close
Пространства имён
Варианты
Действия

std::mbrtowc

Материал из cppreference.com
 
 
 
Многобайтовые строки с завершающим нулём
Широкие/многобайтовые преобразования
Типы
 
<tbody> </tbody>
Определено в заголовочном файле <cwchar>
std::size_t mbrtowc( wchar_t* pwc, const char* s, std::size_t n, std::mbstate_t* ps );

Преобразует узкий многобайтовый символ в широкий символ.

Если s не является нулевым указателем, проверяет не более n байт многобайтовой символьной строки, начиная с байта, на который указывает s, чтобы определить количество байтов, необходимых для завершения следующего многобайтового символа (включая любые последовательности сдвига). Если функция определяет, что следующий многобайтовый символ в s является полным и допустимым, преобразует его в соответствующий широкий символ и сохраняет в *pwc (если pwc не является нулевым).

Если s является нулевым указателем, значения n и pwc игнорируются, а вызов эквивалентен std::mbrtowc(nullptr, "", 1, ps).

Если созданный широкий символ является нулевым символом, состояние преобразования, хранящееся в *ps, является начальным состоянием сдвига.

Параметры

pwc указатель на место, куда будет записан результирующий широкий символ
s указатель на строку многобайтовых символов, используемую в качестве входных данных
n ограничение на количество байтов в s, которые могут быть проверены
ps указатель на состояние преобразования, используемое при интерпретации многобайтовой строки

Возвращаемое значениеe

Первое из следующих применимых условий:

  • 0, если символ, преобразованный из s (и сохранённый в pwc, если он не равен нулю), был нулевым символом.
  • количество байтов [1...n] многобайтового символа, успешно преобразованного из s.
  • static_cast<std::size_t>(-2), если следующие n байтов представляют собой неполный, но пока действительный многобайтовый символ. В *pwc ничего не записывается.
  • static_cast<std::size_t>(-1), если возникает ошибка кодирования. В *pwc ничего не записывается, значение EILSEQ сохраняется в errno, а значение *ps остаётся не указанным.

Пример

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
 
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // начальное состояние
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << L"Следующие " << len << L" байтов это символ " << wc << '\n';
        ptr += len;
    }
}

int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // узкая многобайтовая кодировка UTF-8
    const char* str = "z\u00df\u6c34\U0001d10b"; // или u8"zß水𝄋"
                      // или "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

Вывод:

Следующие 1 байтов это символ z
Следующие 2 байтов это символ ß
Следующие 3 байтов это символ 水
Следующие 4 байтов это символ 𝄋

Смотрите также

преобразует следующий многобайтовый символ в широкий символ
(функция) [править]
преобразует широкий символ в его многобайтовое представление при заданном состоянии
(функция) [править]
[virtual]
преобразует строку из externT в internT, например, при чтении из файла
Оригинал:
converts a string from externT to internT, such as when reading from file
Текст был переведён автоматически используя Переводчик Google.
Вы можете проверить и исправить перевод. Для инструкций щёлкните сюда.

(virtual protected std::codecvt функция-элемент) [править]