std::mbrtowc
| Определено в заголовочном файле <cwchar>
|
||
std::size_t mbrtowc( wchar_t* pwc, const char* s, std::size_t n, std::mbstate_t* ps ); |
||
Преобразует узкий многобайтовый символ в широкий символ.
Если s не является нулевым указателем, проверяет не более n байт многобайтовой символьной строки, начиная с байта, на который указывает s, чтобы определить количество байтов, необходимых для завершения следующего многобайтового символа (включая любые последовательности сдвига). Если функция определяет, что следующий многобайтовый символ в s является полным и допустимым, преобразует его в соответствующий широкий символ и сохраняет в *pwc (если pwc не является нулевым).
Если s является нулевым указателем, значения n и pwc игнорируются, а вызов эквивалентен std::mbrtowc(nullptr, "", 1, ps).
Если созданный широкий символ является нулевым символом, состояние преобразования, хранящееся в *ps, является начальным состоянием сдвига.
Параметры
| pwc | — | указатель на место, куда будет записан результирующий широкий символ |
| s | — | указатель на строку многобайтовых символов, используемую в качестве входных данных |
| n | — | ограничение на количество байтов в s, которые могут быть проверены |
| ps | — | указатель на состояние преобразования, используемое при интерпретации многобайтовой строки |
Возвращаемое значениеe
Первое из следующих применимых условий:
0, если символ, преобразованный изs(и сохранённый вpwc, если он не равен нулю), был нулевым символом.- количество байтов
[1...n]многобайтового символа, успешно преобразованного изs. static_cast<std::size_t>(-2), если следующиеnбайтов представляют собой неполный, но пока действительный многобайтовый символ. В*pwcничего не записывается.static_cast<std::size_t>(-1), если возникает ошибка кодирования. В*pwcничего не записывается, значение EILSEQ сохраняется в errno, а значение*psостаётся не указанным.
Пример
#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
void print_mb(const char* ptr)
{
std::mbstate_t state = std::mbstate_t(); // начальное состояние
const char* end = ptr + std::strlen(ptr);
int len;
wchar_t wc;
while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
{
std::wcout << L"Следующие " << len << L" байтов это символ " << wc << '\n';
ptr += len;
}
}
int main()
{
std::setlocale(LC_ALL, "en_US.utf8");
// узкая многобайтовая кодировка UTF-8
const char* str = "z\u00df\u6c34\U0001d10b"; // или u8"zß水𝄋"
// или "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
print_mb(str);
}
Вывод:
Следующие 1 байтов это символ z
Следующие 2 байтов это символ ß
Следующие 3 байтов это символ 水
Следующие 4 байтов это символ 𝄋
Смотрите также
| преобразует следующий многобайтовый символ в широкий символ (функция) | |
| преобразует широкий символ в его многобайтовое представление при заданном состоянии (функция) | |
[virtual] |
преобразует строку из externT в internT, например, при чтении из файла Оригинал: converts a string from externT to internT, such as when reading from file Текст был переведён автоматически используя Переводчик Google. Вы можете проверить и исправить перевод. Для инструкций щёлкните сюда. (virtual protected std::codecvt функция-элемент)
|
Документация C по mbrtowc
| |