std:: mbrtowc
|
Определено в заголовочном файле
<cwchar>
|
||
|
std::
size_t
mbrtowc
(
wchar_t
*
pwc,
const
char
*
s,
|
||
Преобразует узкий многобайтовый символ в широкий символ.
Если s не является нулевым указателем, анализирует не более n байт многобайтовой строки символов, начиная с байта, на который указывает s , чтобы определить количество байт, необходимых для завершения следующего многобайтового символа (включая любые последовательности сдвига). Если функция определяет, что следующий многобайтовый символ в s является полным и корректным, преобразует его в соответствующий широкий символ и сохраняет в * pwc (если pwc не является нулевым указателем).
Если s является нулевым указателем, значения n и pwc игнорируются, и вызов эквивалентен std :: mbrtowc ( nullptr, "" , 1 , ps ) .
Если широкий символ, полученный в результате, является нулевым символом, состояние преобразования, хранящееся в * ps является начальным состоянием сдвига.
Содержание |
Параметры
| pwc | - | указатель на место, куда будет записан результирующий широкий символ |
| s | - | указатель на многобайтовую строку символов, используемую в качестве входных данных |
| n | - | ограничение на количество байтов в s, которые могут быть проверены |
| ps | - | указатель на состояние преобразования, используемое при интерпретации многобайтовой строки |
Возвращаемое значение
Первое из следующих условий, которое применяется:
- 0 если символ, преобразованный из s (и сохранённый в pwc если не null), был нулевым символом.
- количество байт [ 1 ... n ] многобайтового символа, успешно преобразованного из s .
- static_cast < std:: size_t > ( - 2 ) если следующие n байт составляют неполный, но пока корректный многобайтовый символ. Ничего не записывается в * pwc .
- static_cast < std:: size_t > ( - 1 ) если произошла ошибка кодировки. Ничего не записывается в * pwc , значение EILSEQ сохраняется в errno , а значение * ps остаётся неопределённым.
Пример
#include <clocale> #include <cstring> #include <cwchar> #include <iostream> void print_mb(const char* ptr) { std::mbstate_t state = std::mbstate_t(); // initial state const char* end = ptr + std::strlen(ptr); int len; wchar_t wc; while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0) { std::wcout << "Next " << len << " bytes are the character " << wc << '\n'; ptr += len; } } int main() { std::setlocale(LC_ALL, "en_US.utf8"); // UTF-8 narrow multibyte encoding const char* str = "z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋" // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b"; print_mb(str); }
Вывод:
Next 1 bytes are the character z Next 2 bytes are the character ß Next 3 bytes are the character 水 Next 4 bytes are the character 𝄋
Смотрите также
|
преобразует следующий многобайтовый символ в широкий символ
(функция) |
|
|
преобразует широкий символ в его многобайтовое представление с учётом состояния
(функция) |
|
|
[virtual]
|
преобразует строку из
ExternT
в
InternT
, например, при чтении из файла
(виртуальная защищённая функция-член
std::codecvt<InternT,ExternT,StateT>
)
|
|
Документация C
для
mbrtowc
|
|