std:: c16rtomb
|
Определено в заголовочном файле
<cuchar>
|
||
|
std::
size_t
c16rtomb
(
char
*
s,
char16_t
c16,
std::
mbstate_t
*
ps
)
;
|
(начиная с C++11) | |
Преобразует отдельную кодовую точку из представления 16-битных символов переменной длины (обычно UTF-16) в узкое многобайтовое представление символов.
Если s не является нулевым указателем и c16 является последним 16-битным кодовым юнитом в корректном переменной длины кодировании кодовой точки, функция определяет количество байт, необходимое для хранения многобайтового представления этого символа (включая сдвиговые последовательности и учитывая текущее состояние многобайтового преобразования * ps ), и сохраняет многобайтовое представление символа в массиве символов, на первый элемент которого указывает s , обновляя * ps при необходимости. Функция может записать не более MB_CUR_MAX байт.
Если
s
является нулевым указателем, вызов эквивалентен
std
::
c16rtomb
(
buf, u
'
\0
'
, ps
)
для некоторого внутреннего буфера
buf
.
Если c16 не является конечной кодовой единицей в 16-битном представлении расширенного символа, запись в массив, на который указывает s , не производится, обновляется только * ps .
Если c16 является нулевым широким символом u ' \0 ' , сохраняется нулевой байт, которому предшествует любая последовательность сдвига, необходимая для восстановления начального состояния сдвига, и параметр состояния преобразования * ps обновляется для представления начального состояния сдвига.
Многобайтовая кодировка, используемая этой функцией, определяется текущей активной локалью C.
Содержание |
Параметры
| s | - | указатель на массив узких символов, где будет сохранен многобайтовый символ |
| c16 | - | 16-битный символ для преобразования |
| ps | - | указатель на объект состояния преобразования, используемый при интерпретации многобайтовой строки |
Возвращаемое значение
При успехе возвращает количество байт (включая любые сдвиговые последовательности), записанных в массив символов, первый элемент которого указывается s . Это значение может быть 0 , например, при обработке первого char16_t в суррогатной паре.
При неудаче (если c16 не является корректным 16-битным символом), возвращает - 1 , сохраняет EILSEQ в errno и оставляет * ps в неопределённом состоянии.
Примечания
Стандарт C++ отсылает к стандарту C для семантики этой функции. В опубликованном C11, в отличие от std::mbrtoc16 , которая преобразует многобайтовые кодировки переменной ширины (такие как UTF-8) в 16-битные кодировки переменной ширины (такие как UTF-16), эта функция может преобразовывать только 16-битные кодировки с одним блоком, что означает невозможность преобразования UTF-16 в UTF-8, несмотря на изначальное предназначение функции. Это было исправлено в отчете о дефектах после C11 DR488 .
Пример
Пример предполагает, что исправление для defect report 488 применено.
#include <climits> #include <clocale> #include <cuchar> #include <iomanip> #include <iostream> #include <string_view> int main() { std::setlocale(LC_ALL, "en_US.utf8"); std::u16string_view strv = u"zß水🍌"; // or z\u00df\u6c34\U0001F34C std::cout << "Processing " << strv.size() << " UTF-16 code units: [ "; for (char16_t c : strv) std::cout << std::showbase << std::hex << static_cast<int>(c) << ' '; std::cout << "]\n"; std::mbstate_t state{}; char out[MB_LEN_MAX]{}; for (char16_t c : strv) { std::size_t rc = std::c16rtomb(out, c, &state); std::cout << static_cast<int>(c) << " converted to [ "; if (rc != (std::size_t) - 1) for (unsigned char c8 : std::string_view{out, rc}) std::cout << +c8 << ' '; std::cout << "]\n"; } }
Вывод:
Processing 5 UTF-16 code units: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c ] 0x7a converted to [ 0x7a ] 0xdf converted to [ 0xc3 0x9f ] 0x6c34 converted to [ 0xe6 0xb0 0xb4 ] 0xd83c converted to [ ] 0xdf4c converted to [ 0xf0 0x9f 0x8d 0x8c ]
Смотрите также
|
(C++11)
|
преобразует узкий многобайтовый символ в кодировку UTF-16
(функция) |
|
(C++20)
|
преобразует строку UTF-8 в узкую многобайтовую кодировку
(функция) |
|
[virtual]
|
преобразует строку из
InternT
в
ExternT
, например при записи в файл
(виртуальная защищенная функция-член
std::codecvt<InternT,ExternT,StateT>
)
|
|
Документация C
для
c16rtomb
|
|