Namespaces
Variants

std:: mbrtowc

From cppreference.net
Определено в заголовочном файле <cwchar>
std:: size_t mbrtowc ( wchar_t * pwc,

const char * s,
std:: size_t n,

std:: mbstate_t * ps ) ;

Преобразует узкий многобайтовый символ в широкий символ.

Если s не является нулевым указателем, анализирует не более n байт многобайтовой строки символов, начиная с байта, на который указывает s , чтобы определить количество байт, необходимых для завершения следующего многобайтового символа (включая любые последовательности сдвига). Если функция определяет, что следующий многобайтовый символ в s является полным и корректным, преобразует его в соответствующий широкий символ и сохраняет в * pwc (если pwc не является нулевым указателем).

Если s является нулевым указателем, значения n и pwc игнорируются, и вызов эквивалентен std :: mbrtowc ( nullptr, "" , 1 , ps ) .

Если широкий символ, полученный в результате, является нулевым символом, состояние преобразования, хранящееся в * ps является начальным состоянием сдвига.

Содержание

Параметры

pwc - указатель на место, куда будет записан результирующий широкий символ
s - указатель на многобайтовую строку символов, используемую в качестве входных данных
n - ограничение на количество байтов в s, которые могут быть проверены
ps - указатель на состояние преобразования, используемое при интерпретации многобайтовой строки

Возвращаемое значение

Первое из следующих условий, которое применяется:

  • 0 если символ, преобразованный из s (и сохранённый в pwc если не null), был нулевым символом.
  • количество байт [ 1 ... n ] многобайтового символа, успешно преобразованного из s .
  • static_cast < std:: size_t > ( - 2 ) если следующие n байт составляют неполный, но пока корректный многобайтовый символ. Ничего не записывается в * pwc .
  • static_cast < std:: size_t > ( - 1 ) если произошла ошибка кодировки. Ничего не записывается в * pwc , значение EILSEQ сохраняется в errno , а значение * ps остаётся неопределённым.

Пример

#include <clocale>
#include <cstring>
#include <cwchar>
#include <iostream>
void print_mb(const char* ptr)
{
    std::mbstate_t state = std::mbstate_t(); // initial state
    const char* end = ptr + std::strlen(ptr);
    int len;
    wchar_t wc;
    while ((len = std::mbrtowc(&wc, ptr, end-ptr, &state)) > 0)
    {
        std::wcout << "Next " << len << " bytes are the character " << wc << '\n';
        ptr += len;
    }
}
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = "z\u00df\u6c34\U0001d10b"; // or u8"zß水𝄋"
                      // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
    print_mb(str);
}

Вывод:

Next 1 bytes are the character z
Next 2 bytes are the character ß
Next 3 bytes are the character 水
Next 4 bytes are the character 𝄋

Смотрите также

преобразует следующий многобайтовый символ в широкий символ
(функция)
преобразует широкий символ в его многобайтовое представление с учётом состояния
(функция)
[virtual]
преобразует строку из ExternT в InternT , например, при чтении из файла
(виртуальная защищённая функция-член std::codecvt<InternT,ExternT,StateT> )