Namespaces
Variants

mbrlen

From cppreference.net
Определено в заголовочном файле <wchar.h>
size_t mbrlen ( const char * s, size_t n, mbstate_t * ps ) ;
(начиная с C95)
(до C99)
size_t mbrlen ( const char * restrict s, size_t n, mbstate_t * restrict ps ) ;
(начиная с C99)

Определяет размер в байтах представления многобайтового символа.

Эта функция эквивалентна вызову mbrtowc ( NULL , s, n, ps ? ps : & internal ) для некоторого скрытого объекта internal типа mbstate_t , за исключением того, что выражение ps вычисляется только один раз.

Содержание

Параметры

s - указатель на элемент многобайтовой строки символов
n - ограничение на количество байт в s, которые могут быть проверены
ps - указатель на переменную, содержащую состояние преобразования

Возвращаемое значение

Первое из следующих условий, которое применяется:

  • 0 если следующие n или меньше байт завершают нулевой символ, или если s является нулевым указателем. Оба случая сбрасывают состояние преобразования.
  • количество байтов [ 1 ... n ] которые завершают корректный многобайтовый символ
  • ( size_t ) - 2 если следующие n байт являются частью потенциально корректного многобайтового символа, который всё ещё не завершён после проверки всех n байт
  • ( size_t ) - 1 если произошла ошибка кодировки. Значение errno устанавливается в EILSEQ ; состояние преобразования не определено.

Пример

#include <locale.h>
#include <stdio.h>
#include <string.h>
#include <wchar.h>
int main(void)
{
    // allow mbrlen() to work with UTF-8 multibyte encoding
    setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = "水";
    size_t sz = strlen(str);
    mbstate_t mb;
    memset(&mb, 0, sizeof mb);
    int len1 = mbrlen(str, 1, &mb);
    if (len1 == -2)
        printf("The first 1 byte of %s is an incomplete multibyte char"
               " (mbrlen returns -2)\n", str);
    int len2 = mbrlen(str + 1, sz - 1, &mb);
    printf("The remaining %zu  bytes of %s hold %d bytes of the multibyte"
           " character\n", sz - 1, str, len2);
    printf("Attempting to call mbrlen() in the middle of %s while in initial"
           " shift state returns %zd\n", str, mbrlen(str + 1, sz - 1, &mb));
}

Вывод:

The first 1 byte of 水 is an incomplete multibyte char (mbrlen returns -2)
The remaining 2  bytes of 水 hold 2 bytes of the multibyte character
Attempting to call mbrlen() in the middle of 水 while in initial shift state returns -1

Ссылки

  • Стандарт C23 (ISO/IEC 9899:2024):
  • 7.29.6.3.1 Функция mbrlen (стр.: TBD)
  • Стандарт C17 (ISO/IEC 9899:2018):
  • 7.29.6.3.1 Функция mbrlen (стр.: TBD)
  • Стандарт C11 (ISO/IEC 9899:2011):
  • 7.29.6.3.1 Функция mbrlen (стр. 442)
  • Стандарт C99 (ISO/IEC 9899:1999):
  • 7.24.6.3.1 Функция mbrlen (стр: 388)

Смотрите также

(C95)
преобразует следующий многобайтовый символ в широкий символ с учетом состояния
(функция)
возвращает количество байтов в следующем многобайтовом символе
(функция)
C++ documentation для mbrlen