std:: scanf, std:: fscanf, std:: sscanf

From cppreference.net

Определено в заголовочном файле `<cstdio>`
int scanf ( const char * format, ... ) ;	(1)
int fscanf ( std:: FILE * stream, const char * format, ... ) ;	(2)
int sscanf ( const char * buffer, const char * format, ... ) ;	(3)

Считывает данные из различных источников, интерпретирует их в соответствии с format и сохраняет результаты в заданные места.

1) Считывает данные из stdin .

2) Считывает данные из файлового потока stream .

3) Считывает данные из строки символов с нулевым завершением buffer .

Содержание

Параметры

stream	-	входной файловый поток для чтения
buffer	-	указатель на строку символов с нулевым завершителем для чтения
format	-	указатель на строку символов с нулевым завершителем, определяющую способ чтения ввода
...	-	принимающие аргументы

Строка format состоит из

не-пробельные многобайтовые символы, кроме % : каждый такой символ в строке формата потребляет ровно один идентичный символ из входного потока, или вызывает сбой функции, если следующий символ в потоке не совпадает.
пробельные символы: любой одиночный пробельный символ в строке формата потребляет все доступные последовательные пробельные символы из ввода (определяется как при многократном вызове std::isspace ). Заметьте, что нет разницы между " \n " , " " , " \t \t " , или другими пробельными символами в строке формата.
спецификации преобразования. Каждая спецификация преобразования имеет следующий формат:

вводный % символ.

(необязательный) символ подавления присваивания * . Если присутствует эта опция, функция не присваивает результат преобразования какому-либо принимающему аргументу.

(необязательно) целое число (больше нуля), которое указывает максимальную ширину поля , то есть максимальное количество символов, которое функция может обработать при выполнении преобразования, указанного текущей спецификацией преобразования. Обратите внимание, что % s и % [ могут привести к переполнению буфера, если ширина не указана.

(необязательный) модификатор длины , который указывает размер принимающего аргумента, то есть фактический тип назначения. Это влияет на точность преобразования и правила переполнения. Тип назначения по умолчанию различается для каждого типа преобразования (см. таблицу ниже).

спецификатор формата преобразования.

Доступны следующие спецификаторы формата:

Спецификатор преобразования	Объяснение	Ожидаемый тип аргумента
Модификатор длины→		`hh`	`h`	отсутствует	`l`	`ll`	`j`	`z`	`t`	`L`
Доступно только с C++11→		Да				Да	Да	Да	Да
`%`	Соответствует литералу `%` .	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
`c`	Соответствует символу или последовательности символов . Если используется спецификатор ширины, соответствует ровно width символам (аргумент должен быть указателем на массив с достаточным местом). В отличие от %s и %[, не добавляет нулевой символ в массив.	N/A	N/A	char *	wchar_t *	N/A	N/A	N/A	N/A	N/A
`s`	Соответствует последовательности непробельных символов ( строка ). Если используется спецификатор ширины, соответствует до width символов или до первого пробельного символа, в зависимости от того, что наступит раньше. Всегда сохраняет нулевой символ в дополнение к сопоставленным символам (поэтому аргумент-массив должен иметь место как минимум для width+1 символов).
`[` set `]`	Сопоставляет непустую последовательность символов из set набора символов. Если первый символ набора - `^` , то сопоставляются все символы, не входящие в набор. Если набор начинается с `]` или `^]` , то символ `]` также включается в набор. Определяется реализацией, может ли символ `-` в не-начальной позиции в сканирующем наборе указывать на диапазон, как в `[0-9]` . Если используется спецификатор ширины, сопоставляет только до width . Всегда сохраняет нулевой символ в дополнение к сопоставленным символам (поэтому аргумент-массив должен иметь место как минимум для width+1 символов).
`d`	Соответствует десятичному целому числу . Формат числа совпадает с ожидаемым функцией std::strtol со значением 10 для аргумента base .	signed char * или unsigned char *	signed short * или unsigned short *	signed int * или unsigned int *	signed long * или unsigned long *	signed long long * или unsigned long long *	std:: intmax_t * или std:: uintmax_t *	std:: size_t *	std:: ptrdiff_t *	Н/Д
`i`	Соответствует целому числу . Формат числа совпадает с ожидаемым функцией std::strtol со значением 0 для аргумента base (основание системы счисления определяется по первым разобранным символам).
`u`	Соответствует беззнаковому десятичному целому числу . Формат числа совпадает с ожидаемым функцией std::strtoul со значением 10 для аргумента base .
`o`	Соответствует беззнаковому восьмеричному целому числу . Формат числа совпадает с ожидаемым функцией std::strtoul со значением 8 для аргумента base .
`x` `X`	Соответствует беззнаковому шестнадцатеричному целому числу . Формат числа совпадает с ожидаемым функцией std::strtoul со значением 16 для аргумента base .
`n`	Возвращает количество символов, прочитанных на данный момент . Ввод не потребляется. Не увеличивает счетчик присваиваний. Если для спецификатора определен оператор подавления присваивания, поведение не определено.
`a` (C++11) `A` (C++11) `e` `E` `f` `F` (C++11) `g` `G`	Соответствует числу с плавающей запятой . Формат числа совпадает с ожидаемым функцией std::strtof .	N/A	N/A	float *	double *	N/A	N/A	N/A	N/A	long double *
`p`	Соответствует определяемой реализацией последовательности символов, определяющей указатель . `printf` семейство функций должно производить ту же последовательность с использованием `%p` спецификатора формата.	N/A	N/A	void **	N/A	N/A	N/A	N/A	N/A	N/A
Примечания
Для каждого спецификатора преобразования, кроме n , из потока считывается самая длинная последовательность входных символов, которая не превышает указанную ширину поля и которая либо точно соответствует ожиданиям спецификатора преобразования, либо является префиксом последовательности, которую он ожидает. Первый символ, если таковой имеется, после этой считанной последовательности остается непрочитанным. Если длина считанной последовательности равна нулю или если считанная последовательность не может быть преобразована, как указано выше, происходит ошибка сопоставления, если только конец файла, ошибка кодирования или ошибка чтения не предотвратили ввод из потока, в этом случае это ошибка ввода. Все спецификаторы преобразования, кроме [ , c , и n , потребляют и отбрасывают все ведущие пробельные символы (определяемые как при вызове std::isspace ) перед попыткой разбора ввода. Эти потребленные символы не учитываются в указанной максимальной ширине поля. Спецификаторы преобразования lc , ls , и l [ выполняют преобразование многобайтовых символов в широкие символы, как если бы вызывался std::mbrtowc с объектом std::mbstate_t , инициализированным нулем перед преобразованием первого символа. Спецификаторы преобразования s и [ всегда сохраняют нулевой терминатор в дополнение к сопоставленным символам. Размер целевого массива должен быть как минимум на единицу больше указанной ширины поля. Использование % s или % [ без указания размера целевого массива так же небезопасно, как std::gets . Правильные спецификации преобразования для целочисленных типов фиксированной ширины ( std::int8_t и т.д.) определены в заголовочном файле `<cinttypes>` (хотя `SCNdMAX` , `SCNuMAX` и т.д. являются синонимами для % jd , % ju и т.д.). Существует точка следования после действия каждого спецификатора преобразования; это позволяет сохранять несколько полей в одну и ту же переменную-приемник. При разборе неполного значения с плавающей точкой, которое заканчивается экспонентой без цифр, например, разбор "100er" со спецификатором преобразования % f , последовательность "100e" (самый длинный префикс потенциально допустимого числа с плавающей точкой) потребляется, что приводит к ошибке сопоставления (потребленная последовательность не может быть преобразована в число с плавающей точкой), при этом "r" остается. Некоторые существующие реализации не следуют этому правилу и откатываются, потребляя только "100" , оставляя "er" , например, glibc bug 1765 . Если спецификация преобразования недействительна, поведение не определено.

Возвращаемое значение

Количество успешно присвоенных принимающих аргументов (которое может быть нулевым в случае сбоя сопоставления до присвоения первого принимающего аргумента), или EOF если ошибка ввода происходит до присвоения первого принимающего аргумента.

Сложность

Не гарантируется. В частности, некоторые реализации std::sscanf имеют сложность $O(N)$ , где N = std:: strlen ( buffer ) [1] . Для производительного разбора строк рекомендуется использовать std::from_chars .

Примечания

Поскольку большинство спецификаторов преобразования сначала потребляют все последовательные пробельные символы, код вида

std::scanf("%d", &a);
std::scanf("%d", &b);

будет считывать два целых числа, введённых на разных строках (второй % d поглотит оставшийся символ новой строки от первого) или на одной строке, разделённых пробелами или табуляциями (второй % d поглотит пробелы или табуляции).

The conversion specifiers that do not consume leading whitespace, such as % c , can be made to do so by using a whitespace character in the format string:

std::scanf("%d", &a);
std::scanf(" %c", &c); // игнорировать перевод строки после %d, затем прочитать символ

Обратите внимание, что некоторые реализации std::sscanf включают вызов std::strlen , что делает их время выполнения линейным относительно длины всей строки. Это означает, что если std::sscanf вызывается в цикле для многократного разбора значений из начала строки, ваш код может работать за квадратичное время ( пример ).

Пример

Запустить этот код

#include <clocale>
#include <cstdio>
#include <iostream>
int main()
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    std::setlocale(LC_ALL, "en_US.utf8");
    char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水";
    // парсинг выполняется следующим образом:
    // %d: целое число
    // %f: число с плавающей точкой
    // %9s: строка длиной не более 9 символов (без пробелов)
    // %2d: двузначное целое число (цифры 5 и 6)
    // %f: число с плавающей точкой (цифры 7, 8, 9)
    // %*d: целое число, которое нигде не сохраняется
    // ' ': все последовательные пробельные символы
    // %3[0-9]: строка длиной не более 3 цифр (цифры 5 и 6)
    // %2lc: два широких символа с преобразованием multibyte в wide
    const int ret = std::sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                                &i, &x, str1, &j, &y, str2, warr);
    std::cout << "Преобразовано " << ret << " полей:\n"
                 "i = " << i << "\n"
                 "x = " << x << "\n"
                 "str1 = " << str1 << "\n"
                 "j = " << j << "\n"
                 "y = " << y << "\n"
                 "str2 = " << str2 << std::hex << "\n"
                 "warr[0] = U+" << (int)warr[0] << "\n"
                 "warr[1] = U+" << (int)warr[1] << '\n';
}

Вывод:

Преобразовано 7 полей:
i = 25
x = 5.432
str1 = Thompson
j = 56
y = 789
str2 = 56
warr[0] = U+df
warr[1] = U+6c34

Смотрите также

vscanf vfscanf vsscanf (C++11) (C++11) (C++11)	читает форматированный ввод из stdin , файлового потока или буфера используя список переменных аргументов (функция)
fgets	получает строку символов из файлового потока (функция)
printf fprintf sprintf snprintf (C++11)	выводит форматированные данные в stdout , файловый поток или буфер (функция)
from_chars (C++17)	преобразует последовательность символов в целочисленное или вещественное значение (функция)
Документация C для scanf , fscanf , sscanf

Compiler support
Freestanding and hosted
Language
Standard library
Standard library headers
Named requirements
Feature test macros (C++20)
Language support library
Concepts library (C++20)
Diagnostics library
Memory management library
Metaprogramming library (C++11)
General utilities library
Containers library
Iterators library
Ranges library (C++20)
Algorithms library
Strings library
Text processing library
Numerics library
Date and time library
Input/output library
Filesystem library (C++17)
Concurrency support library (C++11)
Execution control library (C++26)
Technical specifications
Symbols index
External libraries

I/O manipulators
Print functions (C++23)
C-style I/O
Buffers
basic_streambuf
basic_filebuf
basic_stringbuf
basic_spanbuf (C++23)
strstreambuf ( C++98/26* )
basic_syncbuf (C++20)
Streams
Abstractions
ios_base
basic_ios
basic_istream
basic_ostream
basic_iostream
File I/O
basic_ifstream
basic_ofstream
basic_fstream
String I/O
basic_istringstream
basic_ostringstream
basic_stringstream
Array I/O
basic_ispanstream (C++23)
basic_ospanstream (C++23)
basic_spanstream (C++23)
istrstream ( C++98/26* )
ostrstream ( C++98/26* )
strstream ( C++98/26* )
Synchronized Output
basic_osyncstream (C++20)
Types
streamoff
streamsize
fpos
Error category interface
iostream_category (C++11)
io_errc (C++11)

cppreference.net

Namespaces

Variants