Namespaces
Variants

scanf, fscanf, sscanf, scanf_s, fscanf_s, sscanf_s

From cppreference.net
< c ‎ | io
定义于头文件 <stdio.h>
(1)
int scanf ( const char * format, ... ) ;
(C99前)
int scanf ( const char * restrict format, ... ) ;
(C99起)
(2)
int fscanf ( FILE * stream, const char * format, ... ) ;
(C99前)
int fscanf ( FILE * restrict stream, const char * restrict format, ... ) ;
(C99起)
(3)
int sscanf ( const char * buffer, const char * format, ... ) ;
(C99前)
int sscanf ( const char * restrict buffer, const char * restrict format, ... ) ;
(C99起)
int scanf_s ( const char * restrict format, ... ) ;
(4) (C11起)
int fscanf_s ( FILE * restrict stream, const char * restrict format, ... ) ;
(5) (C11起)
int sscanf_s ( const char * restrict buffer, const char * restrict format, ... ) ;
(6) (C11起)

从多种来源读取数据,根据 format 解释数据,并将结果存储到指定位置。

1) stdin 读取数据
2) 从文件流 stream 中读取数据
3) 从以空字符结尾的字符串 buffer 中读取数据。到达字符串末尾相当于 fscanf 遇到文件结束条件
4-6) (1-3) 相同,但以下情况除外: % c % s % [ 转换说明符各需要两个参数(通常的指针和类型为 rsize_t 的值,指示接收数组的大小,当使用 % c 读取到单个字符时该值可为 1 ),并且以下错误会在运行时被检测到并调用当前安装的 约束处理函数
  • 任何指针类型的参数是空指针
  • format stream buffer 是空指针
  • 通过 % c % s % [ 写入的字符数(加上终止空字符)将超过为这些转换说明符提供的第二个( rsize_t )参数
  • 可选地,任何其他可检测错误,例如未知转换说明符
与所有边界检查函数一样,仅当实现定义了 __STDC_LIB_EXT1__ 且用户在包含 <stdio.h> 之前将 __STDC_WANT_LIB_EXT1__ 定义为整型常量 1 时,才保证 scanf_s fscanf_s sscanf_s 可用。

目录

参数

stream - 用于读取的输入文件流
buffer - 指向以空字符结尾的字符串的指针,用于读取数据
format - 指向以空字符结尾的字符串的指针,指定输入读取格式
... - 接收参数


format 字符串包含

  • 非空白多字节字符(除 % 外):格式字符串中的每个此类字符会从输入流中消耗一个完全相同的字符,如果流中的下一个字符不相等则导致函数执行失败。
  • 空白字符:格式字符串中的任意单个空白字符会消耗输入中所有可用的连续空白字符(通过循环调用 isspace 确定)。注意格式字符串中的 " \n " " " " \t \t " 或其他空白字符没有区别。
  • 转换说明符。每个转换说明符具有以下格式:
  • 引导性 % 字符。
  • (可选) 赋值抑制字符 * 。如果存在此选项,函数不会将转换结果赋值给任何接收参数。
  • (可选) 大于零的整数,用于指定 最大字段宽度 ,即函数执行当前转换说明符所指定的转换时允许消耗的最大字符数。请注意若未提供宽度参数, % s % [ 可能导致缓冲区溢出。
  • (可选) 长度修饰符 用于指定接收参数的大小,即实际的目标类型。这将影响转换精度和溢出规则。默认目标类型因各转换类型而异(详见下表)。
  • 转换格式说明符。

以下格式说明符可用:

转换
说明符
说明 期望
参数类型
长度修饰符→ hh h l ll j z t L
仅自C99起可用→
%
匹配字面量 %
N/A N/A N/A N/A N/A N/A N/A N/A N/A
c

匹配一个 字符 或一系列 字符

  • 若使用宽度限定符,则精确匹配 width 个字符(参数必须为指向具有足够空间的数组的指针)。
  • 与 %s 和 %[ 不同,不会向数组追加空字符。
N/A N/A
char *
wchar_t *
N/A N/A N/A N/A N/A
s

匹配非空白字符序列(即 string )。

  • 若使用宽度限定符,则最多匹配 width 个字符或遇到首个空白字符即停止(以先到者为准)。
  • 始终在匹配字符后存储空字符(因此参数数组必须至少有 width+1 个字符的空间)。
[ set  ]

匹配来自字符集 set 的非空字符序列。

  • 若字符集的首字符为 ^ ,则匹配所有不在该集合中的字符。
  • 若字符集以 ] ^] 开头,则 ] 字符也会被包含在集合中。
  • 在非起始位置出现的 - 字符是否表示范围(如 [0-9] )由具体实现定义。
  • 若使用了宽度限定符,则最多匹配 width 个字符。
  • 始终会在匹配的字符之外额外存储一个空字符(因此参数数组必须至少有 width+1 个字符的空间)。
d

匹配一个 十进制整数

  • 数字格式与 strtol 函数在 10 base 参数时期望的格式相同。
signed char * unsigned char *
signed short * unsigned short *
signed int * unsigned int *
signed long * unsigned long *
signed long long * unsigned long long *
不适用
i

匹配 整型数

  • 数字格式与 strtol 函数所期望的格式相同,其中 0 作为 base 参数的值(进制由解析的首字符确定)。
u

匹配无符号 十进制整数

  • 数字格式与 strtoul 函数所期望的格式相同,其中 10 作为 base 参数的值。
o

匹配无符号 八进制整数

  • 数字格式与 strtoul 函数所期望的格式相同,其中 8 作为 base 参数的值。
x
X

匹配无符号 十六进制整数

  • 数字格式与 strtoul 函数所期望的格式相同,其中 16 作为 base 参数的值。
n

返回 当前已读取的字符数

  • 不消耗输入。不增加赋值计数。
  • 若格式说明符定义了赋值抑制操作符,则行为未定义。
a (C99)
A (C99)
e
E
f
F (C99)
g
G

匹配 浮点数

  • 数字格式与 strtof 函数预期格式相同。
不适用 不适用
float *
double *
不适用 不适用 不适用 不适用
long double *
p

匹配实现定义的字符序列,用于表示 指针

  • printf 系列函数应使用 %p 格式说明符生成相同序列。
不适用 不适用
void **
不适用 不适用 不适用 不适用 不适用 不适用
备注

对于除 n 之外的所有转换说明符,从流中消耗的输入字符序列是:不超过指定字段宽度、且完全符合转换说明符预期或符合其预期序列前缀的最长字符序列。该消耗序列后的首个字符(若存在)将保持未读取状态。若消耗序列长度为零,或消耗序列无法按上述规则完成转换,则出现匹配失败——除非因文件终止、编码错误或读取错误导致无法从流中获取输入,此时视为输入失败。

[ c n 之外的所有转换说明符,在尝试解析输入前会消耗并丢弃所有前导空白字符(通过调用 isspace 判定)。这些被消耗的字符不计入指定的最大字段宽度。

转换说明符 lc ls l [ 会执行多字节到宽字符的转换,其效果类似于在转换首个字符前,先初始化 mbstate_t 对象为零,再调用 mbrtowc

转换说明符 s [ 除了存储匹配的字符外,始终会额外存储空终止符。目标数组的大小必须至少比指定字段宽度大1。若使用 % s % [ 时未指定目标数组大小,其不安全性等同于 gets

针对 定宽整数类型 (如 int8_t 等)的正确转换规范定义在头文件 <inttypes.h> 中(尽管 SCNdMAX SCNuMAX 等分别等同于 % jd % ju 等)。

每个转换说明符执行完成后存在一个 顺序点 ,这允许将多个字段存储至同一个“接收”变量中。

当解析以指数符号结尾但无数字的不完整浮点数值时(例如使用转换说明符 % f 解析 "100er" ),将消耗序列 "100e" (可能有效的浮点数的最长前缀),导致匹配错误(消耗的序列无法转换为浮点数),并保留 "r" 未读取。部分现有实现未遵循此规则,会回退至仅消耗 "100" ,保留 "er" ,例如 glibc bug 1765

若转换规范无效,则行为未定义。

如果转换规范无效,则行为未定义。

返回值

1-3) 成功赋值的接收参数数量(若在首个接收参数被赋值前发生匹配失败,则该值可能为零),或若在首个接收参数被赋值前发生输入失败则返回 EOF
4-6) (1-3) 相同,区别在于当出现运行时约束违规时也会返回 EOF

复杂度

不保证。特别要注意的是,某些 sscanf 的实现具有 O(N) 的时间复杂度,其中 N = strlen ( buffer ) [1]

注释

由于大多数转换说明符首先会消耗所有连续的空白字符,因此诸如

scanf("%d", &a);
scanf("%d", &b);

将读取在不同行输入的两个整数(第二个 % d 会消耗第一个输入遗留的换行符)或在同一行输入、以空格或制表符分隔的两个整数(第二个 % d 会消耗这些空格或制表符)。

The conversion specifiers that do not consume leading whitespace, such as % c , can be made to do so by using a whitespace character in the format string:
scanf("%d", &a);
scanf(" %c", &c); // 消耗 %d 之后的所有连续空白字符,然后读取一个字符

示例

#define __STDC_WANT_LIB_EXT1__ 1
#include <stdio.h>
#include <stddef.h>
#include <locale.h>
int main(void)
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    setlocale(LC_ALL, "en_US.utf8");
    char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水";
    /* 解析方式如下:
       %d:一个整数
       %f:一个浮点数值
       %9s:最多9个非空白字符的字符串
       %2d:两位整数(数字5和6)
       %f:一个浮点数值(数字7、8、9)
       %*d:一个不存储在任何位置的整数
       ' ':所有连续空白字符
       %3[0-9]:最多3位十进制数字的字符串(数字5和6)
       %2lc:两个宽字符,使用多字节到宽字符转换 */
    int ret = sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                     &i, &x, str1, &j, &y, str2, warr);
    printf("Converted %d fields:\n"
           "i = %d\n"
           "x = %f\n"
           "str1 = %s\n"
           "j = %d\n"
           "y = %f\n"
           "str2 = %s\n"
           "warr[0] = U+%x\n"
           "warr[1] = U+%x\n",
           ret, i, x, str1, j, y, str2, warr[0], warr[1]);
#ifdef __STDC_LIB_EXT1__
    int n = sscanf_s(input, "%d%f%s", &i, &x, str1, (rsize_t)sizeof str1);
    // 将25写入i,5.432写入x,9字节"Thompson\0"写入str1,3写入n
#endif
}

可能的输出:

Converted 7 fields:
i = 25
x = 5.432000
str1 = Thompson
j = 56
y = 789.000000
str2 = 56
warr[0] = U+df
warr[1] = U+6c34

参考文献

  • C17标准(ISO/IEC 9899:2018):
  • 7.21.6.2 fscanf函数(页码:231-236)
  • 7.21.6.4 scanf函数(页码:236-237)
  • 7.21.6.7 sscanf函数(页码:238-239)
  • K.3.5.3.2 fscanf_s函数(页码:430-431)
  • K.3.5.3.4 scanf_s函数(页码:432)
  • K.3.5.3.7 sscanf_s函数(页码:433)
  • C11 标准 (ISO/IEC 9899:2011):
  • 7.21.6.2 fscanf 函数 (p: 317-324)
  • 7.21.6.4 scanf 函数 (p: 325)
  • 7.21.6.7 sscanf 函数 (p: 326)
  • K.3.5.3.2 fscanf_s 函数 (p: 592-593)
  • K.3.5.3.4 scanf_s 函数 (p: 594)
  • K.3.5.3.7 sscanf_s 函数 (p: 596)
  • C99标准(ISO/IEC 9899:1999):
  • 7.19.6.2 fscanf函数(页码:282-289)
  • 7.19.6.4 scanf函数(页码:290)
  • 7.19.6.7 sscanf函数(页码:291)
  • C89/C90 标准 (ISO/IEC 9899:1990):
  • 4.9.6.2 fscanf 函数
  • 4.9.6.4 scanf 函数
  • 4.9.6.6 sscanf 函数

另请参阅

(C99) (C99) (C99) (C11) (C11) (C11)
stdin 、文件流或缓冲区读取格式化输入
使用可变参数列表
(函数)
从文件流获取字符串
(函数)
将格式化输出打印到 stdout 、文件流或缓冲区
(函数)
C++ 文档 关于 scanf fscanf sscanf