scanf, fscanf, sscanf, scanf_s, fscanf_s, sscanf_s
|
定义于头文件
<stdio.h>
|
||
| (1) | ||
|
int
scanf
(
const
char
*
format, ...
)
;
|
(C99前) | |
|
int
scanf
(
const
char
*
restrict
format, ...
)
;
|
(C99起) | |
| (2) | ||
|
int
fscanf
(
FILE
*
stream,
const
char
*
format, ...
)
;
|
(C99前) | |
|
int
fscanf
(
FILE
*
restrict
stream,
const
char
*
restrict
format, ...
)
;
|
(C99起) | |
| (3) | ||
|
int
sscanf
(
const
char
*
buffer,
const
char
*
format, ...
)
;
|
(C99前) | |
|
int
sscanf
(
const
char
*
restrict
buffer,
const
char
*
restrict
format, ...
)
;
|
(C99起) | |
|
int
scanf_s
(
const
char
*
restrict
format, ...
)
;
|
(4) | (C11起) |
|
int
fscanf_s
(
FILE
*
restrict
stream,
const
char
*
restrict
format, ...
)
;
|
(5) | (C11起) |
|
int
sscanf_s
(
const
char
*
restrict
buffer,
const
char
*
restrict
format, ...
)
;
|
(6) | (C11起) |
从多种来源读取数据,根据
format
解释数据,并将结果存储到指定位置。
stream
中读取数据
buffer
中读取数据。到达字符串末尾相当于
fscanf
遇到文件结束条件
-
- 任何指针类型的参数是空指针
-
format、stream或buffer是空指针 -
通过
%
c
、
%
s
或
%
[
写入的字符数(加上终止空字符)将超过为这些转换说明符提供的第二个(
rsize_t)参数 - 可选地,任何其他可检测错误,例如未知转换说明符
-
与所有边界检查函数一样,仅当实现定义了
__STDC_LIB_EXT1__
且用户在包含
<stdio.h>
之前将
__STDC_WANT_LIB_EXT1__
定义为整型常量
1
时,才保证
scanf_s、fscanf_s和sscanf_s可用。
目录 |
参数
| stream | - | 用于读取的输入文件流 |
| buffer | - | 指向以空字符结尾的字符串的指针,用于读取数据 |
| format | - | 指向以空字符结尾的字符串的指针,指定输入读取格式 |
| ... | - | 接收参数 |
该
format
字符串包含
- 非空白多字节字符(除 % 外):格式字符串中的每个此类字符会从输入流中消耗一个完全相同的字符,如果流中的下一个字符不相等则导致函数执行失败。
- 空白字符:格式字符串中的任意单个空白字符会消耗输入中所有可用的连续空白字符(通过循环调用 isspace 确定)。注意格式字符串中的 " \n " 、 " " 、 " \t \t " 或其他空白字符没有区别。
- 转换说明符。每个转换说明符具有以下格式:
-
- 引导性 % 字符。
-
- (可选) 赋值抑制字符 * 。如果存在此选项,函数不会将转换结果赋值给任何接收参数。
-
- (可选) 大于零的整数,用于指定 最大字段宽度 ,即函数执行当前转换说明符所指定的转换时允许消耗的最大字符数。请注意若未提供宽度参数, % s 与 % [ 可能导致缓冲区溢出。
-
- (可选) 长度修饰符 用于指定接收参数的大小,即实际的目标类型。这将影响转换精度和溢出规则。默认目标类型因各转换类型而异(详见下表)。
-
- 转换格式说明符。
以下格式说明符可用:
|
转换
说明符 |
说明 |
期望
参数类型 |
||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 长度修饰符→ |
hh
|
h
|
无 |
l
|
ll
|
j
|
z
|
t
|
L
|
|
| 仅自C99起可用→ | 是 | 是 | 是 | 是 | 是 | |||||
%
|
匹配字面量
%
。
|
N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A |
c
|
匹配一个 字符 或一系列 字符 。
|
N/A | N/A |
char
*
|
wchar_t
*
|
N/A | N/A | N/A | N/A | N/A |
s
|
匹配非空白字符序列(即 string )。
|
|||||||||
[
set
]
|
匹配来自字符集 set 的非空字符序列。
|
|||||||||
d
|
匹配一个 十进制整数 。
|
signed
char
*
或
unsigned
char
*
|
signed
short
*
或
unsigned
short
*
|
signed
int
*
或
unsigned
int
*
|
signed
long
*
或
unsigned
long
*
|
signed
long
long
*
或
unsigned
long
long
*
|
size_t
*
|
不适用 | ||
i
|
匹配 整型数 。
|
|||||||||
u
|
匹配无符号 十进制整数 。
|
|||||||||
o
|
匹配无符号 八进制整数 。
|
|||||||||
x
X
|
匹配无符号 十六进制整数 。
|
|||||||||
n
|
返回 当前已读取的字符数 。
|
|||||||||
a
(C99)
A
(C99)
e
E
f
F
(C99)
g
G
|
匹配 浮点数 。
|
不适用 | 不适用 |
float
*
|
double
*
|
不适用 | 不适用 | 不适用 | 不适用 |
long
double
*
|
p
|
匹配实现定义的字符序列,用于表示 指针 。
|
不适用 | 不适用 |
void
**
|
不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
| 备注 | ||||||||||
|
对于除 n 之外的所有转换说明符,从流中消耗的输入字符序列是:不超过指定字段宽度、且完全符合转换说明符预期或符合其预期序列前缀的最长字符序列。该消耗序列后的首个字符(若存在)将保持未读取状态。若消耗序列长度为零,或消耗序列无法按上述规则完成转换,则出现匹配失败——除非因文件终止、编码错误或读取错误导致无法从流中获取输入,此时视为输入失败。 除 [ 、 c 和 n 之外的所有转换说明符,在尝试解析输入前会消耗并丢弃所有前导空白字符(通过调用 isspace 判定)。这些被消耗的字符不计入指定的最大字段宽度。 转换说明符 lc 、 ls 和 l [ 会执行多字节到宽字符的转换,其效果类似于在转换首个字符前,先初始化 mbstate_t 对象为零,再调用 mbrtowc 。 转换说明符 s 和 [ 除了存储匹配的字符外,始终会额外存储空终止符。目标数组的大小必须至少比指定字段宽度大1。若使用 % s 或 % [ 时未指定目标数组大小,其不安全性等同于 gets 。
针对
定宽整数类型
(如
int8_t
等)的正确转换规范定义在头文件
每个转换说明符执行完成后存在一个 顺序点 ,这允许将多个字段存储至同一个“接收”变量中。 当解析以指数符号结尾但无数字的不完整浮点数值时(例如使用转换说明符 % f 解析 "100er" ),将消耗序列 "100e" (可能有效的浮点数的最长前缀),导致匹配错误(消耗的序列无法转换为浮点数),并保留 "r" 未读取。部分现有实现未遵循此规则,会回退至仅消耗 "100" ,保留 "er" ,例如 glibc bug 1765 。 若转换规范无效,则行为未定义。 |
||||||||||
如果转换规范无效,则行为未定义。
返回值
复杂度
不保证。特别要注意的是,某些
sscanf
的实现具有
O(N)
的时间复杂度,其中
N
=
strlen
(
buffer
)
[1]
。
注释
由于大多数转换说明符首先会消耗所有连续的空白字符,因此诸如
scanf("%d", &a); scanf("%d", &b);
将读取在不同行输入的两个整数(第二个 % d 会消耗第一个输入遗留的换行符)或在同一行输入、以空格或制表符分隔的两个整数(第二个 % d 会消耗这些空格或制表符)。
The conversion specifiers that do not consume leading whitespace, such as % c , can be made to do so by using a whitespace character in the format string:scanf("%d", &a); scanf(" %c", &c); // 消耗 %d 之后的所有连续空白字符,然后读取一个字符
示例
#define __STDC_WANT_LIB_EXT1__ 1 #include <stdio.h> #include <stddef.h> #include <locale.h> int main(void) { int i, j; float x, y; char str1[10], str2[4]; wchar_t warr[2]; setlocale(LC_ALL, "en_US.utf8"); char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水"; /* 解析方式如下: %d:一个整数 %f:一个浮点数值 %9s:最多9个非空白字符的字符串 %2d:两位整数(数字5和6) %f:一个浮点数值(数字7、8、9) %*d:一个不存储在任何位置的整数 ' ':所有连续空白字符 %3[0-9]:最多3位十进制数字的字符串(数字5和6) %2lc:两个宽字符,使用多字节到宽字符转换 */ int ret = sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc", &i, &x, str1, &j, &y, str2, warr); printf("Converted %d fields:\n" "i = %d\n" "x = %f\n" "str1 = %s\n" "j = %d\n" "y = %f\n" "str2 = %s\n" "warr[0] = U+%x\n" "warr[1] = U+%x\n", ret, i, x, str1, j, y, str2, warr[0], warr[1]); #ifdef __STDC_LIB_EXT1__ int n = sscanf_s(input, "%d%f%s", &i, &x, str1, (rsize_t)sizeof str1); // 将25写入i,5.432写入x,9字节"Thompson\0"写入str1,3写入n #endif }
可能的输出:
Converted 7 fields: i = 25 x = 5.432000 str1 = Thompson j = 56 y = 789.000000 str2 = 56 warr[0] = U+df warr[1] = U+6c34
参考文献
- C17标准(ISO/IEC 9899:2018):
-
- 7.21.6.2 fscanf函数(页码:231-236)
-
- 7.21.6.4 scanf函数(页码:236-237)
-
- 7.21.6.7 sscanf函数(页码:238-239)
-
- K.3.5.3.2 fscanf_s函数(页码:430-431)
-
- K.3.5.3.4 scanf_s函数(页码:432)
-
- K.3.5.3.7 sscanf_s函数(页码:433)
- C11 标准 (ISO/IEC 9899:2011):
-
- 7.21.6.2 fscanf 函数 (p: 317-324)
-
- 7.21.6.4 scanf 函数 (p: 325)
-
- 7.21.6.7 sscanf 函数 (p: 326)
-
- K.3.5.3.2 fscanf_s 函数 (p: 592-593)
-
- K.3.5.3.4 scanf_s 函数 (p: 594)
-
- K.3.5.3.7 sscanf_s 函数 (p: 596)
- C99标准(ISO/IEC 9899:1999):
-
- 7.19.6.2 fscanf函数(页码:282-289)
-
- 7.19.6.4 scanf函数(页码:290)
-
- 7.19.6.7 sscanf函数(页码:291)
- C89/C90 标准 (ISO/IEC 9899:1990):
-
- 4.9.6.2 fscanf 函数
-
- 4.9.6.4 scanf 函数
-
- 4.9.6.6 sscanf 函数
另请参阅
|
(C99)
(C99)
(C99)
(C11)
(C11)
(C11)
|
从
stdin
、文件流或缓冲区读取格式化输入
使用可变参数列表 (函数) |
|
从文件流获取字符串
(函数) |
|
|
(C99)
(C11)
(C11)
(C11)
(C11)
|
将格式化输出打印到
stdout
、文件流或缓冲区
(函数) |
|
C++ 文档
关于
scanf
、
fscanf
、
sscanf
|
|