Namespaces
Variants

char8_t

From cppreference.net
定义于头文件 <uchar.h>
typedef unsigned char char8_t ;
(C23 起)

char8_t 是用于 UTF-8 的无符号整数类型,与 unsigned char 类型相同。

示例

#include <stdio.h>
#include <uchar.h>
int main(void)
{
    char8_t str[] = u8"zß水🍌"; // 或 "z\u00df\u6c34\U0001f34c"
    size_t str_sz = sizeof str; // sizeof *str == 1 根据定义
    printf("%zu UTF-8 代码单元: [ ", str_sz);
    for (size_t n = 0; n < str_sz; ++n)
        printf("%02X ", str[n]);
    printf("]\n");
}

可能的输出:

11 UTF-8 代码单元: [ 7A C3 9F E6 B0 B4 F0 9F 8D 8C 00 ]

参考文献

  • C23 标准 (ISO/IEC 9899:2024):
  • 7.30 Unicode 工具 <uchar.h> (页码: 410)

参见

C++ 文档 关于 基础类型