std::codecvt_mode

在标头 `<codecvt>` 定义
enum codecvt_mode { consume_header = 4, generate_header = 2, little_endian = 1 };		(C++11 起) (C++17 中弃用)

平面 std::codecvt_utf8、std::codecvt_utf16 和 std::codecvt_utf8_utf16 接受可选的 std::codecvt_mode 类型值为模板实参，这会指定 unicode 字符串转换的可选特性。

常量

在标头 `<locale>` 定义
值	含义
`little_endian`	假设输入是小端序（仅应用于 UTF-16 ，默认为大端序）
`consume_header`	消耗可能在输入序列的开始存在的字节序标记，而且（在 UTF-16 的情况下）依赖于为解码剩下输入而指定的字节序
`generate_header`	在输出序列的开始输出字节序标记

可以辨认的字节序标记有：

`0xfe 0xff`	UTF-16 大端
`0xff 0xfe`	UTF-16 小端
`0xef 0xbb 0xbf`	UTF-8 （端序无影响）

如果在读以字节序标记开始的文件时未指定 std::consume_header，那么将 Unicode 字符 U+FEFF（零宽无中断空格）读作字符串内容的首字符。

示例

下列示例演示消耗 UTF-8 字节序标记：

运行此代码

#include <fstream>
#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
 
int main()
{
    // 带字节序标记的 UTF-8 数据
    std::ofstream("text.txt") << u8"\ufeffz\u6c34\U0001d10b";
 
    // 读 UTF8 文件，跳过字节序标记
    std::wifstream fin("text.txt");
    fin.imbue(std::locale(fin.getloc(),
                          new std::codecvt_utf8<wchar_t, 0x10ffff, std::consume_header>));
 
    for (wchar_t c; fin.get(c);)
        std::cout << std::hex << std::showbase << c << '\n';
}

输出：

0x7a
0x6c34
0x1d10b

参阅

codecvt	在字符编码间转换，包括 UTF-8、UTF-16、UTF-32 (类模板)
codecvt_utf8 (C++11)(C++17 中弃用)	在 UTF-8 与 UCS-2/UCS-4 间转换 (类模板)
codecvt_utf16 (C++11)(C++17 中弃用)	在 UTF-16 与 UCS-2/UCS-4 间转换 (类模板)
codecvt_utf8_utf16 (C++11)(C++17 中弃用)	在 UTF-8 与 UTF-16 间转换 (类模板)

编译器支持
自立实现与有宿主实现
语言
标准库
标准库标头
具名要求
功能特性测试宏 (C++20)
语言支持库
概念库 (C++20)
元编程库 (C++11)
诊断库
通用工具库
字符串库
容器库
迭代器库
范围库 (C++20)
算法库
数值库
本地化库
输入/输出库
文件系统库 (C++17)
正则表达式库 (C++11)
并发支持库 (C++11)
技术规范
符号索引
外部库

std::codecvt_mode

常量

示例

参阅

导航