std::mbstowcs
来自cppreference.com
在标头 <cstdlib> 定义
|
||
std::size_t mbstowcs( wchar_t* dst, const char* src, std::size_t len); |
||
转换来自首元素为 src
所指向的数组的多字节字符串到其宽字符表示。被转换的字符存储于 dst
所指向数组的相继元素。写入目标数组的宽字符数不多于 len
。
如同以调用 std::mbtowc 转换每个字符,除了 mbtowc 转换状态不受影响。若满足下列条件则转换停止:
* 转换并存储了多字节空字符。
* 遇到(当前 C 本地环境中的)非法多字节字符。
* 本要存储的下个宽字符会超出
len
。注意
大多数实现中, 此函数在处理过字符串时更新 std::mbstate_t 类型的全局静态对象,而且不能为二个线程所同时调用,这种情况应该用 std::mbsrtowcs 。
POSIX 指定一个常见扩展:若 dst
是空指针,则此函数返回假设转换则写入 dst
的宽字符数。类似行为对于 std::mbsrtowcs 是标准。
参数
dst | - | 指向将存储宽字符串的宽字符数组的指针 |
src | - | 指向要转换的空终止多字节字符串的首元素的指针 |
len | - | dst 所指向的数组中的可用宽字符数 |
返回值
成功时,返回目标数组的宽字符数,不含终止符 L'\0' 。
转换错误时(若遇到非法多字节字符),返回 static_cast<std::size_t>(-1) 。
示例
运行此代码
#include <iostream> #include <clocale> #include <cstdlib> int main() { std::setlocale(LC_ALL, "en_US.utf8"); std::wcout.imbue(std::locale("en_US.utf8")); const char* mbstr = u8"z\u00df\u6c34\U0001f34c"; // 或 u8"zß水🍌" // 或 "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9f\x8d\x8c"; wchar_t wstr[5]; std::mbstowcs(wstr, mbstr, 5); std::wcout << "wide string: " << wstr << '\n'; }
输出:
wide string: zß水🍌
参阅
给定状态,转换窄多字节字符串到宽字符串 (函数) | |
转换宽字符串为窄多字节字符串 (函数) | |
[虚] |
将字符串从 ExternT 转换到 InternT ,例如在从文件读取时 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数) |