1
17
您需要区分源字符集、执行字符集、连线执行字符集及其基本版本: 基本源字符集:
这个字符集正好有96个字符。它们适合7位。像这样的人物
让我们获取一些基本源字符的二进制表示示例。它们可以是完全任意的,不需要这些对应于ASCII值。
基本执行字符集
如前所述,基本执行字符集包含基本源字符集的所有成员。它仍然不包括任何其他角色,比如
如前所述,基本执行字符集包含回车、空字符和其他字符的表示。
如果基本执行字符集为11位长(如本例中所示),则char数据类型应足够大以存储11位,但可能更长。 _和基本执行范围字符集: 基本执行范围字符用于宽字符(wchar_t)。它基本上与基本的执行范围字符集相同,但也可以有不同的二进制表示。
唯一固定的成员是空字符,它需要是
在基本字符集之间转换:
然后编译一个C++源文件,将源字符集的每个字符转换成基本的执行(宽)字符集。 例子:
自从
关于文件编码:
有几种文件编码。例如
更新的文件编码,如
文件编码要求: 大多数编译器提供命令行开关来指定源文件的文件编码。
C++源文件需要在具有基本源字符集表示的文件编码中进行编码。例如:源文件的文件编码需要具有
如果你能输入字符
非基本字符集: 基本源字符集中未包含的字符属于源字符集。源字符集等同于文件编码。
例如:
不包含在基本(宽)字符集中的字符属于执行(宽)字符集。 记住,编译器将字符从源字符集转换为执行字符集和执行范围字符集。因此,需要有一种方法来转换这些字符。
例如:如果指定
这些字符不能用
指定字符集: 下面是一些如何使用gcc指定字符集的示例。包括默认值。
使用UTF-8和UTF-32作为默认编码,C++源文件可以包含具有任何语言字符的字符串。UTF-8字符可以通过两种方式进行转换,不会出现问题。 扩展字符集:
多字节字符比普通字符的条目长。它们包含一个转义序列,将它们标记为多字节字符。 多字节字符根据用户运行时环境中的区域设置进行处理。这些多字节字符在运行时转换为用户环境中的编码集。 |
rookie · 检查函数模板的所有参数包参数是否属于int 1 年前 |
ivaigult · -W转换和隐式字符串到布尔类型转换 1 年前 |
rainer · 后台插入程序的初始化 1 年前 |
Community wiki · 以理智、安全和高效的方式复制文件 1 年前 |
Shefali Kanaujia · 对C中向量的向量进行排序++ 1 年前 |
Ma Joonyoung · 粗粒度和细粒度链表的时间比较 1 年前 |