代码之家 › 专栏 › 技术社区 › Laurynas Biveinis

Emacs23使用的字符集比Unicode大四倍-为什么?

emacs23 unicode emacs

Laurynas Biveinis · 技术社区 · 15 年前

来自Emacs 23.1 NEWS :

***Emacs字符集现在是Unicode的超集。(关于…… 是代码空间的四倍, 应该足够了)。

更多详细信息,请参阅:

***在多字节缓冲区和字符串中,字符由UTF-8表示。字节序列。字符代码空格现在是0x0..0x3ffff,不带间隙;代码点0x0..0x10ffff为相同代码的Unicode字符点,而代码点 0x3ff80..0x3ffff是原始8位字节。

根据维基百科的说法, BMP 的 UCS 包含65536个字符,最新版本的 Unicode 包含超过10.7万个字符,并且UCS有超过100万个代码点。0x3ffff超过400万。

可以解决哪些问题,或者使用内部字符集作为Unicode的超集有什么好处?

1 回复 | 直到 15 年前

glenatron 15 年前

Unicode被设计为包含所有人类语言所需的字符集,这对于代码的全球化/本地化当然是有用的,但是因为Emacs本身就是神的工具,它还必须包含所有类型的神可以使用的每一个字符(包括但不限于伟大的老年人)、太空竞赛(包括但不限于我们未来的外星人霸主)、超智能机器智能(包括但不限于我们未来的机器人大师)以及其他所有渴望无限宇宙能量的存在。可能有很多角色!

或者可以将utf-8作为一种编码字符的方法,它比Unicode集和Emacs所占用的空间大得多,Emacs只支持整个utf-8,但我更喜欢上面的解释。

推荐文章

M - · 为什么两个相同的表情符号不相等?

2 年前

Andrei Cleland · 在长正则表达式中包含unicode字符

2 年前

Mohsen · 将字符串从Windows 1256转换为UTF-8

6 年前

jpantina · 如何使用Python 3导入带有保存为Unicode文本的CSV扩展名的Excel文件?

6 年前

Bao Thai · 使用pandas数据帧在python中将utf转换为ascii

6 年前

AMINA ARSHAD · 从字符转换为Unicode数字时出错

6 年前

Maverick · VS2017 C++编译器错误C2664无法转换参数

6 年前

Ivan Bilan · Python 2字符串以某种方式保存为纯Unicode

6 年前

Taqwa · 在C#[已关闭]中将上标转换为Unicode

7 年前

ecjb · 无法在Jupyter的PDF输出中显示Unicode字符(如)

7 年前