代码之家 › 专栏 › 技术社区 › JL. Hans Passant

非英语特殊字符

locale internationalization

JL. Hans Passant · 技术社区 · 15 年前

如何生成一个包含特定区域中所有字符代码的文本文件,例如1029捷克语。我基本上想生成一个在字母表中存在的每个字符的列表?

3 回复 | 直到 15 年前

Aaron Digulla 15 年前

如果这是Windows区域设置,只需生成一个包含32到255个字节的文件:区域设置的字节代码是相同的;它们只是对每个字节的解释不同。见 this page 用于链接。

示例:字节0xA5在捷克语代码页(1250)中表示“_”,而在德语代码页(1252 A.K.A ISO-Latin-1)中表示“_”。

[编辑]请注意,这仅适用于一个字节映射到一个字符的Unicode前区域设置。它不适用于每个字符需要两个或更多字节的任何亚洲区域设置。

Santi 15 年前

我会用python+beautiful soup编写一个脚本,它可以从以下位置获取所有脚本:

Mihai Nita 15 年前

CLDR(公共区域设置数据存储库, http://cldr.unicode.org/ )包含该信息。

但是,如果您使用Unicode处理所有事情,就没有很好的理由去关心。欧盟现在的成员国在几个“传统”代码页上使用字符:西欧、东欧、土耳其、波罗的海、希腊、西里尔文。Unicode是唯一的方法。

推荐文章

shim · 如何在日期格式化程序的日期和时间设置中正确支持iOS 12小时/24小时时间覆盖?

6 年前

Rohan West · 是什么控制了中的CurrencyPositivePattern。网

6 年前

BugShotGG · 如何在c中处理ifstream、cout等的多个区域设置++

6 年前

JosanSun · 为什么我在关于文件编码格式的qt代码中得到了凌乱的代码结果?

6 年前

JuMoGar · 读/写特殊字符(如颚化符,…)在控制台应用程序C中

6 年前

user2060733 · 特定地区的Android分析异常

6 年前

Paul Santus · DateTimeFormatter。withLocale():根据FormatStyle和Locale引用所有模式

7 年前

Parth Anjaria · 抽屉布局区域设置未更改

7 年前

Ufkoku · 设置默认区域设置

7 年前

MJB · 如何识别站点中的当前区域设置

7 年前