代码之家 › 专栏 › 技术社区 › Blixt

使用Python将国际字符替换为基础拉丁字符的好方法是什么?

internationalization string python

Blixt · 技术社区 · 15 年前

说我有绳子 "blÃ¶t trÃ¤bÃ¥t" 其中有一些 a o 上面有乌姆劳特和戒指。我希望它变成 "blot trabat" 尽可能简单。我做了一些挖掘,发现了以下方法:

import unicodedata
unicode_string = unicodedata.normalize('NFKD', unicode(string))

\u0308 对于umlauts。)现在要将其恢复为ASCII字符串,我可以这样做 ascii_string = unicode_string.encode('ASCII', 'ignore') 它将忽略组合字符,从而生成字符串 “涂抹特拉巴特” .

这里的问题是:有没有更好的方法?这感觉像是一种迂回的方式,我在想可能有什么我不知道的。当然,我可以将它封装在一个helper函数中,但我更愿意检查Python中是否还没有这个函数。

1 回复 | 直到 15 年前

Martin v. Löwis 15 年前

如果创建一个显式表,然后使用unicode.translate方法,效果会更好。这样做的好处是,音译更精确,例如将“”音译为“oe”,将“”音译为“ss”,这在德语中是应该做到的。

PyPI上有几个音译包: translitcodec , Unidecode 和 trans .

推荐文章

Thor-x86_128 · 如何使用TypeScript确保两个对象具有相同的结构(没有接口)?

2 年前

Gwen_vere · Wordpress i18n JavaScript文本未翻译

2 年前

spondiirty · 带有宽字符(jp或cn)的python input()在Mac终端上无法正常工作

2 年前

Kingsley Simon · 如果从帮助器方法rails更改,则不会显示I18n转换的值

6 年前

devBem · 反应来自<FormattedMessage>

6 年前

beechy · 两级国际化;资源绑定

6 年前

lpt · 外语中的词云或可视化

6 年前

SeaFuzz · 如何将国际化对象传递给Flutter中的子小部件

7 年前

Heiko · 是否可以在Google Play Store中放置一个带有翻译后应用程序名称的应用程序?

7 年前

lio · 具有三个表和一个动态列的Mysql查询(i18n)

7 年前