1
8
几乎完整的音译表(拉丁语、希腊语和西里尔文字符集)可以在 slughifi library .它面向Django,但可以很容易地修改以满足一般需求(我将它与基于Werkzeug的Appengine应用程序一起使用)。 |
2
4
我只是使用UTF-8作为URL路径。只要域不是IDN FF3,就可以使用它。谷歌正确地读取和显示它们。这个 IRI RFC 允许Unicode。只需确保正确解析传入的URL即可。 |
3
2
一般来说,这取决于你期望得到的语言。如果您的主要用户群是日语,那么删除除ISO-8859-1字符以外的所有字符就不太可能了。 也就是说,如果您的字符集转换库支持,那么一个选项可能是使用音译模式。例如,使用GNU ICONV,可以执行以下操作:
如您所见,重音字符被自动转换为ASCII范围内的某个字符。当然,如何将其转换为代码将取决于您使用的语言,但是如果您的语言基于GNU ICONV进行字符集转换(如果它在Linux上,则很可能是这样),那么只需指定“ascii//translit”作为转换为字符集,就可以直接应用此技巧。 然而,需要注意的一点是,它只对ASCII中“看起来”的字符有效。例如:
如您所见,它对日文没有太大帮助,之后需要进一步处理以删除不适合URL的字符。 |
4
1
如果所有其他方法都失败了,您可以使用转换表,但可能有一个性能更好的解决方案可用。您使用的服务器端语言是什么? |
M - · 为什么两个相同的表情符号不相等? 2 年前 |
Mohsen · 将字符串从Windows 1256转换为UTF-8 6 年前 |
AMINA ARSHAD · 从字符转换为Unicode数字时出错 6 年前 |
Taqwa · 在C#[已关闭]中将上标转换为Unicode 6 年前 |