1
5
听起来您基本上需要检查每个Unicode字符是否在特定范围内。这个 Unicode code charts 应该是一个好的起点。 如果你在使用.NET,我的 MiscUtil 库有一些Unicode范围支持——它是原语,但它应该完成这项工作。我现在没有可供参考的资料来源,但是如果有帮助的话,稍后我会用一个例子来更新这篇文章。 |
2
6
不确定完美答案,但有一个Unicode范围用于 katakana 和 hiragana 在维基百科上列出。(我想也可以从 unicode.org 同样如此。
根据输入检查这些范围应该起到对平假名或片假名进行Unicode语言不可知性验证的作用。 对于汉字,我希望它会更复杂一点,因为我 希望中文和日文中使用的汉字都包含在同一个范围内,但我可能又错了。(我不能指望简体中文和繁体中文在同一范围内…) |
Hugolpz · Awk:如何处理文件夹和子文件夹中的多个文件.txt? 11 年前 |