![]() |
1
1
这个
列表中的元素似乎不会产生任何重叠的组合。也就是说:没有
这意味着你可以很容易地将一个拼音词分解成如下元素:
输出:
使现代化 :
在看了一本书之后
reliable source
,看来你解析拼音的方法太简单了。这个
table of combinations
这表明并非所有的可能性都是有效的。它还表明,一些组合是模糊的(从纯粹的句法角度来看)。例如
梁
可以解析为
然而,用一个regexp来解决这个问题似乎并不简单,因此您可能需要考虑寻找一个第三方库,它知道如何处理所有棘手的边缘情况。 |
![]() |
John Veridan · 在Python笔记本中仅选择列[无行] 6 年前 |
![]() |
seanysull · 修改regex以包含连字符单词 6 年前 |
![]() |
Ovaflow · 使用nltk中的标记集计算语音中的不同单词 7 年前 |
![]() |
Laurent R · 根据空格和标点符号标记,标点符号保留 7 年前 |
![]() |
mrfr · StreamTokenizer在遇到斜杠时停止 7 年前 |
![]() |
Rose · Elasticsearch:术语搜索不适用于特殊字符 7 年前 |
![]() |
vakarami · 用于提取文件名的模式标记器 7 年前 |
![]() |
Konstantin · 用Ruby将单词分解成字母 7 年前 |