![]() |
1
4
据Spacy称,使用Spacy的日语标记化仍处于研究阶段 alpha phase . 标记化的理想方法是为标记化的单词列表提供与语言结构有关的信息。例如,对于一个英语句子,你可以试试这个
这些结果目前还不适用于日语。
此外,如果您查看spacy的源代码
here
,您将看到令牌化是可用的,但它只带来了
因此,对于构建令牌化,目前强烈建议使用 janome 下面给出了一个示例
我认为spacy团队正在研究类似的输出,为日语构建模型,这样也可以为日语构建“特定于语言的”结构,类似于其他语言的结构。 使现代化 here , here & here udpipe似乎支持50多种语言,就语言支持而言,它为我们在Spacy中看到的问题提供了解决方案。 |
![]() |
2
2
尝试使用此选项:
|
![]() |
Lau Kumra · 如何为货币重新训练现有spacy-NER模型 6 年前 |
![]() |
Abhishek Ram · 如何在Spacy中添加其他货币字符 6 年前 |
![]() |
max · 我怎样才能得到作为某个动词宾语的名词从句? 6 年前 |
![]() |
Thoc theodox · Spacy培训多线程CPU使用率 6 年前 |
![]() |
Marc P. · 文本分类TA的训练样本数 7 年前 |
![]() |
jamesk · 在空间中识别“it”主题 7 年前 |