代码之家 › 专栏 › 技术社区 › Will Roberts

斯坦福corenlp分类器:ner训练上下文

stanford-nlp

Will Roberts · 技术社区 · 6 年前

在斯坦福大学的corenlp分类器中,我看到的所有例子都包含了人们不想识别的单词(用o表示)。例如,以下“特定”和“之前”不被确认为资产:

certain O       O
Apple   ASSET   ASSET
products       ASSET   ASSET
macOS   ASSET   ASSET
before  O       O

1)我是否需要提供“确定”和“以前”等上下文的单词?

2)订单是否重要?我可以,而不是在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”苹果,在“做”苹果,在“做”产品之前?

3)如果需要上下文,一旦我添加了足够的培训数据,我是否可以只添加更多没有上下文的资产?

1 回复 | 直到 6 年前

sophros 6 年前

广告1。如果分类依赖于上下文,则上下文很有用。

广告2。斯坦福corenlp分类器使用crf( Conditional Random Field )利用词序进行正确分类的算法。

公元3年。见PT。一。-必要性取决于你的问题和数据。您可以重用以前的上下文,看看这是否会提高或降低分类精度。

推荐文章

Axel Clerici · 斯坦福NLP:共指消解语料库

6 年前

Thomas ISHIGAKI · 如何在多线程中运行命令行CoreNLP?

6 年前

meera_meera · 生成任务的BLEU分数

6 年前

Kay · ColumnDataClassifier的最大类数

6 年前

George Wang · 斯坦福CoreNLP 3.9.1中国模型未加载

6 年前

nixxo_raa · 如何在Java中提取所有类型的名词?

6 年前

S.EB · 泰米尔语中有词性标记语和标记语吗?

7 年前

David Batista · 培训斯坦福NER CRF,控制迭代次数和正则化(L1、L2)参数

7 年前

FrancoisTheFrenchOne · 斯坦福德·科伦普(StanfordCoreNLP)可用的法国模型都是用哪种树库训练的?

7 年前

matt_07734 · 斯坦福大学CoreNLP中的详细情绪分数

7 年前