代码之家  ›  专栏  ›  技术社区  ›  Will Roberts

斯坦福corenlp分类器:ner训练上下文

  •  0
  • Will Roberts  · 技术社区  · 6 年前

    在斯坦福大学的corenlp分类器中,我看到的所有例子都包含了人们不想识别的单词(用o表示)。例如,以下“特定”和“之前”不被确认为资产:

    certain O       O
    Apple   ASSET   ASSET
    products       ASSET   ASSET
    macOS   ASSET   ASSET
    before  O       O
    

    1)我是否需要提供“确定”和“以前”等上下文的单词?

    2)订单是否重要?我可以,而不是在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”之前,在“做”苹果,在“做”苹果,在“做”产品之前?

    3)如果需要上下文,一旦我添加了足够的培训数据,我是否可以只添加更多没有上下文的资产?

    1 回复  |  直到 6 年前
        1
  •  1
  •   sophros    6 年前

    广告1。如果分类依赖于上下文,则上下文很有用。

    广告2。斯坦福corenlp分类器使用crf( Conditional Random Field )利用词序进行正确分类的算法。

    公元3年。见PT。一。-必要性取决于你的问题和数据。您可以重用以前的上下文,看看这是否会提高或降低分类精度。