代码之家  ›  专栏  ›  技术社区  ›  abhgh

Berkeley Parser English-在线与离线的不同结果

nlp
  •  0
  • abhgh  · 技术社区  · 6 年前

    我使用的是Berkeley Parser for English,从 here 。这似乎给了我不同于他们在线的结果 demo

    例如,考虑以下句子:

    我是白金会员。我希望有人能立即为我修复这个问题。

    在我的机器上运行解析器会给我这个解析树(这是不正确的):

    在演示过程中运行它时,我得到了这个(正确的):

    有人能指出为什么这里有区别吗?解析器下载仅具有一个英语语法文件, eng_sm6.gr. ,因此它不能是错误的语法文件。这是命令行开关的问题吗?这就是我要运行的: <代码> Java-BelkayPARSER -1.7.JAR GR EngEng6M.Gr

    感谢您的帮助,谢谢!demo.

    例如,考虑以下句子:

    I am a platinum member. I want someone to fix this for me immediately.

    在我的机器上运行解析器会给我这个解析树(这是不正确的): enter image description here

    在演示过程中运行它时,我得到了这个(正确的): enter image description here

    有人能指出为什么这里有区别吗?解析器下载只有一个英文语法文件, eng_sm6.gr ,因此它不能是错误的语法文件。这是命令行开关的问题吗?这就是我要运行的: java -jar BerkeleyParser-1.7.jar -gr eng_sm6.gr

    感谢您的帮助,谢谢!

    1 回复  |  直到 6 年前
        1
  •  1
  •   berkin    6 年前

    对于这种情况,我想起来有两个原因:

    • 他们可能在在线版本中使用了不同的语法。
    • 他们可能在解析前将句子拆分,并将句子合并到在线版本的根节点中。

    您可能希望预先拆分句子,然后单独分析这些句子。统计解析器是用句子训练的。据我所知,Berkeley Parser是一个不存在的解析器,它也接受了句子的训练,但是为它解析更多的标记可能更复杂。正如您在输出中看到的,术语 立即 pos被标记为一个名词;所以你可以先尝试拆分句子,然后解析,看看后面是怎么做的。

    干杯,