代码之家 › 专栏 › 技术社区 › abhgh

Berkeley Parser English-在线与离线的不同结果

nlp

abhgh · 技术社区 · 6 年前

我使用的是Berkeley Parser for English,从 here 。这似乎给了我不同于他们在线的结果 demo 。

例如,考虑以下句子:

我是白金会员。我希望有人能立即为我修复这个问题。


   
    
     在我的机器上运行解析器会给我这个解析树(这是不正确的):
    
    
     
    
   
   
    在演示过程中运行它时,我得到了这个(正确的):
    
     
    
   
   
    有人能指出为什么这里有区别吗?解析器下载仅具有一个英语语法文件,
    
     eng_sm6.gr.
     
      ,因此它不能是错误的语法文件。这是命令行开关的问题吗?这就是我要运行的:
<代码> Java-BelkayPARSER -1.7.JAR GR EngEng6M.Gr
     
    
   
   
    
     
      感谢您的帮助,谢谢!demo.
     
     
      例如,考虑以下句子:
     
     
      
       I am a platinum member. I want someone to fix this for me immediately.
      
     
     
      在我的机器上运行解析器会给我这个解析树(这是不正确的):
      
       
      
     
     
     
     
      在演示过程中运行它时,我得到了这个(正确的):
      
       
      
     
     
     
     
      有人能指出为什么这里有区别吗?解析器下载只有一个英文语法文件,
      
       eng_sm6.gr
      
      ,因此它不能是错误的语法文件。这是命令行开关的问题吗?这就是我要运行的:
      
       java -jar BerkeleyParser-1.7.jar -gr eng_sm6.gr
      
     
     
      感谢您的帮助,谢谢!

1 回复 | 直到 6 年前

berkin 6 年前

对于这种情况,我想起来有两个原因:

他们可能在在线版本中使用了不同的语法。
他们可能在解析前将句子拆分,并将句子合并到在线版本的根节点中。

您可能希望预先拆分句子,然后单独分析这些句子。统计解析器是用句子训练的。据我所知,Berkeley Parser是一个不存在的解析器,它也接受了句子的训练,但是为它解析更多的标记可能更复杂。正如您在输出中看到的,术语立即 pos被标记为一个名词;所以你可以先尝试拆分句子,然后解析,看看后面是怎么做的。

干杯,

推荐文章

XYZ · 如何将每行的每个字转换为数据帧的数值

2 年前

August Nilsson · 计算R中两个单词嵌入之间的文本相似性时,`select()`不处理列表'

2 年前

John · 使用R中的单词嵌入从文本变量预测数字变量

2 年前

Mucida · BERT2:如何使用GPT2LMHeadModel开始一个句子,而不是完成它

2 年前

Sab Garduño · w2v_列中出现错误(trainFile=file_列,modelFile=model,stopWordsFile=file_stopwords)(下面是完整的错误文本)

2 年前

Bennet Weber · 有没有办法用python找到一个单词的反义词(意思相反的单词)?你知道数据集或nlp工具包吗?

2 年前

Michael W · 从数据帧创建术语频率矩阵的有效方法

2 年前

Moodhi · 计算GEC的F分数

2 年前

user18628526 · 什么时候使用Word2vec和一大堆单词?

2 年前

Merve · 如果我想返回列表上的一个操作,但当它返回空值时它保持不变,我怎么说呢?

2 年前