代码之家  ›  专栏  ›  技术社区  ›  Anil Jagtap

en-core-web-sm、en-core-web-md和en-core-web-lg spacy模型有什么区别?

  •  7
  • Anil Jagtap  · 技术社区  · 6 年前

    我在系统上安装了SPAcy,我想解析/提取人名、英文组织。但我看到了 here 有4种英语模式。还有 model versioning. 我不知道哪种型号比较大,需要选择哪种型号进行开发?

    2 回复  |  直到 5 年前
        1
  •  9
  •   AKX Bryan Oakley    6 年前

    sm / md / lg 请参阅型号的尺寸(分别为小、中、大)。

    正如你链接到的模型页面上所说,

    模型差异主要是统计的。总的来说,我们确实希望更大的模型是“更好的”和更准确的整体。最终,它取决于您的用例和需求。我们建议从默认模型开始(下面用星号标记)。

    FWIW公司 模型是默认值(如上所述)

        2
  •  1
  •   typhon04 jpp    5 年前

    不同之处在于预测的准确性。

    但是,正如你在 comparison 在SPAcy文档中,差异非常小。

    这个 en_core_web_lg ( 788兆字节 ) 与…相比 en_core_web_sm ( 10兆字节 ) :

    • LAS: 90.07% VS 89.66%
    • 销售时点情报系统: 96.98% VS 96.78%
    • UAS: 91.83% VS 91.53%
    • NER F分数: 86.62% VS 85.86%
    • NER精度: 87.03% VS 86.33%
    • NER回忆: 86.20% VS 85.39%

    一直以来 en-core-web-lg公司 79次 更大,因此加载更慢。

    我建议您使用 en-core-web-sm 同时开发并在生产中转换为更大的模型。 只需更改加载的模型,就可以轻松地进行切换。

    nlp = spacy.load("en_core_web_lg")