代码之家  ›  专栏  ›  技术社区  ›  jack west

使用空格键获取单词在句子中的位置

  •  21
  • jack west  · 技术社区  · 7 年前

    我知道从文档中获取各种属性的基本spacy工作流,但是我找不到一个内置函数来返回作为句子一部分的单词的位置(开始/结束)。

    1 回复  |  直到 7 年前
        1
  •  39
  •   DhruvPathak    7 年前

    这些可以作为句子中标记的属性。 Doc 说:

    idx int父文档中令牌的字符偏移量。

    >>> import spacy
    >>> nlp = spacy.load('en')
    >>> parsed_sentence = nlp(u'This is my sentence')
    >>> [(token.text,token.i) for token in parsed_sentence]
    [(u'This', 0), (u'is', 1), (u'my', 2), (u'sentence', 3)]
    >>> [(token.text,token.idx) for token in parsed_sentence]
    [(u'This', 0), (u'is', 5), (u'my', 8), (u'sentence', 11)]