代码之家  ›  专栏  ›  技术社区  ›  Paul J. Lucas

WordNet数据文件格式帮助

  •  5
  • Paul J. Lucas  · 技术社区  · 14 年前

    我有一个关于WordNet数据文件格式的问题。wndb(5)手册页部分说明:

    两个词在不同的合成词之间的词汇关系由源和目标词数中的非零值来表示。此字段的前两个字节和后两个字节分别表示源和目标语法集中的字号,它们之间的关系保持不变。单词编号被分配给语法集中的单词字段,从左到右,从1开始。

    让我举一个“贵族”的例子 index.noun 条目是:

    贵族n 14@#m+10 09807754

    相应的data.noun条目是:

    09807754 18 n 03贵族0蓝带0贵族0 013@09623038 n 0000#m 08388207 n 0000+01590484 a 0306+01590484 a 0102~09840639 n 0000~09872782 n 0000~10083823 n 0000~10175090 n 0000~10285135 n 0000~10472799 n 0000~10474064 n 0000~10505732 n 0000~10506642 n 0000 |贵族成员

    第一个“ptr”是:

    @09623038新0000

    data.noun 条目开始于:

    09623038 18 n 01领队0 058@00007846 n 0000。。。

    或者说,源句法集中的所有单词(“贵族”、“蓝血”和“贵族”)与目标句法集中的所有单词之间的关系成立吗?

    1 回复  |  直到 14 年前
        1
  •  1
  •   Quentin Pradet    11 年前

    这种关系确实适用于 源语法集中的所有单词转换为目标语法集中的所有单词 .