我有一个关于WordNet数据文件格式的问题。wndb(5)手册页部分说明:
两个词在不同的合成词之间的词汇关系由源和目标词数中的非零值来表示。此字段的前两个字节和后两个字节分别表示源和目标语法集中的字号,它们之间的关系保持不变。单词编号被分配给语法集中的单词字段,从左到右,从1开始。
让我举一个“贵族”的例子
index.noun
条目是:
贵族n 14@#m+10 09807754
相应的data.noun条目是:
09807754 18 n 03贵族0蓝带0贵族0 013@09623038 n 0000#m 08388207 n 0000+01590484 a 0306+01590484 a 0102~09840639 n 0000~09872782 n 0000~10083823 n 0000~10175090 n 0000~10285135 n 0000~10472799 n 0000~10474064 n 0000~10505732 n 0000~10506642 n 0000 |贵族成员
第一个“ptr”是:
@09623038新0000
data.noun
条目开始于:
09623038 18 n 01领队0 058@00007846 n 0000。。。
或者说,源句法集中的所有单词(“贵族”、“蓝血”和“贵族”)与目标句法集中的所有单词之间的关系成立吗?