![]() |
1
3
这是一个开始:
这将建立一个(word,document)对的列表。你不能轻易地用它编一本字典,因为每个文档都会出现很多次。 但是
可能会有所帮助。 |
![]() |
2
0
|
![]() |
3
0
以下是查找类似文档的解决方案(最难的部分):
一旦找到相似的文档,就应该能够使用defaultdict(如s.lott的答案所示)将每个单词和每个文档的所有匹配列表附加在一起。 相关链接:
|