![]() |
1
5
使用 设置 对于停止语:
和输入txt_file的ArrayList
|
![]() |
2
1
您想从文件中删除重复的单词,下面是相同的高级逻辑。
现在您已经设置了包含文件中所有唯一单词的集合。 |
![]() |
3
1
使用
希望这能有所帮助。 |
![]() |
4
0
如果你只是想从文件中的单词中删除一组特定的单词,你可以随心所欲。但是,如果你正在处理一个涉及自然语言处理的问题,你应该使用一个库。 例如,使用 Lucene 因为标记化一开始看起来会更复杂,但它会处理你会忽略的无数复杂问题,如果你改变主意,改变特定的权宜之计,改变你如何标记化,是否关心案件等,它会有很大的灵活性。 |
![]() |
5
0
你应该尝试使用
|