1
0
让我们退一步问问 传统上,我们用n-gram表示文本。N-gram试图捕捉有趣的搭配,即组合在一起的单词,例如“White House”作为二元图,可能比仅仅知道句子包含单词“White”和“House”更有趣。 使用n-gram的缺点是稀疏性增加——许多搭配的频率较低。我们可能会在预测时遇到以前从未见过的搭配。
|
user6172474 · 有什么比字典更快的吗?[副本] 7 年前 |
FF0605 · 如何在python中将多个句子转换为二元图 7 年前 |
ignorance · 如何在MxNet中计算n-gram? 7 年前 |