1
1
这样做的一种方法是使用tidyText,它的数量和文本挖掘包的数量一样多。我之所以选择TidyText,是因为你使用的是dplyr,这很好地解决了这个问题。我正在使用一个内部连接将词典与您的数据连接起来。如果要保留词典中不匹配的单词,请将其更改为左连接。
TidyText的额外信息: tidy text mining with R cran task view Natural Language Programming 其他套餐:Quanteda、Qdap、Momentr、Udpipe |
2
1
这是一个基地
这可以增强(例如通过
|
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |