-3
|
shakthydoss · 技术社区 · 11 年前 |
1
1
一种简单可行的方法:对于给定的文档,计算 TF-IDF 对每个单词进行测量,并选择前N个单词作为标签(或将候选单词减少一些阈值)。 此外,在您的情况下,对“标题”和“类别”字段中的单词使用经验增强系数是合理的。 |
PhD Rookie · 选择最可能选项的决策树? 6 年前 |
The_Anil · 获取无效类型比较错误 6 年前 |
Mohit Shah · 为什么在选择模型之前不进行模型调整? 6 年前 |
r1d1 · 主题提取和文本分类在概念上有什么区别? 6 年前 |
Sara · 按行从两列中选择重复项,并在R中创建一个新变量 6 年前 |
Syahnur Nizam · 使用Weka作为引擎的基于PHP的网站 6 年前 |
Abdelghani Info · 为什么使用支持向量机? 6 年前 |