![]() |
1
0
neural network 才能认出他们。给出链接的数量/类型,也许还有HTML标记的类型。
|
![]() |
2
3
我相信你在尝试文档分类,这是一个很好的研究课题。 http://en.wikipedia.org/wiki/Document_classification 你会看到很多不同的方法。但是,在确定你所称的“趋势”之前,提出任何一种(或神经网络等)建议都是过早的。我建议研究“web文档分类”等。这显然是文献分类的一个相当大的子集,如果你能接触到学术期刊,就会有很多令人费解的文章供你欣赏。 http://uhaweb.hartford.edu/compsci/ccli/wdc.htm 最后,我认为这是一个可访问的(如果格式奇怪的话)网站,有一个一般的,也许过时的讨论: http://www.webology.ir/2008/v5n1/a52.html
|
![]() |
danial · 如何在多个字符串的每个位置找到最频繁的字符 2 年前 |
![]() |
Manny · 如何比较Perl中的字符串? 2 年前 |
![]() |
Diret · 获取范围内每个数字的子倍数的算法 2 年前 |
![]() |
Saif · 排序时python如何决定何时调用比较器? 2 年前 |