![]() |
1
11
我查过juniversalchardet和ICU4J ,结果不一致: Juniversalchaddet有更好的结果:
因此,人们应该考虑他最有可能要处理的编码。 ICU4J公司 请注意,ICU4J仍在维护中。 还要注意,您可能想要使用ICU4J,如果它返回null是因为它没有成功,那么尝试使用juniversalchardet。或者相反。 AutoDetectReader Apache Tika 确实如此-首先尝试使用HtmlEncodingDetector,然后使用UniversalEncodingDetector(基于juniversalchardet),然后尝试使用Icu4jEncodingDetector(基于ICU4J)。 |
![]() |
2
4
我在网上找到了答案: http://fredeaker.blogspot.com/2007/01/character-encoding-detection.html
所以我才用 现在。我会用结果更新这篇文章。 |
![]() |
3
1
与其他应用程序相比,它更容易与我们的应用程序集成,并产生了很好的结果。 |