关于 Nutch 的一个问题: 中文乱码

来源:百度文库 编辑:神马文学网 时间:2024/04/18 16:28:56
站内相关文章|Related Articles
Nutch 初体验之二
Nutch 初体验
很多朋友都遇到Nutch 0.6 输入中文会出现乱码的问题。这个问题其实和 Nutch 关系不大,主要原因是使用 Tomcat 5.0 的问题。解决办法是修改 Tomcat 的 server.xml 文件的 connnector:

其中 URIEncoding="UTF-8" useBodyEncodingForURI="true" 是需要新增的。否则搜索栏输入的字符默认编码将不能正确解析。
注:这个小 Hint 本来是写在站点的首页页面的,今天把他整理一下放到这里.
Technorati Tags:Nutch BTW: "乱码"用英语如何翻译? Scrambled code/characters
Illegible contents/characters/codes
Truncated words/contents
Garbled character/code 最后一个似乎更好 这篇 【关于 Nutch 的一个问题: 中文乱码 】来自dbanotes.net | | del.icio.us |雅虎收藏+ |365Key |CSDN 网摘