乱码大全(19)──日文和韩文的汉字编码(2)

来源:百度文库 编辑:神马文学网 时间:2024/04/28 03:00:24
乱码大全(19)──日文和韩文的汉字编码(2)  “乱码大全”,作者:bluesea,水木清华 BBS 成员。欢迎在 BBS 中转载,帮助计算机初学者解决使用软件过程中遇到的实际问题。本文原载于水木清华 BBS 的 Internet讨论区。地址是: telnet://bbs.tsinghua.edu.cn ,WWW访问的地址是 http://bbs.tsinghua.edu.cn 。当下面的条件全部满足时,转载本文可以不经过作者允许:(1) 转载水木清华 BBS 的信头;(2)不修改原文;(3) 转载仅限于各种 BBS 和非商业性质的个人网点。严禁各种形式的抄袭,严禁非作者将 本文或局部用于任何正式出版的刊物。请所有转载文章的网友注意阅读本文的第一段,遵守网络的惯例、尊重作者的劳动。本自然段是全文的一部分。
比较理想的方法是安装一套 NJWIN 1.6,特别要注意:在 PWindows 95 中需要把 Option 中的 My Windows Systems 选项设为 Standard English/Western。( 如果你正在运行金山词霸之类的抓屏翻译软件,最好先关掉鼠标取词功能。) 这样,在 NJWIN 的编码选择菜单中分别去试验日文就韩文的选项。上面五种编码都可以被分别识别出来。如果试验不出来,应该考虑这个编码是否有可能属于 UTF-8 编码,请参考《乱码大全》中关于 UTF-8 编码的部分。
还有一种可以试验的方法,就是将邮件拷贝成一个纯文本文件,在文件的开始加上这样一行:

然后将文件改名为 *.HTM,用 MS-IE 4.0 (需要事先安装日语和朝鲜语组件)浏览,逐一改变语言选项。用 Netscape Navigator 也同样可以。它们都无法识别 KHanzi,Netscape 对 UTF-8 的阅读也要打些折扣。其实,KHanzi 就是 KSC 汉字去掉高位后的结果,和 GB 与 HZ 的关系很相似。类似的还有 BIG-HZ 等。
上面 5 种编码的转换还可以通过软件 MView Convert(下载地址参见“乱码大全──Unicode(2; UTF-7与汉字乱码)” ) 来转换。另外,除了 KHanzi 之外, 前面 4 种编码还可以被 OutLook Express 予以转换。这需要我们在乱码的前面加一个“信头”,格式如下:
MIME-Version: 1.0
Content-Type: text/plain;charset="iso-2022-jp"
其中引号以内的东西,可以是前面例子标题中方括号里的内容。注意如果原来有信头,那么所加的这两行和原来的信头不要有空行,整个信头和正文至少要空一行。然后将文件改名为 *.EML,然后双击它启动 OutLook Express (需要事先安装日文和朝鲜语组件)。当然你可能需要经过试验才能获得正确的解码。
上面这几种编码可能会出现在电子邮件或相应的中文网点中。比如:***的中文周刊报纸《中文报道》(http://www.ntthi.com/cfm/) 的大部分内容就采用的是 JIS 编码。当然,编码的转换只适合以上编码中的汉字的转换,做不到翻 译。BTW,如果你能够阅读日文(网页),却没有合适的日文浏览环境,不妨试一试 http://www.shodouka.com/ ,这个服务器能够将你指定的日文网页转换成图像来阅读,从而没有日文环境也能够阅读日文。