乱码大全(15)──Unicode(2; UTF-7与汉字乱码)

来源:百度文库 编辑:神马文学网 时间:2024/04/29 01:24:34
乱码大全(15)──Unicode(2; UTF-7与汉字乱码)  UTF,Unicode 转换码,是 Transformation Format of Unicode 的缩写。 Microsoft IE 4.0 和 OutLook Express 的中文版本把它译成“通用字符”,联想到 Microsoft(中国)的“专家”们能够把 uuencode 翻译成“取消编码”,并把 “plug & Play monitor”翻译成“插头和播放监视器”,这个“通用字符”就算是可以接受吧。
UTF-7:A Mail-Safe Transformation Format of Unicode(RFC1642)。这是一种使用 7 位 ASCII 码对 Unicode 码进行转换的编码。它的设计目的仍然是为了在只能传递 7 为编码的邮件网关中传递信息。 UTF-7 对英语字母、数字和常见符号直接显示,而对其他符号用修正的 Base64 编码。符号 + 和 - 号控制编码过程的开始和暂停。所以乱码中如果夹有英文单词,并且相伴有 + 号和 - 号,这就有可能是 UTF-7 编码。例如有这样一封邮件(行号是后加的):
1: From: "bluesea"
2: Subject: =?utf-7?B?K2JVdUwxUS0=?=
3:
4: +IBxOcXgBWSdRaCAd/wxPXIAF/xo-bluesea+/wxsNGcobgVTTg-
5: BBS+YhBUWDACayKPzlco- BBS+Ti2PbI99MAJnLGWHU5+PfU6ObDRnKA-
6: +bgVTTg- BBS +doQ- Internet+i6iLulM6MAI-
我们需要在原信头添加下面的信息:
MIME-Version: 1.0
Content-Type: text/plain; charset="utf-7"
注意,上面两行加在原信的第三行处,与原信头不要留空行。然后将被编辑的信件另存为 *.eml 文件,用双击它启动 OutLook Express 即可获得原信的内容。同时这里也提醒一下,如果你拥有支持 UTF-7 编码能力的邮件程序,在用它发信的时候,尽量不要使用这个编码,以免使对方不知所措。
一个不错的汉字代码转换软件: MView Convert 可以把转换 UTF-7 编码的文件转换为 GB 或其他编码的文件。它的下载地址是:
http://ftpsearch.ntnu.no/cgi-bin/search?query=mvconv.zip
http://irpslibrary.ucsd.edu/software/ms-win/convert/mvconv.zip
http://irpslibrary.ucsd.edu/software/ms-win/dics/mvconv.zip
http://www.speednet.net/~cheung/mvconv.zip
ftp://ftp.ifcss.org/pub/software/ms-win/convert/mvconv.zip
“乱码大全”,作者:bluesea,水木清华BBS成员。欢迎在 BBS 中转载,帮助计算机初学者解决使用软件过程中遇到的实际问题。本文原载于水木清华 BBS 的 Internet 讨论区。地址是: telnet://bbs.tsinghua.edu.cn ,WWW访问的地址是 http://bbs.tsinghua.edu.cn 。当下面的条件全部满足时,转载本文可以不经过作者允许:(1) 转载水木清华 BBS 的信头;(2)不修改原文;(3) 转载仅限于各种 BBS 和非商业性质的个人网点。 严禁各种形式的抄袭,严禁非作者将本文或局部用于任何正式出版的刊物。本自然段是全文的一部分。