敏感词过滤和奥威尔的“新话词典”

来源:百度文库 编辑:神马文学网 时间:2024/04/29 14:55:15

敏感词过滤和奥威尔的“新话词典”

(2010-04-06 15:51:50)转载 标签:

奥威尔

网管

敏感词过滤

杂谈

大清入主中原,草木皆兵,连汉字也暗藏杀机,不得不防。于是,“清”字成了大清国的敏感词,含有敏感词的诗句“清风不识字,何事乱翻书”让翰林官徐骏掉了脑袋。

共产党进了京城,本是铁打的江山,不料数十年后竟也怕起汉字来了,“共产党”三字在互联网上像“清”字一样成了敏感词。虽不至于取人脑袋,但贴在网上的文章免不了因含有“共产党”三字而被莫名其妙地排头砍去。我的一篇短文《宋庆龄的最后归宿》贴在新浪网上时便享受过此等待遇:

 

网上流传的何方、陈敏等人披露的宋庆龄生前的那些话,我看是真真假假、有真有假,但起码是动过手脚的。这一类游戏已成“网上政治”最时髦的手段,不是仅用在宋庆龄一人身上。

和鲁迅一样具备独立人格的宋庆龄,对历次政治运动的中的错误行为和党内斗争中那些违背人性的东西不可能不置一词,也肯定不愿同流合污,但要说她因此而对共产党“心冷了”、对她一生同中共的合作“后悔了”,甚至于“厌世”或想出走,那恐怕是对她更大的不敬和污蔑。宋最后要求加入共产党这件事我看是真实的,也合乎她一贯的信念。中共的元老们,如邓公和小超等人对宋无疑是极为尊重的,也不会愚蠢到开这样大的历史性玩笑,要在一个已死之人身上弄虚作假。

八十年代初的政治环境并不需要用宋的政治归宿来给中共注射强心针,宋的入党要求更多的是个人色彩,但在某些政治势力利用那些真真假假的“遗言”来歪曲她的形象时,她的最后的政治意愿无疑成了最好的回答。

 

显而易见,这寥寥三百余字基本上“政治正确”,是替共产党辩诬。然而,却因含有敏感词而被新浪网删除。无奈之中,只好将“共产党”换成“G产党”,“中共”换成“中G”,让土生土长的中共带上一点外国色彩后重新贴出,这才准于过关,至今还苟活在新浪网上。

据说,北京某大学在网上的博士招生简章中,出现了要求考生“拥护中国敏感词过滤的领导”的词句,更是让人啼笑皆非。要不是胡学长在天安门阅兵,我真的有点怀疑反动势力已潜入政府机关,逼迫共产党再度成了地下党。

这一类笑话,并不能全怪政府相关部门的主管大人,古今中外,都有书报审查的惯例,互联网时代让“老革命遇到了新问题”,面对浩如烟海的网上文字出此下策恐怕也是不得已的事。但将这类审查简化成敏感词过滤,这水平大概和当年国民党见到红色封面的书便要收缴一样愚蠢和神经过敏。

 

倘若要使我的短文《宋庆龄的最后归宿》在网上流芳百世,不被删除,按照流行的做法,应当将文中所有涉及敏感内容的词语加以隐去,譬如,其中之一段可改写为:

 

和鲁迅一样具备独 & 立人格的S庆 & 龄,对历次Z/Z运 & 动的中的错误行为和D内斗 & 争中那些违背人 & 性的东西不可能不置一词,也肯定不愿同流合污,但要说她因此而对G/C/D“心冷了”、对她一生同中G的合作“后悔了”,甚至于“厌世”或想出走,那恐怕是对她更大的不敬和污 & 蔑。S最后要求加入G/C/D这件事我看是真实的,也合乎她一贯的信 & 念。中G的元老们,如D公和小CHAO等人对S无疑是极为尊重的,也不会愚蠢到开这样大的历 & 史性玩笑,要在一个已死之人身上弄 & 虚 & 作 & 假。

 

这看起来有点像是加了片假名和平假名的日文,也有人称之为“火星文”。显然,敏感词过滤让汉字面临重大改革,否则,随着“片假名和平假名”的大量引入,以及像“明珠”(民主)、“发指”(法制)、“滋油”(自由)等“新词”的流行,中国人很快将看不懂中文了。

在奥威尔的著名小说《一九八四》里,大洋国的“英社”党(Ingsoc,英国社会主义)早在1984年便预见到敏感文字问题的严重性,曾下大力对英语作了脱胎换骨的改造,并推出“新话词典”,不仅大大减少了敏感词语的出现,而且让国民有典可查,能读懂用“新话”写出的任何文章。这无疑为汉字的改革提供了宝贵的经验。

新话的两个最主要特征是:词汇量的大大压缩,和对保留词汇、新词汇含义的“脱敏”处理。譬如“free”和“equal”这两个词不再含有任何政治上的意义。“All mans are equal”(人人平等)这句话表达的只是每个人在个头、体重和力量上都相等,政治平等的概念不复存在。同样,“politically free”(政治上自由)和“intellectually free”(思想上自由)这一类旧说法被淘汰,不会出现在文字中。

为减轻敏感词过滤的工作量,大幅度压缩词汇量也是十分重要的。

在“新话”里,压缩词汇量的途径之一是将相关事物用单一的新词加以概括。譬如,人类的全部性活动被概括成两个词:goodsex和sexcrime。只有夫妻之间为了生出孩子这唯一目的而进行的性交,并且女方无快感,才被定义为goodsex。其它的一切性活动,包括淫乱、通奸、同性恋和任何性变态均称之为sexcrime,并在原则上处于相同的惩罚:死刑。

Sexcrime这个抽象的新词使大洋国的公民不再受到淫乱(Promiscuous)、通奸(adultery)、同性恋(homosexual)和性变态(paraphilia)这些过于形象的旧词所包含的犯罪性诱惑。同样的道理使得人们不再追求公正(justice)、民主(democracy)、科学(science)和宗教(religion)等,因为它们已由党的名称“Ingsoc”这一新词所概括。

淫乱、通奸、同性恋、性变态、公正、民主、和宗教等敏感词汇统统被扫进了历史的垃圾堆,不再让人类过敏了,这是怎样的一件大快人心事呵!

当然,日常事务中必须使用的那些词,比如饮食、工作、穿衣、驾车、种花、烹饪,和狗、猫、老鼠等等都在“新话词典”中保留了下来。但它的数目非常之小,而意义又受到严格得多的限定。凡是意思上模棱两可、有细微差别的地方,都一概删除。譬如dog(狗)这个字仅限于指有四条腿和一条尾巴的动物,而不能引伸出任何其它含义。鲁迅先生将梁实秋先生称之为“丧家的资本家的乏走狗”,这在新话语境里是绝对不会发生的,也是绝对不被容许的,因为梁实秋先生不仅只有两条腿而且没有尾巴。

指出这一点十分重要。因为由于词语的单一性,对英社党的任何“指桑骂槐”、“含沙射影”式的攻击将不再有可能,而任何赤裸裸的恶毒攻击都将很容易被“敏感词过滤软件”所捕获。

当然,用新话创作的文艺小说(如果有一些怀旧的人对此仍有兴趣的话)不再有意识流、悬念或隐喻一类精神污染式的玩意儿。《青春之歌》也和上个世纪三十年代的什么学生运动不再有关,它只可能是一部描述青年人追求时尚的网络小说。

 

在1984年,无论口头还是书面,在大洋国还没有人能够把新话作为他惟一的交流工具。虽然《泰晤士报》上的社论都是用新话写成,但这种技艺只有专家才能掌握。预计到2050年,新话会最终取代老话。

随着敏感词过滤制造的笑话所带来的迫切性,中国人有可能会超过大洋国,提前制定出中国的“新话词典”。