让汉字在数码时代凸显符号本色

来源:百度文库 编辑:神马文学网 时间:2024/04/30 18:07:50
[整理] 让汉字在数码时代凸显符号本色(征求意见稿)  luojie25@163.com
作者:胡敬禹 [日期:2007-02-01]

有一则消息揭示了数码时代汉字的发展方向:1月30日微软新一代操作系统vista上市,黑体取代宋体作为默认字体粉墨登场。
使用毛笔的时候我们有楷书,印刷书刊的时候我们有宋体,数码时代我们将面对黑体,黑体汉字的笔画粗细均匀,少了些笔形变化,目前看来一点也不影响汉字文化的内涵。微软对汉字的认识是科学的,它没有固守汉字应用的现状,它要的是一种技术层面上尽量合乎科学的汉字。汉字的发展演变是不会止步的,为了满足数码时代的要求,其符号性将进一步加强,那么明天的汉字将会是什么样子?微软的举动无疑让我们看到了一线曙光。
早在微软动手之前我就开始研制井田字元汉字,设计了一种完全没有斜笔的全新字体(如图1)。

图1
通过图2,我们来比较一下井田字元汉字与常用的楷体、宋体、黑体汉字放大后的差别。

图2
通过比较,可以很直观地得出结论:井田字元汉字是一种无级缩放不变形无锯齿高保真的汉字字体。尽管多少会给人一些矫枉过正的感觉,但是一种能够满足数码时代需要的汉字毕竟已经开始萌芽。

汉字通过长期的历史演变,形成了形体方正、笔画平直的楷书。通过深入研究,笔者认为汉字形体结构的内在规律并非纷繁复杂,恰恰相反,它有着一套结构简单、形体规范、数目较少、容易识记的字母。因为汉字的这种字母由“田”字蜕变而来,反映了汉字“田”上各直线段在不同取舍情形下的64种状态,基本结构只有19种(图3),笔者称之为井田字元,简称字元。

图3
经过整理,井田字元分为3类,共55种形状:
1、归一字元:即独立的正笔,有2种形状:
2、离散字元:正笔相互平行呈离散关系,有4种形状:
3、集结字元:正笔相互制约、彼此粘连交叉构成方块整体,有49种形状:

为什么井田字元可以忽略汉字中斜笔的存在呢?
楷书汉字只采用了一种笔画段——直笔,笔者的统计结果表明,《印刷通用汉字字形表》所收6196个字中一丨/\4种笔画段分别约占37%、28%、20%、15%,其中点画大约占了12%,统计时归入“\”。正笔不仅在数量上占了绝对优势,而且在结体构形时也占了主导地位。斜笔不仅数量少,而且大多与正笔一或丨相交成形,矫正到某一正笔位置极少影响到对汉字的认知。例如:等与井田字元“T”有相同的结构特征。
井田字元是横竖正笔组合成形时最基本的最规范的结构单元,事实上也是汉字形体结构的基本单元,可以作为汉字的一种属性元素。
井田字元通过衍生可产生一系列衍生字符,例如:
十→丰巾中申甘井      丄→由曲上止
王→里缶          土→出击
十→卄→册         十→丰→車韦
有这样一首诗“科学观察惟仔细,大蚤身上小蚤栖,更有小蚤在其上,层层相咬无尽期”,非常形象地描述了汉字的这种衍生结构。
三维结构的化合物可以有相应的分子式,平面结构的汉字更容易转化成一串线性的、有序的字元集合,用字元式来描述。简单起见,我们不妨看看汉字怎样用字元式来表达。
古:二(十口)
月:(二)
胡:〢(二(十口)(二))
串:十(二(口口))
汉字逐渐向井田字元汉字接近,这就是汉字形体演变的客观规律。

为了研究汉字怎样由简单的线条构成数以万计的不同形体,本文给出了汉字各级构件明确的定义和分类,建立起笔画、零件、块件、块组、字型等层层具有井田字元特征的汉字结构系统,这样一来就可以非常方便地对汉字字形的结构单位、结构层次、结构关系和结构模式进行科学地分析。
下面根据汉字的实际情况对汉字各级构件与井田字元间的关系作些简单分析。
1、笔画
汉字只有一丨/\4种基本笔画段,它们或长或短、或独行或相连、或稍呈弧形或略加笔势,从而构成了数十种笔画(笔形)。
笔画是汉字书写的最小单元,形态复杂多变,但是都可以找到井田字元特征。
(1)、一段笔画可分为横竖撇捺点提6类,基本形状为一丨/\,具有归一字元的特征。
(2)、两段笔画可按书写时的运笔方向分为顺时钟和逆时钟两类折笔。除了外,其它的两段笔画的字元特征分别为“”和“”。
类顺折包括等,类逆折包括等。
(3)、多段笔画末端的钩提段均可略去,它们常将一个平面划分成右上和左下两区,一般左下区面积较大而且包容构件,常见多段笔画有:

2、零件
零件是指构成汉字最小的独立的可离析的笔画组合单元。
零件可以按其外观的字元特征分为如下3类:
(1)、归一零件:指汉字中孤立的一段笔画横竖撇捺点提所构成的零件,具有归一字元的特征,基本形状为一丨/\,其长度和形状比较随意。如旦、引、彷、广、弋、寸、犬、太、攸、行等字中孤立的一段笔画。
(2)、离散零件:指汉字中若干一段笔画的离散组合单元,离散零件各笔画的长度和形状比较随意,但相互之间基本保持平行或对称的关系,具有离散字元“二、三、〢、〣”的特征。例如:二、冫、亠、三、氵、彡、川、、忄。
(3)、集结零件:指汉字中若干笔画段的集结组合单元,包括孤立的折笔。集结零件各笔画段彼此相交、相互制约,没有离散的笔画,具有集结字元的特征。例如:厂、乚、匕、丁、亻、甲、申、由、尸、日、目、日、田。
集结零件具有一层或多层字元信息,可以用字元式来描述。
由:丄(曰)  申:十(曰)  甲:T(曰)
目:曰(二)  丰:十(三)  里:王(曰)
零件还可以按其结体的字元特征分为如下2类:
(1)、元形零件 这类零件与字元形状相近。例如:
二:二冫  三:三彡氵  干:干千
土:土士  王:王壬   曰:日曰
(2)、衍生零件 这类零件具有多层次的字元特征。例如:
干:午天开年  十:丰中巾甘井串册  工:正西酉
王:里五重   土:出击生      丄:上由丑止曲且皿
3、块件
块件是指构成汉字的彼此分隔、相对独立的笔画结构块。
本文将块件划分为如下两个大类:
(1)独体块件 即独个的零件,或称单零件块,例如:冫、三、氵、川、厂、尸、丁、甲、申、由、曲、串、年、于、出、工、正、月、刀、目、田。
(2)组合块件 即若干零件的非线性组合块,或称零体组合块,指一个或多个小零件分布在一个大零件的域内或周边,共同构成一个独立的方块整体,这类块件实际上可离析出多个零件。
组合块件又可细分为四种类型:
a、包围型:同、周、凶、冈、区、围、囚、固
b、夹附型:斗、半、寸、夹、求、玉、噩、平
c、依附型:才、尺、木、未、末、本、飞、广
d、混合型:国、勾、疾、病、困、米、柬、鬼
4、块组
我们通常将下列构件当作一个整体单元看待:钅、纟、鱼、革、羊、竹。这些构件可以称作块件组合,简称块组。块组具有离散字元“二、〢、三、〣”的特征,可以泛指若干块件呈上下关系或左右关系的组合单元。例如:
二:钅纟革羊  〢:从此非北
三:高兴合立  〣:班枷排沏
5、字型
单字由块件堆砌组合而成,大致可以分为5类,即独体型、左右型、上下型、左中右型及上中下型,后四类统称为合体型。
独体型汉字本身就是一个完整的块件。
例如:日、月、山、川、虫、毛、用、疾。
合体型汉字由两个或两个以上块件堆砌而成,从整体上看,各块件或块组间也呈线性排列,其字型最终仍可递归还原成离散字元形式,可用离散字元“二、〢、三、〣”作为其字型代码。例如:
二:吕胃品型  〢:体付梧部
三:复算量合  〣:沏维排斑
6、异形构件
在这里,笔者有意地把一些包含折笔的构件分类罗列出来,供大家研究讨论。
X类构件:又、夂、廴、及
K类构件:女、东、拣、车
S类构件:专、亏、鼎、鸟、马、乌、夷、弗
Z类构件:乙、讠、飞、九、凹、几、风、瓦
B类构件:阝、乃、杨、及、廴、凸
这些汉字构件存在形体上不尽符合字元规范的情况,但是仍具有清晰的字元特征而且为数极少。当然其中有些构件是人为造成的,特别是个别行书和草书的笔形进入了楷书,真是耐人寻味。

整个汉字系统其实就是井田字元的衍生体系,井田字元本身就是极其规范的字母,可以作为汉字编码的码元,可以作为标识键盘的键元,这样汉字完全可以拥有自己的字母键盘。
经过国家知识产权局的严格审查,汉字字元编码及中文字元键盘方案已授予国家发明专利权(专利号:ZL95110690.2 G06F3/023)。具体实施方案这里就不详细介绍了。

微软雅黑字体现在成了大陆最流行的字体,因为它是微软发布的最新操作系统vista的默认字体,毫无疑问,从此以后使用vista操作系统的用户必须为微软黑体买单,乐享其成的我们难免多了一丝忧虑。
我们要做的,就是让汉字在数码时代凸显符号本色。