转:英语音标和Unicode

来源:百度文库 编辑:神马文学网 时间:2024/04/26 07:08:42
英语音标和Unicode 收藏
1 缘起
我本来是要整理一份英语音标的替换表。在cnbook中使用这个替换表可以把金山词霸的音标转换到音标对应的Unicode字符,就可以正确显示了。在整理替换表的过程中,发现网上很多关于音标的文章还是图片形式,很多网友还在用特殊字体来输入和显示音标。
其实使用Unicode后,我们基本上可以像处理普通字符一样处理音标。于是我整理了这篇关于英语音标和Unicode的文章。本文假设读者了解Unicode。如果您不熟悉Unicode,可以参考我以前的一些文章:
浅谈文字编码和Unicode(上)
浅谈文字编码和Unicode(下)
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
2 特殊字体
目前很多网友使用特殊字体来输入和显示音标。例如金山词霸的Ksphonet.ttf。这些字体把一些普通的ascii字符映射成英语音标。例如将A映射成æ。用户输入的其实还是A。安装过这种字体的用户可以在Word里实验一下:输入字母A后,将其字体设置为“Kingsoft Phonetic Plain”后,它就被显示成æ。
我们把这样输入的音标复制到其它文本编辑器,其它编辑器按当前字体显示,就会显示出这些音标的原形,即普通的ascii字符。例如我在一个网站上看到过如下的DJ音标介绍:
英语音标表(英语国际音标表,dj音标)
单元音 短元音 [E] [O] [u] [V] [e] [Q]
单元音 长元音 [i:] [E:] [O:] [u:] [A:]
双元音 [ei] [ai] [Oi] [au] [Eu] [iE] [CE] [uE]
清浊成对的辅音 清辅音 [p] [t] [k] [F] [T] [s] [ts] [S] [tS]
清浊成对的辅音 浊辅音 [B] [d] [G] [v] [D] [z] [dz] [dr] [Z] [dZ]
其它辅音 [H] [M] [n] [N] [l] [r] [J] [W]
很容易猜到,编辑是将Word中正常显示的音标直接复制过来的。编辑在Word中使用了GWIPA字体把这些普通字符显示成音标。但在网页上,浏览器没有用GWIPA字体显示这些字符,所以就看到了本来的ascii字符。GWIPA字体采用了以下映射关系:
我按照这个映射关系做一个替换表,将普通字符转换成对应音标的Unicode字符,就可以得到:
英语音标表(英语国际音标表,dj音标)
单元音 短元音 [?] [?] [u] [?] [e] [æ]
单元音 长元音 [i:] [?:] [?:] [u:] [ɑ:]
双元音 [ei] [ai] [?i] [au] [?u] [i?] [??] [u?]
清浊成对的辅音 清辅音 [p] [t] [k] [f] [θ] [s] [ts] [?] [t?]
清浊成对的辅音 浊辅音 [b] [d] [g] [v] [ð] [z] [dz] [dr] [?] [d?]
其它辅音 [h] [?] [n] [N] [l] [r] [j] [w]
3 Unicode字符的显示
不是所有字体都能显示音标对应的Unicode字符。在Windows的默认字体中目前只有"Lucida Sans Unicode"支持这些音标字符。还有一些字符能很好地支持Unicode,例如"Arial Unicode MS"和网友开发的UniFonts。不过这些字体需要用户单独安装。在设计网页时不能假设用户安装过这些字体。
因为Windows默认支持一些Unicode字体(例如"Lucida Sans Unicode"),所以与前面介绍的特殊字体相比,使用Unicode字符有更好的可移植性。更重要的是我们使用了统一的音标字符编码。
目前的浏览器在显示网页时,还不能自动选择支持音标字符的Unicode字体。所以网页设计者需要用css建议浏览器选择可以支持音标字符的字体。例如:
.IPA {
FONT-FAMILY: "Charis SIL", "Doulos SIL", Gentium, GentiumAlt,
"DejaVu Sans", Code2000, "TITUS Cyberbit Basic",
"Arial Unicode MS", "Lucida Sans Unicode",
"Chrysanthi Unicode"
}
在不方便使用css的场合也可以用font标签,例如:
θ
请注意参数: lang="EN-US"。如果没有这个参数,有些音标不能正确显示,例如重音符号?和?。在应用css样式时也应该使用lang参数。
4 IPA符号
4.1 概述
这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。还有个网页提供了IPA字符输入功能。只要点击网页上的字符,字符就会出现在下方的编辑框中。
关于英语语音有一本很著名的书:"English Pronouncing Dictionary",简称EPD。这本书的作者是Daniel JONES,现在经常看到的DJ音标的DJ就来自这位学者。 EPD的第一版是在1917年出版的,以后又陆续出版过很多版本。EPD的第14版首次在1977年出版。1988年,由AC Gimson和SM Ransaran修订过的EPD第14版又重新出版。 1988年的EPD版本的音标使用IPA符号取代了一些传统音标符号。以后英语字典的音标系统基本上都使用与EPD 1988版一致的IPA符号。后面会讨论音标符号的变化。
4.2 英语音标需要的特殊字符
因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。
音标符号 10进制Unicode编码 16进制Unicode编码
æ 230 00E6
ð 240 00F0
? 331 014B
ɑ 593 0251
? 594 0252
? 596 0254
? 601 0259
? 603 025B
? 604 025C
ɡ 609 0261
? 618 026A
? 643 0283
? 650 028A
? 652 028C
? 658 0292
? 712 02C8
? 716 02CC
? 720 02D0
θ 952 03B8
5 英语音标
5.1 概述
音标就是记录英语读音的符号系统。每个英语字典都会选择一套这样的符号系统。字典的编撰者有时会在标准的音标系统基础上增加自己的音标。新增的音标通常也用IPA符号表示。例如最常见的音标有20个元音和24个辅音,Collins词典的音标系统有27个元音音标,28个辅音音标。 Collins增加了一些可以更好地表达“r化韵”和其它细节的音标,例如 ?r, ?:r, ?:r, ɑ:r, ??r, e?r, ??r, ?n, ?l, hw
网上有个48个标准音标的说法,就是在44个常见音标基础上增加了ts,tr,dz,dr这4个辅音。我没有考证出这个标准究竟是哪个组织的“标准”,标准号是多少,就只能存疑了。
网上关于英语音标种类的说法有点混乱。一般而言,英语国际音标、IPA音标、DJ音标这3个提法比较接近,本文将其都称作IPA音标,而且只讨论其中的44个常见音标。为方便起见,将采用IPA字符前的IPA音标称作IPA63,把采用IPA字符后的IPA音标称作IPA88。还有一种出自美语发音字典的KK音标也比较常见,KK的缩写来自作者John S. Kenyon和Thomas A. Knott。KK音标的表示方法与IPA音标有一些差异。下表显示了IPA63、IPA88和KK音标在符号上的差异。
单元音短元音 IPA63 i ? ? u ? e æ
IPA88 ? ? ? ? ? e æ
KK ? ? ɑ ? ? ? æ
单元音长元音 IPA63 i: ?: ?: u: ɑ:
IPA88 i: ?: ?: u: ɑ:
KK i ? ? u ɑ
双元音 IPA63 ei ai ?i au ?u i? ?? u?
IPA88 e? a? ?? a? ?? ?? e? ??
KK e a? ?? a? o ?r ?r ?r
清浊成对辅音 清辅音 p t k f θ s ? t?
浊辅音 b d ɡ v ð z ? d?
其它辅音 h m n ? l r j w
下面这张截图看上去可能更清晰一些:
这个网页讨论了使用IPA字符前后IPA音标的变化。
5.2 IPA63、IPA88、KK音标和Collins音标的例子
我比较习惯IPA63的音标,因为看惯了。不过我最近一直在用Collins词典。可以把Collins词典的音标看作IPA88的扩充。除了增加了一些可以更好表达美式发音的音标外,Collins词典还把 ?? 写成 o?。o?可以更精确地表达美式发音,但更多的英国词典使用??。 关于英语音标有一个不错的网页。这个网页的音标和IPA88、Collins词典比较接近。
我整理了一张包括IPA63、IPA88、KK音标和Collins音标示例的表格。
示例单词 IPA63 IPA63示例 IPA88 IPA88示例 KK KK示例 Collins Collins示例
单元音短元音 sit i [sit] ? [s?t] ? [s?t] ? /s?t/
about ? [??baut] ? [??ba?t] ? [??ba?t] ? /?ba?t/
forget   [f??get]   [f??get]   [f??g?t] ?r /f?rget/
hot ? [h?t] ? [h?t] ɑ [hɑt] ? /h?t/
good u [gud] ? [g?d] ? [g?d] ? /g?d/
luck ? [l?k] ? [l?k] ? [l?k] ? /l?k/
yes e [jes] e [jes] ? [j?s] e /jes/
man æ [mæn] æ [mæn] æ [mæn] æ /mæn/
单元音长元音 week i: [wi:k] i: [wi:k] i [wik] i: /wi:k/
very   [?veri:]   [?veri:]   [?v?ri] i /veri/
turn ?: [t?:n] ?: [t?:n] ? [t?n] ?:r /t?:rn/
claw ?: [kl?:] ?: [kl?:] ? [kl?] ?: /kl?:/
floor   [fl?:r]   [fl?:r]   [fl?r] ?:r /fl?:r/
school u: [sku:l] u: [sku:l] u [skul] u: /sku:l/
actual   [?ækt?u?l]   [?ækt???l]   [?ækt?u?l] u /ækt?u?l/
calm ɑ: [kɑ:m] ɑ: [kɑ:m] ɑ [kɑm] ɑ: /kɑ:m/
card   [kɑ:d]   [kɑ:d]   [kɑd] ɑ:r /kɑ:rd/
双元音 say ei [sei] e? [se?] e [se] e? /se?/
bike ai [baik] a? [ba?k] a? [ba?k] a? /ba?k/
boy ?i [b?i] ?? [b??] ?? [b??] ?? /b??/
house au [haus] a? [ha?s] a? [ha?s] a? /ha?s/
coat ?u [k?ut] ?? [k??t] o [kot] o? /ko?t/
dear i? [di?] ?? [d??] ?r [d?r] ??r /d??r/
care ?? [k??r] e? [ke?r] ?r [k?r] e?r /ke?r/
tour u? [tu?r] ?? [t??r] ?r [t?r] ??r /t??r/
清辅音 pay p [pei] p [pe?] p [pe] p /pei/
talk t [t?:k] t [t?:k] t [t?k] t /t?:k/
king k [ki?] k [k??] k [k??] k /ki?/
fit f [fit] f [f?t] f [f?t] f /f?t/
thin θ [θin] θ [θ?n] θ [θ?n] θ /θ?n/
bus s [b?s] s [b?s] s [b?s] s /b?s/
ship ? [?ip] ? [??p] ? [??p] ? /??p/
cheap t? [t?i:p] t? [t?i:p] t? [t?ip] t? /t?i:p/
浊辅音 bed b [bed] b [bed] b [b?d] b /bed/
done d [d?n] d [d?n] d [d?n] d /d?n/
dog ɡ [d?ɡ] ɡ [d?ɡ] ɡ [dɑɡ] ɡ /d?ɡ/
voice v [v?is] v [v??s] v [v??s] v /v??s/
then ð [ðen] ð [ðen] ð [ð?n] ð /ðen/
buzz z [b?z] z [b?z] z [b?z] z /b?z/
measure ? [?me??] ? [?me??] ? [?m???] ? /me??r/
bridge d? [brid?] d? [br?d?] d? [br?d?] d? /br?d?/
其它辅音 home h [h?um] h [h?um] h [hom] h /houm/
mat m [mæt] m [mæt] m [mæt] m /mæt /
not n [n?t] n [n?t] n [nɑt] n /n?t/
hidden   [?hidn]   [?h?dn]   [?h?dn] ?n /h?d?n/
sing ? [si?] ? [s??] ? [s??] ? /s??/
late l [leit] l [le?t] l [le?t] l /le?t/
handle   [?hændl]   [?hændl]   [?hændl] ?l /hænd?l/
run r [r?n] r [r?n] r [r?n] r /r?n/
you j [ju:] j [ju:] j [ju] j /ju:/
win w [win] w [w?n] w [w?n] w /w?n/
why   [hwai]   [hwa?]   [hwa?] hw /hwa?/
6 音标符号的输入
在学习英语时,我更常做的是复制金山词霸里的音标,只要作个替换表将原来的普通字符映射到Unicode字符就可以了,通常不需要手工输入。输入音标,我想最简单的方法就是复制粘贴了。
在office软件中,可以用自动更正选项输入音标。例如设置将Yi更正为?。只要输入Yi、空格,软件就会自动将Yi更正为?。只要在office的一个软件里设置了自动更正,其它软件会共享这个设置。不过office软件的自动更正是针对单词的,即Yi不能和其它字母连着。在输入后面一个空格时,office软件进行更正。这一点不太方便,因为每次输入都要删除多余的空格。
熟悉输入法码表的朋友可以把这几个音标字符加到自定义的码表中。
我做了一个英语音标输入的网页。只要点击网页上的音标字符,该字符就会被插入到下方的编辑框中。有兴趣的朋友可以试试。
7 结束语
有很多网友使用特殊的音标字体输入和显示音标。不同的音标字体对普通字符和音标字符的映射关系通常是不同的。如果读者没有安装对应的字体就无法正确阅读。使用音标的Unicode字符应该是解决音标输入和显示的标准做法。使用统一的信息编码,大家可以更好地交流。希望在网上看到更多用Unicode表示的音标。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/fmddlmyy/archive/2010/06/06/5651508.aspx