语音输入的简要介绍

来源:百度文库 编辑:神马文学网 时间:2024/04/28 18:13:38
语音输入是根据操作者的讲话,电脑识别成汉字的输入方法(又称声控输入)。它是用与主机相连的话筒读出汉字的语音,利用语音识别系统分析辩识汉字或词组,把识别后的汉字显示在编辑区中,再通过“发送”功能将编辑区的文字传到其他文档的编辑中。
语音识别技术的原理是将人的话音转换成声音信号,经过特殊处理,与计算机中已存储的已有声音信号进行比较,然后反馈出识别的结果。其关键在于将人的话音转换成声音信号的准确性,以及与原有声音信号比较时的智能化程度。语音识别技术是人工智能的有机组成部分。
这种输入法的好处是不再用手去输入,把双手解放出来,只要会读出汉字的读音即可,但是受每个人汉字发音的限制,不可能都满足语音识别软件的要求,因此在实际应用中错误率较键盘输入高。特别是一些专业技术方面的语言,识别系统几乎不能确认,错误率较高。
还记得一两年前曾经流行过一段时间语音输入软件(如IBM ViaVioce),其中大多数都是以IBM语音录入软件为内核的,不过由于当时计算机的处理速度还没有达到很高的水平,所以并没有形成气候。现在随着计算机主频不断提高,就连Windows XP也内置了语音录入软件,它用起来如何呢?让我们一起来感受一下吧。
语音识别是操作系统将口头语言转换为书面文字的能力。内部驱动程序(称为SR引擎) 识别这些语言并能够将它们转换为文字。Windows XP语音识别系统需要扬声器或其他声音输入设备来接收声音。通常,扬声器应该是带有集成噪音过滤器的高质量设备。语音识别率直接与输入质量相关。劣质扩音器的识别率非常低,有的甚至无法接收。
Microsoft语音识别训练向导(语音训练向导)会指导您完成所需步骤,并且推荐放置扩音器的最佳位置(由您进行测试,获得最佳效果)。
一、使用Microsoft语音识别引擎
我们可以在任何Microsoft Office XP程序、Internet Explorer 5.0和Outlook Express 5.0中口述文本。其它软件可能最终将支持Microsoft语音识别引擎,此时不能在写字板中口述文本。就像语音引擎都有特定的语言一样,它们可能还有特定的地区要求。例如,“Microsoft English ASR Version 5引擎”是供美国、英国、澳大利亚人使用,而由于发音不同,其他不讲美国英语的人使用时很费劲。
要使用语音识别,需要有高质量近距离的麦克风以及声卡或USB端口。您可以使用“麦克风向导”配置麦克风的位置。
培训语音识别引擎熟悉您的声音非常重要。当大声朗读训练文本时,引擎就会找到适合您讲话的模式,以便帮助它解释您所说的话。训练可以为每个讲话者创建语音配置文件。
二、安装语音识别系统
(一)、确定是否已安装语音识别引擎。
1、单击“开始”,指向“设置”,依次单击“控制面板”、“声音、语音和音频设备”,然后单击“语音”。2、如果“语音属性”中的“语音识别”选项卡可用,则表明已安装了语音识别引擎。否则,手写识别引擎尚未安装。
(二)、从Microsoft Word 2002安装语音识别
1.安装语音输入法
先打开Word XP程序,然后点击菜单命令“工具→语音”。如果您以前没有安装过语音识别组件,那么系统会要求你插入Office XP安装光盘,之后,系统就开始自动安装了。(注意:安装了语音识别之后,您可以在所有的Office XP组件中使用,并不只局限于Word。)
安装结束之后,单击“下一步”就可以开始进行语音适应训练了。
2.调整麦克风
首先,注意不要直接把麦克风放在嘴的前方,并且不要直接对着麦克风呼吸,应该把麦克风放在距嘴侧约一拇指宽的地方。其次,保持一个安静的环境也是非常重要的。先测试一下麦克风,我们只需要根据提示用平常的语调朗读句子,然后看音量仪的计数是否稳定在绿色区域内就可以了。

待音量仪式稳定后,点击“下一步”测试麦克风的安放位置,再次朗读对话框中的例句,然后听一下回放的录音是否清晰。一切调整好后,点击“完成”。
3.语音训练
麦克风设置完成以后,系统会进行语音识别的训练。首先要求您确认一些声音基本信息,接着点击“下一步”,系统给出一个例句,您可以点击“示例”按钮听一听应该如何朗读这样的句子。之后,再次点击“下一步”就可以开始语音训练了。
语音训练的方式如图2所示。您只要用平常的语调朗读对话框的内容即可。系统会对您的语音进行识别,能够识别的语句即呈现选中状态,否则会停留在不能识别的字词那里等待您进行重复。所有的语句都识别结束之后,系统会自动生成语音配置文件。

如果您以后想再次进行语音训练,那么,可以点击语言栏上的“语音工具”按钮,然后单击“训练”来对计算机进行语音识别的训练(如图3)。
目前,国际上正酝酿和进行着一场所谓信息革命,在这场革命中,一种能摸拟人的智能的计算机,即所谓第五代计算机将崭露头角。这种计算机能看,能听,能说,具有分析、判断、推理和思考的能力,是名符其实的电脑。就语臼学范畴而论,这种计算机应能接收自然语音的输入和能用语音输出。显然。人们用自己的语音跟计算机打交道,这将是十分方便的。下面,我们就扼要地介绍一下计算机的语音输入的基本原理和现状。
4.语音输入
语音文件配置好了,现在是开始语音输入的时候了。在Word语言栏中,点击图3中的“麦克风”按钮,然后单击语言栏上的“听写”按钮,Word就进入“听写模式”,您就可以口述您要书写的内容了,注意那些标点符号也要读出来哟。如果您点击“声音命令模式”按钮,就可以口述执行命令了。比如您说“打开”,那么程序就为您打开“文件→打开”对话框。感觉不错吧!当然,语音输入总会有一定的错误率,您可以通过多次语音训练的方法来提高系统识别率。
       在使用听写模式时,您最好将当前输入法设置为微软拼音输入法。如果有时您的计算机对您的语音置之不理的话,那么不妨看看当前是否是微软拼音输入法。
5.不同用户的语音识别
如果有多人都使用一台计算机的话,每个人的声音都不一样,那计算机听谁的好呢?不用担心,您可以为每一个用户建立一个不同的语音配置文件。方法是:点击“开始→控制面板”,双击其中的“语音”项目,打开“语音属性”对话框,点击“语音”选项卡,然后点击“新建”按钮,就可以建立一个新的用户了。不同用户的语音配置文件是不同的,只要先在这里选中自己的配置文件,然后在Word中就可以进行语音输入了。
好了,我就说这么多吧。快去试试这种动口不动手的新感觉吧!
_xyz