IBM Websphere Voice Toolkit 6.0 (语音应用程序) 下载,E维软件

来源:百度文库 编辑:神马文学网 时间:2024/04/29 05:56:37
什么是语音应用程序:
起初,语音应用程序主要是用来通过响应“请按一或说一”之类的命令通过电话与银行或信用卡公司进行交互。随着时间的推移,这些交互式语音应答(Interactive Voice Response,IVR)系统已经从一个词或离散的数字识别系统发展为允许几个基本的命令,比如“请说‘操作员’”或“打电话给妈妈”。您可能还会想到一个语音应用程序,比如 IBM ViaVoice,它是一个通用的计算机听写系统(computer dictation system)。
在描述如何开发语音应用程序时,本文并不仅限于这些类型的语音应用程序。语音应用程序背后的基本思想是对话 — 用户在其中与系统进行对话,可能是在一个结构化的对话中或菜单中(有指导对话应用程序)或者用一种更自然、形式更自由的对话(自然语言理解(natural language understanding,NLU))。在任何情况下,语音应用程序都已不再只是单词(one-word)系统,它提供一种更自然的系统界面而不是在电话上按按纽。
一个新的表示标记标准 VoiceXML,它对于 Web 语音应用程序就象 HTML 之于可视应用程序一样。用于 Web 的语音应用程序就是生成 VoiceXML 并提供数据的语音接口的 Web 应用程序,这些数据驻留在 Web 基础结构(超文本传输协议(Hypertext transfer protocol,HTTp)服务器、Web 应用程序服务器、公共网关接口(Common Gateway Interface ,CGI)、实用摘录和报告语言(practical Extraction and Reporting Language,pERL)、servlet、JavaServer pages?(JSps?)等)背后。
对于可视应用程序,您可以使用表示标记、图形、图像映射等,而软件包可以帮助您开发这些组件。在语音应用程序中,您使用 VoiceXML 来作为表示标记,用语法和词汇来指定用户可以说的词和短语。
一个 VoiceXML 应用程序由几部分组成。VoiceXML 定义对话流,并且就象 HTML 应用程序有图形和图像映射一样,VoiceXML 应用程序也有结构,比如语法和发音。
语法和发音对于 Web 语音应用程序的功能来说至关重要。当一个可视 Web 应用程序需要用户提供一些数据(比如名字或街道地址)时,用户只需把它输入到输入域内。在一个语音应用程序中,语音浏览器却必须知道要听什么内容。就象日常的面对面对话一样,讨论主题需要有一个公共的参考框架以便使对话进行下去。这一点同样适用于计算机语音识别。不管用户是与表单内的菜单还是域进行交互,语音识别器都需要有一个参考框架或一组对于这些值来说有效的词和短语(话语)。我们把这些称为语法。
这些语法在识别引擎中是活动的,它们定义当对音频进行了解码和分析后该引擎返回给应用程序的词集。识别器把用户的话语与活动语法内的一个条目匹配起来,语音浏览器根据您对 VoiceXML 程序的定义进行响应。与和另一个人谈话不同,计算机无法吸取经验、无法推断它不能明确识别的单词或短语的言外之意。一种常见的误解是以为只可以说任何可以转换为文本字符串的内容。实际上,计算机识别系统必须有一组有效的话语,我们可以从这些话语中选择一种与用户的话语相匹配。
在高质量的语音应用程序中,发音起着非常关键的作用。IBM ViaVoice 有一个超过 100,000 个单词的词汇表。由于 Web 上的数据各种各样(有许多是合成词),再加上主题和范围的随机性,不可避免地会出现这样的情况,那些需要被文本到语音(text-to-speech)引擎识别或读出来的词听起来和您想象的并不相同。作为开发语音应用程序工作的一部分,您将需要提供新词以及它们的发音。
图 1. 语音应用程序的整体结构
上面的图 1 展示了语音应用程序的整体结构。在语音 Web 交互的客户机端,用户与一个语音浏览器进行交互,该浏览器代表用户与 Web 交谈。浏览器给语音识别引擎一个或一组语法以及有效的用户话语。在用户说话时,识别引擎使用这些语法来识别所说的词并将它们返回给浏览器。根据 VoiceXML,该浏览器采取一个操作,比如发出一个 URL 请求。在服务器端,可视应用程序和语音应用程序的处理过程差不多。但语音应用程序的性质允许它们接收、解释和生成更多的 VoiceXML,比如通过说话(通过文本到语音(TTS))、播放预先录好的音频或通过激活浏览器中的更多语法并等待用户说些别的内容。这个过程在流程和结构上与 HTML 应用程序的类似;明显的区别在于浏览器如何呈现信息和接受用户输入。
要创建 VoiceXML 应用程序,您需要开发下列相关部件:
VoiceXML 和脚本编制(ECMAScript)
语法
发音
在相当长的一段时间里,语音应用程序都显得很神秘。它们曾像魔法一样,在这种应用程序中,做任何比“按一或说一”更有用的工作都需要博士们的共同努力。实现使语音 Web 应用程序象 HTML 应用程序一样容易、一样普及这个目标是一个很大的挑战,因为计算机系统的语音界面不象可视的屏幕、键盘和鼠标的形态那样直观。
虽然也是 WebSphere? 产品系列的一部分,IBM WebSphere Voice Toolkit(以下称为 Voice Toolkit)却是一个独立的工具箱,专门用来为 IBM 语音中间件开发语音应用程序的所有组件。下面图 2 中显示的 Voice Toolkit 界面与其他的 Web 工具箱外观相似。这种设计使得开发语音应用程序与创建可视应用程序很相似。除支持新的以 Web 为中心的 VoiceXML 编程模型外,Voice Toolkit 还支持使用其他 IBM 语音中间件产品(比如 IBM DirectTalk)的传统语音应用程序所需的元素。
图 2. IBM WebSphere Voice Toolkit 界面
您可能有(也可能没有)一个可视的 Web 站点,或者您已经做过一些语音应用程序方面的工作。
最后,您需要一个面向项目的工具箱来帮助您开发这些不熟悉的组件(比如语法和词典及其他组件、更传统的 Web 逻辑,比如 servlet、bean 和 JSp。
图 3. 编写一个语音 Web 程序的步骤
上面的图 3 显示了编写一个语音 Web 程序的步骤。下面的示例演示了这些步骤。我们假设您想编写一个启用语音的饮料选择器程序。您想做的第一件事将是提供一种方法,让用户说出他们想要的饮料。一旦收集好了饮料名,就把它们作为 Web 地址(比如 http://www.myserver.com/servlet/getdrink?drink=‘soda‘)提交给服务器,该服务器最后用标记进行响应,告诉语音浏览器显示(在这种情况下,是说出)事务结果,并提供其他的导航选项。本文包含这种语音应用程序的部件清单,但您首先想知道的是这个选择器的设计流以及不同的组件如何交互。
在任何与用户进行交互的程序中,您首先应该做的都是绘制流的示意图或串连图板,或者与用户进行对话。这一步列出用户的输入、结果输出以及应用程序流的始末。在这种情况下,您想为用户提供一种方法,让他们说出自己想要的饮料。输入不管是可视的(键入)还是语音的(说)都没关系。用户指定一种想要的饮料,系统输出相应的内容。这就是 VoiceXML 程序。VoiceXML 详细说明了浏览器在接受用户输入、调用服务器端逻辑、说出输出、调用前面所说的服务器端逻辑以及执行向其他“VoiceXML”页面或文档的转换时应该如何操作。
所以,相当简单,您指示 VoiceXML 说“What would you like to drink?”,让它接受某个输入,并根据该输入形成一个发往服务器的 Web 地址请求(比如 http://www.myserver.com/servlet/get-drink?drink=‘soda‘)。最后,服务器用标记进行响应,告诉语音浏览器显示(在这种情况下,是说出)事务结果,并提供其他的导航选项。下面的清单 1 显示了开发过程的第一步。
在处理 VoiceXML 代码时,编辑器会突出显示并块选择(blocking)代码使您更方便阅读,还会在您保存文件或(通过选择适当的菜单项)发出请求时帮您检查语法。Content Assist 功能部件还会帮助向您显示哪些标记是有效的以及它们的位置。Voice Toolkit 最强大的功能是它的交叉子系统(intersubsystem)链接。请回忆一下我们刚才说过,语音识别系统必须知道它们要识别或要说的词(特定是词的发音)。
更精确地说是,TTS 引擎可以比较准确地猜到你能拼写出的任何词的发音,并将这种发音赋予该词,但识别器却必须有要识别的词的发音。如果您有一个词不在内建的词汇表中,TTS 就可以合理地猜测这个词该如何发音。但是,对于识别器来说知道一个词的正确发音是非常重要的。这是 Lexicon 子系统的一个功能,我们将简单地描述一下。编辑器(语法和 VoiceXML)对未知的词做标志,并向您提供一个到 Lexicon 子系统的链接以帮助您构建发音并将其与应用程序存储在一起。
IBM Websphere Voice Toolkit 6.0 (语音应用程序) 下载,E维软件 IBM Websphere Voice Toolkit 6.0 (语音应用程序) 下载,E维软件 *IBM Websphere Voice Toolkit 6.0 (语音应用程序) 下载,E维软件 IBM WebSphere 常见问题解答 IBM WebSphere 常见问题解答 IBM WebSphere 常见问题解答 应用程序迁移至Xtreme Toolkit pro 软件测试工具——使用IBM Rational PurifyPlus测试J2EE应用程序:希赛网软件工程频道 婚礼单位领导致辞范本 -软件E线下载站 婚礼单位领导致辞范本 -软件E线下载站 文字转换语音软件 听网 V3.0 for S60v3 正式版含语音包 - 智能手机软件免费下载 -【S60 Android应用程序数量已突破10万大关_Android最新资讯_Android软件下载... IBM - MustGather: Read first for all WebSphere Application Server products IBM WebSphere 开发者技术期刊: 数据库访问中的锁定策略 IBM WebSphere Application Server 诊断和调优(二) The Spring Framework and IBM WebSphere Application Server IBM WebSphere 开发者技术期刊: 数据库访问中的锁定策略 Huihoo - IBM WebSphere Application Server Community Edition 初试 IBM WebSphere 开发者技术期刊: WebSphere Application Server Community Edition 入门 英语 学习的好帮手:韦氏142000个单词真人语音库直接下载 - 〖软件下载交流〗 - MA... 英语学习的好帮手:韦氏142000个单词真人语音库直接下载 - ,〖软件下载交流〗 - MA... 英语学习的好帮手:韦氏142000个单词真人语音库直接下载, - ,〖软件下载交流〗 - MA... 软件 QQ语音聊天王