-- 作者:admin
-- 发布时间:8/9/2005 7:45:00 PM
-- 语音系统开发的新平台:VoiceXML浏览器
http://www.ccw.com.cn/htm/net/comm/01_10_19_3.asp 语音系统开发的新平台:VoiceXML浏览器 张欣 01-10-19 上午 10:10:03 -------------------------------------------------------------------------------- VoiceXML将语音交互引入了数据浏览的世界,使电话等以语音为主要形式的设备成为新型的网络终端,其自然、简单,具备了更为广泛的普及性和友好性。本文对无限商机公司的VoiceXML语音浏览器的介绍,将帮助读者进一步了解它的功能和用途。 无限商机公司的VoiceXML语音浏览器是为解决用户的多种需求而设计的,在实现过程中,分别设计了控制层、安全层、事务层、会话层和应用层,并开放了除控制层之外的所有层的接口。 1.VoiceXML语音浏览器的组成部分 一个完整的VoiceXML语音浏览器,由VoiceXML 解析器、语音识别引擎、语音合成引擎、语音通道等几个部分组成。 (1)VoiceXML 解析器 VoiceXML解析器是整个语音浏览器的核心部分,在语音浏览器中担负控制中心的角色。VoiceXML解析器通过网络协议,如HTTP协议等,获取VoiceXML 脚本语言所描述的应用文档;解析该应用文档,解释其中各个标志,生成相应的控制命令,控制其他部件进行相应的动作,并获取结果;根据结果决定应用的执行方向和顺序流。 (2)语音识别引擎 语音识别引擎是VoiceXML语音浏览器的生命力所在,它使计算机能理解用户的语音命令,将产生的相应的文字结果送回VoiceXML解析器进行处理。 在VoiceXML语音浏览器中,语音识别引擎为命令式的识别引擎,其根据有限的语法来识别用户的语音信号,产生对应语法定义的识别结果。所以,语法便成为了VoiceXML语音浏览器中的重要概念。在VoiceXML语音浏览器中,语法决定了用户能说什么、如何说。好的语法能带给用户良好的交互感觉,也能从逻辑上提高语音识别引擎的识别率,使整个语音应用的浏览流畅而轻松。 在VoiceXML语音浏览器中,语音识别引擎不仅需要处理对用户语音信号的识别,同时也需要处理对用户按键的识别,按键和语音以同样的机制被处理和传递。 (3)语音合成引擎 VoiceXML语音合成引擎可以将文字转换成语音文件,也可以转换成语音数据流,或者直接将事先录制好的语音文件直接播放或以流的方式播放给语音通道。 语音合成引擎将文字转化为声音的品质,决定了用户对系统的直接感觉。因此,如何提高语音合成引擎的合成品质,已成为影响语音应用效果的重要因素。 (4)语音通道 语音通道是在VoiceXML语音浏览器中传输用户语音数据信号和由合成引擎所产生的声音数据信号的传递通道,它在物理上连接语音采集和播放设备、语音识别引擎的语音输入端和语音合成引擎的语音输出端。 在基于电信平台的语音应用系统中,语音通道的物理设备主要是语音卡、语音信道或是以数字编码形式存在的虚拟通道,如IP的语音编码数据包等;而在PC平台上,声卡则成为主要的语音通道。 对不同平台的语音通道物理设备的支持,决定了VoiceXML语音浏览器是一个可实际应用的平台。 2.VoiceXML语音浏览器各部分的协作 VoiceXML语音浏览器的协作核心是VoiceXML解析器,其通过建立应用和会话,获取包含控制命令的文档,根据文档中的标志建立对话,从而解释各个对话,控制语音识别、语音合成引擎以及语音通道的触发、开启关闭和挂起等,实现与用户的会话式的交互,并根据对用户反馈的识别结果进行导向判断,进行文档之间的转移和应用之间的转移。 3.VoiceXML语音浏览器的开放机制 在无限商机公司的VoiceXML语音浏览器中,对识别引擎和合成引擎进行了开放性的接口设计,实现了与引擎无关的设计。根据此接口,开发商可以开发用于其他识别或合成引擎的封装模块,从而在无限商机的VoiceXML语音浏览器中使用其他的识别或合成引擎。其可建立于电话服务器、PC 、嵌入式设备中,支持国内外语音卡,支持IP等语音信道。 无限商机公司VoiceXML语音浏览器中,所有开发接口是以CORBA规范设计的,开发商可以用各种编程语言,如C、C++、Java等,在不同的平台和操作系统上实现,从而实现对各种操作系统平台的支持。并且,利用CORBA强大的分布式机制,整个VoiceXML语音浏览器可以建立于跨越各种物理平台、操作系统之上的分布式网络中。 4.在VoiceXML语音浏览器上开发语音应用 在VoiceXML语音浏览器上开发语音应用,如同开发Web应用一样轻松简单,只需要有XML的知识,就可以开发VoiceXML应用。基于VoiceXML的语音应用系统,可以很好地与其他已有的Web 应用系统或数据应用系统实现良好结合。 在VoiceXML语音浏览器基础上的应用开发,改变了传统的CTI系统的开发概念。开发人员不必关心复杂的流程和模块,不必为数据接口编写程序模块,不必重新建立已有系统的逻辑实现,也不必一次次地重复某个模块的开发。 (网页编辑:风之翼)
|