新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> VoiceXML, CCXML, OpenVXI
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML在语音技术中的应用 』 → 语音系统开发的新平台:VoiceXML浏览器 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 15717 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 语音系统开发的新平台:VoiceXML浏览器 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    兴趣:
    * XML相关技术
    * 资料收集
    * Ontology Engineering
    * Web架构
    * SW Implementation
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 XML在语音技术中的应用 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 语音系统开发的新平台:VoiceXML浏览器

    http://www.ccw.com.cn/htm/net/comm/01_10_19_3.asp

    语音系统开发的新平台:VoiceXML浏览器

    张欣  
    01-10-19 上午 10:10:03

    --------------------------------------------------------------------------------

    VoiceXML将语音交互引入了数据浏览的世界,使电话等以语音为主要形式的设备成为新型的网络终端,其自然、简单,具备了更为广泛的普及性和友好性。本文对无限商机公司的VoiceXML语音浏览器的介绍,将帮助读者进一步了解它的功能和用途。
    无限商机公司的VoiceXML语音浏览器是为解决用户的多种需求而设计的,在实现过程中,分别设计了控制层、安全层、事务层、会话层和应用层,并开放了除控制层之外的所有层的接口。
    1.VoiceXML语音浏览器的组成部分
    一个完整的VoiceXML语音浏览器,由VoiceXML 解析器、语音识别引擎、语音合成引擎、语音通道等几个部分组成。
    (1)VoiceXML 解析器
    VoiceXML解析器是整个语音浏览器的核心部分,在语音浏览器中担负控制中心的角色。VoiceXML解析器通过网络协议,如HTTP协议等,获取VoiceXML 脚本语言所描述的应用文档;解析该应用文档,解释其中各个标志,生成相应的控制命令,控制其他部件进行相应的动作,并获取结果;根据结果决定应用的执行方向和顺序流。
    (2)语音识别引擎
    语音识别引擎是VoiceXML语音浏览器的生命力所在,它使计算机能理解用户的语音命令,将产生的相应的文字结果送回VoiceXML解析器进行处理。
    在VoiceXML语音浏览器中,语音识别引擎为命令式的识别引擎,其根据有限的语法来识别用户的语音信号,产生对应语法定义的识别结果。所以,语法便成为了VoiceXML语音浏览器中的重要概念。在VoiceXML语音浏览器中,语法决定了用户能说什么、如何说。好的语法能带给用户良好的交互感觉,也能从逻辑上提高语音识别引擎的识别率,使整个语音应用的浏览流畅而轻松。
    在VoiceXML语音浏览器中,语音识别引擎不仅需要处理对用户语音信号的识别,同时也需要处理对用户按键的识别,按键和语音以同样的机制被处理和传递。
    (3)语音合成引擎
    VoiceXML语音合成引擎可以将文字转换成语音文件,也可以转换成语音数据流,或者直接将事先录制好的语音文件直接播放或以流的方式播放给语音通道。
    语音合成引擎将文字转化为声音的品质,决定了用户对系统的直接感觉。因此,如何提高语音合成引擎的合成品质,已成为影响语音应用效果的重要因素。
    (4)语音通道
    语音通道是在VoiceXML语音浏览器中传输用户语音数据信号和由合成引擎所产生的声音数据信号的传递通道,它在物理上连接语音采集和播放设备、语音识别引擎的语音输入端和语音合成引擎的语音输出端。
    在基于电信平台的语音应用系统中,语音通道的物理设备主要是语音卡、语音信道或是以数字编码形式存在的虚拟通道,如IP的语音编码数据包等;而在PC平台上,声卡则成为主要的语音通道。
    对不同平台的语音通道物理设备的支持,决定了VoiceXML语音浏览器是一个可实际应用的平台。
    2.VoiceXML语音浏览器各部分的协作
    VoiceXML语音浏览器的协作核心是VoiceXML解析器,其通过建立应用和会话,获取包含控制命令的文档,根据文档中的标志建立对话,从而解释各个对话,控制语音识别、语音合成引擎以及语音通道的触发、开启关闭和挂起等,实现与用户的会话式的交互,并根据对用户反馈的识别结果进行导向判断,进行文档之间的转移和应用之间的转移。
    3.VoiceXML语音浏览器的开放机制
    在无限商机公司的VoiceXML语音浏览器中,对识别引擎和合成引擎进行了开放性的接口设计,实现了与引擎无关的设计。根据此接口,开发商可以开发用于其他识别或合成引擎的封装模块,从而在无限商机的VoiceXML语音浏览器中使用其他的识别或合成引擎。其可建立于电话服务器、PC 、嵌入式设备中,支持国内外语音卡,支持IP等语音信道。
    无限商机公司VoiceXML语音浏览器中,所有开发接口是以CORBA规范设计的,开发商可以用各种编程语言,如C、C++、Java等,在不同的平台和操作系统上实现,从而实现对各种操作系统平台的支持。并且,利用CORBA强大的分布式机制,整个VoiceXML语音浏览器可以建立于跨越各种物理平台、操作系统之上的分布式网络中。
    4.在VoiceXML语音浏览器上开发语音应用
    在VoiceXML语音浏览器上开发语音应用,如同开发Web应用一样轻松简单,只需要有XML的知识,就可以开发VoiceXML应用。基于VoiceXML的语音应用系统,可以很好地与其他已有的Web 应用系统或数据应用系统实现良好结合。
    在VoiceXML语音浏览器基础上的应用开发,改变了传统的CTI系统的开发概念。开发人员不必关心复杂的流程和模块,不必为数据接口编写程序模块,不必重新建立已有系统的逻辑实现,也不必一次次地重复某个模块的开发。

    (网页编辑:风之翼)


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/9 19:45:00
     
     阳光不老 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(C++考了100分!)
      文章:37
      积分:384
      门派:XML.ORG.CN
      注册:2004/10/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给阳光不老发送一个短消息 把阳光不老加入好友 查看阳光不老的个人资料 搜索阳光不老在『 XML在语音技术中的应用 』 的所有贴子 访问阳光不老的主页 引用回复这个贴子 回复这个贴子 查看阳光不老的博客2
    发贴心情 
    期待!

    ----------------------------------------------
    规矩网络 Refree.Cn 打造中国顶级的资源重组网站!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/10/27 14:14:00
     
     asura_z 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:77
      门派:XML.ORG.CN
      注册:2006/12/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给asura_z发送一个短消息 把asura_z加入好友 查看asura_z的个人资料 搜索asura_z在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看asura_z的博客3
    发贴心情 
    有那么强悍吗?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/12/28 16:54:00
     
     漫步天涯 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:59
      门派:XML.ORG.CN
      注册:2007/3/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给漫步天涯发送一个短消息 把漫步天涯加入好友 查看漫步天涯的个人资料 搜索漫步天涯在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看漫步天涯的博客4
    发贴心情 
    这个东东现在可以用吗?
    应该体验体验.
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/3/29 12:17:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML在语音技术中的应用 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/3/28 9:19:37

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    1,980.469ms