新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> VoiceXML, CCXML, OpenVXI
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML在语音技术中的应用 』 → XML在语音合成中的应用 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 13734 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: XML在语音合成中的应用 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     Coral 美女呀,离线,快来找我吧!
      
      
      威望:6
      等级:计算机学士学位(超级版主)
      文章:271
      积分:2320
      门派:XML.ORG.CN
      注册:2004/12/29

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Coral发送一个短消息 把Coral加入好友 查看Coral的个人资料 搜索Coral在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看Coral的博客楼主
    发贴心情 XML在语音合成中的应用

    文章出处:中国学习在线    
       
       互联网以及和它相关的一切现在似乎随处可见。您也许已经试过接到夜间电话推销员的语音电话、又或者曾经接到过当地药店给您的处方通知。现在,有一种新技术可以使用语音合成结合XML技术传送语音信息了。

        以语音传递信息的手段并不是什么新东西。它是我们几千年来一直使用的交流方法。而且,从一台计算机那里接收到电话也并非什么新发明。许多语音技术到现在已经大行其道了,从传真机、自动拨号器到集成语音回复系统(IVR)。电话当然是它最普遍的应用。

        传统的语音系统使用预先录制好的样本、词典和音素来创建我们所听到的声音。然而,使用这种预先录制的手段有很多问题。其中最普遍的问题之一就是缺少连贯性和变化。如果只有一种录制好的语音版本,其中每个单词或者声音都只有一个样本,那么很难让计算机发出和普通陈述语句不同语调的疑问句。同样困难的是让计算机知道何时该用某种语调或者该用何种语调发音。

        为了帮助解决语音合成问题,W3C为语音合成标记语言(Speech Synthesis Markup Language)创建了一种新的工作草稿。这种新的XML词汇表可以使语音浏览器开发人员能够控制一个语音合成器的创建方法。例如,开发者可以将命令包含进音量中,并在合成语音模式的时候使用它。

        SSML规范基于Sun公司早期的一项名为JSpeeck Markup Language(JSML)的研究工作。JSML则是基于Java Speech API Markup Language。现在SSML是W3C语音研究工作组的工作稿。

        SSML语言的基本目标是一个文本到语音(Text-To-Speech简称TTS)的处理器。一个TTS引擎获得一个文本的集合并将它转换为语音。现在已经有了几种TTS应用程序了,例如电话语音合成回复系统,以及为盲人设计的更高级的系统等等。特定文本集合的发音本身固有的不确定性是现有TTS系统的所面临的主要难题之一。其他普遍一点的问题集中在单词简写(如HTML)、拼写和发音不同的单词(如subpoena)等词类的发音上。

        SSML语言的基础元素指定了文本的格式。例如针对HTML,SSML语言提供了一种段落元素而且走得更远。因为它还提供了句子元素。通过像指定段落一样指定句子的地址,包括起始地址和终止地址,TTS引擎就能更精确的生成语音。

        除了基本的格式,SSML还提供了功能来指定如何发某个预定的词语或者词语集合。这个功能由“say-as”元素来实现。它是SSML中一个非常有用的组件。它能让你指定一个模板,这个模板描述如何发音某个单词或者单词集合。通过“say-as”,我们可以为缩写的单词指定如何发音,也可以为拼写与发音不同的单词指定发音。我们还可以列出数字和日期之间的区别。“say-as”元素包含了对email地址、货币和电话号码等的支持。

        我们也可以对文本提供一种语音学上的表达方式。例如,我们可以通过这种手段来指出美式英语和英式英语对potato单词发音的不同。

        SSML语言的几个高级属性可以帮助我们让TTS系统生成更人性化的声音。我们可以使用“voice”元素指定男声、女声或者中性的声音,而且还可以指定声音所属的年龄。我们可以使用这个元素来指定从4岁的男孩到75岁的老妇之间的任何声音。

        我们还可以使用“emphasis”元素环绕那些需要强调或者比较次要的文本。我们还可以使用“break”元素告诉系统语音在某处应该暂停。

        SSML语言最高级地特性之一体现在它地“prosody”元素上。通过它我们可以以某种指定地方式生成某个确定的文本集合的语音。我们可以指定声音的语调、范围、语速(单词每分钟)。我们甚至可以通过使用“contour”元素指定更细节的东西。“contour”元素把语调和语速集成在了一起。通过指定一个文本集合的“contour”元素值,我们可以更精确的定义如何生成语音


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/4 11:59:00
     
     卡卡嚓 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:13
      积分:104
      门派:XML.ORG.CN
      注册:2006/1/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给卡卡嚓发送一个短消息 把卡卡嚓加入好友 查看卡卡嚓的个人资料 搜索卡卡嚓在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看卡卡嚓的博客2
    发贴心情 不错
    日新月异啊
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/1/5 16:31:00
     
     阳光不老 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(C++考了100分!)
      文章:37
      积分:384
      门派:XML.ORG.CN
      注册:2004/10/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给阳光不老发送一个短消息 把阳光不老加入好友 查看阳光不老的个人资料 搜索阳光不老在『 XML在语音技术中的应用 』 的所有贴子 访问阳光不老的主页 引用回复这个贴子 回复这个贴子 查看阳光不老的博客3
    发贴心情 
    学习!

    ----------------------------------------------
    规矩网络 Refree.Cn 打造中国顶级的资源重组网站!

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/10/27 14:12:00
     
     asura_z 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:77
      门派:XML.ORG.CN
      注册:2006/12/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给asura_z发送一个短消息 把asura_z加入好友 查看asura_z的个人资料 搜索asura_z在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看asura_z的博客4
    发贴心情 
    落伍喽!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/12/28 16:54:00
     
     panpan1130 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:2
      积分:64
      门派:XML.ORG.CN
      注册:2008/3/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给panpan1130发送一个短消息 把panpan1130加入好友 查看panpan1130的个人资料 搜索panpan1130在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看panpan1130的博客5
    发贴心情 
    语音技术前途广阔!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/3/29 13:01:00
     
     liyuexian 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:67
      门派:XML.ORG.CN
      注册:2008/3/31

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liyuexian发送一个短消息 把liyuexian加入好友 查看liyuexian的个人资料 搜索liyuexian在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liyuexian的博客6
    发贴心情 
    难那,现在要毕业设计
    真实一点不会 难难
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/4/1 18:51:00
     
     rgj_rgj 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:7
      积分:80
      门派:XML.ORG.CN
      注册:2008/4/10

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给rgj_rgj发送一个短消息 把rgj_rgj加入好友 查看rgj_rgj的个人资料 搜索rgj_rgj在『 XML在语音技术中的应用 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看rgj_rgj的博客7
    发贴心情 

    学习
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/4/10 15:22:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML在语音技术中的应用 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 20:07:33

    本主题贴数7,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    125.000ms