1) SSML
语音合成标记语言
2) SSML (Speech synthesis markup language)
SSML(语音合成标记语言)
3) VoxML
语音标记语言
4) voiceXML
语音可扩展标记语言
5) VXML Voice eXtensible Markup Language
语音扩展标记语言
6) VXML(Voice Extensible Markup Language)
语音标记扩展语言
补充资料:语音识别中的语言模型
语音识别中的语言模型
language model of speech recognition
言模型利用语言学和语法知识从识别的语音中(可能有几个候选音,它们有不同的概率)挑出正确的字或词来,使语音输入的句子(语音串)变成有正确意义的文字。用语言模型可大大减少识别搜索运算量和提高识别率。以W表示待识别的词或句子,以A表示待识语音的声学信号。用P(A/W)表示:说W的条件下产生A的概率,不同的W产生A的概率不同。用P(w)表示话语中w出现的概率。在识别过程中,检测到一个确定的声学信号A之后,查W(多个)出现A的概率P(A/W),再和W出现的概率P(W)相乘。比较不同的W有不同的乘积,将乘积最大的那个W就作为挑出词,即识别结果。用公式表示为 命一理黔[,(W)·,(A/W)〕(1)公式中的P(A/w)是由语言模型匹配得到的概率,爪w)是由语言模型决定的概率。建立语言模型有两种方法:一种是句法一语义分析方法。这是基于知识规则的方法,需要有庞大的专家知识库,规则十分繁复。一些特例不在规则之内,也许会引起错误。这种方法对一定应用范围的语音理解系统比较有效,但对无应用背景的普适性理解系统,则因知识和规则太多、太繁杂而使系统过于庞大。采用语言模型后,通过选择合法句子,还可将其中个别错识的词改正过来。在建立普适性的识别理解系统情况下,例如用汉语单音节或词汇呼人任意中文文本时,上面基于句法一语义的语言模型将因知识库和规则过于庞大而产生困难,可代之以另一种用语言统计模型的办法。这是用大量语料,包括政治、经济、文艺、体育、科技等各个领域的语料来统计词的前后搭配概率,利用统计所得概率去引导或控制语音识别匹配范围和判决。例如在已有前N个词Wl,w2.二,呱情况下出现词W的概率,称为N词语言模型。这样的模型因参数太多而使模型极为复杂,常用前一个词或前两个词的简化模型。用前一个词的统计语言模型称双词语言模型。用前两个词的模型称为三词语言模型。语言统计模型不但将建立模型的大量工作交由计算机去承担,而且和语音识别匹配模型的连接更为直接和方便,为许多语音识别理解系统所采用。显然,利用知识和统计这两种方法建立的语言模型是相互重叠而又相互补充 的。yuyjn shlb一e zhong de yuyan moxing语音识别中的语言模型(language modelofsp以叉h似嘎,ition)语音识别中,语音单元被识别后产生合理语句的规则集合。在语音识别中按语
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条