2) Text-To-Visual Speech Synthesis System
文本-可视语音合成系统
1.
The Research and Realization of Text-To-Visual Speech Synthesis System;
文本-可视语音合成系统的研究及实现
3) text-to-visual speech (TTVS)
文本-视觉语音合成(TTVS)
5) visual speech synthesis
可视语音合成
1.
In order to realize visual speech synthesis,a satisfied bimodal database needs to be built up.
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。
6) text-to-audioVisual speech(TTVS)
文本-可视语音转换系统(TTVS)
补充资料:汉语的语音合成
汉语的语音合成
speech synthesis of Chinese
hanyu de yuyin hecheng汉语的语音合成(speeCh synthesis of Chi-n已犯)指用人工方法来模拟人类说话的技术。最早用机械方法,以后用模拟电路,现在根据语音生成的原理用计算机编程来获得合成语音。语音合成的历史可迫溯到17世纪以前。18世纪有人用风箱模仿肺部气流,让气流冲击簧片产生振动模拟声带振动,用共鸣器模拟声道,产生元音,甚至能发出一些句子。 1939年美国贝尔实验室科学家H.L坛dley用周期脉冲发生电路和随机噪声发生器来模拟嗓音源和噪声源,用10个带通滤彼器来模拟声道响应,通过控制电路改变声源和声道参数产生合成语音。 1960年瑞典科学家G.Fant发表了著名论文“语音产生的声学理论”,即语音产生的声源—滤波器模型,建立了现代语音分析、合成的理论基础。70年代开始,随着语音信号数字处理技术的飞速发展和计算机的广泛应用,语音合成技术进人了新的阶段。其代表性成果是美国科学家D.H.州日tt1982年完成的串或并联共振峰合成器,它可以发出7种不同音色的语音,在发音速度达到350词/分时,合成语音仍清晰自然,并被德、日等国开发出本国语种的版本。 语音合成技术分参数合成和波形编辑两大类。参数合成又分发音参数合成和终端参数合成两种(参见语音参数合成),前者提取发声器官的生理参数,如声道截面函数等,通过调节这些参数来合成语音。后者则不问语音产生的生理机制,只要合成语音的谱特性和实际语音相符。这类合成有共振峰合成和线性预测合成等,因此称终端参数合成。由于合成模型不精确,参数提取有误差等原因,参数合成质量难以达到令人十分满意的程度。在高速运算和大存储量得到解决的今天,波形编辑语音合成技术以其优良的音质,受到重视。语音波形编辑合成技术不是简单的数字录放,也不是参数合成,而是用一个语音波形数据库存放取自真实语音的语音单元波形,单元按实际需要可以为音素、音节、词、短语等,合成时按韵律修改规则修改语音单元波形并进行拼接。波形编辑的代表方法是法国科学家F.J.Char伴ntier 80年代中期提出的音调同步重叠相加法Rl几A。PS OLA有时间维(即Tl)一P义)-LA)、频率维(即FD一PSOI叫A)和线性预测(即LP-P33LA)等几种算法。 汉语语音合成研究始于50年代。80年代初中国科学院声学研究所等单位的访问学者,利用国外合成系统进行汉语语音合成研究。1986年中国社会科学院语言研究所设计了以汉语普通话声母、韵母为合成单元的级联共振峰合成器,并对合成规则,如音段和超声段协同发音、时长分布等作了较深人的研究,明显提高了合成词语和短句的清晰度和自然度。语音合成的生命力在于提高合成质量,达到应用的目的。因此在合成单元、合成方法,特别是合成韵律规则上还有许多研究工作要做。国内中国社会科学院语言研究所、中国科学院声学研究所等单位都在进行语音合成研究。结合汉语特点已研制出一些具有较高清晰度和自然度的汉语合成系统。 语音合成的一个重要应用方面是文语转换系统。它能将文本中的文字自动转换为口语(参见文语转换系统)。汉语语音合成是汉语人机语音通信和智能计算机接口必不可少的组成部分。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条