《新一代人工智能与语音识别》电子书在线阅读-马延周-得到APP

互联网类型

可以朗读语音朗读

105千字字数

2019-08-01 发行日期

展开全部

主编推荐语

系统介绍基于新闻语料的俄语连续语音识别方法。

内容简介

本书阐述了语音识别的基本类型，对近60年来国内外俄语连续语音识别研究现状进行评析，并建立声学模型和语言模型是俄语连续语音识别研究需要解决的关键问题。

全书共分以下几个部分：基于Kaldi设计实现俄语连续语音识别原型系统，使之具备在线识别和离线识别功能，以验证声学模型和语言模型优化算法的有效性，进而为面向特定领域的俄语语音识别实用系统研发提供理论方法、实验数据和关键技术支撑。

为了实现上述目标，需要进行如下环环紧扣的操作步骤：俄语语音语料的采集加工处理、俄语文本语料的采集清洗过滤、俄语发音词典的自动预测生成、声学模型建模基本单元（音素集）的确定、声学模型和语言模型的优化等。

评分及书评

评分不足

1个评分

L⃛u⃛f⃛f⃛y⃛
2022-05-31

给这本书评了

1.0

建成了俄语语音识别语音语料库和文本语料库。语音语料库包含 360 小时的带标注语音语料，语音内容包括整句和数字串等；文本语料库规模达 10GB，采集来源主要是通用领域的俄罗斯境内俄语网站上的新闻类语料和 Twitter 上的消息类语料。②建立了俄语发音词典。发音词典是俄语连续语音识别系统的核心资源，是俄语转写为相应俄语标准发音的基础，该词典包含 76277 个词形。③设计和研发了基于众包的俄语语音标注平台。语音语料的标注始终是研究者面临的主要难题，实现海量语音的标注并在有限的时间内提高工作效率是研究者关注的焦点。基于众包的标注平台实现了海量语音数据的快速有效标注，节省了研究者的时间，提高了工作效率。④设计和研发了面向俄语文本的过滤清洗系统。由于网络上的文本结构复杂多变，从众多不规则结构中提取出统一格式的文本并把其中的噪声去除，才能生成语言模型训练所需的文本语料。本书开发的过滤清洗系统的功能是实现对从 Web 爬取的俄语文本进行过滤清洗以去除噪声，达到可以进行语言模型训练的标准。⑤设计了俄语语音识别音素集和字音转换规则，降低了声学模型的训练难度，提高了俄语声学模型的训练效率，基于数据驱动的方式，采用 Phonetisaurus 和 Sequitur 两种算法对比验证了有效性。⑥分析和研究了语言模型的优化算法，采用 KN、Katz 平滑技术和 REP 语言模型剪枝算法，优化验证在 WER 基本不变的情况下降低语言模型的规模。⑦基于 Kaldi 建立俄语连续语音识别原型系统。在训练声学模型、语言模型和发音词典的基础上，通过编写代码实现俄语语音的在线识别功能和离线识别功能，在一定程度上填补了中国俄语语音识别研究领域的空白，能够为特定领域的俄语语音识别应用系统的研发提供理论与技术支撑。
转发
转发同时评论

快速转发

评论

8

分享
「微信」扫码分享

出版方

清华大学出版社

清华大学出版社成立于1980年6月，是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府，秉承清华人“自强不息，厚德载物”的人文精神，清华大学出版社在短短二十多年的时间里，迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向，把出版高等学校教学用书和科技图书作为主要任务，并为促进学术交流、繁荣出版事业设立了多项出版基金，逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色，在教育出版领域树立了强势品牌。