·网站管理入口
  ·德化天气
  ·万年日历
  ·常用软件下载
  ·校长信箱
您的位置主页 > 工会视窗 >

首先推荐我的知乎Live:语音识别技术的前世今生。这是对语音识别技术30年来发展的一份综述,听完后你就会对语音识别的整体框架有个了解。Live的幻灯片可以在这里下载。在之后的学习过程中,你可以不时地问自己下面的问题,逐步加深理解:语音识别系统一般由哪些模块组成?(答案见下图)各个模块的作用是什么?特征提取模块是怎样保留语音信号中对语音识别有用的信息,抑制无关信息的?声学模型是怎样在语音特征和音素之间建立映射的?语言模型是怎样知道什么样的句子「像话」,什么样的句子「不像话」的?解码器如何在海量的句子中快速地找到比较好的识别结果?最近几年兴起的神经网络,颠覆了上面框图中的哪些模块?是怎么做到的?对整体框架有了了解之后,就可以去学习细节了。经典的教科书包括:XuedongHuang,AlexAcero,Hsiao-wuenHon,SpokenLanguageProcessingLawrenceRabiner,Biing-HwangJuang,FundamentalsofSpeechRecognitionDanjurafskyandJamesH.Martin,SpeechandLanguageProcessing不过这些书都比较老了,只讲了「前世」的技术,并没涉及到「今生」的神经网络。神经网络技术目前仍在飞快的迭代中,所以并不容易找到一本与时俱进的教科书。另外有两篇经典论文:L.R.Rabiner,“AtutorialonhiddenMarkovmodelsandselectedapplicationsinspeechrecognition,”ProceedingsoftheIEEE,vol.77,no.2,pp.257–286,1989.A.Graves,S.Fern′andez,F.Gomez,andJ.Schmidhuber,“Connectionisttemporalclassi?cation:Labellingunsegmentedsequencedatawithrecurrentneuralnetworks,”inInternationalConferenceonMachineLearning(ICML),ACM,2006,pp.369–376.第一篇讲的是「前世」技术中的骨架HMM,后一篇讲的是「今生」技术中的CTC,当你学到这二者的时候值得一看。如果你要自己上手搭语音识别系统,可以从EESEN这个工具包中的示例出发,慢慢修改。比如TEDLIUM那个示例就是不错的。

上一篇:如何使用TeXLive和TeXstudio操作LaTeX 下一篇:如何评价银监会开出天价罚单广发银行因侨兴债被罚722亿
建议使用1024*768分辩率浏览最佳效果
网站维护:学校办公室   地址:德化城关福兴路
邮编:362500 电话:0595-3522236 网站备案:闽ICP备09026616号
网站地图