[1]王洪海,刘 刚,郭 军.基于滑动倒谱的自动语言辨识[J].智能系统学报,2008,3(4):336-341.
WANG Hong-hai,L IU Gang,GUO Jun.Automatic language identif ication using shifted cepstra[J].CAAI Transactions on Intelligent Systems,2008,3(4):336-341.
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
3
期数:
2008年第4期
页码:
336-341
栏目:
学术论文—自然语言处理与理解
出版日期:
2008-08-25
- Title:
-
Automatic language identif ication using shifted cepstra
- 文章编号:
-
1673-4785 (2008) 04-0336-06
- 作者:
-
王洪海,刘 刚,郭 军
-
北京邮电大学信息工程学院,北京100876
- Author(s):
-
WANG Hong-hai, L IU Gang, GUO Jun
-
Information Engineering College, Beijing University of Posts and Telecommunications, Beijing 100876, China
-
- 关键词:
-
自动语言辨识; 滑动倒谱; 滑动差分倒谱; 高斯混合模型
- Keywords:
-
automatic language identification; shifted cep stra; shifted delta cep stra; Gaussian mixture model
- 分类号:
-
TP391. 42
- 文献标志码:
-
A
- 摘要:
-
滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用. 但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息. 为此,提出了滑动倒谱( SC)的概念, 并与滑动差分倒谱特征矢量进行了对比研究. 首先利用开发集的语音考察了滑动差分倒谱和滑动倒谱的控制参数在不同取值的情况下对识别性能的影响,利用爬山法确定了这2类特征矢量达到局部最优控制参数组合的路径,然后利用测试集的数据对优化后的2类特征矢量建立的模型进行了闭集辨识和开集辨识. 2种情况下的测试结果都表明滑动倒谱的性能优于滑动差分倒谱. 并且这2种参数还具有特征互补性,将它们进行决策级数据融合可以进一步提高系统的性能.
- Abstract:
-
Shifted delta cep stra have been widely used in automatic language identification, but only delta cep strum information is emp loyed. Research on accent identification revealed that detailed cep strum ismore informative than delta cep strum. So shifted cep strum was p roposed and comparative studywas conducted between these two cep stra. Effects of their control parameters on recognition performance were investigated with speech data in the development set. The best paths of these two vectors to reach a locally op timal control parameter combination were determined with the hill2climbing method. Comparative tests performed with speech data both in the closed test set and open test set demonstrated that shifted cep stra is superior to shifted delta cep stra. In addition, they are mutually comp le2 mentary and data fusion at the decision level could further imp rove the performance of the system
备注/Memo
收稿日期: 2007-06-28.
?基金项目:“十一五”国家863计划重点项目课题(2006AA010102)
作者简介:
王洪海, 男, 1970 年生, 高级工程师,主要研究方向为自动语言辨识,发表学术论文近10篇.
刘 刚,男, 1973年生,副教授,主要研究方向为语音识别、文字识别、语音合成等.
郭 军,男, 1959年生,教授,博士生导师,北京市中高级职称评审委员会计算机组副组长,主要研究方向为模式识别、网络控制与管理等. 主持开发的基于整形变换的手写汉字识别方法在对日本国家标准汉字数据库ETL9的测试中获最高识别率,在1995年全国评测中获得识别率第1名.
通信作者:王洪海. E-mail: greegrassw@sina. com.
更新日期/Last Update:
2009-05-18