您好,欢迎来到中国测试科技资讯平台!

首页> 《中国测试》期刊 >本期导读>应用DTW的语音(声纹)鉴别技术研究

应用DTW的语音(声纹)鉴别技术研究

2355    2016-01-23

免费

全文售价

作者:张钢, 朱铮涛, 何淑贤

作者单位:广东工业大学信息学院, 广东广州 510090


关键词:语音识别; 语音鉴别; DTW; MFCC系数; 样本域


摘要:

研究了将语音识别中的DTW(Dynamic Time Warping,动态时间规整)算法用于声纹鉴别的技术。通过引入样本域的概念,由所给的有限个样本建立最大相似于样本点的样本域,计算被测样本的相似度。该算法提高了语音鉴别(区分不同发音者)的效率。有限人数的实验结果显示该算法辨伪率为98.75%(400人次),识别率81-93%(80人次)。


Research on DTW-based speech recognition for voiceprint identify

ZHANG Gang, ZHU Zheng-tao, HE Shu-xian

Guangdong University of Technology, Guangzhou 510091, China

Abstract: This paper reported research on a Voiceprint Identify algorithm based on DTW (Dynamic Time Warping).By the idea of "stylebook domain",a domain that contains all stylebooks was created,to calculate the Similarity of the tested stylebook.Experiments showed that 98.75% of the tested stylebooks (among 400 person-times)could be distinguished (from each other),and the recognition rate was between 81% and 93%.

Keywords: Speech Recognition; Voiceprint Identify; DTW; MFCC coefficient; Stylebook domain

2007, 33(2): 120-123  收稿日期: 2006-6-20;收到修改稿日期: 2006-8-26

基金项目: 

作者简介: 张钢(1977-),男,山东青岛市人,硕士研究生,研究方向:计算机视觉及语音识别技术。

参考文献

[1] 何强, 何英.MATLAB扩展编程[M].北京:清华大学出版社, 2002:341-345.
[2] 李海洲, 徐秉峥.语音识别中的神经网络DTW结构[J].电子学报, 1992, 20(7):82-87.
[3] 万春.基于DTW的语音识别应用系统研究与实现[J].集美大学学报, 2002, 7(6):104-108.
[4] Lawrence Rabiner, Biin-Hwang Juang.Funamentals of Speech Recognition[M]. Prentice-Hall International,lnc. 2004, 7:45-61.
[5] 谷志新, 王述洋.声纹识别技术中特征语音参数选取的相关问题[J].林业劳动安全, 2005, 18(2):27-30.
[6] 吴晓平, 崔光照.基于DTW算法的语音识别系统实现[J]. 电子工程师, 2004, 7(7):17-19.
[7] 张炎, 姜惠春.隐马尔可夫模型和动态时间规正统一框架下的汉语全音节语音识别研究[J]. 声学学报, 1998, 23(6):556-559.