应用DTW的语音(声纹)鉴别技术研究中国测试科技资讯平台

作者：张钢, 朱铮涛, 何淑贤

作者单位：广东工业大学信息学院, 广东广州 510090

关键词：语音识别; 语音鉴别; DTW; MFCC系数; 样本域

摘要：

研究了将语音识别中的DTW(Dynamic Time Warping,动态时间规整)算法用于声纹鉴别的技术。通过引入样本域的概念,由所给的有限个样本建立最大相似于样本点的样本域,计算被测样本的相似度。该算法提高了语音鉴别(区分不同发音者)的效率。有限人数的实验结果显示该算法辨伪率为98.75%(400人次),识别率81-93%(80人次)。

Research on DTW-based speech recognition for voiceprint identify

ZHANG Gang, ZHU Zheng-tao, HE Shu-xian

Guangdong University of Technology, Guangzhou 510091, China

Abstract: This paper reported research on a Voiceprint Identify algorithm based on DTW (Dynamic Time Warping).By the idea of "stylebook domain",a domain that contains all stylebooks was created,to calculate the Similarity of the tested stylebook.Experiments showed that 98.75% of the tested stylebooks (among 400 person-times)could be distinguished (from each other),and the recognition rate was between 81% and 93%.

Keywords: Speech Recognition; Voiceprint Identify; DTW; MFCC coefficient; Stylebook domain

2007, 33(2): 120-123 收稿日期: 2006-6-20;收到修改稿日期: 2006-8-26

基金项目:

作者简介: 张钢(1977-),男,山东青岛市人,硕士研究生,研究方向:计算机视觉及语音识别技术。

参考文献

[1] 何强, 何英.MATLAB扩展编程[M].北京:清华大学出版社, 2002:341-345.
[2] 李海洲, 徐秉峥.语音识别中的神经网络DTW结构[J].电子学报, 1992, 20(7):82-87.
[3] 万春.基于DTW的语音识别应用系统研究与实现[J].集美大学学报, 2002, 7(6):104-108.
[4] Lawrence Rabiner, Biin-Hwang Juang.Funamentals of Speech Recognition[M]. Prentice-Hall International,lnc. 2004, 7:45-61.
[5] 谷志新, 王述洋.声纹识别技术中特征语音参数选取的相关问题[J].林业劳动安全, 2005, 18(2):27-30.
[6] 吴晓平, 崔光照.基于DTW算法的语音识别系统实现[J]. 电子工程师, 2004, 7(7):17-19.
[7] 张炎, 姜惠春.隐马尔可夫模型和动态时间规正统一框架下的汉语全音节语音识别研究[J]. 声学学报, 1998, 23(6):556-559.

数字期刊群

6大专业栏目，满足更精准的内容需求

《中国测试》期刊

了解我们，实时跟进期刊出版

行业期刊

测试计量专业期刊论文数据库

资料下载

学习工具和知识点的集合库

视听课堂

中国测试独家视频

言论图书馆

行业参考书籍

学术会议

追踪学术研究热点

行业新闻

获取业界最新要闻

专家风采

关注学术大牛动向

杂志社动态

聚焦中国测试杂志社

科普课堂

用科学知识，引领智慧生活

专题页

用科学知识，引领智慧生活

科技情报

获取业界最新要闻

产业情报

关注学术大牛动向

应用DTW的语音(声纹)鉴别技术研究

量值传递中绝对测量与相对测量转化实例的数理分析(一)

三维结构形变的单目像机测量方法

光纤陀螺标度因数与零偏测试及评价方法研究

声源定位系统校准研究与不确定度分析

低空慢速小目标探测与定位技术研究

一种相似性框架下基于非线性扩散过程的剩余寿命估计模型

免费

免费

免费

免费