蚂蚁文库
换一换
首页 蚂蚁文库 > 资源分类 > DOC文档下载
 

异常声音检测识别研究背景意义及现状

  • 资源ID:54766218       资源大小:17.71KB        全文页数:4页
  • 资源格式: DOC        下载权限:游客/注册会员    下载费用:10积分 【人民币10元】
快捷注册下载 游客一键下载
会员登录下载
三方登录下载: 微信快捷登录 QQ登录  
下载资源需要10积分 【人民币10元】
邮箱/手机:
温馨提示:
支付成功后,系统会自动生成账号(用户名和密码都是您填写的邮箱或者手机号),方便下次登录下载和查询订单;
支付方式: 微信支付    支付宝   
验证码:   换一换

 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

异常声音检测识别研究背景意义及现状

异常声音检测识别研究背景意义及现状 1研究背景........................................................................................................................................ 1 2声音的检测识别的发展和现状 .................................................................................................... 1 2.1声音识别技术的发展 ......................................................................................................... 1 2.2国外研究现状 ..................................................................................................................... 2 2.3国内现状综述 ..................................................................................................................... 3 3研究异常声音识别的意义 ............................................................................................................ 4 1研究背景 随着人类社会的进步,人们的生活水平有了较大的改善;然而复杂的社会负面因素,酝酿了许多不安全因素并导致了犯罪率的上升。随着城市化进程的加速,不安全因素对国家和人民生命财产安全的威胁日益加重。安全问题已经成为社会关注的焦点。随着信息化和网络化技术的发展,安全监控在国防和社会安全中所起的作用越来越突出。声音信号在日常生活中分布非常广泛,包含信息量大,也是人类交流的基本方式。声音传播媒介多种多样分布非常广泛,同时声音信号的获取也较为方便。公共场所的异常声音能够有效的揭示和表征异常状况以及突发事故,受到人们越来越多的关注。 2声音的检测识别的发展和现状 声音是由物体的振动产生的,并通过传播媒介传播开来。声音检测技术识别可以分为两个主要的方面一个是语音信号检测识别技术主要指语音识别技术;另一个是非语音声音信号的检测识别技术。 2.1声音识别技术的发展 语音识别的研究工作大约开始于五十年代,当时ATT Bell实验室实现了第一个可识别十个英文数字的语音识别系统Audry系统。 六十年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划DP和线性预测分析技术LP,而后者较好地解决了语音信号模型的问题,对语音识别的发展产生了深远影响。 七十年代,语音识别领域取得了突破。在理论上,LP技术得到进一步发展,动态时间规整技术DTW基本成熟,特别是提出了矢量量化VQ和隐马尔可夫模型HMM理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 八十年代语音识别研究的重点是连续语音识别,各种连续语音的识别算法Lee和Rabiner、Myers实验室的Bell提出的二层动态规划算法NEC被开发,如. 等人提出的分层构造算法,以及帧同步分层构造算法等。同时,研究方向从基于模板匹配技术转向基于统计模型技术,不再追求刻意细化语音特征,而是从整体平均统计的角度来建立最佳的语音识别系统。同时,HMM方法逐步成为主流的语音识别技术。对它的研究使大词汇量连续语音识别的开发成为可能。1988年,美国CMU大学用VQ/HMM方法实现了997词的非特定人连续语音识别系统SPHINX,这是世界上第一个高性能的非特定人、大词汇量、连续语音识别系统,开创了语音识别的新纪元。 进入九十年代,语音识别步入了高速发展时期,语音识别在某些领域已经走向成熟,同时随着多媒体时代的来临迫切要求语音识别系统从实验室走向实用。90年代语音技术的另一个主要趋势是语音识别在日趋完善的同时开始与其他领域的技术相结合。90年代初期人们开始进一步研究语音识别与自然语言处理的结合,产生了基于口音识别和理解的人机对话系统。90年代中期语音识别与机器翻译技术相结合,发展面向不同语种人类之间交流的直接语音翻译技术,这些技术在有些领域内如火车、飞机订票等开始走向实用化。目前,IBM,Dragon,Philips等公司都己经能够提供相应的产品。 ATT应用语音识别技术研制出了智慧卡,已应用于自动提款机。美国主要电信运营商Sprint的PCS部门以卓越、创新的客户服务著称。自2000年以来为客户开通了语音驱动系统,提供客户服务、语音拨号、查号和更改地址等业务。2001年9月它开通的可以自然方式对话的咨询系统,更实现了以自然、开放的询问方式实时获得所需信息的功能。欧洲电信联盟在电信与金融结合领域应用语音识别技术,于1998年完成了CAVECaller Verification in Banking and Telecomm-unication计划,并于同年又启动了PICASSOPioneering Call Authentication for Secure Service Operation计划,在电信网上完成了说话人识别。 2.2国外研究现状 针对声音信号的研究可以分为语音信号的研究和非语音信号的研究。20世纪50年代ATT贝尔实验室的Audry系统以来,语音信号的研究(主要指语音识别)目前已经得到了很大的发展。语音信号线性预测系数(LPC)技术,Mel频率倒谱系数Mel-Frequency Cepstrum Coefficient,MFCC和感知线性预测系数Perceptual Linear Predictive,PLP和动态时间规整(DTW)技术的提出,有效的检测了语音信号的特征提取和不等长匹配问题。这些都使得语音信号的研究达到了前所未有的高度。 异常声音中的枪声、爆炸声属于非语言信号。对非语音信号的研究相比语音信号的研究相对缓慢。国外主要将声音信号的检测技术用于健康状况的检测中。(基于小波包的呼吸声音分Wavelet Packet Based Respir.Atory Sound Classification 类)先将获取到的呼吸声音信号在时间域进行定长的分割,划分为多个段;再用小波包分解分析各个声音段的特性;寻找出最佳基;利用最佳基构造特征向量。特征向量的分类是采用知识向量量子化的方法。该方法的研究对象是人呼吸的声音,通过分析特征向量来寻找异常声音,确定被检测对象的健康状况。另外日本有科研人员通过对枪声的检测用于环境评判上。

注意事项

本文(异常声音检测识别研究背景意义及现状)为本站会员(sunhongz116)主动上传,蚂蚁文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蚂蚁文库(发送邮件至2303240369@qq.com或直接QQ联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们


网站客服QQ:2303240369

copyright@ 2017-2027 mayiwenku.com 

网站版权所有  智慧蚂蚁网络

经营许可证号:ICP备2024020385号



收起
展开