美章网 资料文库 短时统计分析的清浊音判别范文

短时统计分析的清浊音判别范文

时间:2022-07-15 09:28:22

短时统计分析的清浊音判别

《电脑开发与应用杂志》2014年第六期

1短时统计分析判决算法

1.1贝叶斯分类器设计对于一帧语音信号,还不存在一种能够完全准确的判别出是清音还是浊音的方法。面对研究对象的复杂性,不得不借助统计的方法。在语音信号中,清音帧、浊音帧不是孤立出现的,而是每当出现时,总是一段连续的清音或一段连续的浊音,且清音和浊音的过渡也是比较明显的。可以通过手工标注的方法把清音段和浊音段分离,分别获得清音帧和浊音帧的样本训练数据。为了对清音帧和浊音帧进行分类,使用贝叶斯方法建立清、浊音分类:作为清浊音的判定规则。当需要对语音信号中的某一帧进行清浊音判定时,首先采用统计模型中的训练数据分别计算该帧为清音或浊音时的概率,然后求其概率的比值T。若T叟1,则认为帧为清音帧;若T刍1,则认为帧为浊音帧。

1.2清浊音帧能量的概率密度估计清音帧能量和浊音帧能量具体服从什么分布并不明确,对它们概率密度的估计采用了两种函数逼近的方法。一种是伽马分布的密度函数:其中μ、σ分别为均值和方差。为了便于观测逼近效果,分别绘制了清、浊音分布直方图(图1),伽马分布对清、浊音的逼近效果图(图2)和高斯分布对清、浊音的逼近效果图(图3)。

1.3算法步骤(1)选取语音信号s(n)作为处理对象,进行波、分帧、加窗、预加重,获得预处理的信号sw(n),并用短时能量公式求出每一帧的短时能量。(2)统计训练样本中清音帧、浊音帧在总体中的比例,其值分别作为清音、浊音的先验概率P(u)、P(v)。(3)分别选择对清音、浊音帧能量的分布进行逼近的函数,分别得到相应的概率密度估计fu、fv。(4)任选取一未知帧语音信号,分别代入密度函数fu、fv,可分别求出其对应的类条件概率密度(fx/u)和(fx/v)。(5)在得到清音帧、浊音帧的先验概率P(u)、P(v)和未知帧在清、浊音下的条件概率密度密度(fx/u)、(fx/v)后,可用上面设计的贝叶斯分类器进行清/浊音帧的判别。

2实验结果

实验中的测试数据是采用8000Hz采样频率,16bit量化的数字语音信号,帧长为240个采样点。测试样本为成年男声,清音319帧,浊音479帧,共798帧。为探究该方法的有效性,试验中与文献中的组合判决法进行了比较,同时也为了探究伽马度函数和高斯密度函数对清音帧能量、浊音帧能量分布的逼近效果,分成了4组进行比较。实验的对比结果如表1所示。3结论从实验结果可以看出,新的判决方法比传统的组合参数判别方法具有更好的判别效果。从逼近函数的选择上看,虽然都具有较高的判别率,但从实验结果来看,清音伽马逼近、浊音高斯逼近的组合逼近判别效果更好一点。

作者:程晓磊姜占才单位:青海师范大学计算机学院

被举报文档标题:短时统计分析的清浊音判别

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/kejizazhi/dnkfyyyzz/649036.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)