原文地址:http://www.voidcn.com/blog/joey_su/article/p-2513632.html
原始语音信号经过A/D转换得到数字信号,经过预加重提升高频成分,接着是加窗,对加窗后的信号进行两个方面的处理,一个方面是提取倒谱特征,即经过离散傅立叶变换后,对频谱幅度进行平方,通过梅尔滤波器组,再进行对数变换,最后进行离散傅立叶变换的逆运算得到倒谱特征;另一方面是求加窗后信号的能量,将这两个方面结合起来形成动态特征,最后再进行特征变换得到声学模型。
预加重:语音是由声门激励通过系统(声道等)产生的,声门激励属于低频,所以语音的能量主要集中在低频,相对于低频来说,高频的能量较低,提升高频分量有助于提高信噪比,可采用预加重的方法,这种方法在通信系统中经常使用。