Python音频特征提取——pyAudioAnalysis工具包

赵至柔

于 2018-05-03 12:54:56 发布

阅读量2.5w

点赞数 10

CC 4.0 BY-SA版权

分类专栏： Python 音频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39516859/article/details/80178135

本文介绍了Python音频分析库pyAudioAnalysis，包括其主要功能如特征提取，并详细阐述了Zero Crossing Rate、Energy等音频特征。同时，文章提供了pyAudioAnalysis的安装步骤，涉及hmmlearn、Simplejson、eyed3、pydub等依赖包的安装方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

语音识别等应用离不开音频特征的提取，最近在看音频特征提取的内容，用到一个python下的工具包——pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis，该工具包的说明文档可以点击这里下载，对应的github链接点击这里。

这个工具包原说明文档支持的是Linux安装，且不能与python3很好地兼容，注意啦！

一、pyAudioAnalysis工具包简介

pyAudioAnalysis是一个音频处理工具包，主要功能如图：
这里写图片描述
其中Feature Extraction包括（顺序有先后）：

补充说明一下：

1-Zero Crossing Rate：短时平均过零率，即每帧信号内，信号过零点的次数，体现的是频率特性
2-Energy：短时能量，即每帧信号的平方和，体现的是信号能量的强弱
3-Entropy of Energy：能量熵，跟频谱的谱熵（Spectral
Entropy）有点类似，不过它描述的是信号的时域分布情况，体现的是连续性
4-Spectral

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。