1、librosa
算是一个比较全面的音频处理库,可以用于音频读取、音频播放、时频转换、滤波、特征提取、计算歌曲节拍、相似度计算、绘制mel频谱等等,算是一个功能完备而使用方便的库。
使用说明:https://blog.csdn.net/zzc15806/article/details/79603994
官方文档:http://librosa.github.io/librosa/index.html
2、pyworld
是一个高性能的声码器,用于将一段speech音频分离成基频(f0)、谐波谱包络和非周期谱包络,可以有效地将音频(比如人的歌声)的基频提出或者计算调式。
文档:https://github.com/JeremyCCHsu/Python-Wrapper-for-World-Vocoder
参考博客:
https://zhuanlan.zhihu.com/p/76704615
https://www.sohu.com/a/219420730_723464