工作概述
完成关于asr模型的改造,压缩模型体积,提高推理性能。
成果展示
官方model.pt 220M,量化后68M 0.96S/条
官方model.pt 128M,量化后15M 0.6s/条
性能计算方式:for跑了100次,然后delay/100得到的每条执行时间。
声明
GitHub模型网址:FunASR/examples/industrial_data_pretraining/paraformer/README_zh.md at main · modelscope/FunASR
下述代码源码在FunASR/examples/industrial_data_pretraining/paraformer
中能找到
一、数据集配置
1. 下载数据集
16k中文语音识别Aishell-1学术数据集
使用ftp的put进行数据集上传至Linux上
2. 生成{type}_wav.scp和{type}_text.txt文件
代码在data_proce