whisper、faster_whisper怎么做成实时语音识别？

最新推荐文章于 2025-05-30 09:40:35 发布

原创最新推荐文章于 2025-05-30 09:40:35 发布 · 1.6k 阅读

·

21

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#whisper #语音识别 #人工智能

1、做成实时语音识别的困难有哪些？

①选择合适的部署方案：网上查找关于whisper和faster_whisper的各种部署方案，考虑自身资源，应该选择何种方案？可以参考网址：https://github.com/ufal/whisper_streaminghttps://github.com/ufal/whisper_streaming

根据网址里面的whisper_streaming工程，主要研究一下whisper_online.py和whisper_online_server.py。如果whisper_online.py不能运行，请修改whisper模型的本地下载路径。

②参考视频：免费开源的语音转文本软件Whisper的本地搭建详细教程 | Whisper部署_哔哩哔哩_bilibili免费开源的语音转文本软件Whisper的本地搭建详细教程如果需要获取文档，可以先关注并转发本视频，然后私信回复Whisper关键字。, 视频播放量 11704、弹幕量 3、点赞数 181、投硬币枚数 146、收藏人数 497、转发人数 136, 视频作者编程分享录, 作者简介一起学习编程吧！我创建了一个技术分享博客https://blog.lukeewin.top，欢迎大家来访问。，相关视频：OpenAI开源Whisper，我来教你如何从零开始搭建，【GPT-SoVITS】不用本地部署！不受显卡限制！每月10000分钟免费时间，腾讯云端详细教程。，whisper-jax最详细的安装教程 | 一个号称比whisper快70倍的语音识别项目 | 免费开源的语音识别项目，可以白嫖的语音识别项目 | 小白都能懂的搭建OpenAI开源语音识别Whisper教程，Ubuntu中部署实时语音识别WhisperLive，Linux中搭建语音识别项目Whisper | 可免费使用的语音转文字项目，【全738集】B站最详细StableDifusion+Comfyui全套保姆级教程--零基础入门到精通，存下吧，比哨书好太多了!7天从入门到精通商AI绘画，Whisper | Faster Whisper | 语音识别 | 可内网部署的ASR，你见过速度如此之快的语音转文本吗？| 内网可部署的语音识别 | 语音识别，（已离职）冒死上传，花3W买的最系统的AI大模型教程，（LLM+RAG+Langchain+国产大模型ChatGLM-4+DeepSeek部署）手把手教学,全程https://www.bilibili.com/video/BV18V4y1C7M7/?spm_id_from=333.337.search-card.all.click&vd_source=34e35372da530cf06543ce1176cb8cf4

bilibili上，编程分享录账号，分享了自然语言处理的各种模型和部署方案，有助于大家理解和学习。

2、请各位留言交流，whisper模型要求30s左右的音频，实时语音识别中，客户端每次发到服务端的语音长度只有数秒，怎么提高语音识别准确率？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。