【笔记】通过百度智能云实现Python语音识别和语音合成
前言
通过百度智能云实现Python语音识别和语音合成
获取百度智能云密钥
登录百度智能云并实名认证
- 登录百度智能云->搜索
语音->进入管理控制台

我已阅读并同意

- 首次使用需要实名认证

免费试用180天
领取免费资源

语音识别->勾选全部->0元领取

语音合成->勾选全部->0元领取

前往应用列表

创建应用并获取密钥
应用列表->创建应用

- 填写基本信息->
立即创建

查看应用详情

- 获取
AppID、API Key、Secret Key
下载依赖
调用系统麦克风
1 | brew install portaudio |
百度API
1 | pip3 install baidu-aip |
语音识别
1 | pip3 install SpeechRecognition |
播放声音
MacOS上需要操作ObjectC才能播放声音
1 | pip3 install pyobjc |
播放声音
1 | pip3 install playsound |
踩坑
pip安装playsound失败,报错:Getting requirements to build wheel ... error error: subprocess-exited-with-error
解决问题
- 更新
wheel后再安装playsound
1 | pip3 install --upgrade wheel |
语音识别
- 将语音存储为声音文件,并将语音转换为文字
<APP_ID>:百度智能云的AppID<API_KEY>:百度智能云的AppID<SECRET_KEY>:百度智能云的AppID
timeout=:超时时间,单位秒
1 | from aip import AipSpeech |
语音合成
1 | from aip import AipSpeech |
踩坑
- 报错:
ModuleNotFoundError: No module named 'chardet'
解决问题
1 | pip3 install chardet |
完成
参考文献
哔哩哔哩——MedalCollector
哔哩哔哩——MedalCollector
askubuntu——RiskyRon——zx485