▷ 位置:首页 - 动态 - 微信小程序怎样实现基本语音的识别
微信小程序怎样实现基本语音的识别

通过微信小程序wx.startRecord()wx.stopRecord()接口录音并上传silk录音文件至服务器,通过ffmpegsilk录音文件转成wav录音文件,再通过百度语音识别。

RESTAPI获取语音识别后的结果。

2、代码实现

录音和语音文件上传

node服务端接收语音文件代码

silk文件转wav文件

我使用的是silk-v3-decodersilk文件转wav文件

silk-v3-decoder使用方法

百度语音识别RESTAPI识别wav文件

1、通过APIKeySecretKey获取的access_token

通过APIKeySecretKey获取的access_token文档

2、通过token调用百度语音识别RESTAPI识别接口

3、语音识别优化

通过上述操作后,发现识别的内容和实际内容差别很大

百度语音识别RESTAPI文档

查看文档可知:采样率:8000/16000仅支持单通道

ffmpeg里对应的设置方式分别是:

-arrate设置采样率

-acchannels设置声道数

修改converter.sh文件,修改为下图所示

修改后的converter.sh文件


方快广州微信小程序开发公司版权所有 粤ICP备14046016

Copyright 2018 www.FangKuai5.com 广州小程序开发公司 All Rights Reserved