**!!!注意!!**该帖我只会讲制作角色语音识别模块的方法。看完该贴你会得到什么?
回答:如果你购买基础设备并打算根据该贴实施行动,你会得到一个你推的语音识别模块。
准备工作
一, 硬件准备
-
ASR PRO语音开发板(焊好排针)
-
开发板可以直接在淘宝或者是京东买,挑便宜的买就行了,有2M和4M的,看着选。
-
2M的大概可以放30条左右的短语音
-
4M可以放很多条,完全够用了。
-
-
type-c数据线
- 就是普通的数据线,type-c头 + USB头
-
ASR PRO语音模块配套喇叭
- !!!一定要买配套的喇叭,电子元器件好像有很多种类的喇叭(我不是很懂)
二, 软件准备
- 天问Block:天问五幺官网 - 一站式单片机开发 (twen51.com)请到官网下载吧!
- 这是我们接下来用来编程的软件
连接工作
-
很简单,按照上图,把开发板,喇叭连接,然后利用type-c数据线连接到电脑。
-
打开天问Block,进入页面看到连接的设备名字则连接成功。
编码工作
在开始编码工作之前我们要先了解一些东西,分别是,模块添加,播报音设置,欢迎词和退出语音,识别词,识别词类型,识别标识ID等。该帖我只会讲制作角色语音识别模块的方法。
一,模块添加
首先,我们要制作一个简单的语音识别(你说话,他回答),你会用到哪些模块呢?
-
**语音识别:**里面有识别语音的基础模块(欢迎词,退出词,识别词),我们编程会用到的模块大部分都在这里。
-
**控制:**包含了一些if-else,switch,延迟,计时器等功能。
-
**数学与逻辑:**包含了一些,逻辑运算,与控制模块结合使用
-
扩展—>播放语音ID(需要下载)
-
点击左边列表下方的添加扩展,进入扩展页面后搜索“播放语音ID”,加载。
-
二,各种词语设置(播报音,欢迎词和退出语音,识别词,识别词类型,识别标识ID等)
-
播放音(语音识别)
(必须要有)点击倒三角形可以选语音,但是选不选问题不大,因为后期我们都是需要把语音替换成自推的声音哒!
-
欢迎词和退出语音(语音识别)
-
**欢迎词:**开发板连接电源之后自动触发
-
**退出语音:**唤醒时间结束后自动播放
-
-
识别词,识别词类型,识别标识ID,回复语音
-
**识别词:**识别的声音,比如你喊“宝宝”希望得到回应,你就把识别词设成“宝宝”,识别词语句可以设置很多个
-
**识别词类型:**分两类:唤醒词和命令词
-
唤醒词:用于在开发板连接电源的情况下,用于唤醒角色(唤醒词最多设置五个)
-
命令词:在角色被唤醒的情况下使用,(可设置多个)
-
识别标识ID:识别标识ID是唯一的,有且只能有一个!!!且必须有
-
**回复语音:**识别到唤醒词后回复的内容,比如你设置为”宝宝“,默认就是播报音回复”宝宝“,所以后期我们需要把回复内容音频替换成自己的音频。
-
-
播报声音,唤醒退出时间
三,正式开始编码
-
新建项目
-
新建项目后你会得到一个这样的项目文件,对此我们需要注意以下几点
- 设备已连接
- 连接设备为ASRPRO
- 设置项目名称(分别后续修改)
-
删掉初始文件中不需要的部分
-
-
编码
-
设置欢迎词和退出词
-
设置唤醒词(按需设置)
-
设置命令词(按需设置)
-
设置随机回复
- 首先设置识别词和添加语音
- 识别词类型为命令词(!!!不可以是唤醒词),回复语音设置为空
- **添加语音:**语音名称不重要,自己看得懂就好,播放ID最好是连在一起的
-
设置执行代码
- 在控制模块选择**“如果-执行”模块**/“switch模块”,添加到这个紫色执行的位置
- 在数字与逻辑模块选择一个可以嵌套语音识别ID的模块,如果不知道选哪个就选图片这个
- 在数字与逻辑模块中添加语音识别ID模块(在语音识别中)如图
- 在**“如果-执行”模块的执行部分添加播放语音ID**模块(在扩展的播放语音中),之后在数字与逻辑模块选择需要的块
- 首先设置识别词和添加语音
到了这里,编码部分就结束了。
四,生成模型
-
音频导入
在模型生成之后,我们就要进行音频导入各种了,也就是把模型生成的音频替换成自己的音频。
!!!注意!!你需要提前准备好wav格式的音频!!!
第一步 我们需要找到天问Block的文件夹
- 如果你没有修改下载路径,这个文件夹大概率在c盘下。
- 点进文件夹【天问Block】—>【asrpro】,我们会看到几个会用到的文件
- 点进【voive】—>【mp3】文件夹,我们可以看到系统生成的音频,然后将你的音频重命名为生成的音频**(把你音频的名字改成生成音频的名字)**
- 回到原本文件夹,进入【asrpro】—>【wav】文件夹,将自己修改为名字的音频粘贴到【wav】文件夹(注意!音频一定要是wav格式)
- 退回到【asrpro】文件夹,双击【一键转语音.bat】,随后回到【voive】—>【mp3】文件夹,会发现,音频已经完成替换。
烧录
回到天问Block,点击2M编译下载,等待烧录完成。
OK,等你完成这一步,你的语音识别模块就已经完成啦!