**!!!注意!!**该帖我只会讲制作角色语音识别模块的方法。看完该贴你会得到什么?

回答:如果你购买基础设备并打算根据该贴实施行动,你会得到一个你推的语音识别模块

准备工作

一, 硬件准备

  1. ASR PRO语音开发板(焊好排针)

    • 开发板可以直接在淘宝或者是京东买,挑便宜的买就行了,有2M和4M的,看着选。

    • 2M的大概可以放30条左右的短语音

    • 4M可以放很多条,完全够用了。

  2. type-c数据线

    • 就是普通的数据线,type-c头 + USB头
  3. ASR PRO语音模块配套喇叭

    • !!!一定要买配套的喇叭,电子元器件好像有很多种类的喇叭(我不是很懂)

ASR PRO开发板+配套喇叭

二, 软件准备

  1. 天问Block:天问五幺官网 - 一站式单片机开发 (twen51.com)请到官网下载吧!
    • 这是我们接下来用来编程的软件

连接工作

  1. 很简单,按照上图,把开发板,喇叭连接,然后利用type-c数据线连接到电脑。

  2. 打开天问Block,进入页面看到连接的设备名字则连接成功。

    设备连接成功

编码工作

在开始编码工作之前我们要先了解一些东西,分别是,模块添加,播报音设置,欢迎词和退出语音,识别词,识别词类型,识别标识ID等。该帖我只会讲制作角色语音识别模块的方法。

一,模块添加

首先,我们要制作一个简单的语音识别(你说话,他回答),你会用到哪些模块呢?

模块列表

  • **语音识别:**里面有识别语音的基础模块(欢迎词,退出词,识别词),我们编程会用到的模块大部分都在这里。

  • **控制:**包含了一些if-else,switch,延迟,计时器等功能。

  • **数学与逻辑:**包含了一些,逻辑运算,与控制模块结合使用

  • 扩展—>播放语音ID(需要下载)

    • 点击左边列表下方的添加扩展,进入扩展页面后搜索“播放语音ID”,加载。

      播放语音ID

二,各种词语设置(播报音,欢迎词和退出语音,识别词,识别词类型,识别标识ID等)

  1. 播放音(语音识别)

    播放音

(必须要有)点击倒三角形可以选语音,但是选不选问题不大,因为后期我们都是需要把语音替换成自推的声音哒!

  1. 欢迎词和退出语音(语音识别)

    欢迎词和退出语音

    • **欢迎词:**开发板连接电源之后自动触发

    • **退出语音:**唤醒时间结束后自动播放

  2. 识别词,识别词类型,识别标识ID,回复语音

    识别

    • **识别词:**识别的声音,比如你喊“宝宝”希望得到回应,你就把识别词设成“宝宝”,识别词语句可以设置很多个

    • **识别词类型:**分两类:唤醒词和命令词

    • 唤醒词:用于在开发板连接电源的情况下,用于唤醒角色(唤醒词最多设置五个

    • 命令词:在角色被唤醒的情况下使用,(可设置多个)

    • 识别标识ID:识别标识ID是唯一的,有且只能有一个!!!且必须有

    • **回复语音:**识别到唤醒词后回复的内容,比如你设置为”宝宝“,默认就是播报音回复”宝宝“,所以后期我们需要把回复内容音频替换成自己的音频

  3. 播报声音,唤醒退出时间

    声音和时间

三,正式开始编码

  1. 新建项目

    新建项目

    • 新建项目后你会得到一个这样的项目文件,对此我们需要注意以下几点

      • 设备已连接
      • 连接设备为ASRPRO
      • 设置项目名称(分别后续修改)

      新建项目文件

    • 删掉初始文件中不需要的部分

      删掉后

  2. 编码

    • 设置欢迎词和退出词

      欢迎词和退出词

    • 设置唤醒词(按需设置)

    唤醒词

    • 设置命令词(按需设置)

      命令词

    • 设置随机回复

      • 首先设置识别词添加语音
        • 识别词类型为命令词(!!!不可以是唤醒词),回复语音设置为
        • **添加语音:**语音名称不重要,自己看得懂就好,播放ID最好是连在一起

      随即回复

      • 设置执行代码

        • 控制模块选择**“如果-执行”模块**/“switch模块”,添加到这个紫色执行的位置
        • 数字与逻辑模块选择一个可以嵌套语音识别ID的模块,如果不知道选哪个就选图片这个
        • 在数字与逻辑模块中添加语音识别ID模块(在语音识别中)如图
        • 在**“如果-执行”模块执行部分添加播放语音ID**模块(在扩展的播放语音中),之后在数字与逻辑模块选择需要的块

        执行代码

    到了这里,编码部分就结束了。

    四,生成模型

    生成模型

音频导入

在模型生成之后,我们就要进行音频导入各种了,也就是把模型生成的音频替换成自己的音频

!!!注意!!你需要提前准备好wav格式的音频!!!

第一步 我们需要找到天问Block的文件夹

  • 如果你没有修改下载路径,这个文件夹大概率在c盘下。

天问Block

  • 点进文件夹【天问Block】—>【asrpro】,我们会看到几个会用到的文件

asrpro文件夹

  • 点进【voive】—>【mp3】文件夹,我们可以看到系统生成的音频,然后将你的音频重命名为生成的音频**(把你音频的名字改成生成音频的名字)**

音频

  • 回到原本文件夹,进入【asrpro】—>【wav】文件夹,将自己修改为名字的音频粘贴到【wav】文件夹(注意!音频一定要是wav格式

wav

  • 退回到【asrpro】文件夹,双击【一键转语音.bat】,随后回到【voive】—>【mp3】文件夹,会发现,音频已经完成替换。

烧录

回到天问Block,点击2M编译下载,等待烧录完成。

2M编译下载

OK,等你完成这一步,你的语音识别模块就已经完成啦!