一种基于语音识别的播放器控制系统及其方法与流程

2021-01-28 13:01:01|

313|

起点商标网

本发明涉及语音识别技术领域，更具体的说是涉及一种基于语音识别的播放器控制系统及其方法。

背景技术：

随着信息技术的不断发展，智能手机早已经在人们的日常生活中占据了十分重要的地位，除去基础的通信作用，智能手机的用途更多地是用在玩游戏听音乐和看视频等方面，在众多使用情景下为了不打扰别人，而自己得到更好的音响体验效果，通常都会选择使用耳机，耳机佩戴分类很多，分为头戴式、耳机、耳塞等，耳机的连接方式也分为有线连接与无线连接，但使用耳机类产品都存在一个问题，就是你在使用耳机时你是无法听清外界的声音，导致交流不便与无法感知外界声音的安全隐患。

因此，如何提供一种能对外界声音进行语音识别的播放器控制系统及其方法是本领域技术人员亟需解决的问题。

技术实现要素：

有鉴于此，本发明提供了一种基于语音识别的播放器控制系统及其方法，其目的在于解决一旦使用耳机播放媒体后则无法听清外界环境中的声音而导致的安全隐患问题。

为了实现上述目的，本发明采用如下技术方案：

一种基于语音识别的播放器控制系统，包括：设置模块、输入模块、识别模块、控制模块和输出模块；其中，

所述设置模块，用于设置系统运行模式，每个运行模式分别对应一个系统命令激活分贝值和系统恢复分贝值；

所述输入模块，用于接收外界声音，并将所接收到的外界声音传递给所述识别模块；

所述识别模块，用于对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断所述语音识别结果与系统运行模式设置是否匹配，若匹配则将所述语音识别结果传递至所述控制模块；

所述控制模块，用于根据所述语音识别结果对当前播放器进行控制，并将所述语音识别结果传输至所述输出模块，并进一步根据检测外界声音的分贝与所述系统恢复分贝值进行对比，若低于所述系统恢复分贝值，则控制当前播放器恢复识别前的状态；

所述输出模块，用于输出当前播放器播放的音频和所述语音识别结果。

优选的，所述设置模块内包括模式设置单元、关键词设置单元和存储单元；

所述模式设置单元，用于对系统的运行模式进行设置；

所述关键词设置单元，用于设置识别关键词；

所述存储单元，用于存储系统参数、音频素材、存储所述模式设置单元和所述关键词设置单元所设置的内容，所述系统参数包括存储系统命令激活分贝值和系统恢复分贝值，所述音频素材包括：警车警笛、消防车警笛、救护车警笛、自行车铃、狗叫声。

优选的，所述模式设置单元包括关键词识别模式设置和声音类别识别模式设置。

优选的，所述输入模块为移动设备终端上的收音装置或与所述移动设备终端相适配的耳机上的收音装置。

优选的，所述识别模块包括分贝检测单元、第一比较单元、识别单元和判断单元；

所述分贝检测单元，用于对所接收到的外界声音进行分贝检测；

所述第一比较单元，用于比较所检测到的外界声音的分贝与相应的系统命令激活分贝值之间的大小；

所述识别单元，用于根据系统模式分别对所接收到的外界声音进行识别；

所述判断单元，用于判断所述语音识别结果与系统运行模式设置是否匹配，其中在关键词识别模式下，判断所识别到的结果是否与所预设的关键词匹配，在声音类别识别模式下，判断所识别到的结果是否与所述音频素材中的音频内容相匹配。

优选的，所述控制模块包括暂停单元、第二比较单元和播放单元；

所述暂停单元，用于实现当前播放器的暂停播放；

所述第二比较单元，用于比较当前所检测到的外界声音的分贝与所述系统恢复分贝值之间的大小；

所述播放单元，用于根据第二比较单元的比较结果实现当前播放器的重新播放。

优选的，所述控制模块还包括震动器，用于在当前播放器的播放暂停后使移动设备终端开始震动。

优选的，还包括媒体音量调节模块，所述媒体音量调节模块用于接收所述输入模块所获取到的外界声音，调节所述输出模块输出的当前播放器所播放的媒体音量以及外界声音的音量并调节至预设比例，其中当前播放器所播放的媒体音量大于所获取到的外界声音的音量。

一种基于语音识别的播放器控制方法，包括以下步骤：

s1.设置系统运行模式，每个运行模式分别对应一个系统命令激活分贝值和系统恢复分贝值；

s2.接收外界声音，对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断所述语音识别结果与系统运行模式设置是否匹配；

s3.若所述语音识别结果与系统运行模式设置匹配则对当前播放器进行控制，根据所述语音识别结果对当前播放器进行控制，并进一步根据检测外界声音的分贝与所述系统恢复分贝值进行对比，若低于所述系统恢复分贝值，则控制当前播放器恢复识别前的状态；

s4.输出当前播放器播放的音频和所述语音识别结果。

优选的，s2还包括以下内容：

接收外界声音，调节当前播放器所播放的媒体音量以及所获取到的外界声音的音量并调节至预设比例，其中当前播放器所播放的媒体音量大于所获取到的外界声音的音量；对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断所述语音识别结果与系统运行模式设置是否匹配。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种基于语音识别的播放器控制系统及其方法，该系统能有效将外界声音通过输入单元输入至识别模块，通过识别模块进行检测判断，如果识别到了与关键词或是与音乐素材相匹配的内容，则说明此时需要使用者听见外界的声音，从而控制用户的播放器停止播放音频，并将外界的声音通过输出装置让用户听见，从而使用户能够及时了解到外界的情况，有效避免了遇到危险或错过外界的其他相关信息的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的一种基于语音识别的播放器控制系统结构示意图；

图2附图为本发明提供的一种基于语音识别的播放器控制方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种基于语音识别的播放器控制系统，包括：设置模块、输入模块、识别模块、控制模块和输出模块；其中，

设置模块，用于设置系统运行模式，每个运行模式分别对应一个系统命令激活分贝值和系统恢复分贝值；

输入模块，用于接收外界声音，并将所接收到的外界声音传递给识别模块；

识别模块，用于对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断语音识别结果与系统运行模式设置是否匹配，若匹配则将语音识别结果传递至控制模块；

控制模块，用于根据语音识别结果对当前播放器进行控制，并将语音识别结果传输至输出模块，并进一步根据检测外界声音的分贝与系统恢复分贝值进行对比，若低于系统恢复分贝值，则控制当前播放器恢复识别前的状态；

输出模块，用于输出当前播放器播放的音频和语音识别结果。

需要进一步说明的是：

当分贝检测结果小于相应的系统命令激活分贝值时，不对播放器进行任何控制；

使用者还可通过设定恢复播放器的关键词，在需要播放器回复识别前的状态时对播放器说出恢复播放器关键词，经过语音识别后控制播放器恢复。

为了进一步实施上述技术方案，设置模块内包括模式设置单元、关键词设置单元和存储单元；

模式设置单元，用于对系统的运行模式进行设置；

关键词设置单元，用于设置识别关键词；

存储单元，用于存储系统参数、音频素材、存储模式设置单元和关键词设置单元所设置的内容，系统参数包括存储系统命令激活分贝值和系统恢复分贝值，音频素材包括：警车警笛、消防车警笛、救护车警笛、自行车铃、狗叫声。

为了进一步实施上述技术方案，模式设置单元包括关键词识别模式设置和声音类别识别模式设置。

为了进一步实施上述技术方案，输入模块为移动设备终端上的收音装置或与移动设备终端相适配的耳机上的收音装置。

为了进一步实施上述技术方案，识别模块包括分贝检测单元、第一比较单元、识别单元和判断单元；

分贝检测单元，用于对所接收到的外界声音进行分贝检测；

第一比较单元，用于比较所检测到的外界声音的分贝与相应的系统命令激活分贝值之间的大小；

识别单元，用于根据系统模式分别对所接收到的外界声音进行识别；

判断单元，用于判断语音识别结果与系统运行模式设置是否匹配，其中在关键词识别模式下，判断所识别到的结果是否与所预设的关键词匹配，在声音类别识别模式下，判断所识别到的结果是否与音频素材中的音频内容相匹配。

需要说明的是：

所检测到的外界声音的分贝比相应的系统命令激活分贝值小则播放器则保持原有状态，若大于，则该系统开始识别和判断等后续控制。

在关键词识别模式下，判断所识别到的结果是否与所预设的关键词匹配，若匹配，则说明需要暂停播放播放器内的原音频，若不匹配，该系统毋须进行下一步动作；

在声音类别识别模式下，判断所识别到的结果是否与音频素材中的音频内容相匹配，若匹配，则说明需要暂停播放播放器内的原音频，若不匹配，该系统毋须进行下一步动作。

为了进一步实施上述技术方案，控制模块包括暂停单元、第二比较单元和播放单元；

暂停单元，用于实现当前播放器的暂停播放；

第二比较单元，用于比较当前所检测到的外界声音的分贝与系统恢复分贝值之间的大小；

播放单元，用于根据第二比较单元的比较结果实现当前播放器的重新播放。

为了进一步实施上述技术方案，控制模块还包括震动器，用于在当前播放器的播放暂停后使移动设备终端开始震动。

为了进一步实施上述技术方案，还包括媒体音量调节模块，媒体音量调节模块用于接收输入模块所获取到的外界声音，调节输出模块输出的当前播放器所播放的媒体音量以及外界声音的音量并调节至预设比例，其中当前播放器所播放的媒体音量大于所获取到的外界声音的音量。

一种基于语音识别的播放器控制方法，包括以下步骤：

s1.设置系统运行模式，每个运行模式分别对应一个系统命令激活分贝值和系统恢复分贝值；

s2.接收外界声音，对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断语音识别结果与系统运行模式设置是否匹配；

s3.若语音识别结果与系统运行模式设置匹配则对当前播放器进行控制，并进一步根据检测外界声音的分贝与系统恢复分贝值进行对比，若低于系统恢复分贝值，则控制当前播放器恢复识别前的状态；

s4.输出当前播放器播放的音频和语音识别结果。

为了进一步实施上述技术方案，s2还包括以下内容：

接收外界声音，调节当前播放器所播放的媒体音量以及所获取到的外界声音的音量并调节至预设比例，其中当前播放器所播放的媒体音量大于所获取到的外界声音的音量；对所接收到的外界声音进行分贝检测，分贝检测结果大于相应的系统命令激活分贝值则进行语音识别，获取语音识别结果，判断语音识别结果与系统运行模式设置是否匹配。

下面将通过具体实施例进行进一步说明：

实例1：输入模块为手机自带mic，播控软件为相应的媒体播放软件，打开媒体播放软件界设置触发模式，选择智能语音识别，输入测试者名字“ly”，输入播放关键词“音乐”，选择语音识别容差度为90％，设置系统命令激活分贝值，回到主界面使用媒体播放软件正常播放相关媒体内容，测试者佩戴上耳机并戴上眼罩，测试打断者站在测试者后面一米远说出测试者名字“ly”，手机mic识别打断者发出的声音高于系统命令激活分贝值，软件对收到外界音频后进行语音识别，识别声频中含有测试者名字，识别完成后触发媒体播放暂停命令，并将mic音频信号覆盖原媒体音频输出到耳机播出，实现测试者佩戴耳机与外界打断者的无障碍交流，交流完成后系统检测外部声音分贝是否低于预设值，低于预设值后媒体恢复播放，也可以对播放器说出播放关键词“音乐”进行媒体的复播。

实例2：输入模块为手机自带mic，播控软件为相应的媒体播放软件，打开媒体播放软件界设置触发模式，选择警示声音，勾选警车、救护车、消防车、自行车、狗选项，并开启震动提示，再设置系统警示激活分贝值60，回到主界面使用媒体播放软件正常播放相关媒体内容，测试者佩戴上耳机和戴上眼罩，测试打断者站在测试者后面一米使用音响播放警车警笛、消防车警笛、救护车警笛、自行车铃、狗叫声，手机mic识别后方发出的声音高于系统命令激活分贝值60，软件对收到外界音频后进行语音识别，识别声频中内容与勾选设置声音相同时，触发媒体播放暂停命令并给手机震动器发送震动命令，同时将手机mic音频信号覆盖原媒体音频输出到耳机播出，实现测试者佩戴耳机遇到紧急情况时与外界环境的无障碍交流。交流完成后系统检测外部声音分贝是否低于预设值，低于预设值后媒体恢复播放，也可以对播放器说出播放关键词“音乐”进行媒体的复播。

实例3：输入模块为蓝牙耳机自带mic，播控软件为相应的媒体播放软件，打开媒体播放软件界设置触发模式，选择智能语音识别，输入测试者名字“ly”，输入播放关键词“音乐”，选择语音识别容差度为90％，设置系统命令激活分贝值，回到主界面使用媒体播放软件正常播放相关媒体内容，测试者佩戴上耳机和戴上眼罩，测试打断者站在测试者后面一米远说出测试者名字“ly”，蓝牙耳机mic识别打断者发出的声音高于系统命令激活分贝值，软件对收到外界音频后进行语音识别，识别声频中含有测试者名字，识别完成后触发媒体播放暂停命令，并将mic音频信号覆盖原媒体音频输出到蓝牙耳机播出，实现测试者佩戴耳机与外界打断者的无障碍交流。交流完成后系统检测外部声音分贝是否低于预设值，低于预设值后媒体恢复播放，也可以对播放器说出播放关键词“音乐”进行媒体的复播。

实例4：输入模块为蓝牙耳机自带mic，播控软件为相应的媒体播放软件，打开媒体播放软件界设置触发模式，打开媒体播放软件界设置音频模式，把音乐模式改选择为虚实混音模式，调节媒体音量为70％，调节外部音量为30％，回到主界面使用媒体播放软件正常播放相关媒体内容，测试者佩戴上耳机和戴上眼罩，测试者能能够实时听到30％外部声音与70％媒体声音，测试打断者站在测试者后面一米远说出测试者名字“ly”，软件将mic音频信号覆盖原媒体音频输出到蓝牙耳机播出，实现测试者佩戴耳机与外界打断者的无障碍交流。交流完成后系统检测外部声音分贝是否低于预设值，低于预设值后媒体恢复虚实混音模式播放，也可以对播放器说出播放关键词“音乐”进行媒体恢复虚实混音模式播放。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。