HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基于BNEP协议的蓝牙音频设备语音识别系统的方法与流程

2021-01-28 14:01:59|257|起点商标网
基于BNEP协议的蓝牙音频设备语音识别系统的方法与流程

本发明属于通信技术领域,尤其是涉及一种基于bnep协议的蓝牙音频设备语音识别系统的方法。



背景技术:

现有技术通过蓝牙音频设备配置的语音采集模块及运行在移动终端的软件,收集蓝牙音频设备输入的语音信号,将信号传输给移动终端的软件,由软件进行语音识别,将识别后的文字信息显示在移动终端后再由手机识别文字并发起相应动作。

现有技术的缺陷在于:软件端的数据库需要不断迭代数据以保证识别检索功能正常;由软件端进行识别,速度较慢、识别质量较低;用户必须在移动终端下载相应的软件才能实现语音识别功能;下载软件占用用户移动终端的内存资源,数据库越强大占用的资源越多;不同的移动终端存在的软件兼容性问题。



技术实现要素:

本发明旨在解决上述技术问题,提供一种基于bnep协议的蓝牙音频设备语音识别系统的方法。

为了达到上述目的,本发明采用如下技术方案:

基于bnep协议的蓝牙音频设备语音识别系统,包括蓝牙耳机、移动设备端、后台服务器,所述蓝牙耳机包括语音采集模块、耳机蓝牙模块,所述移动设备端包括移动设备端蓝牙模块、网络模块,所述后台服务器包括后台服务器蓝牙模块、语音信号解析模块;所述语音采集模块,用于接收语音输入信号;所述耳机蓝牙模块和所述移动设备端蓝牙模块通过bnep组成临时自组织网,实现蓝牙耳机与所述移动设备端的连接;所述后台服务器蓝牙模块,用于向蓝牙耳机发送申请连接请求、接收移动设备端发送的语音解析请求、发送语音解析数据至移动设备端;所述移动设备端蓝牙模块用于向后台服务器发起解析请求、用于接收语音解析数据;所述语音信号解析模块用于解析语音信号;所述网络模块用于连接网络。

基于bnep协议的蓝牙音频设备语音识别系统的方法,包括以下步骤:

s1、后台服务器申请连接蓝牙耳机;

s2、耳机蓝牙模块和移动设备端蓝牙模块通过bnep组成临时自组织网,实现蓝牙耳机与所述移动设备端的连接,所述移动设备端开启网络,所述蓝牙耳机通过bnep与所述后台服务器实现数据传输;

s3、蓝牙耳机的语音采集模块接收语音输入信号;

s4、移动设备端向后台服务器发起语音解析请求;

s5、后台服务器的语音信号解析模块解析语音信号;

s6、后台服务器发送语音解析数据至移动设备端;

s7、移动设备端接收解析数据并完成指令。

作为优选,耳机蓝牙模块和移动设备端蓝牙模块的蓝牙配对选择numericcomparison的方式,即双方都显示一个6位的数字,由用户来核对数字是否一致,并输入yes/no,两端yes表示一致即可配对,可以防止中间人攻击。

作为优选,还包括蓝牙耳机加密方法,所述加密方法采用e0算法,eo加密算法电路包括线性反馈移位寄存器组、组合逻辑门和复合器,e0算法是蓝牙链路层的加密算法,属于流加密方式,即将数据流与密钥比特流进行异或运算,e0算法对每一分组的有效载荷的加密是单独进行的,它发生在循环冗余校验之后,前向纤错编码之前,利用线性反馈移位寄存器产生伪随机序列,从而形成可用于加密的密钥流,然后将密钥流与要加密的数据流进行异或,实现加密,解密时把密文与同样的密钥流再异或一次就可得到明文。

作为优选,e0算法生成二进制密码流kcipher,即加密密钥kc,所述线性反馈移位寄存器组包括4个线性反馈移位寄存器,每个线性反馈移位寄存器的输出为一个16状态的简单有限状态机的组合,该状态机的输出为字节流序列,或是初始化阶段的随机初始值,4个线性反馈移位寄存器的长度分别为:l1=25,l2=31,l3=33,l4=39,总长度为128位。

作为优选,在e0算法中,加密密钥kc被修改为实际加密密钥kc′,kc′可在1-16字节间变化,但其最大有效长度由厂商预置。

作为优选,步骤s2中,蓝牙耳机开机并开始广播,移动设备端打开蓝牙后会扫描蓝牙设备,蓝牙耳机被扫描到会回复移动设备端;移动设备端点击连接,蓝牙耳机收到移动设备端的连接要求后回发出安全请求要求移动设备端进行配对,移动设备端收到蓝牙耳机要求配对的广播包后,就会发起配对请求;蓝牙耳机收到移动设备端的配对请求后,会回复移动设备端同意配对;移动设备端和蓝牙耳机就会进行信息传输并生成配对秘钥;秘钥生成后移动设备端和蓝牙耳机保存配对信息,配对完成。

作为优选,步骤s5中,语音信号解析模块的解析语音信号方法包括:将麦克风采集到的数据进行特征提取,然后根据声学模型和发音字典使用决策树搜索输入特征序列对应的字或词,最后根据语言模型来确定输入特征对应的字或者词。

作为优选,语音信号解析模块的解析语音信号方法包括以下步骤:

s51、信号处理:用于声学特征提取,声学模型可以根据该特征计算声学单元各成分的概率,对于基于深度学习的方法则可以直接由声学特征到文字,提取的特征为梅尔频率倒谱系数mfcc;

提取mfcc特征的过程如下:

s511、先对语音进行预加重、分帧和加窗;

s512、对每一个短时分析窗,通过fft得到对应的频谱;

s513、将上面的频谱通过mel滤波器组得到mel频谱;

s514、在mel频谱上面进行倒谱分析:取对数,做逆变换,实际逆变换一般是通过dct离散余弦变换来实现,取dct后的第2个到第13个系数作为mfcc系数,获得mel频率倒谱系数mfcc,这个mfcc就是这帧语音的特征;

s52、生成声学模型:使用混合高斯-隐马尔科夫模型gmm-hmm作为声学模型,即把信号处理得到的mfcc特征正确的识别成对应hmmstate系列,这个过程涉及两个概率,一是hmm中的似然likelihood,即把当前frame的特征识别为这个state的概率,二是状态转移概率transitionprobabilities,即把上个state转化为这个state的概率,这个过程是hmm中说的decoding---这里指计算层面,一个序列转化为另一个序列理论上有指数级转化方式,所以每一个frame只取概率最高的那个state;

s53、生成语言模型:语言模型是对人类说话习惯性的描述,采用的语言模型是基于统计的n元文法n-gram,n-gram是一种基于统计语言模型的算法:将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n的字节片段序列,每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度;

s54、解码器解码:解码器根据输入的信号、声学特征、语言模型以及发音词典寻找最大概率的词串。

作为优选,所述的移动设备端为手机,所述的移动设备端与后台服务器的连接网络为3g、4g、5g或wifi。

采用上述技术方案后,本发明具有如下优点:

本发明蓝牙耳机通过bnep协议,并通过移动设备端的网络模块连接网络,实现与后台服务器的连接后,就可进行数据流的交互;蓝牙耳机接收输入的语音信号后可主动发起解析请求,通过蓝牙传输给移动设备端后连接后台服务器数据库进行解析;解析完成后,后台服务器端通过网络下发解析数据至移动设备端;移动设备端收到解析数据后可在移动设备端发起相应控制指令。

本发明通过bnep,用户移动设备端设备无需下载app,仅需要连接网络就可以实现使用后台服务器数据库解析语音信号,实现蓝牙音频设备语音控制。极大的提升用户的操作便利性、节约用户的内存资源、提高语音解析速度与质量。

附图说明

图1为本发明的基于bnep协议的蓝牙音频设备语音识别系统的结构示意图;

图2为本发明的基于bnep协议的蓝牙音频设备语音识别系统的方法的步骤流程图;

图3为本发明的语音信号解析方法的步骤流程图;

图4为本发明的eo加密算法电路的结构示意图;

图中:

1-蓝牙耳机;101-语音采集模块;102-耳机蓝牙模块;2-移动设备端;201-移动设备端蓝牙模块;202-网络模块;3-后台服务器;301-后台服务器蓝牙模块;302-语音信号解析模块。

具体实施方式

以下结合附图及具体实施例,对本发明作进一步的详细说明。

如图1所示,基于bnep协议的蓝牙音频设备语音识别系统,包括蓝牙耳机1、移动设备端2、后台服务器3。所述蓝牙耳机1包括语音采集模块101、耳机蓝牙模块102;所述移动设备端2包括移动设备端蓝牙模块201、网络模块202;所述后台服务器3包括后台服务器蓝牙模块301、语音信号解析模块302。

所述语音采集模块101,用于接收语音输入信号;所述耳机蓝牙模块102和所述移动设备端蓝牙模块201通过bnep组成临时自组织网,实现蓝牙耳机1与所述移动设备端2的连接;所述后台服务器蓝牙模块301,用于向蓝牙耳机1发送申请连接请求、接收移动设备端2发送的语音解析请求、发送语音解析数据至移动设备端2;所述移动设备端蓝牙模块201用于向后台服务器3发起解析请求、用于接收语音解析数据;所述语音信号解析模块302用于解析语音信号;所述网络模块202用于连接网络;所述的移动设备端2为手机,所述的移动设备端2与后台服务器3的连接网络为3g、4g、5g或wifi。

如图2所示,本发明还提供一种基于bnep协议的蓝牙音频设备语音识别系统的方法,包括以下步骤:

s1、后台服务器3申请连接蓝牙耳机1;

s2、耳机蓝牙模块102和移动设备端蓝牙模块201通过bnep组成临时自组织网,实现蓝牙耳机1与所述移动设备端2的连接,所述移动设备端2开启网络,所述蓝牙耳机1通过bnep与所述后台服务器3实现数据传输;

s3、蓝牙耳机1的语音采集模块101接收语音输入信号;

s4、移动设备端2向后台服务器3发起语音解析请求;

s5、后台服务器3的语音信号解析模块302解析语音信号;

s6、后台服务器3发送语音解析数据至移动设备端2;

s7、移动设备端2接收解析数据并完成指令。

耳机蓝牙模块102和移动设备端蓝牙模块201的蓝牙配对选择numericcomparison的方式,即双方都显示一个6位的数字,由用户来核对数字是否一致,并输入yes/no,两端yes表示一致即可配对,可以防止中间人攻击。

本发明还包括蓝牙耳机加密方法,所述加密方法采用e0算法,eo加密算法电路包括线性反馈移位寄存器组、组合逻辑门和复合器,e0算法是蓝牙链路层的加密算法,属于流加密方式,即将数据流与密钥比特流进行异或运算,e0算法对每一分组的有效载荷的加密是单独进行的,它发生在循环冗余校验之后,前向纤错编码之前,利用线性反馈移位寄存器产生伪随机序列,从而形成可用于加密的密钥流,然后将密钥流与要加密的数据流进行异或,实现加密,解密时把密文与同样的密钥流再异或一次就可得到明文。

如图4所示,eo加密算法电路包括线性反馈移位寄存器组(linearfeedbackshiftregistcr,lfsr)、组合逻辑和复合器(blend),其中blend中t1和t2为线性变换网络,z-1为延迟网络。lfsrs的长度分别为25、31、33、39。采用多个lfsr是为了增加生成的伪随机序列的长度和随机性。当产生加密流时,lfsrs需要赋予初值(种子)。四个lfsr再加上各是两位的ct和ct+1共计132位,由主设备地址adr(48位)、时钟cl(26位)和链路层加密私钥kc(最多128位)提供,kc由e0算法产生的。

e0算法生成二进制密码流kcipher,即加密密钥kc,所述线性反馈移位寄存器组包括4个线性反馈移位寄存器,每个线性反馈移位寄存器的输出为一个16状态的简单有限状态机的组合,该状态机的输出为字节流序列,或是初始化阶段的随机初始值,4个线性反馈移位寄存器的长度分别为:l1=25,l2=31,l3=33,l4=39,总长度为128位。

在e0算法中,加密密钥kc被修改为实际加密密钥kc′,kc′可在1-16字节间变化,但其最大有效长度由厂商预置。

步骤s2中,蓝牙耳机1开机并开始广播,移动设备端2打开蓝牙后会扫描蓝牙设备,蓝牙耳机1被扫描到会回复移动设备端2;移动设备端2点击连接,蓝牙耳机1收到移动设备端2的连接要求后回发出安全请求要求移动设备端2进行配对,移动设备端2收到蓝牙耳机1要求配对的广播包后,就会发起配对请求;蓝牙耳机1收到移动设备端2的配对请求后,会回复移动设备端2同意配对;移动设备端2和蓝牙耳机1就会进行信息传输并生成配对秘钥;秘钥生成后移动设备端2和蓝牙耳机1保存配对信息,配对完成。

步骤s5中,语音信号解析模块302的解析语音信号方法包括:将麦克风采集到的数据进行特征提取,然后根据声学模型和发音字典使用决策树搜索输入特征序列对应的字或词,最后根据语言模型来确定输入特征对应的字或者词。

语音信号解析模块302的解析语音信号方法具体包括以下步骤:

s51、信号处理:用于声学特征提取,声学模型可以根据该特征计算声学单元各成分的概率,对于基于深度学习的方法则可以直接由声学特征到文字,提取的特征为梅尔频率倒谱系数mfcc;

提取mfcc特征的过程如下:

s511、先对语音进行预加重、分帧和加窗;

s512、对每一个短时分析窗,通过fft得到对应的频谱;

s513、将上面的频谱通过mel滤波器组得到mel频谱;

s514、在mel频谱上面进行倒谱分析:取对数,做逆变换,实际逆变换一般是通过dct离散余弦变换来实现,取dct后的第2个到第13个系数作为mfcc系数,获得mel频率倒谱系数mfcc,这个mfcc就是这帧语音的特征;

s52、生成声学模型:使用混合高斯-隐马尔科夫模型gmm-hmm作为声学模型,即把信号处理得到的mfcc特征正确的识别成对应hmmstate系列,这个过程涉及两个概率,一是hmm中的似然likelihood,即把当前frame的特征识别为这个state的概率,二是状态转移概率transitionprobabilities,即把上个state转化为这个state的概率,这个过程是hmm中说的decoding---这里指计算层面,一个序列转化为另一个序列理论上有指数级转化方式,所以每一个frame只取概率最高的那个state;

s53、生成语言模型:语言模型是对人类说话习惯性的描述,采用的语言模型是基于统计的n元文法n-gram,n-gram是一种基于统计语言模型的算法:将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n的字节片段序列,每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度;

s54、解码器解码:解码器根据输入的信号、声学特征、语言模型以及发音词典寻找最大概率的词串。

本发明蓝牙耳机1通过bnep协议,并通过移动设备端2的网络模块202连接网络,实现与后台服务器3的连接后,就可进行数据流的交互;蓝牙耳机1接收输入的语音信号后可主动发起解析请求,通过蓝牙传输给移动设备端2后连接后台服务器3数据库进行解析;解析完成后,后台服务器3端通过网络下发解析数据至移动设备端2;移动设备端2收到解析数据后可在移动设备端2发起相应控制指令。

本发明通过bnep,用户移动设备端设备无需下载app,仅需要连接网络就可以实现使用后台服务器3数据库解析语音信号,实现蓝牙音频设备语音控制。极大的提升用户的操作便利性、节约用户的内存资源、提高语音解析速度与质量。

除上述优选实施例外,本发明还有其他的实施方式,本领域技术人员可以根据本发明作出各种改变和变形,只要不脱离本发明的精神,均应属于本发明所附权利要求所定义的范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips