一种基于语音和文本识别的密码锁系统、方法及保险箱与流程
本发明涉及密码锁技术领域,尤其涉及一种基于语音和文本识别的密码锁系统、方法及保险箱。
背景技术:
现有的保险箱使用的是机械密码式、电子密码式以及指纹密码式等多种密码锁,操作较为简单,但是,这些保险箱都是使用单一的密码锁,保密性一般,安全性还是有待提高。文本密码(包括文字、字母、数字、特殊符号中的一种或任意组合)需要设置有一定长度,才能具有较高的安全性,但长密码输入繁琐,操作不便。因此,针对上述问题,有必要提出进一步地解决方案以至少解决一个问题。
技术实现要素:
本发明旨在提供一种基于语音和文本识别的密码锁系统、方法及保险箱,以克服现有技术中存在的不足。
为解决上述技术问题,本发明的技术方案是:
一种基于语音和文本识别的密码锁系统,包括:
语音采集模块,用于采集用户的语音信息,所述语音采集模块包括麦克风;
文本输入模块,用于用户输入文本信息,所述文本输入模块包括键盘;
存储模块,用于存储用户的语音密码信息和文本密码信息;
处理模块,用于接收并将所述语音采集模块、所述文本输入模块的输出信号与所述存储模块中的语音密码信息、文本密码信息进行匹配,并根据匹配结果生成指令,所述处理模块包括单片机;
语音输出模块,用于根据所述处理模块的指令播放特定语音提示信息,所述语音输出模块包括扬声器;
密码锁模块,用于根据所述处理模块的指令打开或关闭,所述密码锁模块包括电磁锁;
所述语音采集模块、所述文本输入模块、所述存储模块、所述语音输出模块和所述密码锁模块均与所述处理模块连接。
本发明的一个较佳实施例中,所述密码锁模块还包括直流升压器,所述处理模块输出的直流电压经所述直流升压器升压后输送至所述电磁锁,控制所述电磁锁的锁舌收缩。
本发明的一个较佳实施例中,所述语音密码信息包括语音特征参数和语音指令,所述语音特征参数包括基音周期和线性预测倒谱编码。
本发明还提供了一种基于语音和文本识别的密码锁控制方法,采用上述的系统,包括以下步骤:
通过语音采集模块采集用户的语音信息;
处理模块接收语音采集模块采集的语音信息,预处理后将语音信息与存储模块中的语音密码信息进行匹配;
若匹配成功,则处理模块发送指令至密码锁模块,密码锁模块开锁;
若匹配不成功,则处理模块发送指令至语音输出模块和/或文本输入模块。
本发明的一个较佳实施例中,若匹配不成功,则处理模块发送指令至语音输出模块和/或文本输入模块具体为:
若处理模块连续匹配语音信息与存储模块中的语音密码信息不成功次数未达到预设阈值,则处理模块发送指令至语音输出模块,语音输出模块播放识别失败语音提示,提示用户再次输入语音信息;
若处理模块连接匹配语音信息与存储模块中的语音密码信息不成功次数达到预设阈值,则处理模块发送指令至语音输出模块和文本输入模块,文本输入模块启动,提示用户输入文本信息;
处理模块接收文本输入模块输入的文本信息,并将其与存储模块中的文本密码信息进行匹配;
若匹配成功,则处理模块发送指令至密码锁模块,密码锁模块开锁;
若匹配不成功,则处理模块发送指令至密码锁模块,密码锁模块锁死。
本发明的一个较佳实施例中,处理模块接收语音采集模块采集的语音信息,并将语音信息与存储模块中的语音密码信息进行匹配具体为:
处理模块接收语音采集模块采集的语音信息,并使用dtw算法匹配语音信息中的语音特征参数与存储模块中的语音特征参数,同时匹配用户语音信息中的语音命令与存储模块中的语音命令。
本发明的一个较佳实施例中,还包括语音密码信息和文本密码信息录入步骤:
初次使用前,用户通过语音采集模块进行至少两次语音信息输入,处理模块根据语音采集模块采集的语音信息处理获得语音特征参数和语音命令,并存入存储模块,用户通过文本输入模块输入一个文本密码,处理模块识别后存入存储模块。
本发明的一个较佳实施例中,处理模块对语音采集模块采集的语音信息预处理具体为:
处理模块对语音采集模块采集的语音信息进行a/d转换、噪音去除和端点检测。
本发明的一个较佳实施例中,获得语音特征参数的具体方法为:
处理模块对语音信息进行线性预测,求取预测残差,再对残差信号求取自相关函数,找到除零点外第一个峰值点位置,从而得出基音周期;当语音信息为自回归信号时,处理模块利用线性预测分析获得线性预测倒谱编码。
本发明还提供了一种基于语音和文本识别的保险箱,其特征在于,包括如权利要求1-3任一所述的系统,或权利要求4-8任一所述的控制方法。
与现有技术相比,本发明的有益效果是:
(1)本发明通过语音识别和文本密码相结合的方式,克服了单一密码的安全性不足问题,提高了密码锁的安全性;进一步地,语音识别采用对特定人语音和语音指令双重识别,进一步提高密码锁的安全性;再进一步地,采用基音周期和线性预测倒谱编码(lpcc)共同作为特定人语音识别的特征参数,提高对特定人语音识别的准确度,从而进一步提高密码锁的安全性。
(2)本发明通过语音密码为先、文本密码为后的开锁方式,通过便捷的语音输入减少文本输入的频率,从而提高密码锁的操作便捷度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的结构框图;
图2为本发明中语音采集模块中前端电路的电路图;
图3为本发明的流程图。
具体地,100、语音采集模块;
200、文本输入模块;
300、处理模块;
400、存储模块;
500、语音输出模块;
600、密码锁模块。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,一种基于语音和文本识别的密码锁系统,包括语音采集模块100、文本输入模块200、处理模块300、存储模块400、语音输出模块500以及密码锁模块600,语音采集模块100、文本输入模块200、存储模块400、语音输出模块500和密码锁模块600均与处理模块300连接。本系统通过语音识别和文本密码相结合的方式,克服了单一密码的安全性不足问题,提高了密码锁的安全性。可以理解的是,文本密码包括文字、字母、数字、特殊符号中的一种或任意组合,用户通过文本输入模块200输入以上文本密码。
优选地,本系统还包括在线调试模块,在线调试模块包括在线调试器,在线调试模块用于系统开发人员对系统进行维护和修复系统出现的bug。
具体而言,语音采集模块100用于采集用户的语音信息。语音采集模块100包括麦克风。如图2所示,语音采集模块100可以采用含有麦克风的前端电路来采集语音信号。前端电路具体如图2所示,其中,r21,r24,c25为滤波电路,r22,r23给麦克风提供偏置,形成差分电路,能够让电信号以差分方式输入spce061a单片机的micp和micn引脚,c30,c32是抑制直流信号。
文本输入模块200用于用户输入文本信息。文本输入模块200包括键盘。
存储模块400用于存储用户的语音密码信息和文本密码信息,语音密码信息和文本密码信息在用户初次使用前进行预录入。存储模块400包括外扩flash。
处理模块300用于接收并将语音采集模块100、文本输入模块200的输出信号与存储模块400中的语音密码信息、文本密码信息进行匹配,并根据匹配结果生成指令。处理模块300包括单片机,具体可以采用spce061a单片机。
语音输出模块500用于根据处理模块300的指令播放特定语音提示信息。语音输出模块500包括扬声器。
密码锁模块600用于根据处理模块300的指令打开或关闭。密码锁模块600包括电磁锁。
在本发明的一个较佳实施例中,密码锁模块600还包括直流升压器,处理模块300输出的直流电压经直流升压器升压后输送至电磁锁,控制电磁锁的锁舌收缩。具体地,处理模块300通过i/o口输出一个3v左右的直流电压,经过直流升压器后,电压升到12v或者24v,当电磁锁接通12v或者24v直流电源后,锁舌缩进锁体,实现开锁。
在本发明的一个较佳实施例中,语音密码信息包括语音特征参数和语音指令。本系统语音识别采用对特定人语音和语音指令双重识别,进一步提高密码锁的安全性。语音特征参数包括基音周期和线性预测倒谱编码。本系统采用基音周期和线性预测倒谱编码(lpcc)共同作为特定人语音识别的特征参数,提高对特定人语音识别的准确度,从而进一步提高密码锁的安全性。
如图3所示,本发明还提供了一种基于语音和文本识别的密码锁控制方法,包括以下步骤:
通过语音采集模块100采集用户的语音信息。
处理模块300接收语音采集模块100采集的语音信息,预处理后将语音信息与存储模块400中的语音密码信息进行匹配。
若匹配成功,则处理模块300发送指令至密码锁模块600,密码锁模块600开锁。
若匹配不成功,则处理模块300发送指令至语音输出模块500和/或文本输入模块200。
本控制方法通过语音密码为先、文本密码为后的开锁方式,通过便捷的语音输入减少文本输入的频率,从而提高密码锁的操作便捷度。
在本发明的一个较佳实施例中,还包括语音密码信息和文本密码信息录入步骤:
初次使用前,用户通过语音采集模块100进行至少两次语音信息输入,处理模块300根据语音采集模块100采集的语音信息处理获得语音特征参数和语音命令,并存入存储模块400,用户通过文本输入模块200输入一个文本密码,处理模块300识别后存入存储模块400。
一般而言,用户要进行两次语音训练录入,系统给出语音信号输入提示,用户的声音通过麦克风进入语音信号采集前端电路,第一次发出语音命令时,由spce061a对采集的语音信号进行a/d转换和预处理,然后提取用户的基音周期和lpcc作为语音特征参数。第二次发出语音命令时,过程同第一次一样,将两次训练得到的特征参数共同作为特征参数模板存入到外扩的flash内。再训练多个不同的语音命令,训练好后存入到flash的语音库中,还要设置一个长密码以应对三次语音识别不成功的状况。
其中,若匹配不成功,则处理模块300发送指令至语音输出模块500和/或文本输入模块200具体为:
若处理模块300连续匹配语音信息与存储模块400中的语音密码信息不成功次数未达到预设阈值,则处理模块300发送指令至语音输出模块500,语音输出模块500播放识别失败语音提示,提示用户再次输入语音信息。
若处理模块300连接匹配语音信息与存储模块400中的语音密码信息不成功次数达到预设阈值,则处理模块300发送指令至语音输出模块500和文本输入模块200,文本输入模块200启动,提示用户输入文本信息。
其中,预设阈值一般设置为3次,当然不限于此,可以为1次、2次,或者4次、5次以及更多。预设阈值可以由厂商设置,也可以由用户设置。
用户输入的语音信息一般控制在3s内。开锁后对匹配不成功次数进行清零处理。
处理模块300接收文本输入模块200输入的文本信息,并将其与存储模块400中的文本密码信息进行匹配。若匹配成功,则处理模块300发送指令至密码锁模块600,密码锁模块600开锁。若匹配不成功,则处理模块300发送指令至密码锁模块600,密码锁模块600锁死。一般而言,即为,单片机控制电源接通键盘的电路,接通后就可通过键盘输入提前设置好的文本密码来进行认证,若此次认证再不成功,密码锁就会锁死,只能找厂家恢复出厂设置。文本密码一般可以采用数字长密码。
其中,处理模块300接收语音采集模块100采集的语音信息,并将语音信息与存储模块400中的语音密码信息进行匹配具体为:
处理模块300接收语音采集模块100采集的语音信息,并使用dtw算法匹配语音信息中的语音特征参数与存储模块400中的语音特征参数,同时匹配用户语音信息中的语音命令与存储模块400中的语音命令。即使用松弛时间序列起点和终点的dtw算法匹配语音信息中的语音特征参数与存储模块400中的语音特征参数,同时运用dtw算法的命令词识别功能来匹配用户语音信息中的语音命令与存储模块400中的语音命令。dtw是一种衡量两个长度不同的时间序列相似度的方法,它会比较从语音采集模块100中得到的语音命令和存储模块400中的语音命令这二者的时间序列相似度,且将二者的时间序列进行松弛即从两个时间序列的起始点(1,1)、(1,2)、(2,1)、(1,3)、(3,1)以及终止点(n,m)、(n-1,m)、(n,m-1)、(n-2,m)、(n,m-2)中各选择出一个最小值,将两语音样本之间的相互距离在相应的点放松后选择一个最短距离。对于一个需要识别的语音命令,要使用dtw算法与存储模块400中的每一个语音命令进行匹配,计算距离。求出最短距离也就是最相似的那个就是识别出来的语音命令。
其中,处理模块300对语音采集模块100采集的语音信息预处理具体为:处理模块300对语音采集模块100采集的语音信息进行a/d转换、噪音去除和端点检测。
其中,获得语音特征参数的具体方法为:处理模块300对语音信息进行线性预测,求取预测残差,再对残差信号求取自相关函数,找到除零点外第一个峰值点位置,从而得出基音周期;当语音信息为自回归信号时,处理模块300利用线性预测分析获得线性预测倒谱编码。即,处理模块300对语音信息进行线性预测,通过过去若干语音采样值的线性组合来逼近得出预测残差,再对残差信号求取自相关函数,而自相关函数的周期与语音信号周期相同,因此在找到自相关函数除零点外的第一个峰值点位置,就能得出基音周期。线性预测倒谱编码是基于线性预测编码(lpc)通过递推公式求出,由公式(1)lpc模型可以得出预测系数αl,再由αl通过公式(2)计算出倒谱系数cn,就能得到线性预测倒谱编码。
其中p为lpc模型的阶数(p=12)、x(n)为取样值、
本发明还提供了一种基于语音和文本识别的保险箱,包括以上的基于语音和文本识别的密码锁系统,或以上的基于语音和文本识别的密码锁控制方法。
综上所述,本发明通过语音识别和文本密码相结合的方式,克服了单一密码的安全性不足问题,提高了密码锁的安全性;进一步地,语音识别采用对特定人语音和语音指令双重识别,进一步提高密码锁的安全性;再进一步地,采用基音周期和线性预测倒谱编码(lpcc)共同作为特定人语音识别的特征参数,提高对特定人语音识别的准确度,从而进一步提高密码锁的安全性。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除