音频识别系统的制作方法
本发明涉及一种音频识别技术领域,具体为音频识别系统。
背景技术:
音频识别是指利用音频识别设备实现未知音频的识别,现有技术是通过将数据变换特定的超声波后与普通音频进行叠加形成新的音频,并通过录音或是对音频文件解码获取这些特定的超声波,并还原成原始数据并加以利用。这些技术存在显著的缺点:1、覆盖范围狭小,由于超声波的物理特性导致这些携带信息的特殊音波只能在相对能量集中的区域才能被识别,因此产生了离开特定覆盖范围后无法识别的问题。2、抗干扰能力差,由于采用频谱作为识别依据,导致当环境噪音大的时候无法正确识别。3、叠加后的音频由于承载超声波会对人耳产生刺激,影响听者的健康。
技术实现要素:
本发明的目的就在于为了解决现有的音频识别设备存在覆盖范围狭小、抗干扰能力差以及叠加后的音频由于承载超声波会对人耳产生刺激,影响听者的健康的问题,而提出音频识别系统;本发明将音频编码单元传递的已经编码的pcm数据进行重新编码,使得编码后的音频和原始音频在格式上一致,听感上基本一致,通过音频解码模块采集其公共场合播放的新的音频并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理以及数字滤波单元会将录音单元采集的音频中不承载信息的频率成分过滤,通过串联贝塞尔高通和带通滤波,保证过滤非必要的频率成分的同时,保留相位成分,并通过降噪算法,提升带分析的信号的信噪比;
本发明的目的可以通过以下技术方案实现:音频识别系统,包括音频加码模块和音频解码模块;
所述音频加码模块用于把输入的音频进行加码并调制到承载音频内容之上形成调制音频;
所述音频解码模块用于采集环境声音并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理,然后音把音频中加码的信息还原并对其进行相应的处理;相应的处理包括弹出、跳转;
所述音频解码模块包括录音单元、数字滤波单元、频谱生成单元、频谱分析单元、相位谱分析单元、识别单元和校验输出单元;
所述录音单元用于录音设备和ad/da转换器采集环境声音并生成pcm数据流;录音单元将pcm数据流传输至数字滤波单元;
所述数据滤波单元用于将pcm数据流中不承载信息的频率成分过滤并通过降噪算法降噪得到滤波后的数据,数据滤波单元将滤波后的数据传送给频谱生成单元;
所述频谱生成单元用于将滤波后的数据分别生成频谱数据、能量密度谱数据和相位谱数据并将其发送至频谱分析单元;
所述频谱分析单元用于对频谱数据进行分析,并找出其中的特征频谱,利用能量和密度以及信噪比的关系对特征频谱进行分析和比对,然后标记出频谱位置和长度,利用多次回归分析对识别阈值内的频谱数据,做多重标记并将其发送至相位谱分析单元;若在频谱分析中无法标记到足够的可分析数据,则识别失败;
所述相位谱分析单元用于将频谱分析单元做多重标记的频谱数据作为相位谱分析的输入,同时针对已经标记的频谱和位置数据以及在相位谱上进行特征识别,将识别到的数据进行标记得到标记数据并将标记数据发送至识别单元;当相位谱分析单元无法识别到约定的相位特征,则识别将结束;
所述识别单元用于对标记数据进行模式提取和重组,对于重组后形成的信息进行规则检查和比对,当信息符合系统规则,则识别单元将重组后形成的信息输出到校验模块;否,识别失败;
所述校输出单元用于对识别单元输出的重组后形成的信息进行多种校验,校验包括crc和系统匹配校验;当通过校验,则重组后形成的信息被作为正式的结果返回调用方;否,则识别失败。
所述音频加码模块包括音频加码单元、信息调制单元、音频编码单元和音频流输出单元;
所述音频加码单元用于将输入的音频根据其格式和编码还原成pcm格式的裸音频数据并把裸音频数据发送至信息调制单元;将pcm格式的裸音频数据标记为pcm数据;输入的音频即原始数据;
所述信息调制单元用于对pcm数据进行全面解析和调制需要的参数得到调制参数;其中,调制参数包括音频中进行调制的位置,相位,能量和密度参数;所述信息调制单元把pcm数据和调制参数发送至音频编码单元;
所述音频编码单元用于将接收的pcm数据和调制参数通过音频编码算法调制到一起,形成承载了要调制信息的新的pcm数据,音频编码单元将新的pcm数据发送至音频流输出单元;
所述音频流输出单元用于将接收的新的pcm数据进行重新编码还原,将新的pcm数据的格式还原成输入时音频的格式。
所述录音设备包括具有麦克风或超声波震荡片以及其他感知空气震动进行模拟和数字转换的设备及移动终端上装载的应用程序及小程序;其中移动终端包括手机、电脑和平板。
所述环境声音包括开放空间公共或商业场合扬声器发送的信号、封闭空间公共或商业场合扬声器发送的信号、移动运输工具内部的扬声器发送的信号、手机或电脑或多媒体设备播放视频或音频内容发送的信号、电影院或剧院场所演出播放发送的信号、调频收音机接收电台信号并通过扬声器发送的信号、各类具有扬声器的电子设备播放音频内容发送的信号以及所有可以播放音频及视频内容的设备发出声音发送的信号和通过上述设备发送的调制音频信号。
与现有技术相比,本发明的有益效果是:
1、音频加码单元把原始音频根据其格式和编码,还原成pcm格式的裸音频数据,并把裸音频数据作为参数传入信息调制单元;信息调制单元的功能是根据要调制的信息对解码单元获得的pcm数据进行全面分析,并生成调制需要的参数以及需要在音频中进行调制的位置,相位,能量和密度等调制参数,并将这些参数传递给音频编码单元;音频编码单元的功能是把音频加码单元输出的pcm数据和由信息调制单元得到的调制参数通过音频编码算法调制到一起,形成承载了要调制的信息的新的pcm数据,并将这些pcm数据传递给音频流输出单元;音频流输出单元将根据音频流原始数据的音频格式,将音频编码单元传递的已经编码的pcm数据进行重新编码,使得编码后的音频和原始音频在格式上一致,听感上基本一致,从而避免叠加后的音频由于承载超声波会对人耳产生刺激,影响听者的健康;
2、本发明通过音频解码模块采集其公共场合播放的新的音频并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理以及数字滤波单元会将录音单元采集的音频中不承载信息的频率成分过滤,通过串联贝塞尔高通和带通滤波,保证过滤非必要的频率成分的同时,保留相位成分,并通过降噪算法,提升带分析的信号的信噪比;从而解决音频识别过程中覆盖范围狭小、抗干扰能力差和噪音的问题。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的原理框图;
图2为本发明的音频加码模块工作流程图;
图3为本发明的音频解码模块识别流程图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-3所示,音频识别系统,包括音频加码模块和音频解码模块;音频加码模块用于把输入的音频进行加码并调制到承载音频内容之上形成调制音频;音频加码模块包括音频加码单元、信息调制单元、音频编码单元和音频流输出单元;
音频加码单元的功能是把输入的音频(原始音频)根据其格式和编码,还原成pcm格式的裸音频数据,并把裸音频数据作为参数传入信息调制单元;
信息调制单元的功能是根据要调制的信息对解码单元获得的pcm数据进行全面分析,并生成调制需要的参数以及需要在音频中进行调制的位置,相位,能量和密度等调制参数,并将这些参数传递给音频编码单元;
音频编码单元的功能是把音频加码单元输出的pcm数据和由信息调制单元得到的调制参数通过音频编码算法调制到一起,形成承载了要调制的信息的新的pcm数据,并将这些pcm数据传递给音频流输出单元;
音频流输出单元将根据音频流原始数据的音频格式,将音频编码单元传递的已经编码的pcm数据进行重新编码,使得编码后的音频和原始音频在格式上一致,听感上基本一致,并已经调制了信息,这个音频播放时就可以被安装有瑞迪欧识别sdk的应用或设备通过片段录音从而还原上面调制的信息;
音频解码模块用于采集环境声音并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理,然后音把音频中加码的信息还原并对其进行相应的处理;相应的处理包括弹出、跳转,甚至是执行交互式ui等;
音频解码模块包括录音单元、数字滤波单元、频谱生成单元、频谱分析单元、相位谱分析单元、识别单元和校验输出单元;音频加码模块包括音频加码单元、信息调制单元、音频编码单元和音频流输出单元;环境声音即录音设备接收的音频信号;音频信号包括开放空间公共或商业场合扬声器发送的信号、封闭空间公共或商业场合扬声器发送的信号、移动运输工具内部的扬声器发送的信号、手机或电脑等设备播放视频或音频内容发送的信号、多媒体设备播放(电视,电脑等)内容发送的信号、电影院,剧院等场所演出播放发送的信号、调频收音机等设备接收电台信号并通过扬声器发送的信号、各类具有扬声器的电子设备播放音频内容发送信号、所有可以播放音频及视频内容的设备发出声音发送信号和调制音频;录音设备包括具有麦克风或超声波震荡片等其他可以感知空气震动,进行模拟和数字转换的设备接收信号和移动终端(手机,电脑,平板等)上装载的应用程序及小程序等接收信号信号的设备;
录音单元通过录音设备和ad/da转换器把环境声音采集生成pcm数据流,并传递给数字滤波单元;
数字滤波单元会将录音单元采集的音频中不承载信息的频率成分过滤,通过串联贝塞尔高通和带通滤波,保证过滤非必要的频率成分的同时,保留相位成分,并通过降噪算法,提升带分析的信号的信噪比,滤波后的数据会传送给频谱生成单元;
频谱生成单元主要的工作是把数字滤波单元传递进来的已经滤波的数据按照要求分别生成频谱数据,能量密度谱数据和相位谱数据,提供给后面的频谱分析单元和相位谱分析单元使用;
频谱分析单元把频谱生成单元生成的频谱数据进行分析,并找出其中的特征频谱,利用能量和密度以及信噪比的关系对这些特征频谱进行分析和比对,并标记出可能的频谱位置和长度,利用多次回归分析对识别阈值内的频谱数据,做多重标记,作为下一步相位分析的依据,如果在频谱分析中无法标记到足够的可分析数据,那么识别将会失败。
相位谱分析单元是将频谱分析的结果作为相位谱分析的输入,并针对已经标记的频道和位置数据以及在相位谱上进行特征识别,如果无法识别到约定的相位特征,识别将结束,对于识别到的数据,相位分析单元将进行标记,并将结果输出到识别单元;
识别单元根据相位谱分析单元输出的结果对标记数据进行模式提取和重组,对于重组后形成的信息进行规则检查和比对,如果信息符合系统规则,那么识别单元将会将结果输出到校验单元,否则识别失败。识别单元可能输出多个不同的识别信息候选;
校验输出单元对识别单元输出的识别数据进行多种校验,例如crc,系统匹配校验等,如果通过校验,则信息被作为正式的结果返回调用方,否则识别失败,由于识别单元可能输出多个不同的识别信息候选,所以校验单元还需要针对这些通过校验的候选进行仲裁,最终确定仲裁通过的信息作为最后的结果;
音频加码模块是对原始音频信息进行处理,使的处理后的音频中包含我们想要增加的信息,并形成一个新的音频,这个过程我们称之为加码过程,可以理解为内容制作,只不过这个内容是在原始音频内容上的加工,加工后的内容仍然是一个听起来和原始内容相同的音频,不过在音频里包含了我们可以还原的特殊信息;
然后是解码过程,音频经过加码后形成的新的音频可以在一切音频内容可以使用的场合使用,例如在公共场所播放,在电视广播中播放,在媒体设备中播放等等,音频解码模块通过麦克风或其他拾音设备(录音),甚至是数字方式获取的加码音频文件本身等方式获取加码后的音频,然后通过音频解码模块的处理,把音频中加码的信息还原回来,并对这个信息进行相应的处理;
本发明在使用时,音频加码单元把原始音频根据其格式和编码,还原成pcm格式的裸音频数据,并把裸音频数据作为参数传入信息调制单元;信息调制单元的功能是根据要调制的信息对解码单元获得的pcm数据进行全面分析,并生成调制需要的参数以及需要在音频中进行调制的位置,相位,能量和密度等调制参数,并将这些参数传递给音频编码单元;音频编码单元的功能是把音频加码单元输出的pcm数据和由信息调制单元得到的调制参数通过音频编码算法调制到一起,形成承载了要调制的信息的新的pcm数据,并将这些pcm数据传递给音频流输出单元;音频流输出单元将根据音频流原始数据的音频格式,将音频编码单元传递的已经编码的pcm数据进行重新编码,使得编码后的音频和原始音频在格式上一致,听感上基本一致,从而避免叠加后的音频由于承载超声波会对人耳产生刺激,影响听者的健康;
录音单元通过录音设备和ad/da转换器把环境声音采集生成pcm数据流,并传递给数字滤波单元;数字滤波单元会将录音单元采集的音频中不承载信息的频率成分过滤,通过串联贝塞尔高通和带通滤波,保证过滤非必要的频率成分的同时,保留相位成分,并通过降噪算法,提升带分析的信号的信噪比,滤波后的数据会传送给频谱生成单元;频谱生成单元主要的工作是把数字滤波单元传递进来的已经滤波的数据按照要求分别生成频谱数据,能量密度谱数据和相位谱数据,提供给后面的频谱分析单元和相位谱分析单元使用;频谱分析单元把频谱生成单元生成的频谱数据进行分析,并找出其中的特征频谱,利用能量和密度以及信噪比的关系对这些特征频谱进行分析和比对,并标记出可能的频谱位置和长度,利用多次回归分析对识别阈值内的频谱数据,做多重标记,相位谱分析单元是将频谱分析的结果作为相位谱分析的输入,并针对已经标记的频道和位置数据以及在相位谱上进行特征识别,如果无法识别到约定的相位特征,识别将结束,对于识别到的数据,相位分析单元将进行标记,并将结果输出到识别单元;识别单元根据相位谱分析单元输出的结果对标记数据进行模式提取和重组,对于重组后形成的信息进行规则检查和比对,如果信息符合系统规则,那么识别单元将会将结果输出到校验单元,校验输出单元对识别单元输出的识别数据进行多种校验;通过音频解码模块采集其公共场合播放的新的音频并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理以及数字滤波单元会将录音单元采集的音频中不承载信息的频率成分过滤,通过串联贝塞尔高通和带通滤波,保证过滤非必要的频率成分的同时,保留相位成分,并通过降噪算法,提升带分析的信号的信噪比;从而解决音频识别过程中覆盖范围狭小、抗干扰能力差和噪音的问题;
音频加码模块把输入的音频进行加码并调制到承载音频内容之上形成调制音频;即对原始音频信息进行处理,使的处理后的音频中包含我们想要增加的信息,并形成一个新的音频;将新的音频在在一切音频内容可以使用的场合使用,然后音频解码模块采集其公共场合播放的新的音频并进行滤波、数字滤波、频谱生成、频谱分析、相位谱分析以及识别和校验处理,然后把音频中加码的信息还原并对其进行相应的处理。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除