HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种交互式多功能的老年护理机器人识别系统的制作方法

2021-01-28 15:01:43|288|起点商标网
一种交互式多功能的老年护理机器人识别系统的制作方法

本发明涉及机器人技术领域,尤其涉及一种交互式多功能的老年护理机器人识别系统。



背景技术:

目前我国人口老龄化问题日益严峻,在人口老龄化的背景下,老年护理机器人是社会生活所迫切需要的,老年护理机器人既能很好地提高老人的的生活质量,又能帮助解决伴随着少子老龄化带来的劳动力不足问题,减轻子女们养老的负担,缓解人口老龄化所带来的问题。

在现有技术中,老年护理机器人的识别系统设计还存在一定的缺陷,在实际使用中,机器人的使用存在特定人(老年人)和非特定人(家庭成员或者访客),而在进行识别系统设计时,而对于特定人群使用时,如何能保证精确的识别命令发出者是否为设定人群,对于非特定人群时,如何能保证录入不同声纹特征的识别,保证其识别精确度,是本发明旨在解决的问题。



技术实现要素:

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种交互式多功能的老年护理机器人识别系统。

为了实现上述目的,本发明采用了如下技术方案:

一种交互式多功能的老年护理机器人识别系统,包括特定人识别分系统、非特定人识别分系统和语音收集处理模块,所述特定人识别分系统和非特定人识别分系统共用同一个语音收集初处理模块,所述语音收集处理模块包括端点检测模块和特征提取模块,所述特定人识别分系统包括模型训练与识别模块和模型更新模块。

优选地:所述端点检测模块是以端点检测作为特征,可以确定一段包含语音的声音信号中确定语音的起点和终点,区分语音信号和非语音信号。

优选地:所述特征提取模块包括前端处理、特征提取和特征归一化三个流程,其具体步骤如下:

a1:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

a2:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,对如下处理:y(0)=0.03×s(1),y(n)=s(n)-0.97×s(n-1),n=1,2,……,51,其中,s(n)表示一帧中第n+1个采样点;

a3:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:其中,n=0,1,……,t-1,t=512.

a4:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:xk=|xk|2

a5:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

a6:mel对数能量:对每个mel频子带能量去对视:mel(i)=ln(filt(i)),i=1,2,……,40;

a7:离散余弦变换:其中,i=0,1……,m-1;m=40;d=13。

优选地:所述模型训练与识别模块采用高斯混合-通用背景模型,其通过无监督学习对人的发声系统进行拟合,根据每个人的声音特点构造不同的特定人模型,其在预先训练好的背景模型上对少量待识别用户语音数据进行自适应训练,其具体流程如下:

b1:数据准备,准备3小时左右的语音数据;

b2:用k-means算法对数据进行初步聚类;

b3:期望最大化,对b2步骤中的结果进行进一步优化;

b4:特定人目标建模;

b5:语音识别。

优选地:所述b1中的语音数据中,特定人的个数再80-100人,按性别分成两组,分别对两组数据进行特征提取,所述b2中,其类的个数为1024,经过5次迭代,可以得到包括类中心与方差在内的1024个类,其是高斯混合模型的各个分量。

优选地:所述b5中,当用户对机器人发出命令或者进行语音交流时,机器人将采集到的的语音数据在特定人模型库中的各个模型上计算得分,在对得分进行必要的归一化处理后,得分最高的那个模型所属的特定人便是系统识别出的特定人结果,其得分计算如下:其中lnp(xi丨λspr)为第i帧语音在特定人模型上的概率,lnp(xi丨λubn)为第i帧在ubn模型上的概率,n为待识别语音的帧数。

优选地:所述模型更新模块为识别系统应对系统中的特定人模型进行更新,当系统以较高的成功率确认一次说话者身份后,系统这段语音数据连同身份、时间信息一同保存在数据库中,一段时间之后,系统基于最近采集信息进行特定人模型的重新训练和数据库更新。

优选地:所述非特定人识别分系统是利用隐马尔科夫模型,来完成非特定人语音识别,其在实际使用时,先建立词汇库,需要给定一下参数,状态数据n、观测符号数目m个集合、三个概率分布状态转移概率矩阵a,观测符号概率矩阵b,初始状态概率矢量p,一次建立特定模型l=(p,a,b),对于给定n,m,a,b和p,该模型即可产生观测序列:o=(o1,o2,......,ot),t为观测符号的数据,即观测序列的长度,其产生观测序列的步骤如下:

c1:根据初始状态分布p选择一个初始状态si;

c2:设定t=1;

c3:根据状态si的观测符号概率分布选择输出符号;

c4:根据状态si的转移概率转移到心状态sj;

c5:设定t=t+1,如果t<t,则跳转c3,否则结束;

c6:根据观测序列给每一个模型评分,识别结果就是得分最高的模型多对应的词汇库中的词。

优选地:所述语音收集处理模块还包括后期处理模块,其能有效的控制环境噪声对语音识别的影响,具体步骤如下:

d1:根据人类语音听觉感知对激励源缓变不敏感的特性,建立经验公式:h(z)=0.1×(2+z-1-z-3-2z-4)/z4×(1-0.98z-1),减弱人类声线频率之外的能量的比重,

d2:高阶差分,对相邻的13维特征之间的模型做一阶、二阶差分,构成39的的改进模型特性;

d3:倒谱均值减,对原始信号进行相应的调制,进行除噪;

d4:高斯化,对语音特征进行高斯化规整。

优选地:所述其还包括自主功能分系统,所述自主功能分系统包括请求帮助模块、危险警报模块和通知通告模块,所述请求帮助模块,当机器人在行进过程中,遇到卡住、牵绊、迷路情况时,经上位机判断后,机器人便发出相应请求帮助,所述危险警报模块,结合机器人各种传感器,当检测到异常温度、空气异常成分情况,其发出警报,所述通知通告模块用于对用户设置的各种日程、时间、事件的提醒,还包括娱乐功能分系统,所述娱乐功能分系统包括播放模块和无线通讯模块,当系统检测到例如“播放音乐”、“讲笑话”指令时,上位机控制无线通讯模块连接互联网,在互联网上进行相应的搜索,搜索下载后,经播放模块进行播放文字、音频、视频。

本发明的有益效果为:

1.本发明通过对特定人群和非特定人群采用不同分系统控制,对于特定人的语音识别采用训练模式,对于飞特定人群采用词汇库对比模式,大大的提高了语音识别的精确性。

2.本发明通过对语音包进行端点检测,确定语音的起点和重点,随后再进行特征点提取,极大的减少的上位机的计算量,提高了整个系统的相应速度。

3.本发明通过对特征提取后的数据再进行后期数据处理,对整个语音数据包中的其他噪音进行去除,并且还对特定人识别的模型库进行定时更新,进一步提高了语音识别的精确度。

附图说明

图1为本发明提出的一种交互式多功能的老年护理机器人识别系统中的特征提取流程示意图;

具体实施方式

下面结合具体实施方式对本专利的技术方案作进一步详细地说明。

在本专利的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“设置”应做广义理解,例如,可以是固定相连、设置,也可以是可拆卸连接、设置,或一体地连接、设置。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利中的具体含义。

实施例1:

一种交互式多功能的老年护理机器人识别系统,包括特定人识别分系统、非特定人识别分系统和语音收集处理模块,所述特定人识别分系统和非特定人识别分系统共用同一个语音收集初处理模块,所述语音收集处理模块包括端点检测模块和特征提取模块,所述特定人识别分系统包括模型训练与识别模块和模型更新模块。

所述端点检测模块是以端点检测作为特征,可以确定一段包含语音的声音信号中确定语音的起点和终点,区分语音信号和非语音信号。

所述特征提取模块包括前端处理、特征提取和特征归一化三个流程,其具体步骤如下:

a1:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

a2:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,对如下处理:y(0)=0.03×s(1),y(n)=s(n)-0.97×s(n-1),n=1,2,……,51,其中,s(n)表示一帧中第n+1个采样点;

a3:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:其中,n=0,1,……,t-1,t=512.

a4:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:xk=|xk|2

a5:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

a6:mel对数能量:对每个mel频子带能量去对视:mel(i)=ln(filt(i)),i=1,2,......,40;

a7:离散余弦变换:其中,i=0,1......,m-1;m=40;d=13。

所述模型训练与识别模块采用高斯混合-通用背景模型,其通过无监督学习对人的发声系统进行拟合,根据每个人的声音特点构造不同的特定人模型,其在预先训练好的背景模型上对少量待识别用户语音数据进行自适应训练,其具体流程如下:

b1:数据准备,准备3小时左右的语音数据;

b2:用k-means算法对数据进行初步聚类;

b3:期望最大化,对b2步骤中的结果进行进一步优化;

b4:特定人目标建模;

b5:语音识别。

所述b1中的语音数据中,特定人的个数再80-100人,按性别分成两组,分别对两组数据进行特征提取,所述b2中,其类的个数为1024,经过5次迭代,可以得到包括类中心与方差在内的1024个类,其是高斯混合模型的各个分量。

所述b5中,当用户对机器人发出命令或者进行语音交流时,机器人将采集到的的语音数据在特定人模型库中的各个模型上计算得分,在对得分进行必要的归一化处理后,得分最高的那个模型所属的特定人便是系统识别出的特定人结果,其得分计算如下:其中lnp(xi丨λspr)为第i帧语音在特定人模型上的概率,lnp(xi丨λubn)为第i帧在ubn模型上的概率,n为待识别语音的帧数。

所述模型更新模块为识别系统应对系统中的特定人模型进行更新,当系统以较高的成功率确认一次说话者身份后,系统这段语音数据连同身份、时间等信息一同保存在数据库中,一段时间之后,系统基于最近采集信息进行特定人模型的重新训练和数据库更新

所述非特定人识别分系统是利用隐马尔科夫模型,来完成非特定人语音识别,其在实际使用时,先建立词汇库,需要给定一下参数,状态数据n、观测符号数目m个集合、三个概率分布状态转移概率矩阵a,观测符号概率矩阵b,初始状态概率矢量p,一次建立特定模型l=(p,a,b),对于给定n,m,a,b和p,该模型即可产生观测序列:o=(o1,o2,......,ot),t为观测符号的数据,即观测序列的长度,其产生观测序列的步骤如下:

c1:根据初始状态分布p选择一个初始状态si;

c2:设定t=1;

c3:根据状态si的观测符号概率分布选择输出符号;

c4:根据状态si的转移概率转移到心状态sj;

c5:设定t=t+1,如果t<t,则跳转c3,否则结束;

c6:根据观测序列给每一个模型评分,识别结果就是得分最高的模型多对应的词汇库中的词。

实施例2:

一种交互式多功能的老年护理机器人识别系统,包括特定人识别分系统、非特定人识别分系统和语音收集处理模块,所述特定人识别分系统和非特定人识别分系统共用同一个语音收集初处理模块,所述语音收集处理模块包括端点检测模块和特征提取模块,所述特定人识别分系统包括模型训练与识别模块和模型更新模块。

所述端点检测模块是以端点检测作为特征,可以确定一段包含语音的声音信号中确定语音的起点和终点,区分语音信号和非语音信号。

所述特征提取模块包括前端处理、特征提取和特征归一化三个流程,其具体步骤如下:

a1:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

a2:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,对如下处理:y(0)=0.03×s(1),y(n)=s(n)-0.97×s(n-1),n=1,2,......,51,其中,s(n)表示一帧中第n+1个采样点;

a3:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:其中,n=0,1,……,t-1,t=512.

a4:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:xk=|xk|2

a5:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

a6:mel对数能量:对每个mel频子带能量去对视:mel(i)=ln(filt(i)),i=1,2,......,40;

a7:离散余弦变换:其中,i=0,1......,m-1;m=40;d=13。

所述模型训练与识别模块采用高斯混合-通用背景模型,其通过无监督学习对人的发声系统进行拟合,根据每个人的声音特点构造不同的特定人模型,其在预先训练好的背景模型上对少量待识别用户语音数据进行自适应训练,其具体流程如下:

b1:数据准备,准备3小时左右的语音数据;

b2:用k-means算法对数据进行初步聚类;

b3:期望最大化,对b2步骤中的结果进行进一步优化;

b4:特定人目标建模;

b5:语音识别。

所述b1中的语音数据中,特定人的个数再80-100人,按性别分成两组,分别对两组数据进行特征提取,所述b2中,其类的个数为1024,经过5次迭代,可以得到包括类中心与方差在内的1024个类,其是高斯混合模型的各个分量。

所述b5中,当用户对机器人发出命令或者进行语音交流时,机器人将采集到的的语音数据在特定人模型库中的各个模型上计算得分,在对得分进行必要的归一化处理后,得分最高的那个模型所属的特定人便是系统识别出的特定人结果,其得分计算如下:其中lnp(xi丨λspr)为第i帧语音在特定人模型上的概率,lnp(xi丨λubn)为第i帧在ubn模型上的概率,n为待识别语音的帧数。

所述模型更新模块为识别系统应对系统中的特定人模型进行更新,当系统以较高的成功率确认一次说话者身份后,系统这段语音数据连同身份、时间等信息一同保存在数据库中,一段时间之后,系统基于最近采集信息进行特定人模型的重新训练和数据库更新

所述非特定人识别分系统是利用隐马尔科夫模型,来完成非特定人语音识别,其在实际使用时,先建立词汇库,需要给定一下参数,状态数据n、观测符号数目m个集合、三个概率分布状态转移概率矩阵a,观测符号概率矩阵b,初始状态概率矢量p,一次建立特定模型l=(p,a,b),对于给定n,m,a,b和p,该模型即可产生观测序列:o=(o1,o2,......,ot),t为观测符号的数据,即观测序列的长度,其产生观测序列的步骤如下:

c1:根据初始状态分布p选择一个初始状态si;

c2:设定t=1;

c3:根据状态si的观测符号概率分布选择输出符号;

c4:根据状态si的转移概率转移到心状态sj;

c5:设定t=t+1,如果t<t,则跳转c3,否则结束;

c6:根据观测序列给每一个模型评分,识别结果就是得分最高的模型多对应的词汇库中的词。

所述语音收集处理模块还包括后期处理模块,其能有效的控制环境噪声对语音识别的影响,具体步骤如下:

d1:根据人类语音听觉感知对激励源缓变不敏感的特性,建立经验公式:h(z)=0.1×(2+z-1-z-3-2z-4)/z4×(1-0.98z-1),减弱人类声线频率之外的能量的比重,

d2:高阶差分,对相邻的13维特征之间的模型做一阶、二阶差分,构成39的的改进模型特性;

d3:倒谱均值减,对原始信号进行相应的调制,进行除噪;

d4:高斯化,对语音特征进行高斯化规整。

实施例3:

一种交互式多功能的老年护理机器人识别系统,包括特定人识别分系统、非特定人识别分系统和语音收集处理模块,所述特定人识别分系统和非特定人识别分系统共用同一个语音收集初处理模块,所述语音收集处理模块包括端点检测模块和特征提取模块,所述特定人识别分系统包括模型训练与识别模块和模型更新模块。

所述端点检测模块是以端点检测作为特征,可以确定一段包含语音的声音信号中确定语音的起点和终点,区分语音信号和非语音信号。

所述特征提取模块包括前端处理、特征提取和特征归一化三个流程,其具体步骤如下:

a1:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

a2:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,对如下处理:y(0)=0.03×s(1),y(n)=s(n)-0.97×s(n-1),n=1,2,......,51,其中,s(n)表示一帧中第n+1个采样点;

a3:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:其中,n=0,1,……,t-1,t=512.

a4:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:xk=|xk|2

a5:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

a6:mel对数能量:对每个mel频子带能量去对视:mel(i)=ln(filt(i)),i=1,2,......,40;

a7:离散余弦变换:其中,i=0,1......,m-1;m=40;d=13。

所述模型训练与识别模块采用高斯混合-通用背景模型,其通过无监督学习对人的发声系统进行拟合,根据每个人的声音特点构造不同的特定人模型,其在预先训练好的背景模型上对少量待识别用户语音数据进行自适应训练,其具体流程如下:

b1:数据准备,准备3小时左右的语音数据;

b2:用k-means算法对数据进行初步聚类;

b3:期望最大化,对b2步骤中的结果进行进一步优化;

b4:特定人目标建模;

b5:语音识别。

所述b1中的语音数据中,特定人的个数再80-100人,按性别分成两组,分别对两组数据进行特征提取,所述b2中,其类的个数为1024,经过5次迭代,可以得到包括类中心与方差在内的1024个类,其是高斯混合模型的各个分量。

所述b5中,当用户对机器人发出命令或者进行语音交流时,机器人将采集到的的语音数据在特定人模型库中的各个模型上计算得分,在对得分进行必要的归一化处理后,得分最高的那个模型所属的特定人便是系统识别出的特定人结果,其得分计算如下:其中lnp(xi丨λspr)为第i帧语音在特定人模型上的概率,lnp(xi丨λubn)为第i帧在ubn模型上的概率,n为待识别语音的帧数。

所述模型更新模块为识别系统应对系统中的特定人模型进行更新,当系统以较高的成功率确认一次说话者身份后,系统这段语音数据连同身份、时间等信息一同保存在数据库中,一段时间之后,系统基于最近采集信息进行特定人模型的重新训练和数据库更新

所述非特定人识别分系统是利用隐马尔科夫模型,来完成非特定人语音识别,其在实际使用时,先建立词汇库,需要给定一下参数,状态数据n、观测符号数目m个集合、三个概率分布状态转移概率矩阵a,观测符号概率矩阵b,初始状态概率矢量p,一次建立特定模型l=(p,a,b),对于给定n,m,a,b和p,该模型即可产生观测序列:o=(o1,o2,......,ot),t为观测符号的数据,即观测序列的长度,其产生观测序列的步骤如下:

c1:根据初始状态分布p选择一个初始状态si;

c2:设定t=1;

c3:根据状态si的观测符号概率分布选择输出符号;

c4:根据状态si的转移概率转移到心状态sj;

c5:设定t=t+1,如果t<t,则跳转c3,否则结束;

c6:根据观测序列给每一个模型评分,识别结果就是得分最高的模型多对应的词汇库中的词。

所述语音收集处理模块还包括后期处理模块,其能有效的控制环境噪声对语音识别的影响,具体步骤如下:

d1:根据人类语音听觉感知对激励源缓变不敏感的特性,建立经验公式:h(z)=0.1×(2+z-1-z-3-2z-4)/z4×(1-0.98z-1),减弱人类声线频率之外的能量的比重,

d2:高阶差分,对相邻的13维特征之间的模型做一阶、二阶差分,构成39的的改进模型特性;

d3:倒谱均值减,对原始信号进行相应的调制,进行除噪;

d4:高斯化,对语音特征进行高斯化规整。

其还包括自主功能分系统,所述自主功能分系统包括请求帮助模块、危险警报模块和通知通告模块,所述请求帮助模块,当机器人在行进过程中,遇到卡住、牵绊、迷路等情况时,经上位机判断后,机器人便发出相应请求帮助,所述危险警报模块,结合机器人各种传感器,当检测到异常温度、空气异常成分等情况,其发出警报,所述通知通告模块用于对用户设置的各种日程、时间、事件的提醒。

实施例4:

一种交互式多功能的老年护理机器人识别系统,包括特定人识别分系统、非特定人识别分系统和语音收集处理模块,所述特定人识别分系统和非特定人识别分系统共用同一个语音收集初处理模块,所述语音收集处理模块包括端点检测模块和特征提取模块,所述特定人识别分系统包括模型训练与识别模块和模型更新模块。

所述端点检测模块是以端点检测作为特征,可以确定一段包含语音的声音信号中确定语音的起点和终点,区分语音信号和非语音信号。

所述特征提取模块包括前端处理、特征提取和特征归一化三个流程,其具体步骤如下:

a1:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

a2:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,对如下处理:y(0)=0.03×s(1),y(n)=s(n)-0.97×s(n-1),n=1,2,……,51,其中,s(n)表示一帧中第n+1个采样点;

a3:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:其中,n=0,1,……,t-1,t=512.

a4:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:xk=|xk|2

a5:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

a6:mel对数能量:对每个mel频子带能量去对视:mel(i)=ln(filt(i)),i=1,2,......,40;

a7:离散余弦变换:其中,i=0,1......,m-1;m=40;d=13。

所述模型训练与识别模块采用高斯混合-通用背景模型,其通过无监督学习对人的发声系统进行拟合,根据每个人的声音特点构造不同的特定人模型,其在预先训练好的背景模型上对少量待识别用户语音数据进行自适应训练,其具体流程如下:

b1:数据准备,准备3小时左右的语音数据;

b2:用k-means算法对数据进行初步聚类;

b3:期望最大化,对b2步骤中的结果进行进一步优化;

b4:特定人目标建模;

b5:语音识别。

所述b1中的语音数据中,特定人的个数再80-100人,按性别分成两组,分别对两组数据进行特征提取,所述b2中,其类的个数为1024,经过5次迭代,可以得到包括类中心与方差在内的1024个类,其是高斯混合模型的各个分量。

所述b5中,当用户对机器人发出命令或者进行语音交流时,机器人将采集到的的语音数据在特定人模型库中的各个模型上计算得分,在对得分进行必要的归一化处理后,得分最高的那个模型所属的特定人便是系统识别出的特定人结果,其得分计算如下:其中lnp(xi丨λspr)为第i帧语音在特定人模型上的概率,lnp(xi丨λubn)为第i帧在ubn模型上的概率,n为待识别语音的帧数。

所述模型更新模块为识别系统应对系统中的特定人模型进行更新,当系统以较高的成功率确认一次说话者身份后,系统这段语音数据连同身份、时间等信息一同保存在数据库中,一段时间之后,系统基于最近采集信息进行特定人模型的重新训练和数据库更新。

所述非特定人识别分系统是利用隐马尔科夫模型,来完成非特定人语音识别,其在实际使用时,先建立词汇库,需要给定一下参数,状态数据n、观测符号数目m个集合、三个概率分布状态转移概率矩阵a,观测符号概率矩阵b,初始状态概率矢量p,一次建立特定模型l=(p,a,b),对于给定n,m,a,b和p,该模型即可产生观测序列:o=(o1,o2,……,ot),t为观测符号的数据,即观测序列的长度,其产生观测序列的步骤如下:

c1:根据初始状态分布p选择一个初始状态si;

c2:设定t=1;

c3:根据状态si的观测符号概率分布选择输出符号;

c4:根据状态si的转移概率转移到心状态sj;

c5:设定t=t+1,如果t<t,则跳转c3,否则结束;

c6:根据观测序列给每一个模型评分,识别结果就是得分最高的模型多对应的词汇库中的词。

所述语音收集处理模块还包括后期处理模块,其能有效的控制环境噪声对语音识别的影响,具体步骤如下:

d1:根据人类语音听觉感知对激励源缓变不敏感的特性,建立经验公式:h(z)=0.1×(2+z-1-z-3-2z-4)/z4×(1-0.98z-1),减弱人类声线频率之外的能量的比重,

d2:高阶差分,对相邻的13维特征之间的模型做一阶、二阶差分,构成39的的改进模型特性;

d3:倒谱均值减,对原始信号进行相应的调制,进行除噪;

d4:高斯化,对语音特征进行高斯化规整。

其还包括自主功能分系统,所述自主功能分系统包括请求帮助模块、危险警报模块和通知通告模块,所述请求帮助模块,当机器人在行进过程中,遇到卡住、牵绊、迷路等情况时,经上位机判断后,机器人便发出相应请求帮助,所述危险警报模块,结合机器人各种传感器,当检测到异常温度、空气异常成分等情况,其发出警报,所述通知通告模块用于对用户设置的各种日程、时间、事件的提醒。

其还包括娱乐功能分系统,所述娱乐功能分系统包括播放模块和无线通讯模块,当系统检测到例如“播放音乐”、“讲笑话”等指令时,上位机控制无线通讯模块连接互联网,在互联网上进行相应的搜索,搜索下载后,经播放模块进行播放文字、音频、视频等。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips