一种适合盲人使用的语音空调控制装置的制作方法

2021-01-28 13:01:07|

233|

起点商标网

本发明属于空调语音控制技术领域，具体来说是一种适合盲人使用的语音空调控制装置。

背景技术：

现有的空调的语音控制装置，通过语音播报模块播报包括多个命令词的帮助菜单，用户根据帮助菜单发出命令词后，语音采集模块采集用户发出的语音信号，然后语音识别模块对采集到的语音信号进行识别以生成语音识别结果，控制模块根据语音识别结果对空调器进行控制。但是现有的空调语音控制的缺点在于需要通过语音播报器发出帮助菜单命令词，用户才能根据帮助菜单发出命令词来控制空调状态。且缺乏语音播报空调实时状态难以及时给与盲人反馈，智能化较低。

经检索，中国发明专利：一种空调器及其语音控制装置和语音控制方法(申请号为201811029946.5，申请日为2018.09.05)，该申请案包括：语音播报模块，语音播报模块用于播报帮助菜单，其中，帮助菜单包括多个命令词；语音采集模块，语音采集模块用于采集用户基于帮助菜单发出的语音信号；语音识别模块，语音识别模块用于对语音信号进行识别以生成语音识别结果；控制模块，控制模块与语音识别模块相连，控制模块根据语音识别结果对空调器进行控制。本发明实施例的语音控制装置通过播报包括命令词的帮助菜单，能够让用户清楚知道语音设备的语音命令操作方法，进一步提升用户体验。但是该申请案的不足之处在于只能播报帮助菜单，功能不够全面。

技术实现要素：

1.发明要解决的技术问题

本发明的目的在于解决现有的语音空调控制设备只能播报帮助菜单，功能不够全面的问题。

2.技术方案

为达到上述目的，本发明提供的技术方案为：

本发明的一种适合盲人使用的语音空调控制装置，包括

语音接收模块，所述语音接收模块用于接收语音指令；

语音处理模块，所述语音处理模块用于对语音接收模块所采集的语音信号进行识别并输出语音识别结果；

控制模块，所述控制模块用于接收语音处理模块输出的语音识别结果并生成语音控制指令发出；

执行模块，所述执行模块用于接收并执行控制模块发出的语音控制指令；

电源模块，所述电源模块用于为装置供电；

语音播报模块，所述语音播报模块收集空调状态数据并进行播报。

优选的，所述语音接收模块连接有触发识别单元，所述触发识别单元为距离传感器。

优选的，所述语音接收模块为声音接收设备。

优选的，所述语音处理模块为语音转换设备。

优选的，所述控制模块为控制器。

优选的，所述执行模块为空调开关，所述语音播报模块包括信号收集设备和声音播放器。

一种适合盲人使用的语音空调控制方法，检测盲人靠近空调的距离和时间，当距离和时间满足设定阈值时，播报语音控制菜单，盲人根据语音控制菜单说出语音控制指令，对语音控制指令进行处理转化成空调指令并控制空调执行操作，所述语音控制菜单包括空调工作状态和室内环境状态。

优选的，所述方法采用上述装置进行，所述语音处理模块将语音接收模块接收到的语音信号采用梅尔频率倒谱系数(mfcc)以及线性预测倒谱系数(lpcc)进行特征参数的提取，接着矢量量化vq(vectorquantization)，从而得到若干个候选的结果，将结果和语音处理模块中建立的词库相匹配，最后模式匹配输出的结果传输至控制模块，控制模块发出相应的控制指令。

优选的，所述语音处理模块内设有语音命令相对于的词库，所述词库内设有常用的空调语音控制语句。

3.有益效果

采用本发明提供的技术方案，与现有技术相比，具有如下有益效果：

本发明的一种适合盲人使用的语音空调控制装置，包括语音接收模块，语音接收模块用于接收语音指令；语音处理模块，语音处理模块用于对语音接收模块所采集的语音信号进行识别并输出语音识别结果；控制模块，控制模块用于接收语音处理模块输出的语音识别结果并生成语音控制指令发出；执行模块，执行模块用于接收并执行控制模块发出的语音控制指令；电源模块，电源模块用于为装置供电；语音播报模块，语音播报模块收集空调状态数据并进行播报。检测盲人靠近空调的距离和时间，当距离和时间满足设定阈值时，播报语音控制菜单，盲人根据语音控制菜单说出语音控制指令，对语音控制指令进行处理转化成空调指令并控制空调执行操作，同时会对盲人播报空调状态和室内环境状态，帮助盲人进行更好的发出指令，解决了现有的语音控制空调难以帮助盲人获取空调状态的问题。

附图说明

图1为本发明的一种适合盲人使用的语音空调控制装置的结构示意图；

图2为本发明的hmm的基本模型图。

示意图中的标号说明：

100、语音接收模块；110、触发识别单元；200、语音处理模块；300、控制模块；400、执行模块；500、电源模块；600、语音播报模块。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述，附图中给出了本发明的若干实施例，但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例，相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是，当元件被称为“固设于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件；当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件；本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同；本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明；本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

实施例1

参照附图1，本实施例的一种适合盲人使用的语音空调控制装置，包括

语音接收模块100，所述语音接收模块100用于接收语音指令；

语音处理模块200，所述语音处理模块200用于对语音接收模块100所采集的语音信号进行识别并输出语音识别结果；

控制模块300，所述控制模块300用于接收语音处理模块200输出的语音识别结果并生成语音控制指令发出；

执行模块400，所述执行模块400用于接收并执行控制模块300发出的语音控制指令；

电源模块500，所述电源模块500用于为装置供电；

语音播报模块600，所述语音播报模块600收集空调状态数据并进行播报。

语音接收模块100连接有触发识别单元110，所述触发识别单元110为距离传感器。所述语音接收模块100为声音接收设备。所述语音处理模块200为语音转换设备。所述控制模块300为控制器。执行模块400为空调开关，所述语音播报模块600包括信号收集设备和声音播放器。

所述语音处理模块200内设有语音命令相对于的词库，所述词库内设有常用的空调语音控制语句。

方法采用上述的装置进行，所述语音处理模块200将语音接收模块100接收到的语音信号采用梅尔频率倒谱系数(mfcc)以及线性预测倒谱系数(lpcc)进行特征参数的提取，接着矢量量化vq(vectorquantization)，从而得到若干个候选的结果，将结果和hmm训练好的模型、语音处理模块200中建立的词库相匹配，最后模式匹配输出的结果传输至控制模块300，控制模块300发出相应的控制指令。

其中hmm的基本模型如图2所示，其中灰色的圈表示可观察到的状态，白色的圈表示隐藏状态，箭头表示状态之间的转换概率。从语音信号来考虑，信号中的音素是按照从左至右的方式发出的，所以使用自左至右的状态问转移方式相对合理。且在汉语中，音素省略现象很少出现，尤其是针对于本文所处理的单音节发音中则几乎不存在。所以在设计中采用的是无跳转状态模型，

隐马尔可夫模型有三个必备：初始概率π、隐藏状态转移矩阵(a)和生成观察状态概率矩阵(b)。通常用λ＝{π，a，b}表示hmm模型。隐马尔可夫模型由下列5个参数描述口：

①n：隐藏状态序列的数目，记n个状态为s1，s2…st时刻所处的隐藏状态为qt，qt∈(s1,s2…sn)。

②m：每个观察序列的数目，记m个观察为x1,x2…xm，t时刻所处的观察状态为yt，yt∈(x1，x2…xm)。

③在隐马尔可夫模型中，在t＝0时刻时，系统的初始概率π在某一个状态q·。中，即πi＝p(q1＝si)，1≤i≤n

④在任意时刻t时，在它的t时刻处的状态qt+1只与t时刻的状态qt+1有关，且转移概率矩阵a跳转，aij为隐藏状态概率转移矩阵，其计算公式为：

aij＝p(qt+1＝sj|qt＝si)，1≤i，j≤n

⑤在任意时刻t所处在的状态qt是隐藏的，外界不能直接观察到,只能通过系统在当前时刻提供的观察序列qt得出，故观察序列yt只与隐藏序列qt有关bjx为生成观察状态概率矩阵，其计算公式为：

bjx＝p(yt＝xk|qt＝sj)。1≤j≤n，1≤k≤m

用前向算法求解hmm的观测序列概率，算法的本质是动态规划思想，找到局部状态递推公式，从局部状态的最优解拓展到对整个问题的最优解。计算时刻1的各个隐藏状态的前向概率为：

α1＝πibi(y1)，1≤i≤n

递推t时刻之前的前向概率为：

计算结果为：

用viterbi算法求解最有可能隐藏状态序列。根据t时刻的隐藏状态qt情况算出(t+1)时刻各个隐藏状态情况，找到所有可能路径的最大值。设隐藏状态为i，则

递推：

概率最大路径中t-1的状态为：

其中美尔频率倒谱系数(mfcc)，是一种根据人耳听觉特性构造的一种语音特征参数。由于人耳所听到的声高与频率并不是线性对应关系，而mel频率尺度更能准确的对应人耳的听觉特性。mel频率尺度与实际频率大体上呈现出对数分布关系，其转换关系可近似为式fmel≈259510910(1+f/700)

美尔频率倒谱系数计算步骤如下：

原始语音信号s(n)经过一系列预处理后得到帧信号x(n)，对帧信号进行离散傅里叶变换。得到其线性频率谱x(k)：其中，o≤k≤n，n为傅里叶变换的点数求帧信号能量谱，即上式求得的离散频率普的平方。通过m个美尔尺度的三角型滤波器对能量谱进行带通滤波。m通常取24～40个。

以上所述实施例仅表达了本发明的某种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制；应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围；因此，本发明专利的保护范围应以所附权利要求为准。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签：信号频率概率计算语音识别技术

上一篇一种语音指令的处理方法、设备及控制系统与流程

下一篇语音处理系统、会议系统、语音处理方法以及记录介质与流程

热门咨询

热门标签

热门产品

tips