HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种基于深度学习的语音互动设备的制作方法

2021-01-28 14:01:22|238|起点商标网
一种基于深度学习的语音互动设备的制作方法

本发明涉及智能设备技术领域,具体为一种基于深度学习的语音互动设备。



背景技术:

随着科技的发展,人们对智能设备与人的互动交流有了更高的要求。例如:智能设备能够“听懂”人说话而做出相应的反应。

深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。最早的神经网络的思想起源于1943年的mcp人工神经元模型,当时是希望能够用计算机来模拟人的神经元反应的过程,但直到最近,它才真正让人工智能火起来。主要原因在于:算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础,对人工智能发展的意义不言而喻。

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。近年来,其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。目前,研发出来的基于深度学习技术的主流芯片有cpu、gpu、fpga、asic。投放市场的深度学习芯片有中国科学院计算技术研究所研发的“寒武纪”芯片、麻省理工学院研发的eyeriss芯片等等。

现有的基于深度学习的语音互动设备在使用的过程中,市场上已经有能够识别人声并进行互动的智能设备,但此类设备存在以下缺陷:对人声识别的准确度不高,为此我们提出一种新型的基于深度学习的语音互动设备解决上述问题。



技术实现要素:

本部分的目的在于概述本发明的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于现有语音互动设备中存在的问题,提出了本发明。

因此,本发明的目的是提供一种基于深度学习的语音互动设备,能够实现在使用的过程中,对收集到的语音进行预处理和信号增强,提高准确性。

为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:

一种基于深度学习的语音互动设备,其包括壳体、触摸显示屏和语音采集器,所述壳体的前表面中间设置有触摸显示屏,所述壳体的左侧和右侧设置有语音采集器,所述壳体的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,所述处理器电性输入连接预处理单元,所述预处理单元电性输入连接语音采集器,所述处理器双向连接语音处理单元和深度学习芯片,所述处理器电性输出连接驱动单元;

其中,

预处理单元包括语音降噪、语音合成和语音信号转换;

语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成。

作为本发明所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述驱动单元电性输出连接触摸显示屏,根据不同的语音指令,控制触摸显示屏显示不同的内容。

作为本发明所述的一种基于深度学习的语音互动设备的一种优选方案,其中:语音降噪采用mask方法进行降噪,因此我们的目标为irm(t,f)

其中|s(t,f)|2为纯净语音的能量谱,|n(t,f)|2为噪声的能量谱。

作为本发明所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述壳体的顶部设置有提手,所述提手的顶部设置有防滑套,方便装置的携带。

作为本发明所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述壳体的底部四角设置有支撑脚架,支撑脚架的底部设置有防护垫片,用于增加稳定性。

与现有技术相比,本发明的有益效果是:通过该一种基于深度学习的语音互动设备的设置,结构设计合理,首先通过语音降噪、语音合成和语音信号转换对语音采集器采集的语音进行预处理,然后在通过时频分解、目标计算和特征抽取、分离模型和波形合成对采集到的语音信号进行增强,提高了语音信息的准确性。

附图说明

为了更清楚地说明本发明实施方式的技术方案,下面将结合附图和详细实施方式对本发明进行详细说明,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明结构示意图;

图2为本发明系统框图;

图3为本发明语音处理单元结构示意图。

图中;100壳体、110触摸显示屏、120语音采集器。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施方式的限制。

其次,本发明结合示意图进行详细描述,在详述本发明实施方式时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。

本发明提供如下技术方案:一种基于深度学习的语音互动设备,包括壳体100、触摸显示屏200和语音采集器300,壳体100的前表面中间设置有触摸显示屏200,壳体100的左侧和右侧设置有语音采集器300,壳体100的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,处理器电性输入连接预处理单元,预处理单元电性输入连接语音采集器300,处理器双向连接语音处理单元和深度学习芯片,处理器电性输出连接驱动单元;

具体的,预处理单元包括语音降噪、语音合成和语音信号转换;语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成,驱动单元电性输出连接触摸显示屏200,根据不同的语音指令,控制触摸显示屏200显示不同的内容,语音采集器300用于语音采集,触摸显示屏200用于根据语音内容显示不同的内容,实现语音互动

语音降噪采用mask方法进行降噪,因此我们的目标为irm(t,f)

其中|s(t,f)|2为纯净语音的能量谱,|n(t,f)|2为噪声的能量谱。

工作原理:在使用的过程中,首先通过语音采集器300与语音指令进行采集,首先通过语音降噪、语音合成和语音信号转换对语音采集器300采集的语音进行预处理,然后在通过时频分解、目标计算和特征抽取、分离模型和波形合成对采集到的语音信号进行增强,提高了语音信息的准确性。

虽然在上文中已经参考实施方式对本发明进行了描述,然而在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本发明所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本发明并不局限于文中公开的特定实施方式,而是包括落入权利要求的范围内的所有技术方案。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 深度学习语音芯片
tips