HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种多人文本语音转换装置及方法与流程

2021-01-28 13:01:58|248|起点商标网
一种多人文本语音转换装置及方法与流程

本发明属于智能语音交互技术领域,涉及一种多人文本语音转换装置及方法。



背景技术:

目前,语音识别技术广泛应用于人机交互领域中,现有的语音识别技术能够准确地和快速地识别语音信号对应的发言对象以及语音信号本身地含义,这极大地推动了人机交互的应用和发展。随着智能设备的普及,目前大多数智能设备(智能手机,智能音箱等)具有自动发音功能,但是目前大部分智能设备只能单纯地发出机器声音,对于需要通过智能设备进行语音交互的用户来说,机器声音比较单调乏味,听起来没有自然语言那样生动形象,且过于生硬,并不能体现出用户本身的特色。除此之外,在协同办公场景下,目前用户对于所述语音信息、文本信息或者文本和语音两种信息都存在的情况下对信息的存储管理不够完善。

综上所述,现有技术存在的问题是:在协同办公场景下,如何实现个性化的语音合成以及完善对信息的存储管理,使得用户之间的交流自然友好,高效完成办公任务。



技术实现要素:

本发明的目的在于克服现有技术中存在的缺陷,提供一种多人文本语音转换装置及方法,该技术方案旨在多人协同语音办公场景下,用户在身份确认之后可以根据现有设备及所处环境选择适合的交互设备,根据不同交互设备用户所述的语音信息、文本信息或者语音和文本两种信息都存在的情况下,可以通过文本-语音后台服务器完成文本-语音之间的转换,使得多人之间的交互更加自然友好,从而提高工作效率。

其技术方案如下:

一种多人文本语音转换装置,包括麦克风设备、键鼠及手写板、智能音箱设备和接收设备;

所述麦克风设备,用于接收用户发出的语音信息;

所述键鼠及手写板,用于传输用户的文本信息;

所述智能音箱设备,用于传出经语音合成系统将文本信息转换成的语音信息;

所述接收设备,用于接收用户传递的语音信息转换成的文本信息。

进一步,所述接收设备包括显示器设备、平板电脑、笔记本电脑、智能手表和其他(智能汽车等)。

进一步,还包括存储管理模块,所述存储管理模块包括文本数据库、语音数据库和个人资料库,所述文本数据库和语音数据库之间通过语音、人物、文本的关系连接在一起;

所述文本数据库,用于存储用户键鼠或触屏方式传输的文本信息或者经过语音识别将语音信息转换成的文本信息;

所述语音数据库,用于存储来自用户麦克风的语音信息。

进一步,还包括麦克风语音信息融合模块,所述麦克风语音信息融合模块包括麦克风信息采集、语音信息增强和语音信息存储格式;

所述麦克风采集信息,调用不同设备的麦克风采集用户语音信息;

所述语音信息增强,用于对不同设备采集到的不同频率的语音信息进行降噪和融合,

使得用户通过音箱接收到的语音信息更加清晰;

所述语音信息存储格式,将不同麦克风采集到的语音信息转换为统一的格式存储在语音数据库中,设备和用户信息以json格式存储({“name”:“user1”,“device”:“huaweip30”,“time”:“20:40”}),便于用户对信息的管理和查询。

本发明所述多人文本语音转换方法,包括以下步骤:

步骤1、用户经过身份确认;

步骤2、确认身份的用户根据现有设备和所处环境选择适合的交互设备;

步骤3、通过交互设备发送语音信息、文本信息或者语音和文本两种信息;

步骤4、当用户经交互设备发送语音信息时可以直接以语音信息方式发送给对方用户,也可以存储在文本-语音服务器中的用户语音数据库中,经过声纹识别确认所述语音信息由所述用户发送,并且通过语音识别将其转换为文本信息存储在用户文本数据库中,以文本的方式通过显示器传递给对方用户。

进一步,当用户经交互设备发送文本信息时可以直接以文本信息方式发送给对方用户,也可以存储在文本-语音服务器的用户文本数据库中,经过声纹特征库的语音合成技术转换成具有用户声音特征的语音信息,以语音的方式通过音箱传递给对方用户。

再进一步,当用户经交互设备发送语音和文本两种信息给对方用户时,可以将其存储在文本-语音服务器的相应的用户语音数据库和用户文本数据库,然后采用语音识别或者语音合成技术转换成相应的信息模态传递给对方用户。

再进一步,多个用户依次通过设备麦克风发送语音信息,确认用户身份,通过声纹识别确认语音信息为所述用户所发送,将所述用户的语音信息存储在用户语音资料库中。

再进一步,语音资料库中的语音信息通过语音识别技术转化为文本信息,转化后的文本信息和参考文本进行对齐处理获得准确的文本信息。

再进一步,根据用户使用的交互设备从存储模块的语音数据库、文本数据库以及个人资料库中查看历史信息,用户和其语音信息、用户与其文本信息或者用户与其语音和文本信息。

本发明的有益效果:

本发明的多人文本语音转换装置在协同办公场景下,用户确认身份之后,根据现有设备和所处环境来选择适合的交互设备,通过交互设备发送语音、文本或者语音和文本两种信息。用户采用语音方式进行交互,语音信号通过麦克风收集,收集到的语音信息存储在语音数据库中,经声纹识别确认所述语音信息为所述用户所发送,语音数据库中的语音信息通过语音识别转换成对应的文本信息通过显示屏传输给没有麦克风或者处于嘈杂环境下选择文本交互的对方用户;对方采用文本进行交互,将文本信息存储在文本数据库中,文本数据库中的文本信息通过具有声纹特征库的语音合成技术转换成具有用户声音特征的语音信息,通过音箱传输给用户。

附图说明

图1:本发明实施例1的多人文本语音转换方法流程示意图;

图2:本发明实施例2的多人文本语音转换方法流程示意图;

图3:本发明实施例3的多人文本语音转换方法流程示意图;

图4:本发明实施例4的多人文本语音转换方法流程示意图;

图5:本发明实施例5的多人文本语音转换方法流程示意图;

图6:本发明实施例6的多人文本语音转换方法流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案作进一步详细地说明。

实施例1

如图1所示为本发明实施例提供的一种多人文本-语音转换方法的流程图,包括如下步骤:

s101通过麦克风接收来自用户的语音信息;

s102通过声纹识别技术对接收到的语音信息进行用户身份确认并提取语音信息的声音特征;

s103将提取到的具有用户声纹特征的语音信息存放在语音数据库中;

s104将语音数据库中的语音信息通过语音识别技术换成对应的文本信息;

s105文本信息通过显示器将信息传递给用户。

上述技术方案的声纹识别的工作原理为:通过声纹识别对语音降噪处理,去掉原始数据中的背景噪声,从而使提取的声音特征更加准确,去噪之后的语音信号需要经过分帧、加窗、快速傅里叶变化、取对数以及彩色图像映射得到记录声纹特征的语谱图,然后将其与对应的语音一起存储在语音数据库中。

实施例2

如图2所示为本发明实施例提供的一种多人文本-语音转换方法的流程图二,包括如下步骤:

s201通过键鼠或者触屏的交互方式得到的文本信息存储在文本数据库中;

s202文本数据库中的文本信息通过声纹特征库的语音合成技术将文本信息转换成具有用户声音特征的语音信息;

s203语音信息通过音箱设备传递给用户。

实施例3

如图3所示为本发明实施例提供的一种多人文本-语音转换存储管理流程图一,包括如下步骤:

s301多个用户依次通过设备的麦克风发送语音信息;

s302确认用户身份;

s303通过声纹识别确认所述语音信息为该用户所发送;

s304将该用户语音信息存入用户语音资料库中。

实施例4

如图4所示为本发明实施例提供的一种多人文本-语音转换确认模块流程图,包括如下步骤:

s401用户语音资料库中的语音信息通过语音识别技术转换成文本信息;

s402经语音识别转换的文本信息与参考文本进行对齐处理;

s403经过对齐处理后输出准确的文本信息。

实施例5

如图5所示为本发明实施例提供的一种多人文本-语音转换存储管理流程图二,包括如下步骤:

s501用户通过存储模块查看信息管理;

s502存储模块中包括语音数据库、文本数据库和个人资料库;

s503用户根据所选交互设备从存储模块中查看信息管理;

s504通过存储管理可以查看到历史信息用户和其对应的语音信息;

s505通过存储管理可以查看到历史信息用户和其对应的文本信息;

s506通过存储管理可以查看到历史信息用户和其对应的语音和文本信息。

实施例6

如图6所示为本发明实施例提供的一种多人文本-语音转换流程图,包括以下步骤:

s601在协同办公场景下,用户确认身份;

s602用户根据自己的设备或者所处环境选择适合的交互设备;

s603通过交互设备发送语音信息、文本信息或者语音和文本两种信息;

s604当通过交互设备发送语音信息时,可以直接以语音信息进行交互,也可以将语音信息存储在文本-语音服务器中的用户语音数据库中,然后声纹识别确认所述语音信息为所述用户的声音,采用语音识别技术将语音信息转换为文本信息存储在用户文本数据库中通过显示器传递给用户;当通过交互设备发送文本信息时,可以直接以文本方式进行交互,也可以将文本信息存储在文本-语音服务器的用户文本数据库,通过声纹特征库的语音合成技术转换为具有所述用户声音特征的语音信息以音箱为传输介质传递给对方用;当通过交互设备发送语音和文本信息时,可以存储在文本-语音服务器中对应的用户文本数据库和用户语音数据库,经过语音识别或者语音合成技术转换为对方用户所需要的信息模态。

以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips