一种信息处理方法、装置及设备与流程
本发明涉及信息技术领域,尤其涉及一种信息处理方法、装置及设备。
背景技术:
随着电子设备的推广和普及,人们对于电子设备的应用的便利性提出了更高的要求,人们在不方便打开手机进行信息获取或输入时,需要利用语音助手、无障碍语音辅助、有声读物等功能。目前的tts(texttospeech,文本转语音)所利用的合成语音的音色往往是固定的或者是有限的几种语音可以供选择,例如:男声、女声、年轻、成熟等不同特质的语音。可供用户选择的音色是有限的,在用户需要针对不同的信息利用个性化音色进行语音播报时,需要用户参与音色设置,操作较为麻烦,无法实现自动生成较为个性化的音色的语音。此外,预先设置的音色类别是有限的,用户无法实现真正意义上的个性化语音播报,也无法实现根据利用tts得到的语音进行信息来源判断的目的。
技术实现要素:
本发明实施例为了解决信息处理过程中存在的上述问题,创造性地提供一种信息处理方法、装置及设备。
根据本发明第一方面,提供了一种信息处理方法,应用于信息接收端,所述方法包括:接收待处理信息,所述待处理信息包括用于生成语音输出信息的第一信息、用于示出根据所述第一信息生成所述语音输出信息需要使用的语音模型的第二信息;根据所述第一信息和所述第二信息,生成并输出所述语音输出信息。
根据本发明一实施方式,所述根据所述第一信息和所述第二信息,生成并输出所述语音输出信息,包括:根据所述第二信息,获取所述语音模型;根据所述语音模型,对所述第一信息进行语音识别,得到与所述第一信息对应的语音输出信息;输出所述语音输出信息。
根据本发明一实施方式,根据所述第二信息,获取所述语音模型,包括:根据所述第二信息,确定所述语音模型的获取途径为以下至少之一:在所述第二信息包括所述语音模型的完整模型时,确定直接接收所述语音模型;在所述第二信息包括所述语音模型的模型标识时,确定根据所述模型标识查找所述语音模型,其中,所述模型标识用于示出所述待处理信息的来源信息;以及在所述第二信息包括所述语音模型的存储路径时,确定根据所述存储路径,下载所述语音模型;以及根据所确定的获取途径,获取所述语音模型。
根据本发明一实施方式,根据所确定的获取途径,获取所述语音模型,包括:在所确定的获取途径包括两个及以上获取途径时,分别通过多个获取途径中的每一者获取语音模型;检测通过每一者获取的语音模型完整度;在通过其中一者获取到完整的语音模型时,中止通过其他获取途径获取语音模型的操作。
根据本发明一实施方式,所述语音模型的存储路径,包括以下至少之一:所述语音模型在所述信息接收端所属设备上的本地存储路径;所述语音模型在与所述信息接收端通信连接的云存储上的存储路径;所述语音模型在所述信息接收端能够连接的网络平台上的资源链接路径。
根据本发明一实施方式,所述方法还包括:接收语音模型的更新指令,所述更新指令能够示出待更新的语音模型的模型信息的以下至少之一:模型标识、模型更新时间戳、模型版本信息、模型获取途径;响应于所述更新指令,查找待更新的语音模型,并根据查找结果确定是否需要更新与所述更新指令相对应的语音模型;在确定需要更新与所述更新指令相对应的语音模型时,根据所述更新指令,执行以下操作至少之一:更新所述接收端存储的所述语音模型的模型信息;接收与所述更新指令相对应的语音模型。
根据本发明第二方面,还提供了一种信息处理方法,应用于信息发送端,所述方法包括:确定待处理信息的第一信息,所述第一信息用于生成语音输出信息;根据所述第一信息,确定所述待处理信息的第二信息,所述第二信息用于示出根据所述第一信息生成所述语音输出信息需要使用的语音模型;发送所述待处理信息。
根据本发明第三方面,还提供了一种信息处理装置,应用于信息接收端,所述装置包括:信息接收模块,用于接收待处理信息,所述待处理信息包括用于生成语音播报输出信息的第一信息、用于示出根据所述第一信息生成所述语音输出播报信息需要使用的音色语音模型的第二信息;信息处理模块,用于根据所述第一信息和所述音色模型第二信息,生成并输出所述语音播报输出信息。
根据本发明第四方面,还提供了一种信息处理装置,应用于信息发送端,所述装置包括:第一信息确定模块,用于确定待处理信息的第一信息,所述第一信息用于生成语音输出信息;第二信息确定模块,用于根据所述第一信息,确定所述待处理信息的第二信息,所述第二信息用于示出根据所述第一信息生成所述语音输出信息需要使用的语音模型;信息发送模块,用于发送所述待处理信息。
根据本发明第五方面,还提供了一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述信息处理方法。
本发明实施例信息处理方法、装置及设备,在传输信息时,同时传输与所传输信息相对应的语音模型的信息,以使得信息接收端能够根据语音模型,确定并获取语音模型,从而利用该语音模型将所接收的信息生成语音输出信息。如此,在信息接收端没有充足的用于训练语音模型的语音资源的情况下,也能够利用个性化的语音模型生成语音输出信息。同时,语音模型的共享,有效节省了信息接收端训练模型的计算资源及时间成本,能够根据从网络、云平台、信息发送端获取的语音模型,快速生成个性化语音。
需要理解的是,本发明的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例一种信息处理方法的实现流程示意图一;
图2示出了本发明实施例一种信息处理方法的实现流程示意图二;
图3示出了本发明实施例一种信息处理装置的组成结构示意图一;
图4示出了本发明实施例一种信息处理装置的组成结构示意图二;
图5示出了本发明实施例一种设备的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
为了对本发明实施例一种信息处理方法进行较为清楚地说明,举例说明本发明实施例的应用场景。随着移动终端的普及和智能化,例如:手机、平板电脑、笔记本电脑、智能手表等,用户对于移动终端的便利性提出了更好地要求,可能会在开车、做饭以及正在做其他事情的同时,利用移动终端处理事务,例如:查看邮件、短信、微信等。但是,在此过程中,用户不方便用眼睛去查看信息,需要借助移动终端的语音转换技术,将需要处理的信息转换为语音。为了使用户根据所听到的信息能判断信息的发送者,就需要对信息转语音的模型进行个性化定制。
对此,本发明实施例提供了信息发送端发送信息时,同时提供语音模型的相关信息的方法。例如:信息发送端为用户a的手机1,手机1中会存储大量的用户a与他人的通话记录、语音聊天记录等数据,手机1可以根据这些数据训练用于生成符合用户a的音色的语音模型。用户a可以在向用户b的手机2发送短信息、邮件等信息时,同时发送该语音模型。还可以将该语音模型上传至云端、网盘等虚拟存储装置,并在向用户b的手机2发送短信息、邮件等信息时,发送该语音模型的存储路径。需要说明的是,用户a向用户b发送语音模型还是其存储路径,都是在用户无感知的情况下,通过后台发送的。此外,用户b的手机2中所运行的系统也可以通过接收信息的组件判断信息来源,然后根据信息来源从网络平台、网盘、云端等查找相应的语音模型。例如:用户b通过微信应用程序接收用户a发送的信息。
图1示出了本发明实施例一种信息处理方法的实现流程示意图一。
参考图1,本发明实施例信息处理方法,应用于信息接收端,至少包括如下操作流程:操作101,接收待处理信息,待处理信息包括用于生成语音输出信息的第一信息、用于示出根据第一信息生成语音输出信息需要使用的语音模型的第二信息;操作102,根据第一信息和第二信息,生成并输出语音输出信息。
在操作101,接收待处理信息,待处理信息包括用于生成语音输出信息的第一信息、用于示出根据第一信息生成语音输出信息需要使用的语音模型的第二信息。
举例说明,用户b利用手机2接收用户a通过手机1发送的邮件或者微信文本信息,用户b所接收的内容包括文本信息本身和能够生成对应于用户a的音色的语音模型。
用户b利用其手机2的微信或qq等应用程序,接收到用户a通过其手机的相应的应用程序所发送的群聊信息。微信或qq等应用程序可以调用信息发送人的信息,则第一信息为用户b所接收的信息本身,第二信息为信息发送人的信息。可以根据信息发送人的信息,从用户b的手机2查找与信息发送人相应的语音模型。
在操作102,根据第一信息和第二信息,生成并输出语音输出信息。
在本发明一实施方式中,采用以下操作步骤实现根据第一信息和第二信息,生成并输出语音输出信息:根据第二信息,获取语音模型;根据语音模型,对第一信息进行语音识别,得到与第一信息对应的语音输出信息;输出语音输出信息。
在本发明一实施方式中,采用以下操作步骤实现根据第二信息,获取语音模型:根据第二信息,确定语音模型的获取途径为以下至少之一:在第二信息包括语音模型的完整模型时,确定直接接收语音模型;在第二信息包括语音模型的模型标识时,确定根据模型标识查找语音模型,其中,模型标识用于示出待处理信息的来源信息;以及在第二信息包括语音模型的存储路径时,确定根据存储路径,下载语音模型;以及根据所确定的获取途径,获取语音模型。
举例说明,第一信息为用户b手机2接收的用户a通过手机1发送的微信文本信息,用户a发送信息时可以直接发送与用户a音色相对应的语音模型作为第二信息。此时,用户b手机2接收到的第一信息为微信文本信息,第二信息为语音模型本身,可以根据语音模型对微信文本信息直接进行语音识别,并输出语音。例如:利用tts(texttospeech,从文本到语音)进行语音识别,将从用户a接收的微信文本信息转换为语音信息进行播放。
如此,用户b所能够听到的语音输出信息为根据用户a的语料所训练的语音模型转换的。用户b可以根据语音输出信息直接判断出信息来源。例如:对于某个聊天群或者会议讨论群等正在进行聊天过程,用户b在开车等过程中也可以非常方便地通过语音播放获取到群聊天信息,并且能根据每条信息转换为语音输出信息时使用的语音模型不同,判断信息来源。而无需通过手机屏幕查看文本信息。有效提升了用户体验。
其中,对于第二信息包括语音模型的完整模型时,可以直接接收语音模型,并利用所接收的语音模型生成语音输出信息。
对于第二信息包括语音模型的模型标识时,可以根据模型标识查找语音模型,其中,模型标识可以用于示出待处理信息的来源信息。例如:模型标识能够示出邮件发件人、微信或短信发信人、接收的文章作者等。通常应用程序中可以通过api调用可以直接获取邮件发件人、微信或短信发信人等信息,例如:邮箱、微信、短信息等应用程序。此时,可以根据模型标识从网站、云端、本地等查找并确定语音模型。此外,在微信或qq等群聊过程中,还可以通过参与群聊的用户获取语音模型,例如:用户a、b、c、d、e……等多个用户参与群聊,用户b可以从用户c、d或e的手机端获取用于对应于用户a所发送的文本信息的语音模型。
对于第二信息包括语音模型的存储路径的,可以根据存储路径,下载语音模型。其中,存储路径可以是网址、网盘链接等。
在本发明一实施方式中,语音模型的存储路径,包括以下至少之一:语音模型在信息接收端所属设备上的本地存储路径;语音模型在与信息接收端通信连接的云存储上的存储路径;语音模型在信息接收端能够连接的网络平台上的资源链接路径。
在本发明一实施方式中,在所确定的获取途径包括两个及以上获取途径时,分别通过多个获取途径中的每一者获取语音模型;检测通过每一者获取的语音模型完整度;在通过其中一者获取到完整的语音模型时,中止通过其他获取途径获取语音模型的操作。
举例说明,用户b接收的手机2接收到用户a手机1发送的微信文本信息和对应于用户a的语音模型的完整模型,并且接收到该语言模型的存储路径为某一网盘链接。用户b可以在从用户a手机1接收语音模型的同时,从所接收的网盘链接下载语音模型,在通过其中一种方式获取到完整语音模型时,停止另一种方式的语音模型接收。例如:用户b通过网盘链接获取到语音模型并下载完成,则此时用户b中断从用户a手机1接收语音模型。
用户b可以在利用从网盘下载的语音模型成功识别用户a发送的微信文本信息后,自动删除从用户a缓存的语音模型,也可以在利用从网盘下载的语音模型对用户a发送的微信文本信息进行语音识别识别后,再次跟进从用户a缓存的语音模型的进度,继续缓存语音模型。
在本发明一实施方式中,还接收语音模型的更新指令,响应于更新指令,查找待更新的语音模型,并根据查找结果确定是否需要更新与更新指令相对应的语音模型;在确定需要更新与更新指令相对应的语音模型时,根据更新指令,执行以下操作至少之一:更新接收端存储的语音模型的模型信息;接收与更新指令相对应的语音模型。其中,更新指令能够示出待更新的语音模型的模型信息的以下至少之一:模型标识、模型更新时间戳、模型版本信息、模型获取途径。
举例说明,这是语音模型被动更新的一种方式,信息接收端接收信息发送端所发送的模型更新指令,并响应于模型更新指令,查找本地缓存或云存储中是否配置或缓存有与模型更新指令相应的语音模型,如果有,获取更新后的模型,以更新语音模型。
例如:用户a生成新的语音模型并发布语音模型更新指令;用户b接收到模型更新指令,在本地缓存查找相应的语音模型;如果用户b没有查到相应的语音模型或者响应于该模型更新指令判定需要更新相应的语音模型,可以向用户a请求发送相应的语音模型;用户a接到用户b所发出的语音模型请求后,发送相应的语音模型至用户b;用户b将所接收到的模型添加到本地缓存或云存储。如此,用户b在具有tts语音应用时,则可以通过设备本地缓存库查找到相应的语音模型进行应用。
在本发明一实施方式中,信息接收端还可以进行模型主动更新。具体来讲,信息接收端可以将语音模型存储在设备本地或云端,通过缓存失效机制保证存储空间开销及模型时效性的均衡。例如:设定每间隔设定时间,获取设备本地或云端所存储的语音模型的版本信息,版本信息可以是更新时间或版本号等,根据版本信息确定是否需要进行更新,在确定需要对语音模型进行更新时从云存储或网站、网盘链接等将语音模型缓存至设备本地。还可以通过版本信息判断语音模型是否失效,例如:如果版本信息示出语音模型的更新时间早于当前时间之前的设定时间段,则判定相应的语音模型失效,此时,可以删除语音,或发出提醒信息等。
图2示出了本发明实施例一种信息处理方法的实现流程示意图二。
参考图2,本发明实施例信息处理方法,还提供了一种信息处理方法,应用于信息发送端,方法包括:操作201,确定待处理信息的第一信息,第一信息用于生成语音输出信息;操作202,根据第一信息,确定待处理信息的第二信息,第二信息用于示出根据第一信息生成语音输出信息需要使用的语音模型;操作203,发送待处理信息。
在操作201,确定待处理信息的第一信息,第一信息用于生成语音输出信息。
举例说明,用户a需要向用户b发送微信信息或者邮件。用户a的手机1需要确定微信信息或邮件的内容。
在操作202,根据第一信息,确定待处理信息的第二信息,第二信息用于示出根据第一信息生成语音输出信息需要使用的语音模型。
举例说明,用户a需要向用户b转发一条文章链接消息,文章链接消息的内容用户c的原创内容。则用户a的手机1作为信息发送端,需要发送的第一信息为文章链接消息,根据文章链接消息确定的第二信息用于示出基于用户c的音色进行语音识别的语音模型。此时,第二信息可以为用户a的手机1设备本地存储的用户c的语音模型,也可以是用户c的语音模型的存储路径。
这里,用户c的语音模型可以是用户c在其设备本地进行训练得到的语言模型,并发送至用户a的手机1。也可以是用户a根据与用户c的通话记录、语音聊天记录等语料资源,在用于a的设备本地进行训练的语音模型。
在操作203,发送待处理信息。
将操作201和操作202中所确定的第一信息和第二信息同时发送至信息接收端。
本发明实施例信息处理方法、装置及设备,在传输信息时,同时传输与所传输信息相对应的语音模型的信息,以使得信息接收端能够根据语音模型,确定并获取语音模型,从而利用该语音模型将所接收的信息生成语音输出信息。如此,在信息接收端没有充足的用于训练语音模型的语音资源的情况下,也能够利用个性化的语音模型生成语音输出信息。同时,语音模型的共享,有效节省了信息接收端训练模型的计算资源及时间成本,能够根据从网络、云平台、信息发送端获取的语音模型,快速生成个性化语音。
同理,基于上文实体抽取方法,本发明实施例还提供一种信息处理装置,应用于信息接收端,图3示出了本发明实施例一种信息处理装置的组成结构示意图一,如图3所示,装置30包括:信息接收模块301,用于接收待处理信息,待处理信息包括用于生成语音播报输出信息的第一信息、用于示出根据第一信息生成语音输出播报信息需要使用的音色语音模型的第二信息;信息处理模块302,用于根据第一信息和音色模型第二信息,生成并输出语音播报输出信息。
进一步的,基于上文实体抽取方法,本发明实施例还提供一种信息处理装置,应用于信息发送端,图4示出了本发明实施例一种信息处理装置的组成结构示意图二,参考图4,装置40包括:第一信息确定模块401,用于确定待处理信息的第一信息,第一信息用于生成语音输出信息;第二信息确定模块402,用于根据第一信息,确定待处理信息的第二信息,第二信息用于示出根据第一信息生成语音输出信息需要使用的语音模型;信息发送模块403,用于发送待处理信息。
更进一步,基于如上文知识图谱构建方法,本发明实施例还提供一种设备,图5示出了本发明实施例一种设备的组成结构示意图。参考图5,设备50包括至少一个处理器501、以及与处理器501连接的至少一个存储器502、总线503;其中,处理器501、存储器502通过总线503完成相互间的通信;处理器501用于调用存储器502中的程序指令,至少执行如下的操作步骤:操作101,接收待处理信息,待处理信息包括用于生成语音输出信息的第一信息、用于示出根据第一信息生成语音输出信息需要使用的语音模型的第二信息;操作102,根据第一信息和第二信息,生成并输出语音输出信息。
这里需要指出的是:以上对针对实体抽取装置实施例的描述,与前述图1至2所示的方法实施例的描述是类似的,具有同前述图1至2所示的方法实施例相似的有益效果,因此不做赘述。对于本发明实体抽取装置实施例中未披露的技术细节,请参照本发明前述图1至2所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(readonlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除