声音表情的应用方法、装置、设备及可读存储介质与流程
本发明涉及互联网技术领域,更具体地,涉及一种声音表情的应用方法、装置、设备及可读存储介质。
背景技术:
随着互联网技术的飞速发展和智能终端的普及,越来越多的用户习惯于通过智能手机、掌上电脑、平板电脑这类终端设备上安装的、提供即时聊天服务或留言评论服务的社交应用(例如微信、qq、微博、博客等)进行社交。
用户在使用这些社交应用进行交流时,可以通过社交应用提供的聊天窗口或者留言窗口,输入文字、语音、图片等内容与其他用户进行互动交流实现社交,同时,用户还可以使用社交应用提供的或者支持的图片表情,来表达在与其他用户进行交流时的自身情绪或感情,使得交流更为简洁生动。
但是,在用户不通过输入文字或者图片进行交流的社交场景中,目前的社交应用只能提供用户发送语音进行交流的功能,用户无法在使用社交应用进行语音交流的过程中,直接使用表情这种简洁、生动地方式来表达自身的情绪或情感,难以实际满足自身在语音交流中的情绪或情感表达需求。
技术实现要素:
本发明的一个目的是提供一种用于应用声音表情的新技术方案。
根据本发明的第一方面,提供了一种声音表情的应用方法,其中,包括:
提供表情选择界面,展示可供用户选择的声音表情;
接收用户的表情选择指示,确定对应的目标声音表情;
在与所述目标声音表情关联的关联应用窗口中,播放所述目标声音表情。
可选地,每个所述声音表情具有对应的情感特征以及声音内容;所述情感特征至少包括情感类型以及情感程度;
所述方法还包括:
根据用户输入的关联语音数据,获取用户的语音情感特征;所述语音情感特征至少包括语音情感类型以及语音情感程度;
根据所述语音情感特征,从包括多个声音表情的声音表情数据库中,选择所述感情特征与所述语音情感特征对应的声音表情,作为通过所述表情选择界面展示的声音表情。
可选地,所述根据用户输入的关联语音数据,获取用户的语音情感特征的步骤包括:
对所述关联语音数据进行语音分析,得到所述关联语音数据的音调特征、音量特征以及节奏特征;
根据情感特征提取模型,对所述关联语音数据的音调特征、音量特征以及节奏特征进行处理,得到对应的所述语音情感特征;
其中,所述情感特征提取模型是通过采集语音样本训练获取的机器学习模型,用于根据输入的语音的所述音调特征、音量特征以及节奏特征,输入对应的所述语音情感特征。
可选地,所述根据用户输入的关联语音数据,获取用户的语音情感特征的步骤包括:
将所述关联语音数据转换对对应的关联文本数据;
根据预先构建的情感词库,从所述关联文本数据中,提取情感关键词;
通过情感结构化模型,对所述情感关键词进行结构化分析,得到对应的所述语音情感特征;
其中,所述情感结构化模型是通过对采集的与情感相关的情感词汇进行分类并结构化组织得到的词汇模型;所述情感结构化模型中包括的每个情感词汇都具有对应的情感类型以及情感程度。
可选地,所述提供表情选择界面,展示可供用户选择的声音表情的步骤包括:
根据所述声音表情的所述情感特征,生成对应的声音波形以展示所述声音表情;
和/或,
所述表情选择指示是用户输入的语音选择指示。
可选地,每个所述声音表情具有对应的情感特征以及声音内容;所述情感特征至少包括情感类型以及情感程度;所述声音表情包括语音表情和音效表情;所述语音表情的所述声音内容是与所述语音表情的情感特征对应的语音;所述音效表情的所述声音内容是与所述音效表情的情感特征对应的音效;
所述在与所述目标声音表情关联的关联应用窗口中,播放所述目标声音表情的步骤包括:
当所述目标声音表情是所述语音表情时,在所述关联应用窗口中播放与所述目标声音表情关联的用户语音过程中,根据所述目标声音表情在所述用户语音中的插入位置,播放所述目标声音表情;
当所述目标声音表情是所述音效表情时,将与所述目标声音表情关联的用户语音与所述目标声音表情混音合成后,在所述关联应用窗口中播放。
可选地,所述方法还包括:
响应于用户的声音表情生成请求,根据用户输入的声音内容,生成对应的所述声音表情,以供用户选择使用。
根据本发明的第二方面,提供一种声音表情的应用装置,其中,包括:
表情提供单元,用于提供表情选择界面,展示可供用户选择的声音表情;
表情确定单元,用于接收用户的表情选择指示,确定对应的目标声音表情;
表情播放单元,用于在与所述目标声音表情关联的关联应用窗口中,播放所述目标声音表情。
根据本发明的第三方面,提供一种声音表情的应用设备,其中,包括:
显示装置;
存储器,用于存储可执行的指令;
处理器,用于根据所述可执行的指令的控制,运行所述声音表情的应用设备执行如本发明的第一方面所述的声音表情的应用方法。
根据本发明的第四方面,提供一种可读存储介质,其中,其中,所述可读存储介质存储有可被计算机读取执行的计算机程序,所述计算机程序用于在被所述计算机读取运行时,执行如本发明的第一方面所述的声音表情的应用方法。
根据本公开的一个实施例,提供表情选择界面展示可供选择的、具有对应的情感特征以及声音内容的声音表情,在接收用户的表情选择指示后,确定用户选择的目标声音表情,并在与目标声音表情关联的关联应用窗口中,播放目标声音表情,令用户在通过语音交流的过程中,可以直接通过声音表情,生动简洁地表达自身的情绪或感受,满足用户在语音交流中的情绪或情感表达需求,提升用户的语音交流体验。尤其适用于语音聊天、语音留言或者语音评论等应用场景。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是显示可用于实现本发明的实施例的电子设备的硬件配置的例子的框图。
图2示出了本发明的实施例的声音表情的应用方法的流程图。
图3是表情选择界面展示声音表情的例子的示意图。
图4是根据用户的声音表情生成请求生成声音表情的例子的示意图。
图5是在语音聊天场景中应用声音表情的例子的示意图。
图6是在语音评论场景中应用声音表情的例子的示意图。
图7示出了本发明的实施例的声音表情的应用装置3000的框图。
图8示出了本发明的实施例的声音表情的应用设备4000的框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。
电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器cpu、微处理器mcu等。存储器1200例如包括rom(只读存储器)、ram(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括usb接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括wifi通信、蓝牙通信、2g/3g/4g/5g通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项声音表情的应用方法。本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<实施例>
本实施例中的总体构思是提供一种声音表情的应用方案,提供表情选择界面展示可供选择的、具有对应的情感特征以及声音内容的声音表情,在接收用户的表情选择指示后,确定用户选择的目标声音表情,并在与目标声音表情关联的关联应用窗口中,播放目标声音表情,令用户在通过语音交流的过程中,可以直接通过声音表情,生动简洁地表达自身的情绪或感受,满足用户在语音交流中的情绪或情感表达需求,提升用户的语音交流体验。尤其适用于语音聊天、语音留言或者语音评论等应用场景。
<方法>
在本实施例中,提供一种声音表情的应用方法,如图2所示,包括:步骤s2100-s2300。
步骤s2100,提供表情选择界面,展示可供用户选择的声音表情。
该表情选择界面是可供用户通过点击、滑动、勾选等手势操作或者语音、文字输入进行交互,选择界面中所展示的声音表情的人机交互界面,例如,可以如图3所示。
在本实施例中,每个声音表情具有对应的声音内容。
声音内容是声音表情具体播放时的具体内容。在本实施例中,声音表情的声音内容符合预设的声音时长,将声音内容限定在对应的声音时长内,可以避免声音表情影响用户的正常语音交流,该声音时长可以根据具体的应用场景或者应用需求设置,例如,设置为1秒。
在本实施例中,声音表情的声音内容可以根据其要表达的内容,具有不同的内容分类。例如,声音内容可以分为情绪表达类、话术回应类、动作表达类、状态表达类。情绪表达类的声音内容可以用于表达特定的情绪,例如开心、尴尬、安慰等等。话术回应类的声音内容可以是针对一些特定的前文设计的声音回应内容,例如,针对道歉设计的“对不起”、针对再见设计的“拜拜”等。动作表达类的声音内容可以是通过声音模拟或者直接输出某些特定动作的声音内容,例如,直接用声音模拟口哨声或者录制声音说“反弹一万倍”等等。状态表达类的声音内容用于表达用户当前的状态,例如“我在吃饭”、“我要洗澡去啦”等等。
每个声音表情可以具有对应的情感特征。
情感特征是对应的声音表情体现的情感或者情绪的特性。情感特征可以包括情感类型以及情感程度。情感类型可以是根据人类的情感及情绪分类预先设置的类型,例如情感类型可以包括生气、快乐、哀伤、欢喜等,情感程度可以包括对应的情感类型的情感程度,例如生气这一情感类型可以包括狂怒、发火、微怒等不同程度的生气情绪。根据具体的应用场景或者应用需求,情感特征还可以包括其他内容,例如还可以包括表情主题,针对不同使用表情的场景设置,例如包括新年红包主题、开学主题等等。
在本实施例中,可供用户选择的声音表情,可以根据具体的应用需求,由在支持播放声音表情的电子设备的操作系统或者支持播放声音表情的应用系统,自动内置录制生成,或者,还可以由特定的声效人员、配音人员(例如某些明星等)根据指定的内容录制生成。
在一个例子中,本实施例中提供的声音表情的应用方法,还包括:
响应于用户的声音表情生成请求,根据用户输入的声音内容,生成对应的声音表情,以供用户选择使用。
声音表情生成请求是用户触发的、请求生成声音表情的指令,可以由用户通过点击或者勾选对应的功能按钮、手势选择功能项等人机交互操作或者语音指令输入等方式触发发送。例如,如图4所示,可以通过提供功能按钮供用户点击触发发送声音表情生成请求。
此外,如图4所示,本例中可以响应于该声音表情生成请求,提供提示框指引用户输入声音内容,还可以引导用户配置声音表情对应的情感特征,根据用户输入的声音内容以及配置的声音表情的情感特征,生成对应的声音表情,并提供声音表情的试听,令用户确认是否能作为声音表情保存,当用户确认后,保存生成的声音表情,以供用户此后选择使用。
通过本例,可以根据用户自身的表情使用需求,生成对应的声音表情,实现声音表情的定制,灵活地满足用户对声音表情的个性化需求。
在本实施例中,通过表情选择界面展示的可供用户选择的声音表情,可以是所有可供选择的声音表情,为了避免用户在大量声音表情中花费较多时间选择,还可以将用户常用的声音表情优先展示给用户选择,以提高用户的选择效率。
而在一个例子中,每个声音表情可以具有对应的情感特征以及声音内容,本实施例中的步骤s2100还可以包括:步骤s2110-步骤s2120。
步骤s2110,根据用户输入的关联语音数据,获取用户的语音情感特征。
在本例中,关联语音数据是用户期望使用声音表情表达对应的情感或者情绪的语音数据。例如,在语音聊天的场景下,关联语音数据是用户期望使用声音表情的一句语音;在语音留言的场景下,关联语音数据是用户输入的、期望使用声音表情的语音留言;在语音评论的场景下,关联语音数据是用户输入的、期望使用声音表情的语音评论。
在本例中,语音情感特征是关联语音数据体现的情感或者情绪特征。语音情感特征至少包括语音情感类型以及语音情感程度。语音情感特征与上述声音表情的情感特征类似,对应的,语音情感类型与上述声音表情的情感类型类似划分,语音情感程度与上述声音表情的情感程度类似,在此不再赘述。
在一个更具体的例子中,步骤s2110可以包括:步骤s2111-s2112。
步骤s2111,对关联语音数据进行语音分析,得到关联语音数据的音调特征、音量特征以及节奏特征。
对关联语音数据进行语音分析,可以使用常用的语音信号分析手段,确定关联语音数据的音调高低、音量大小、节奏快慢等,对应得到关联语音数据的音调特征、音量特征以及节奏特征。
而关联语音数据的音调高低、音量大小、节奏快慢等可以在一定程度上体现语音中蕴含的情绪或感受,例如,体现哀伤的情绪的语音通常音量较小、音调较低、节奏较慢等,通过关联语音数据的音调特征、音量特征以及节奏特征,可以结合后续步骤,获取关联语音数据体现的语音情感特征。
步骤s2212,根据情感特征提取模型,对关联语音数据的音调特征、音量特征以及节奏特征进行处理,得到对应的语音情感特征。
情感特征提取模型是通过采集语音样本训练获取的机器学习模型,用于根据输入的语音的音调特征、音量特征以及节奏特征,输入对应的语音情感特征。具体地,可以预先采集大量的语音样本,每个语音样本具有对应的音量、音调以及节奏,体现预设的语音情感特征,通过大量的语音样本进行训练,训练可以通过例如卷积神经网络等常用于训练机器学习模型的训练网络来实现,最终训练获取得到的情感特征提取模型,可以根据输入的语音的音调特征、音量特征以及节奏特征,识别该语音体现的语音情感特征并输出。
利用大量语音样本训练得到的情感特征提取模型,识别得到关联语音数据体现的语音情感特征,可以精准、有效地提取关联语音数据所体现的用户当下的情绪或感受。
在另一个更具体的例子中,步骤s2110可以包括:步骤s21101-s21103。
步骤s21101,将关联语音数据转换对对应的关联文本数据。
在本例中,可以将关联语音数据通过语音识别引擎或者语音转文本的工具、插件等,得到对应的关联文本数据。
步骤s21102,根据预先构建的情感词库,从关联文本数据中,提取情感关键词。
情感词库中包括多个分别体现不同的人类情感或者人类情绪的情感词汇。本例中可以通过人工或者机器挖掘这些情感词汇,构建情感词库。
根据该情感词库,可以将关联文本数据进行分词得到的词汇与情感词库中包括的情感词汇通过余弦相似度等方法进行相似度分析,提取相似度高于预设的相似度阈值的情感词汇作为情感关键词。
步骤s21103,通过情感结构化模型,对情感关键词进行结构化分析,得到对应的语音情感特征。
情感结构化模型是通过对采集的与情感相关的情感词汇进行分类并结构化组织得到的词汇模型。情感结构化模型中包括的每个情感词汇都具有对应的情感类型以及情感程度。
在本例中,可以对预先通过人工或者机器挖掘得到的情感词汇,根据人类情感或者人类情绪进行不同层次的分类,例如,根据每种情感类型进分为大类,每个大类里包括属于相同情感类型的情感词汇,在每个大类里再按情感程度的不同,进一步细分为不同的小类,每个小类下可根据情感程度的高低对情感词汇进行排序,形成不同分类层次的结构,以此组织情感词汇对应的得到情感结构化模型。
通过情感结构化模型,对情感关键词进行结构化分析,可以在情感结构化模型查找到与情感关键词对应的情感词汇,根据该情感词汇的情感类型以及情感程度,得到语音情感特征。
在本例中,通过预设的情感词库从与关联语音数据对应的关联文本数据中提取情感关键词,再通过对情感词汇进行层次结构组织得到的情感结构化模型,对情感关键词进行结构化分析,得到语音情感特征,可以无需采集大量语音样本,通过较为简单的结构化分析手段,快速、有效地获取关联语音数据体现的语音情感特征。
在实际应用中,基于本实施例中公开的上述获取关联语音数据体现的语音情感特征的两个例子,本领域技术人员可以根据具体的应用场景或者应用需求选择其中任意一种实施,或者,为了获取更精准的语音情感特征,可以同时实施上述两个例子,分别获取关联语音数据体现的语音情感特征,将两个例子中的得到语音情感特征的重合部分抽取出来,作为最终的语音情感特征。
在通过上述步骤s2110获取用户的语音情感特征后,进入:
步骤s2120,根据语音情感特征,从包括多个声音表情的声音表情数据库中,选择感情特征与语音情感特征对应的声音表情,作为通过表情选择界面展示的声音表情。
在本例中,可以通过支持播放声音表情的操作系统或者应用系统内置生成、通过特定人员录音生成或者根据用户的请求定制化生成各种声音表情,以此构建包括多个声音表情的声音表情数据库。
声音表情的感情特征体现声音表情使用时表达的情绪或感受。语音情感特征体现的是用户输入的、期望使用声音表情的关联语音数据中所隐患的情绪或感受。从声音表情数据库中选取感情特征与语音情感特征对应的声音表情,作为通过表情选择界面展示的声音表情,可以缩小声音表情的展示范围,令用户能更快速、高效地选取到符合自身情感或者情绪表达需求的声音表情,提升用户的声音表情使用体验。
应当理解的是,在实际应用中,为了更好地满足用户的声音表情使用体验,可以从声音表情数据库中,选择感情特征与语音情感特征对应的声音表情进行优先展示,当用户未能选中声音表情时,再展示声音表情数据库中其他的声音表情进行展示,以期最终能满足用户的声音表情使用需求。
在本实施例中,可以采用各种方式在表情选择界面中展示声音表情,例如,可以通过对每个声音表情使用可区分的图标、编号来展示声音表情,或者,还可以通过声音表情的声音内容的关键字来展示声音表情等等。在展示声音表情时,还可以提供试听功能供用户播放声音表情进行试听后,选择声音表情。
具体的一个例子中,步骤s2100可以包括:
根据声音表情的情感特征,生成对应的声音波形以展示声音表情。
声音表情的情感特征包括情感类型和情感程度。在本例中,可以根据情感类型设置声音波形的颜色,根据情感程度设置声音波形的形状(波形幅度大小、波形周期等),根据设置的声音波形的颜色和形状,可以生成对应的声音波形。例如,如图3所示,声音表情1的情感特征是“生气”、情感程度是“微怒”的声音表情,通过黑色的、幅度较小的声音波形展示,声音表情2的情感特征是“喜悦”,情感程度是“高兴坏了”的声音表情,可以通过浅色的、幅度较大的声音波形展示,等等。
通过根据声音表情的情感特征生成的声音波形来展示声音表情,可以令用户能直观、快速地了解声音表情所体现的情感特征,更为便捷地选择符合自身表情使用需求的声音表情。
在上述步骤s2100通过表情选择界面展示声音表情之后,进入:
步骤s2200,接收用户的表情选择指示,确定对应的目标声音表情。
用户的表情选择指示用于指示用户在表情选择界面中选中哪个声音表情作为目标声音表情。
在本实施例中,表情选择指示可以根据用户实施在表情选择界面上的点击、勾选、滑动手势等操作触发。
在一个例子中,表情选择指示是用户输入的语音选择指示。该语音选择指示可以是指示选择的目标声音表情的编号、关键字的语音等。
通过语音选择指示来选择声音表情,可以令用户无需手动操作,直接通过语音指令选择声音表情,在纯语音交流过程中使用声音表情更为顺畅,效率更高。
在上述步骤s2200确定用户选择的目标声音表情之后,进入:
步骤s2300,在与目标声音表情关联的关联应用窗口中,播放目标声音表情。
关联应用窗口是待播放目标声音表情的关联应用中提供的应用窗口。例如,目标声音表情是在语音聊天中使用,关联应用窗口是提供语音聊天服务的社交应用提供的聊天窗口;目标声音表情是在语音留言中使用,关联应用窗口是提供语音留言服务的应用提供的留言窗口;目标声音表情是在语音评论中使用,关联应用窗口是提供语音评论服务的应用提供的评论窗口。
在与目标声音表情关联的关联应用窗口中,播放目标声音表情,可以令用户在通过语音交流的过程中,可以直接通过声音表情,生动简洁地表达自身的情绪或感受,满足用户在语音交流中的情绪或情感表达需求,提升用户的语音交流体验。尤其适用于语音聊天、语音留言或者语音评论等应用场景。
在一个例子中,声音表情包括语音表情和音效表情;语音表情的声音内容是与语音表情的情感特征对应的语音;音效表情的声音内容是与音效表情的情感特征对应的音效。在这个例子中,本实施例中的声音表情的应用方法的步骤s2300可以包括:步骤s2310-s2320。
步骤s2310,当目标声音表情是语音表情时,在关联应用窗口中播放与目标声音表情关联的用户语音过程中,根据目标声音表情在用户语音中的插入位置,播放目标声音表情。
与目标声音表情关联的用户语音,是用户输入的、期望通过使用目标声音表情表达该用户语音的情绪或情感的语音数据。例如,目标声音表情是在语音聊天中使用,与目标声音表情关联的用户语音是用户输入的、期望使用目标表情的聊天语音;目标声音表情是在语音留言中使用,与目标声音表情关联的用户语音是用户输入的、期望使用目标表情的语音留言;目标声音表情是在语音评论中使用,与目标声音表情关联的用户语音是用户输入的、期望使用目标表情的语音评论。
当目标声音表情是语音表情时,该语音表情的声音内容是与语音表情的情感特征对应的语音,是有语言内容的声音表情。用户通常期望通过语音表情播放时的语言内容来表达自身的情绪或感受。该语音表情在被用户选择使用时,通常具有对应的在用户语音中的插入位置,例如,在语音聊天中,可以是用户当前输入的一句聊天语音中的开始、中间或者末尾,在语音留言或者语音评论也类似。
根据作为目标声音表情的语音表情在与其关联的用户语音中的插入位置,播放语音表情,可以在用户语音中插入播放具有语言内容的语音表情,表达用户在语音交流中期望表达的情绪或感受。例如,作为目标声音表情的语音表情的语言内容是“比心”,用户在语音聊天场景下,在一句语音聊天的末尾插入该语音表情,对应的,接收该句语音聊天的用户在关联的语音聊天窗口中播放该句语音聊天时,会在该句语音聊天的末尾听到语音表情“比心”,直观地体会到发送该句语音聊天的用户所表达的情绪或感受。
步骤s2320,当目标声音表情是音效表情时,将与目标声音关联的用户语音与音效表情混音合成后,在关联应用窗口中播放。
与目标声音表情关联的用户语音,与上述步骤s2310类似,在此不再赘述。
当目标声音表情是音效表情时,该音效表情的声音内容是与音效表情的情感特征对应的音效,是没有语言内容的声音表情。该音效表情在被用户选择使用时,是期望通过音效表情播放时所产生的音效来表达自身的情绪或感受。将与目标声音表情关联的用户语音与目标声音表情混音合成后,使得作为目标声音表情的音效表情成为用户语音的音效背景,在关联应用窗口中播放时,使得用户语音具有音效表情形成的音效,表达用户在语音交流中期望表达的情绪或感受。例如,作为目标声音表情的音效表情的音效是哄堂大笑的笑声特效,用户在语音聊天场景下,在一句语音聊天中使用该音效表情,对应的,接收该句语音聊天的用户在关联的语音聊天窗口中播放该句语音聊天时,会听到带有哄堂大笑的笑声特效作为音效的该句语音聊天,直观地体会到发送该句语音聊天的用户所表达的情绪或感受。
在本例中,可以区分不同类型的声音表情采用不同的声音表情的播放方式,更为灵活地通过声音表情满足用户在语音交流过程中不同的声音表情需求。
在实际应用场景下,用户在语音交流过程中可以直接使用声音表情,而不关联用户自身输入的用户语音,例如,用户在语音评论时直接选择目标声音表情作为自己的评论,或者在语音聊天时直接选择目标声音表情作为聊天语音发给其他用户,此时可以不执行上述步骤s2310-s2320,而是在关联应用窗口中直接播放该目标声音表情。
<应用例子1>
以下将结合图5进一步说明在语音聊天场景中,本实施例中提供的声音表情的应用方法。
在本例中,假设用户a要发一句聊天语音给用户b。
如图5所示,该声音表情的应用方法包括:步骤s201-s206。
步骤s201,用户a在语音聊天窗口中,输入要发送给b的聊天语音。
假设用户a输入的聊天语音是“好喜欢你”。
步骤s202,接收到用户a的聊天语音,弹出对话框供用户a确认是否使用声音表情。
步骤s203,接收用户a使用声音表情的确认,通过表情选择界面展示声音表情供用户选择。
在本例中,通过表情选择界面展示的声音表情可以通过如上述步骤s2110-s2120中从预先构建的声音表情数据库中选择。声音表情数据库可以包括持播放声音表情的操作系统或者应用系统内置生成、通过特定人员录音生成以及根据用户的请求定制化生成各种声音表情。
步骤s204,接收用户a选择目标声音表情的语音指示,选中目标声音表情。
假设本例中选中的目标声音表情是语音表情,声音内容是“比心”,用户a选择目标声音表情时已经录入聊天语音,因此,声音表情对应的插入位置是聊天语音的末尾。
步骤s205,将目标声音表情插入用户a输入的聊天语音中,发送给用户b。
本例中,将语音表情“比心”插入聊天语音“好喜欢你”的末尾,发送给用户b。
步骤s206,用户b接收到用户a发送的聊天语音,在语音聊天窗口中播放插入目标声音表情的聊天语音。
在本例中,用户b听到的聊天语音是“好喜欢你比心”。
通过在语音聊天场景中,提供声音表情给用户选择使用,可以令用户在语音交流过程中,直接通过声音表情,生动简洁地表达自身的情绪或感受,满足用户在语音交流中的情绪或情感表达需求。
在语音留言、录音等场景下实施本实施例中的声音表情的应用方法,与本例中在语音聊天场景下类似,在此不再赘述。
<应用例子2>
以下将结合图6进一步说明在语音评论场景中,本实施例中提供的声音表情的使用方法。
如图6所示,该声音表情的应用方法包括:步骤s211-s216。
步骤s211,用户a在文章w的评论窗口中,输入评论语音。
假设在本例中,用户a输入的评论语音是“这篇文章太棒啦”。
步骤s212,接收到用户b的评论语音,弹出对话框供用户确认是否使用声音表情。
步骤s213,接收用户a使用声音表情的确认,通过表情选择界面展示声音表情供用户选择。
在本例中,通过表情选择界面展示的声音表情可以通过如上述步骤s2110-s2120中从预先构建的声音表情数据库中选择。声音表情数据库可以包括持播放声音表情的操作系统或者应用系统内置生成、通过特定人员录音生成以及根据用户的请求定制化生成各种声音表情。
步骤s214,接收用户a选择目标声音表情的语音指示,选中目标声音表情。
假设本例中选中的声音表情是音效表情,声音内容是哈哈大笑的特效。
步骤s215,将目标声音表情与用户a输入的评论语音混音合成后发表。
本例中,将具有哈哈大笑特效的音效表情与评论语音“这篇文章太棒啦”混音合成后发表。
步骤s216,用户b浏览文章w的评论,点击用户a的评论语音,在评论窗口中播放。
在本例中,用户b听到的评论语音是具有哈哈大笑的音效的“这篇文章太棒啦”。
<声音表情的应用装置>
在本实施例中,还提供一种声音表情的应用装置3000,如图7所示,包括:表情提供单元3100、表情确定单元3200以及表情播放单元3300,用于本实施例中提供的声音表情的应用方法,在此不再赘述。
表情提供单元3100,用于提供表情选择界面,展示可供用户选择的声音表情。
可选地,;每个所述声音表情具有对应的情感特征以及声音内容;所述情感特征至少包括情感类型以及情感程度;表情提供单元3100还包括:
用于根据用户输入的关联语音数据,获取用户的语音情感特征的装置;所述语音情感特征至少包括语音情感类型以及语音情感程度;
用于根据所述语音情感特征,从包括多个声音表情的声音表情数据库中,选择所述感情特征与所述语音情感特征对应的声音表情,作为通过所述表情选择界面展示的声音表情的装置。
可选地,用于根据用户输入的关联语音数据,获取用户的语音情感特征的装置还用于:
对所述关联语音数据进行语音分析,得到所述关联语音数据的音调特征、音量特征以及节奏特征;
根据情感特征提取模型,对所述关联语音数据的音调特征、音量特征以及节奏特征进行处理,得到对应的所述语音情感特征;
其中,所述情感特征提取模型是通过采集语音样本训练获取的机器学习模型,用于根据输入的语音的所述音调特征、音量特征以及节奏特征,输入对应的所述语音情感特征。
可选地,用于根据用户输入的关联语音数据,获取用户的语音情感特征的装置还用于:
将所述关联语音数据转换对对应的关联文本数据;
根据预先构建的情感词库,从所述关联文本数据中,提取情感关键词;
通过情感结构化模型,对所述情感关键词进行结构化分析,得到对应的所述语音情感特征;
其中,所述情感结构化模型是通过对采集的与情感相关的情感词汇进行分类并结构化组织得到的词汇模型;所述情感结构化模型中包括的每个情感词汇都具有对应的情感类型以及情感程度。
可选地,表情提供单元3100还包括:
用于根据所述声音表情的所述情感特征,生成对应的声音波形以展示所述声音表情的装置。
可选地,表情提供单元3100还包括:
用于响应于用户的声音表情生成请求,根据用户输入的声音内容,生成对应的所述声音表情,以供用户选择使用的装置。
表情确定单元3200,用于接收用户的表情选择指示,确定对应的目标声音表情。
可选地,所述表情选择指示是用户输入的语音选择指示。
表情播放单元3300,用于在与所述目标声音表情关联的关联应用窗口中,播放所述目标声音表情。
可选地,每个所述声音表情具有对应的情感特征以及声音内容;所述情感特征至少包括情感类型以及情感程度;所述声音表情包括语音表情和音效表情;所述语音表情的所述声音内容是与所述语音表情的情感特征对应的语音;所述音效表情的所述声音内容是与所述音效表情的情感特征对应的音效;
所述表情播放单元3300还用于:
当所述目标声音表情是所述语音表情时,在所述关联应用窗口中播放与所述目标声音表情关联的用户语音过程中,根据所述目标声音表情在所述用户语音中的插入位置,播放所述目标声音表情;
当所述目标声音表情是所述音效表情时,将与所述目标声音表情关联的用户语音与所述目标声音表情混音合成后,在所述关联应用窗口中播放。
本领域技术人员应当明白,可以通过各种方式来实现声音表情的应用装置3000。例如,可以通过指令配置处理器来实现声音表情的应用装置3000。例如,可以将指令存储在rom中,并且当启动设备时,将指令从rom读取到可编程器件中来实现声音表情的应用装置3000。例如,可以将声音表情的应用装置3000固化到专用器件(例如asic)中。可以将声音表情的应用装置3000分成相互独立的单元,或者可以将它们合并在一起实现。声音表情的应用装置3000可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
在本实施例中,声音表情的应用装置3000可以是任意地提供语音交流使用声音表情功能的软件产品或者应用程序。例如,声音表情的应用装置3000可以是提供语音聊天中使用声音表情的社交应用,或者,声音表情的应用装置3000可以支持在语音留言中使用声音表情的通讯类应用,或者,声音表情的应用装置3000可以是提供语音评论功能并且在支持在语音评论中使用声音表情的内容分发类应用。
<声音表情的应用设备>
在本实施例中,还提供一种声音表情的应用设备4000,如图8所示,包括:
显示装置4100,
存储器4200,用于存储可执行的指令;
处理器4300,用于根据所述可执行的指令的控制,运行所述声音表情的应用设备执行如本实施例所述的声音表情的应用方法。
在本实施例中,声音表情的应用设备4000可以是手机、掌上电脑、平板电脑、笔记本电脑、台式电脑等电子设备。具体的一个例子中,声音表情的应用设备4000可以是任意地提供语音交流使用声音表情功能的软件产品或者应用程序的手机,例如,安装有提供语音聊天中使用声音表情的社交应用的手机。
声音表情的应用设备4000还可以包括其他的装置,例如,如图1所示的电子设备1000,还可以包括输入装置等。
<可读存储介质>
在本实施例中,还提供一种可读存储介质,可读存储介质存储有可被计算机读取并运行的计算机程序,所述计算机程序用于在被所述计算机读取运行时,执行如本实施例所述的声音表情的应用方法。
可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
以上已经结合附图和例子说明本发明的实施例,根据本实施例,提供一种声音表情的应用方法、装置、设备及可读存储介质,提供表情选择界面展示可供选择的、具有对应的情感特征以及声音内容的声音表情,在接收用户的表情选择指示后,确定用户选择的目标声音表情,并在与目标声音表情关联的关联应用窗口中,播放目标声音表情,令用户在通过语音交流的过程中,可以直接通过声音表情,生动简洁地表达自身的情绪或感受,满足用户在语音交流中的情绪或情感表达需求,提升用户的语音交流体验。尤其适用于语音聊天、语音留言或者语音评论等应用场景。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除