歌词集合的生成方法及装置与流程
本公开涉及媒体处理技术领域,尤其涉及一种歌词集合的生成方法及装置。
背景技术:
串烧歌曲是一种通过人工处理或者计算机处理大量歌曲的方式获得的组合音频。串烧歌曲在听感上的表现为,每一段串烧歌曲都是来自不同的歌曲。串烧歌曲的这些音频片段,它们的曲风、流派、风格甚至语言都可以不同。串烧歌曲也正是因为这种复杂多变的组合风格给用户带来了别致的听歌体验。
但是,对于串烧歌词,它会由于串烧歌曲的成分来源多样性而导致制作歌词的复杂度增大。如果人工制作串烧歌词,人们需要分析串烧歌曲中的每一个音频片段背后的歌曲歌词。譬如,一首串烧歌曲中有m个音频片段,这每个音频片段都来自不同的歌曲,那么人工制作串烧歌词的时候就需要分析这一首串烧歌曲对应的m首不同的歌曲。当m较大时,这带来的人工成本和时间成本是巨大的。因此,如何实现自动制作歌词集合,从而提升歌词集合的生成效率,节省人力成本,是本公开亟待解决的问题。
技术实现要素:
本公开提供一种歌词集合的生成方法及装置。
第一方面,提供了一种歌词集合的生成方法,所述方法包括:
获取歌曲集合中每个音频片段的起止时间信息,所述每个音频片段的起止时间信息包括以下至少一项信息:所述每个音频片段的开始淡入时间,淡入结束时间,开始淡出时间,淡出结束时间;
根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段在所述歌曲集合中对应的第二歌词信息,以及获取所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息;
根据所述每个音频片段的起止时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息进行校准,以得到所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息。
可选地,所述开始淡入时间为所述每个音频片段在所述歌曲集合中的开始时间,所述淡出结束时间为所述每个音频片段在所述歌曲集合中的结束时间。
可选地,所述根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段在所述歌曲集合中对应的第二歌词信息,包括:
根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,在所述第一歌词信息中选择从所述每个音频片段的开始淡入时间至淡出结束时间之间的歌词信息作为所述第二歌词信息,所述第二歌词信息包括至少一个歌词。
可选地,所述根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息进行校准,包括:
采用如下公式获得所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息exacttimem:
其中,exacttimem是第m个音频片段的第二时间信息,wordtimem是所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,tem是第m个音频片段的淡入结束时间,toutm是第m个音频片段的淡出结束时间,tin1是第一个音频片段的开始淡入时间。
可选地,所述方法还包括:
根据校准后的所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息,输出所述歌曲集合中的所述每个音频片段对应的第二歌词信息。
第二方面,提供了一种歌词集合的生成装置,所述装置包括:
第一获取单元,用于获取歌曲集合中每个音频片段的起止时间信息,所述每个音频片段的起止时间信息包括以下至少一项信息:所述每个音频片段的开始淡入时间,淡入结束时间,开始淡出时间,淡出结束时间;
第二获取单元,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段在所述歌曲集合中对应的第二歌词信息;
第三获取单元,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息;
校准单元,用于根据所述每个音频片段的起止时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息进行校准,以得到所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息。
可选地,所述开始淡入时间为所述每个音频片段在所述歌曲集合中的开始时间,所述淡出结束时间为所述每个音频片段在所述歌曲集合中的结束时间。
可选地,所述第二获取单元,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,在所述第一歌词信息中选择从所述每个音频片段的开始淡入时间至淡出结束时间之间的歌词信息作为所述第二歌词信息,所述第二歌词信息包括至少一个歌词。
可选地,所述校准单元用于采用如下公式获得所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息exacttimem:
其中,exacttimem是第m个音频片段的第二时间信息,wordtimem是所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,tem是第m个音频片段的淡入结束时间,toutm是第m个音频片段的淡出结束时间,tin1是第一个音频片段的开始淡入时间。
可选地,所述装置还包括:
输出单元,用于根据校准后的所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息,输出所述歌曲集合中的所述每个音频片段对应的第二歌词信息。
第三方面,提供了歌词集合的生成装置,包括:处理器和存储器,所述存储器中存储有程序指令,所述处理器执行所述程序指令以实现如第一方面或第一方面的任一个实现所述的方法。
第四方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如第一方面或第一方面的任一个实现所述的方法。
采用本公开提供的一种歌词集合的生成方法及装置,具有如下有益效果:
通过根据每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,实现了自动制作歌词集合,提高了制作歌词集合的效率。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种歌词集合的生成方法的流程示意图;
图2为歌曲集合中音频片段之间进行时间耦合的示意图;
图3为本公开实施例提供的又一种歌词集合的生成方法的流程示意图;
图4为获取每个音频片段在歌曲集合中对应的第二歌词信息的示意图;
图5a~图5c为示例的对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准的示意图;
图6为本公开实施例提供的一种歌词集合的生成装置的结构示意图;
图7为本公开实施例提供的又一种歌词集合的生成装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
歌曲集合,又可以称为串烧歌曲,是一种通过人工处理或者计算机处理大量歌曲的方式获得的组合音频。串烧歌曲在听感上的表现为,每一段串烧歌曲都是来自不同的歌曲。串烧歌曲的这些音频片段,它们的曲风、流派、风格甚至语言都可以不同。串烧歌曲也正是因为这种复杂多变的组合风格给用户带来了别致的听歌体验。
然而,目前主要靠人工制作歌曲集合对应的歌词集合,其人工成本和时间成本较大。
本公开提供一种歌词集合的生成方法及装置,通过根据每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,实现了自动制作歌词集合,提高了制作歌词集合的效率。
如图1所示,为本公开实施例提供的一种歌词集合的生成方法的流程示意图,该方法包括以下步骤:
s101、获取歌曲集合中每个音频片段的起止时间信息,所述每个音频片段的起止时间信息包括以下至少一项信息:所述每个音频片段的开始淡入时间,淡入结束时间,开始淡出时间,淡出结束时间。
歌曲集合包括一个或多个音频片段。歌曲集合的各个相邻的音频片段之间有时间耦合,这种耦合在内容上首先是音频的淡出处理和淡入处理,然后将处理后的音频在时间上叠加起来。如图2所示的歌曲集合中音频片段之间进行时间耦合的示意图,音频片段1与音频片段2耦合在一起。其中,淡出处理可以采用余弦函数,淡出时长一般取4秒,包括但不限于该值;淡入处理采用的是正弦函数,淡入时长一般取2秒,包括但不限于该值。这种音频片段的处理方式会产生4个时间信息,分别是开始淡入时间tin,淡入结束时间te,开始淡出时间ts,淡出结束时间tout。其中,开始淡入时间tin和淡出结束时间tout分别对应音频片段的开始时间和结束时间;淡入结束时间与开始淡入时间之差,即te-tin为淡入时长,它是做淡入处理的时间长度;淡出结束时间与开始淡出时间之差,即tout-ts为淡出时长,它是做淡出处理的时间长度。每个音频片段的起止时间信息包括上述4个时间信息。
可以将每一个音频片段的淡出和淡入时间以矩阵的方式表示。歌曲集合的起止时间信息,记为t,共有m个音频片段,每个音频片段的起止时间记为tm。则t=[t1,t2,t3,……tm],其中,tm=[tin_m,te_m,ts_m,tout_m],分别对应第m个音频片段的开始淡入时间、淡入结束时间、开始淡出时间、淡出结束时间。
s102、根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段在所述歌曲集合中对应的第二歌词信息,以及获取所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息。
遍历每个音频片段,获得音频片段对应的原始歌词,即第一歌词信息。以m=5为例,它对应歌曲集合中的第5个音频片段,即b5,它是从歌曲5中节选而来,因此直接获取歌曲5的歌词内容,记为q5。需要指出的是,这里的q5是歌曲5的全部歌词内容,或者是原始歌词内容。通过这种方式,即可获得歌曲集合的每个音频片段对应的原始歌词,记为q=[q1,q2,q3,…,qm],该集合中包括的歌词信息即第一歌词信息。
通过步骤s101得到的歌曲集合的起止时间信息t,获得每个音频片段在歌曲集合中对应的第二歌词信息,即歌曲集合中每个音频片段实际使用的歌词信息。以m=5为例,音频片段b5对应的起止时间为t5,t5=[tin_5,te_5,ts_5,tout_5]。然后从原始歌词q5中,按照时间选择从tin_5时刻至tout_5时刻之内的歌词与时间,作为b5音频片段实际使用的歌词信息,记为qrc_5,它可以表示为qrc_5=[word1_time1,word2_time2,…],其中word1_time1表示歌词word1在歌曲5中的时间为time1。通过这种方法,即可获得每个音频片段实际使用的歌词信息,记为qrc=[qrc_1,qrc_2,…,qrc_m],该集合中包括的歌词信息即第二歌词信息。
每个音频片段中包含一个或多个歌词,其中音频片段的起止时间为tm,tm包括4个时刻,分别为:开始淡入时间、淡入结束时间、开始淡出时间、淡出结束时间。这个音频片段内的每一个歌词都有相应的时间,即qrc_m,它包括每个歌词word的发声时间,即qrc_m中的[word1_time1,word2_time2,…],该集合包括的是第二歌词信息中的至少一个歌词的第一时间信息。但是,这些时间是相对于歌曲m开始的时间,并不是相对于歌曲集合开始的时间。譬如,音频片段1是从歌曲1的50秒开始淡入,至歌曲1的90秒淡出结束;音频片段2是从歌曲2的70秒开始淡入,至歌曲2的120秒淡出结束。则qrc_1中的每个歌词都是相对于歌曲1中的50秒开始的,而qrc_2中的每个歌词都是相对于歌曲2中的70秒开始的,这种各自独立的相对时间造成qrc_m没有一个相同的参考起始时间。因此,需要通过时间校准获得各个音频片段相对串烧歌曲的时间。
s103、根据所述每个音频片段的起止时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息进行校准,以得到所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息。
在获得每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息后,可以根据每个音频片段的起止时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息进行校准,以得到每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息。最终得到以整个歌曲集合为统一参考点的每个音频片段对应的第二歌词信息的至少一个歌词的第二时间信息。
根据本公开实施例提供的一种歌词集合的生成方法,通过根据每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,实现了自动制作歌词集合,提高了制作歌词集合的效率。
如图3所示,为本公开实施例提供的又一种歌词集合的生成方法的流程示意图,该方法包括以下步骤:
s201、获取歌曲集合中每个音频片段的起止时间信息,所述每个音频片段的起止时间信息包括以下至少一项信息:所述每个音频片段的开始淡入时间,淡入结束时间,开始淡出时间,淡出结束时间。
通过提取串烧歌曲的信息,获得串烧歌曲中每个音频片段的结构分布情况。具体包括:
在生成歌曲集合的时候,构成串烧歌曲的每个音频片段分别来自不同的数据源,每个数据源对应一首歌曲。这些音频片段的信息是已知的。譬如,串烧歌曲的音频记为a,共有m个音频片段,每个音频片段记为bm,m=1,2,3,…,m。则串烧音频a可表示为:a=[b1,b2,b3,…,bm],其中音频片段bm是从歌曲m中节选的。通过分析bm即可获知串烧歌曲的内部音频结构。
歌曲集合的各个相邻的音频片段之间有时间耦合,这种耦合在内容上首先是音频的淡出处理和淡入处理,然后将处理后的音频在时间上叠加起来。如图2所示的歌曲集合中音频片段之间进行时间耦合的示意图,音频片段1与音频片段2耦合在一起。其中,淡出处理可以采用余弦函数,淡出时长一般取4秒,包括但不限于该值;淡入处理采用的是正弦函数,淡入时长一般取2秒,包括但不限于该值。这种音频片段的处理方式会产生4个时间信息,分别是开始淡入时间tin,淡入结束时间te,开始淡出时间ts,淡出结束时间tout。其中,开始淡入时间tin和淡出结束时间tout分别对应音频片段的开始时间和结束时间;淡入结束时间与开始淡入时间之差,即te-tin为淡入时长,它是做淡入处理的时间长度;淡出结束时间与开始淡出时间之差,即tout-ts为淡出时长,它是做淡出处理的时间长度。每个音频片段的起止时间信息包括上述4个时间信息。
可以将每一个音频片段的淡出和淡入时间以矩阵的方式表示。歌曲集合的起止时间信息,记为t,共有m个音频片段,每个音频片段的起止时间记为tm。则t=[t1,t2,t3,……tm],其中,tm=[tin_m,te_m,ts_m,tout_m],分别对应第m个音频片段的开始淡入时间、淡入结束时间、开始淡出时间、淡出结束时间。
s202、根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,在所述第一歌词信息中选择从所述每个音频片段的开始淡入时间至淡出结束时间之间的歌词信息作为所述第二歌词信息,以及获取所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,所述第二歌词信息包括至少一个歌词。
通过将s201获得的串烧歌曲时间信息t用于歌词内容分析,得到串烧歌曲中的每个音频片段实际使用的歌词内容,即第二歌词信息。具体包括:
遍历每个音频片段,获得音频片段对应的原始歌词,即第一歌词信息。以m=5为例,它对应歌曲集合中的第5个音频片段,即b5,它是从歌曲5中节选而来,因此直接获取歌曲5的歌词内容,记为q5。需要指出的是,这里的q5是歌曲5的全部歌词内容,或者是原始歌词内容。通过这种方式,即可获得歌曲集合的每个音频片段对应的原始歌词内容,记为q=[q1,q2,q3,…,qm]。
通过步骤s201得到的歌曲集合的起止时间信息t,获得每个音频片段在歌曲集合中对应的第二歌词信息,即歌曲集合中每个音频片段实际使用的歌词信息。如图4所示,为获取每个音频片段在歌曲集合中对应的第二歌词信息的示意图,可以根据每个音频片段的起止时间信息和每个音频片段对应的第一歌词信息,在第一歌词信息中选择从所述每个音频片段的开始淡入时间至下一个音频片段的开始淡入时间(或者该音频片段的开始淡出结束时间)之间的歌词信息作为所述第二歌词信息,该音频片段与下一个音频片段之间是连续的,且不存在重叠区域。可选地,也可以选择从每个音频片段的开始淡入时间到该音频片段的淡出结束时间之间的歌词信息作为第二歌词信息,该该音频片段与下一个音频片段之间是连续的,且存在重叠区域。以m=5为例,音频片段b5对应的起止时间为t5,t5=[tin_5,te_5,ts_5,tout_5]。然后从原始歌词q5中,按照时间选择从tin_5时刻至tout_5时刻之内的歌词与时间,作为b5音频片段实际使用的歌词信息,记为qrc_5,它可以表示为qrc_5=[word1_time1,word2_time2,…],其中word1_time1表示歌词word1在歌曲5中的时间为time1。通过这种方法,即可获得每个音频片段实际使用的歌词信息,记为qrc=[qrc_1,qrc_2,…,qrc_m]。
每个音频片段中包含一个或多个歌词,其中音频片段的起止时间为tm,tm包括4个时刻,分别为:开始淡入时间、淡入结束时间、开始淡出时间、淡出结束时间。这个音频片段内的每一个歌词都有相应的时间,即qrc_m,它包括每个歌词word的发声时间,即qrc_m中的[word1_time1,word2_time2,…]。但是,这些时间是相对于歌曲m开始的时间,并不是相对于歌曲集合开始的时间。譬如,音频片段1是从歌曲1的50秒开始淡入,至歌曲1的90秒淡出结束;音频片段2是从歌曲2的70秒开始淡入,至歌曲2的120秒淡出结束。则qrc_1中的每个歌词都是相对于歌曲1中的50秒开始的,而qrc_2中的每个歌词都是相对于歌曲2中的70秒开始的,这种各自独立的相对时间造成qrc_m没有一个相同的参考起始时间。因此,需要通过时间校准获得各个音频片段相对串烧歌曲的时间。
s203、根据所述每个音频片段的起止时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息进行校准,以得到所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息。
对于任一个音频片段m,可以采用如下公式1获得每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息exacttimem:
其中,exacttimem是第m个音频片段的第二时间信息,wordtimem是所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,tem是第m个音频片段的淡入结束时间,toutm是第m个音频片段的淡出结束时间,tin1是第一个音频片段的开始淡入时间。
如图5a~图5c所示,为示例的对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准的示意图。具体地,在图5a中,m=1时,exacttime1=wordtime1-tin1,其中,tin1是第一个音频片段的开始淡入时间,wordtime1是第一个音频片段中的第一个歌词word1在第一个音频片段中的第一时间信息为wordtime1,exacttime1是校准后的第一个音频片段在歌曲集合中的开始时间,也是校准后的歌词word1在第一个音频片段中的第二时间信息。在图5b中,m=2时,对于第二个音频片段中的第一个歌词word2在第二个音频片段中的第一时间信息为wordtime2,exacttime2是校准后的第二个音频片段在歌曲集合中的开始时间,也是校准后的歌词word2在第二个音频片段中的第二时间信息,exacttime2由①、②和③三段时间构成,即exacttime2=(te1-tin1)+(tout1-te1)+(wordtime2-te2)。其中,te1是第一个音频片段的淡入结束时间,tout1是第一个音频片段的淡出结束时间,te2是第二个音频片段的淡入结束时间。在图5c中,m=3时,exacttime2=(te1-tin1)+(tout1-te1)+(tout2-te2)+(wordtime3-te3)。其中,wordtime3是第三个音频片段中的第一个歌词word3在第三个音频片段中的第一时间信息,te3是第三个音频片段的淡入结束时间。当m为其它值时,以此类推。可以理解的是,上述wordm可以是一个词,也可以是一句话,本发明对此不作限制。
s204、根据校准后的所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息,输出所述歌曲集合中的所述每个音频片段对应的第二歌词信息。
通过对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,最终得到以整个歌曲集合为统一参考点的每个音频片段对应的第二歌词信息的至少一个歌词的第二时间信息,输出歌曲集合中的所述每个音频片段对应的第二歌词信息,从而得到整个歌词集合。
进一步地,可以打印整个歌词集合到显示器,或者存储到磁盘,或者与串烧音频一起播放和显示,这样用户在收听串烧歌曲的过程中,就可以欣赏到实时的串烧歌词内容了。
本发明利用算法的高效、稳健和准确的优势,通过串烧歌曲信息和音频片段对应的原始歌词信息获得时间校准后的串烧歌词,实现高效准确地生成串烧歌词。这种方案不仅避免了传统人工制作歌词的人力成本,也有利于提供更多的串烧歌词,满足用户在听歌过程中使用串烧歌词的需求。
根据本公开实施例提供的一种歌词集合的生成方法,通过根据每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,实现了自动制作歌词集合,提高了制作歌词集合的效率。
基于上述歌词集合的生成方法的同一构思,如图6所示,本公开实施例还提供一种歌词集合的生成装置,该生成装置1000包括:第一获取单元11、第二获取单元12、第三获取单元13和校准单元14,还可以包括输出单元15(图中以虚线表示和连接)。其中:
第一获取单元11,用于获取歌曲集合中每个音频片段的起止时间信息,所述每个音频片段的起止时间信息包括以下至少一项信息:所述每个音频片段的开始淡入时间,淡入结束时间,开始淡出时间,淡出结束时间;
第二获取单元12,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段在所述歌曲集合中对应的第二歌词信息;
第三获取单元13,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,获取所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息;
校准单元14,用于根据所述每个音频片段的起止时间信息,对所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息进行校准,以得到所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息。
可选地,所述开始淡入时间为所述每个音频片段在所述歌曲集合中的开始时间,所述淡出结束时间为所述每个音频片段在所述歌曲集合中的结束时间。
可选地,所述第二获取单元12,用于根据所述每个音频片段的起止时间信息和所述每个音频片段对应的第一歌词信息,在所述第一歌词信息中选择从所述每个音频片段的开始淡入时间至淡出结束时间之间的歌词信息作为所述第二歌词信息,所述第二歌词信息包括至少一个歌词。
可选地,所述校准单元14用于采用如下公式获得所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息exacttimem:
其中,exacttimem是第m个音频片段的第二时间信息,wordtimem是所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述第一歌词信息的第一时间信息,tem是第m个音频片段的淡入结束时间,toutm是第m个音频片段的淡出结束时间,tin1是第一个音频片段的开始淡入时间。
可选地,所述输出单元15,用于根据校准后的所述每个音频片段对应的第二歌词信息中的至少一个歌词相对所述歌曲集合的第二时间信息,输出所述歌曲集合中的所述每个音频片段对应的第二歌词信息。
有关上述各单元的具体实现可参考图1或图3所示方法实施例中的相关描述。
根据本公开实施例提供的一种歌词集合的生成装置,通过根据每个音频片段的起止时间信息和每个音频片段对应的第二歌词信息中的至少一个歌词相对第一歌词信息的第一时间信息,对每个音频片段对应的第二歌词信息中的至少一个歌词相对歌曲集合的第二时间信息进行校准,实现了自动制作歌词集合,提高了制作歌词集合的效率。
图7是本公开实施例提供的又一种歌词集合的生成装置的结构示意图。在一个实施例中,该歌词集合的生成装置可以对应于上述图1或图3所对应实施例中。如图7所示,该歌词集合的生成装置可以包括:处理器,网络接口和存储器,此外,上述歌词集合的生成装置还可以包括:用户接口,和至少一个通信总线。其中,通信总线用于实现这些组件之间的连接通信。其中,用户接口可以包括显示屏(display)、键盘(keyboard),可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器可以是高速ram存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器可选的还可以是至少一个位于远离前述处理器的存储装置。如图7所示,作为一种计算机可读存储介质的存储器中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图7所示的歌词集合的生成装置中,网络接口可提供网络通讯功能;而用户接口主要用于为用户提供输入的接口;而处理器可以用于调用存储器中存储的设备控制应用程序,以实现上述图1或图3任一个所对应实施例中对歌词集合的生成方法的描述,这里不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
应当理解,本公开实施例中所描述的歌词集合的生成装置可执行前文图1或图3任一个所对应实施例中对歌词集合的生成方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本公开实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的歌词集合的生成装置1000所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图1或图3任一个所对应实施例中对歌词集合的生成方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本公开所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本公开方法实施例的描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriberline,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,rom),或随机存储存储器(randomaccessmemory,ram),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digitalversatiledisc,dvd)、或者半导体介质,例如,固态硬盘(solidstatedisk,ssd)等。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除