HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基于对位和声关系的LSTM多轨音乐生成方法与流程

2021-01-28 14:01:40|344|起点商标网
基于对位和声关系的LSTM多轨音乐生成方法与流程

本发明涉及一种基于对位和声关系的lstm多轨音乐生成方法,属于计算机算法作曲领域。



背景技术:

随着计算机和神经网络算法的不断发展,人工智能已经应用到众多的领域。在音乐创作方面,利用神经网络算法进行编曲已经取得了一定阶段的突破。对于现有的算法而言,大多通过对乐曲中音符的上下文关系进行分析,没有考虑伴奏及和声与主旋律直接的对位关系。



技术实现要素:

发明目的:为了克服现有技术的不足,基于对位和声关系的lstm(长短期神经网络)多轨音乐生成方法。

本发明采用的技术方案为:

一种基于对位和声关系的lstm多轨音乐生成方法,具体包括以下步骤:

s1,构建音频midi数据集;

s2,提取midi文件中的主旋律与和声旋律,构建对位关系矩阵;

s3,利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络,通过网络生成多轨音乐。

在所述步骤s2中,提取midi文件中的主旋律与和声旋律,构建对位关系矩阵,包括以下过程:

s21,选取midi文件中的主旋律,将非和声旋律剔除,其余旋律依次编号;

s22,将每时刻的旋律信息制作为矩阵,将每条和声旋律与主旋律做差值操作,得到对位关系矩阵。

在所述步骤s22中,将每条和声旋律与主旋律做差值操作,对位关系矩阵,包括以下过程:

midi文件由头块与音轨块组成,音轨块数据区包含以下两种信息:

其中,ij表示第j条midi消息,δti表示第i段midi消息所执行的时间长度,mi表示第i段midi消息。midi消息存储该时间段内的音符,强弱等信息。值得注意的是,i=0,表示主旋律所对应的音轨块数据区。

对位关系矩阵可根据以下公式得出:

dj=ij-i0

其中,d表示对位关系矩阵,对位关系矩阵通过计算差值,表示了和声旋律与主旋律之间的相对关系。

在所述步骤s3中,利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络,包括以下过程:

s31:将主旋律送入一个长短期神经网络中进行训练,该长短期神经网络用以生成主旋律。

s32:将和声旋律送入另一个长短期神经网络中进行训练,该长短期神经网络用以生成多轨和声旋律。

s33:将生成的主旋律与多轨和声旋律融合,生成新的多轨音乐。

所述长短期神经网络由遗忘门、输入门和输出门构成。遗忘门决定上一时刻的单元状态ct-1有多少保留到当前时刻的ct,输入们决定当前时刻网络的输入xt有多少保存到单元状态ct,输出门控制单元状态ct-1有多少输出到lstm的当前输出值ht。

在所述步骤s33中,生成的主旋律与多轨和声旋律融合,生成新的多轨音乐,采用对多轨道音频的直接混缩法进行融合。

在所述步骤s3中,长短期神经网络的遗忘门、输入门和输出门的激活函数分别各自采用了sigmoid函数与tanh函数。通过采用激活函数,可以将线性关系转化为非线性关系,便于神经网络判断更好地学习数据特征。

有益效果:

1.本发明提取了主旋律与和声旋律之间的特征,有助于神经网络算法能够更加直观地对和声旋律的生成进行处理。

2.本发明所使用了两次长短期神经网络,不仅可以生成一条新的旋律,而且可以在新旋律的基础上生成关于旋律的和声,大大简化了复杂情况下编曲的过程。

附图说明

图1所示为本发明的流程图;

图2所示为长短期神经网络结构图。

具体实施方法

下面结合附图对本发明作更进一步的说明。

下面结合实例对本发明作更进一步的说明。

如图1所示,基于对位和声关系的lstm多轨音乐生成方法,首先构建音频midi数据集,提取midi文件中的主旋律与和声旋律,并且构建对位关系矩阵。利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络。通过两条网络分别生成多条旋律,合成多轨音乐。具体过程如下:

s1,构建音频midi数据集;

从现有的开源音频midi数据集中获取多轨音频midi数据集。

s2,提取midi文件中的主旋律与和声旋律,构建对位关系矩阵;

将每条和声旋律与主旋律做差值操作,对位关系矩阵,包括以下过程:

s21,选取midi文件中的主旋律,将非和声旋律剔除,其余旋律依次编号;

s22,将每时刻的旋律信息制作为矩阵,将每条和声旋律与主旋律做差值操作,得到对位关系矩阵。

在所述步骤s22中,将每条和声旋律与主旋律做差值操作,对位关系矩阵,包括以下过程:

midi文件由头块与音轨块组成,音轨块数据区包含以下两种信息:

其中,ij表示第j条midi消息,δti表示第i段midi消息所执行的时间长度,mi表示第i段midi消息。midi消息存储该时间段内的音符,强弱等信息。值得注意的是,i=0,表示主旋律所对应的音轨块数据区。

对位关系矩阵可根据以下公式得出:

dj=ij-i0

其中,d表示对位关系矩阵,对位关系矩阵通过计算差值,表示了和声旋律与主旋律之间的相对关系。

s3,利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络。通过网络生成多轨音乐。

利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络,包括以下过程:

将主旋律送入一个长短期神经网络中进行训练,该长短期神经网络用以生成主旋律;

将和声旋律送入另一个长短期神经网络中进行训练,该长短期神经网络用以生成多轨和声旋律;

将生成的主旋律与多轨和声旋律融合,生成新的多轨音乐。

长短期神经网络由遗忘门、输入门和输出门构成。遗忘门决定上一时刻的单元状态ct-1有多少保留到当前时刻的ct,输入们决定当前时刻网络的输入xt有多少保存到单元状态ct,输出门控制单元状态ct-1有多少输出到lstm的当前输出值ht。

将生成的主旋律与多轨和声旋律融合,生成新的多轨音乐。采用对多轨道音频的直接混缩法进行融合。

长短期神经网络的遗忘门、输入门和输出门的激活函数分别各自采用了sigmoid函数与tanh函数。通过采用激活函数,可以将线性关系转化为非线性关系,便于神经网络判断更好地学习数据特征。

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: lstm
tips