基于LSTM的环境温湿度在烟丝过程中的水份连续实时预测方法与流程
本发明涉及智能制造实时预测领域,具体针对烟丝生产过程中,在连续、多批次、反馈滞后性的环境下,基于lstm的环境温湿度实时预测方法。
背景技术:
随着工业现代化和科学技术的进步,作为我国经济收入的重要组成部分,我国烟草行业也步入了一个新的发展阶段。卷烟生产是一个相对比较复杂的过程,其每一环节都对卷烟的品质与材料的消耗等具有重大的影响。而作为烟草加工工艺过程中的重要环节,烟草制丝加工由于具有较强的连续性和相关性,以及具备多种多样的工艺设备因素,使得其在加工过程中能够有效的保证卷烟质量的稳定性。
制丝过程作为卷烟生产的一个重要阶段,其过程控制对后段工序的生产乃至烟支成品的质量都有显著影响。在整个制丝过程,烟丝水分都伴随着烟丝生产的始终,因此对于制丝线烟丝水分的控制,显得尤为重要。烟丝水分的把握是否得当,直接影响着烟丝的柔韧性和耐加工性,从而关系到生产过程烟丝的消耗、烟支的感官舒适度,甚至对卷烟的生产成本和销售收益造成影响。烘丝和加香是制丝过程的关键环节,这一流程的烟丝含水率控制自然而然成为精准化管理的重点。
加香后环境温湿度数据具有时间序列特征。近年来,随着深度学习技术的不断发展,一些深度学习模型逐渐被应用到时序数据的研究中。在深度学习模型中,循环神经网络(recurrentneuralnetwork,rnn)将时序的概念引入到网络结构设计中,使其在时序数据分析中表现出更强的适应性。长短期记忆(longshorttermmemory,lstm)模型弥补了梯度消失和梯度爆炸、长期记忆能力不足等问题。与传统的rnn相比,lstm能够学习时间序列的隐在联系,并根据时间序列的相关性,从而得出最优化的模型。
传统lstm模型的研究成果表明lstm在时间序列数据预测中的可行性,并已经取得了显著的效果。但是在烟草制丝生产环节,多批次的烟叶,需要在连续生产环境下的实时预测,每个批次的控制参数,各个参数都在实时变化,同时,加香后烟丝含水率的控制研究主要集中在智能控制和pid控制以及两者相结合的方式,由于控制效果有一定的滞后性,无法考虑环境温湿度存在的潜在影响,容易导致加香后的烟丝含水率稳定率下降。因此传统lstm算法,很难实现这种滞后性、连续、多批次下的实时准确预测。
技术实现要素:
本发明为克服现有技术的不足之处,提出一种基于lstm的环境温湿度在烟丝过程中的水份连续实时预测方法,以期能实现对制丝水分的预测,从而提高预测的准备性和效率。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于lstm的环境温湿度在烟丝过程中的水份连续实时预测方法的特点包括以下步骤:
s1:收集烟厂车间环境的温湿度数据,并对温湿度数据进行标准化处理后,划分为训练集ttr和测试集tte;
s2:构建基于环境温湿度对加香后烟丝出口水分的lstm预测模型;
s3:基于所述训练集训练lstm预测模型的隐藏层,并得到预测输出值;
s4:对比实际输出值和预测输出值的损失函数值,通过降低损失函数值不断优化训练后的lstm预测模型,从而得到最优lstm预测模型用于实现水份分析和预测。
本发明所述的基于lstm的环境温湿度在烟丝过程中的水份连续实时预测方法的特点也在于,利用式(1)对s1中的温湿度数据进行标准化处理:
xnorm=(x-xmin)(xmax-xmin)(1)
式(1)中:xnorm为标准化后的温湿度数据;x为原始的温湿度数据;xmax、xmin分别为原始的温湿度数据中的最大值和最小值。
s2中建立的lstm预测模型的结构包括:输入层、隐藏层、输出层;
所述输入层的输入数据为:制丝车间环境温湿度和加香车间环境温湿度;所述输出层的输出数据为:加香机机出口含水率。
利用式(2)得到所述lstm预测模型中的隐藏层第t个时刻xt的输出pt:
pt=lstm(xt,c<t-1>,h<t-1>)(2)
式(2)中,c<t-1>、h<t-1>分别为第t-1个时刻的细胞状态和隐藏层状态。
s4中lstm预测模型优化过程中,利用式(3)定义训练过程的损失函数loss:
式(3)中,yi表示第i个实际值,fi表示第i个预测值,fi-yi表示第i个误差;
应用adam优化算法不断更新lstm预测网络,从而降低损失函数loss的值,并得到最终的lstm预测网络;
采用迭代预测的方法对最终的lstm预测网络进行预测,得到l个理论输出数据yp=(x′m-l+1,x′m-l+2,...,x′m),其中,x′m-l+2表示前l+2个理论输出数据;
将l个理论输出数据yp输入最终的lstm预测模型中,从而利用式(4)得到第m+1时刻的预测输出值
将第m+1时刻的输出值
对预测序列
与已有技术相比,本发明的有益效果体现在:
1、本发明通过构建多批次,连续生产环境下的数据模型,实现了多批次环境下的预测,解决了传统制丝预测不适应于分段预测的问题,实现了对批次的建模,且不需要中断。
2、本发明通过对lstm算法的通过控制模型的层数和参数量,实现了对lstm内含隐藏层的迭代训练,克服了该算法在连续性、多批次、滞后性和实时性上的缺陷,有效提高了预测精度和训练速度。
3、本发明能够连续性对多批次复杂环境下的持续实时预测,提高了方法的适用性和实时性。
4、本发明能够实现端到端的训练与预测,与传统的预测算法相比,训练部分能够实时进行,针对每个批次都能进行训练,使每个批次的模型都不一样,每个批次的预测都有不同的模型,所以可以大幅提升预测的精度。
5、本发明使用lstm网络进行预测,其对时间序列有很好的表达能力,同时采用权重复用,拟合较好,从而能较好地应用在数据不稳定的场景。
附图说明
图1为本发明预测方法的流程图;
图2为本发明基于lstm的环境变量预测模型图;
图3为本发明网络训练流程图;
图4为本发明lstm模型参数量;
图5为本发明lstm模型mae和mse值;
图6a为本发明lstm模型的拟合曲线;
图6b为本发明lstm模型的loss曲线。
具体实施方式
本实施中,一种基于lstm的环境温湿度在烟丝过程中的水份连续实时预测方法,为了保障多批次、连续生产环境下,加香后的烟丝出口水分的稳定性,实现基于lstm的深度学习迭代预测方法,分析环境温湿度在烟丝过程中的水份分析和预测对加香后烟丝出口水分的影响,建立加香后烟丝含水率实时预测模型;通过模型求解,得出预测的环境温湿度对加香后烟丝出水率的影响趋势,最后采用模型预测值与实测值对比的方法进行检验,具体的说,请参阅图1所示,具体包括以下步骤:
s1:收集烟厂车间环境的温湿度数据,所收集的数据来自烟厂车间加香后掺杂物水分,环境温湿度和烟丝含水率,数据采样间隔为一天。并对温湿度数据进行标准化处理后,划分为训练集ttr和测试集tte;比例分别为90%和10%;其中,利用式(1)对s1中的温湿度数据进行标准化处理:
xnorm=(x-xmin)(xmax-xmin)(1)
式(1)中:xnorm为标准化后的温湿度数据;x为原始的温湿度数据;xmax、xmin分别为原始的温湿度数据中的最大值和最小值。对数据标准化可加快网络训练收敛速度,提高模型训练的精度,消除范围较大的特征值给梯度更新所带来的影响。
s2:构建基于环境温湿度对加香后烟丝出口水分的lstm预测模型;
根据环境温湿度变量时间序列有限样本点的数据特点及循环神经网络从简的设计原则,如图2所示,所建立的lstm预测模型的结构包括:输入层、隐藏层、输出层、网络训练及网络预测五个部分;
输入层的输入数据为:制丝车间环境温湿度和加香车间环境温湿度;输出层的输出数据为:加香机机出口含水率。
利用式(2)得到lstm预测模型中的隐藏层第t个时刻xt的输出pt:
pt=lstm(xt,c<t-1>,h<t-1>)(2)
式(2)中,c<t-1>、h<t-1>分别为第t-1个时刻的细胞状态和隐藏层状态。
s3:基于训练集训练lstm预测模型的隐藏层,并得到预测输出值;
隐藏层的训练是整个模型最重要的部分。隐藏层由m-l个lstm结构组成,每个lstm结构内含l个lstm单元,输入层中,定义原始的制丝间和加香间环境变量数据序列为:
a=(a1,a2,…,an)(3)
其中a1=(a11,a12,a13,a14,a15),a11代表加香间温度数据,a12代表加香间湿度数据,a13制丝间间温度数据,a14代表制丝间温度数据,a15烟丝出口含水率。按照9∶1的比例划分的训练集和测试集。可以表示为:
atr=(a1,a2,…,am)(4)
ate=(am+1,am+2,…,an)(5)
满足约束条件m<n和m,n∈n。
然后对训练集中数据按数据标准化的方法处理。采用min-max标准化公式,标准化后的训练集a′tr和测试集a′te可以表示为:
a′tr=(a′1,a′2,…,a′m)(6)
a′te=(a′m+1,a′m+2,…,a′n)(7)
满足:
1≤a≤m,a∈n(9)
构建短时间输入序列使其适应隐藏层的特点,通过固定步长来确定时间序列的长度,并对atr'进行处理,设固定步长取值为l,则模型输入为:
x={x1,x2,...xm-l}(10)
xt={x′t,x′t+1,...x′m+l-1}(11)
1≤t≤m-l,l∈n(12)
对应的理论输出为:
y=(x′l+1,x′l+2,...,x′m)(13)
将x输入隐藏层,经过隐藏层的输出为:
p=(p1,p2,...,pm-l)(14)
pt=lstm(xt,c<t-1>,h<t-1>)(15)
1≤l≤m,m∈n(16)
式(15)中c<t-1>、h<t-1>为上个时刻的细胞状态和隐藏层状态。
s4:对比实际输出值和预测输出值的损失函数值,通过降低损失函数值不断优化训练后的lstm预测模型,从而得到最优lstm预测模型用于实现水份分析和预测。
在lstm预测模型优化过程中,选用均绝对值误差作为误差计算公式,利用式(17)定义训练过程的损失函数loss:
式(17)中,yi表示第i个实际值,fi表示第i个预测值,fi-y表示第i个误差;
应用adam优化算法不断更新lstm预测网络,从而降低损失函数loss的值,并得到最终的lstm预测网络,如图3所示;
采用迭代预测的方法对最终的lstm预测网络进行预测,得到最后的l个理论输出数据yp=(x′m-l+1,x′m-l+2,...,x′m),其中,x′m-l+2表示前l+2个理论输出数据;
将l个理论输出数据yp输入最终的lstm预测模型中,从而利用式(4)得到第m+1时刻的预测输出值
将最后的l-1个数据和测试集中的第m+1时刻的输出值
对预测序列
选择rmse(均方根误差)和mae(平均绝对误差)为模型的评价指标。其中mae能更好地反映预测值误差的实际情况,mse是用来衡量观测值同真实值之间的偏差。
式(19)和式(20)中:l(m-l)为训练的样本总数;pi为预测值,yi为真实值。
通过adam的优化方法更新网络权重,使得网络的损失最小。针对实际训练中常常存在过拟合的问题,采用dropout方法来对神经网络进行正则化,随机丢弃网络中的一些神经元以及相互之间的权重连接,提升模型的泛化能力。
如图4所示,是lstm模型的参数量,其中param#是指参数的数量。trainableparams是训练时网络的参数数量。如图5所示,是lstm模型的训练集和测试集的mae和mse结果图,训练集mae值为1.6009,mse值为3.4669,测试集mae值为1.7046,mse值为4.4725。由此可知,训练集和测试集的mae和mse值较小,网络的预测精度值可以达到最高。图6a是预测值与真实值的拟合曲线,越接近越好;图6b是网络的损失函数loss曲线。trainloss是训练时获得的损失曲线,validationloss是验证时的曲线,曲线很快就逼近0为最佳,说明模型可以很快获得满意的最佳性能。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除