HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种打叶复烤烟叶加工属性分类方法与流程

2021-01-07 15:01:44|303|起点商标网
一种打叶复烤烟叶加工属性分类方法与流程

本发明涉及烟叶加工技术领域,尤其涉及一种打叶复烤烟叶加工属性分类方法。



背景技术:

打叶复烤加工质量的优劣不仅与生产环节密切相关,烟叶自身的物理特性、化学成分、质量风格更起着决定性作用。烟叶的物理特性在不同程度上反映出烟叶的内在质量及其工艺性能,烟叶化学成分在打叶复烤加工过程中的变化也是反映其加工属性的重要因素,打叶复烤加工过程中烟叶原料质量风格的变化是决定烟叶原料使用质量的主要因素。目前,行业打叶复烤工艺技术研究更多的侧重于通过设备改进、工艺技术参数优化来提高打叶复烤的加工质量,很少能结合烟叶自身质量特点系统研究提高打叶复烤加工质量,最终造成对因原料不同而导致参数优化设计缺乏科学的支撑,从而无法实现打叶复烤加工过程的精细化控制;另外,打叶复烤模块配方设计时更偏重于烟叶的质量风格,很少结合烟叶原料的加工属性,很大程度上会造成不同加工属性的烟叶按照相同的打叶复烤加工强度进行加工,带来一定的经济性和内在质量的损失。

所以亟需建立一种基于烟叶质量特性的打叶复烤加工属性定位模型,为品牌原料的配方模块设计、模块化配方加工工艺优化提升奠定数据基础。

公开号为cn104997147a的专利文件公开了这样一种散烟配方打叶复烤加工工艺,包括以下工艺步骤:真空回潮、选叶、配方铺叶切断、自动配方库、叶身打叶复烤、叶柄打叶复烤、打包。该发明采用烟叶切断、叶身和叶柄分类加工,分别打叶复烤,根据叶身和叶柄片烟的物化性质差异,采用不同的加工强度和个性化工艺,但是对于不同种类的烟叶,依旧是将叶身一起加工,叶柄一起加工,需要加工强度小的烟叶依旧可能与需要加工强度大的烟叶一起打叶复烤,造成烟叶因加工强度过大或加工强度不够而内在质量损失的问题。



技术实现要素:

本发明要解决上述问题,提供一种打叶复烤烟叶加工属性分类方法。

本发明解决问题的技术方案是,提供一种打叶复烤烟叶加工属性分类方法,包括以下步骤:

(1)选取烟叶物理质量指标作为特征(特征,即为影响烟叶加工属性的影响因子),测定待分类烟叶样本的特征数据,得到烟叶样本的数据空间;

(2)确定聚类个数k;

(3)选取数据空间中的k个烟叶样本作为初始的聚类中心;

(4)计算其他烟叶样本与聚类中心的欧氏距离,按照距离最近的准则,将所有烟叶样本分到距离最近的聚类中心所对应的类别;

(5)计算同一类别中所有烟叶样本的每个特征的均值,并将其作为该类别新的聚类中心;

(6)重复步骤(4)、(5),直至达到设定的迭代次数或者直至均值与聚类中心一致,聚类过程结束,完成分类,并得到分类模型。

其中,每个加工类别的加工强度是基于烟叶物理质量指标制定的。由于烟叶的含梗率、叶面密度和拉力对加工强度的影响较大,作为本发明的优选,选取的烟叶物理质量指标包括含梗率、叶面密度和拉力。

作为本发明的优选,还包括对每类别下、打叶复烤加工强度的确定:

a.将上述用于建立分类模型的烟叶样本带入分类模型中,确定其类别;

b.计算每类别下、每个特征的均值,并根据均值的大小排序以确定不同类别下该特征的质量水平;

c.按照“含梗率质量水平越高所需打叶复烤加工强度越小、叶面密度质量水平越大所需打叶复烤加工强度越强、拉力质量水平越大所需打叶复烤加工强度越强”的原则,确定各类别所需打叶复烤加工强度。

此外,为了提高分类模型的准确度,特征越多越好,因此作为本发明的优选,额外选取了平衡含水率、填充值作为特征。

通过本申请,可以使得待分类烟叶样本得到其最适宜的类别。同时,通过物理质量指标确定不同类别的不同加工强度,即可对该类别下的所有烟叶进行相应的打叶复烤加工。

作为本发明的优选,得到的分类模型还可用于加工类别的预测:测定待加工烟叶的各个特征数据,代入所述分类模型,得到预测加工类别。本申请得到的分类模型除了能够将烟叶样本进行分类外,还能作为预测模型。在调拨得到一种新等级烟叶时,仅需要检测该烟叶的各个特征数据,将其带入分类模型程序中,通过计算待加工烟叶与各个聚类中心的欧式距离,选取其中欧式距离最小的聚类中心所在加工类别,即可推算得到该烟叶所适用的加工类别,然后可以对所有预测为同一类别的烟叶,采用相同的打叶复烤加工强度进行加工。不仅提高了打叶复烤的效率,而且提高了打叶复烤的精准度,避免了某些烟叶的加工强度与烟叶加工属性不匹配带来的经济指标和内在质量损失。

因此,本申请实际上也是在提供一种高效的、加工质量好的打叶复烤工艺,其包括两个步骤,一是烟叶加工属性分类,二是打叶复烤。本申请从烟叶加工属性分类步骤入手,将属于同一加工类别的烟叶一起进行相应强度的打叶复烤,不仅提高了加工的效率,而且烟叶的加工程度适宜,从而得到高质量的烟叶。

本申请建模时,是以现有烟叶样本的特征数据进行建模,由于烟叶物理特性指标数据的量纲不同、数量级不同,因此步骤(1)的步骤a中,需要对特征数据进行标准化处理后再应用。按照下式1进行标准化处理。

式1.

其中,xij’为第i个烟叶样本的第j个特征的标准化数据,xij为第i个烟叶样本的第j个特征数据,minxj为第j个特征中的最小值,maxxj为第j个特征中的最大值。

本申请是采用k-means聚类算法进行模型的建立。其中,聚类个数k值的选定是模型建立的基础之一。其选定方法可有多种,作为本发明的优选,采用了肘部法则。肘部法则的计算原理是成本函数,成本函数是类别畸变程度之和,每个类的畸变程度等于每个变量点到其类别中心的位置距离平方和,若类内部的成员彼此间越紧凑则类的畸变程度越小,反之,若类内部的成员彼此间越分散则类的畸变程度越大。在选择类别数量上,肘部法则会把不同值的成本函数值画出来。随着k值的增大,平均畸变程度会减小;每个类包含的样本数会减少,于是样本离其重心会更近。但是,随着k值继续增大,平均畸变程度的改善效果会不断减低。k值增大过程中,畸变程度的改善效果下降幅度最大的位置对应的值就是肘部,这处的k值就是最合理的聚类数目。所述肘部法则具体为:首先初步确定k的取值范围;然后计算k个聚类中心下的平均畸变值mk,mk=sum(min(cdist(x,k)))/n,n为烟叶样本的数目,x为烟叶样本矩阵,k为聚类中心,cdist为计算欧氏距离符号;最后以k为横坐标,mk为纵坐标绘制曲线图,选取曲线图肘部对应的k值。

本申请模型的建立可以通过python软件以程序算法实现,一般用组内平方和(又称误差平方和或残差平方和)作为目标函数,如下式2.

式2.

其中,ci表示第i个聚类,x是ci中的烟叶样本点,μi是ci的聚类中心。如果样本数据x属于ci所在类别,则计算两者之间的欧式距离,将所有样本点到其中心点距离算出来,并加总,就是其目标函数。重复进行步骤(4)、(5)的目的,就是不断更新聚类中心点,使得样本更靠近新的聚类中心点,从而不断降低sse的值,以找到最小的sse,即最优解。

因此,sse值的大小也是评价模型的方式之一,该值越接近于0说明分类模型拟合情况越好。

轮廓系数是指所有样本的轮廓系数的平均值,其分布范围为(-1,1),值越接近于-1,说明模型拟合效果越差,值越接近于1,说明此模型拟合情况越好。作为本发明的优选,分类模型建立后,还包括模型评价步骤:随机选取烟叶样本,计算其到同类其他烟叶样本的平均距a;计算该烟叶样本分别到剩余类别的所有烟叶样本的平均距离b,选取最小的b;计算轮廓系数s=(b-a)/(max{b,a}),s越接近于1说明分类模型拟合情况越好。

作为本发明的优选,还包括k值检验步骤:计算聚类中心之间的欧式距离作为类别间距离,计算每个类别内、烟叶样本之间的欧式距离作为类别内距离,如果类别内距离均小于类别间距离,说明k值可用。

本发明的有益效果:

本申请通过建立基于烟叶原料物质量特征的分类模型,将烟叶原料分为不同的加工属性类别,对相同加工属性的烟叶按照相同打叶复烤加工强度进行加工,不仅提高了加工效率,而且提高了加工强度和烟叶的适配度,避免了传统加工工艺中,烟叶原料加工强度不适宜所带来的经济损失和烟叶本身质量损失的问题。

附图说明

图1是实施例中的k-mk曲线图。

具体实施方式

以下是本发明的具体实施方式,并对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。

一种打叶复烤烟叶加工属性分类方法,包括以下步骤:

(1)收集本烟草企业三年内调拨的658个等级烟叶作为烟叶样本,选取含梗率、叶面密度、拉力、平均含水率、填充值,5个烟叶物理质量指标作为特征,将每份烟叶样本的各个特征值(一般烟草企业数据库中已有相应特征值,不需要重新测定)存储在一个向量x中,即为烟叶样本数据。

然后按照式1.对所有数据进行标准化处理,即得到建模样本数据。

(2)通过肘部法则确定聚类个数k,其一般可以应用python软件通过算法实现,其算法流程为:

a.首先初步确定k的取值范围为k=1,2,.....,9。

b.然后根据mk=sum(min(cdist(x,k)))/n,计算k取每一个值时的平均畸变值mk。

c.最后以k为横坐标,mk为纵坐标绘制曲线图,得到的曲线图如图1所示。由图1可知,在k=2时效果最好,但分类相对较为粗放,所以向下选取第二优的转变点k=4,即,将样本加工属性分为4类,分别定义为类别a、b、c、d。

(3)随机选取数据空间中的4个烟叶样本作为初始的聚类中心。

应用python软件,通过算法进行下述步骤。

(4)计算其他烟叶样本与聚类中心的欧氏距离,按照距离最近的准则,将所有烟叶样本分到距离最近的聚类中心所对应的类别。

(5)计算同一类别中所有烟叶样本的每个特征的均值,并将其作为该类别新的聚类中心。

(6)重复步骤(4)、(5),直至达到设定的迭代次数或者直至均值与聚类中心一致,聚类过程结束,完成分类,并得到分类模型。

得到的模型最好进行模型评价后再使用,模型评价可以有几种不同的方式。本实施例中,采用了三种模型评价方法。

一是计算模型的残差平方和,也就是各个样本与所在类别的均值的误差平方和,当平均组内残差平方和为0时模型拟合效果最好。本实施例中,得到的模型中,样本到聚类中心的总组内平方和,即,总残差平方和为0.846,平均组内平方和为0.0018,说明此分类模型的拟合情况较优。

二是计算模型的轮廓系数,随机选取烟叶样本,计算其到同类其他烟叶样本的平均距a;计算该烟叶样本分别到剩余类别的所有烟叶样本的平均距离b,选取最小的b;计算轮廓系数s=(b-a)/(max{b,a}),本实施例中,s=0.56,接近于1,说明模型的拟合情况较好。

三是判断类别间差异性,以4个类别的中心向量代表4个类的中心位置,应用欧氏距离度量了4个类别的差异性,得到结果如下表1所示。通过表1可知,本实施例中,每一类内的样本均小于类间的距离,说明该模型可以很好的将样本分为4个不同质量特性的类别。

表1.

(7)对分类得到的每一类别所需打叶复烤加工强度进行确定:

a.计算每类别下、所有烟叶样本的每个特征的均值,并根据均值的大小排序以确定不同类别下该特征的质量水平。

b.按照“含梗率质量水平越高所需打叶复烤加工强度越小、叶面密度质量水平越大所需打叶复烤加工强度越强、拉力质量水平越大所需打叶复烤加工强度越强”的原则,确定各类别所需打叶复烤加工强度,具体如下表2。

表2.

由表2可知,类别a中的烟叶需要进行中等强度的打叶复烤加工,类别b中的烟叶需要进行较大强度的打叶复烤加工,类别c中的烟叶需要进行最大强度的打叶复烤加工,类别d中的烟叶需要进行较小强度的打叶复烤加工。

(8)对于下年度不同品种和等级的烟叶,其需要进行打叶复烤加工时,测定该烟叶的各个特征数据,然后带入分类模型中,即可得到其加工类别,然后对其进行相应强度的打叶复烤加工即可。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 聚类分类数据
tips