HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

基于分类回归模型的新冠疫情综合评估方法与流程

2021-01-08 13:01:04|358|起点商标网
基于分类回归模型的新冠疫情综合评估方法与流程

本发明涉及人工智能和数据分析领域,尤其涉及一种基于分类回归模型的新冠疫情综合评估方法。

技术背景

2020年1月12日,世界卫生组织正式命名为2019-ncov。2019新型冠状病毒的特点为人群普遍易感,可造成感染患者全身多系统损伤,其中有慢性疾病史的中老年人所受影响更大。该疫情已成为全球共同面临的公共卫生安全挑战。

新冠肺炎来势汹汹,传播速度惊人,而且防治难度很大,这导致其对全球经济和人们正常生活造成了前所未有的冲击。据估计,其影响远超过2003年非典的肆虐和2008年全球金融危机。截止目前,据有关资料显示,防控新冠疫情和治疗感染患者的费用高昂,给国家和个人带来了巨大的经济负担。

广州地理研究所提出了一种基于人流密度的流行病疫情风险等级评估方法,包括:获得评估地区的新增确诊病例的总数、人口流动数量、入口密度以及企业数据,将其输入评估模型中,形成评估地区的疫情风险评估等级。

目前,已发表的有关新冠疫情的评估模型不多,有关疫情的评估方法往往只着眼于单一影响因素;但是,疫情的严重程度是多种因素共同作用的结果,因此只考虑一种或几种影响因素,得到的结果难免存在较大误差。这一评估结果难以对疫情的防控工作起到有效的警示和指导作用,将导致已开展的防控工作收效甚微,甚至造成疫情的反弹或加重,造成一定的经济损失和不利影响。

随着近年人工智能和大数据的发展,计算机技术被广泛地应用在各个领域。机器学习是涉及数学统计理论、计算机建模等多学科、多领域的交叉学科。机器学习的主要作用为研究如何利用计算机模拟人类的学习过程。计算机通过学习现有的知识,进行分类统计、数据挖掘;并从现有的信息当中获取所需的目标或数据。随着人工智能、大数据、云计算以及并行处理的快速发展,人类处理信息的能力得到了极大提高,计算机能够处理和分析海量的数据信息,完成人类大脑所不能完成的功能。

监督学习是一种常用的机器学习方法,分为回归(regression)和分类(classification),前者针对于连续型变量,后者则是针对离散型变量。其中回归模型用于拟合数据集对应的函数模型,而分类模型用于预测数据的类别。现实生活中的典型应用包括垃圾邮件检测、亚马逊的用户个性化推荐、视频网站的“猜你想看”功能等。

监督学习中的回归问题主要分为线性回归和逻辑回归两类。对于回归问题,预计获得的结果是一个函数模型。首先,需要给定一个训练集,然后根据所给训练集学习形成一个数学函数,即根据给定训练集中的点拟合出一条直线或曲线,随后测试这个函数是否足够拟合训练集数据,即当前是否是使代价函数最小的情况,最后得到与给定训练集匹配度最好的函数模型。而回归问题中的逻辑回归虽然被称为回归算法,但它实际上是一种分类学习方法。

监督学习中的分类也是现实生活中比较常见的问题,例如判断一个肿瘤是良性还是恶性,或者邮件是否是垃圾邮件等。典型的分类算法的应用场景的例子,在给定的数据集中,若有一部分数据的类别是已知的,而其余数据的类别未知,用这部分已知数据的全部特征信息来训练分类器,使得学习完毕后,分类器能够把未知类别每一条记录分类到对应的类别中。常见的分类算法有:朴素贝叶斯模型(naivebayesianmode)、k近邻(knn)、支持向量机(svm)等。朴素贝叶斯模型是最简单的分类器,因为它要求每一类别的特征向量都应服从正态分布,所以也被称为概率分类器。对于给定的训练集,knn算法首先将所有样本存储起来,通过分析一个新样本周围的k个最近邻的样本,从而将新样本标记为在k个邻近点中频率最高的类别。

svm是一种基于核函数的分类方法,其原理是求解能够正确划分训练数据集并且形成的几何间距最大的超平面,因此也被称为大间距分类器。它通过某些核函数把特征向量映射到高维空间,然后找到一个高维空间中的能够区分训练数据的最优超平面,该最优超平面能使得距离分割面最近的几个特征向量与分割面间的距离最大化。与分割面距离最近的特征向量被称为“支持向量”,svm模型的算法复杂度是由支持向量的个数决定,而且训练出的模型完全依赖支持向量,所以不易产生过拟合现象。svm是主要用于解决机器学习中的二分类问题,但经过改良后也可以应用于多分类问题。

目前,可能对疫情的严重程度产生影响的因素有:目标国家/地区总确诊病例的数量、新增确诊病例数量、各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、确诊病例年龄构成、不同种类医生数量(不同科室)、护理人员数量、人口流动数量、参与疫情防控的志愿者数量、药品储备情况、新增确诊病例治愈数、新增确诊病例死亡数量、各级医院数量、各级医院可提供病床数、各级医院确诊病例与医护人员比例、确诊病例的病情严重程度(轻症、重症)、确诊病例的职业、确诊病例的行动轨迹、与病情高发地的距离、当地人口密集度、本地确诊病例分布情况、目标地区气候条件(温度、湿度等)、被感染医护人员数量等,将这些因素未经处理与整合的因素称为一级因素。

在所有的一级因素中,有些因素由单一的数据构成,将其称为一级单因素。例如:目标国家/地区总确诊病例的数量、新增确诊病例数量、确诊病例年龄构成、当地人口密集度等因素。对于一级单因素,以目标国家/地区总确诊病例的数量为例,只要提供确诊病例数量这一数据即可,同时这一数据是该因素对应的数据集的全部内容,即所占比重为100%。而有些因素是由多个数据集共同构成的,且这些数据集在该因素中分别对应不同的比重,将这种因素称为一级复合因素。例如:各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、不同种类医生数量(不同科室)、确诊病例的职业、确诊病例的病情严重程度(轻症、重症)等。以不同种类医生数量(不同科室)这一影响因素为例,感染科和呼吸科是最为忙碌的科室,也是疫情的最前线,承担着发热病人的诊断和治疗等一系列工作,因此属于这两个科室的医生数量对于疫情的影响程度最大,而检验科医生需要为就诊的患者做皮试以及检查工作,因此也应占据不小的比重,因此在不同种类医生数量(不同科室)这一影响因素中感染科、呼吸科和检验科的医生数量所占的比重就应大于口腔科、泌尿科等科室医生数量所占的比重。总而言之,在一级复合因素中各数据集所占的比重即为其重要程度,也就是对疫情的影响程度。

将所有一级因素进行分类整合,将得到二级因素,因此所有的二级因素都为复合因素。二级因素分别是:医疗水平、疫情防控力度、地理因素影响、目标地区基础特征。其中,医疗水平因素由各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、不同种类医生数量、护理人员数量、药品储备情况、新增确诊病例治愈数、新增确诊病例死亡数量、各级医院数量、各级医院可提供病床数、各级医院确诊病例与医护人员比例等一级因素组成。疫情防控力度由新增确诊病例数量、参与疫情防控的志愿者数量、确诊病例的职业、确诊病例的行动轨迹、被感染医护人员数量等一级因素组成。地理因素影响由目标地区与病情高发地的距离、目标地区气候条件(温度、湿度等)、本地确诊病例分布情况、人口流动情况等一级因素组成。目标地区基础特征由目标国家/地区总确诊病例的数量、确诊病例年龄构成、确诊病例的职业、人口密集度等一级因素组成。本方法得到的最终结果,即目标地区的疫情风险系数由医疗水平、疫情防控力度、地理因素影响、目标地区基础特征四个二级因素构成。

对所有的二级因素的处理与对一级复合因素的处理相同,即按照二级因素中各一级因素对疫情影响程度的大小,为各一级因素分配比重。例如:对于疫情防控力度二级因素,新增确诊病例数量为主要因素,在分析模型中对于疫情的严重程度起关键作用,而参与疫情防控的志愿者数量等因素为次要因素,因此分配给主要因素的比重就要大于分配给次要因素的比重。由此,为所有的影响因素赋予不同的权重系数,可以使本方法最终得出的疫情风险系数更加客观准确,更符合实际情况。如何根据目标国家/地区的上述因素确定该国家/地区当前的疫情严重程度,并采取相应的疫情防控措施,是防控疫情的关键所在。此外,如何有效的通过计算机模拟和数据分析确定疫情的发展趋势,以及资源的调配,也是影响疫情的主要因素。

根据影响因素的属性将其划分为积极因素和消极因素。积极因素是对疫情起到有效防控作用的影响因素,例如,各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、不同种类医生数量(不同科室)、新增确诊病例治愈数等影响因素。而消极因素是导致疫情恶化、加重的不利影响因素,例如,目标国家/地区总确诊病例的数量、新增确诊病例数量、新增确诊病例死亡数量等影响因素。同时,对于某些影响因素的积极或消极判定,可能会根据实际情况发生改变。例如,对于确诊病例的职业,若为邮递员、餐厅服务员、外卖员或医生等与人有频繁接触的职业,则该影响因素倾向于消极因素;而若为某些与人接触很少的职业,则该影响因素倾向于积极因素。对于与疫情高发地的距离,若与疫情集中爆发地的距离足够远,则该因素偏向于积极因素;但若为疫情集中爆发地周边地区,则该因素偏向为消极因素。

不同的国家/地区之间的贸易情况、人口流动趋势、运输交通等情况也会对疫情的严重程度产生很大影响。例如,若个别地区防控措施松散,病例大量流出,将导致病毒大面积扩散,对该地区周边国家/地区的疫情防控工作带来极大挑战,甚至影响其经济发展及居民正常生活。若个别地区确诊病例密度大,导致病毒附着于某些货物上,这些病毒就可能通过贸易运输输入其他地区,使当地居民染病,对于疫情的防控影响极大。

一个国家/地区的疫情严重程度是多种因素共同作用的结果,这些影响因素各自对目标国家/地区的疫情产生影响,例如目标国家/地区新增确诊病例数量的增大将加重疫情,而医护人员数量的增大会缓解疫情。同时,不同因素之间的相互影响也是评估过程中需要考量的重要部分。例如,在医疗资源非常充足的情况下,确诊病例的数量对该国家/地区疫情严重程度的影响微乎其微,因此若目标国家/地区的医护人员数量远大于确诊病例数量,则确诊病例数量这一影响因素以及相对应的二级因素目标地区基础特征,在对疫情严重程度的影响的评估中所占的权重应该被削弱,而医护人员数量以及相对应的二级因素医疗水平在对疫情严重程度的影响的评估中所占的权重应该被增大,这就体现了影响因素之间的互相影响也会对整体的疫情造成影响。

为了让本发明中的评估方法更加符合实际情况,需要给不同因素分配相应的权重系数,并且这个权重系数还要根据不同影响因素间的关系进行调整,因此本发明中设置一个浮动模块。该浮动模块的作用为调整影响因素对应的权重系数。该浮动功能包括向上浮动和向下浮动,浮动范围由该影响因素的取值以及其他因素对该因素影响确定。从而保证本发明最终得到的疫情风险系数是客观准确的。

对于众多的影响因素,无论是积极因素还是消极因素都需要被计算机进行模型化处理。首先提取各影响因素的特征信息。对于一级单因素,需获取该影响因素的数据或数据集、对应的二级因素种类、该因素在二级因素中的初始比重、当影响因素值等于0时对应的疫情的严重程度、影响因素值处于正无穷或极大值状态时对应的疫情的严重程度、从0开始不断增加影响因素值时疫情严重程度的变化趋势是否发生变化、该因素是积极因素还是消极因素,或是需要进一步判别等信息。对于一级复合因素,需获取该影响因素的各个子数据或子数据集、对应的二级因素种类、该因素在二级因素中的初始比重、当影响因素值等于0时对应的疫情的严重程度、影响因素值处于正无穷或极大值状态时对应的疫情的严重程度、从0开始不断增加影响因素值时疫情严重程度的变化趋势是否发生变化、该因素是积极因素还是消极因素,或是需要进一步判别的信息,并且设定影响因素中的各个部分分配初始比重值。

收集每个影响因素对应的特征信息形成特征矩阵,输入分类器,进行类别的划分。根据各影响因素大小/多少与疫情严重程度间的函数关系,将所有影响因素划分为三类。其次,对于每个影响因素,将其对应类别的函数关系作为回归模型,用该影响因素的数据或数据集进行回归模拟,拟合出该影响因素与疫情严重间对应的数学函数模型,由该函数得出影响因素的取值对应的疫情严重程度以及在对应的二级因素中所占的比重,即权重系数。然后,将得到的权重系数输入浮动模块进行第一轮调整,并判定该一级因素属于积极因素还是消极因素,从而调整权重系数的符号。根据每类二级因素包含的所有一级因素对应的疫情严重程度以及在对应的二级因素中所占的比重可以得到二级因素的值,然后将所有二级因素输入浮动模块进行权重系数的第二轮调整,并判定该二级因素属于积极因素还是消极因素,从而调整权重系数的符号。最后,计算得出目标地区的疫情风险系数,并分析出对于目标地区影响最大的因素,为政府的防控工作提供精准全面的警示与指导作用,挽救因疫情受损的国民经济,改善百姓生活。



技术实现要素:

本发明的目的是提供一种基于分类回归模型的新冠疫情综合评估方法,能够对目标国家/地区的疫情风险性有更加全面、准确的评估,获取目标国家/地区的疫情风险系数并选取出对目标国家/地区疫情影响最大的影响因素,对疫情的防治工作的开展起到警示和指导作用。

为了解决相关技术中存在的问题,本发明提供一种基于分类回归模型的新冠疫情综合评估方法,包括如下步骤:

part_1:获取对于疫情有影响的因素的特征信息;

part_2:创建分类器,对影响因素进行类别划分;

part_3:拟合影响因素与疫情严重程度间的回归模型;

part_4:计算各级因素的值与权重系数、计算疫情风险系数,并选出对疫情影响最大的因素。

一种基于分类回归模型的新冠疫情综合评估方法,所使用的数据结构如下:

输入分类模型的影响因素(一级因素)特征数据集featureset的数据结构,定义如下:

数据项1,item_1:影响因素名称

数据项2,item_2:影响因素名称对应的二级因素种类

数据项3,item_3:在二级因素中的初始比重

数据项4,item_4:当影响因素值等于0时对应的疫情的严重程度

数据项5,item_5:影响因素值处于正无穷或极大值状态时对应的疫情的严重程度

数据项6,item_6:从0开始不断增加影响因素值时疫情严重程度的变化趋势是否发生改变

数据项7,item_7:积极因素/消极因素,或是需要进一步判别

数据项8,item_8:影响因素中的各个部分及其初始比重,用数组标记和表示

数据项9,item_9:影响因素与疫情严重程度间的函数关系类型,并需要标记。

输入回归模型的影响一级因素回归数据集regressionset的数据结构,定义如下:

数据项1,item_1:影响因素名称

数据项2,item_2:影响因素数据、数据集

数据项3,item_3:影响因素数据、数据集对应的疫情严重程度的取值

数据项4,item_4:影响因素相关标准值

数据项5,item_5:影响因素与疫情严重程度间的函数关系类型。

一级因素结果数据集result1的数据结构,定义如下:

数据项1,item_1:影响因素名称

数据项2,item_2:影响因素的取值对应的疫情严重程度p

数据项3,item_3:在对疫情产生影响的众多因素中影响因素所占的比重w1。

二级因素的数据结构data2set:

数据项1,item_1:二级因素名称

数据项2,item_2:积极因素/消极因素

数据项3,item_3:组成二级因素的一级因素数量

数据项4,item_4:二级因素在分析模型中所占比重w2

数据项5,item_5:由一级因素计算出的二级因素值h。

一种基于分类回归模型的新冠疫情综合评估方法,所使用函数如下:

分类器svm,定义如下:

具体过程:采用机器学习中支持向量机(svm)这一分类算法对影响因素进行多分类处理。构造svm多类分类器的方法为组合多个二分类器来实现多分类器的构造。训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类。分类时将未知样本分类为具有最大分类函数值的一类,这样就用svm解决了多分类问题。

初始数据输入:经过人工标记的部分影响因素的特征数据集对分类器进行训练;剩下的未经人工标记的需要被分类器划分的影响因素的特征数据集。

输出及结果:评估模型的所有因素都被标记。影响因素与疫情严重程度间的函数关系类型相同的视为一类。

回归模型regression,定义如下:

具体过程:本发明中的三种函数模型均为多项式形式。由于多项式的最高次数已经确定,所以采用单变量线性回归算法,通过梯度下降算法找到使损失函数最小的向量,从而获取拟合效果最好的函数模型。其中,自变量是影响因素,因变量是疫情严重程度,初始数据输入由自变量和因变量构成的有序对,输出及结果是函数模型。

一种基于分类回归模型的新冠疫情综合评估方法,所使用的过程描述如下。

系统过程task,具体为:

task{

task_1:提取一级因素的特征信息,构成特征数据集featureset,

task_2:人工标记的一级因素,

task_3:利用经过人工标记的一级因素的特征矩阵labeledfeatures对分类器进行训练,

task_4:利用训练好的分类器将所有一级因素划分为三类,

task_5:将影响因素回归数据集regressionset输入回归模型regression中,拟合出函数模型,

task_6:将一级因素i的数据或数据集输入其对应类别的回归函数模型中,获取p_i和w1_i,

task_7:将一级因素依次输入浮动模块中,通过对比该一级因素的w1与其他一级因素的w1间的大小或比例关系,对其他一级因素的权重系数进行调整,

task_8:计算二级因素值h=w1_1*p_1+w1_2*p_2+...+w1_n*p_n,

task_9:将二级因素依次输入浮动模块中,通过对比该二级因素的w2与其他二级因素的w2间的大小关系,对其他二级因素的权重系数进行调整,

task_10:计算得到疫情风险系数ncov=w2_1*h_1+w2_2*h_2+w2_3*h_3+w2_4*h_4,并求得对疫情影响最大的因素,

task_i:预留用户执行指令和过程,

}

其中,task_1主要实现对影响因素的特征信息的采集,为后续的分类处理做准备。

task_2、task_3和task_4主要用于将输入评估模型的所有影响因素与疫情严重程度间的函数关系类型进行划分,分别为二次项系数为负的二次函数关系,正相关关系和负相关关系。

task_5代表回归算法拟合函数模型的过程。影响因素与疫情严重程度间的函数关系有三种,分别对应三种函数模型:二次项系数为负的二次函数,三次函数以及反比例函数。根据每一个影响因素的数据集以及与疫情严重程度间的函数关系类型,获取该类型对应的函数模型的各项系数,从而得到准确的拟合函数。

task_6和task_7用于计算出一级因素的取值对应的疫情严重程度p以及在对应的二级因素中所占的比重w1,并通过浮动模块对其在二级因素中的权重大小,即该一级因素对疫情的影响大小和重要程度,进行权重削减或权重增加,使得分配给每个一级因素的比重更加符合实际情况。

task_8和task_9通过一级因素的取值对应的疫情严重程度p以及在对应的二级因素中所占的比重w1计算出二级因素的值h,即二级因素对应的疫情严重程度,同时通过浮动模块对各二级因素进行权重削减或权重增加,表示根据实际情况对分析模型进行合理化调整,使得最终结果准确。

task_10代表求得最终结果,即疫情风险系数,同时通过分别比较w2和w1,可以推断出对目标地区的疫情影响最大的因素,对目标地区的疫情防控工作起到警示和指导作用。

task_i是系统给用户预留的执行指令和过程,以满足用户扩展功能的需求。

一种基于分类回归模型的新冠疫情综合评估方法,所述特征如下:

part_1,提取一级因素的特征信息,构成特征矩阵featureset,具体为:

对所有的一级因素进行分类,将其划分为四种二级因素,分别是医疗水平、疫情防控力度、地理因素影响、目标地区基础特征。若该一级因素i对应的二级因素为医疗水平,则其特征数据集featureset_i中的type_i=1;若该一级因素i对应的二级因素为疫情防控力度,则其特征数据集featureset_i中的type_i=2;若该一级因素i对应的二级因素为地理因素影响,则其特征数据集featureset_i中的type_i=3;若该一级因素i对应的二级因素为地区基础特征,则其特征数据集featureset_i中的type_i=4。因此,二级因素i的data2set包括二级因素名称name_i、积极因素/消极因素ps_i、组成二级因素的一级因素数量number_i、二级因素在分析模型中所占比重w2_i、由一级因素计算出的二级因素值h_i。形式化如下:

data2set_i={name_i,ps_i,number_i,w2_i,h_i}.

选取要输入评估模型进行分析的影响因素fact_index,例如:确诊病例年龄fact_1、确诊病例数量fact_2、医护人员数量fact_i、各类医疗物资数量fact_n-1以及各级医院数量fact_n等。输入评估模型进行分析的影响因素越多,得到的疫情风险系数越准确。通过分析影响因素i获取其特征数据集featureset_i,包括影响因素名称name_i,影响因素名称对应的二级因素种类type_i,给定在二级因素中的初始比重w0_i,当影响因素值等于0时对应的疫情的严重程度r1_i,影响因素值处于正无穷或极大值状态时对应的疫情的严重程度r2_i,从0开始不断增加影响因素值时疫情严重程度的变化趋势是否发生变化r3_i,判断是积极因素/消极因素,或是需要进一步判别的因素ps_i,给定影响因素中的各个部分及其初始比重用数组proportion[m]标记和表示,其中m表示子部分数量,影响因素与疫情严重程度间的函数关系类型label_i。由于还没有进行人工标记与分类,影响因素与疫情严重程度间的函数关系类型label_i无取值,故可以设其初值为0,其中,二次项系数为负的二次函数关系对应取值为1,正相关关系对应取值为2,负相关关系对应取值为3。影响因素i对应的特征featureset_i表示,将所有影响因素的特征数据集存储于矩阵中,形成对于全体影响因素的特征矩阵allfeatures_i,形式化如下:

featureset_i={name_i,type_i,w0_i,r1_i,r2_i,r3_i,ps_i,proportion[m]_i,label_i}

allfeatures_i={featureset_1,featureset_2,...,featureset_i,...}

所述特征part_1描述完毕。

一种基于分类回归模型的新冠疫情综合评估方法,所述特征如下:

part_2,创建分类器,对影响因素进行类别划分,具体为:

输入回归模型的影响因素回归数据集regressionset,包括影响因素名称name_i,影响因素数据或数据集data_i,影响因素数据或数据集对应的疫情严重程度的取值或取值数组degree_i,影响因素相关标准值standard_i,影响因素与疫情严重程度间的函数关系类型label_i。选择初始化一部分影响因素进行人工标记,若影响因素i与疫情严重程度之间的函数关系符合二次项系数为负的二次函数关系,则将featureset_i中的label_i以及回归数据集regreesionset_i中的label_i均标记为1;若影响因素i与疫情严重程度之间的函数关系符合正相关关系,则将featureset_i中的label_i以及回归数据集regressionset_i中的label_i均标记为2;若影响因素i与疫情严重程度之间的函数关系符合负相关关系,则将featureset_i中的label_i以及回归数据集regressionset_i中的label_i均标记为3。将这些经过人工标记的影响因素存储于矩阵labeledfeatures中,剩下的没有进行人工标记的影响因素存储于矩阵unlabeledfeatures中。用经过人工标记的影响因素训练分类器,即将特征矩阵labeledfeatures输入分类器svm中,供分类器进行学习。

将特征矩阵unlabeledfeatures输入训练好的分类器中,根据featureset_i中的影响因素值等于0时对应的疫情的严重程度r1_i、影响因素值处于正无穷状态时对应的疫情的严重程度r2_i,与从0开始不断增加影响因素值时疫情严重程度的变化趋势是否发生变化r3_i,这三个特征对unlabeledfeatures中的影响因素进行类别划分。若影响因素i与疫情严重程度之间的函数关系符合二次项系数为负的二次函数关系,则分类器svm将featureset_i中的label_i以及回归数据集regressionset_i中的label_i均标记为1;若影响因素i与疫情严重程度之间的函数关系符合正相关关系,则分类器svm将featureset_i中的label_i以及回归数据集regressionset_i中的label_i均标记为2;若影响因素i与疫情严重程度之间的函数关系符合负相关关系,则分类器svm将featureset_i中的label_i以及回归数据集regressionset_i中的label_i均标记为3。对于输入评估模型的所有影响因素,将label_i一致的影响因素视为一类,由此便将所有的影响因素按其特征属性划分为三类。形式化如下:

regressionset={name_i,data_i,degree_i,standard_i,label_i}

labeledfeatures={feature_m,feature_n,...,feature_p,...}

unlabeledfeatures={feature_q,feature_k,...,feature_t,...}

所述特征part_2描述完毕。

一种基于分类回归模型的新冠疫情综合评估方法,所述特征如下:

part_3,拟合影响因素与疫情严重程度间的回归模型,具体为:

完成part_2后,输入评估模型的所有影响因素就被划分成了三类,而每类对应一种影响因素与疫情严重程度之间的函数形式,分别是二次项系数为负的二次函数,三次函数以及反比例函数。

若影响因素i的回归数据集regressionset_i中的标记label_i=1,则影响因素i与疫情严重程度间的函数关系为二次项系数为负的二次函数形式。将影响因素i对应的回归数据集regressionset_i中的影响因素数值数组data以及影响因素数值数组对应的疫情严重程度的取值数组degree做成有序对,将其存储在test_i数组中,即test0_i={(data0[0],degree0[0]),(data0[1],degree0[1]),..,(dara0[n],degree0[n])}。将影响因素i对应的有序对数据集test_i输入回归模型regression中,这些有序对被表示为函数图像中的标准点。回归算法根据这些标准点计算出符合影响因素i的二次函数各项系数a_i,b_i和c_i,从而拟合出完整的函数关系式function1=a_i*x^2+b_i*x+c_i。

若影响因素i的回归数据集regressionset_i中的标记label_i=2,则影响因素i与疫情严重程度间的函数关系为三次函数形式。将影响因素i对应的回归数据集regressionset_i中的影响因素相关标准值standard_i以及对应的疫情严重程度的取值degree_i做成有序对,在该种情况下,degree_i通常取值为0.5。同时,构成有序对(0,r1)以及(1,r2),其中r1为影响因素i对应的特征数据集feature_i中的r1,r2为影响因素i对应的特征数据集feature_i中的r2。将这些有序对存储在test1_i数组中,即test1_i={(standard_i,degree_i),(0,r1),(1,r2)}。将影响因素i对应的有序对数据集test1_i输入回归模型regression中,这些有序对被表示为函数图像中的标准点。回归算法根据这些标准点计算出符合影响因素i的三次函数各项系数a_i和b_i,从而拟合出完整的函数关系式function2=a_i*x^3+b_i。

若影响因素i的回归数据集regressionset_i中的标记label_i=3,则影响因素i与疫情严重程度间的函数关系为反比例函数形式。将影响因素i对应的回归数据集regressionset_i中的影响因素相关标准值standard_i以及对应的疫情严重程度的取值degree_i做成有序对,在该种情况下,degree_i通常取值为0.5。将该有序对输入回归模型regression中,回归算法就根据这些标准点计算出符合影响因素i的反比例函数系数a_i,从而拟合出完整的函数关系式function3=a_i/x。

三种回归模型形式化为:

function1=a_i*x^2+b_i*x+c_i,

function2=a_i*x^3+b_i,

function3=a_i/x

所述特征part_3描述完毕。

一种基于分类回归模型的新冠疫情综合评估方法,所述特征如下:

part_4,求得各级因素的值与权重系数,计算疫情风险系数,并选出对疫情影响最大的因素,具体为:

首先求得一级因素的取值对应的疫情严重程度p以及在对应的二级因素中所占的比重w1。

若影响因素i的回归数据集regressionset_i中的标记label_i=1,则影响因素i与疫情严重程度间的函数模型function1=a_i*x^2+b_i*x+e_i。求得影响因素i对应的回归数据集regressionset_i中的影响因素数值数组data的加权平均值average_i,并将其代入函数模型function1中。求得的function1(average_i)的值即为影响因素i的结果数据集result_i中的p_i。而影响因素i的结果数据集result_i中的w1_i则为(p_i-0.5)*(1/n)+w0_i的计算结果,其中w0_i为特征数据集featureset_i中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset_i中的number_i值。

若影响因素i的回归数据集regressionset_i中的标记label_i=2,则影响因素i与疫情严重程度间的函数模型function=a_i*x^3+b_i。将影响因素i的回归数据集regressionset_i中的影响因素取值data代入函数模型function2中。求得的function2(data)的值即为影响因素i的结果数据集result_i中的p_i。而影响因素i的结果数据集result_i中的w1_i则为(p_i-0.5)*(1/n)+w0_i的计算结果,其中w0_i为特征数据集featureset_i中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset_i中的number_i值。

若影响因素i的回归数据集regressionset_i中的标记type_i=3,则影响因素i与疫情严重程度间的函数模型function3=a_i/x。将影响因素i的回归数据集regressionset_i中的影响因素取值data代入函数模型function3中。求得的function3(data)的值即为影响因素i的结果数据集result_i中的p_i。而影响因素i的结果数据集result_i中的w1_i则为(p_i-0.5)*(1/n)+w0_i的计算结果,其中w0_i为特征数据集featureset_i中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset_i中的number_i值。

对上述处理的一级因素依次输入浮动模块中,进行权重系数的调整。将输入的一级因素i的w1_i与除它外的一级因素j的w1_j进行比较,然后根据w1的大小/比例关系对w1_i进行相应的增大(减少),对w1_j进行相应的减少(增大),即w1_i=w1_i+/-δw,w1_j=w1_j+/-δw。接着将一级因素i的w1_i分别与除他外的所有一级因素的w1按上述步骤进行比较和调整。由此就完成了对权重系数的第一轮调整。

对属于同一类二级因素的所有一级因素的权重系数进行按比例归一化处理,使得所有权重系数的和为1,即w1_i=w1_i/(w1_i+w1_(i+1)+...+w1_m),当所有的权重系数都经过按比例缩放处理后,有w1_i+w1_(i+1)+...+w1_m=1。通过影响因素的自身属性以及对应的疫情严重程度p的大小,判定该因素属于积极因素还是消极因素,若是积极因素,则将其权重系数w1记为负数,即w1=-w1;若是消极因素,则其权重系数w1不发生改变。然后将每一类二级因素包含的所有一级因素i对应的疫情严重程度p_i与经过调整的权重系数w1_i相乘得到部分积m_i,即m_i=p_i*w1_i,然后将得到的所有部分积相加,就得到二级因素j的值h_j,即h_j=m_1+m_2+...+m_n,其中n为二级因素中包含的一级因素数量,即featureset_i中的number_i值。

按照对权重系数的第一轮调整的方法,对四类二级因素的权重系数w2进行第二轮调整。调整过后,根据二级因素的值h及其自身属性,判断该因素属于积极因素还是消极因素,若是积极因素,则将其权重系数w2记为负数,即w2=-w2;若是消极因素,则其权重系数w2不发生改变。

最后计算得到目标地区的疫情风险系数ncov=w2_1*h_1+w2_2*p_2+w2_3*p_3+w2_4*p_4。比较所有二级因素的权重系数w2,其中权重系数w2最大的二级因素被判定为目标国家/地区对疫情严重程度影响最大的方面。同时在每类二级因素中,权重系数w1最大的因素为对该方面影响最大的因素。由此,获取对于本地疫情影响最大的综合因素,即医疗水平、疫情防控力度、地理因素影响、目标地区基础特征中权重系数最大的一类,这就给疫情的防控工作提供了更加准确的警示与指导信息,能够帮助目标地区进行疫情防控工作的开展和优化。同时本方法还能分别获取每个二级因素中,所占比重最大的一级因素,这就给疫情的防控工作提供了更加细致的讯息,便于细化疫情防控工作,从而使疫情的防控获得更好的效果。所述特征part_4描述完毕。

一种基于分类回归模型的新冠疫情综合评估方法,本发明的有益效果如下:

(1)综合多种因素对疫情风险进行分析。

常见的评估模型大多基于单一因素,但疫情是多种因素共同作用导致的结果。所以由单一影响因素分析得到的疫情风险性自然不够准确。本发明提出的基于分类回归模型的新冠疫情综合评估方法,能够对所有可能对疫情产生影响的因素进行综合分析,得到全面而准确的疫情风险评估结果。而且,本评估方法还可以筛选出对目标国家/地区的疫情影响最大的因素,这为目标国家/地区的防疫工作起到了警示与提醒作用,使其更好的开展疫情防护工作。

(2)应用机器学习和影响因素的模型特征,便于对海量数据进行处理。

对目标国家/地区的疫情产生影响的因素非常多,数据集也非常大,如果人工分析,效率会很低。因此本发明中的基于分类回归模型的新冠疫情综合评估方法中采用机器学习算法,通过对分类器进行训练,使其准确而高效的完成对于人来说繁重复杂的工作,使本发明中的基于分类回归模型的新冠疫情综合评估方法更加准确高效,实现预期作用。

(3)能够选出对目标国家/地区疫情影响最大的方面,以及在各个方面中对疫情影响最大的因素。

现有的评估模型大多只是得出目标国家/地区的疫情风险等级,这一结果确实可以展示防疫工作的效果,也可以起到一定的警示和提醒作用,但对于防疫工作的改进和优化而言,该结果不具备指导作用。本发明提出的基于分类回归模型的新冠疫情综合评估方法,可以分析输入评估模型的所有因素中对目标国家/地区疫情影响最大的宏观方面,也就是目标国家/地区防疫工作最薄弱的关键部分,对疫情防控工作的开展和优化起到了宏观调控作用,便于国家和政府抓住疫情的重点要点。同时,本发明可以获得在各个宏观部分中占据比重最大的影响因素,这就为疫情的防控工作提供了更加细致精准的警示和指导作用,能够大大提升疫情防控工作的效果。

附图说明

图1是一种基于分类回归模型的新冠疫情综合评估方法的主要过程示意图。

具体实施方式

下面结合附图和实施例对本发明的实施做进一步详细描述,以下实施例用于说明本发明,但不能用来限制本发明的范围。

例子1:影响因素的级别与类别的划分及其初始化过程。

选取的输入评估模型的影响因素有:目标国家/地区总确诊病例的数量、新增确诊病例数量、各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、确诊病例年龄构成、不同种类医生数量(不同科室)、护理人员数量、人口流动数量、参与疫情防控的志愿者数量、药品储备情况、新增确诊病例治愈数、新增确诊病例死亡数量、各级医院数量、各级医院可提供病床数、各级医院确诊病例与医护人员比例、确诊病例的病情严重程度(轻症、重症)、确诊病例的职业、确诊病例的行动轨迹、与病情高发地的距离、当地人口密集度、本地确诊病例分布情况、目标地区气候条件(温度、湿度等)、被感染医护人员数量。其中一级复合因素有:各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、确诊病例的病情严重程度(轻症、重症)、药品储备情况、目标地区气候条件(温度、湿度等)和同种类医生数量(不同科室)。

对于所有的一级因素,二级因素医疗水平由各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、不同种类医生数量(不同科室)、护理人员数量、药品储备情况、新增确诊病例治愈数、新增确诊病例死亡数量、各级医院数量、各级医院可提供病床数、各级医院确诊病例与医护人员比例等一级因素组成,因此,这些一级因素的特征数据集中的对应的type值为1。疫情防控力度由新增确诊病例数量、参与疫情防控的志愿者数量、确诊病例的职业、确诊病例的行动轨迹、被感染医护人员数量等一级因素组成,因此,这些一级因素的特征数据集中的对应的type值为2。地理因素影响由目标地区与病情高发地的距离、目标地区气候条件(温度、湿度等)、本地确诊病例分布情况、人口流动情况等一级因素组成,因此,这些一级因素的特征数据集中的对应的type值为3。目标地区基础特征由目标国家/地区总确诊病例的数量、确诊病例年龄构成、确诊病例的职业、人口密集度等一级因素组成,因此,这些一级因素的特征数据集中的对应的type值为4。

以属于医疗水平的一级复合因素各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)为例,其特征数据集中对应的type值为1。同时按照该因素对于疫情的影响程度,将其在二级因素中所占的初始比重w0设置为0.2。该影响因素值等于0时对应的疫情的严重程度为100%,即r1=1;该影响因素值处于正无穷或极大值状态时对应的疫情的严重程度为0,即r2=0,从0开始不断增加影响因素值时疫情严重程度的变化趋势不会改变,即r3=0(1表示是,0表示不是),该影响因素属于积极因素还是消极因素,需要进一步判别,因为当医疗物资储备极其充足时,该因素对疫情的防控是有利的,属于积极因素;而当医疗物资储备严重不足时,该因素对疫情的防控是有害的,属于消极因素,因此,ps=0(0表示属性需进一步判定,1表示积极因素,2表示消极因素)。防护服,防护面罩,呼吸机属于至关重要的医疗物资,因此将这三部分的初始比重设为0.3,即proportion[0]=proportion[1]=proportion[2]=0.3,而消毒设备相比于其他三种因素属于次要物资,因此将其初始比重设置为proportio3[m]=0.1。假设选中该因素为需进行人工标记的影响因素,则该影响因素与疫情严重程度间的函数关系类型属于反比例函数关系,因此特征数据集featureset中对应的label值为3。因此,属于医疗水平的一级复合因素各种医疗物资储备情况的特征数据集featureset的格式及内容为:

featureset={“医疗物资储备情况”,1,0.2,1,0,0,0,{0.3,0.3,0.3,0.1},3}.

例子2:评估模型中的分类过程。

输入评估模型的影响因素有:目标国家/地区总确诊病例的数量、新增确诊病例数量、各种医疗物资储备情况(例如:防护服,防护面罩,消毒设备,呼吸机等)、确诊病例年龄构成、不同种类医生数量(不同科室)、护理人员数量、人口流动数量、参与疫情防控的志愿者数量、药品储备情况、新增确诊病例治愈数、新增确诊病例死亡数量、各级医院数量、各级医院可提供病床数、各级医院确诊病例与医护人员比例、确诊病例的病情严重程度(轻症、重症)、确诊病例的职业、确诊病例的行动轨迹、与病情高发地的距离、当地人口密集度、本地确诊病例分布情况、目标地区气候条件(温度、湿度等)、被感染医护人员数量。

首先选取一部分影响因素进行人工分类,从而对分类器进行训练。例如,对于各级医院确诊病例与医护人员比例这一影响因素,当该影响因素值等于0时对应的疫情的严重程度为0,因此其特征数据集featureset中对应的r1=0;当该影响因素值处于正无穷或极大值状态时对应的疫情的严重程度为100%,因此其特征数据集featureset中对应的r2=1;从0开始不断增加影响因素值时疫情严重程度的变化趋势不会改变,因此其特征数据集featureset中对应的r3=0(1表示是,0表示不是)。通过人工判断,该影响因素与疫情严重程度间的函数关系类型属于三次函数关系,即其特征数据集featureset中对应的label值为2。对于确诊病例年龄构成这一影响因素,当该影响因素值等于0时对应的病患数量,也就是疫情的严重程度,其值为该年龄对应的确诊病例数量与该地区总确诊病例数量的比值,记为rate1,因此其特征数据集featureset中对应的r1=rate1;当该影响因素值处于正无穷或极大值状态时对应的病患数量,也就是疫情的严重程度,其值为该年龄对应的确诊病例数量与该地区总确诊病例数量的比值,记为rate2,因此其特征数据集featureset中对应的r2=rate2;从0开始不断增加影响因素值时疫情严重程度的变化趋势会改变,也就是函数关系图像存在拐点,因此其特征数据集featureset中对应的r3=1(1表示是,0表示不是)。通过人工判断,该影响因素与疫情严重程度间的函数关系类型属于二次项系数为负的二次函数关系,即其特征数据集featureset中对应的label值为1。对于与病情高发地的距离这一影响因素,当该影响因素值等于0时疫情的严重程度为100%,因此其特征数据集featureset中对应的r1=1;当该影响因素值处于正无穷或极大值状态时疫情的严重程度为0,因此其特征数据集featureset中对应的r2=0;从0开始不断增加影响因素值时疫情严重程度的变化趋势不会改变,因此其特征数据集featureset中对应的r3=0(1表示是,0表示不是)。通过人工判断,该影响因素与疫情严重程度间的函数关系类型属于反比例函数关系,即其特征数据集featureset中对应的label值为3。同时将影响因素所对应的回归数据集regressionset中的label进行赋值,其中回归数据集regressionset中的label值等于特征数据集featureset中对应的label值。

将上述已经进行人工标记的影响因素的特征数据集输入分类器中,并用训练好的分类器对剩余的没有经过人工标记的影响因素进行分类,即获取所有因素的回归数据集regressionset中的label值。

例子3:评估模型中的回归过程。

以确诊病例年龄这一影响因素进行举例说明:若影响因素i的回归数据集regressionset中的标记label=1时的回归过程。对确诊病例年龄数据集进行统计分析,即统计每个年龄age_i对应的确诊病例数量number_i,形成一系列有序对(age_i,number_i)。将这些有序对作为标准点,输入回归模型regression中,回归算法根据这些标准点计算出符合影响因素i的二次函数各项系数a_i,b_i和c_i,从而拟合出完整的函数关系式function1=a_i*x^2+b_i*x+c_i,即确诊病例年龄age与年龄为age的确诊病例数量number,也就是疫情严重程度间关系的数学形式表达。

以确诊病例占目标国家/地区总人口的比值这一影响因素进行举例说明:若影响因素i的回归数据集regressionset中的标记label=2时的回归过程。查阅目标国家/地区的相关规定以及权威文献,选取几种在当地较为普遍的普通流行疾病,并获取这几种普通流行疾病的病例占当地总人口的比重,求得其平均值averagesick。当确诊病例占目标国家/地区总人口的比值为0,即没有人患病的时候,对应的疫情严重程度设为0,对应有序对(0,0);当确诊病例占目标国家/地区总人口的比值为1,即假设目标国家/地区的所有居民全部确诊的情况,对应的疫情严重程度设为1,对应有序对(1,1);当确诊病例占目标国家/地区总人口的比值等于averagesick的时候,对应的疫情严重程度设为0.5,对应有序对(averagesick,0.5)。将上述所得有序对作为标准点,输入回归模型regression中,这些有序对被表示为函数图像中的标准点。回归算法根据这些标准点计算出符合影响因素i的三次函数各项系数a_i和b_i,从而拟合出完整的函数关系式function2=a_i*x^3+b_i,即为确诊病例占目标国家/地区总人口的比值这一影响因素与疫情严重程度间关系的数学形式表达。

以医护人员数量与确诊病例数量的比例这一影响因素进行举例说明:若影响因素i的回归数据集regressionset中的标记label=3时的回归过程。查阅目标国家/地区的相关规定以及权威文献,获得目标国家/地区规定的医护人员与病例的基准比例standard。当医护人员数量与确诊病例数量的比例为0,即医护人员极其稀缺的时候,对应的疫情严重程度设为正无穷;当医护人员数量与确诊病例数量的比值为正无穷,即医护人员充足的时候,对应的疫情严重程度近似为0;当医护人员数量与确诊病例数量的比值等于standard时,对应的疫情严重程度设为0.5,对应有序对(averagesick,0.5)。将上述所得有序对作为标准点,输入回归模型regression中,回归算法就根据这些标准点计算出符合影响因素i的反比例函数系数a_i,从而拟合出完整的函数关系式function3=a_i/x,即医护人员数量与确诊病例数量的比例与疫情严重程度间关系的数学形式表达。

例子4:评估模型中的浮动模块工作过程。

选取目标国家/地区总确诊病例的数量、确诊病例年龄构成、确诊病例占目标国家/地区总人口的比值、当地人口密集度、医护人员数量与确诊病例数量的比例、目标地区气候条件(温度、湿度等)和被感染医护人员数量等影响因素模拟该评估模型中的浮动模块工作过程。

目标国家/地区总确诊病例的数量与疫情严重程度间的关系可由三次函数表示,因此其回归数据集regressionset中的标记label=2,对应的回归函数为function2=a_1*x^3+b_1。将获取的目标国家/地区总确诊病例的数量number1代入回归函数function2中,求得function2(number1)即为目标国家/地区总确诊病例的数量这一影响因素的结果数据集result中的p_1,而结果数据集result中的w1_1则为(p_1-0.5)*(1/n)+w0的计算结果,其中w0为该影响因素特征数据集featureset中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset中的number值。

确诊病例年龄构成与疫情严重程度间的关系可由二次项系数为负的二次函数表示,因此其回归数据集regressionset中的标记label=1,对应的回归函数为function1=a_2*x^2+b_2*x+c_2,其中a_2<0。求得确诊病例年龄数据集的加权平均数averageage,将其代入回归函数function1中,得到的数值function1(averageage)即为确诊病例年龄这一影响因素的结果数据集result中的p_2。而其结果数据集result中的w1_2则为(p_2-0.5)*(1/n)+w0的计算结果,其中w0为其特征数据集featureset中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset中的number值。

医护人员数量与确诊病例数量的比例与疫情严重程度间的关系可由反比例函数表示,因此其回归数据集regressionset中的标记label=3,对应的回归函数为function3=a_3/x。将医护人员数量与确诊病例数量的比例rate1代入回归函数function3中,得到的function3(rate1)即为医护人员数量与确诊病例数量的比例这一影响因素的结果数据集result中的p_3。而其结果数据集result中的w1_3则为(p_3-0.5)*(1/n)+w0的计算结果,其中w0为其特征数据集featureset中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset中的number值。

确诊病例占目标国家/地区总人口的比值与疫情严重程度间的关系可由三次函数表示,因此其回归数据集regressionset中的标记label=2,对应的回归函数为function2=a_4*x^3+b_4。将获取的确诊病例占目标国家/地区总人口的比值rate2代入回归函数function2中,求得function2(rate2)即为确诊病例占目标国家/地区总人口的比值这一影响因素的结果数据集result中的p_4,而结果数据集result中的w1_4则为(p_4-0.5)*(1/n)+w0的计算结果,其中w0为该影响因素特征数据集featureset中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset中的number值。

当地人口密集度与确诊病例数量的比例与疫情严重程度间的关系可由反比例函数表示,因此其回归数据集regressionset中的标记label=3,对应的回归函数为function3=a_5/x。将当地人口密集度number2代入回归函数function3中,得到的function3(number2)即为当地人口密集度这一影响因素的结果数据集result中的p_5。而其结果数据集result中的w1_5则为(p_5-0.5)*(1/n)+w0的计算结果,其中w0为其特征数据集featureset中设置的影响因素在二级因素中的权重初值,n为对应的二级因素中包含的一级因素数量,即featureset中的number值。而目标地区气候条件(温度、湿度等)和被感染医护人员数量都属于label=2的情况,分别得到p_6和p_7。

将上述所有因素依次输入浮动模块中,进行权重系数w1的调整。若目标国家/地区总确诊病例的数量对应的w1_1远远大于医护人员数量与确诊病例数量的比例对应的w1_3,则对w1_1进行相应的增大,即w1_1=w1_1+δw1,对w1_3进行相应的减小,w1_3=w1_3-δw1。若当地人口密集度对应的w1_5远远大于医护人员数量与确诊病例数量的比例对应的w1_3或确诊病例占目标国家/地区总人口的比值w1_4,则对w1_5进行相应的增大,即w1_5=w1_5+δw2,对w1_3或w1_4进行相应的减小,即w1_3=w1_3-δw2/2或w1_4=w1_4-δw2/2。由此就完成了对权重系数的第一轮调整。

目标国家/地区总确诊病例的数量、确诊病例年龄构成和当地人口密集度属于二级因素目标地区基础特征,确诊病例占目标国家/地区总人口的比值和被感染医护人员数量属于二级因素疫情防控力度,医护人员数量与确诊病例数量的比例属于二级因素医疗水平,而目标地区气候条件(温度、湿度等)二级因素地理因素影响。

对属于同一类二级因素的所有一级因素的权重系数进行按比例归一化处理,使得所有权重系数的和为1,即w1_i=w1_i/(w1_i+w1_(i+1)+...+w1_m),当所有的权重系数都经过按比例缩放处理后,有w1_i+w1_i+1+...+w1_m=1。若目标国家/地区总确诊病例的数量、确诊病例年龄构成、确诊病例占目标国家/地区总人口的比值、被感染医护人员数量、医护人员数量与确诊病例数量的比例、而目标地区气候条件(温度、湿度等)和当地入口密集度对应的p值大于0.5则属于消极因素,反之,则属于积极因素。若是积极因素,则将其权重系数w1记为负数,即w1=-w1;若是消极因素,则其权重系数w1不发生改变。

二级因素目标地区基础特征的值h1=p_1*w1_1+p_2*w1_2+p_5*w1_5,疫情防控力度的值h2=p_4*w1_4+p_7*w1_7,医疗水平的值h3=p_3*w1_3,而地理因素影响的值h4=p_6*w1_6。

下面对所有的二级因素进行第二轮浮动处理,若疫情防控力度的值h2远大于目标地区基础特征的值h1,则对w2_2进行相应的增大,即w2_2=w2_2+δw3,对w2_1进行相应的减小,w2_1=w2_1-δw3;若疫情防控力度的值h2远大于地理因素影响的值h4,则对w2_2进行相应的增大,即w2_2=w2_2+δw4,对w2_4进行相应的减小,w2_4=w2_4-δw4;若医疗水平的值h3远大于目标地区基础特征的值h1,则对w2_2进行相应的增大,即w2_3=w2_3+δw5,对w2_1进行相应的减小,w2_1=w2_1-δw5若医疗水平的值h3远大于地理因素影响的值h4,则对w2_3进行相应的增大,即w2_3=w2_3+δw6,对w2_4进行相应的减小,w2_4=w2_4-δw6。由此,所有的浮动操作都已描述完毕。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips