HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

信息处理方法、装置、计算机设备及存储介质与流程

2021-01-08 11:01:59|273|起点商标网
信息处理方法、装置、计算机设备及存储介质与流程

本发明涉及计算机技术领域,尤其涉及一种信息处理方法、装置、计算机设备及存储介质。



背景技术:

随着计算机技术的发展,利用数据挖掘技术对来自各地的诊断事件中所产生的诊断数据进行统计,并将统计的数据作为诊断工具的数据来源,但是目前对诊断事件中所产生的诊断数据的统计仍然停留在利用数学统计的方法来对诊断事件中产生的诊断数据进行统计,然而基于这一统计结果所构建的诊断工具中不仅不能清晰直观地了解到诊断数据的分布情况,而且所得到的统计结果也无法准确地反映出诊断事件的症状分布。



技术实现要素:

本发明实施例提供了一种信息处理方法、装置、计算机设备及存储介质。

本发明实施例的技术方案是这样实现的:

本发明实施例提供了一种信息处理方法,所述方法包括:

获取诊断事件中的症状特征信息;

根据所述症状特征信息,构建第一拓扑图;其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征,所述第一拓扑图的边对应于所述症状特征之间的关联关系;

根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点;

根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。

上述方案中,所述根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点,包括:

获取所述第一拓扑图中两个节点之间的边的权重信息,其中,所述边的权重信息表征所述两个节点对应的症状特征之间的关联度;

根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述第一拓扑图中的种子节点;其中,中心度用于表征对应节点在拓扑图中的重要程度。

上述方案中,所述获取所述第一拓扑图中两个节点之间的边的权重信息,包括:

根据所述第一拓扑图中两个节点之间的联合熵,以及所述两个节点分别对应的节点自信息,确定所述两个节点之间的边的权重信息。

上述方案中,所述根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述第一拓扑图中的种子节点,包括:

根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度;

根据所述各个节点的第二中心度,选择所述第二中心度满足预定条件的节点作为种子节点。

上述方案中,根据所述节点信息,分别确定所述两个节点的邻节点集;

根据所述两个节点的邻节点集的相似度,确定所述两个节点之间的距离信息;

所述根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度,包括:

根据所述两个节点之间的距离信息,以及所述两个节点之间的边的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度。

上述方案中,所述根据所述症状特征信息,构建第一拓扑图,包括:

对所述症状特征信息进行聚类,得到聚类结果;

根据所述聚类结果,构建第一拓扑图。

上述方案中,所述根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图,包括:

以所述种子节点为中心,建立局部社区;

遍历与所述种子节点连接的节点,根据所述节点信息,逐步判断与所述种子节点连接的节点是否能够加入所述局部社区;

将能够加入所述局部社区的节点与所述种子节点一起构成新的局部社区;

根据所述第一拓扑图中所有种子节点所构成的新的局部社区,构建作为诊断工具的第二拓扑图。

本发明实施例还提供一种信息处理装置,所述装置包括:

获取模块,用于获取诊断事件中的症状特征信息;

第一构建模块,用于根据所述症状特征,构建第一拓扑图;其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征;所述第一拓扑图的边对应于所述症状特征之间的关联关系;

确定模块,用于根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点;

第二构建模块,用于根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。

本发明实施例还提供一种计算机设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中所述处理器用于运行所述计算机程序时,实现如上述所述的信息处理方法。

本发明实施例还提供一种计算机存储介质,存储有可执行程序,所述可执行程序被处理器执行时,实现如上述所述的信息处理方法。

上述实施例所提供的信息处理方法、装置、计算机设备及存储介质,通过获取诊断事件中的症状特征信息;根据所述症状特征信息,构建第一拓扑图,其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征,所述第一拓扑图的边对应于所述症状特征之间的关联关系;根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点;根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。也就是说,上述实施例能够将诊断事件中的症状特征信息规划成第一拓扑图,然后再基于所述第一拓扑图中节点的节点信息,来确定所述第一拓扑图中的种子节点,最后还能够根据所确定的种子节点重新划分第一拓扑图,从而构建作为诊断工具的第二拓扑图,如此,由于不仅将症状特征信息以拓扑图的形式记录在诊断工具中,同时还会对基于症状特征信息构建的拓扑图再进行重新规划布局,以得到更为准确的症状特征信息分布图,因此,通过这一重新构建的第二拓扑图能够更加清楚直观且更准确地反应出症状特征信息的相关分布情况,从而为诊断工具用于诊断时提供更具参考价值的数据来源。

附图说明

图1为本发明实施例所提供的信息处理方法的流程示意图;

图2为本发明实施例所提供的信息处理方法构建的第一拓扑图;

图3为本发明具体实施例所提供的信息处理方法的流程示意图;

图4为本发明具体实施例所提供的信息处理方法构建的第一拓扑图;

图5为本发明具体实施例所提供的信息处理方法构建的第二拓扑图;

图6为本发明实施例所提供的信息处理装置的功能结构示意图;

图7为本发明实施例所提供的计算机设备的硬件结构示意图。

具体实施方式

以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明实施例提供的信息处理方法,应用于计算机设备中,其中,所述计算机设备可以是客户端、服务器,其中,客户端可以包括手机、平板电脑、可穿戴式设备;服务器可以包括:网络服务器、代理服务器、应用程序服务器等。实际上,所述信息处理方法主要应用于诊断工具所承载的客户端或相关应用软件的服务器所提供的服务器中。在本发明实施例中,计算机设备能够将诊断事件中的症状特征信息进行收集,并规划成第一拓扑图,然后再基于所述第一拓扑图中节点的节点信息,来确定所述第一拓扑图中的种子节点,最后还能够根据所确定的种子节点重新规划第一拓扑图,从而构建作为诊断工具的第二拓扑图,如此,由于不仅将症状特征信息以拓扑图的形式记录在诊断工具中,同时还会对基于症状特征信息构建的拓扑图再进行重新规划布局,以得到更为准确的症状特征信息分布图,因此,通过这一重新构建的第二拓扑图能够更加清楚直观且更准确地反应出症状特征信息的相关分布情况,从而为诊断工具用于诊断时提供更具参考价值的数据来源。

本发明实施例提供一种信息处理方法,图1为本发明实施例所提供的信息处理方法的流程示意图,如图1所示,所述方法包括以下步骤:

步骤101:获取诊断事件中症状特征信息。

这里,所述诊断事件包括疾病的诊断事件、机器设备的维修诊断事件等。所述症状特征信息表征的是所述疾病或者机器在该诊断事件中所表现出的状态特征。例如,若所述诊断事件为疾病的诊断事件时,以所述疾病为感冒为例,那么对应所述诊断事件中的症状特征信息可以包括发热、咳嗽等症状特征信息。若所述诊断事件为机器设备的维修诊断事件时,以所述机器设备的维修诊断事件为手机内存空间已满事件为例,那么对应的所述诊断事件中的症状特征信息可以包括手机死机、手机的处理速度变慢等。

这里,所述获取诊断事件中症状特征信息,可以包括计算机设备直接获取用户输入的诊断事件对应的症状特征信息;当然,还可以包括接收来自网络中的针对所述诊断事件对应的症状特征信息。

步骤102:根据所述症状特征信息,构建第一拓扑图;其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征,所述第一拓扑图的边对应于所述症状特征之间的关联关系。

这里,根据所述症状特征信息,可以将症状特征信息中所描述的症状特征作为第一拓扑图的节点,以同一诊断事件作为所述症状特征之间的关联关系构建症状特征对应的节点的边。

具体地,请参见图2,图2为本发明实施例所提供的信息处理方法构建的第一拓扑图,如图2所示,可以理解的是,同一诊断事件的症状特征对应的节点相互连接,以表征症状特征之间的关联关系。这里,诊断事件a包含有abc三个症状特征,将abc连接起来的边表征abc对应的三个症状特征关联关系;相应地,诊断事件b包含有bcd,将bcd连接起来的边表征bcd三个症状特征的关联关系。这里,a和d没有连接在一起,表征a和d对应的症状特征不存在关联关系,也就是a和d对应的症状特征不属于同一诊断事件。据此,根据所述症状特征信息,以及症状特征信息之间的关联关系,构建第一拓扑图。

需要补充的是,在所述步骤102之前,所述方法还包括:对所述症状特征信息进行预处理。

在一实施方式中,所述对所述症状特征信息进行预处理,包括:对所述症状特征信息数字化处理,例如可以利用布尔值来对症状特征信息进行数字化处理,可以对存在的症状特征用“1”表示,对不存在的症状特征用“0”表示。例如,表1为利用布尔值对症状特征信息的示意表。如表1所示,诊断事件a所出现的症状特征包括a,b,c;诊断事件b所出现的症状特征包括b,c,d。

通过对症状特征信息的数字化处理之后,能更加清楚地看到哪些症状特征是共现特征,也就是在不同诊断事件中同时出现的症状特征,再基于各个症状特征之间的共现情况,构建第一拓扑图。

表1

在另一实施方式中,所述对所述症状特征信息进行预处理,还包括:对所述症状特征信息进行聚类,得到聚类结果;基于所述聚类结果,构建第一拓扑图。

这里,所述对所述症状特征信息进行聚类,实际上,可以包括对所述症状特征信息进行语义聚类。例如,以诊断事件为感冒为例,所述感冒对应的症状特征包括:发烧、发热、咳嗽等。那么根据对所述症状特征信息进行语义聚类,可以将所述症状特征中所记载的“发烧”和“发热”聚类成“热感”。

通过对所述症状特征信息语义聚类,可以减少对同一症状的冗余记载。然后根据聚类结果,依据聚类之后所述症状特征信息所在的类,构建第一拓扑图。如此,可以减少第一拓扑图中的冗余节点,提高了第一拓扑图的可读性。

步骤103:根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点。

在一实施方式中,所述步骤103,可以包括:获取所述第一拓扑图中两个节点之间的边的权重信息,其中,所述边的权重信息表征所述两个节点对应的症状特征信息之间的关联度;根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述第一拓扑图中的种子节点;其中,中心度用于表征对应节点在拓扑图中的重要程度。

本实施例在确定第一种子节点的过程中,还会将所述两个节点之间的边的权重信息纳入考虑范围,相比现有技术中仅仅考虑到单个节点自身的节点信息计算中心度而言,根据所述第一拓扑图中两个节点之间的边的权重信息,以及对应节点的第一中心度所确定的种子节点更加准确。

这里,所述获取所述第一拓扑图中两个节点之间的边的权重信息,包括:根据所述第一拓扑图中两个节点之间的联合熵,以及所述两个节点分别对应的节点自信息,确定所述两个节点之间的边的权重信息。

需要说明的是,自信息是由克劳德·香农提出的,是用来衡量单一事件发生时所包含的信息量多寡的。这里,所述节点自信息表征节点自身的信息量。例如,所述节点xi的自信息可以通过公式(1)计算得到。

h(xi)=-p(xi)log2p(xi)(1)

其中,h(xi)表示每个症状特征对应的节点xi的自信息;p(xi)表示xi的概率空间;p(xj)表示xj的概率空间。

需要说明的是,联合熵是指度量一个联合分布的随机系统的不确定度,联合熵的物理意义是,观察一个多个随机变量的随机系统获得的信息量。这里,所述两个节点之间的联合熵实际上是考虑两个节点之间的关联程度的一个重要指标,在本实施例中,可以通过公式(2)计算得到xi节点和xj节点之间的联合熵。

其中,h(xi,xj)表示节点xi与节点xj之间的联合熵。

由于在计算两个节点之间的边的权重信息时,不仅考虑到两个节点之间的联合熵,同时还考虑到了两个节点分别的节点自信息,如此一来,使得利用这种方式所获得的所述两个节点之间的权重信息更加精准。

在实施例中,所述两个节点之间的边的权重信息可以依据公式(3)进行计算。

其中,iij*表示节点xi与节点xj之间的权重。

进一步地,在一实施方式中,所述根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述第一拓扑图中的种子节点,包括:根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定给所述对应节点的第二中心度;根据所述各个节点的第二中心度,选择所述第二中心度满足预定条件的节点作为种子节点。

在本实施例中,首先基于所述两个节点之间的权重信息对对应的节点的第一中心度进行重新计算,确定所述对应节点的第二中心度,然后根据各个节点中的第二中心度,选择所述第二中心度满足预定条件的节点作为种子节点。

这样,通过两个节点之间的权重信息对对应节点的中心度进行调整,使得对应节点的中心度调整之后能够更加精准表征所述对应节点在拓扑图中的重要程度,从而为基于种子节点对第一拓扑图进行重新划分所得到的第二拓扑图的数据分布准确性提供了基础。

具体地,第一中心度的计算可以通过公式(4)获得。

其中,dv表示节点在第一拓扑图中的第一中心度;n是第一拓扑图中总的节点数,v表示第一拓扑图中所计算的当前节点,link(v)是节点v的邻居节点集,∑evv'是节点v的度。

在本实施例中,调整第一中心度可以利用公式(5)实现。

其中,d(vi)表示节点vi的第二中心度,也就是基于节点之间的权重信息对第一节点中心度进行调整后,计算得到的对应节点的第二中心度。节点vj是vi的邻居节点,wij是节点vi和节点vj对应边的权重,是节点vi的第一中心度,越大,则节点vi在整个网络中的中心度越大。

这里,所述选择所述第二中心度满足预定条件的节点作为种子节点,可以包括:选择所述第二中心度大于阈值的节点作为种子节点。

在另一实施方式中,所述选择所述第二中心度满足预定条件的节点作为种子节点,还可以包括:根据所述第二中心度对所述各个节点进行降序排列,选择前预定数值的节点作为种子节点。

这样,可以根据第一拓扑图中各个节点目前的情况智能地选择出第二中心度排在前几位的节点作为种子节点,可以减少人工的干预,同时能够适应于不同的拓扑图的节点情况。

进一步地,在另一实施方式中,所述方法还包括:根据所述节点信息,分别确定所述两个节点的邻节点集;根据所述两个节点的邻节点集的相似度,确定所述两个节点之间的距离信息;所述根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度,包括:根据所述两个节点之间的距离信息,以及所述两个节点之间的边的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度。本实施例中,将所述两个节点之间的距离信息作为第二中心度的考虑参数之一,如此,可以避免因为两个节点的距离过近,被同时确定为种子节点造成对第一拓扑图的重新划分后数据分布的准确性不高的现象。

在本实施例中,所述两个节点之间的距离信息可以通过公式(6)进行计算。

其中,link(vi)和link(vj)分别表示种子节点vi和vj的邻节点集,通过公式(6)可以计算出节点vi和节点vj对应的邻节点集的相似度,可以理解的是,节点vi和节点vj对应的邻节点集的相似度越高,则表征节点vi和节点vj的共用邻节点越多,也就是节点vi和节点vj的距离也就越近。

若节点vi和节点vj是两个很接近的节点,如果将这两个很接近的节点都确定为种子节点的话,不利于后续基于种子节点对第一拓扑图的重新规划,从而减弱后续基于种子节点的重新规划的第二拓扑图的参考性,导致数据布局不准确。因此,本实施例将所述两个节点之间的距离信息作为确定种子节点的参考信息之一,能够提高数据分布的准确性。

步骤104:根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。

这里,所述步骤104可以包括:以所述种子节点为中心,建立局部社区;遍历与所述种子节点连接的节点,根据所述节点信息,逐步判断与所述种子节点连接的节点是否能够加入所述局部社区;将能够加入所述局部社区的节点与所述种子节点一起构成新的局部社区;根据所述第一拓扑图中所有种子节点所构成的新的局部社区,构建作为诊断工具的第二拓扑图。

可以理解的是,所述第一拓扑图中所有的节点构成的社区可以称为全局社区,而其中的一个或部分节点构成的社区可以称为局部社区。在本实施例中,可以以种子节点构建局部社区。

需要说明的是,所述遍历与所述种子节点连接的节点,根据所述节点信息,逐步判断与所述种子节点连接的节点是否能够加入所述局部社区,例如,可以包括首先建立以种子节点为中心的局部社区c,然后计算与所述种子节点的连接的节点v对局部社区c的自适应度,对节点v加入c之后,如果因为v的加入,自适应度值变大,那么v对该局部社区c有正向作用,应该加入该局部社区,故被判断为能够加入所述局部社区的节点;否则,所述节点v就不属于所述局部社区,可以将v与所述种子节点进行断开,如此来完成对第一拓扑图的重新划分;最后,根据所述第一拓扑图中所有种子节点所构成的新的局部社区,构建作为诊断工具的第二拓扑图。

具体地,首先可以对种子节点的局部社区c进行初始扩充函数的计算,具体可参见公式(7);其次,利用节点v对局部社区c的自适应度进行计算,具体可参见公式(8)。

其中,fc表示局部社区c的初始扩展函数;表示节点v对局部社区c的自适应度;是社区c内部边的总和;是社区c内部的任意节点与外部所有连边的总和。

上述实施例所提供的信息处理方法,通过获取第一关键词;通过获取诊断事件中的症状特征信息;根据所述症状特征信息,构建第一拓扑图,其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征,所述第一拓扑图的边对应于所述症状特征之间的关联关系;根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点;根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。也就是说,上述实施例能够将诊断事件中的症状特征信息规划成第一拓扑图,然后再基于所述第一拓扑图中节点的节点信息,来确定所述第一拓扑图中的种子节点,最后还能够根据所确定的种子节点重新划分第一拓扑图,从而构建作为诊断工具的第二拓扑图,如此,由于不仅将症状特征信息以拓扑图的形式记录在诊断工具中,同时还会对基于症状特征信息构建的拓扑图再进行重新规划布局,以得到更为准确的症状特征信息分布图,因此,通过这一重新构建的第二拓扑图能够更加清楚直观且更准确地反应出症状特征信息的相关分布情况,从而为诊断工具用于诊断时可提供更具参考价值的数据来源。

为了能够便于对本申请实施例所提供的信息处理方法的进一步理解,提供了一具体实施方式。

本实施例涉及数据挖掘领域的一种中医症状间关联挖掘的方法,现有的症状关联分布规律大都是以文本形式存于数据库中的,缺乏可读性。并且采用的是统计数学的方法对症状进行统计分析的,因此诊断工具在使用这些数据时并没有较大的参考意义。

本实施例提供了一种基于改进后的重叠社区发现方法构建中医症状关联网络,以为诊断工具提供较为准确的症状特征数据的分布情况。

具体地,请参阅图3,图3为本发明具体实施例所提供的信息处理方法的流程示意图;如图3所述,所述方法包括:

步骤31:采集问诊数据集;

这里,所述步骤31可以理解为上述实施例所述的步骤101,即获取诊断事件中症状特征信息。

并且在本实施例中,对采集的问诊数据集首先进行预处理,得到预处理之后的问诊数据集。这里的预处理与上述实施例所述的预处理方式相同。

步骤32:根据所述症状特征共现关系,构建症状特征共现网络;

所述根据症状特征共现关系,构建症状特征共现网络,包括:首先需要利用症状特征共现情况建立症状特征共现网络。假设给定问诊数据集db={x1,x2,...,xn},得到症状特征集为d={x1,x2,...,xm},xi表示问诊数据集中的第i个问诊病案,每一个xi都包含症状特征集d中的每个特征,是一个二值序列。当然,也可以根据问诊数据集,得到证型类别集。

以下,以缺血性中风病问诊数据集为例,表2是缺血性中风病问诊数据集的部分数据的布尔值示意表。

表2

其中,表2中的数字表示一个病例,这里的病例可以理解为上述实施例所述的诊断事件,也就是说,在表2中病例1出现的症状特征至少有x1,x5,x20。根据表2中症状特征间的共现关系,构建症状特征共现网络,需要说明的是,所述症状特征共现网络可以理解为上述实施例所述的第一拓扑图。具体地,可参见图4为本发明具体实施例所提供的信息处理方法构建的第一拓扑图。如图4所示,根据上述表2可以构建缺血性中风病问诊数据集的第一拓扑图。

步骤33:利用关联度系数公式计算共现症状彼此间的关联度;

这里,利用关联度系数公式计算共现症状彼此间的关联度,可以理解为上述实施例所述的计算出两个节点之间的边的权重信息,实际上,这里两个节点之间的边的权重信息可以映射为两个症状之间的关联度。具体地,可以采用上述实施例所述的公式(3)计算得到症状对应的节点之间的边的权重。

具体地,表3为任意两个症状间的关联度示意表,也就是第一拓扑图中任意两个节点之间的边的权重值示意表。

表3

步骤34:将关联度作为对应边的权重,建立初始症状网络;

这里,所谓的初始症状网络实际上是包含了第一拓扑图,以及第一拓扑图中各个节点的边的权重信息的网络拓扑图。

步骤35:利用改进的局部扩展社区发现算法,重新规划所述初始症状网络;

这里,利用改进的局部扩展社区发现算法包括在确定种子节点的算法的改进。其中,种子节点的确定方式可以理解为上述实施例确定种子节点的任意方式。在本实施例中,所述种子节点确定中,计算节点的第二中心度可以结合上述实施例所述的公式(4)(5)和(6),然后采用公式(9)进行计算得到。

其中,c(vi)表示根据节点vi和节点vj的第二中心度,具体地是根据节点vi和节点vj的距离信息,以及节点vi的第一中心度计算得到。当然,在其他实施方式中,还可以通过其他计算方式得到节点vi的第二中心度,但是将两个节点的权重信息以及两个距离信息,结合节点本身的第一中心度所得到的第二中心度更加能够准确地反映出该节点的重要程度,也就是该节点在网络拓扑中的中心性。

因此,通过这种方式得到第二中心度能更准确地反应出所述节点在网络拓扑中的重要程度,从而使得根据这一更加准确的第二中心度所确定的种子节点也更加准确,进而为后续根据种子节点来划分第一拓扑图所构建的第二拓扑图能反应的数据分布也更加准确。

具体地,表4为节点的第一中心度与第二中心度的结果示意表。从下表可以看出,经过对所述第一中心度进行调整得到了第二中心度,能够使得种子节点的确定更加准确。

表4

这里,将各个节点按照第二中心度降序排列,选出前预定位数对应的节点作为种子节点,形成种子节点集,以每一个种子节点为一个局部社区。

步骤36:得到症状关联网络。

这里,所述症状关联网络实际上可以理解为上述实施例所述第二拓扑图。在本实施例中,在根据第二中心度确定的种子节点的情况下,利用上述实施例所述的公式(7)和(8)对种子节点进行局部社区扩展,最后基于第一拓扑图中的所有种子节点所扩展的新的局部社区,构建出症状关联网络。

具体地,可参见图5,图5为本发明具体实施例所提供的信息处理方法构建的第二拓扑图,如图5所示,为根据上述方法重新规划布局的缺血性中风病的症状布局情况,从如图5可以看出,缺血性中风病的所有症状划分为两个大的社区,分别是症状4对应的局部社区和症状12对应的局部社区。

上述实施中,能够自动地对网络中的症状进行划分,避免了人工阈值对症状关联挖掘结果的影响;且由于借助改进后的社区发现方法充分考虑了中医症状的特征及分布规律;并且根据这一重新规划的网络布局图清楚直观地了解到症状的分布情况,可读性强。

进一步地,本发明实施例还提供一种信息处理装置,图6为本发明实施例所提供的信息处理装置的功能结构示意图,如图6所示,所述信息处理装置,包括:获取模块61、第一构建模块62、确定模块63及第二构建模块64;其中,

所述获取模块61,用于获取诊断事件中的症状特征信息;

所述第一构建模块62,用于根据所述症状特征,构建第一拓扑图;其中,所述第一拓扑图的节点对应于所述症状特征信息所描述的症状特征;所述第一拓扑图的边对应于所述症状特征之间的关联关系;

所述确定模块63,用于根据所述第一拓扑图中节点的节点信息,确定所述第一拓扑图中的种子节点;

所述第二构建模块64,用于根据所述种子节点,对所述第一拓扑图进行划分构建作为诊断工具的第二拓扑图。

可选地,所述确定模块63,用于获取所述第一拓扑图中两个节点之间的边的权重信息,其中,所述边的权重信息表征所述两个节点对应的症状特征之间的关联度;根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述第一拓扑图中的种子节点;其中,中心度用于表征对应节点在拓扑图中的重要程度。

可选地,所述确定模块63,还用于根据所述第一拓扑图中两个节点之间的联合熵,以及所述两个节点分别对应的节点自信息,确定所述两个节点之间的边的权重信息。

可选地,所述确定模块63,还用于根据所述两个节点之间的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度;根据所述各个节点的第二中心度,选择所述第二中心度满足预定条件的节点作为种子节点。

可选地,所述装置还包括距离确定模块,用于根据所述节点信息,分别确定所述两个节点的邻节点集;

根据所述两个节点的邻节点集的相似度,确定所述两个节点之间的距离信息;

所述确定模块63,还用于根据所述两个节点之间的距离信息,以及所述两个节点之间的边的权重信息,以及对应节点的第一中心度,确定所述对应节点的第二中心度。

可选地,所述第一构建模块62,还用于对所述症状特征信息进行聚类,得到聚类结果;

根据所述聚类结果,构建第一拓扑图。

可选地,所述第二构建模块64,具体用于以所述种子节点为中心,建立局部社区;遍历与所述种子节点连接的节点,根据所述节点信息,逐步判断与所述种子节点连接的节点是否能够加入所述局部社区;将能够加入所述局部社区的节点与所述种子节点一起构成新的局部社区;根据所述第一拓扑图中所有种子节点所构成的新的局部社区,构建作为诊断工具的第二拓扑图。

上述实施例提供的信息处理装置在进行信息处理时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内容结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的信息处理装置与信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

如图7所示,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器72、处理器71及存储在存储器72上并可在处理器71上运行的计算机指令;所述处理器71执行所述指令时实现应用于所述服务器或者客户端中的信息处理方法的步骤。

在一些实施例中,本发明实施例中的存储器62可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的系统和方法的存储器72旨在包括但不限于这些和任意其它适合类型的存储器。

而处理器71可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器71中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器71可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器72,处理器71读取存储器72中的信息,结合其硬件完成上述方法的步骤。

在一些实施例中,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本发明又一实施例提供了一种计算机存储介质,该计算机可读存储介质存储有可执行程序,所述可执行程序被处理器71执行时,可实现应用于所述服务器或客户端中的程序处理方法的步骤。例如,如图1或图2或图3或图4或图5所示的方法中的一个或多个。

在一些实施例中,所述计算机存储介质可以包括:u盘、移动硬盘、只读存储器(rom,readonlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以所述权利要求的保护范围以准。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips