一种中医内科患者数据信息处理方法、系统、装置与流程

2021-01-08 11:01:31|

329|

起点商标网

本发明属于中医内科信息处理技术领域，尤其涉及一种中医内科患者数据信息处理方法、系统、装置。

背景技术：

现在对中医的认可度越来越高，人们也普遍认为中医也能够很好的治疗疾病，甚至一些西医难以治疗或难以找到病因的疾病，通过中医的诊治、治疗能够起到很好的治疗效果。随着中医就诊、入住院人数的增加，患者数据的量级成几何倍数的提升，对患者信息的存储、分类及处理就带来了严峻的考验：

首先是中医患者数据的统一管理问题。目前的现状是就诊和入住院的系统是分开的，问诊的医生看不到患者的入住院信息，入住院的医生看不到就诊患者的信息，而且门诊和病房的信息不能互通，这给医生的诊断带来的一定的繁琐，造成患者的信息、数据不能及时获取，增加了问诊时间。

其次是中医患者数据的模糊匹配问题。在分散于多处的患者数据库中，精准的得到某一特定患者的所有数据往往是一个挑战。一个比较简单的逻辑是通过身份证号，手机号等id来唯一的确定某段数据归属何人。然而，并非所有数据集都录有患者的id信息，更多被记录的只是患者的姓名、年龄、性别等高重复性的数据。采用手机号来作为id也是不合理的，很多手机号没有经过实名认证，往往只是作为临时使用，而且不同人可以重复使用同一个手机号。所以，当进行患者数据的归属匹配时，往往要进行模糊匹配。这就需要设计一套可靠的模糊匹配算法，运用大数据的处理方法，尽可能的提高匹配的成功率。

最后是如何优化海量中医患者数据的查询速度和存储成本的问题。一个中医患者的数据往往会包括轻量级的元数据：姓名、联系方式、年龄、性别等；中量级的流水数据：就诊历史、药方、账单等；也会包括重量级的多媒体数据：x光高清照片，核磁共振成像等。一个患者的数据，小的只有几kb，大的会有几gb甚至几十gb。考虑到一个医院往往要服务于几十万居民，它的患者信息系统必须得能够在tb级数据量下还能满足快速查询和低成本存储的要求。这就要求必须对患者信息系统作出相应的优化。

技术实现要素：

针对现有技术存在的问题，本发明提供了一种中医内科患者数据信息处理方法、系统、装置。

本发明的附加特征和优点将在随后的描述中阐述，其中一部分将从描述中变得明显，或者可以通过实践在此公开的原理而学习到这些特征与优点。本发明的附加特征和优点可以借助在权利要求中具体指出的仪器和组合来实现和获得。这些和其他的本发明特征将从随后的描述和权利要求中变得更为完全地明显，或者可以通过实践在此阐述的原理来获得。

本发明是这样实现的，一种中医内科患者数据信息处理方法包括以下步骤：

第一步，统一患者信息数据格式。

数据采集器采集就诊卡的患者信息及数据，存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，并对在存入数据库前进行格式检查，防止坏数据的存入；对患者信息及数据对象表示为对象标识id与对应的操作id及对应的结果数据的之间的匹配关系，提高了患者信息及数据存储的效率，同时扩展性更好，能够快速响应用户需求的变化。

第二步，患者数据的加密存储。

将第一步所述数据库进行密钥加密处理；提高了数据的可靠性、安全性，便于保护患者的隐私。

第三步，患者就诊时，数据采集器识别就诊卡的条形码等信息，通过usb数据线将信息传输到智能终端上，智能终端根据患者的信息，解密存储在数据库中的患者信息，采用模糊匹配的方法，调取存储在数据库中的患者历次就诊信息、入住院信息等。

所述模糊匹配方法将预处理的患者信息及数据运用统计分析、机器学习的方法，找出数据中的规律，按照患者数据name属性与预处理的患者信息及数据进行语义匹配。

在数据量较小，单台计算机可以处理时，所述模糊匹配方法采用单机处理算法：

在数据量超过了单台计算机处理能力(超过存储介质容量上限)时，所述模糊匹配方法采用海量数据下的一种集合模糊匹配关联算法，如fmlash算法(afuzzymatchinglinkingalgorithmaboutsetunderhadoop)。该方法的关键为基于关键字对数据进行哈希分区，拥有相同关键字的数据被分到同一个分组，但对于需要进行关联的属性值不能直接用作关键字来进行分区操作，相反，使用从其他属性值中产生的签名作为分区关键字，只有当关联的属性值具有至少一个公共签名时才有可能匹配，签名可以是一个字符串中各个单词的列表，也可以是匹配字符串长度的变化区间。

针对数据增加时关联操作效率变低的问题，该算法在hadoop固有的分块策略基础之上对其分块策略再进一步优化，即在分块后再分阶段处理。针对数据处理过程中失真问题，如同一人名或者地址在不同的集合中会出现一定的差异，即使匹配了也不可能总是做到精确的匹配，实际上是满足某个匹配阈值的。即给定两个记录文件r和s、度量函数sim和一个模糊匹配度阈值，该值随着情况改变而动态改变，找出两个集合中的所有记录对s.a和r.a，且满足sim(s.a，r.a)≥k(模糊值)。针对该问题，fmlash算法提出了更广泛的适用度模糊匹配计算方法，即使用一定的标准函数度量集合之间的模糊匹配度，对于满足度量标准的数据再进行关联操作。通过与当前存在的较好处理集合数据的匹配关联算法对比，在集合数据的匹配关联领域表现出了更广阔的应用前景。

第四步，匹配到的患者数据反馈到智能终端中，问诊医生获取这些信息，然后结合患者的当场描述进行问诊；病房的医生也可以通过智能终端、移动终端由数据库调取患者的历次就诊信息、入住院信息等，及时的了解患者的信息，便于制定适合的治疗方案。

本发明提供的中医内科患者数据信息处理方法，还包括数据库内患者数据的大数据优化。设立备份数据库：本发明为了解决数据的存储安全，设立了oracle数据库备份系统；同时为了解决备份数据库中存在大量重复数据的问题，设计了数据块指纹去重机制。具体操作如下：在备份数据库中，首先生成临时备份患者信息及数据文件，然后把临时患者信息及数据文件划分成不重叠的块，通过哈希算法计算每个块的指纹值。然后在备份数据库建立hash表记录已存储患者信息及数据的指纹值；通过对比指纹值，检测重复数据。为了提高数据安全性，采用了一定的安全机制来防止信息泄露以及数据丢失。实验证明，该系统在实现远程备份的同时，有效地减少了备份的数据。

将数据块的指纹值与备份系统索引表中存储的指纹值比较，判断传过来的数据块是否已经存在于备份数据库中。如果不是重复的数据块，就将数据块和数据块的指纹值写入备份数据库的存储服务器中。随着备份数据库中数据块的增多，索引表也越来越大，搜索索引表中的指纹值会变得很低效，为了解决这个问题，对索引表引入二级索引缓存，内存中存放第一级缓存，里面的指纹值是最近发送过来的数据块的指纹值。磁盘中存放第二级缓存，内存中换出的指纹值放在第二级缓存中。

本发明实施例提供的中医内科患者数据信息处理装置的智能终端还包括：

数据处理模块：用于读取存储于本地或服务器的数据，验证登录信息、初始化客户端，并上传数据至数据库，分别标记已上传数据和未上传数据，使得智能终端能通过多种方式，获取到正确的数据，以维持正常工作；

本地存储模块，用于备份数据处理模块从数据库获得的数据，并保存智能终端产生的数据；作为无网络状态下，智能终端获取数据的临时数据库，让智能终端能适应各种使用环境，应对断网的突发情况；

网络检测模块，用于判断当前智能终端是否正常连接网络，以检测结果来让智能终端执行不同的操作，达到无视网络问题，始终正常运行的目的。

移动终端亦包括上述三个模块，但对移动端做了相应优化：

数据处理模块：仅用于从数据库中读取数据；

本地存储模块，用于备份数据处理模块从数据库获得的数据，并采用lru缓存策略限制本地缓存的规模；

网络检测模块，用于判断当前移动终端是否正常连接网络；如正常连接网络则通过数据处理模块从数据库中读取数据，否则从本地存储模块中读取缓存数据。

移动终端通过无线的路由器由数据库调取信息采用了一种无线通信拥塞与故障感知的容错算法：在无线的路由器处添加对故障、拥塞感知模块，感知无线通信的故障和拥塞信息并对其编码，发送给子网中的路由器；子网中的路由器根据接收到的无线的路由器通信对状态编码，判断数据包是否使用无线传输；在不使用无线传输时，采用拥塞避免机制降低无线的路由器周围的通信负载；在无线的路由器通信对无故障时，子网路由器根据接收到的无线的路由器通信对状态编码，平衡有线无线链路的综合利用率；当无线的路由器通信对发生永久性故障时，子网路由器能够提前感知并禁用，避免大量数据包在无线的路由器处重传。

附图说明

图1是本发明实施例提供的中医内科患者数据信息处理方法流程图。

图2是本发明实施例提供的中医内科患者数据信息处理系统的结构示意图。

图3是本发明实施例提供的中医内科患者数据信息处理装置的结构示意图；

图3中：1、数据采集器；2、智能终端；3、数据库；4、路由器；5、移动终端；6、备份数据库。

具体实施方式

针对现有技术存在的问题，本发明提供了一种中医内科患者数据信息处理方法、系统、装置，下面结合附图对本发明作详细的描述。

如图1所示，本发明提供的中医内科患者数据信息处理方法包括：

第一步，统一患者信息数据格式。

患者第一次就诊时，数据采集器采集就诊卡的患者信息及数据，存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，并对在存入数据库前进行格式检查，防止坏数据的存入；对患者信息及数据对象表示为对象标识id与对应的操作id及对应的结果数据的之间的匹配关系，提高了患者信息及数据存储的效率，同时扩展性更好，能够快速响应用户需求的变化。

按照采集对象和数据相对应的原则具体包括：

若干患者信息及数据对象，均用以执行操作，并产生与所述操作对应的结果数据；

数据库，用以存储患者信息及数据对象，所述的数据库为各所述的患者信息及数据及所述结果数据，该患者信息及数据对象表示为对象标识id与对应的操作id及对应的结果数据的之间的匹配关系；

所述的对象标识id为该系统中用以识别对象的唯一标识；

所述的操作id为该系统中各所述对象所执行的操作的统一标识。

第二步，患者数据的加密存储。

将第一步所述数据库进行密钥加密处理；提高了数据的可靠性、安全性，便于保护患者的隐私。密钥加密处理包括：数据库根据安全参数λ，选取阶均为大素数p的椭圆曲线群g与乘法群gt、模p剩余类的一个域zp、一个对称双线性配对映射e：g×g→gt，同时从g中选择两个生成元g1，g2；此外，数据库选择一个单向哈希函数h：{0，1}^*→g、一个伪随机函数f、一个伪随机置换函数π；最后，数据库公开系统参数

智能终端或移动终端随机选取私钥计算公钥同理数据库随机选取私钥计算公钥pk＝gpk^β，同时计算一个验证参数γ＝gpk^inv，其中inv·β≡1(modp)；智能终端或移动终端各自选取签名密钥对。

加密密钥对k组原始数据(明文)进行随机循环移位和迭代异或运算，即加密密钥对k组原始数据(明文)进行喷泉码随机化运算，其结果再进行密钥加扰运算，获得k组密文数据(密文)。k组密文数据(密文)进行逆向密钥解扰运算，其结果再与解密密钥进行逆向随机循环移位和迭代异或运算，即其结果再与解密密钥进行逆向喷泉码随机化运算，恢复k组原始数据(明文)。

第三步，患者第二次就诊时，数据采集器识别就诊卡的条形码等信息，通过usb数据线将信息传输到智能终端上，智能终端根据患者的信息，解密存储在数据库中的患者信息，采用模糊匹配的方法，调取存储在数据库中的患者历次就诊信息、入住院信息等。若调取不到信息，则返回第一步重新统一患者信息数据格式。

在数据量较小，单台计算机可以处理时，所述模糊匹配方法采用如下单机处理算法：

(1)读取患者的就诊卡信息与数据库存储的患者信息及数据，定义语义相似阈值rm；

(2)患者数据name属性与预处理的患者信息及数据分为字符串序列n1＝n11，n12，…，n1m及n2＝n21，n22，…，n2n；

(3)判别n1i是否包含n2中的字符串，i＝1，2，…，m，若包含，则count1++；同理判断n2j是否包含n1中的字符串，j＝1，2，…，n，若包含，则count2++；

(4)计算匹配分数

(5)若score≥rm，则匹配超过阈值rm，匹配成功；否则匹配未达到阈值rm，匹配失败，继续读取数据库中的下一组存储的患者信息及数据；

(6)将所有匹配成功的患者信息进行合并和去重，并分配对象标识id为该系统中用以识别对象的唯一标识；将各操作对应的结果数据分配操作id为该系统中各所述对象所执行的操作的统一标识；

(7)将模糊匹配后的对象标识id及对应的患者信息，操作id及对应的结果数据存入第一步所述数据库。

本发明提供的中医内科患者数据信息处理方法，还包括数据库内患者数据的大数据优化。

(1)对患者数据信息设置存储阈值rs；如患者数据库及索引数据库小于阈值rs的大小，则不设存储期限；否则患者数据信息将于存储时限过后自动清空；小的存储阈值rs可以保存元数据，大的存储阈值rs则可以保存更多的流水数据及多媒体数据。

(2)设立索引数据库：对数据库生成并存储对象索引数据库，该对象索引数据为对象标识id和操作id的集合。该对象索引数据库用以快速从所述的数据库获取对象标识id和操作id，进而获取相应的患者信息和操作结果数据。

(3)设立备份数据库：本发明为了解决数据的存储安全，设立了oracle数据库备份系统；同时为了解决备份数据库中存在大量重复数据的问题，设计了数据块指纹去重机制。具体操作如下：

在备份数据库中，首先生成临时备份患者信息及数据文件，然后把临时患者信息及数据文件划分成不重叠的块，通过哈希算法计算每个块的指纹值。然后在备份数据库建立hash表记录已存储患者信息及数据的指纹值；通过对比指纹值，检测重复数据。为了提高数据安全性，采用了一定的安全机制来防止信息泄露以及数据丢失。实验证明，该系统在实现远程备份的同时，有效地减少了备份的数据。

所述指纹去重机制使用rsyncchecksum计算滑动窗口内数据块的求和校验值，如果校验值匹配，则用sha-1算法对数据块进行更严格的hash计算，比较sha-1hash值和存储的hash值来检测重复数据。如果检测到重复数据，将重复数据块记录后，滑动窗口滑过这个重复数据块继续向前移动。另外，还要将滑动块之前的这个碎片记录并存储下来。如果checksum校验值和已经存储的校验值不匹配，滑动窗口继续前移进行检测，如果滑动窗口移动的距离达到定长块长度时还没有检测到重复数据，将这个块的checksum校验和与sha-1hash值计算并存储供将来数据块重复检测。

如图2所示，本发明实施例提供的中医内科患者数据信息处理系统包括：

数据格式统一模块，用于采集就诊卡的患者信息及数据，存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，并对在存入数据库前进行格式检查。

数据模糊匹配模块，用于按照患者数据name属性与预处理的患者信息及数据进行语义匹配。

数据加密模块，用于信息进行加密处理。

数据优化模块，用于设置存储阈值，设立索引数据库和设立备份数据库。

如图3所示，本发明实施例提供的中医内科患者数据信息处理装置包括：数据采集器1、智能终端2、数据库3、路由器4、移动终端5、备份数据库6。

数据采集器1通过usb数据线与智能终端2连接，智能终端2通过互联网与数据库3连接，数据库3通过互联网与路由器4连接，路由器4通过无线与移动终端5连接，数据库3通过互联网与备份数据库6连接。

智能终端2还包括：

数据处理模块：用于读取存储于本地或服务器的数据，验证登录信息、初始化客户端，并上传数据至数据库3，分别标记已上传数据和未上传数据，使得智能终端2能通过多种方式，获取到正确的数据，以维持正常工作；

本地存储模块，用于备份数据处理模块从数据库3获得的数据，并保存智能终端2产生的数据；作为无网络状态下，智能终端2获取数据的临时数据库，让智能终端2能适应各种使用环境，应对断网的突发情况；

网络检测模块，用于判断当前智能终端2是否正常连接网络，以检测结果来让智能终端2执行不同的操作，达到无视网络问题，始终正常运行的目的。

移动终端5亦包括上述三个模块，但对移动端做了相应优化：

数据处理模块：仅用于从数据库3中读取数据；

本地存储模块，用于备份数据处理模块从数据库3获得的数据，并采用lru缓存策略限制本地缓存的规模；

网络检测模块，用于判断当前移动终端5是否正常连接网络；如正常连接网络则通过数据处理模块从数据库3中读取数据，否则从本地存储模块中读取缓存数据。

患者就诊时，将就诊卡放置在数据采集器1上，数据采集器1识别就诊卡的条形码等信息，通过usb数据线将信息传输到智能终端2上，智能终端2根据患者的信息，按照患者数据name属性与预处理的患者信息及数据进行语义匹配，调取存储在数据库3中的患者历次就诊信息、入住院信息等，然后反馈到智能终端2中，问诊医生获取这些信息，然后结合患者的当场描述进行问诊；病房的医生也可以通过智能终端2、移动终端5由数据库5调取患者的历次就诊信息、入住院信息等，及时的了解患者的信息，便于制定适合的治疗方案，移动终端5通过无线的路由器由数据库3调取信息，按照患者数据name属性与预处理的患者信息及数据进行语义匹配。

移动终端5通过无线的路由器4由数据库3调取信息采用了一种无线通信拥塞与故障感知的容错算法：在无线的路由器4处添加对故障、拥塞感知模块，感知无线通信的故障和拥塞信息并对其编码，发送给子网中的路由器；子网中的路由器根据接收到的无线的路由器4通信对状态编码，判断数据包是否使用无线传输；在不使用无线传输时，采用拥塞避免机制降低无线的路由器4周围的通信负载；在无线的路由器4通信对无故障时，子网路由器根据接收到的无线的路由器4通信对状态编码，平衡有线无线链路的综合利用率；当无线的路由器4通信对发生永久性故障时，子网路由器能够提前感知并禁用，避免大量数据包在无线的路由器4处重传。

本领域的技术人员应理解，取决于设计需求和其它因素，可以进行各种修改、组合、子组合和替换，只要它们处于所附权利要求或其等效的范围内即可。本发明的描述是为了示例说明的目的而提供的，而不旨在是彻底无遗漏的，或者局限于所公开的实施例。很多修改和变更对于本领域的普通技术人员将是清楚的。选择这些实施例是为了说明本发明的原理及其实际应用，并且使得本领域的其他普通技术人员能够理解本发明，以便实现可能适于其他预期用途的具有各种修改的各种实施例。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。