CN113012803B - 计算机设备、系统、可读存储介质及医学数据分析方法 - Google Patents
计算机设备、系统、可读存储介质及医学数据分析方法 Download PDFInfo
- Publication number
- CN113012803B CN113012803B CN201911316849.9A CN201911316849A CN113012803B CN 113012803 B CN113012803 B CN 113012803B CN 201911316849 A CN201911316849 A CN 201911316849A CN 113012803 B CN113012803 B CN 113012803B
- Authority
- CN
- China
- Prior art keywords
- node
- symptom
- inspection result
- nodes
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000007405 data analysis Methods 0.000 title claims abstract description 15
- 208000024891 symptom Diseases 0.000 claims abstract description 265
- 238000007689 inspection Methods 0.000 claims abstract description 221
- 201000010099 disease Diseases 0.000 claims abstract description 172
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 172
- 238000004590 computer program Methods 0.000 claims abstract description 33
- 230000015654 memory Effects 0.000 claims abstract description 20
- 230000005540 biological transmission Effects 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000005295 random walk Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 18
- 206010035664 Pneumonia Diseases 0.000 description 22
- 201000009240 nasopharyngitis Diseases 0.000 description 17
- 206010037660 Pyrexia Diseases 0.000 description 15
- 206010011224 Cough Diseases 0.000 description 13
- 206010036790 Productive cough Diseases 0.000 description 11
- 210000004369 blood Anatomy 0.000 description 11
- 239000008280 blood Substances 0.000 description 11
- 210000000440 neutrophil Anatomy 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000002601 radiography Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 201000007100 Pharyngitis Diseases 0.000 description 1
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开一种计算机设备、系统、可读存储介质及医学数据分析方法。该计算机设备的一具体实施方式包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器配置为加载计算机程序时执行下述步骤:获取患者的症状信息和检查结果信息;根据上述信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;基于各症状节点和各检查结果节点的初始权重、及症状信息和检查结果信息在知识图谱上的通过边的证据传递,确定知识图谱上的每一个节点的最终权重。该实施方式可对疾病的诊断作出辅助。
Description
技术领域
本发明涉及计算机技术领域。更具体地,涉及一种计算机设备、系统、可读存储介质及医学数据分析方法。
背景技术
基于疾病预测的辅助诊断系统的应用能够降低医生的劳动强度,提高工作效率,尤其是对于基层年轻医生来说,可以帮助他们实现更准确的判断。同时也可为人们更好地管理自己的健康提供帮助。
目前的辅助诊断系统大致可分为两类:一是基于专家知识的辅助诊断系统,二是基于机器学习方法的辅助诊断系统。其中,基于专家知识的辅助诊断系统覆盖面小,只适合特定领域疾病的辅助诊断。基于机器学习方法的辅助诊断系统常用做法是从数据中抽取特征,然后通过机器学习方法训练一个预测模型,最后使用该模型进行预测。基于机器学习方法的辅助诊断系统通常只使用患者确定的出现症状作为特征,例如对于患者描述“咳嗽、咳痰、没有发烧”,只使用“咳嗽”和“咳痰”作为症状信息特征来预测,但在实际诊断中,患者明确确定的没有出现的症状在医生诊断时也是很重要的信息。
发明内容
本发明的目的在于提供一种计算机设备、系统、可读存储介质及医学数据分析方法,以解决现有技术存在的问题中的至少一个。
为达到上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器配置为加载所述计算机程序时执行下述步骤:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
本发明第一方面提供的计算机设备,不论用户输入的信息中是否包含某症状或检查结果、包含的症状或检查结果是确认还是否认,均以所有症状及所有检查结果为基础而通过证据传播来进行知识图谱上的每一个节点的最终权重的确定,可精确高效地为患者疾病预测提供依据,对疾病的诊断作出有效辅助,可据其实现作为覆盖各领域疾病的通用诊断辅助系统,具有较高的应用价值。
可选地,所述处理器配置为加载所述计算机程序时执行所述根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重包括所述处理器配置为加载所述计算机程序时执行:对于症状信息中的确认症状和检查结果信息中的确认检查结果,相应节点的初始权重设置为α1;对于症状信息中的否认症状和检查结果信息中的否认检查结果,相应节点的初始权重设置为α2;对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,相应节点的初始权重设置为α3。
采用此可选方式,对用户的信息所体现检查结果、确定出现的症状、确定未出现的症状及未体现的检查结果和症状,进行相应症状节点及检查结果节点的区别化的初始值设置,可保证得到的知识图谱上的每一个节点的最终权重的精确性及有效性。
可选地,α1、α2、α3的取值设置为α1=1、α2=-1、α3=0。
此可选方式,基于最大熵原理设置不同症状节点及检查结果节点的初始权重值,可保证得到的知识图谱上的每一个节点的最终权重的精确性及有效性。
可选地,所述处理器配置为加载所述计算机程序时执行所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:所述处理器配置为加载所述计算机程序时执行基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
此可选方式采用的随机游走算法可精确高效地得到的知识图谱上的每一个节点的最终权重。
可选地,所述处理器配置为加载所述计算机程序时执行:
根据下述公式对各节点的权重进行迭代计算从而确定各个节点的最终权重:
对于第j个疾病节点dj,
初始权重为
第t+1次迭代计算的权重为
对于第i个症状节点si,第t+1次迭代计算的权重为
对于第k个检查结果节点ck,第t+1次迭代计算的权重为
其中,t=0,1,...,T-1;λ为预设的调和参数;S0(si)为症状节点si的初始权重;S0(ck)为检查结果节点ck的初始权重;ei,j为症状节点si与疾病节点dj之间的边的权重,若症状节点si与疾病节点dj之间存在边则ei,j设置为1,否则设置为0;ek,j为检查结果节点ck与疾病节点dj之间的边的权重,若检查结果节点ck与疾病节点dj之间存在边则ek,j设置为1,否则设置为0;I、K、J分别为症状节点的个数、检查结果节点的个数、疾病节点的个数。
采用此可选方式,可保证随机游走算法对各节点的权重进行迭代计算的精度及效率,迭代计算的公式可精确表征症状与疾病之间的关系及疾病与检查结果之间的关系,且随机游走算法可有效收敛,从而可精确高效地得到的知识图谱上的每一个节点的最终权重。
可选地,所述调和参数λ的取值设置为λ∈(0,1)。
此可选方式设置的调和参数λ的取值,可保证迭代计算公式的精确性及随机游走算法可有效收敛。
可选地,所述迭代计算的终止条件是达到最大迭代次数或各节点的权重不再变化。
此可选方式设置的迭代计算的终止条件,可保证迭代计算公式的精确性及随机游走算法可有效收敛。
可选地,所述处理器配置为加载所述计算机程序时执行:
对各疾病节点的最终权重由大到小进行排序,将排在前N个的疾病节点对应的疾病输出;
或,对各疾病节点的最终权重由小到大进行排序,将排在后N个的疾病节点对应的疾病输出;
其中,N为正整数。
此可选方式可直观地为患者疾病预测提供依据,有利于对疾病的诊断作出有效辅助。
可选地,所述处理器配置为加载所述计算机程序时执行:
对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由大到小进行排序,将排在前M个的检查结果节点对应的检查输出;
或,对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由小到大进行排序,将排在后M个的检查结果节点对应的检查输出;
其中,M为正整数。
此可选方式可在为患者疾病预测提供依据的同时,直观地给出有针对性的检查建议。特别是,对于最终权重最大的疾病节点存在两个及以上、最终权重最大的疾病节点的权重与至少一个其他疾病节点的最终权重较接近的情况,此时虽提供的疾病预测依据的参考性有所不足,但补充的针对性检查建议可有效引导患者进行目的性更强的检查。
本发明第二方面提供了一种计算机系统,包括终端设备和本发明第一方面提供的计算机设备,所述终端设备配置为向所述计算机设备发送用户的症状信息和检查结果信息,及接收所述计算机设备的输出。
本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器加载时执行下述步骤:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
本发明第四方面提供了一种基于医学知识图谱的医学数据分析方法,包括:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
可选地,所述根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重包括:
对于症状信息中的确认症状和检查结果信息中的确认检查结果,相应节点的初始权重设置为α1;对于症状信息中的否认症状和检查结果信息中的否认检查结果,相应节点的初始权重设置为α2;对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,相应节点的初始权重设置为α3。
可选地,所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
可选地,所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:
根据下述公式对各节点的权重进行迭代计算从而确定各个节点的最终权重:
对于第j个疾病节点dj,
初始权重为
第t+1次迭代计算的权重为
对于第i个症状节点si,第t+1次迭代计算的权重为
对于第k个检查结果节点ck,第t+1次迭代计算的权重为
其中,t=0,1,...,T-1;λ为预设的调和参数;S0(si)为症状节点si的初始权重;S0(ck)为检查结果节点ck的初始权重;ei,j为症状节点si与疾病节点dj之间的边的权重,若症状节点si与疾病节点dj之间存在边则ei,j设置为1,否则设置为0;ek,j为检查结果节点ck与疾病节点dj之间的边的权重,若检查结果节点ck与疾病节点dj之间存在边则ek,j设置为1,否则设置为0;I、K、J分别为症状节点的个数、检查结果节点的个数、疾病节点的个数。
本发明的有益效果如下:
本发明所述技术方案不论用户输入的信息中是否包含某症状或检查结果、包含的症状或检查结果是确认还是否认,均以所有症状及所有检查结果为基础而通过证据传播来进行知识图谱上的每一个节点的最终权重的确定,可精确高效地为患者疾病预测提供依据,对疾病的诊断作出有效辅助,可据其实现作为覆盖各领域疾病的通用诊断辅助系统,具有较高的应用价值。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明;
图1示出本发明实施例提供的基于医学知识图谱的医学数据分析方法的流程图。
图2示出本发明实施例提供的基于医学知识图谱的医学数据分析方法中数据走向图。
图3示出层次图的示意图。
图4示出本发明实施例提供的计算机设备的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
如图1和图2所示,本发明的一个实施例提供了一种基于医学知识图谱的医学数据分析方法,该方法由处理器加载存储在存储器中的计算机程序执行,包括如下步骤:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
本实施例提供的基于医学知识图谱的医学数据分析方法,不论用户输入的信息中是否包含某症状或检查结果、包含的症状或检查结果是确认还是否认,均以所有症状及所有检查结果为基础而通过证据传播来进行知识图谱上的每一个节点的最终权重的确定,可精确高效地为患者疾病预测提供依据,对疾病的诊断作出有效辅助,可根据执行该方法的计算机设备实现作为覆盖各领域疾病的通用诊断辅助系统,具有较高的应用价值。
本实施例提供的基于医学知识图谱的医学数据分析方法对获取患者的症状信息和检查结果信息的具体方式不做限制。例如,可以通过用户的输入获取症状信息和检查结果信息,也可以在存储器中直接获取相关信息。
在一个具体示例中,预设的知识图谱的构建过程如下:从医学数据中抽取症状、疾病、检查结果、症状与疾病之间的关系及疾病与检查结果之间的关系,以症状、疾病及检查结果作为节点且症状与疾病之间的关系及疾病与检查结果之间的关系作为节点之间的边,构建知识图谱。其中,知识图谱可以图模型体现,进一步,可以层次图形式体现。以图3所示的症状与疾病之间的关系、疾病与检查结果之间的关系为例:从医学数据中抽取症状,例如发热、咳嗽和咳痰,根据医学数据,症状发热对应的疾病为肺炎或普通感冒,因此,在构建知识图谱时,在“发热”节点和“肺炎”节点以及“普通感冒”节点之间分别形成一条边;根据医学数据,症状咳嗽对应的疾病也是肺炎或普通感冒,则在“咳嗽”节点和“肺炎”节点以及“普通感冒”节点之间分别形成一条边;同理,“咳痰”节点和“肺炎”节点以及“普通感冒”节点之间也分别形成一条边。同理,根据医学数据,例如疾病肺炎在检查结果上对应胸片有阴影及血常规中性白细胞百分比>70%,则在构建知识图谱时,在“肺炎”节点和“胸片有阴影”节点以及“血常规中性白细胞百分比>70%”节点之间分别形成一条边。其它节点之间也可以建立这样的关系。
其中,所述医学数据包括互联网、文献、病历中的至少一个。
例如,所述互联网可以是各种医疗问答网站,这些网站通过医疗专业人员回答用户提出的医学问题,如丁香园、好大夫在线、寻医问药等。
例如,文献可以是纸本印刷或电子化的各种诊疗指南、医生案头手册、医学书籍、医学论文等。
例如,病历可以是手写的病历也可以是电子病历。
其中,所述证据传递在图中体现的是分数传递,例如,和相应症状、检查越相关的疾病得分越高,也就是患有该疾病的可能性越大。例如,患者说他患有咳嗽,判断可能的疾病是感冒或者咽炎,后患者说还有发烧的症状,此时发烧作为证据可以使得患者患有感冒的可能性增大。
在本实施例的一些可选的实现方式中,根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重包括:对于症状信息中的确认症状和检查结果信息中的确认检查结果,相应节点的初始权重设置为α1;对于症状信息中的否认症状和检查结果信息中的否认检查结果,相应节点的初始权重设置为α2;对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,相应节点的初始权重设置为α3。可理解的是,α1、α2和α3的取值分别不同。
其中,症状信息中的确认症状为症状信息中用户确定出现的症状,症状信息中的否认症状为症状信息中用户确定未出现的症状,症状信息中的未包含的症状为症状信息中用户未提及的症状,例如,若获取的症状信息为“发热、无咳痰”,则“发热”节点对应的“发热”症状为症状信息中的确认症状,“咳痰”节点对应的“咳痰”症状为症状信息中的否认症状,“咳嗽”节点对应的“咳嗽”症状为症状信息中未包含的症状;与之类似,检查结果信息中的确认检查结果为检查结果信息中用户确定出现的检查结果,检查结果信息中的否认检查结果为检查结果信息中用户确定未出现的检查结果,检查结果信息中的未包含的检查结果为检查结果信息中用户未提及的检查结果,例如,若获取的检查结果信息为“胸片有阴影、血常规中性白细胞百分比为60%”,则“胸片有阴影”节点对应的“胸片有阴影”检查结果为检查结果信息中的确认检查结果,“血常规中性白细胞百分比>70%”节点对应的“血常规中性白细胞百分比>70%”检查结果为检查结果信息中的否认检查结果,“尿常规酸碱度>8”节点对应的“尿常规酸碱度>8”检查结果为检查结果信息中未包含的检查结果。
采用此实现方式,对用户的信息所体现的检查结果、确定出现的症状、确定未出现的症状及未体现的检查结果和症状,进行相应症状节点及检查结果节点的区别化的初始值设置,可保证得到的知识图谱上的每一个节点的最终权重的精确性及有效性。可理解的是,若症状信息中未包含的任何症状,则意味着没有症状信息或者症状信息为空,此时仅根据用户的检查结果信息进行后续流程即可,反之,若检查结果信息中未包含的任何检查结果,则意味着没有检查结果信息或者检查结果信息为空,此时仅根据用户的症状信息进行后续流程即可。
在本实施例的一些可选的实现方式中,α1、α2、α3的取值设置为α1=1、α2=-1、α3=0。
对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,可能存在两种原因:一是用户忘记将已存在的症状(不论确认还是否认)放入症状信息、将已存在的检查结果(不论确认还是否认)放入检查结果信息,二是未包含的症状或检查结果确实不存在,在未进行进一步的信息确认的情况下,基于作为选择随机变量统计特性最符合客观情况的准则的最大熵原理将此类节点的初始权重设置为0,即对于未知的事件当作等概率处理,结合将症状信息中的确认症状和检查结果信息中的确认检查结果的相应节点的初始权重设置为1,及将症状信息中的否认症状和检查结果信息中的否认检查结果的相应节点的初始权重设置为-1,即将确认发生的事件和确认未发生的事件的初值权重分别设置为取正值的1和取负值的-1,可保证得到的知识图谱上的每一个节点的最终权重的精确性及有效性。
在本实施例的一些可选的实现方式中,所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
例如,采用随机游走算法进行证据的传递。此实现方式采用的随机游走算法可精确高效地得到的知识图谱上的每一个节点的最终权重。
在本实施例的一些可选的实现方式中,基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:
根据下述公式对各节点的权重进行迭代计算从而确定各个节点的最终权重:
对于第j个疾病节点dj,
初始权重为
可理解的是,知识图谱的所有症状节点和所有检查结果节点的初始权重是根据获取的症状信息和检查结果信息确定的,而所有疾病节点的初始权重是根据每一症状节点和每一检查结果节点的初始权重及知识图谱中的表征症状与疾病之间的关系、疾病与检查结果之间的关系的边通过该公式计算得到的;
第t+1次迭代计算的权重为
对于第i个症状节点si,第t+1次迭代计算的权重为
对于第k个检查结果节点ck,第t+1次迭代计算的权重为
其中,t=0,1,...,T-1;λ为预设的调和参数;S0(si)为症状节点si的初始权重;S0(ck)为检查结果节点ck的初始权重;ei,j为症状节点si与疾病节点dj之间的边的权重,若症状节点si与疾病节点dj之间存在边则ei,j设置为1,否则设置为0;ek,j为检查结果节点ck与疾病节点dj之间的边的权重,若检查结果节点ck与疾病节点dj之间存在边则ek,j设置为1,否则设置为0;I、K、J分别为症状节点的个数、检查结果节点的个数、疾病节点的个数。
对于疾病节点dj,“(1-λ)St(dj)”可约束每一次进行迭代计算后疾病节点dj的变化幅度,或者说将每一次进行迭代计算后疾病节点dj的变化幅度控制在可控范围内,以保证随机游走算法的有效收敛;可精确表征疾病与症状之间的关系及疾病与检查结果之间的关系;总的来说,St+1(dj)的计算公式的意义为:某一疾病对应的症状及检查结果的权重越大,则传递给该疾病的权重就越大;
对于症状节点si,“(1-λ)St(si)”可约束每一次进行迭代计算后症状节点si的变化幅度,或者说将每一次进行迭代计算后症状节点si的变化幅度控制在可控范围内,以保证随机游走算法的有效收敛;可精确表征症状与疾病之间的关系;总的来说,St+1(si)的计算公式的意义为:某一疾病的权重越大(即患者患有该疾病的概率越大),则与该疾病对应的(或者说相关的,存在“边”连接的)的症状的权重就越大;
对于检查结果节点ck,“(1-λ)St(ck)”可约束每一次进行迭代计算后检查结果节点ck的变化幅度,或者说将每一次进行迭代计算后检查结果节点ck的变化幅度控制在可控范围内,以保证随机游走算法的有效收敛;可精确表征检查结果与疾病之间的关系;总的来说,St+1(ck)的计算公式的意义为:某一疾病的权重越大(即患者患有该疾病的概率越大),则与该疾病对应的(或者说相关的,存在“边”连接的)的检查结果的权重就越大,例如,层次图如图3所示,如果患者患有肺炎的概率大则胸片有阴影的可能性也会大,如果患者患有普通感冒的概率大则胸片有阴影的可能性会小,因为“普通感冒”节点与“胸片有阴影”节点之间没有边,即两者之间的“ek,j”等于0,“普通感冒”节点的权重无法传递给“胸片有阴影”节点。
参照上述可见,St+1(dj)、St+1(si)及St+1(ck)的计算公式中,调和参数λ的总体作用为控制当前迭代计算的权重及由存在关系的其他层节点传递得来的权重的比例。
综上所述,采用此实现方式,可保证随机游走算法对各节点的权重进行迭代计算的精度及效率,迭代计算的公式可精确表征症状与疾病之间的关系及疾病与检查结果之间的关系,且随机游走算法可有效收敛,从而可精确高效地得到的知识图谱上的每一个节点的最终权重。
另外,对于上述迭代计算的公式,可设定 其中,si,t表示症状节点si在第t次迭代的分数,dj,t表示疾病节点dj在第t次迭代的分数,ck,t表示检查结果节点ck在第t次迭代的分数,则上述公式的矩阵形式如下:
对于症状节点:
St+1(s)=λ×A×St(d)+(1-λ)St(s),其中,A是I×J的矩阵,ei,j症状节点si与疾病节点dj之间的边的权重;
对于疾病节点:
St+1(d)=(1-λ)×St(d)+λ×B×St(s)+λ×C×St(c),其中,B为J×I的矩阵,ej,i表示疾病节点dj与症状节点si之间的边的权重,需要说明的是,ei,j=ej,i;C为J×K的矩阵,ej,k表示疾病节点dj与检查结果节点ck之间的边的权重;
对于检查结果节点:
St+1(c)=(1-λ)×St(c)+λ×G×St(d),其中G为K×J的矩阵,ek,j表示检查结果节点ck与疾病节点dj之间的边的权重。
在本实施例的一些可选的实现方式中,所述调和参数λ的取值设置为λ∈(0,1)。进一步,所述调和参数λ的取值设置为λ=0.5。
此实现方式设置的调和参数λ的取值,可保证迭代计算公式的精确性及随机游走算法可有效收敛。
在本实施例的一些可选的实现方式中,所述迭代计算的终止条件是达到最大迭代次数或各节点的权重不再变化。
此可选方式设置的迭代计算的终止条件,可保证迭代计算公式的精确性及随机游走算法可有效收敛。
在本实施例的一些可选的实现方式中,最大迭代次数T的取值设置为T=10000。
此实现方式中,最大迭代计算次数T=10000的设置是基于覆盖各医学领域的层次图中节点的数量及边的数量而设置的合适取值,可在保证精度的情况下保证计算的效率。可理解的是,如果仅应用于某一医学领域,在节点数量及边的数量较少的情况下,可相应减小最大迭代计算次数T的取值。
在本实施例的一些可选的实现方式中,该方法还包括:
对各疾病节点的最终权重由大到小进行排序,将排在前N个的疾病节点对应的疾病输出;
或,对各疾病节点的最终权重由小到大进行排序,将排在后N个的疾病节点对应的疾病输出;
其中,N为正整数。
此实现方式可直观地为患者疾病预测提供依据,有利于对疾病的诊断作出有效辅助。例如,可以只输出最终权重最大的疾病节点对应的疾病作为疾病预测的依据,例如,对于最终权重最大的疾病节点的权重明显大于其他疾病节点的情况,可设置N=1,即只输出最终权重最大的疾病节点对应的疾病作为疾病预测的依据;而对于最终权重最大的疾病节点的权重与至少一个其他疾病节点的最终权重较接近的情况,可设置N>1。
在本实施例的一些可选的实现方式中,该方法还包括:
对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由大到小进行排序,将排在前M个的检查结果节点对应的检查输出;
或,对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由小到大进行排序,将排在后M个的检查结果节点对应的检查输出;
其中,M为正整数。
采用此实现方式,可在为患者疾病预测提供依据的同时,直观地给出有针对性的检查建议。特别是,对于最终权重最大的疾病节点存在两个及以上、最终权重最大的疾病节点的权重与至少一个其他疾病节点的最终权重较接近的情况,此时虽提供的疾病预测依据的参考性有所不足,但补充的针对性检查建议可有效引导患者进行目的性更强的检查。
在一个具体示例中,图模型(层次图)如图3所示,调和参数λ的取值设置为λ=0.5,用户输入的信息为“发热、咳嗽、无咳痰”(没有提及胸片检查及血常规检查),则对于层次图中的症状节点和检查结果节点的初始权重进行如下设置:“发热”节点和“咳嗽”节点作为症状信息中的确认症状所对应的节点,初始权重设置为1;“咳痰”节点作为症状信息中的否认症状所对应的节点,的初始权重设置为-1;“胸片有阴影”节点和“血常规中性白细胞百分比>70%”节点作为检查结果信息中未包含的检查结果所对应的节点,初始权重设置为0;根据本实施例中的公式,“肺炎”节点的初始权重为其中,“发热”节点传递给“肺炎”节点的权重是这是由于“发热”节点与“肺炎”节点以及“普通感冒”节点之间分别存在边,因此,计算“肺炎”节点的初始权重时“发热”节点传递给“肺炎”节点的权重同理,“咳嗽”节点传递给“肺炎”节点的权重是“咳痰”节点传递给“肺炎”节点的权重是“胸片有阴影”节点和“血常规中性白细胞百分比>70%”节点传递给“肺炎”节点的权重均是0;同理,“普通感冒”节点的初始权重为
在第1次迭代计算后,
“肺炎”节点的权重变为:
“普通感冒”节点的权重变为:
“胸片有阴影”节点的权重变为:
S1(c1)=(1-0.5)×0+0.5×(0.25×1)=0.125
“血常规中性白细胞百分比>70%”节点的权重变为:
S1(c2)=(1-0.5)×0+0.5×(0.25×1)=0.125
上述权重结果中,由于“肺炎”节点与“普通感冒”节点的权重相同,因此基于用户输入的信息为“发热、咳嗽、无咳痰”(没有提及胸片检查及血常规检查),无法给出患者是患有肺炎还是普通感冒的依据,此时,可输出“胸片”和“血常规”等检查以便进一步确认。例如,可输出“胸片”的检查建议,若用户做了胸片检查后输入胸片有阴影的信息,那么,“胸片有阴影”节点的权重就变为1,回到上述过程,“肺炎”节点的初始权重就变为而“普通感冒”节点的初始权重还是(因为“普通感冒”节点与“胸片有阴影”节点之间不存在边,即e1,2=0),表明用户患有肺炎的概率大;若用户做了胸片检查后输入胸片无阴影的信息,那么,“胸片有阴影”节点的权重就变为-1,回到上述过程,“肺炎”节点的初始权重就变为而“普通感冒”节点的初始权重还是表明用户患有普通感冒的概率大。
上述实施例提供的基于医学知识图谱的医学数据分析方法可以通过计算机程序来实现,基于此,本发明的另一个实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例提供的基于医学知识图谱的医学数据分析方法。
其中,处理器可以是中央处理器(CPU)、现场可编程逻辑阵列(FPGA)、单片机(MCU)、数字信号处理器(DSP)、专用集成电路(ASIC)等具有数据处理能力和/或程序执行能力的逻辑运算器件。存储器包括但不限于例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(Cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
本实施例提供的计算机设备,综合考虑了患者确定出现的症状和患者确定未出现的症状这两方面的症状信息,不论用户输入的信息中是否包含某症状或检查结果、包含的症状或检查结果是确认还是否认,均以所有症状及所有检查结果为基础,通过证据传播来进行知识图谱上的每一个节点的最终权重的确定,可精确高效地为患者疾病预测提供依据,对疾病的诊断作出有效辅助,可据其实现作为覆盖各领域疾病的通用诊断辅助系统,具有较高的应用价值。
本发明的另一个实施例提供了一种计算机系统,包括终端设备和上述实施例提供的计算机设备,所述终端设备配置为向所述计算机设备发送用户的症状信息和检查结果信息,及接收所述计算机设备的输出。
其中,终端设备可以通过多种方式与计算机设备通讯连接。例如,网线、光纤等有线方式,或Wi-Fi、蓝牙、Zigbee等无线局域网方式,或3G、4G、5G等无线广域网的方式。
所述终端设备可以是手机、平板电脑、笔记本电脑、个人电脑等具有信息输入能力的器件。终端设备可通过其交互装置接收用户输入的用户的症状信息及检查结果信息,并发送至计算机设备;终端设备在接收计算机设备的输出(例如N个疾病节点对应的疾病,或N个疾病节点对应的疾病及M个的检查结果节点对应的检查)后可以通过屏幕显示、语音输出等方式告知用户。
在一个具体示例中,终端设备为手机,计算机设备为服务器。用户使用手机APP,通过手机的触控屏在其显示的APP界面输入症状信息及检查结果信息,手机将用户输入的症状信息及检查结果信息发送至服务器,服务器根据症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,并将各节点的初始权重返回至手机以使得手机通过其触控屏在APP界面向用户展示各节点的初始权重,同时,服务器基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递来确定所述知识图谱上的每一个节点的最终权重,并在对各疾病节点的最终权重由大到小进行排序后,将排在前三个的疾病节点对应的疾病及其最终权重作为结果信息返回至手机,手机通过其触控屏在APP界面通过列表或柱状图、饼图等形式向用户展示接收自服务器的结果信息,用户还可通过手机的触控屏对APP界面中展示的结果信息中的疾病进行点选等操作,以实现疾病确认等后续操作。
在另一个具体示例中,终端设备为个人电脑,计算机设备为服务器。用户使用个人电脑的Web客户端,基于显示屏显示的Web客户端界面,通过鼠标点选、键盘操作等方式输入症状信息及检查结果信息,个人电脑将用户输入的症状信息及检查结果信息发送至服务器,服务器根据症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,并将各节点的初始权重返回至个人电脑以使得个人电脑通过其显示屏在Web客户端界面向用户展示各节点的初始权重,同时,服务器基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递来确定所述知识图谱上的每一个节点的最终权重,并在对各疾病节点的最终权重由大到小进行排序后,将排在前三个的疾病节点对应的疾病及其最终权重作为结果信息返回至个人电脑,个人电脑通过其显示屏在Web客户端界面通过列表或柱状图、饼图等形式向用户展示接收自服务器的结果信息,用户还可通过鼠标点选、键盘操作等方式对Web客户端界面中展示的结果信息中的疾病进行点选等操作,以实现疾病确认等后续操作。
如图4所示,适于用来实现上述实施例提供的计算机设备的计算机系统,包括中央处理模块(CPU),其可以根据存储在只读存储器(ROM)中的程序或者从存储部分加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有计算机系统操作所需的各种程序和数据。CPU、ROM以及RAM通过总线被此相连。输入/输入(I/O)接口也连接至总线。
以下部件连接至I/O接口:包括键盘、鼠标等的输入部分;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
特别地,根据本实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括有形地包含在计算机可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
附图中的流程图和示意图,图示了本实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或示意图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,示意图和/或流程图中的每个方框、以及示意和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本发明实施例还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质,也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备执行上述实施例提供的基于医学知识图谱的医学数据分析方法。
需要说明的是,在本发明的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于本领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (14)
1.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器配置为加载所述计算机程序时执行下述步骤:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重;
所述处理器配置为加载所述计算机程序时执行所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:所述处理器配置为加载所述计算机程序时执行基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
2.根据权利要求1所述的计算机设备,其特征在于,所述处理器配置为加载所述计算机程序时执行所述根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重包括所述处理器配置为加载所述计算机程序时执行:
对于症状信息中的确认症状和检查结果信息中的确认检查结果,相应节点的初始权重设置为α1;对于症状信息中的否认症状和检查结果信息中的否认检查结果,相应节点的初始权重设置为α2;对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,相应节点的初始权重设置为α3。
3.根据权利要求2所述的计算机设备,其特征在于,α1、α2、α3的取值设置为α1=1、α2=-1、α3=0。
4.根据权利要求1-3中任一项所述的计算机设备,其特征在于,所述处理器配置为加载所述计算机程序时执行:
根据下述公式对各节点的权重进行迭代计算从而确定各个节点的最终权重:
对于第j个疾病节点dj,
初始权重为
第t+1次迭代计算的权重为
对于第i个症状节点si,第t+1次迭代计算的权重为
对于第k个检查结果节点ck,第t+1次迭代计算的权重为
其中,t=0,1,...,T-1;λ为预设的调和参数;S0(si)为症状节点si的初始权重;S0(ck)为检查结果节点ck的初始权重;ei,j为症状节点si与疾病节点dj之间的边的权重,若症状节点si与疾病节点dj之间存在边则ei,j设置为1,否则设置为0;ek,j为检查结果节点ck与疾病节点dj之间的边的权重,若检查结果节点ck与疾病节点dj之间存在边则ek,j设置为1,否则设置为0;I、K、J分别为症状节点的个数、检查结果节点的个数、疾病节点的个数。
5.根据权利要求4所述的计算机设备,其特征在于,所述调和参数λ的取值设置为λ∈(0,1)。
6.根据权利要求4所述的计算机设备,其特征在于,所述迭代计算的终止条件是达到最大迭代次数或各节点的权重不再变化。
7.根据权利要求1所述的计算机设备,其特征在于,所述处理器配置为加载所述计算机程序时执行:对各疾病节点的最终权重由大到小进行排序,将排在前N个的疾病节点对应的疾病输出;
或,对各疾病节点的最终权重由小到大进行排序,将排在后N个的疾病节点对应的疾病输出;
其中,N为正整数。
8.根据权利要求1所述的计算机设备,其特征在于,所述处理器配置为加载所述计算机程序时执行:
对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由大到小进行排序,将排在前M个的检查结果节点对应的检查输出;
或,对检查结果信息中未包含的检查结果对应的各检查结果节点的最终权重由小到大进行排序,将排在后M个的检查结果节点对应的检查输出;
其中,M为正整数。
9.根据权利要求1所述的计算机设备,其特征在于,在获取患者的症状信息和检查结果信息之前,所述处理器配置为加载所述计算机程序时执行:
从医学数据中抽取症状、疾病、检查结果、症状与疾病之间的关系及疾病与检查结果之间的关系,以症状、疾病及检查结果作为节点且症状与疾病之间的关系及疾病与检查结果之间的关系作为节点之间的边,构建知识图谱。
10.一种计算机系统,包括终端设备和权利要求1-9中任一项所述的计算机设备,所述终端设备配置为向所述计算机设备发送用户的症状信息和检查结果信息,及接收所述计算机设备的输出。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器加载时执行下述步骤:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重;
所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
12.一种基于医学知识图谱的医学数据分析方法,其特征在于,包括:
获取患者的症状信息和检查结果信息;
根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重,其中,所述预设的知识图谱以症状、疾病及检查结果作为节点,且以症状与疾病之间的关系、疾病与检查结果之间的关系作为节点之间的边;
基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重;
所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:基于各症状节点和各检查结果节点的初始权重、及利用随机游走算法对各节点的权重进行迭代计算所实现的所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重。
13.根据权利要求12所述的方法,其特征在于,所述根据所述症状信息和检查结果信息确定预设的知识图谱的所有症状节点和所有检查结果节点的初始权重包括:
对于症状信息中的确认症状和检查结果信息中的确认检查结果,相应节点的初始权重设置为α1;对于症状信息中的否认症状和检查结果信息中的否认检查结果,相应节点的初始权重设置为α2;对于症状信息中未包含的症状和检查结果信息中未包含的检查结果,相应节点的初始权重设置为α3。
14.根据权利要求12或13所述的方法,其特征在于,所述基于各症状节点和各检查结果节点的初始权重、及所述症状信息和检查结果信息在所述预设的知识图谱上的通过所述边的证据传递,确定所述知识图谱上的每一个节点的最终权重包括:
根据下述公式对各节点的权重进行迭代计算从而确定各个节点的最终权重:
对于第j个疾病节点dj,
初始权重为
第t+1次迭代计算的权重为
对于第i个症状节点si,第t+1次迭代计算的权重为
对于第k个检查结果节点ck,第t+1次迭代计算的权重为
其中,t=0,1,...,T-1;λ为预设的调和参数;S0(si)为症状节点si的初始权重;S0(ck)为检查结果节点ck的初始权重;ei,j为症状节点si与疾病节点dj之间的边的权重,若症状节点si与疾病节点dj之间存在边则ei,j设置为1,否则设置为0;ek,j为检查结果节点ck与疾病节点dj之间的边的权重,若检查结果节点ck与疾病节点dj之间存在边则ek,j设置为1,否则设置为0;I、K、J分别为症状节点的个数、检查结果节点的个数、疾病节点的个数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911316849.9A CN113012803B (zh) | 2019-12-19 | 2019-12-19 | 计算机设备、系统、可读存储介质及医学数据分析方法 |
US17/033,438 US20210192365A1 (en) | 2019-12-19 | 2020-09-25 | Computer device, system, readable storage medium and medical data analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911316849.9A CN113012803B (zh) | 2019-12-19 | 2019-12-19 | 计算机设备、系统、可读存储介质及医学数据分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113012803A CN113012803A (zh) | 2021-06-22 |
CN113012803B true CN113012803B (zh) | 2024-08-09 |
Family
ID=76382568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911316849.9A Active CN113012803B (zh) | 2019-12-19 | 2019-12-19 | 计算机设备、系统、可读存储介质及医学数据分析方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210192365A1 (zh) |
CN (1) | CN113012803B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113628726B (zh) * | 2021-08-10 | 2023-12-26 | 海南榕树家信息科技有限公司 | 基于图神经网络的中医辨治推荐系统、方法和电子设备 |
CN115732074A (zh) * | 2021-08-25 | 2023-03-03 | 佳能医疗系统株式会社 | 医用信息处理系统、医用信息处理方法以及存储介质 |
CN114464286B (zh) * | 2022-02-25 | 2023-02-07 | 广州循证医药科技有限公司 | 基于人机交互的可视化病例数据导入、报告系统与方法 |
CN117076484B (zh) * | 2023-09-04 | 2024-04-19 | 北京大学 | 基于时序知识图谱的人力资源数据分析方法 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3771001B2 (ja) * | 1996-06-04 | 2006-04-26 | 富士通株式会社 | 分散システムの診断システム及び分散システムの診断プログラムを格納した記憶媒体 |
JP4448347B2 (ja) * | 2004-03-04 | 2010-04-07 | 株式会社日立ハイテクノロジーズ | 医用検査ナビゲーションシステム |
KR20070029958A (ko) * | 2005-09-12 | 2007-03-15 | 이형래 | 무선휴대통신 단말기를 이용한 전립선비대증환자의병원방문시기 조절방법 및 이를 수행하기 위한 시스템 |
US8229881B2 (en) * | 2007-07-16 | 2012-07-24 | Siemens Medical Solutions Usa, Inc. | System and method for creating and searching medical ontologies |
WO2011060314A1 (en) * | 2009-11-12 | 2011-05-19 | eTenum, LLC | Method and system for optimal estimation in medical diagnosis |
US8935196B2 (en) * | 2010-05-28 | 2015-01-13 | Siemens Aktiengesellschaft | System and method for providing instance information data of an instance |
CN102509327B (zh) * | 2011-09-30 | 2013-10-30 | 北京航空航天大学 | 一种图像空洞填补的多尺度全局采样方法 |
US8965818B2 (en) * | 2012-05-16 | 2015-02-24 | Siemens Aktiengesellschaft | Method and system for supporting a clinical diagnosis |
US10409908B2 (en) * | 2014-12-19 | 2019-09-10 | Google Llc | Generating parse trees of text segments using neural networks |
US10095689B2 (en) * | 2014-12-29 | 2018-10-09 | International Business Machines Corporation | Automated ontology building |
US10332631B2 (en) * | 2015-07-07 | 2019-06-25 | Seven Medical, Inc. | Integrated medical platform |
EP3223180A1 (en) * | 2016-03-24 | 2017-09-27 | Fujitsu Limited | A system and a method for assessing patient risk using open data and clinician input |
EP3223179A1 (en) * | 2016-03-24 | 2017-09-27 | Fujitsu Limited | A healthcare risk extraction system and method |
US20180046773A1 (en) * | 2016-08-11 | 2018-02-15 | Htc Corporation | Medical system and method for providing medical prediction |
US11626208B2 (en) * | 2016-08-31 | 2023-04-11 | International Business Machines Corporation | System, method and computer program product for ensemble-based cognitive online health system for effective disease diagnosis |
CN106372439A (zh) * | 2016-09-21 | 2017-02-01 | 北京大学 | 基于病例库的疾病症状及其权重知识的获取和处理方法 |
US11823798B2 (en) * | 2016-09-28 | 2023-11-21 | Merative Us L.P. | Container-based knowledge graphs for determining entity relations in non-narrative text |
JP2019536137A (ja) * | 2016-10-25 | 2019-12-12 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 知識グラフベースの臨床診断支援 |
US20180122509A1 (en) * | 2016-10-31 | 2018-05-03 | Talislife Sàrl | Multilevel Intelligent Interactive Mobile Health System for Behavioral Physiology Self-Regulation in Real-Time |
US20180144424A1 (en) * | 2016-11-18 | 2018-05-24 | Yen4Ken, Inc. | Method and system for content processing to query multiple healthcare-related knowledge graphs |
CN108335755B (zh) * | 2017-01-19 | 2022-03-04 | 京东方科技集团股份有限公司 | 数据分析方法和设备 |
US20180218126A1 (en) * | 2017-01-31 | 2018-08-02 | Pager, Inc. | Determining Patient Symptoms and Medical Recommendations Based on Medical Information |
CN107145744B (zh) * | 2017-05-08 | 2018-03-02 | 合肥工业大学 | 医学知识图谱的构建方法、装置及辅助诊断方法 |
CN107506591B (zh) * | 2017-08-28 | 2020-06-02 | 中南大学 | 一种基于多元信息融合和随机游走模型的药物重定位方法 |
CN108287881A (zh) * | 2017-12-29 | 2018-07-17 | 北京理工大学 | 一种基于随机游走关系发现的优化方法 |
CN108428478B (zh) * | 2018-02-27 | 2022-03-29 | 东北师范大学 | 基于异质医疗数据挖掘的甲状腺癌风险预测方法 |
CN108492887B (zh) * | 2018-04-13 | 2020-09-22 | 合肥工业大学 | 医疗知识图谱构建方法及装置 |
CN108565019A (zh) * | 2018-04-13 | 2018-09-21 | 合肥工业大学 | 多学科适用的临床检查组合推荐方法及装置 |
US11232856B2 (en) * | 2018-06-29 | 2022-01-25 | Engooden Health Inc. | Methods for automatic cohort selection in epidemiologic studies and clinical trials |
US11651858B2 (en) * | 2018-08-07 | 2023-05-16 | International Business Machines Corporation | Providing medical treatment using optimized symptom-centric decision trees based on disease-centric knowledge graphs |
CN108986871A (zh) * | 2018-08-27 | 2018-12-11 | 东北大学 | 一种智慧医疗知识图谱的构建方法 |
US11036718B2 (en) * | 2018-08-30 | 2021-06-15 | Accenture Global Solutions Limited | Linking entities in dynamic graphs |
US11263405B2 (en) * | 2018-10-10 | 2022-03-01 | Healthpointe Solutions, Inc. | System and method for answering natural language questions posed by a user |
CN109543047A (zh) * | 2018-11-21 | 2019-03-29 | 焦点科技股份有限公司 | 一种基于医疗领域网站的知识图谱构建方法 |
CN109616169B (zh) * | 2018-12-24 | 2020-11-13 | 广州天鹏计算机科技有限公司 | 相似患者挖掘方法、装置、计算机设备和存储介质 |
US11195620B2 (en) * | 2019-01-04 | 2021-12-07 | International Business Machines Corporation | Progress evaluation of a diagnosis process |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN109902165B (zh) * | 2019-03-08 | 2021-02-23 | 中国科学院自动化研究所 | 基于马尔科夫逻辑网的智能交互式问答方法、系统、装置 |
CN110391021A (zh) * | 2019-07-04 | 2019-10-29 | 北京爱医生智慧医疗科技有限公司 | 一种基于医学知识图谱的疾病推理系统 |
-
2019
- 2019-12-19 CN CN201911316849.9A patent/CN113012803B/zh active Active
-
2020
- 2020-09-25 US US17/033,438 patent/US20210192365A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20210192365A1 (en) | 2021-06-24 |
CN113012803A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nazer et al. | Bias in artificial intelligence algorithms and recommendations for mitigation | |
CN113012803B (zh) | 计算机设备、系统、可读存储介质及医学数据分析方法 | |
JP6976360B2 (ja) | データ処理装置及び方法、認識装置、学習データ保存装置、機械学習装置並びにプログラム | |
Liang et al. | Fast automated detection of COVID-19 from medical images using convolutional neural networks | |
Elder et al. | Reading and evaluating qualitative research studies | |
Krumholz et al. | Do non-clinical factors improve prediction of readmission risk? results from the Tele-HF study | |
WO2023109199A1 (zh) | 一种个体慢病演进风险可视化评估方法及系统 | |
US11205516B2 (en) | Machine learning systems and methods for assessing medical interventions for utilization review | |
US20100217094A1 (en) | Point-of-care enactive medical system and method | |
Gao et al. | Chest X-ray image analysis and classification for COVID-19 pneumonia detection using Deep CNN | |
CN111145909B (zh) | 诊疗数据处理方法与装置、存储介质、电子设备 | |
Duffy et al. | Confounders mediate AI prediction of demographics in medical imaging | |
US11200967B1 (en) | Medical patient synergistic treatment application | |
US12002583B2 (en) | Universal health machine for the automatic assessment of patients | |
Chung et al. | Large Language Model Capabilities in Perioperative Risk Prediction and Prognostication | |
CN109545384A (zh) | 一种医学诊断方法及装置 | |
Yaşar et al. | A novel study to increase the classification parameters on automatic three-class COVID-19 classification from CT images, including cases from Turkey | |
Oh et al. | New trends in innovative technologies applying artificial intelligence to urinary diseases | |
US20170186120A1 (en) | Health Care Spend Analysis | |
Chamundeshwari et al. | Adaptive Despeckling and Heart Disease Diagnosis by Echocardiogram using Optimized Deep Learning Model | |
Clancy | Technology solutions for nurse leaders | |
US7877341B2 (en) | Self-adaptive data pre-fetch by artificial neuron network | |
Mateussi et al. | Clinical Applications of Machine Learning | |
CN113990422A (zh) | 一种随访数据的采集方法和装置 | |
JP2010200881A (ja) | 膵嚢胞性疾患診断装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |