CN109471852B - 医疗数据库建立方法、装置、计算机设备和存储介质 - Google Patents
医疗数据库建立方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109471852B CN109471852B CN201811399720.4A CN201811399720A CN109471852B CN 109471852 B CN109471852 B CN 109471852B CN 201811399720 A CN201811399720 A CN 201811399720A CN 109471852 B CN109471852 B CN 109471852B
- Authority
- CN
- China
- Prior art keywords
- target
- data
- evaluation value
- classified
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及一种医疗数据库建立方法、装置、计算机设备和存储介质。方法包括:获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将关键字相同的待分类医疗数据作为初始分组;查询初始分组中的待分类医疗数据对应的费用;获取预设费用范围,从初始分组中获取费用在预设费用范围内的待分类医疗数据作为目标待分类医疗数据;从初始分组中提取目标待分类医疗数据得到目标分组,根据目标分组建立医疗数据库;根据医疗数据库中的目标分组是否分组合理,判断目标分组是否可用,并将目标分组是否可用的判断结果输出。采用本方法能够提高对医疗数据库的建立效率,且无需人工大量操作,避免经常出现误操作导致建立的医疗数据库准确率不高。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种医疗数据库建立方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,用户各种行为都可以通过线上进行,因此,对线上的医疗数据库的建立有着迫切的需要。
传统地,往往是人工通过获取疾病名称与相应的病理表现建立医疗数据库,而人工建立的医疗数据库由于工作量大,则导致建立耗费时间长,且人工建立相应的医疗数据库易出错。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高建立医疗数据库的效率以及准确度的医疗数据库建立方法、装置、计算机设备和存储介质。
一种医疗数据库建立方法,所述方法包括:
获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将所述关键字相同的待分类医疗数据作为初始分组;
查询所述初始分组中的所述待分类医疗数据对应的费用;
获取预设费用范围,从所述初始分组中获取所述费用在所述预设费用范围内的所述待分类医疗数据作为目标待分类医疗数据;
从所述初始分组中提取所述目标待分类医疗数据得到目标分组,根据所述目标分组建立医疗数据库;
根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
在其中一个实施例中,所述根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出,包括:
获取所述医疗数据库中的所述目标分组中的所述目标待分类医疗数据对应的费用;
计算所述目标待分类医疗数据对应的费用的平均值和标准差;
根据所述平均值与所述标准差得到所述医疗数据库中的所述目标分组的数据数量评价值;
获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用。
在其中一个实施例中,所述获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用之后,包括:
当根据所述数据数量评价值判断所述目标分组可用时,则获取不同所述目标分组对应的所述费用之间的协方差;
获取不同所述目标分组对应的所述费用的方差;
根据所述协方差以及所述方差得到所述医疗数据库中的所述目标分组的相关性评价值;
获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
在其中一个实施例中,所述获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用之后,包括:
当根据所述相关性评价值判断所述目标分组可用时,获取所述目标分组对应的地区信息;
计算所述目标分组中与所述地区信息对应的所述费用的地区平均值;
根据所述地区平均值得到所述医疗数据库中的所述目标分组的稳定性评价值;
获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
在其中一个实施例中,所述根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,包括:
当所述判断结果为可用时,则接收预测费用的预测指令,所述预测指令携带有待预测数据;
查询所述待预测数据所对应的所述目标分组作为预测目标分组;
获取所述待预测数据对应的地区信息,并获取所述预测目标分组中与所述地区信息对应的第一地区花费;
当所述第一地区花费低于预设值时,则将所述第一地区花费对应的所述预测目标分组添加弃用标签;
采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
在其中一个实施例中,所述根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,还包括:
获取待判断医疗数据以及所述待判断医疗数据所对应的待判断治疗费用;
查询所述待判断医疗数据对应的目标分组;
提取所述待判断医疗数据中包含的所述地区信息,获取所述目标分组中与所述地区信息对应的所述第二地区花费;
计算所述待判断治疗费用与所述第二地区花费的差值;
当所述差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
一种医疗数据库建立装置,所述装置包括:
获取模块,用于获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将所述关键字相同的待分类医疗数据作为初始分组;
查询模块,用于查询所述初始分组中的所述待分类医疗数据对应的费用;
提取模块,用于获取预设费用范围,从所述初始分组中获取所述费用在所述预设费用范围内的所述待分类医疗数据作为目标待分类医疗数据;
建立模块,用于从所述初始分组中提取所述目标待分类医疗数据得到目标分组,根据所述目标分组建立医疗数据库;
判断模块,用于根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
在其中一个实施例中,所述判断模块,包括:
费用获取单元,用于获取所述医疗数据库中的所述目标分组中的所述目标待分类医疗数据对应的费用;
计算单元,用于计算所述目标待分类医疗数据对应的费用的平均值和标准差;
数据数量评价值获取单元,用于根据所述平均值与所述标准差得到所述医疗数据库中的所述目标分组的数据数量评价值;
判断单元,用于获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
上述医疗数据库建立方法、装置、计算机设备和存储介质,根据待分类医疗数据中的关键字建立了初始分组,进而根据初始分组中的待分类医疗数据所对应的费用,二次分类得到目标分组,从而根据目标分组建立医疗数据库,则可以根据相应的待分类医疗数据进行两次的分类从而建立医疗数据库,无需人工根据相应的疾病数据与症状数据逐步建立关联关系得到相应的医疗数据库,提高对医疗数据库的建立效率,且无需人工大量操作,避免经常出现误操作导致建立的医疗数据库准确率不高。
附图说明
图1为一个实施例中医疗数据库建立方法的应用场景图;
图2为一个实施例中医疗数据库建立方法的流程示意图;
图3为一个实施例中可用性判断步骤的流程示意图;
图4为一个实施例中医疗数据库建立装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的医疗数据库建立方法,可以应用于如图1所示的应用环境中。其中,服务器可以控制初始数据库以及医疗数据库,待分类医疗数据存储在初级数据库中,服务器获取待分类医疗数据,并从获取的待分类医疗数据中提取关键字相同的待分类医疗数据,并作为初始分组,服务器查询初始分组中待分类医疗数据对应的费用,获取预设费用范围,从初始分组中获取费用在预设范围内的待分类医疗数据作为目标待分类医疗数据,从初始分组中提取目标待分类医疗数据得到目标分组,并根据目标分组建立医疗数据库,进而判断医疗数据库中包含的目标分组是否可用,并输出判断结果。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种医疗数据库建立方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202:获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将关键字相同的待分类医疗数据作为初始分组。
具体地,待分类医疗数据是指建立医疗数据库所需的整体医疗数据,待分类医疗数据可以包含有不同种类的疾病数据、疾病症状数据、医疗就诊信息等,例如,待分类医疗数据可以是对应的具体疾病,如高血压,高血压所对应的症状为头晕等。初始分组是指包含有相同关键字的待分类医疗数据的医疗数据分组。具体地,服务器存储有相应的初级数据库,初级数据库中存储有相应的待分类医疗数据,服务器查询待分类医疗数据中的关键字,进而将关键字相同的待分类医疗数据提取出来,将提取出来的包含有相同的关键字的待分类医疗数据作为初始分组。可以是,服务器对待分类医疗数据中包含的字符逐个查询,从而得到待分类医疗数据的关键字,提取关键字相同的待分类医疗数据,作为初始分组;还可以是,服务器获取不同待分类医疗数据所对应的国际疾病分类编码,也即ICD编码(international Classification of diseases,国际疾病分类编码),进而根据预设的查询规则查询ICD编码,将根据预设的查询规则将查询到的相同的ICD编码所对应的待分类医疗数据进行提取,作为初始分组,例如,服务器获取到待分类医疗数据的ICD编码,进而根据查询规则也即查询ICD编码的前三位,将前三位ICD编码相同的待分类医疗数据进行提取,作为初始分组。
S204:查询初始分组中的待分类医疗数据对应的费用。
具体地,服务器将具有相同的关键字的待分类医疗数据进行提取,得到初始分组,进而服务器根据初始分组中包含的待分类医疗数据,逐一查询每个初始分组中的待分类医疗数据所对应的费用,可以是,服务器得到初始分组时,逐一查询初始分组中在预设时间内在任一个地区治疗待分类医疗数据中所包含的疾病的费用。例如,服务器得到初始分组时,逐一查询初始分组中在两年内,特定的城市如上海治疗待分类医疗数据中所包含的疾病的费用。
S206:获取预设费用范围,从初始分组中获取费用在预设费用范围内的待分类医疗数据作为目标待分类医疗数据。
具体地,预设费用范围是指费用的具体界限,也即根据预设费用范围,可以提取目标待分类医疗数据。目标待分类医疗数据是指存储至医疗数据库中的整体医疗数据,目标待分类医疗数据可以包含有不同种类的疾病数据、疾病症状数据以及医疗就诊信息等,且目标待分类医疗数据为包含有相同的关键字,且所对应的费用所属相同的预设费用范围的数据。具体地,服务器得到不同的初始分组时,则根据初始分组包含的待分类医疗数据的关键字,获取对应的预设费用范围,根据获取到的预设费用范围,查询初始分组中的每个待分类医疗数据的费用,并将每个待分类医疗数据的费用与预设费用范围进行比较,当待分类医疗数据的费用在预设费用范围时,则费用在预设费用范围的待分类医疗数据作为目标待分类医疗数据。可以是,服务器获取的预设费用范围可以为与待分类医疗数据对应的费用在相同的时间段以及相同的地区的预设费用范围,当服务器获取到该预设费用范围时,逐一将初始分组中的待分类医疗数据的费用与预设费用范围进行比对,当待分类医疗数据的费用在预设费用范围内时,则该待分类医疗数据作为目标待分类医疗数据。例如,根据上述示例,获取到预设费用范围为两年内的对应的地区为特定的城市如上海的预设费用范围,进而服务器将初始分组中待分类医疗数据的费用与预设费用范围进行比对,当待分类医疗数据的费用在预设费用范围时,则将该初始分组中的待分类医疗数据作为目标待分类医疗数据。
S208:从初始分组中提取目标待分类医疗数据得到目标分组,根据目标分组建立医疗数据库。
具体地,目标分组中存储有目标待分类医疗数据,也即目标分组中存储的目标待分类医疗数据为费用在预设费用范围内的数据。医疗数据库是指存储有不同的目标分组的数据库,也即是存储有不同的目标待分类医疗数据的数据库,医疗数据库中可以存储有相应的疾病数据、对应的疾病症状数据、且疾病数据对应的治疗费用在预设费用范围内。具体地,当服务器根据预设数据范围,查询费用在预设费用范围内的待分类医疗数据,并将查询到的待分类医疗数据作为目标待分类医疗数据,服务器从初始分组中提取目标待分类医疗数据,将相同初始分组中的目标待分类医疗数据作为目标分组,服务器将所有的目标分组存储至相应的数据库,该数据库即为医疗数据库。
S210:根据医疗数据库中的目标分组是否分组合理,判断目标分组是否可用,并将目标分组是否可用的判断结果输出。
具体地,当服务器建立了相应的医疗数据库时,则需要采用医疗数据库中的目标分组进行数据查询,或者根据目标分组包含的目标待分类医疗数据所对应的费用进行后续治疗花费进行预测等,则服务器需要验证目标分组是否可用,可以是,服务器验证建立完成的医疗数据库中包含的目标分组是否分组合理,从而判断是否可用,并输出相应的判断结果,也即可以是,当医疗数据库中包含的目标分组可用,则在服务器对应的界面上输出相应的提示信息,如“验证完成,医疗数据库中的目标分组可用”;当医疗数据库中包含的目标分组不可用,则在服务器对应的界面上输出相应的提示信息,如“验证不通过,请调整目标分组”。
本实施例中,服务器根据待分类医疗数据的关键字建立了初始分组,进而根据初始分组中的待分类医疗数据所对应的费用,进行二次分类得到目标分组,将目标分组存储至相应的数据库得到医疗数据库,建立的医疗数据库包含有不同种类的数据,增加适用范围,且无需人工对大量数据进行操作从而建立相应的医疗数据库,提高建立医疗数据库的效率,且无需人工大量操作,避免人工操作的失误,提高建立的医疗数据库的准确性。
在其中一个实施例中,请参见图3,提供一可用性判断步骤的流程示意图,可用性判断步骤,也即判断医疗数据库中包含的目标分组是否可用,可以包括:获取医疗数据库中的目标分组中的目标待分类医疗数据对应的费用;计算目标待分类医疗数据对应的费用的平均值和标准差;根据平均值与标准差得到医疗数据库中的目标分组的数据数量评价值;获取目标数据数量评价值,比较数据数量评价值与目标数量评价值,得到目标分组是否可用。
具体地,数据数量评价值是指评价包含在医疗数据库中的每个目标分组中的数据量是否合理,也即是评价不同的目标分组中的目标待分类医疗数据的数量的合理性的评价指标。目标数据数量评价值是指预设的每个医疗分组包含的数据量合理的标准评价指标。具体地,当服务器将目标分组存储至数据库,得到对应的医疗数据库时,则对医疗数据库中包含的目标分组是否可用进行判断,则服务器可以对包含在医疗数据库中的目标分组数据数量评价值的判断维度进行判断。则服务器获取到医疗数据库中的不同的目标分组中每个目标待分类医疗数据所对应的费用,进而,计算获取的每个目标待分类医疗数据所对应的费用的平均值以及标准差,进而根据平均值与标准差得到数据数量评价值,获取到目标数据数量评价值,比较计算得到的数量评价指与目标数据数量评价值,从而对目标分组的可用性进行判断。可以是,对包含在医疗数据库中的任意一个目标分组,服务器根据目标分组数据数量评价值的判断维度对目标分组的可用性进行判断,也即服务器可以获取预设时间段内的任意一个地区信息,根据相应的地区信息,获取目标分组中包含的目标待分类医疗数据与该地区信息对应的费用,进而计算获取到的目标待分类医疗数据对应的费用的平均值与标准差,服务器计算标准差与平均值的比值,该比值即为数据数量评价值,具体地,数据数量评价值可以采用如下的计算公式进行计算:
其中,SD为目标分组中包含的目标待分类医疗数据的在一个地区的标准差,MEAN为目标分组中包含的目标待分类医疗数据在相同的一个地区的平均值。
当该数据数量评价值未超过目标数据数量评价值时,则每个目标分组中包含有合理的数据数量,也即可以进行后续的可用性判断,当数据数量评价值大于等于目标数据数量评价值时,则包含在医疗数据库中的该目标分组中的目标待分类医疗数据过多,则需要进行进一步处理,如拆分相应的目标分组等,进而服务器可以采用相同的方法对不同的目标分组的数据数量评价值进行计算,从而判断不同的目标分组的可用性。
例如,服务器可以获取预设时间段两年内,获取的地区信息为北京,获取目标分组中包含的目标待分类医疗数据在北京地区两年内治疗包含在待分类医疗数据中的疾病的费用,进而计算该费用的平均值与标准差,根据标准差与平均值的比值得到数据数量评价值,当该数据数量评价值未超过目标数据数量评价值时,如未超过2时,则可以进行后续的可用性判断,当数据数量评价值超过目标数据数量评价值,如超过2时,则包含在医疗数据库中的该目标分组中的目标待分类医疗数据过多,则需要进行进一步处理,如拆分相应的目标分组等地区信息等。需要说明的是,选取的预设时间段还可以是1年内、2年半内或3年内等,选取的预设地区还可以是对应的不同城市、如广州、深圳、西安等。
本实施例中,服务器对建立的医疗数据库中包含的目标分组的可用性中的数据数量的维度进行验证,从而保证目标分组中未包含有过多数据,避免后续使用过程中数据量过大而使用不便,以及在对费用预测的使用中预测不准确。
在其中一个实施例中,获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用之后,还可以包括:当判断目标分组可用时,则获取不同目标分组对应的费用之间的协方差;获取不同目标分组对应的费用的方差;根据协方差以及方差得到医疗数据库中的目标分组的相关性评价值;获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
具体地,相关性评价值是指评价包含在医疗数据库中的不同目标分组之间的是否有目标待分类医疗数据的交叉,也即评价每个目标分组是否是可以独立使用的评价指标。目标相关性评价值是预设的不同目标分组是是否可以独立使用的标准评价指标,根据相关性评价值与目标相关性评价值的比较,则可以得出已建立完成的目标分组是否存在数据交叉。当服务器根据数据数量评价值判断目标分组可用,也即服务器判断医疗数据库中存储的目标分组中包含的目标待分类医疗数据的数量是合理的,则可以进行第二级判断,也即判断不同的目标分组的数据的相关性,也即判断医疗数据库中包含的每个目标分组中的目标待分类医疗数据是独立的,也即相同的目标待分类医疗数据不会包含在不同的目标分组中,不同的目标分组中的目标待分类医疗数据之间无交叉。具体地,当服务器根据数据数量评价值判断目标分组数据为可用时,则获取不同目标分组之间的目标待分类医疗数据对应的费用的协方差,进而分别获取不同目标分组对应的费用的方差,进而根据得到的费用的方差以及协方差得到相关性评价值,服务器根据得到的相关性评价值判断目标分组是否可用。可以是,服务器根据数据数量评价值判断目标分组为可用时,则可以根据预设时间段内的一个地区信息获取不同目标分组中包含的目标待分类医疗数据的费用,也即获取的费用为在预设时间段内该地区对应的治疗目标待分类医疗数据中包含的疾病数据的费用,服务器根据地区信息获取到的不同目标分组中目标待分类医疗数据的费用时,则计算不同目标分组之间的协方差,再计算每个目标分组中的费用的方差,根据不同目标分组之间的协方差以及每个目标分组中的费用的方差,计算目标分组的相关性评价值,也即分别计算每个目标分组与不同的其他目标分组之间的相关性评价值,也即具体可以采用如下公式进行计算:
其中,COV(X1,X2)为不同的目标分组中的目标待分类数据在相同地区所对应的费用的协方差,为目标分组中的目标待分类医疗数据在一个城市所对应的费用的方差,/>为其不同的目标分组中的目标待分类医疗数据在相同的一个城市的费用方差。
当计算所有的目标分组之间相关性评价值小于目标相关性评价值时,则不同的目标分组中无交叉的目标待分类医疗数据,也即根据相关性评价值得到的目标分组的结果为可用,当相关性评价值大于等于目标相关性评价值时,则计算的相关性评价值大于目标相关性评价值的两个目标分组之间有目标待分类医疗数据的交叉,则需要进一步查询,是否需要对两个目标分组进行合并等操作。
例如,采用两个目标分组,也即目标分组A与目标分组B进行说明,服务器可以获取预设时间段两年内,获取的地区信息为北京,进而获取目标分组A中包含的、目标待分类医疗数据在北京地区两年内治疗包含在待分类医疗数据中的疾病的费用a,再获取目标分组B中包含的、目标待分类医疗数据在北京地区两年内治疗包含在待分类医疗数据中的疾病的费用b,进而根据费用a与费用b,计算目标分组A与目标分组B之间的费用的协方差,再计算目标分组A的费用a的方差,计算目标分组B的费用b的方差,从而计算A与B之间的相关性评价值,当计算的相关性评价值小于0.2时,则目标分组A与目标分组B中无交叉的目标待分类医疗数据,当相关性评价值大于等于0.2时,则目标分组A与目标分组B之间可能存在有交叉的目标待分类医疗数据,则需要进一步进行处理,如合并目标分组A与目标分组B等,也即采用相同的方法,可以分别计算医疗数据中包含的不同的目标分组之间的相关性评价值。
需要说明的是,选取的预设时间段还可以是1年内、2年半内或3年内等,选取的预设地区还可以是对应的不同城市、如广州、深圳、西安等。当计算不同的目标分组中的待分类医疗数据的协方差时,当不同的目标分组中包含的待分类医疗数据数量不同时,则可以对数量少的待分类医疗数据所对应的费用进行补充,如采用与目标待分类医疗数据所对应的地区费用平均值对缺少的费用进行补充等,也可以相应的删除数量较多的目标分组中的目标待分类医疗数据,例如,可以是,当目标分组A中包含有3个数据,当目标分组B中包含4个数据,则可以采用目标分组中的目标待分类医疗数据所对应的地区的平均费用代替第4个数据,也可以从目标分组B中删除1个数据,从而保证不同的目标分组数据的数量相同,从而计算协方差,上述进行数据补充还可以回归分析建立变量间关系,然后预测出缺省的数值等,在此不再赘述。
本实施例中,服务器对建立的医疗数据库中包含的目标分组的可用性中的相关性的维度进行验证,从而保证不同的目标分组中包含的目标待分类医疗数据无交叉,保证建立的医疗数据库的准确性。
在其中一个实施例中获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用之后,还可以包括:当根据相关性评价值判断目标分组可用时,获取目标分组对应的地区信息;计算目标分组中与地区信息对应的费用的地区平均值;根据地区平均值得到医疗数据库中的目标分组的稳定性评价值;获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
具体地,地区信息是指目标分组中的目标待分类医疗数据对应的具体地区,也即地区信息是目标分组中的目标待分类医疗数据中包含的疾病数据所适用的具体地区,可以是该地区有相关的疾病,也可以是需要采用医疗数库对该地区进行后续的费用等的预测。地区平均值是指根据目标分组中包含的每个目标待分类医疗数据所对应费用,计算得到的费用的平均值。稳定性评价值是指评价医疗数据库中包含的每个目标分组的可靠性的评价指标。目标稳定性评价值是指预设的医疗数据库中包含的每个目标分组的可靠性的标准值。当服务器根据相关性评价值判断目标分组可用,也即服务器判断医疗数据库中存储的目标分组中包含的目标待分类医疗数据无交叉,则可以进行第三级判断,也即判断不同的目标分组的可靠性。具体地,当服务器根据相关性评价值判断目标分组数据为可用时,进而获取到每个目标分组所对应的不同的地区信息,服务器计算不同的目标分组所对应的每个地区信息的费用的地区平均值,根据得到的每个地区的费用的地区平均值。可以是,服务器根据相关性评价值判断目标分组数据为可用时,则获取目标分组对应的不同的地区信息从而获取到不同的地区,进而根据获取到的一个地区,获取目标分组中每个目标待分类医疗数据中的疾病数据在该地区进行治疗的费用,进而计算目标分组中的目标待分类医疗数据中的疾病数据在该地区进行治疗费用的平均值为第一地区平均值,同样地,服务器根据获取到的另一个地区,获取目标分组中每个目标待分类医疗数据中的疾病数据在该另一个地区进行治疗的费用,进而计算目标分组中的目标待分类医疗数据中的疾病数据在该另一个地区进行治疗费用的平均值为第二地区平均值,进而根据在一个地区第一地区平均值与在另一个地区第二地区平均值,得到稳定性评价值,计算稳定性评价值可以采用如下公式:
其中,COEF(X1)是指目标分组中的目标待分类医疗数据在一个城市的费用的平均值,COEF(X2)是指相同的目标分组中的目标待分类医疗数据在另一个城市的费用的平均值。
当该稳定性评价值小于目标稳定性评价值时,则每个目标分组是稳定可靠的,也即目标分组中的目标待分类医疗数据是可信的,当稳定性评价值大于等于目标稳定性评价值时,则包含在医疗数据库中的该目标分组中的目标待分类医疗数据需要进一步查询可靠性,如可以查询是否由于数据统计时间过久而导致失去可信度等。
例如,采用一个目标分组A进行说明,且服务器可以获取的地区信息为地区a与地区b,服务器获取目标分组A中包含的目标待分类医疗数据中的疾病在地区a治疗的费用,进而计算费用的平均值作为目标分组A在地区a的第一地区平均值,同样地,得到目标分组A在地区b的第二地区平均值,进而采用上述公式计算得到稳定性评价值,当计算得到的稳定性评价值小于0.2时,则该目标分组中包含的数据是可信的,当得到的稳定性评价值大于等于0.2时,则该目标分组中包含的数据需要进一步确认。采用相同的方法,可以计算不同的目标分组的稳定性评价值,从而判断每个目标分组中的目标待分类医疗数据是否是可信的。
本实施例中,服务器对建立的医疗数据库中包含的目标分组的可用性中的稳定性的维度进行验证,从而保证每个目标分组中包含的目标待分类医疗数据都为可信,提高后续使用医疗数据库的可信度。
在其中一个实施例中,根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,包括:当判断结果为可用时,则接收预测费用的预测指令,预测指令携带有待预测数据;查询待预测数据所对应的目标分组作为预测目标分组;获取待预测数据对应的地区信息,并获取预测目标分组中与地区信息对应的第一地区花费;当第一地区花费低于预设值时,则将第一地区花费对应的预测目标分组添加弃用标签;采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
具体地,预测指令是用于指示服务器对相应的数据进行预测的命令,当服务器接收到预测指令时,则获取待预测数据,进而对待预测数据进行预测。待预测数据是指需要采用目标分组进行费用预测的数据,待预测数据可以包含有身份信息,历史诊断信息等,例如,待预测数据可以包含有具体的人员的姓名、联系方式、身份证信息、年龄等,历史诊断信息如历史预设时间段内的疾病数据,症状数据等。从而可以预测相应的费用。预测目标分组是指与待预测数据对应的目标分组,如可以根据待预测数据中包含的相应的疾病数据逐一与目标分组中的目标待分类医疗数据中的疾病数据进行匹配,当匹配成功时,则匹配成功的疾病数据对应的待分类医疗数据所在的目标分组即为预测目标分组。第一地区花费是指根据待预测数据查询到相应的目标分组,根据查询到的目标分组得到的费用数据,该费用数据与地区信息所对应,也即该费用为在该地区治疗该疾病所需的费用。弃用标签是指在预测过程中对不采纳的目标分组添加的相关标识,当有目标分组添加有弃用标签,则在对待预测数据进行对应的费用进行预测时,该目标分组中的目标待分类医疗数据所对应的费用均不参与预测。
具体地,经过上述不同维度的可用性判断,当所有维度输出的结果均为可用时,则医疗数据中的目标分组的判断结果为可用,进而可以采用医疗数据库中的目标分组进行费用预测,当服务器接收到相应的预测指令,该预测指令指示预测待预测数据下一年的医疗花费,则根据预测指令,获取到待预测数据,查询待预测数据中的身份信息以及对应的诊断信息,根据待预测数据中的身份信息查询与该身份信息对应的地区信息,进而根据待预测数据中的诊断信息,与目标分组中的目标待分类医疗数据包含的疾病数据逐一匹配,从而匹配到目标待分类医疗数据以及目标分组作为预测目标分组,进而根据获取到的地区信息查询与目标待分类医疗数据所对应的花费,作为预测目标分组中的第一地区花费,进而将该第一地区预测花费与预设值进行比较,当第一地区预测花费低于预设值时,也即该费用太少,无需进行预测中计算,则在进行预测费用时不考虑该费用,也即将该预测目标分组添加弃用标签,进而将未添加弃用标签的预测目标分组中获取到的第一地区花费对获取到的待预测数据进行计算,可以将不同的第一地区花费进行相加对待测数据进行计算。需要说明的是,当服务器根据待预测数据查询到预测目标分组时,根据地区信息查询预测目标分组中与地区信息对应的第一地区花费,将第一花费与预设值进行比较,当查询同一个预测分组中有多个第一地区花费,每个第一地区花费均低于预设值时,服务器将该预测目标分组添加有弃用标签。且预设值可以根据实际情况进行调整,如设置为100元、500元、700元等。
例如,当服务器接收到相应的预测指令,该预测指令指示预测待预测数据下一年的医疗花费,则根据预测指令,获取到待预测数据,查询待预测数据中的身份信息如姓名、身份证号码等,并查询对应的诊断信息,如疾病为高血压与心脏病,根据待预测数据中的身份信息姓名与身份证号码查询与该身份信息对应的地区信息为地区S,进而根据待预测数据中的诊断信息,如采用高血压与心脏病分别与目标分组中的目标待分类医疗数据包含的疾病数据逐一匹配,从而匹配到目标待分类医疗数据d以及目标分组D,匹配到目标待分类医疗数据d1以及目标分组D1,将目标分组D与目标分组D1分别作为预测目标分组E和预测目标分组E1,进而根据获取到的地区信息查询与目标待分类医疗数据d所对应的花费,作为预测目标分组E中的第一地区花费S,进而根据获取到的地区信息查询与目标待分类医疗数据d1所对应的花费,作为预测目标分组E1中的第一地区花费S1,进而分别将第一地区花费S与第一地区花费S1与预设值进行比较,当第一地区预测花费S低于预设值时,则在进行预测费用时不考虑该费用,也即将该预测目标分组E添加弃用标签,进而将未添加弃用标签的预测目标分组对获取到的待预测数据进行计算,同样地,当第一地区预测花费S1低于预设值时,则在进行预测费用时不考虑该费用,也即将该预测目标分组E1添加弃用标签,进而将未添加弃用标签的预测目标分组对获取到的待预测数据进行计算。
本实施例中,可以采用建立完成的医疗数据库中的目标分组对待预测数据的费用进行预测,使用范围广,且在预测过程中,可以不采用费用低于预设值的费用进行预测,简单易行,提高预测效率。
在其中一个实施例中,根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,还包括:获取待判断医疗数据以及待判断医疗数据所对应的待判断治疗费用;查询待判断医疗数据对应的目标分组;提取待判断医疗数据中包含的地区信息,获取目标分组中与地区信息对应的第二地区花费;计算待判断治疗费用与第二地区花费的差值;当差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
具体地,待判断医疗数据是指需要采用目标分组对相应的费用进行判断的数据,待判断医疗数据中包含有身份信息、历史诊断信息、诊断对应花费等,例如,待判断医疗数据可以包含具体的人员姓名、联系方式、年龄、身份证信息等,历史诊断信息如历史预设事件段内的疾病数据、症状数据等,诊断对应花费可以是预设时间段内治疗疾病所对应的花费等。待判断治疗费用是指包含在待判断医疗数据中的花费,该花费可以为治疗待判断医疗数据中包含的疾病数据对应的花费,也即可以为实际花费。第二地区花费是指根据待判断医疗数据查询到相应的目标分组,根据目标分组得到的费用数据,该费用数据与地区信息所对应,也即该费用为在该地区治疗该与待判断医疗数据中包含的疾病所需的费用,也即为存储的目标费用。
具体地,经过上述不同维度的可用性判断,当所有维度输出的结果均为可用时,则医疗数据中的目标分组的判断结果为可用,进而可以采用医疗数据库中的目标分组对待判断医疗数据的费用进行判断,也即判断治疗疾病所花费的费用是否合理。服务器获取到待判断医疗数据,根据待判断医疗数据查询到待判断治疗费用,进而查询待判断医疗数据中的身份信息,根据相应的身份信息查询到地区信息,服务器进而提取待判断医疗数据中包含的诊断信息,根据诊断信息中包含的疾病数据,与目标分组中的目标待分类医疗数据中的疾病数据逐一匹配,进而查询到对应的目标待分类医疗数据,根据获取到的地区信息,查询匹配到的目标待分类医疗数据所对应的第二地区花费,也即查询到存储的治疗该疾病在地区所需的花费,服务器计算待判断治疗费用与第二地区花费的差值,当差值超过阈值时,则该实际费用与目标费用差距较大,则需要进一步监控是否出现乱开药等现象,进而在服务器的显示界面上输出相应的监控待判断治疗费用的提示信息。
本实施例中,可以采用建立完成的医疗数据库中的目标分组对待判断治疗费用进行判断,从而对可疑的待判断医疗数据进行监控,增加使用范围,适用性强。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种医疗数据库装置400,包括:获取模块410、查询模块420、提取模块430、建立模块440和判断模块450,其中:
获取模块410,用于获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将关键字相同的待分类医疗数据作为初始分组。
查询模块420,用于查询初始分组中的待分类医疗数据对应的费用。
提取模块430,用于获取预设费用范围,从初始分组中获取费用在预设费用范围内的待分类医疗数据作为目标待分类医疗数据。
建立模块440,用于从初始分组中提取目标待分类医疗数据得到目标分组,根据目标分组建立医疗数据库。
判断模块450,用于根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
在其中一个实施例中,判断模块450,包括:
费用获取单元,用于获取医疗数据库中的目标分组中的目标待分类医疗数据对应的费用。
计算单元,用于计算目标待分类医疗数据对应的费用的平均值和标准差。
数据数量评价值获取单元,用于根据平均值与标准差得到医疗数据库中的目标分组的数据数量评价值。
判断单元,用于获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用。
在其中一个实施例中,判断模块450,还包括:
协方差获取单元,用于当根据数据数量评价值判断目标分组可用时,则获取不同目标分组对应的费用之间的协方差。
方差获取单元,用于获取不同目标分组对应的费用的方差。
相关性评价值获取单元,用于根据协方差以及方差得到医疗数据库中的目标分组的相关性评价值。
判断单元,还可以用于获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
在其中一个实施例中,判断模块450,还可以包括:
地区信息获取单元,用于当根据相关性评价值判断目标分组可用时,获取目标分组对应的地区信息。
地区平均值计算单元,用于计算目标分组中与地区信息对应的费用的地区平均值。
稳定性评价值获取单元,用于根据地区平均值得到医疗数据库中的目标分组的稳定性评价值。
判断单元,还可以用于获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
在其中一个实施例中,医疗数据库建立装置400,可以包括:
预测指令接收模块,用于当判断结果为可用时,则接收预测费用的预测指令,预测指令携带有待预测数据。
预测目标分组查询模块,用于查询待预测数据所对应的目标分组作为预测目标分组。
第一地区花费获取模块,用于获取待预测数据对应的地区信息,并获取预测目标分组中与地区信息对应的第一地区花费。
添加模块,用于当第一地区花费低于预设值时,则将第一地区花费对应的预测目标分组添加弃用标签。
计算模块,用于采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
在其中一个实施例中,医疗数据库建立装置400,还可以包括:
待判断治疗费用获取模块,用于获取待判断医疗数据以及待判断医疗数据所对应的待判断治疗费用。
目标分组查询模块,用于查询待判断医疗数据对应的目标分组。
第二地区花费获取模块,用于提取待判断医疗数据中包含的地区信息,获取目标分组中与地区信息对应的第二地区花费。
差值计算模块,用于计算待判断治疗费用与第二地区花费的差值。
输出模块,用于当差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
关于医疗数据库建立装置的具体限定可以参见上文中对于医疗数据库建立方法的限定,在此不再赘述。上述医疗数据库建立装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗数据库建立数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗数据库建立方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将关键字相同的待分类医疗数据作为初始分组。查询初始分组中的待分类医疗数据对应的费用。获取预设费用范围,从初始分组中获取费用在预设费用范围内的待分类医疗数据作为目标待分类医疗数据。从初始分组中提取目标待分类医疗数据得到目标分组,根据目标分组建立医疗数据库。根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
在其中一个实施例中,处理器执行计算机程序时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出,可以包括:获取医疗数据库中的目标分组中的目标待分类医疗数据对应的费用。计算目标待分类医疗数据对应的费用的平均值和标准差。根据平均值与标准差得到医疗数据库中的目标分组的数据数量评价值。获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用。
在其中一个实施例中,处理器执行计算机程序时实现获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用之后,可以包括:当根据数据数量评价值判断目标分组可用时,则获取不同目标分组对应的费用之间的协方差。获取不同目标分组对应的费用的方差。根据协方差以及方差得到医疗数据库中的目标分组的相关性评价值。获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
在其中一个实施例中,处理器执行计算机程序时实现获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用之后,还可以包括:当根据相关性评价值判断目标分组可用时,获取目标分组对应的地区信息。计算目标分组中与地区信息对应的费用的地区平均值。根据地区平均值得到医疗数据库中的目标分组的稳定性评价值。获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
在其中一个实施例中,处理器执行计算机程序时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,包括:当判断结果为可用时,则接收预测费用的预测指令,预测指令携带有待预测数据。查询待预测数据所对应的目标分组作为预测目标分组。获取待预测数据对应的地区信息,并获取预测目标分组中与地区信息对应的第一地区花费。当第一地区花费低于预设值时,则将第一地区花费对应的预测目标分组添加弃用标签。采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
在其中一个实施例中,处理器执行计算机程序时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,还包括:获取待判断医疗数据以及待判断医疗数据所对应的待判断治疗费用。查询待判断医疗数据对应的目标分组。提取待判断医疗数据中包含的地区信息,获取目标分组中与地区信息对应的第二地区花费。计算待判断治疗费用与第二地区花费的差值。当差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将关键字相同的待分类医疗数据作为初始分组。查询初始分组中的待分类医疗数据对应的费用。获取预设费用范围,从初始分组中获取费用在预设费用范围内的待分类医疗数据作为目标待分类医疗数据。从初始分组中提取目标待分类医疗数据得到目标分组,根据目标分组建立医疗数据库。根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
在其中一个实施例中,计算机程序被处理器执行时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出,可以包括:获取医疗数据库中的目标分组中的目标待分类医疗数据对应的费用。计算目标待分类医疗数据对应的费用的平均值和标准差。根据平均值与标准差得到医疗数据库中的目标分组的数据数量评价值。获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用。
在其中一个实施例中,计算机程序被处理器执行时实现获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用之后,可以包括:当根据数据数量评价值判断目标分组可用时,则获取不同目标分组对应的费用之间的协方差。获取不同目标分组对应的费用的方差。根据协方差以及方差得到医疗数据库中的目标分组的相关性评价值。获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
在其中一个实施例中,计算机程序被处理器执行时实现获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用之后,还可以包括:当根据相关性评价值判断目标分组可用时,获取目标分组对应的地区信息。计算目标分组中与地区信息对应的费用的地区平均值。根据地区平均值得到医疗数据库中的目标分组的稳定性评价值。获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
在其中一个实施例中,计算机程序被处理器执行时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,包括:当判断结果为可用时,则接收预测费用的预测指令,预测指令携带有待预测数据。查询待预测数据所对应的目标分组作为预测目标分组。获取待预测数据对应的地区信息,并获取预测目标分组中与地区信息对应的第一地区花费。当第一地区花费低于预设值时,则将第一地区花费对应的预测目标分组添加弃用标签。采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
在其中一个实施例中,计算机程序被处理器执行时实现根据所述医疗数据库中的所述目标分组是否分组合理,判断所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出之后,还包括:获取待判断医疗数据以及待判断医疗数据所对应的待判断治疗费用。查询待判断医疗数据对应的目标分组。提取待判断医疗数据中包含的地区信息,获取目标分组中与地区信息对应的第二地区花费。计算待判断治疗费用与第二地区花费的差值。当差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种医疗数据库建立方法,所述方法包括:
获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将所述关键字相同的待分类医疗数据作为初始分组;
查询所述初始分组中的所述待分类医疗数据对应的费用;
获取预设费用范围,从所述初始分组中获取所述费用在所述预设费用范围内的所述待分类医疗数据作为目标待分类医疗数据;
从所述初始分组中提取所述目标待分类医疗数据得到目标分组,根据所述目标分组建立医疗数据库;
获取所述医疗数据库中的所述目标分组中的所述目标待分类医疗数据对应的费用;计算所述目标待分类医疗数据对应的费用的平均值和标准差;根据所述平均值与所述标准差得到所述医疗数据库中的所述目标分组的数据数量评价值;获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
2.根据权利要求1所述的方法,其特征在于,所述获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用之后,包括:
当根据所述数据数量评价值判断所述目标分组可用时,则获取不同所述目标分组对应的所述费用之间的协方差;
获取不同所述目标分组对应的所述费用的方差;
根据所述协方差以及所述方差得到所述医疗数据库中的所述目标分组的相关性评价值;
获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
3.根据权利要求2所述的方法,其特征在于,所述获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用之后,包括:
当根据所述相关性评价值判断所述目标分组可用时,获取所述目标分组对应的地区信息;
计算所述目标分组中与所述地区信息对应的所述费用的地区平均值;
根据所述地区平均值得到所述医疗数据库中的所述目标分组的稳定性评价值;
获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标分组是否可用的判断结果输出之后,包括:
当所述判断结果为可用时,则接收预测费用的预测指令,所述预测指令携带有待预测数据;
查询所述待预测数据所对应的所述目标分组作为预测目标分组;
获取所述待预测数据对应的地区信息,并获取所述预测目标分组中与所述地区信息对应的第一地区花费;
当所述第一地区花费低于预设值时,则将所述第一地区花费对应的所述预测目标分组添加弃用标签;
采用未添加所述弃用标签的所述预测目标分组所对应的第一地区花费对所述待预测数据进行计算。
5.根据权利要求4所述的方法,其特征在于,所述将所述目标分组是否可用的判断结果输出之后,还包括:
获取待判断医疗数据以及所述待判断医疗数据所对应的待判断治疗费用;
查询所述待判断医疗数据对应的目标分组;
提取所述待判断医疗数据中包含的所述地区信息,获取所述目标分组中与所述地区信息对应的第二地区花费;
计算所述待判断治疗费用与所述第二地区花费的差值;
当所述差值超过阈值时,则输出提示监控待判断治疗费用的提示信息。
6.一种医疗数据库建立装置,其特征在于,所述装置包括:
获取模块,用于获取待分类医疗数据,并从所获取的待分类医疗数据中提取关键字相同的待分类医疗数据,将所述关键字相同的待分类医疗数据作为初始分组;
查询模块,用于查询所述初始分组中的所述待分类医疗数据对应的费用;
提取模块,用于获取预设费用范围,从所述初始分组中获取所述费用在所述预设费用范围内的所述待分类医疗数据作为目标待分类医疗数据;
建立模块,用于从所述初始分组中提取所述目标待分类医疗数据得到目标分组,根据所述目标分组建立医疗数据库;
判断模块,用于获取所述医疗数据库中的所述目标分组中的所述目标待分类医疗数据对应的费用;计算所述目标待分类医疗数据对应的费用的平均值和标准差;根据所述平均值与所述标准差得到所述医疗数据库中的所述目标分组的数据数量评价值;获取目标数据数量评价值,比较所述数据数量评价值与所述目标数据数量评价值,得到所述目标分组是否可用,并将所述目标分组是否可用的判断结果输出。
7.根据权利要求6所述的装置,其特征在于,所述判断模块包括:
协方差获取单元,用于当根据数据数量评价值判断目标分组可用时,则获取不同目标分组对应的费用之间的协方差;
方差获取单元,用于获取不同目标分组对应的费用的方差;
相关性评价值获取单元,用于根据协方差以及方差得到医疗数据库中的目标分组的相关性评价值;
判断单元,用于获取目标相关性评价值,比较所述相关性评价值与所述目标相关性评价值,得到所述目标分组是否可用。
8.根据权利要求7所述的装置,其特征在于,所述判断模块还包括:
地区信息获取单元,用于当根据相关性评价值判断目标分组可用时,获取目标分组对应的地区信息;
地区平均值计算单元,用于计算目标分组中与地区信息对应的费用的地区平均值;
稳定性评价值获取单元,用于根据地区平均值得到医疗数据库中的目标分组的稳定性评价值;
判断单元,还用于获取目标稳定性评价值,比较所述稳定性评价值与所述目标稳定性评价值,判断所述目标分组是否可用。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810529993 | 2018-05-29 | ||
CN201810529993X | 2018-05-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109471852A CN109471852A (zh) | 2019-03-15 |
CN109471852B true CN109471852B (zh) | 2023-08-01 |
Family
ID=65673116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811399720.4A Active CN109471852B (zh) | 2018-05-29 | 2018-11-22 | 医疗数据库建立方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109471852B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738573A (zh) * | 2019-09-06 | 2020-01-31 | 平安医疗健康管理股份有限公司 | 基于分类器的数据处理方法、设备、存储介质及装置 |
CN110765232B (zh) * | 2019-10-11 | 2023-03-21 | 深圳平安医疗健康科技服务有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101587518A (zh) * | 2009-07-03 | 2009-11-25 | 深圳市宝安区人民医院 | 一种实现数字化病案分类管理的方法 |
CN104247369A (zh) * | 2012-02-22 | 2014-12-24 | 高通股份有限公司 | 用于使设备标识符变模糊的方法和设备 |
CN105574004A (zh) * | 2014-10-10 | 2016-05-11 | 阿里巴巴集团控股有限公司 | 一种网页去重方法和设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL128099A (en) * | 1996-07-22 | 2004-05-12 | Cyva Res Corp | A tool for the security of personal information and its exchange |
US8775330B2 (en) * | 2003-06-23 | 2014-07-08 | International Business Machines Corporation | Establishing a data management fee structure based on fine grained data entities |
US20080021739A1 (en) * | 2006-07-19 | 2008-01-24 | Brock David L | Internet browser based electronic medical record database management system and method |
EP2490135A1 (en) * | 2011-02-21 | 2012-08-22 | Amadeus S.A.S. | Method and system for providing statistical data from a data warehouse |
CN108154384A (zh) * | 2011-07-13 | 2018-06-12 | 阿里巴巴集团控股有限公司 | 广告投放方法、广告投放服务器及广告投放系统 |
WO2016115551A1 (en) * | 2015-01-16 | 2016-07-21 | Pricewaterhousecoopers Llp | Healthcare data interchange system and method |
WO2017042396A1 (en) * | 2015-09-10 | 2017-03-16 | F. Hoffmann-La Roche Ag | Informatics platform for integrated clinical care |
CN106327395A (zh) * | 2016-08-31 | 2017-01-11 | 杭州逸曜信息技术有限公司 | 医疗费用信息的处理方法 |
-
2018
- 2018-11-22 CN CN201811399720.4A patent/CN109471852B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101587518A (zh) * | 2009-07-03 | 2009-11-25 | 深圳市宝安区人民医院 | 一种实现数字化病案分类管理的方法 |
CN104247369A (zh) * | 2012-02-22 | 2014-12-24 | 高通股份有限公司 | 用于使设备标识符变模糊的方法和设备 |
CN105574004A (zh) * | 2014-10-10 | 2016-05-11 | 阿里巴巴集团控股有限公司 | 一种网页去重方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109471852A (zh) | 2019-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177714B (zh) | 异常行为检测方法、装置、计算机设备和存储介质 | |
CN110490594B (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
CN110532168B (zh) | 全链路接口压测方法、装置、计算机设备及存储介质 | |
CN109215771B (zh) | 医疗映射关系库建立方法、装置、计算机设备和存储介质 | |
CN111245912B (zh) | 智能楼宇信息监控方法、装置、服务器及智能楼宇系统 | |
CN112151141A (zh) | 医疗数据处理方法、装置、计算机设备和存储介质 | |
CN110287332B (zh) | 云环境下仿真模型选择方法与装置 | |
CN110888911A (zh) | 样本数据处理方法、装置、计算机设备及存储介质 | |
CN108924258B (zh) | 后台信息推送方法、装置、计算机设备和存储介质 | |
CN110727526B (zh) | 大数据计算任务的处理方法和系统 | |
CN106572048A (zh) | 一种社交网络中用户信息的识别方法和系统 | |
CN109471852B (zh) | 医疗数据库建立方法、装置、计算机设备和存储介质 | |
CN110929994A (zh) | 企业关联风险的分析方法、装置、设备以及存储介质 | |
CN110837956A (zh) | 地下电缆巡检任务分配方法和装置 | |
CN113283502A (zh) | 基于聚类的设备状态阈值确定方法和装置 | |
CN109783788A (zh) | 数据表填补方法、装置、计算机设备和存储介质 | |
CN111723097A (zh) | 应用程序接口配置方法、装置、计算机设备和存储介质 | |
CN112347474A (zh) | 一种安全威胁情报的构建方法、装置、设备和存储介质 | |
CN110555165B (zh) | 信息识别方法、装置、计算机设备和存储介质 | |
CN109218131B (zh) | 网络监控方法、装置、计算机设备和存储介质 | |
CN114022926A (zh) | 一种人脸识别方法、装置、设备以及存储介质 | |
CN112272358A (zh) | 天气预警方法、装置和电子设备 | |
CN112465646B (zh) | 证券数据监控方法、装置、计算机设备和存储介质 | |
CN111339317A (zh) | 用户注册识别方法、装置、计算机设备和存储介质 | |
CN110991473A (zh) | 图像样本的特征选择方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220520 Address after: 518048 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |