CN117809798B - 基于大模型的检验报告解读方法、系统、设备及介质 - Google Patents
基于大模型的检验报告解读方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117809798B CN117809798B CN202410233518.3A CN202410233518A CN117809798B CN 117809798 B CN117809798 B CN 117809798B CN 202410233518 A CN202410233518 A CN 202410233518A CN 117809798 B CN117809798 B CN 117809798B
- Authority
- CN
- China
- Prior art keywords
- report
- model
- language model
- large language
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012795 verification Methods 0.000 title description 3
- 238000004458 analytical method Methods 0.000 claims abstract description 142
- 230000036541 health Effects 0.000 claims abstract description 72
- 238000007689 inspection Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims description 57
- 239000013598 vector Substances 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000009411 base construction Methods 0.000 claims description 4
- 230000003750 conditioning effect Effects 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 description 14
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 238000005065 mining Methods 0.000 description 14
- 238000003745 diagnosis Methods 0.000 description 7
- 239000000306 component Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000009666 routine test Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000002586 coronary angiography Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000007449 liver function test Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000002107 myocardial effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于大模型的检验报告解读方法、系统、设备及介质,涉及检验报告自动解读,其目的在于提高检验报告解读的准确性和可靠性,其包括:通过爬虫程序从网络上收集相关的医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备根据报告解读结论输出健康建议的能力;获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。本方法提高检验报告的解读准确性和可靠性,被检测者可根据健康建议进行后续健康调理。
Description
技术领域
本发明属于人工智能技术领域,涉及检验报告的智能解读,尤其涉及一种基于大模型的检验报告解读方法、系统、设备及介质。
背景技术
随着生活水平的提高,人们对健康状况的关注也是越来越高。无论是人们日常的健康体检,还是在就医诊断过程中,都会涉及各种各样的检测,同时也会产生各种检测报告、检验报告(以下统称为检验报告)。尤其是在临床中,患者对自身的健康状况有了足够了解,对检验报告中的各项数据也有了清晰的认识、了解,那患者配合诊断、治疗的可能性就会大大提高,对患者后续的健康管理也非常重要。然而,由于报告的解读过于专业,普通人对报告中的专业术语不理解。所以,现有技术中,被测者在领取到检测报告后,通常是将报告给到医生,然后由医生进行指导、解读、解释并给出相应健康建议。由于现在医疗资源较为欠缺,医生基本不可能做到面面俱到,对每位患者详细解读、解释其检验报告,为此,就亟需一种检验报告的智能解读方法、解读系统,以便普通人员能够根据解读的结果了解自身的健康状况、知晓如何配合医生的诊疗、甚至是后续的自我健康管理。
现有的报告智能解读方法,大多是从对接的医疗信息系统中获取检查报告,然后大模型根据患者针对报告提出的问题进行分析,得到关键词,患者问答系统根据关键词匹配相应的回答以及诊断建议,然后大模型再根据问答以及诊断建议进行分析后,生成解答并提供给患者。
如,申请号为202310472245.3的发明专利申请就公开了一种体检报告解读方法、装置、存储介质以及电子设备,其方法包括:获取待解读的体检报告;针对所述体检报告的类型采用与所述体检报告的类型相对应的数据提取方法,获取与所述体检报告对应的若干结构化体检数据;采用预设算法模型对各所述结构化体检数据进行数据处理,得到与所述体检报告对应的各医疗分析数据;至少基于目标医疗分析数据以及与所述目标医疗分析数据对应的预置数据等级划分方式,生成反映健康趋势的体检报告解读图示。本解读方法可以更精确的直观的展示用户的体检结果,反映用户的健康状况。
再如,申请号为202310956340.0的发明专利申请就公开了一种基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统,其包括流程挖掘数据引擎、流程挖掘图表组件、任务编排引擎、大语言模型和自然语言接口;流程挖掘数据引擎:流程挖掘数据引擎是该系统的核心组件,用于接收和处理流程挖掘的原始数据;流程挖掘数据引擎从各种数据源中提取数据,并进行预处理和清洗,以准备后续的分析工作;数据源包括日志文件、数据库、传感器,该引擎支持数据抽取、转换和加载、数据清洗和特征提取,以确保数据的质量和准确性;流程挖掘图表组件:流程挖掘图表组件用于将经过专题数据计算后的结果可视化呈现。流程挖掘图表组件生成各种类型的图表,以展示不同维度的流程挖掘数据,图表为柱状图、折线图、饼图;这些图表能够直观地揭示数据之间的关联和趋势,帮助用户更好地理解和分析数据;任务编排引擎:任务编排引擎是协调系统中各个组件的关键部分;任务编排引擎根据用户需求和输入提示,与大语言模型进行交互,并协调生成最终的智能分析报告;任务编排引擎负责将用户的问题和需求转化为适合大语言模型处理的输入格式,并管理模型的调用和结果的解析;大语言模型:大语言模型是系统中的智能分析核心,它基于强大的自然语言处理和文本生成能力,可以根据输入提示推理生成结论和报告;通过与任务编排引擎的协作,大语言模型能够利用流程挖掘数据、专题数据计算结果以及可视化图表等信息,生成描述、分析和解读流程挖掘模型的智能报告;自然语言接口:系统提供自然语言接口,使系统具备以自然语言方式进行交互的能力,用户可以通过简单的自然语言指令与系统进行交互;用户可以提出问题、输入指令或请求特定类型的报告,系统将根据用户的输入进行解析和生成对应的分析报告,使得用户与系统之间的交互更加直观和便捷。
如上述的基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统,现有的智能分析报告大多仅是采用大语言模型对报告进行解读,或者根据患者的提问结合报告进行解答。但是,基于大语言模型分析得来的文本数据,尚不能直接使用,或者使用后对报告的解读准确性较低、可靠性也更低,有必要提供一种解读准确性与可靠性更高的检验报告解读方法;此外,现有的解读方法仅是解读报告中的内容,并不能根据报告给出相应的健康建议。
发明内容
本发明的目的在于:为了提高检验报告解读的准确性和可靠性,提供一种基于大模型的检验报告解读方法、系统、设备及介质,通过在构建和微调大语言模型后,使模型能够掌握专业知识,形成专家智库,模型可根据被测者的检验数据进行解读、生成对应的健康建议,让被测者能够读懂自己的检验报告,知晓后续的健康建议。
本发明为了实现上述目的具体采用以下技术方案:
一种基于大模型的检验报告解读方法,包括以下步骤:
步骤S1,构建专家知识库;
通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;
步骤S2,使用前微调;
对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力;
步骤S3,报告解析;
获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。
进一步地,步骤S1中,报告解析大语言模型进行自监督学习时,具体步骤为:
步骤S1-1,输出特征向量;
使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;
步骤S1-2,预测特征向量;
对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;
步骤S1-3,更新参数;
根据向量误差,更新大语言模型的参数;
步骤S1-4,重复至模型收敛;
重复步骤S1-2到步骤S1-3,直至报告解析大语言模型收敛。
进一步地,步骤S2中,在进行健康建议微调时,具体步骤为:
步骤S2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的(输入)和/或(输出),并将这些数据(指令,输入,输出)、(指令、输出)作为种子池;
步骤S2-1-2,从种子池中随机抽取n条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的(输入,输出);
其中,指令类型包括分类指令、非分类指令;
步骤S2-1-3,选择m条人工编写指令、p条模型生成指令,并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的(输入,输出);
步骤S2-1-4,判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标;若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍,则将该指令对应的数据(指令,输入,输出)、(指令、输出)添加进种子池,并更新种子池;
步骤S2-1-5,重复步骤S2-1-3、步骤S2-1-4,直至种子池中所有指令数量达到10000条;
步骤S2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据(指令,输入,输出)中的(输入),并输出与该(输入)对应的(输出),该(输出)即为健康建议。
进一步地,步骤S2,在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调。
更进一步地,在进行专家反馈微调时,具体步骤为:
步骤S2-2-1,获取样本数据;
获取检验报告样本数据及报告解读结论;
步骤S2-2-2,构建奖励模型;
奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到;
步骤S2-2-3,训练奖励模型;
采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练,得到成熟的奖励模型;
步骤S2-2-4,优化模型;
使用PPO算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数。
更进一步地,步骤S2-2-3中,在训练奖励模型时,损失函数为:
,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型。
进一步地,步骤S2-2-4中,在优化模型时,使用KL散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示KL散度,表示奖励模型输出。
一种基于大模型的检验报告解读系统,包括以下步骤:
专家知识库构建模块,用于通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;
使用前微调模块,用于对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备根据报告解读结论输出健康建议的能力;
报告解析模块,用于获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。
本发明的有益效果如下:
1、本发明中,通过爬虫技术获取了相关的医学知识数据,形成了专家知识库,并且报告解析大语言模型可根据爬取的医学知识进行自监督学习,从而使报告解析大语言模型能够掌握相关的医学知识,并将其用于对待检验报告进行解析,从而可大大提高检验报告的解读准确性与可靠性;由于该报告解析大语言模型经过了使用前的微调,使得该报告解析大语言模型不仅可以输出解读结论,其还可以根据检验报告、解读结论生成健康建议,被检测人员可根据健康建议进行后续的健康调理,改善自身健康环境;此外,由于在爬取医学知识数据时,可以对爬取的数据进行归类,归类时,可以按照疾病类型进行分类,也可以按照医学报告类型进行分类,这样无论是做普通的体检检测,还是疑似某个疾病的检测,报告解析大语言模型能够给出更为准确、专业的解读结论、以及健康建议。
2、本发明中,引入基于专家反馈的模型微调(专家反馈微调),专家反馈中的专业知识信息质量普遍较高,差异性较小;专家的反馈参考价值极大,在微调时能够有效地提升专业知识的学习质量。
附图说明
图1是本发明的流程示意图;
图2是本发明中自监督学习的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
因此,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提供一种基于大模型的检验报告解读方法,其可以适用于健康体检的检测报告的解读,也可以适用于某个疾病诊疗过程中的检测报告的解读。如图1所示,其包括以下步骤:
步骤S1,构建专家知识库;
通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习。
报告解析大语言模型为现有的开源的大语言模型,此为现有技术。
在构建专家知识库之前,需要明确其构建的目标和范围,比如检验指标信息、指标含义和健康建议等信息。
资料收集是知识库建立的一个关键步骤。本实施例的检验报告解读方法,其适用于绝大多数的报告的解读,包括但不限于常规的健康体检的检验报告(比如血常规检验报告、尿常规检验报告、肝功能检验报告、心电图检验报告、心肌酶谱检验报告等)、(疑似)特定疾病的检验报告(比如与心脏病相关的心电图检验报告、心脏彩超检验报告、超声心动图检验报告、冠脉造影检验报告等,当然还可以是其他疾病的相关检验报告,此处就不一一例举)。主要健康体检、主要疾病的相关的医学知识可通过爬虫程序从网络上进行收集,将爬取的数据用于模型的学习,也可以直接将某本书籍、某篇文章给到模型进行学习。收集的信息包括中英文两种语言,以解决报告解析大语言模型通常存在的对中文解析能力较差的问题。爬虫程序将按照预先设置好的关键字去获取对应的文本,然后将找到的相关文本储存在数据库当中。
报告解析大语言模型进行自监督学习时,如图2所示,具体步骤为:
步骤S1-1,输出特征向量;
使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;
步骤S1-2,预测特征向量;
对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;
步骤S1-3,更新参数;
根据向量误差,更新大语言模型的参数;
步骤S1-4,重复至模型收敛;
重复步骤S1-2到步骤S1-3,直至报告解析大语言模型收敛。
步骤S2,使用前微调;
对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力。
进行使用前微调的目的是对于训练好的报告解析大语言模型进行优化,以使报告解析大语言模型能够输出更加具有可读性、并且能够回答患者输入的一些问题、根据报告解读结论提供健康建议。
在进行健康建议微调时,具体步骤为:
步骤S2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的(输入)和/或(输出),并将这些数据(指令,输入,输出)、(指令、输出)作为种子池;
步骤S2-1-2,从种子池中随机抽取8条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的(输入,输出);
其中,指令类型包括分类指令、非分类指令;
步骤S2-1-3,选择6条人工编写指令、2条模型生成指令(该模型生成指令来自于步骤S2-1-2中报告解析大语言模型输出的模型生成指令),并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的(输入,输出)。
在给定指令之后,生成对应的(输入,输出)时还有两种策略:一种是先生成输入,后生成输出,即输入优先策略;另一种是先生成输出,后生成输入,即输出优先策略。之所以会有输出优先的方式,是因为输入优先的方式在生成输入时,偏向于只生成一个标签,尤其是指令对应着分类任务时,其输入里面偏向于只生成一个类别。输出优先就是为了一定程度上缓解该问题。
(1)输入优先
在种子池中随机抽取 k 条数据,输入给报告解析大语言模型,让报告解析大语言模型为最后的指令生成相应的实例,即(输入,输出)。
(2)输出优先
对于分类任务,如果先生成文本,后生成标签,报告解析大语言模型会偏向于生成比较单一的结果。所以对于分类任务,是先生成随机的标签,然后再生成该标签对应的文本。具体操作是在种子池中随机抽取k条在之前的步骤中已经标记为分类的数据输入给报告解析大语言模型,让报告解析大语言模型为最后的指令生成相应的实例,即(输入,输出)。
步骤S2-1-4,判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标;若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍,则将该指令对应的数据(指令,输入,输出)、(指令、输出)添加进种子池,并更新种子池。
该步骤可排除一些无法被语言模型处理的指令,比如涉及图像、图片、图形的指令;在给指令生成实例时,会过滤掉输入相同但是输出不同的实例。
步骤S2-1-5,重复步骤S2-1-3、步骤S2-1-4,直至种子池中所有指令数量达到10000条;
步骤S2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据(指令,输入,输出)中的(输入),并输出与该(输入)对应的(输出),该(输出)即为健康建议。
因为报告解读系统专业知识要求较高,现有的报告解读系统存在两个问题:一、大数据方法收集到的数据质量差异性较大,对应模型微调可能产生负面的影响,不利于专业知识的定向学习。二、在后续基于人类反馈微调的过程中,普通用户(比如说患者)产生的反馈缺乏专业知识上的参考价值,无法通过反馈学习提升模型学习到的专业知识的质量。基于这两个原因,在本实施例的报告解读方法中,引入基于专家反馈的模型微调是非常有利于解决上述两个问题的。对于问题一,专家反馈中的专业知识信息质量普遍较高,差异性较小。对于问题二,专家的反馈参考价值极大,在微调时能够有效地提升专业知识的学习质量。
因此,本实施例在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调。在进行专家反馈微调时,具体步骤为:
步骤S2-2-1,获取样本数据;
获取检验报告样本数据及报告解读结论。检验报告样本数据及报告解读结论可来自于各大医院。
针对给出的检验报告样本数据,通过当前模型生成或者从数据库中其它专家给出的专业化的解读中挑选4个结果,且保证其中至少有2个是模型生成的结果,然后由专家选择他认为其中较好的2个结果。由此获取的数据记为,其中x为输入的问题,为模型生成或者选出的回答,,其中是结果的文本,,结果为专家解读则值为a,为模型生成则值为1-a,a是一个超参数。b为专家选择的两个结果,。收集的数据集记为S。
步骤S2-2-2,构建奖励模型;
奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到。即,该奖励模型的结构就是在复制的报告解析大语言模型上额外增加一个输出层。
步骤S2-2-3,训练奖励模型;
采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练,得到成熟的奖励模型。
训练时,仅修改奖励模型的输出层的参数,奖励模型记为。奖励值的产生策略为:如果专家选择了模型生成的结果,则给予较高的奖励,反之则给予较低的奖励。通过这个策略来鼓励模型生成更加接近专家解读结果的输出。奖励模型使用的损失函数为:
,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型。
步骤S2-2-4,优化模型;
使用PPO算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数。
其中,该PPO算法为现有的算法,可参照“Proximal Policy Optimization(PPO,Schul-man et al. (2017) )”。
为了使此阶段产生的结果不偏离最初预训练好的模型太远,在优化模型时,使用KL散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示KL散度,表示奖励模型输出。
步骤S3,报告解析;
获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。
因为检验报告的类型有多种,比如数据库导入的数据和患者自己上传的照片等数据,所以有必要在使用LLM接口对报告进行解析之前预先对数据进行预处理,以达到更好的解析效果。
检验报告数据预处理方式:
1. 将报告数据按照文件名,内容进行分类。
2. 针对分类好的各类文件单独实现对应的LLM接口调研程序,以引导大模型能够更好地去处理该类别的数据。
另外,还根据对健康建议的满意度,对种子池里面的数据进行打分,并剔除掉得分低的数据,不断对报告解析大语言模型进行微调和改进,以提高报告解析大语言模型对报告的解读准确性、健康建议的合理性和准确性。
另外,在爬取医学知识数据时,可以对爬取的数据进行归类,归类时,可以按照疾病类型进行分类,也可以按照医学报告类型进行分类,这样无论是做常规的健康体检的检验报告,还是某个疑似疾病的检测,报告解析大语言模型都能够给出更为准确、专业的解读结论、以及健康建议。
实施例2
本实施例提供一种基于大模型的检验报告解读系统,其可以适用于健康体检的检测报告的解读,也可以适用于某个疾病诊疗过程中的检测报告的解读。如图1所示,其包括以下步骤:
专家知识库构建模块,用于通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习。
报告解析大语言模型为现有的开源的大语言模型,此为现有技术。
在构建专家知识库之前,需要明确其构建的目标和范围,比如检验指标信息、指标含义和健康建议等信息。
资料收集是知识库建立的一个关键步骤。本实施例的检验报告解读方法,其适用于绝大多数的报告的解读,包括但不限于常规的健康体检的检验报告(比如血常规检验报告、尿常规检验报告、肝功能检验报告、心电图检验报告、心肌酶谱检验报告等)、(疑似)特定疾病的检验报告(比如与心脏病相关的心电图检验报告、心脏彩超检验报告、超声心动图检验报告、冠脉造影检验报告等,当然还可以是其他疾病的相关检验报告,此处就不一一例举)。主要健康体检、主要疾病的相关的医学知识可通过爬虫程序从网络上进行收集,将爬取的数据用于模型的学习,也可以直接将某本书籍、某篇文章给到模型进行学习。收集的信息包括中英文两种语言,以解决报告解析大语言模型通常存在的对中文解析能力较差的问题。爬虫程序将按照预先设置好的关键字去获取对应的文本,然后将找到的相关文本储存在数据库当中。
报告解析大语言模型进行自监督学习时,如图2所示,具体步骤为:
步骤S1-1,输出特征向量;
使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;
步骤S1-2,预测特征向量;
对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;
步骤S1-3,更新参数;
根据向量误差,更新大语言模型的参数;
步骤S1-4,重复至模型收敛;
重复步骤S1-2到步骤S1-3,直至报告解析大语言模型收敛。
使用前微调模块,用于对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备根据报告解读结论输出健康建议的能力。
进行使用前微调的目的是对于训练好的报告解析大语言模型进行优化,以使报告解析大语言模型能够输出更加具有可读性、并且能够回答患者输入的一些问题、根据报告解读结论提供健康建议。
在进行健康建议微调时,具体步骤为:
步骤S2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的(输入)和/或(输出),并将这些数据(指令,输入,输出)、(指令、输出)作为种子池;
步骤S2-1-2,从种子池中随机抽取8条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的(输入,输出);
其中,指令类型包括分类指令、非分类指令;
步骤S2-1-3,选择6条人工编写指令、2条模型生成指令(该模型生成指令来自于步骤S2-1-2中报告解析大语言模型输出的模型生成指令),并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的(输入,输出)。
在给定指令之后,生成对应的(输入,输出)时还有两种策略:一种是先生成输入,后生成输出,即输入优先策略;另一种是先生成输出,后生成输入,即输出优先策略。之所以会有输出优先的方式,是因为输入优先的方式在生成输入时,偏向于只生成一个标签,尤其是指令对应着分类任务时,其输入里面偏向于只生成一个类别。输出优先就是为了一定程度上缓解该问题。
(1)输入优先
在种子池中随机抽取 k 条数据,输入给报告解析大语言模型,让报告解析大语言模型为最后的指令生成相应的实例,即(输入,输出)。
(2)输出优先
对于分类任务,如果先生成文本,后生成标签,报告解析大语言模型会偏向于生成比较单一的结果。所以对于分类任务,是先生成随机的标签,然后再生成该标签对应的文本。具体操作是在种子池中随机抽取k条在之前的步骤中已经标记为分类的数据输入给报告解析大语言模型,让报告解析大语言模型为最后的指令生成相应的实例,即(输入,输出)。
步骤S2-1-4,判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标;若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍,则将该指令对应的数据(指令,输入,输出)、(指令、输出)添加进种子池,并更新种子池。
该步骤可排除一些无法被语言模型处理的指令,比如涉及图像、图片、图形的指令;在给指令生成实例时,会过滤掉输入相同但是输出不同的实例。
步骤S2-1-5,重复步骤S2-1-3、步骤S2-1-4,直至种子池中所有指令数量达到10000条;
步骤S2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据(指令,输入,输出)中的(输入),并输出与该(输入)对应的(输出),该(输出)即为健康建议。
因为报告解读系统专业知识要求较高,现有的报告解读系统存在两个问题:一、大数据方法收集到的数据质量差异性较大,对应模型微调可能产生负面的影响,不利于专业知识的定向学习。二、在后续基于人类反馈微调的过程中,普通用户(比如说患者)产生的反馈缺乏专业知识上的参考价值,无法通过反馈学习提升模型学习到的专业知识的质量。基于这两个原因,在本实施例的报告解读方法中,引入基于专家反馈的模型微调是非常有利于解决上述两个问题的。对于问题一,专家反馈中的专业知识信息质量普遍较高,差异性较小。对于问题二,专家的反馈参考价值极大,在微调时能够有效地提升专业知识的学习质量。
因此,本实施例在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调。在进行专家反馈微调时,具体步骤为:
步骤S2-2-1,获取样本数据;
获取检验报告样本数据及报告解读结论。检验报告样本数据及报告解读结论可来自于各大医院。
针对给出的检验报告样本数据,通过当前模型生成或者从数据库中其它专家给出的专业化的解读中挑选4个结果,且保证其中至少有2个是模型生成的结果,然后由专家选择他认为其中较好的2个结果。由此获取的数据记为,其中x为输入的问题,为模型生成或者选出的回答,,其中是结果的文本,,结果为专家解读则值为a,为模型生成则值为1-a,a是一个超参数。b为专家选择的两个结果,。收集的数据集记为S。
步骤S2-2-2,构建奖励模型;
奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到。即,该奖励模型的结构就是在复制的报告解析大语言模型上额外增加一个输出层。
步骤S2-2-3,训练奖励模型;
采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练,得到成熟的奖励模型。
训练时,仅修改奖励模型的输出层的参数,奖励模型记为。奖励值的产生策略为:如果专家选择了模型生成的结果,则给与较高的奖励,反之则给予较低的奖励。通过这个策略来鼓励模型生成更加接近专家解读结果的输出。奖励模型使用的损失函数为:
,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型。
步骤S2-2-4,优化模型;
使用PPO算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数。
其中,该PPO算法为现有的算法,可参照“Proximal Policy Optimization(PPO,Schul-man et al. (2017) )”。
为了使此阶段产生的结果不偏离最初预训练好的模型太远,在优化模型时,使用KL散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示KL散度,表示奖励模型输出。
报告解析模块,用于获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。
因为检验报告的类型有多种,比如数据库导入的数据和患者自己上传的照片等数据,所以有必要在使用LLM接口对报告进行解析之前预先对数据进行预处理,以达到更好的解析效果。
检验报告数据预处理方式:
1. 将报告数据按照文件名,内容进行分类。
2. 针对分类好的各类文件单独实现对应的LLM接口调研程序,以引导大模型能够更好地去处理该类别的数据。
另外,还根据对健康建议的满意度,对种子池里面的数据进行打分,并剔除掉得分低的数据,不断对报告解析大语言模型进行微调和改进,以提高报告解析大语言模型对报告的解读准确性、健康建议的合理性和准确性。
另外,在爬取医学知识数据时,可以对爬取的数据进行归类,归类时,可以按照疾病类型进行分类,也可以按照医学报告类型进行分类,这样无论是做常规的健康体检的检验报告,还是某个疑似疾病的检测,报告解析大语言模型都能够给出更为准确、专业的解读结论、以及健康建议。
实施例3
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行基于大模型的检验报告解读方法的步骤。
其中,所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器可以是所述计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,所述存储器也可以是所述计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中,所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件,例如所述基于大模型的检验报告解读方法的程序代码等。此外,所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器在一些实施例中可以是中央处理器(CentralProcessingUnit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者处理数据,例如运行所述基于大模型的检验报告解读方法的程序代码。
实施例4
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行基于大模型的检验报告解读方法的步骤。
其中,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于大模型的检验报告解读方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器或者网络设备等)执行本申请实施例所述基于大模型的检验报告解读方法。
Claims (4)
1.一种基于大模型的检验报告解读方法,其特征在于,包括以下步骤:
步骤S1,构建专家知识库;
通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;
步骤S2,使用前微调;
对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力;
步骤S3,报告解析;
获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议;
步骤S1中,报告解析大语言模型进行自监督学习时,具体步骤为:
步骤S1-1,输出特征向量;
使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;
步骤S1-2,预测特征向量;
对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;
步骤S1-3,更新参数;
根据向量误差,更新大语言模型的参数;
步骤S1-4,重复至模型收敛;
重复步骤S1-2到步骤S1-3,直至报告解析大语言模型收敛;
步骤S2中,在进行健康建议微调时,具体步骤为:
步骤S2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的“输入”和/或“输出”,并将这些数据“指令,输入,输出”、“指令、输出”作为种子池;
步骤S2-1-2,从种子池中随机抽取n条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的“输入,输出”;
其中,指令类型包括分类指令、非分类指令;
步骤S2-1-3,选择m条人工编写指令、p条模型生成指令,并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的“输入,输出”;
步骤S2-1-4,判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标;若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍,则将该指令对应的数据“指令,输入,输出”、“指令、输出”添加进种子池,并更新种子池;
步骤S2-1-5,重复步骤S2-1-3、步骤S2-1-4,直至种子池中所有指令数量达到10000条;
步骤S2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据“指令,输入,输出”中的“输入”,并输出与该“输入”对应的“输出”,该“输出”即为健康建议;
步骤S2,在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调;
在进行专家反馈微调时,具体步骤为:
步骤S2-2-1,获取样本数据;
获取检验报告样本数据及报告解读结论;
步骤S2-2-2,构建奖励模型;
奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到;
步骤S2-2-3,训练奖励模型;
采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练,得到成熟的奖励模型;
步骤S2-2-4,优化模型;
使用PPO算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数;
步骤S2-2-3中,在训练奖励模型时,损失函数为:,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型;
步骤S2-2-4中,在优化模型时,使用KL散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示KL散度,表示奖励模型输出。
2.一种基于大模型的检验报告解读系统,其特征在于,包括以下步骤:
专家知识库构建模块,用于通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;
使用前微调模块,用于对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力;
报告解析模块,用于获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议;
专家知识库构建模块中,报告解析大语言模型进行自监督学习时,具体步骤为:
步骤S1-1,输出特征向量;
使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;
步骤S1-2,预测特征向量;
对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;
步骤S1-3,更新参数;
根据向量误差,更新大语言模型的参数;
步骤S1-4,重复至模型收敛;
重复步骤S1-2到步骤S1-3,直至报告解析大语言模型收敛;
使用前微调模块中,在进行健康建议微调时,具体步骤为:
步骤S2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的“输入”和/或“输出”,并将这些数据“指令,输入,输出”、“指令、输出”作为种子池;
步骤S2-1-2,从种子池中随机抽取n条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的“输入,输出”;
其中,指令类型包括分类指令、非分类指令;
步骤S2-1-3,选择m条人工编写指令、p条模型生成指令,并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的“输入,输出”;
步骤S2-1-4,判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标;若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍,则将该指令对应的数据“指令,输入,输出”、“指令、输出”添加进种子池,并更新种子池;
步骤S2-1-5,重复步骤S2-1-3、步骤S2-1-4,直至种子池中所有指令数量达到10000条;
步骤S2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据“指令,输入,输出”中的“输入”,并输出与该“输入”对应的“输出”,该“输出”即为健康建议;
使用前微调模块中,在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调;
在进行专家反馈微调时,具体步骤为:
步骤S2-2-1,获取样本数据;
获取检验报告样本数据及报告解读结论;
步骤S2-2-2,构建奖励模型;
奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到;
步骤S2-2-3,训练奖励模型;
采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练,得到成熟的奖励模型;
步骤S2-2-4,优化模型;
使用PPO算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数;
步骤S2-2-3中,在训练奖励模型时,损失函数为:,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型;
步骤S2-2-4中,在优化模型时,使用KL散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示KL散度,表示奖励模型输出。
3.一种计算机设备,其特征在于:包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1所述方法的步骤。
4.一种计算机可读存储介质,其特征在于:存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410233518.3A CN117809798B (zh) | 2024-03-01 | 2024-03-01 | 基于大模型的检验报告解读方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410233518.3A CN117809798B (zh) | 2024-03-01 | 2024-03-01 | 基于大模型的检验报告解读方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117809798A CN117809798A (zh) | 2024-04-02 |
CN117809798B true CN117809798B (zh) | 2024-04-26 |
Family
ID=90433835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410233518.3A Active CN117809798B (zh) | 2024-03-01 | 2024-03-01 | 基于大模型的检验报告解读方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117809798B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117995334B (zh) * | 2024-04-07 | 2024-06-21 | 北京惠每云科技有限公司 | 基于检验报告的智能化解读与治疗建议方法及装置 |
CN118170892B (zh) * | 2024-05-13 | 2024-08-09 | 山东第一医科大学附属省立医院(山东省立医院) | 体检报告影像学检查辅助解读方法及装置 |
CN118841155B (zh) * | 2024-06-20 | 2025-01-24 | 山东第一医科大学附属省立医院(山东省立医院) | 一种基于混合专家模型对体检报告实验室检查解读的方法 |
CN118553437B (zh) * | 2024-07-29 | 2024-09-20 | 四川大学华西医院 | 基于有监督微调的体检报告解读方法、系统、设备及介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014131166A1 (zh) * | 2013-02-27 | 2014-09-04 | Zhu Wei | 一种医疗信息解析咨询系统 |
CN109284396A (zh) * | 2018-09-27 | 2019-01-29 | 北京大学深圳研究生院 | 医学知识图谱构建方法、装置、服务器及存储介质 |
CN112927776A (zh) * | 2021-02-03 | 2021-06-08 | 昆山慧医优策医疗科技有限公司 | 一种面向医学检验报告的人工智能自动解读系统 |
CN113628744A (zh) * | 2021-07-08 | 2021-11-09 | 江苏嘉纳宝医疗科技有限公司 | 躯体健康量化评估系统及方法 |
CN114220542A (zh) * | 2021-12-15 | 2022-03-22 | 平安科技(深圳)有限公司 | 一种体检信息管理方法、装置、存储介质及计算设备 |
CN114242194A (zh) * | 2021-12-07 | 2022-03-25 | 深圳市云影医疗科技有限公司 | 一种基于人工智能的医学影像诊断报告自然语言处理装置及方法 |
CN116631562A (zh) * | 2023-07-24 | 2023-08-22 | 北京惠每云科技有限公司 | 一种生成电子病历出院记录的方法、装置及电子设备 |
CN116759074A (zh) * | 2023-07-03 | 2023-09-15 | 浙江一山智慧医疗研究有限公司 | 多轮会话式医学影像分析模型的训练方法及应用 |
CN116884559A (zh) * | 2023-07-20 | 2023-10-13 | 联影智能医疗科技(北京)有限公司 | 一种基于语言模型的影像报告生成方法和系统 |
CN116955597A (zh) * | 2023-08-01 | 2023-10-27 | 北京璇星科技有限公司 | 一种基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统 |
CN116975241A (zh) * | 2023-09-20 | 2023-10-31 | 广东技术师范大学 | 基于大语言模型的肝癌辅助诊断与问答方法、系统及介质 |
CN116977661A (zh) * | 2023-06-28 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备、存储介质及程序产品 |
CN117057855A (zh) * | 2023-07-20 | 2023-11-14 | 华为技术有限公司 | 一种数据处理方法及相关装置 |
CN117216209A (zh) * | 2023-09-04 | 2023-12-12 | 上海深至信息科技有限公司 | 一种基于大型语言模型的超声检查报告解读系统 |
CN117409919A (zh) * | 2023-10-23 | 2024-01-16 | 科大讯飞股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN117539977A (zh) * | 2023-10-27 | 2024-02-09 | 深圳须弥云图空间科技有限公司 | 一种语言模型的训练方法及装置 |
CN117558439A (zh) * | 2023-10-23 | 2024-02-13 | 讯飞医疗科技股份有限公司 | 基于大语言模型的问诊交互方法、装置及相关设备 |
CN117709441A (zh) * | 2024-02-06 | 2024-03-15 | 云南联合视觉科技有限公司 | 通过逐步迁移领域训练专业医疗大模型的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100049543A1 (en) * | 2008-08-22 | 2010-02-25 | Inventec Corporation | Health data integration system and the method thereof |
US8935155B2 (en) * | 2012-09-14 | 2015-01-13 | Siemens Aktiengesellschaft | Method for processing medical reports |
US20240021013A1 (en) * | 2022-07-14 | 2024-01-18 | Bacpoint, Inc. | Automated estimation of blood alcohol concentration |
-
2024
- 2024-03-01 CN CN202410233518.3A patent/CN117809798B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014131166A1 (zh) * | 2013-02-27 | 2014-09-04 | Zhu Wei | 一种医疗信息解析咨询系统 |
CN109284396A (zh) * | 2018-09-27 | 2019-01-29 | 北京大学深圳研究生院 | 医学知识图谱构建方法、装置、服务器及存储介质 |
CN112927776A (zh) * | 2021-02-03 | 2021-06-08 | 昆山慧医优策医疗科技有限公司 | 一种面向医学检验报告的人工智能自动解读系统 |
CN113628744A (zh) * | 2021-07-08 | 2021-11-09 | 江苏嘉纳宝医疗科技有限公司 | 躯体健康量化评估系统及方法 |
CN114242194A (zh) * | 2021-12-07 | 2022-03-25 | 深圳市云影医疗科技有限公司 | 一种基于人工智能的医学影像诊断报告自然语言处理装置及方法 |
CN114220542A (zh) * | 2021-12-15 | 2022-03-22 | 平安科技(深圳)有限公司 | 一种体检信息管理方法、装置、存储介质及计算设备 |
CN116977661A (zh) * | 2023-06-28 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备、存储介质及程序产品 |
CN116759074A (zh) * | 2023-07-03 | 2023-09-15 | 浙江一山智慧医疗研究有限公司 | 多轮会话式医学影像分析模型的训练方法及应用 |
CN116884559A (zh) * | 2023-07-20 | 2023-10-13 | 联影智能医疗科技(北京)有限公司 | 一种基于语言模型的影像报告生成方法和系统 |
CN117057855A (zh) * | 2023-07-20 | 2023-11-14 | 华为技术有限公司 | 一种数据处理方法及相关装置 |
CN116631562A (zh) * | 2023-07-24 | 2023-08-22 | 北京惠每云科技有限公司 | 一种生成电子病历出院记录的方法、装置及电子设备 |
CN116955597A (zh) * | 2023-08-01 | 2023-10-27 | 北京璇星科技有限公司 | 一种基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统 |
CN117216209A (zh) * | 2023-09-04 | 2023-12-12 | 上海深至信息科技有限公司 | 一种基于大型语言模型的超声检查报告解读系统 |
CN116975241A (zh) * | 2023-09-20 | 2023-10-31 | 广东技术师范大学 | 基于大语言模型的肝癌辅助诊断与问答方法、系统及介质 |
CN117409919A (zh) * | 2023-10-23 | 2024-01-16 | 科大讯飞股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN117558439A (zh) * | 2023-10-23 | 2024-02-13 | 讯飞医疗科技股份有限公司 | 基于大语言模型的问诊交互方法、装置及相关设备 |
CN117539977A (zh) * | 2023-10-27 | 2024-02-09 | 深圳须弥云图空间科技有限公司 | 一种语言模型的训练方法及装置 |
CN117709441A (zh) * | 2024-02-06 | 2024-03-15 | 云南联合视觉科技有限公司 | 通过逐步迁移领域训练专业医疗大模型的方法 |
Non-Patent Citations (4)
Title |
---|
大规模生成式语言模型在医疗领域的应用:机遇与挑战;肖仰华,等;医学信息学杂志;20231231;第44卷(第09期);1-11 * |
微信端智能解读检验报告单系统的构建及应用;柯娟玉,等;海南医学;20200425;第31卷(第08期);1029-1032 * |
检验报告单智能解读建立与临床应用;雷和月,等;中国数字医学;20180115;第13卷(第01期);103-105 * |
浅论医学专家系统的生成;薛蕾;天津中医药;19901231(第01期);35、47 * |
Also Published As
Publication number | Publication date |
---|---|
CN117809798A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117809798B (zh) | 基于大模型的检验报告解读方法、系统、设备及介质 | |
CN112149414B (zh) | 文本相似度确定方法、装置、设备及存储介质 | |
CN107292086A (zh) | 图像分析问答 | |
CN112069329B (zh) | 文本语料的处理方法、装置、设备及存储介质 | |
CN112541056B (zh) | 医学术语标准化方法、装置、电子设备及存储介质 | |
CN112307215A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
KR102332740B1 (ko) | 딥러닝을 이용하여 환자의 증상을 진단하는 방법, 장치 및 시스템 | |
Alday et al. | Towards a computational model of actor-based language comprehension | |
WO2021114635A1 (zh) | 患者分群模型构建方法、患者分群方法及相关设备 | |
CN117995373B (zh) | 医院查房记录生成方法、装置、电子设备及存储介质 | |
CN118296121A (zh) | 一种基于大语言模型的医学术语标准化辅助诊断方法 | |
Gillies et al. | Theme and topic: How qualitative research and topic modeling can be brought together | |
Gupta et al. | Fundamentals Of Chat GPT For Beginners Using AI | |
Hitzler et al. | Conceptual structures in practice | |
Panwar et al. | A review: Exploring the role of ChatGPT in the diagnosis and treatment of oral pathologies | |
CN111783473B (zh) | 医疗问答中最佳答案的识别方法、装置和计算机设备 | |
Heilmann | Profiling effects of syntactic complexity in translation: A multi-method approach | |
CN116913454A (zh) | 一种体检报告生成方法、系统、装置和介质 | |
CN116779092A (zh) | 一种医学报告生成方法与系统 | |
Nayak et al. | Cognitive computing in software evaluation | |
CN117038109A (zh) | 一种预检报告收集方法和系统 | |
CN116665837A (zh) | 一种体检报告解读方法、装置、存储介质以及电子设备 | |
CN112561714B (zh) | 基于nlp技术的核保风险预测方法、装置及相关设备 | |
CN112509688B (zh) | 压疮图片自动分析系统、方法、设备和介质 | |
CN114328864A (zh) | 基于人工智能和知识图谱的眼科问答系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |