CN116414990B - 一种车辆故障诊断与预防方法 - Google Patents
一种车辆故障诊断与预防方法 Download PDFInfo
- Publication number
- CN116414990B CN116414990B CN202310657034.7A CN202310657034A CN116414990B CN 116414990 B CN116414990 B CN 116414990B CN 202310657034 A CN202310657034 A CN 202310657034A CN 116414990 B CN116414990 B CN 116414990B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- model
- relation
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000002265 prevention Effects 0.000 title claims abstract description 24
- 230000004888 barrier function Effects 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 38
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 2
- 238000012805 post-processing Methods 0.000 abstract description 5
- 238000012423 maintenance Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 239000000446 fuel Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C5/00—Registering or indicating the working of vehicles
- G07C5/08—Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
- G07C5/0808—Diagnosing performance data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种车辆故障诊断与预防方法,包括以下步骤:S1,根据用户信息查询数据库获取与当前用户问题相关的历史报障信息,并衡量历史报障信息与该用户问题的相似度,再通过相似度筛选出相似问题;S2,根据关系抽取模型CasRel对用户提供的问题进行关键实体信息和现象关系抽取;S3,采用GNN模型对所有相关的历史报障信息与抽取的关键实体息和现象关系生成专业性的提示集合;利用知识图谱系统生成专业性的提示;通过结合知识图谱系统和经过汽车专业数据微调的大型语言模型,实现更准确、高效和自适应的车辆故障诊断。同时可根据实际业务需求对生成的诊断结果进行多样化的后处理,使其更适合各种使用场景。
Description
技术领域
本发明涉及车辆故障诊断技术领域,更具体地说,涉及一种车辆故障诊断与预防方法。
背景技术
随着汽车行业的快速发展,汽车故障诊断与维修技术逐渐成为关键环节。传统的汽车维修过程中,车主需要携带故障车辆前往维修站点,维修技师根据车辆状况进行现场诊断。然而,这种方式存在着时间成本高、效率低、准确性受限等问题。因此,开发一种智能车辆问诊系统以辅助车主自主进行初步故障诊断成为了迫切需求。近年来,人工智能领域的发展为实现智能车辆问诊系统提供了可能性。特别是大型语言模型(如GPT系列模型)的出现,使得自然语言处理技术取得了重大突破。基于这些技术,可以开发出智能车辆问诊系统,通过模拟维修技师的诊断过程,帮助车主解决车辆故障问题。
现有的技术方案主要包括两类:基于专家系统的车辆故障诊断技术和基于规则引擎的问答系统。这些技术在车辆维修领域具有一定的应用价值,但也存在一定的局限性。(1)基于专家系统的车辆故障诊断技术,具体的专家系统是一种模拟人类专家解决问题的计算机程序,通过将专家知识表示为一组规则,实现对特定领域问题的解决。这种技术在车辆维修领域应用较为广泛,例如专利号为CN113390650A的基于专家系统的车辆诊断方法、电子设备及车辆,该专家系统的主要局限性在于知识表示和推理能力受限,难以应对复杂多变的实际问题,且更新维护成本较高。(2)基于规则引擎的问答系统,其中规则引擎是一种根据预定义规则进行推理的软件系统,可以用于实现自动问答。在车辆维修领域,一些车辆故障诊断问答系统采用了基于规则引擎的方法,如专利号为CN114859871A的可配置并修改故障判断规则的车辆故障诊断系统及方法中描述的一种基于规则引擎的车辆故障诊断问答系统。这种系统可以根据车主提供的问题,通过匹配预定义的规则来生成相应的答案。然而,基于规则引擎的问答系统存在一定的局限性,例如知识库更新维护成本高、应对多样化问题的能力有限等。
现有的基于专家系统和规则引擎的车辆故障诊断技术在某些场景下具有一定的应用价值,但由于其知识表示、推理能力以及适应性方面的局限性,难以满足复杂多变的车辆故障诊断需求。且其知识库更新维护成本高,现有技术需要手动更新和维护知识库,这一过程不仅耗时,还需要专业知识,导致维护成本较高。
发明内容
本发明要解决的技术问题在于,针对上述技术方案存在的不足,提供一种能更准确、高效和自适应的进行车辆故障诊断的车辆故障诊断与预防方法。
本发明提供一种车辆故障诊断与预防方法,所述方法包括以下步骤:
S1,根据用户信息查询数据库获取与当前用户问题相关的历史报障信息,并衡量历史报障信息与该用户问题的相似度,再通过相似度筛选出相似问题;
S2,根据关系抽取模型CasRel对用户提供的问题进行关键实体信息和现象关系抽取;
S3,采用GNN 模型对所有相关的历史报障信息与抽取的关键实体息和现象关系生成专业性的提示集合;利用知识图谱系统生成专业性的提示;
S4,对汽车专业数据集与生成专业性的提示集合进行大型语言模型微调训练生成专业且流畅的回复;
S5,将用户信息查询与生成的专业性提示进行拼接得到输入列,并将输入列送入大型语言模型生成最终的诊断结果;
S6,将生成的诊断结果转换成具体业务场景需要的语言表述。
本发明所述的车辆故障诊断与预防方法中;所述步骤S1包括以下步骤:
S11,通过GPT模型将问题表示为特征向量,即:
;其中,A表示用户问题的特征向量,B表示历史报障信息的特征向量,/>表示大型语言模型的编码层,通过编码层输出句子的特征向量,/>表示用户问题,H表示用户历史报障信息。
本发明所述的车辆故障诊断与预防方法中;所述步骤S1还包括以下步骤:
S12,通过余弦相似度算法计算问题向量之间的相似度,得到所述问题向量之间的相似度,所述余弦相似度的计算公式如下:
其中,和/>分别表示两个问题的特征向量,/>表示向量点积,/>和/>分别表示向量的模长。
本发明所述的车辆故障诊断与预防方法中;所述步骤S1还包括以下步骤:
S13,将当前问题的相似度阈值设置为,并将当前问题的余弦相似度阈值大于/>的关联历史报障信息筛选出来,获取与当前问题相关的历史报障信息。
本发明所述的车辆故障诊断与预防方法中;所述步骤S2包括以下步骤:
S21,将需要处理的用户问题设为,待抽取的关键节点为/>,现象关系为/>,通过BERT对问题进行编码得到/>,其中/>;
S22,通过关系抽取模型CasRel对进行预测,获得关键节点和关系标签,其中,所述关系抽取模型CasRel包含负责预测节点的模型(/>)与负责预测关系的模型(/>),通过负责预测节点的模型(/>)与负责预测关系的模型(/>)分别对/>进行预测得到/>与/>,其中,/>为预测得到的关键节点标签,/>为预测得到的关系标签,并根据预测得到的关键节点标签/>和关系标签/>确定关键节点和关系,并将关键节点标签/>和关系标签/>组织为三元组的形式。
本发明所述的车辆故障诊断与预防方法中;所述步骤S3包括以下步骤:
S31,所述知识图谱为,其中/>为关键实体集合,/>为现象关系边集合,所述关键实体集合/>包括关键节点信息、用户关联信息和相关历史报障信息,先将节点信息、用户关联信息和相关历史报障信息的编码映射到一个共享的向量空间;通过将每个节点、关联信息和报障信息转换为一个固定长度的向量表示,然后,将映射后的关键节点信息、用户关联信息/>和相关历史报障信息/>编码为向量表示得到初始节点表示/>:
;
S32,采用 GNN 模型对初始节点表示进行信息传播和更新,再通过邻接矩阵A 描述每个节点之间的连接关系,在每个迭代步骤 t 中,根据当前节点表示和邻接矩阵,通过 GNN 层的传播规则进行信息更新:/>;
其中,为在第 t 步迭代后的节点表示矩阵,/>为上一步迭代后的节点表示矩阵,通过若干次迭代,GNN 模型捕捉到每个节点间的复杂关系,进而得到更新后的节点表示;
最后,根据更新后的节点表示,生成与问题相关的专业性/> ,其中,/>;
其中,为一个用于生成 prompt 的函数。
本发明所述的车辆故障诊断与预防方法中;在所述步骤S4中所述微调为通过优化损失函数以减小大型语言模型预测与实际标签之间的差异,所述损失函数/>表示为:
其中,是数据集中样本的数量,/>是第/>个样本的实际标签,/>是第/>个样本的预测标签生成专业且流畅的回复/>,其中,/>
本发明所述的车辆故障诊断与预防方法中;所述步骤S5具体包括将用户信息查询设为,生成的专业性提示设为/>,将提示/>和用户信息查询/>进行拼接,得到输入序列/>:
再将输入序列送入大型语言模型经过自注意力机制Self-Attention和多层Transformer 进行编码得到输出序列/>:
最后,对输出序列进行解码,生成最终的诊断结果/>,其中/>。
本发明所述的车辆故障诊断与预防方法中;所述步骤S6具体包括通过定义一个转换函数将原始诊断结果/>转换为具体业务场景需要语言的表述/>,其中。
本发明所述的车辆故障诊断与预防方法中;在所述步骤S6中当具体业务场景需要语言为执行指令而非接收文字信息时需要将诊断结果转换成相应的指令,当具体业务场景需要语言为语音信息时需要将诊断结果转换为音频。
本发明的车辆故障诊断与预防方法通过结合知识图谱系统和经过汽车专业数据微调的大型语言模型,实现更准确、高效和自适应的车辆故障诊断。同时可根据实际业务需求对生成的诊断结果进行多样化的后处理,使其更适合各种使用场景。
附图说明
图1是本发明车辆故障诊断与预防方法实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语 “第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或 设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,是本发明车辆故障诊断与预防方法实施例的流程示意图。提供一种车辆故障诊断与预防方法,包括以下步骤:
在S1步骤中,根据用户信息查询数据库获取与当前用户问题相关的历史报障信息,并衡量历史报障信息与该用户问题的相似度,再通过相似度筛选出相似问题;
在S2步骤中,根据关系抽取模型CasRel对用户提供的问题进行关键实体信息和现象关系抽取;
在S3步骤中,采用GNN 模型对所有相关的历史报障信息与抽取的关键实体息和现象关系生成专业性的提示集合;利用知识图谱系统生成专业性的提示;
在S4步骤中,对汽车专业数据集与生成专业性的提示集合进行大型语言模型微调训练生成专业且流畅的回复;
在S5步骤中,将用户信息查询与生成的专业性提示进行拼接得到输入列,并将输入列送入大型语言模型生成最终的诊断结果;
在S6步骤中,将生成的诊断结果转换成具体业务场景需要的语言表述。
在一实施例中,步骤S1包括以下步骤:
在S11步骤中,通过 GPT 模型将问题表示为特征向量,即:;其中,A表示用户问题的特征向量,B表示历史报障信息的特征向量,/>表示大型语言模型的编码层,通过编码层输出句子的特征向量,/>表示用户问题,H表示用户历史报障信息。
在一实施例中,步骤S1还包括以下步骤:
在S12步骤中,通过余弦相似度算法计算问题向量之间的相似度,得到问题向量之间的相似度,余弦相似度的计算公式如下:
其中,和/>分别表示两个问题的特征向量,/>表示向量点积,/>和/>分别表示向量的模长。
在一实施例中,步骤S1还包括以下步骤:
在S13步骤中,将当前问题的相似度阈值设置为,并将当前问题的余弦相似度阈值大于/>的关联历史报障信息筛选出来,获取与当前问题相关的历史报障信息。
在一实施例中,步骤S2包括以下步骤:
在S21步骤中,将需要处理的用户问题设为,待抽取的关键节点为/>,现象关系为,通过BERT对问题进行编码得到/>,其中/>;
在S22步骤中,通过关系抽取模型CasRel对进行预测,获得关键节点和关系标签,其中,关系抽取模型CasRel包含负责预测节点的模型(/>)与负责预测关系的模型(/>),通过负责预测节点的模型(/>)与负责预测关系的模型(/>)分别对/>进行预测得到/>与/>,其中,/>为预测得到的关键节点标签,/>为预测得到的关系标签,并根据预测得到的关键节点标签/>和关系标签/>确定关键节点和关系并将关键节点标签/>和关系标签/>组织为三元组的形式。
在一实施例中,步骤S3包括以下步骤:
在S31步骤中,知识图谱为,其中/>为关键实体集合,/>为现象关系边集合,关键实体集合/>包括关键节点信息、用户关联信息和相关历史报障信息,先将节点信息、用户关联信息和相关历史报障信息的编码映射到一个共享的向量空间;通过将每个节点、关联信息和报障信息转换为一个固定长度的向量表示,然后,将映射后的关键节点信息、用户关联信息/>和相关历史报障信息/>编码为向量表示得到初始节点表示/>:
;
在S32步骤中,采用 GNN 模型对初始节点表示进行信息传播和更新,再通过邻接矩阵 A 描述每个节点之间的连接关系,在每个迭代步骤 t 中,根据当前节点表示和邻接矩阵,通过 GNN 层的传播规则进行信息更新:/>;
其中,为在第 t 步迭代后的节点表示矩阵,/>为上一步迭代后的节点表示矩阵,通过若干次迭代,GNN 模型捕捉到每个节点间的复杂关系,进而得到更新后的节点表示;
最后,根据更新后的节点表示,生成与问题相关的专业性/> ,其中,/>;
其中,为一个用于生成 prompt 的函数。
在一实施例中,在步骤S4中微调为通过优化损失函数以减小大型语言模型预测与实际标签之间的差异,损失函数/>表示为:
其中,是数据集中样本的数量,/>是第/>个样本的实际标签,/>是第/>个样本的预测标签生成专业且流畅的回复/>,其中,/>
在一实施例中,步骤S5具体包括将用户信息查询设为,生成的专业性提示设为/>,将提示/>和用户信息查询/>进行拼接,得到输入序列/>:
再将输入序列送入大型语言模型经过自注意力机制Self-Attention和多层Transformer 进行编码得到输出序列/>:
最后,对输出序列进行解码,生成最终的诊断结果/>,其中/>。
在一实施例中,步骤S6具体包括通过定义一个转换函数将原始诊断结果/>转换为具体业务场景需要语言的表述/>,其中/>。
在一实施例中,在步骤S6中当具体业务场景需要语言为执行指令而非接收文字信息时需要将诊断结果转换成相应的指令,当具体业务场景需要语言为语音信息时需要将诊断结果转换为音频。
具体的,本申请中大型语言模型(Large Language Models)是一种基于深度学习的自然语言处理模型,如 GPT 系列(如ChatGPT、GPT-3、GPT-4等)。这些模型通过学习大量文本数据具备强大的自然语言理解和生成能力。与传统的基于规则和专家系统的方法相比,大型语言模型能够更好地处理复杂多变的问题。
Prompt为提示语,可以理解为在我们向大型语言模型进行提问时,在问题前后补充一些例子或者背景知识,让大型语言模型更容易理解我们提出的问题。
知识图谱是一种结构化的知识表示方法,通过实体及其之间的关系组成。知识图谱可以高效地组织和检索领域内的专业知识,为智能车辆问诊系统提供更专业、准确的故障诊断信息。
在本申请中,步骤S2负责对用户提出的问题进行处理,如分析问题的主要信息、提取关键词等。起到生成更精确、专业的 prompt,提高故障诊断的准确性。
在本申请中,步骤S1收集用户的历史报障信息、车辆类型、车辆使用情况等信息。这些信息有助于系统更好地理解用户问题背后的具体场景,为用户提供更个性化、精确的故障诊断服务。
在本申请中,步骤S6负责对大型语言模型生成的诊断结果进行多样化的后处理。根据实际业务需求,结果后处理模块可以将诊断结果转换为执行指令、音频等,使其更适合各种使用场景。
需要说明的是,步骤S1中首先根据用户ID、汽车故障码、汽车车型车系等信息,查询数据库获取与当前用户相关的历史报障信息,然后衡量历史报障信息与该问题的相似度,然后再通过相似度筛选出相似问题进行用户后续的相关处理。可以使用余弦相似度来衡量用户历史报障信息与当前问题的相似度。例如,在数据库中找所有关联问题,然后通过余弦相似度计算出类似问题,如:“油路堵塞、点火线圈损坏”等,用于后续处理。
在步骤S2中为了抽取问题中的关键节点和关系,本申请可以采用 CasRel(ACascade Binary Tagging and Relational Triple Extraction Model)算法。CasRel 是一种基于BERT的级联标注和关系三元组抽取模型,能够有效地抽取实体关系三元组。需要注意的是,CasRel仅为一种可能的实现方式,实际应用中本申请可以根据具体需求选用其他适用的算法。使用关系三元组抽取模型从用户问题中抽取关键备件实体和现象关系。例如,备件包括“发动机”,现象包括“启动困难”、“怠速不稳”和“加速无力”,从知识图谱中查询到相关的原因可能是:燃油系统故障-发生概率高、点火系统故障-发生概率高、发动机机械故障-发生概率较低、电子控制系统故障-发生概率很低。
在步骤S3中为了根据问题预处理模块抽取的关键节点信息、用户关联信息以及第一步得出的相关历史报障信息生成专业性的 prompt,本发明可以采用图神经网络(GraphNeural Network,简称 GNN)算法。GNN 是一种能够在图结构数据上进行深度学习的方法,它可以有效地学习节点之间的关系。需要注意的是,GNN 仅为一种可能的实现方式,实际应用中可以根据具体需求选择其他适用的算法。根据抽取的关键实体和关系以及用户关联信息,知识图谱系统生成专业性的提示(prompt)。例如,根据上面知识图谱抽取的信息生成提示:“可能的故障原因包括燃油系统故障-发生概率高、点火系统故障-发生概率高、发动机机械故障-发生概率较低和电子控制系统故障-发生概率很低等”同时,根据用户关联历史保障信息生成提示:“用户曾报告过类似问题,如油路堵塞和点火线圈损坏。”
在步骤S4,当本申请中大型语言模型为 GPT 系列模型时,GPT 系列模型全称为Generative Pre-trained Transformer,生成式预训练 Transformer)被用于自然语言理解和生成,以提供更准确的诊断结果。为了实现针对汽车专业领域的微调,将利用汽车专业数据集进行模型的微调。经过汽车专业数据集微调的GPT 系列模型被用于理解和生成问题的专业性回复。
在步骤S5中将知识图谱系统生成的专业性提示(prompt)与用户查询(query)整合,送入GPT系列模型中生成最终的诊断结果。例如,生成回复:“尊敬的用户,根据您的问题描述和历史保障信息,我们推测您的车辆可能存在燃油系统故障、点火系统故障和发动机机械故障等问题。建议您进行以下排查:检查油路是否存在堵塞、查看点火线圈是否损坏、检测发动机缸压和压缩比是否正常。另外,我们了解到您曾报告过类似的问题,例如油路堵塞和点火线圈损坏,这些问题也需要引起您的关注。如果问题依然存在,请及时联系专业的汽车维修人员进行进一步的检测和维修。感谢您对我们的咨询服务的信任,祝您的车辆早日恢复正常运行。”
在步骤S6中,根据实际业务需求对生成的诊断结果进行后处理。例如:
当具体业务场景需要语言为需要执行指令而非接收文字信息,可以将诊断结果转换成相应的指令。例如,如:指令1:检查油路是否存在堵塞,清洗或更换油路堵塞部件;指令2:查看点火线圈是否损坏,更换损坏的点火线圈;指令3:检测发动机缸压和压缩比是否正常,进行必要的维修和调整。
当具体业务场景需要语言为需要语音信息时可以将诊断结果转换为音频。例如,利用文本到语音(TTS)技术将诊断结果:“关于您反馈的发动机启动不顺畅、怠速不稳定以及加速力度不足的问题,我们建议您重点检查以下部分:火花塞、点火线圈、燃油泵、喷油器和空气流量计。这些建议基于您的历史报障信息和我们对汽车故障的专业知识。”转换为对应的语音信息,以方便用户在无法阅读文本的情况下获取诊断信息。这样,根据实际应用场景和需求能够对生成的诊断结果进行适当的处理,使其更适合各种使用场景。
本申请通过采用大型语言模型(如GPT-4)可以更有效地学习和理解人类语言,从而提高智能车辆问诊系统在自然语言处理方面的能力。结合知识库系统和大型语言模型,既利用知识库系统提供的专业知识,又充分发挥大型语言模型在自然语言处理方面的优势,提高诊断结果的准确性和可靠性。还通过使用知识库数据生成专业性的prompt,引导大型语言模型生成更专业且流畅的回复。使得大型语言模型可以自动从大量文本数据中学习知识,从而有效降低知识库更新维护成本。通过结合知识库系统和大型语言模型,提高了智能车辆问诊系统的准确性、效率和自适应性,使其能够应对车主提出的多样化问题。
本发明提供的车辆故障诊断与预防方法至少具有以下优点:
1、更强的适应性和理解能力,本申请采用大型语言模型,如 GPT 系列模型,这些模型具有强大的自然语言理解和生成能力。相较于专家系统和规则引擎,大型语言模型能够更好地理解用户提出的复杂多变的问题,并生成更准确的诊断结果。
2、本发明结合知识图谱系统,在整合关键节点信息、用户关联信息和相关历史报障信息的基础上生成专业性的 prompt,进一步提高了故障诊断的准确性和专业性。
3、与基于专家系统和规则引擎的方法相比,本申请利用大型语言模型在不断学习新知识的过程中自动更新和扩展,降低了知识库维护成本,提高了系统的长期稳定性和可靠性。
4、本申请通过获取用户的历史报障信息,结合采用先进的算法(例如 CasRel)对用户提供的问题进行关键节点和关系抽取,和知识图谱系统,为用户提供更个性化、精确的故障诊断服务。
5、本申请可根据实际业务需求对生成的诊断结果进行多样化的后处理,如将结果转换为执行指令、音频等,使其更适合各种使用场景。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软 件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
因此,以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内,本发明的保护范围应该以权利要求的保护范围为准。
Claims (6)
1.一种车辆故障诊断与预防方法,其特征在于,所述方法包括以下步骤:
S1,根据用户信息查询数据库获取与当前用户问题相关的历史报障信息,并衡量历史报障信息与该用户问题的相似度,再通过相似度筛选出相似问题;
S2,根据关系抽取模型CasRel对用户提供的问题进行关键实体信息和现象关系抽取;
S3,采用GNN 模型对所有相关的历史报障信息与抽取的关键实体息和现象关系生成专业性的提示集合;利用知识图谱系统生成专业性的提示;
S4,对汽车专业数据集与生成专业性的提示集合进行大型语言模型微调训练生成专业且流畅的回复;
S5,将用户信息查询与生成的专业性提示进行拼接得到输入列,并将输入列送入大型语言模型生成最终的诊断结果;
S6,将生成的诊断结果转换成具体业务场景需要的语言表述;
所述步骤S3包括以下步骤:
S31,所述知识图谱为,其中 />为关键实体集合,/>为现象关系边集合,所述关键实体集合/>包括关键节点信息/>、用户关联信息/>和相关历史报障信息/>,先将关键节点信息/>、用户关联信息/>和相关历史报障信息/>的编码映射到一个共享的向量空间;通过将每个关键节点信息/>、用户关联信息/>和相关历史报障信息/>转换为一个固定长度的向量表示,然后,将映射后的关键节点信息/>、用户关联信息/>和相关历史报障信息/>编码为向量表示得到初始节点表示/>:
;
S32,采用 GNN 模型对初始节点表示进行信息传播和更新,再通过邻接矩阵/>描述每个节点之间的连接关系,在每个迭代步骤t 中,根据当前节点表示和邻接矩阵,通过 GNN层的传播规则进行信息更新:/>;
其中,为在第t步迭代后的节点表示矩阵,/> 为上一步迭代后的节点表示矩阵,通过若干次迭代,GNN 模型捕捉到每个节点间的复杂关系,进而得到更新后的节点表示;
最后,根据更新后的节点表示 ,生成与问题相关的专业性/>,其中,;
其中,为一个用于生成/>的函数;
在所述步骤S4中所述微调为通过优化损失函数以减小大型语言模型预测与实际标签之间的差异,所述损失函数 />表示为:
其中,是数据集中样本的数量,/>是第/>个样本的实际标签,/>是第i个样本的预测标签生成专业且流畅的回复/>,其中,/>;
所述步骤S5具体包括将用户信息查询设为,生成的专业性提示设为/>,将提示/>和用户信息查询/>进行拼接,得到输入序列 />:
再将输入序列 送入大型语言模型经过自注意力机制Self-Attention和多层Transformer 进行编码得到输出序列 />:
最后,对输出序列 进行解码,生成最终的诊断结果/>,其中/>;
所述步骤S6具体包括通过定义一个转换函数将原始诊断结果 /> 转换为具体业务场景需要语言的表述 /> ,其中/>。
2. 根据权利要求1所述的车辆故障诊断与预防方法,其特征在于,所述步骤S1包括以下步骤:
S11,通过GPT模型将问题表示为特征向量,即:
;其中,A表示用户问题的特征向量,B表示历史报障信息的特征向量,/>表示大型语言模型的编码层,通过编码层输出句子的特征向量,/>表示用户问题,H表示用户历史报障信息。
3.根据权利要求2所述的车辆故障诊断与预防方法,其特征在于,所述步骤S1还包括以下步骤:
S12,通过余弦相似度算法计算问题向量之间的相似度,得到所述问题向量之间的相似度,所述余弦相似度的计算公式如下:
其中,表示用户问题的特征向量,/>表示历史报障信息的特征向量,/>表示向量点积,和/>分别表示向量的模长。
4.根据权利要求3所述的车辆故障诊断与预防方法,其特征在于,所述步骤S1还包括以下步骤:
S13,将当前问题的相似度阈值设置为,并将当前问题的余弦相似度阈值大于/>的关联历史报障信息筛选出来,获取与当前问题相关的历史报障信息。
5.根据权利要求4所述的车辆故障诊断与预防方法,其特征在于,所述步骤S2包括以下步骤:
S21,将需要处理的用户问题设为,待抽取的关键节点为/>,现象关系为/>,通过BERT对问题进行编码得到/>,其中/>;
S22,通过关系抽取模型CasRel对进行预测,获得关键节点和关系标签,其中,所述关系抽取模型CasRel包含负责预测节点的模型/>与负责预测关系的模型/>,通过负责预测节点的模型/>与负责预测关系的模型/>分别对/>进行预测得到/>与/>,其中,/>为预测得到的关键节点标签,/>为预测得到的关系标签,并根据预测得到的关键节点标签/>和关系标签/>确定关键节点和关系,并将关键节点标签/>和关系标签/>组织为三元组的形式。
6.根据权利要求1所述的车辆故障诊断与预防方法,其特征在于,在所述步骤S6中当具体业务场景需要语言为执行指令而非接收文字信息时需要将诊断结果转换成相应的指令,当具体业务场景需要语言为语音信息时需要将诊断结果转换为音频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657034.7A CN116414990B (zh) | 2023-06-05 | 2023-06-05 | 一种车辆故障诊断与预防方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657034.7A CN116414990B (zh) | 2023-06-05 | 2023-06-05 | 一种车辆故障诊断与预防方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116414990A CN116414990A (zh) | 2023-07-11 |
CN116414990B true CN116414990B (zh) | 2023-08-11 |
Family
ID=87059626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310657034.7A Active CN116414990B (zh) | 2023-06-05 | 2023-06-05 | 一种车辆故障诊断与预防方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116414990B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290484B (zh) * | 2023-10-10 | 2024-06-18 | 深圳市明睿数据科技有限公司 | 一种用于汽车故障定位及维修建议的智能问答系统及方法 |
CN117271740A (zh) * | 2023-10-11 | 2023-12-22 | 中国电子科技集团公司第十五研究所 | 一种基于句粒度提示的大语言模型时序知识问答方法 |
CN117076649B (zh) * | 2023-10-13 | 2024-01-26 | 卓世科技(海南)有限公司 | 一种基于大模型思维链的应急信息查询方法及装置 |
CN118396599B (zh) * | 2024-06-26 | 2024-10-11 | 克诺尔车辆设备(苏州)有限公司 | 故障工单处置方法、系统和存储介质 |
CN118378964A (zh) * | 2024-06-27 | 2024-07-23 | 南方科技大学 | 一种基于树状思维链的汽车质检生命周期管理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535902A (zh) * | 2021-07-13 | 2021-10-22 | 辽宁工程技术大学 | 一种融合对抗训练的生成式对话系统 |
CN115033679A (zh) * | 2022-08-10 | 2022-09-09 | 深圳联友科技有限公司 | 基于知识图谱搜索汽车维修数据的方法 |
CN115238029A (zh) * | 2022-06-22 | 2022-10-25 | 国网天津市电力公司电力科学研究院 | 一种电力故障知识图谱的构建方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775839B2 (en) * | 2020-06-10 | 2023-10-03 | International Business Machines Corporation | Frequently asked questions and document retrieval using bidirectional encoder representations from transformers (BERT) model trained on generated paraphrases |
-
2023
- 2023-06-05 CN CN202310657034.7A patent/CN116414990B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535902A (zh) * | 2021-07-13 | 2021-10-22 | 辽宁工程技术大学 | 一种融合对抗训练的生成式对话系统 |
CN115238029A (zh) * | 2022-06-22 | 2022-10-25 | 国网天津市电力公司电力科学研究院 | 一种电力故障知识图谱的构建方法和装置 |
CN115033679A (zh) * | 2022-08-10 | 2022-09-09 | 深圳联友科技有限公司 | 基于知识图谱搜索汽车维修数据的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116414990A (zh) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116414990B (zh) | 一种车辆故障诊断与预防方法 | |
CN113672708B (zh) | 语言模型训练方法、问答对生成方法、装置及设备 | |
KR102504498B1 (ko) | 의료 사실의 검증 방법 및 장치 | |
CN117235238B (zh) | 问答方法、装置、存储介质及计算机设备 | |
US11003705B2 (en) | Natural language processing and classification | |
CN113850387A (zh) | 专家系统知识库构建方法、问答方法、系统、装置及介质 | |
CN110704668B (zh) | 基于网格的协同注意力vqa方法和装置 | |
CN114818703B (zh) | 基于BERT语言模型和TextCNN模型的多意图识别方法及系统 | |
KR102488886B1 (ko) | 하이브리드 지능형 고객 상담장치 및 방법 | |
CN111126056A (zh) | 一种识别触发词的方法及装置 | |
CN117591813B (zh) | 基于多维特征的复杂装备故障诊断方法及系统 | |
CN115797795B (zh) | 基于强化学习的遥感影像问答式检索系统及方法 | |
CN114741487B (zh) | 基于图文语义嵌入的图文检索方法及系统 | |
CN117390156A (zh) | 基于跨模态的问答对话方法、系统、设备及存储介质 | |
CN117009516A (zh) | 换流站故障策略模型训练方法、推送方法及装置 | |
CN113157892B (zh) | 用户意图处理方法、装置、计算机设备及存储介质 | |
CN116957043A (zh) | 模型量化方法、装置、设备及介质 | |
CN116186223A (zh) | 一种金融文本处理方法、装置、设备和存储介质 | |
CN114925681A (zh) | 知识图谱问答问句实体链接方法、装置、设备及介质 | |
CN114548325A (zh) | 基于对偶对比学习的零样本关系抽取方法和系统 | |
CN117173530B (zh) | 目标异常检测方法及装置 | |
CN117009532B (zh) | 语义类型识别方法、装置、计算机可读介质及电子设备 | |
CN115129824B (zh) | 检索式多轮对话方法和系统 | |
CN116992018A (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
CN118780806A (zh) | 智能客服服务方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |