CN117076649B - 一种基于大模型思维链的应急信息查询方法及装置 - Google Patents
一种基于大模型思维链的应急信息查询方法及装置 Download PDFInfo
- Publication number
- CN117076649B CN117076649B CN202311326272.6A CN202311326272A CN117076649B CN 117076649 B CN117076649 B CN 117076649B CN 202311326272 A CN202311326272 A CN 202311326272A CN 117076649 B CN117076649 B CN 117076649B
- Authority
- CN
- China
- Prior art keywords
- emergency
- emergency event
- public
- prompt
- professional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 239000002131 composite material Substances 0.000 claims abstract description 15
- 230000004044 response Effects 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 5
- 238000003339 best practice Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000012098 association analyses Methods 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 241000764238 Isis Species 0.000 claims description 2
- 230000008569 process Effects 0.000 description 13
- 238000007726 management method Methods 0.000 description 9
- 230000015654 memory Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002079 cooperative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于大模型思维链的应急信息查询的方法,应用于应急信息查询技术领域,包括:获取用户输入问题,选出目标应急事件场景,然后将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt,并输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容,最后提供复合答复内容。本发明能够显著提高公众获得应急信息的深度和广度。同时采用思维链方法,提高了公众获得应急信息的准确性。
Description
技术领域
本发明涉及应急信息查询技术领域,特别是指一种基于大模型思维链的应急信息查询方法及装置。
背景技术
应急管理是对资源和职责的组织管理,以应对突发事件的所有方面,包括准备、响应和恢复。目的是减轻所有灾害的不利影响。应急管理中较为重要的部分为应急信息查询。应急信息查询的基本原理的已经触及复杂适应系统(Complex Adaptive System,CAS)思想,即大规模、异质性的行动主体对信息的搜集、交换和共享。它既适应环境的变化,也相互适应,达成协同行动,实现社会系统从“混沌”向有序的回归。这一系统通过信息技术的应用,既增强行动主体对环境变化的适应能力,也提升行动主体之间的相互适应能力,最终提高应急管理的协同水平和集体绩效。
从工作内容来看,应急信息查询覆盖突发事件的全生命周期,各类应急管理主体的工作需要覆盖全生命周期,例如事前预防、应急准备、监测预警、处置救援、恢复重建等事前、事中、事后各个环节。一般应急管理主体工作主要是参照应急预案。另外在应急管理的专家中,决策支持工具和系统通常被广泛应用于处理灾难期间和之后的问题。这些工具是丰富决策过程的宝贵资源,能减轻与规划和比较评估相关的认知负担。与此同时,公众既是突发事件的直接受害者,也是应急事件的直接参与者,但是目前公众参与过程中,常常面对信息匮乏和工具不足的问题。公众经常依赖于诸如百度或Microsoft Bing之类的流行搜索引擎获取信息。公众在利用这些常规搜索的时候,常常无法获得有效信息。一方面是专业性不足,另外一方面是经验不足。专业性不足导致不容易提出有价值的问题。经验不足导致不容易筛选出有效信息。另外公众面对的问题覆盖面广,往往不是专业信息源能完全覆盖的。因此参与应急信息查询的公众在信息搜集和挖掘方面存在工具不足的问题。
大语言模型(Large Language Model,简称 LLM)是一种利人工智能技术。它根据大量的文本数据,学习语言的规律和知识,从而能够生成自然和流畅的文本的模型。大语言模型具有强大的表达能力和泛化能力,可以应用于各种自然语言处理任务,如机器翻译、文本摘要、对话系统、问答系统等。随着人工智能技术的快速发展和应用普及,大语言模型在各种应用中发挥的作用将越来越重要。目前流行的大语言模型应用,例如ChatGPT正在成为潜在的一站式问题解答目的地的地方。
从理论上,大语言模型与应急信息查询在提升适应能力的总体思路和发展方向存在内在的契合。大语音模型在本质上就是一种复杂语言系统。本质上是深度学习模型对信息的搜集和挖掘,识别信息之间的关联机制。大语言模型应用于应急信息查询,应该能够提高应急信息查询的信息搜集和挖掘能力。
目前将大语言模型应用于应急信息查询的研究还非常有限。现有的大语音模型支持的对话系统和问答系统也没有专门为应急信息查询进行设计。当公众参与到应急信息查询过程中,面对专业性不足,经验不足的问题。而且和职能部门不同的地方是,职能部门有明确的责任范围,而公众会面对更为复杂的问题,难以从职能部门的工作指南上获取完整的信息。同时也没有有效的工具能帮助公众直接获取有价值的信息。对公众来说,如何正确使用大语言模型支持应急信息查询的决策过程是一个亟待解决的问题。
发明内容
本发明实施例提供了一种基于大模型思维链的应急信息查询方法及装置。针对公众参与应急信息查询的过程中,常常面对信息匮乏和工具不足的问题。本申请的方法是基于大语言模型为公众参与应急提供决策信息。本申请的方法不仅可以考虑应急信息查询的专业性还可以考虑公众参与应急信息查询的复杂性,还可以避免公共在获取信息过程中缺乏指向性的问题。
为解决上述发明目的,所述技术方案如下:
一方面,本申请实施例提供了一种基于大模型思维链的应急信息查询方法,该方法由电子设备实现,该方法包括以下步骤:
S1: 定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式;
S2: 在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
S3: 根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt;
S4: 将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
S5: 根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
S6: 将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
S7: 基于专业答复内容和公共答复内容,提供复合答复内容。
优选地, 所述S1的定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式,包括:
S11: 从历史应急事件报告中提取应急事件的阶段和用户角色;
S12: 按照事件的阶段和用户角色,提炼至少一个应急事件场景,组成预设应急事件场景库;
S13: 根据历史应急事件报告,给每个应急事件场景赋予标签,所述标签是从每个应急事件场景在历史应急事件报告中相关描述信息中提取的关键词。
优选地, 所述S2的在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景,包括:
S21: 从用户输入问题提取关键词;
S22: 基于公式(1),计算用户输入问题的关键词和预设应急事件场景库里面的每个应急事件场景的关联关系指数:
(1)
其中,是关联关系指数,向量/>是用户输入问题的关键词集合的向量表示,向量/>是预设应急事件场景库里面的每个应急事件场景标签集合的向量表示,/>表示向量的点乘,/>表示向量的范数;
S23: 将应急事件场景的关联关系指数和预设阈值,进行比对,将大于预设阈值的应急事件场景按照应急事件场景的关联关系指数按照降序进行排序;
S24: 选出排序最前的应急事件场景,作为目标应急事件场景。
优选地, 所述S3的根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt,包括:
S31: 对每个应急事件场景制定预设的专业问题文本;
S32: 收集和应急决策相关的专业知识,所述专业知识包括但不限于应急信息查询的最佳实践、相关法规和指南;
S33: 基于专业问题文本和专业知识,根据思维链式方法,对每个应急事件场景生成预设的专业提示,所述思维链式方法是将专业知识按照应急事件管理目标拆解成具体步骤。
优选地, 所述S5的根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt,包括:
S51: 从公开数据集中获取和每个应急事件场景相关的公共问题文本;
S52: 对公共问题文本进行聚类分析,选出核心问题;
S53: 从公开数据集中获取和每个应急事件场景相关的公共知识进行加工处理,得到加工后知识资源;
S54: 基于核心问题和加工后知识资源,根据自动生成思维链式方法,对每个应急事件场景生成预设的公共提示。
优选地, 所述S53的从公开数据集获取和每个应急事件场景相关的公共知识加工处理后,得到加工后知识资源,包括:
S531: 列举和每个应急事件场景相关的推理任务;
S532: 从公开数据集中获取和每个应急事件场景相关的公共知识,并将公共知识通过文本分析算法,拆解成短语数据集;
S533: 利用文本相关性分析,对短语数据集进行筛选,获取相关性大于预设值的短语数据集;
S534: 将相关性较高的短语数据集中的每一条短语均与推理任务建立关联,并给每一条短语添加推理任务标签;
S535: 如果多条短语与同一推理任务对应,则对所述多条短语进行简化操作,得到加工后知识资源,所述简化操作包括筛选、整合中的至少一项。
优选地, 所述S54的基于核心问题和加工后知识资源,根据自动生成思维链式方法,对每个应急事件场景生成预设的公共提示,包括:
S541: 获取预配置的结构化提示序列模板,所述结构化提示序列模板是包括应急响应步骤槽位的步骤模板;
S542: 基于加工后知识资源,按照每个推理任务进行拆解,按照时间先后和角色,排列成任务;
S543: 将任务填入配置的结构化提示序列模板,得到预设的公共提示,所述将任务填入配置的结构化提示序列模板包括将填入同一应急响应步骤槽位的任务合并,对于无法填入模板的任务,进行去除处理。
优选地, 所述S7的基于专业答复内容和公共答复内容,提供复合答复内容,包括:
S71: 对专业答复内容和公共答复内容进行关联关系分析,得到关联关系指数;
S72: 当关联关系指数大于预设阈值时,提供专业答复内容,当关联关系指数小于等于预设阈值时,拼接专业答复内容和公共答复,提供复合答复内容。
第二方面,本申请实施例提供了一种基于大模型思维链的应急信息查询装置,包括以下步骤:
场景库单元: 用于定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式;
用户问题单元: 用于在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
专业提示单元: 用于根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt;
专业答复单元: 用于将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
公共提示单元: 用于根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
公共答复单元: 用于将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
复合答复单元: 用于基于专业答复内容和公共答复内容,提供复合答复内容。
第三方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
上述方案,基于大模型思维链方法,通过建立应急场景库,在应急场景库的基础上,整合了专业知识和公开信息,从大语言模型中提取相关的信息,提高了公众获得应急信息的深度和广度。并在此基础上,采用思维链方法,提高了公众获得应急信息的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于大模型思维链的应急信息查询方法流程图;
图2是本发明实施例提供的一种结构化提示序列模板的结构示意图;
图3是本发明实施例提供的一种基于大模型思维链的应急信息查询方法装置框图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供了一种基于大模型思维链的应急信息查询方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图1所示的一种基于大模型思维链的应急信息查询方法流程图,该方法的处理流程可以包括如下的步骤:
如图1所示,本申请实施例提供了一种基于大模型思维链的应急信息查询方法,包括以下步骤:
S1: 定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式;
优选地, 所述S1,包括:
S11: 从历史应急事件报告中提取应急事件的阶段和用户角色;
S12: 按照事件的阶段和用户角色,提炼至少一个应急事件场景,组成预设应急事件场景库;
S13: 根据历史应急事件报告,给每个应急事件场景赋予标签,所述标签是从每个应急事件场景在历史应急事件报告中相关描述信息中提取的关键词。
在一些实施例中,除了从事件报告中提取应急信息查询相关信息。例如从历史应急事件报告中提取事件的阶段和用户角色。建立应急事件场景库的步骤还可以包括,首先收集各种应急事件场景的常规信息,按照事件的起因,性质,影响和特征,对场景进行分类。编写场景描述:根据筛选后的场景,通过查询相关文献、案例研究和专家意见,编写详细的场景描述,包括事件触发条件、影响范围、行动方案等信息。从详细的描述中,提取关键词。用这些常规信息提取出来的关键词,进一步完善应急事件场景库。
S2: 在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
优选地, 所述S2,包括:
S21: 从用户输入问题提取关键词;
S22: 基于公式(1),计算用户输入问题的关键词和预设应急事件场景库里面的每个应急事件场景的关联关系指数:
(1)
其中,向量是用户输入问题的关键词集合的向量表示,向量/>是预设应急事件场景库里面的每个应急事件场景标签集合的向量表示,/>表示向量的点乘,/>表示向量的范数;
S23: 将应急事件场景的关联关系指数和预设阈值,进行比对,将大于预设阈值的应急事件场景按照应急事件场景的关联关系指数按照降序进行排序;
S24: 选出排序最前的应急事件场景,作为目标应急事件场景。
在一些实施例中,建立应急决策对话模式可以通过以下几种方式。例如,搜索引擎根据用户所在区域,判断用户是否在受灾区域。当用户在受灾区域搜索,可以为用户提供特殊信息入口,例如定制化搜索窗口。定制化搜索窗口提供按钮可以给用户提供不同的信息入口。例如灾情报告、救援资源、紧急联系信息等,以帮助受灾区域的居民和救援人员获取所需的信息。
优选地,用户在搜索窗口输入问题后,判断是否和应急相关。如果相关,首先计算用户输入问题和预设应急事件场景库里面的每一个应急事件场景的关联关系,选出至少一个相关的应急事件场景。
S3: 根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt;
优选地, 所述S3,包括:
S31: 对每个应急事件场景制定预设的专业问题文本;
S32: 收集和应急决策相关的专业知识,所述专业知识包括但不限于应急信息查询的最佳实践、相关法规和指南;
S33: 基于专业问题文本和专业知识,根据思维链式方法,对每个应急事件场景生成预设的专业提示,所述思维链式方法是将专业知识按照应急事件管理目标拆解成具体步骤。
在一些实施例中,大型语言模型(LLMs)可以通过少量示例来执行新任务。思维链(CoT)提示可以提高LLM进行复杂和多步推理的能力。除了(查询,答案)示例对演示外,CoT提示还包括每个示例的理由,即一系列朝着答案的推理步骤,这鼓励LLM在预测最终答案之前明确生成其中间推理过程。
需要说明的是,CoT提示的组成部分包括桥接对象和语言模板。桥接对象是模型为了成功进行最终预测而需要遍历的关键和必要对象。对于算术推理,桥接对象被定义为理由的数值部分(数字和等式),对于事实型问答,桥接对象被定义为主体和客体实体。语言模板是桥接对象的补充部分,用作文本提示、指导模型沿着推理过程推导出正确的桥接对象的关系/谓词。
优选地,CoT提示的生成过程包括,首先定义问题。该问题应是一个多步推理任务。接下来拆解问题,即为将问题分解为更小、更可管理的步骤。在这个过程中,确定桥接对象。接下来是构建思维链,包括创建与前一步中确定的中间步骤相对应的提示序列。这种提示序列就是通过语言模板创建的。模板的功能是让每个提示保持逻辑流动,从一个步骤到下一个步骤。最后就是将提示纳入大语言模型。在本申请中,针对应急信息查询的特征,将语言模板定义为预配置的结构化提示序列模板。
优选地,公共提示指令prompt是一种CoT提示。生成公共提示指令prompt的过程也是首先定义问题,拆解问题,明确桥接对象,最后通过预配置的结构化提示序列模板确定具体的指令prompt.
优选地,预配置的结构化提示序列模板可以包括一系列的步骤[s1,s2,...sn],分别对应应急信息查询中的确定灾害的影响范围,预测灾害影响范围的变化,疏散路径,救治路径,可用公共设施,援救路径等。
S4: 将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
在一些实施例中,最后将公共提示指令prompt输入大语言模型,首先可以通过将其拼接为输入文本的一部分,或者使用特定模型支持的任何其他方法来实现。
S5: 根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
优选地, 所述S5,包括:
S51: 从公开数据集中获取和每个应急事件场景相关的公共问题文本;
S52: 对公共问题文本进行聚类分析,选出核心问题;
S53: 从公开数据集中获取和每个应急事件场景相关的公共知识进行加工处理,得到加工后知识资源;
S54: 基于核心问题和加工后知识资源,根据自动生成思维链式方法,对每个应急事件场景生成预设的公共提示。
优选地, 所述S53,包括:
S531: 列举和每个应急事件场景相关的推理任务;
S532: 从公开数据集中获取和每个应急事件场景相关的公共知识,并将公共知识通过文本分析算法,拆解成短语数据集;
S533: 利用文本相关性分析,对短语数据集进行筛选,获取相关性大于预设值的短语数据集;
S534: 将相关性较高的短语数据集中的每一条短语均与推理任务建立关联,并给每一条短语添加推理任务标签;
S535: 如果多条短语与同一推理任务对应,则对所述多条短语进行简化操作,得到加工后知识资源,所述简化操作包括筛选、整合中的至少一项。
优选地, 所述S54,包括:
S541: 获取预配置的结构化提示序列模板,所述结构化提示序列模板是包括应急响应步骤槽位的步骤模板;
S542: 基于加工后知识资源,按照每个推理任务进行拆解,按照时间先后和角色,排列成任务;
S543: 将任务填入配置的结构化提示序列模板,得到预设的公共提示,所述将任务填入配置的结构化提示序列模板包括将填入同一应急响应步骤槽位的任务合并,对于无法填入模板的任务,进行去除处理。
S6: 将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
S7: 基于专业答复内容和公共答复内容,提供复合答复内容。
优选地, 所述S7,包括:
S71: 对专业答复内容和公共答复内容进行关联关系分析,得到关联关系指数;
S72: 当关联关系指数大于预设阈值时,提供专业答复内容,当关联关系指数小于等于预设阈值时,拼接专业答复内容和公共答复,提供复合答复内容。
在一些实施例中,拼接专业答复内容和公共答复,可以进行简单的拼接,即为直接将专业答复和公共答复合并,并提供。
需要说明的是,也可以提供两个答复区域,分别展示专业答复内容和公共答复。
需要进一步说明的是,当专业答复和公共答复出现很多重合的时候,也可以进行内容的融合,按照时间线,把重合的步骤进行去重,保留最简单的步骤。
以上是关于方法实施例的介绍,以下通过装置实施例,对本申请所述方案进行进一步说明。
图3是根据一示例性实施例示出的一种基于大模型思维链的应急信息查询装置框图,该装置用于一种基于大模型思维链的应急信息查询方法。参照图3,该装置包括:
场景库单元310: 用于定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式;
用户问题单元320: 用于在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
专业提示单元330: 用于根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt;
专业答复单元340: 用于将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
公共提示单元350: 用于根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
公共答复单元360: 用于将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
复合答复单元370: 用于基于专业答复内容和公共答复内容,提供复合答复内容。
在示例性实施例中,还提供了基于大模型思维链的应急信息查询一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述方法。
本申请针对公众参与应急信息查询的过程中,常常面对信息匮乏和工具不足的问题,提供了一种基于大模型思维链的应急信息查询方法。这种方法基于大语言模型,提高了公众对应急信息的搜集和挖掘能力。同时考虑到公众问题常常缺乏指向性,而信息需求又较为复杂的特点,基于思维链方法,为公众提供提示指令prompt作为大语言模型的输入,来提高大语言模型的反馈的准确性。同时考虑到公众需求的多样性,提供了两种提示指令prompt。一种是将信息交互过程引导到专业性方面,另外一种是提高问题的广度。让公众在获取应急相关的信息时,可以获得及时,而且专业,全面的反馈。
图4是本发明实施例提供的一种电子设备400的结构示意图,该电子设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现上述中文文本拼写检查方法的步骤。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述中文文本拼写检查方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。有以下几点需要说明:
(1)本发明实施例附图只涉及到与本发明实施例涉及到的结构,其他结构可参考通常设计。
(2)为了清晰起见,在用于描述本发明的实施例的附图中,层或区域的厚度被放大或缩小,即这些附图并非按照实际的比例绘制。可以理解,当诸如层、膜、区域或基板之类的元件被称作位于另一元件“上”或“下”时,该元件可以“直接”位于另一元件“上”或“下”或者可以存在中间元件。
(3)在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合以得到新的实施例。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于大模型思维链的应急信息查询方法,其特征在于,包括:
S1: 定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式,所述应急事件场景的描述包括:事件触发条件、影响范围和行动方案;
所述S1的定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式,包括:
S11: 从历史应急事件报告中提取应急事件的阶段和用户角色;
S12: 按照事件的阶段和用户角色,提炼至少一个应急事件场景,组成预设应急事件场景库;
S13: 根据历史应急事件报告,给每个应急事件场景赋予标签,所述标签是从每个应急事件场景在历史应急事件报告中相关描述信息中提取的关键词;
S2: 在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
S3: 根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt:
所述S3的根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt,包括:
S31: 对每个应急事件场景制定预设的专业问题文本;
S32: 收集和应急决策相关的专业知识,所述专业知识包括但不限于应急信息查询的最佳实践、相关法规和指南;
S33: 基于专业问题文本和专业知识,根据思维链式方法,对每个应急事件场景生成预设的专业提示,所述思维链式方法是将专业知识按照应急事件管理目标拆解成具体步骤;
S4: 将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
S5: 根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
S6: 将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
S7: 基于专业答复内容和公共答复内容,提供复合答复内容。
2.根据权利要求1所述的基于大模型思维链的应急信息查询方法,其特征在于,所述S2的在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景,包括:
S21: 从用户输入问题提取关键词;
S22: 基于公式(1),计算用户输入问题的关键词和预设应急事件场景库里面的每个应急事件场景的关联关系指数:
(1)
其中,向量是用户输入问题的关键词集合的向量表示,向量/>是预设应急事件场景库里面的每个应急事件场景标签集合的向量表示,/>表示向量的点乘,/>表示向量的范数;
S23: 将应急事件场景的关联关系指数和预设阈值,进行比对,将大于预设阈值的应急事件场景按照应急事件场景的关联关系指数按照降序进行排序;
S24: 选出排序最前的应急事件场景,作为目标应急事件场景。
3.根据权利要求1所述的基于大模型思维链的应急信息查询方法,其特征在于,所述S5的根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt,包括:
S51: 从公开数据集中获取和每个应急事件场景相关的公共问题文本;
S52: 对公共问题文本进行聚类分析,选出核心问题;
S53: 从公开数据集中获取和每个应急事件场景相关的公共知识进行加工处理,得到加工后知识资源;
S54: 基于核心问题和加工后知识资源,根据自动生成思维链式方法,对每个应急事件场景生成预设的公共提示。
4. 根据权利要求3所述的基于大模型思维链的应急信息查询方法,其特征在于,所述S53的从公开数据集获取和每个应急事件场景相关的公共 知识加工处理后,得到加工后知识资源,包括:
S531: 列举和每个应急事件场景相关的推理任务;
S532: 从公开数据集中获取和每个应急事件场景相关的公共知识,并将公共知识通过文本分析算法,拆解成短语数据集;
S533: 利用文本相关性分析,对短语数据集进行筛选,获取相关性大于预设值的短语数据集;
S534: 将相关性较高的短语数据集中的每一条短语均与推理任务建立关联,并给每一条短语添加推理任务标签;
S535: 如果多条短语与同一推理任务对应,则对所述多条短语进行简化操作,得到加工后知识资源,所述简化操作包括筛选、整合中的至少一项。
5.根据权利要求3所述的基于大模型思维链的应急信息查询方法,其特征在于,所述S54的基于核心问题和加工后知识资源,根据自动生成思维链式方法,对每个应急事件场景生成预设的公共提示,包括:
S541: 获取预配置的结构化提示序列模板,所述结构化提示序列模板是包括应急响应步骤槽位的步骤模板;
S542: 基于加工后知识资源,按照每个推理任务进行拆解,按照时间先后和角色,排列成任务;
S543: 将任务填入配置的结构化提示序列模板,得到预设的公共提示,所述将任务填入配置的结构化提示序列模板包括将填入同一应急响应步骤槽位的任务合并,对于无法填入模板的任务,进行去除处理。
6.根据权利要求1所述的基于大模型思维链的应急信息查询方法,其特征在于,所述S7的基于专业答复内容和公共答复内容,提供复合答复内容,包括:
S71: 对专业答复内容和公共答复内容进行关联关系分析,得到关联关系指数;
S72: 当关联关系指数大于预设阈值时,提供专业答复内容,当关联关系指数小于等于预设阈值时,拼接专业答复内容和公共答复,提供复合答复内容。
7.一种基于大模型思维链的应急信息查询装置,其特征在于,所述装置适用于上述权利要求1-6中任意一项的方法,装置包括:
场景库单元: 用于定义应急事件场景,得到预设应急事件场景库,基于所述预设应急事件场景库,建立应急决策对话模式,具体包括:
S11: 从历史应急事件报告中提取应急事件的阶段和用户角色;
S12: 按照事件的阶段和用户角色,提炼至少一个应急事件场景,组成预设应急事件场景库;
S13: 根据历史应急事件报告,给每个应急事件场景赋予标签,所述标签是从每个应急事件场景在历史应急事件报告中相关描述信息中提取的关键词;
用户问题单元: 用于在应急决策对话模式下,获取用户输入问题,基于所述用户输入问题,选出至少一个相关的应急事件场景,作为目标应急事件场景;
专业提示单元: 用于根据目标应急事件场景,将用户输入问题和预设的专业提示进行拼接,获取专业提示指令prompt,具体包括:
S31: 对每个应急事件场景制定预设的专业问题文本;
S32: 收集和应急决策相关的专业知识,所述专业知识包括但不限于应急信息查询的最佳实践、相关法规和指南;
S33: 基于专业问题文本和专业知识,根据思维链式方法,对每个应急事件场景生成预设的专业提示,所述思维链式方法是将专业知识按照应急事件管理目标拆解成具体步骤;
专业答复单元: 用于将专业提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的专业答复内容;
公共提示单元: 用于根据目标应急事件场景,将用户输入问题和预设的公共提示进行拼接,获取公共提示指令prompt;
公共答复单元: 用于将公共提示指令prompt,输入至预训练的大语言模型,得到大语言模型输出的针对所述用户输入问题的公共答复内容;
复合答复单元: 用于基于专业答复内容和公共答复内容,提供复合答复内容。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311326272.6A CN117076649B (zh) | 2023-10-13 | 2023-10-13 | 一种基于大模型思维链的应急信息查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311326272.6A CN117076649B (zh) | 2023-10-13 | 2023-10-13 | 一种基于大模型思维链的应急信息查询方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117076649A CN117076649A (zh) | 2023-11-17 |
CN117076649B true CN117076649B (zh) | 2024-01-26 |
Family
ID=88702819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311326272.6A Active CN117076649B (zh) | 2023-10-13 | 2023-10-13 | 一种基于大模型思维链的应急信息查询方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117076649B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117273868A (zh) * | 2023-11-20 | 2023-12-22 | 浙江口碑网络技术有限公司 | 店铺推荐方法、装置、电子设备与存储介质 |
CN118170890B (zh) * | 2024-05-09 | 2024-07-19 | 腾讯科技(深圳)有限公司 | 一种回复文本的生成方法和相关装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955675A (zh) * | 2019-10-30 | 2020-04-03 | 中国银联股份有限公司 | 机器人对话方法、装置、设备及计算机可读存储介质 |
CN115033677A (zh) * | 2022-06-30 | 2022-09-09 | 中国工商银行股份有限公司 | 基于对话机器人的事件处理方法、装置、设备和介质 |
CN115941369A (zh) * | 2021-08-06 | 2023-04-07 | 中移(杭州)信息技术有限公司 | 智能家居联动的问答数据采集方法、设备、介质和系统 |
CN115994846A (zh) * | 2023-03-24 | 2023-04-21 | 云钞金融服务(北京)有限公司 | 处理金融系统现金微生物数据溯源的公共卫生管理系统 |
CN116414990A (zh) * | 2023-06-05 | 2023-07-11 | 深圳联友科技有限公司 | 一种车辆故障诊断与预防方法 |
CN116561278A (zh) * | 2023-05-05 | 2023-08-08 | 科大讯飞股份有限公司 | 知识问答方法、装置、设备及存储介质 |
CN116595131A (zh) * | 2023-03-23 | 2023-08-15 | 中国科学院自动化研究所 | 使用大型语言模型进行医疗问答的方法及系统 |
CN116628377A (zh) * | 2023-02-01 | 2023-08-22 | 电子科技大学 | 一种网页主题相关度判别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8311835B2 (en) * | 2003-08-29 | 2012-11-13 | Microsoft Corporation | Assisted multi-modal dialogue |
-
2023
- 2023-10-13 CN CN202311326272.6A patent/CN117076649B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955675A (zh) * | 2019-10-30 | 2020-04-03 | 中国银联股份有限公司 | 机器人对话方法、装置、设备及计算机可读存储介质 |
CN115941369A (zh) * | 2021-08-06 | 2023-04-07 | 中移(杭州)信息技术有限公司 | 智能家居联动的问答数据采集方法、设备、介质和系统 |
CN115033677A (zh) * | 2022-06-30 | 2022-09-09 | 中国工商银行股份有限公司 | 基于对话机器人的事件处理方法、装置、设备和介质 |
CN116628377A (zh) * | 2023-02-01 | 2023-08-22 | 电子科技大学 | 一种网页主题相关度判别方法 |
CN116595131A (zh) * | 2023-03-23 | 2023-08-15 | 中国科学院自动化研究所 | 使用大型语言模型进行医疗问答的方法及系统 |
CN115994846A (zh) * | 2023-03-24 | 2023-04-21 | 云钞金融服务(北京)有限公司 | 处理金融系统现金微生物数据溯源的公共卫生管理系统 |
CN116561278A (zh) * | 2023-05-05 | 2023-08-08 | 科大讯飞股份有限公司 | 知识问答方法、装置、设备及存储介质 |
CN116414990A (zh) * | 2023-06-05 | 2023-07-11 | 深圳联友科技有限公司 | 一种车辆故障诊断与预防方法 |
Non-Patent Citations (1)
Title |
---|
闫龙川 等.数据科学与工程技术丛书 Python文本分析.北京:机械工业出版社,2020,(第2版),第305页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117076649A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117076649B (zh) | 一种基于大模型思维链的应急信息查询方法及装置 | |
Wang et al. | Enhancing automated requirements traceability by resolving polysemy | |
CN110968699A (zh) | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 | |
Shibaoka et al. | GOORE: Goal-oriented and ontology driven requirements elicitation method | |
CN108734402B (zh) | 基于虚拟案例的非常规突发事件应急管理决策方法及系统 | |
CN111538844A (zh) | 目标领域知识库的生成、问题解答方法及装置 | |
CN112989761B (zh) | 文本分类方法及装置 | |
CN117743315B (zh) | 一种为多模态大模型系统提供高质量数据的方法 | |
CN111291187B (zh) | 一种情感分析方法、装置、电子设备及存储介质 | |
CN116594768A (zh) | 面向大模型的通用工具协同和精细化学习系统及方法 | |
CN117390145A (zh) | 临床试验的自动文本对话方法、装置、设备及介质 | |
CN112036129A (zh) | 一种配电网应急演练方案数字化辅助设计系统及方法 | |
Mao et al. | New advances in intelligence and security informatics | |
Tallapragada et al. | Improved Resume Parsing based on Contextual Meaning Extraction using BERT | |
Marivate et al. | An intelligent multi-agent recommender system for human capacity building | |
CN115309994A (zh) | 地点检索方法、电子设备以及存储介质 | |
Denter et al. | Forecasting future bigrams and promising patents: introducing text-based link prediction | |
CN114020892A (zh) | 基于人工智能的答案选取方法、装置、电子设备及介质 | |
Das et al. | Automated pipeline for sentiment analysis of political tweets | |
Polonijo et al. | Propaganda detection using sentiment aware ensemble deep learning | |
CN116701752A (zh) | 基于人工智能的新闻推荐方法、装置、电子设备及介质 | |
Pérez et al. | Evaluating Low-cost in internal crowdsourcing for software engineering: The case of feature location in an industrial environment | |
Wang | Chatbot in the Service Industry: Challenges and Perspectives | |
Althar et al. | Software Source Code: Statistical Modeling | |
Trappl | Reducing International Tension and Improving Mutual Understanding Through Artificial Intelligence: 3 Potential Approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |