CN117389541B - 基于对话检索生成模板的配置系统及设备 - Google Patents
基于对话检索生成模板的配置系统及设备 Download PDFInfo
- Publication number
- CN117389541B CN117389541B CN202311704059.4A CN202311704059A CN117389541B CN 117389541 B CN117389541 B CN 117389541B CN 202311704059 A CN202311704059 A CN 202311704059A CN 117389541 B CN117389541 B CN 117389541B
- Authority
- CN
- China
- Prior art keywords
- rule
- template
- configuration
- configuration file
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000007 visual effect Effects 0.000 claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 57
- 230000014509 gene expression Effects 0.000 claims description 37
- 238000013507 mapping Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000012800 visualization Methods 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 9
- 238000009966 trimming Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000002085 persistent effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000000547 structure data Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 7
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 102100033814 Alanine aminotransferase 2 Human genes 0.000 description 1
- 101710096000 Alanine aminotransferase 2 Proteins 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/34—Graphical or visual programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/38—Creation or generation of source code for implementing user interfaces
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供了一种基于对话检索生成模板的配置系统及设备,本方案将传统的程序嵌入式规则调整为动态热加载的可视化模板规则,通过可视化模板设置方式修改规则配置文件并执行规则校验与热更新,可视化模板涵盖了系统各个业务模块的执行参数及模块间耦合逻辑。系统包括:规则模版定义,用于定义实体和实体间逻辑关系;可视化编辑器,用户图形化操作设计规则模板;模板检索与问答,用户根据任务需求查询规则模板库;规则模版解析引擎,将规则模板解析为配置文件;配置文件生成、配置文件编译、业务上线。
Description
技术领域
本发明涉及数据处理、计算机数据模板生成领域,特别涉及基于对话检索生成模板的配置系统及设备。
背景技术
随着信息化和数字化进程的加快,各种信息控制系统在工业、交通、安防、军事等领域发挥着越来越重要的作用。这些系统需要处理大量的数据和执行复杂的控制策略。为了满足不断变化的业务需求,信息控制系统需要具备高度灵活性和可扩展性。
具体来看,对于当前的信息控制系统,动态生成和更新规则模板逐渐成为业界正在优化的重点问题,但现有的规则管理方法,如《一种通过分类配置自动生成代码的方法及系统》(CN102722372B)、《一种配置项设置界面的生成方法及系统》(CN102122245A)等,仍需要专业人员编写复杂的配置文件或编程代码,这对于非技术背景的用户来说较为困难。
近年来随着人工智能技术的快速发展,基于对话检索的方法在很多场景中展现出强大的潜力。例如,通过生成式语言大模型,用户可以使用自然语言与系统进行交互,以完成各种任务。然而,在规则模板生成和配置领域,仅有少部分可视化规则引擎支持拖拽式的规则配置,但在规则模板的检索和复用方面,这些引擎仍然面临着一定的挑战。
现有技术目前至少存在如下的技术问题:
规则编写难度高:现有的规则配置方法通常依赖于编程语言或专门的配置文件,对非技术背景的用户不友好。这使得规则模板的创建和更新过程变得繁琐和低效。
灵活性和扩展性不足:由于依赖于固定的配置文件格式或编程语言,现有方法的灵活性和扩展性有限。这使得在面对多样化和动态化的需求时,现有方法无法快速适应和满足需求。
规则模板检索和复用困难:尽管一些可视化规则引擎提供了拖拽式的规则配置方法,但在规则模板的检索和复用方面,这些引擎仍然面临着挑战。用户很难快速找到与他们需求相匹配的现有规则模板,从而降低了规则配置的效率。
缺乏自然语言交互能力:现有的规则配置方法通常缺乏与用户进行自然语言交互的能力,不同规则引擎定义的规则差异巨大,用户难以直观地理解实际需求和规则的对应关系,规则配置过程不够直观和友好。
发明内容
至少部分地针对现有技术中存在的上述不足,本发明提供了一种基于对话 生成模板的配置系统及设备,以提高模板配置的效率和准确性,同时使得配置过程更加直观和友好。具体而言,本发明公开了以下技术方案:
一方面,本发明提供了一种基于对话检索生成模板的配置系统,该系统包括:
检索查询规则模板模块,用于初次使用用户获取规则模板,该模块基于注意力机制的语言模型;
规则模板定义模块,用于设置规则模板并存储规则模板;所述规则模板包含配置参数、变量、控制结构数据;
可视化编辑器,用于用户对规则模板进行创建或修改,所述可视化编辑器基于Web端实现;
动态配置管理模块,用于规则模板与配置文件的动态加载和更新;所述配置文件至少包含配置参数;
模板检索与生成模块,基于预训练语言模型结合微调方法,实现规则模板的检索,并基于检索的规则模板获得生成规则;
规则模板解析引擎模块,接收所述生成规则,并将生成规则映射到可视化规则模板。
优选地,所述检索查询规则模板模块中,注意力机制设置如下:
将输入的每个词法单元的特征X通过权重矩阵分别映射到三个向量空间Q、K、V,其中,Q表示查询向量空间,K表示键空间,V表示值空间;
计算注意力权重:softmax(Q·K^T / sqrt(d_k)),其中,d_k 表示K向量的维度,sqrt()表示平方根,softmax表示归一化函数;
将注意力权重与V相乘,得到加权值;
将各个加权值的和,作为输出。
优选地,检索查询规则模板模块对所述语言模型进行微调:
首先,所述语言模型在关键词文本、规则组件模板间学习并建立映射关系;
其次,模型将映射关系迁移到用户的需求描述与规则模板之间。
优选地,所述可视化编辑器数据执行流程为:
初始化编辑器,接收用户输入;
基于用户输入实时更新编辑区域;
将用户操作同步到规则模板的配置文件,完成数据绑定。
优选地,所述可视化编辑器还支持将规则模板导出为配置文件,或从配置文件中导入规则模板;支持用户的撤销、预览,支持将规则模板发布到指定目标系统。
优选地,所述动态配置管理模块在可视化编辑器和后端之间建立API接口,规则模板和配置文件存储在后端;可视化编辑器通过API接口发送加载或更新请求到后端,后端处理请求后,通过API接口发送加载或更新的规则模板和/或配置文件数据;所述后端指本系统中除可视化编辑器之外的其他模块;
所述可视化编辑器和后端之间建立持久通信,并在后端检测到规则模板和/或配置文件有更新时,通过API接口向可视化编辑器主动推送更新数据;
当规则模板和/或配置文件发生变化时,监听该变化,并更新规则模板和/或配置文件关联的界面元素。
优选地,所述监听通过事件驱动方式实现
优选地,所述规则模板定义模块进一步包括:业务模型单元、规则组件单元、表达式编辑器单元;
所述业务模型单元用于规范规则模板的各项定义,所述各项定义包括实体、属性、关系、数据类型、使用条件;
所述规则组件单元用于形成可重用的规则组件,所述规则组件包括条件、操作、触发器、连接器、可配置超参数;所述规则组件构成规则组件库;
所述表达式编辑器单元,用于自定义数学、逻辑或比较表达式型规则组件。
优选地,所述规则组件单元中,单个组件构建的方式为:定义一基础规则组件类,所述基础规则组件类包含通过属性和方法;针对不同类型规则组件,分别创建子类,并集成基础规则组件类。
优选地,所述模板检索与生成模块基于部署设施的算力选择预训练语言模型。
优选地,所述模板检索与生成模块的微调方法包括:
规则微调,建立由组件级微调过渡至模板级微调的训练方法,并形成关键词-规则模板生成能力;
检索微调,通过混合提示微调方式,形成检索文本-规则生成能力。
优选地,经过微调后,建立检索文本-规则生成能力后,通过规则模板解析引擎模块,将规则模板的配置文件映射到规则模板。
优选地,所述规则微调的方式为:
步骤101、进行模板组件配置文件-关键词对抽取,包括:在规则模板库选择组件,所述组件涵盖全部关键词和操作;对于选定的所述组件,在规则模板库中提取其对应的配置代码,所述配置代码包括组件的类型、参数设置、逻辑关系;将选定的所述组件形成组件微样本库;
步骤102、对模板组件配置文件-关键词微调训练;
步骤103、进行模板配置文件-关键词对抽取,包括:获取典型模板及模板配置代码,标注与典型模板关联的关键词,并进行关键词-模板配置文件微调训练;
模板组件配置文件-关键词微调训练样本数量N1与关键词-模板配置文件微调训练样本数量N2之间满足:
N2 ≈ 0.1N1。
优选地,所述混合提示微调方式为:
步骤201、建立检索文本、关键词、指令混合样本与同一模板配置文件的训练集,其中,以检索文本、关键词、指令混合样本为输入,以模板配置文件为输出;
步骤202、训练方式采用由检索文本、关键词、指令随机抽取,到全部抽取的方式;
训练中,检索文本、关键词、指令的混合权重更新方式为:将检索文本权重设置为1,关键词和指令权重设置为:1-当前迭代次数/总迭代次数。
优选地,所述规则模板解析引擎模块包含词法分析单元、语法分析单元、语义解析单元;
所述词法分析单元,用于将生成规则的配置文件解析为一系列词法单元;
所述语法分析单元,用于将词法单元序列解析为抽象语法树,并遍历抽象语法树,形成可执行配置文件;
所述语义解析单元,用于将可执行配置文件映射到可视化组件实例,并解析可视化组件实例参数和属性,以及执行数据类型检查。
优选地,所述规则模板解析引擎模块执行映射的方式为:
步骤301、解析生成规则的配置文件,基于该配置文件创建可视化组件实例;
步骤302、基于配置文件中的组件关系数据,设置可视化组件实例间的组件关系;
步骤303、将所述可视化组件实例、可视化组件实例间的组件关系整合为一个可视化规则模板,并输出。
优选地,所述语义解析单元执行数据类型检查,针对每个可视化组件实例,检查其参数、属性是否与预定义的类型一致。
优选地,所述规则模板解析引擎模块还执行对生成的可视化规则模板的规则的优化:
步骤401、遍历抽象语法树,识别冗余组件或相同组件,并标记冗余组件、相同组件位置;相同组件指具有相同表达式和参数的条件组件;冗余组件指不影响规则逻辑执行的节点;
步骤402、检查所述冗余组件是否对规则逻辑产生实际影响,若没有影响,则从抽象语法树中删除;
步骤403、遍历标记的相同组件,对于每一对相同组件,删除其中之一,将保留的相同组件作为合并后条件组件;
遍历已删除相同组件的输入端口,将所有与其相连的组件连接到合并后条件组件的对应输入端口;遍历已删除相同组件的输出端口,将所有与其相连的组件连接到合并后条件组件的对应输出端口;
步骤404、对优化后的抽象语法树重新生成可视化规则模板。
此外,本发明还提供了一种基于对话检索生成模板的配置设备,该设备包含服务器、前端用户交互设备;所述服务器被配置为可以与所述前端用户交互设备进行数据交互,并装载有如上所述的基于对话检索生成模板的配置系统。
与现有技术相比,使用对话方式,直接依据用户调整系统规则的需求生成模板,基本消除了用户学习脚本式配置语言或复杂可视化模板编辑的必要性。同时,本方案利用模板学习机制,每次模板更新后,学习用户需求文本到模板间的映射关系,使系统能够不断适应用户的新需求,避免了传统静态示例模板难以适应不同下游用户与系统运行阶段要求的情况。本方案可广泛应用于工业、交通、安防、军事等领域的信息控制系统,降低用户的技术门槛,提高系统的灵活性和易用性。具体表现为:
1.个性化定制:基于对话生成模板的配置方法能够充分了解用户的需求和偏好,生成针对性更强、满足用户特定需求的模板。这将有助于提高用户的使用体验和满意度。
2.实时反馈:通过与用户的实时交互,系统可以及时获得用户对模板的意见和建议,以便在后续生成过程中进行调整。这将有助于减少迭代周期,提高系统的开发效率。
3.自动优化:利用模板学习机制,系统可以自动优化生成的模板,减少冗余和提高执行效率。这将有助于降低系统的运行成本和提高性能。
4.易于维护和升级:基于对话生成模板的配置方法可以将模板与底层实现分离,便于维护和升级。在系统需要更新时,只需对模板进行调整,而无需修改底层实现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的方案流程示意图;
图2为本发明实施例的模板解析引擎逻辑流程图;
图3为本发明实施例的系统结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。应当明确,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
在一个具体的实施例中,结合图1、图3所示,本发明的方案设计了对话式检索查询规则模板方法,结合规则模板定义、可视化编辑器、动态配置管理等方式,实现需求与规则解耦、规则与代码解耦,大幅改善了现有技术中存在的问题。
对话式检索查询规则模板:综合了关键词匹配查询、基于大规模生成式预训练语言模型进行微调的问答系统技术,便于初次使用用户根据任务需求获取相关规则模板进行二次设计。
本实施例中,大规模生成式预训练语言模型优选设计如下:以注意力机制为核心的语言模型,如BERT、T5、GPT3等,注意力机制实现步骤主要包括:
1.计算Query(Q)、Key(K)和Value(V):将输入序列的每个Token(即词法单元)分别映射到三个不同的向量空间,得到Query、Key和Value。这个映射通过矩阵相乘操作实现,分别使用不同的权重矩阵W_Q, W_K, 和W_V。
Q = X * W_Q
K = X * W_K
V = X * W_V
其中,X是输入序列,W_Q、W_K 和 W_V 分别是权重矩阵,其中,Q表示查询向量空间,K表示键空间,V表示值空间。
2.计算注意力权重:计算Query和Key之间的点积,然后除以缩放因子(Key向量的维度的平方根),最后应用softmax函数将结果归一化到0-1之间。
注意力权重 = softmax(Q * K^T / sqrt(d_k))
其中,d_k 是Key向量的维度。
3.计算加权值:将注意力权重与Value相乘,得到加权值。
加权值 = 注意力权重 * V
4.输出:将加权值相加得到输出序列。
Output =∑{[softmax((X * W_Q) * (X * W_K)^T / sqrt(d_k))] * (X * W_V)}
微调主要步骤包括:第一阶段,模型在弱抽象关键词文本、规则组件模板间学习映射关系,本阶段输入文本抽象程度低,信息含量高,规则组件数量较规则模板多,更易于模型快速形成基本的规则理解能力;第二阶段,模型将规则生成能力迁移到用户完整的描述需求与规则模板上,具体通过使用较一阶段更小的学习率,需求文本、指令、关键词混合训练输入方式逐步形成直接从需求文本到最终模板的生成能力。
规则模板定义模块:本实施例中,在系统的上层采用可视化图形要素,构建了用户友好的业务模型、规则组件、表达式编辑器等的规则表示方法,底层采用通用数据格式(JSON、XML及YAML)存储规则模板,以便于后续解析和处理。规则模板包含了可配置的参数、变量和控制结构,满足了不同场景的需求。
可视化编辑器:本实施例中,设计基于Web端的可视化编辑器,允许用户通过拖放、属性面板等交互方式直观地创建和修改规则模板。编辑器支持撤销/重做、导入/导出、预览等功能,提高了用户体验。基于Web端的可视化编辑器具体包括:
1.菜单栏:包括文件、编辑、视图、帮助等常见的菜单项,提供基本功能操作,额外提供检索框,用于用户需求输入。
2.工具栏:提供常用操作的快捷方式,如新建、打开、保存、撤销、重做等。
3.规则组件库:包含一系列预定义的规则组件,如条件、动作、循环等,供用户对生成的模板进行二次修改编辑,可以通过拖拽或其他方式将组件添加到编辑区域。
4.编辑区域:用于展示和编辑规则模板的可视化结构。用户可以在此区域进行组件的添加、删除、修改等操作。
5.属性面板:用户在编辑区域右击所选项后,展示和编辑所选组件的属性,如条件表达式、动作参数等。
6.信息面板:用于展示编辑器的状态信息,如操作提示、错误信息等。
其工作流程主要包括:
1.初始化编辑器:载入组件库,初始化模板生成模型,设置编辑区域大小,创建菜单栏和工具栏等。
2.用户操作:用户输入需求,生成模板,用户可二次修改模板,通过拖拽、点击等操作在编辑区域添加、删除、修改模板内组件。
3.实时更新:编辑器根据用户操作实时更新编辑区域的可视化结构,同时更新属性面板和信息面板的内容。
4.数据绑定:编辑器将用户操作同步到内部规则模板的配置文件,确保数据的一致性。
5.数据导入导出:编辑器支持将可视化规则模板导出为配置文件,或从配置文件导入可视化规则模板。
6.撤销重做:编辑器实现操作历史记录,支持用户撤销和重做操作。
7.预览与发布:编辑器允许用户预览规则模板的运行效果,并支持将模板发布到指定目标系统。
动态配置管理:本发明实现了与现有信息控制系统的集成,通过API、文件监听器等方式实现规则模板和配置文件的动态加载和更新。这可以确保信息控制系统在运行时根据最新的配置文件执行相应的操作。具体实现技术包括:
1.前后端分离:在前端(基于Web的可视化编辑器)和后端(规则模板解析引擎模块、各业务执行模块)之间建立一个清晰的API接口,规则模板和配置文件存储在后端的文件系统或数据库中(具体存储位置可以基于系统设计需要调整),前端通过API请求数据;前端可以理解为用户使用端等,这是本领域技术人员所熟知的,本实施例中,前端例如可以是用户使用的可视化编辑器(例如基于Web实现的可视化编辑器等),后端可以理解为本方案中执行各个核心数据处理的后端功能模块,这也是本领域技术人员所熟知的表述方式,在本实施例中,后端可以指规则模板解析引擎模块及(除可视化编辑器之外的)各业务执行模块。当需要加载或更新规则模板和配置文件时,前端可以发送相应的请求到后端,后端处理后返回相关的规则模板数据和/或配置文件数据。这样可以确保前后端的职责分离,方便维护和扩展。
2.实时通信:可以使用WebSocket或其他实时通信技术在前端和后端之间建立持久连接。当后端检测到规则模板或配置文件有更新时,可以主动推送数据到前端。前端接收到数据后,可以实时更新界面,提高用户体验。
3.数据绑定和监听:在前端,可以使用数据绑定框架(如Vue.js、React等)将规则模板和配置文件与界面元素关联起来。当数据发生变化时,界面元素会自动更新。通过监听数据变化,可以实现规则模板和配置文件的动态加载和更新。
4.版本控制:将规则模板和配置文件存储在版本控制系统(如Git、SVN等)中,当需要更新时,可以通过版本控制系统进行同步。这样可以确保规则模板和配置文件的一致性,同时方便回滚和追踪历史变更。
5.缓存和存储:为了提高性能,在前端和后端使用缓存和存储技术(如浏览器缓存、Redis等)存储规则模板和配置文件相关的数据。当需要加载或更新数据时,可以优先从缓存和存储中获取,例如,可以在前端设置缓存,在后端设置存储器,可以在数据更新时,更新后数据在后端存储器中存储,并在前端的缓存中预存储更新数据,在需要更新时,优先从前端缓存中获取更新数据,降低网络延迟和服务器压力。
6.事件驱动:在前端,可以使用事件驱动方式监听规则模板和配置文件的加载和更新事件。当事件触发时,可以执行相应的处理逻辑,如请求数据、更新界面等。这样可以提高代码的可读性和可维护性。
本发明的对话式检索规则模板技术可广泛应用于工业、交通、安防、军事等领域的信息控制系统,降低用户的技术门槛,提高系统的灵活性和易用性。
以下结合图1所示,对本方案进一步展开进行阐述。
第一方面:本方案包括规则模板定义模块,该模块进一步包含以下部分:
业务模型单元:业务模型是业务模块在可视化模板中的抽象表示,为确保模板规则形成正确可靠的数据处理流,规则模板定义需要执行业务模型的定义,包括实体、属性、关系、数据类型、使用条件等,以便规则模板解析能够正确实现。在一个优选的实施方式中,业务模型工具由以下部分组成:
1.实体管理器:用于创建、编辑和删除实体。实体是业务模型中的核心概念,代表业务系统中的一个对象,如订单、客户等。
2.属性管理器:用于创建、编辑和删除实体的属性。属性代表实体的特征,如涉及的订单金额数据、客户的姓名等。
3.数据类型管理器:用于定义属性的数据类型。数据类型可以是简单类型(如字符串、数字等)或复杂类型(如列表、字典等)。
4.关系管理器:用于创建、编辑和删除实体之间的关系。关系表示实体之间的联系,如订单与客户的关联等。
5.使用条件管理器:用于设置业务规则的使用条件,如根据订单金额判断所属的交易级别,以及可配置的实际交易金额值等。
处理流程包括:
1.创建实体:用户在可视化编辑器中创建一个新实体,工具将实体信息添加到实体管理器中,并为实体生成唯一标识符。
2.定义属性:为实体添加属性,工具将属性信息添加到属性管理器中,并为属性生成唯一标识符。同时,用户需要选择属性的数据类型,工具会根据数据类型生成相应的输入框、下拉列表等界面元素。
3.创建关系:用户定义实体之间的关系,如一对一、一对多等。工具将关系信息添加到关系管理器中,并为关系生成唯一标识符。
4.设置使用条件:为业务规则设置使用条件,如基于属性值的比较、逻辑运算等。工具将条件信息添加到使用条件管理器中,并生成相应的条件表达式。
5.自动生成实体和属性:工具可以根据已有的数据源(如数据库表、API响应等)自动创建实体和属性。这需要通过编写适配器来解析数据源的结构信息,然后将解析结果映射到业务模型的实体和属性。
规则组件单元:规则模板包含一系列可重用的规则组件:条件、操作、触发器和连接器等。通过对这些组件拖拽和组合来定义规则,规则组建包含可配置超参数,如阈值、时间间隔和权重等,用户可根据实际需求调整规则的行为。单个规则组件构建:采用面向对象的设计方法进行构建。首先,定义一个基础的规则组件类,包含一些通用的属性和方法。然后,针对不同类型的规则组件(如条件、操作、触发器和连接器等),分别创建子类并继承基础规则组件类。
规则组件库构建:
1.组件注册表(Component Registry):用于维护规则组件的类型信息和实例化方法。当用户需要创建一个新的组件时,可以从注册表中查找对应的类型信息和实例化方法。
2.组件存储(Component Storage):用于存储规则组件的实例。这可以是一个内存数据结构(如字典或列表等),也可以是一个持久化存储(如数据库或文件系统等)。
3.组件工厂(Component Factory):用于根据用户的需求和配置参数创建规则组件实例。工厂可以从组件注册表中获取组件类型信息和实例化方法,然后根据配置参数创建组件实例并添加到组件存储中。
规则组件调用:
1.用户在可视化编辑器中选择一个规则组件类型,并配置相关参数。
2.编辑器将组件类型和配置参数发送给后端服务。
3.后端服务根据组件类型和配置参数,通过组件工厂创建一个组件实例。
4.组件工厂从组件注册表中获取组件类型信息和实例化方法,然后根据配置参数创建组件实例。
5.组件实例被添加到组件存储中,并与其他组件进行组合,形成一个完整的规则执行流。
6.当触发条件满足时,触发器类监听到相应的事件并开始执行规则。
7.触发器根据连接器类的定义,将输入数据传递给条件类进行判断。
8.条件类根据输入数据和条件表达式,计算条件结果。
9.若条件结果为真,触发器将数据传递给操作类。
10.操作类根据配置参数执行相应的动作,如更新数据、发送通知等。
11.操作完成后,触发器继续监听后续事件,等待下一次触发。
表达式编辑器单元:对于常见规则以外的部分,用户可使用表达式编辑器自定义规则组件,以便定义复杂数学、逻辑和比较表达式型的规则组建。表达式编辑器使用友好的图形化界面,可零代码创建表达式。
表达式编辑器的具体结构和设计:
1.用户界面:在可视化编辑器中,点击表达式编辑器,额外提供一个图形化的拖拽式界面,用户可以方便地创建和修改表达式。界面包括组件库、画布和属性面板等部分。
2.组件库:组件库包含多种可用于表达式的基本组件,如常量、变量、运算符、函数等。用户可以根据需要将组件拖拽到画布上组合成表达式。
3.画布:画布是用户组合表达式的工作区域。在画布上,用户可以连接组件并调整其顺序和层级关系,以形成所需的表达式。
4.属性面板:属性面板用于显示和编辑选中组件的属性,如常量的值、变量的名称、运算符的类型等。
运行流程:
1.用户在组件库中选择所需组件并拖拽至画布上。
2.用户在画布上连接组件,形成表达式。连接可以表示数据流或函数调用关系。
3.用户选中组件后,在属性面板中修改组件的属性。
4.当表达式完成后,编辑器将表达式序列化为可执行的代码或数据结构。
5.规则引擎在运行时根据序列化后的表达式执行相应的计算。
核心算法:
1.表达式构建:通过拖拽和连接组件在画布上形成表达式树。
2.表达式优化:对表达式树进行优化,如合并相邻的常量、消除冗余计算等。
3.表达式序列化:将表达式树序列化为可执行的代码或数据结构,如抽象语法树(AST)。
4.表达式求值:在运行时根据序列化后的表达式计算结果。求值过程可以采用递归遍历、堆栈求值等算法。
第二方面,本方案还包括对话式的模板检索与生成模块,该模块采用了针对预训练语言模型在小规模规则模板上快速学习的多层级微调方法,包括:
1. 选择预训练语言模型
根据部署设施及算力选择一个生成式预训练的深度学习语言模型(BERT、T5、LLaMa等),这些模型已通过大量文本数据上进行了预训练,能够捕捉自然语言中的语法和语义信息。
模型基于硬件算力选择,具体见可分为:
几十至几百个GPU:小型模型(如BERT-Base,GPT-2),具有1亿至3亿参数,训练时间数周。
数百至数千个GPU:中型模型(如BERT-Large,GPT-3中等规模的子模型),具有数亿至数十亿参数,训练时间数月。
数千个GPU:大型模型(如GPT-3,Megatron-LM),数百亿参数,训练时间数月至一年。
数万个GPU:超大型模型(如GPT-4,Switch Transformer),数万亿参数。训练时间一年以上。
2.规则微调
针对大规模预训练语言模型大参数量与规则模板库小样本量不匹配的问题,我们设计了由组件级微调过渡至模板级微调的训练方法使模型形成初步的关键词-规则模板生成能力:
(1)模板组件配置文件-关键词对抽取,选择典型模板组件及其配置代码,标注相关规则关键词,形成组件级微调样本库,样本库数量级记为N1。该部分中,以关键词为输入,标签为模板组件配置文件。具体步骤包括;
a.选择组件:在规则模板库中,根据实际业务需求和场景,选取具有代表性的组件,这些组件需涵盖所有关键词和操作。组件的选取可以基于频次、业务价值和覆盖度等因素综合考虑。
b.选出对应的配置代码:对于选定的组件,从模板库中提取其对应的配置代码。配置代码应包含组件的类型、参数设置和逻辑关系等信息,以便模型能够根据关键词生成相应的组件配置。
c.形成微样本库:组件级微样本库和模板级微样本库都使用JSON存储,在后端服务器使用文件系统或数据库存储。
(2)关键词-组件配置文件微调训练:以预训练模型10%的学习率进行小样本训练,学习率记为L1,使模型形成关键词到组件间的匹配生成能力。
优选的,训练参数设置如下:
样本数量:N1(N1远小于预训练样本量)
学习率:L1(例如,L1 = 0.1 * 预训练学习率)
(3)模板配置文件-关键词对抽取,选择典型模板及其模板配置代码,标注相关规则关键词,形成模板级微调样本库,样本库数量级记为N2,N2~=0.1N1。该部分中,输入为关键词,标签为模板配置文件。模板级微调样本库:
a.数据存储:微样本库可以使用文件存储或数据库存储。文件存储可以选择使用本地文件系统或云存储服务,将每个样本以文件的形式保存。数据库存储可以使用关系型数据库(如MySQL、PostgreSQL等)或非关系型数据库(如MongoDB、Cassandra等),将每个样本以记录的形式保存。
b.数据格式:使用JSON格式。
c.与组件级样本库区别:从组件级上升到模板级,样本库中单个输入样本类型从仅关键词变为检索文本或关键词或指令,单个标签样本扩展为整个模板配置文件。
(4)关键词-模板配置文件微调训练:其学习率记为L2,L2~=0.1L1,进行进一步微调训练,使模型形成关键词到模板间的匹配生成能力。
优选的,训练参数设置如下:样本数量级:N2(N2 ≈ 0.1N1);
学习率:L2(例如,L2 ≈ 0.1L1)。
3.检索微调
在预训练语言模型经过形成基本的关键词-规则模板生成能力后,需要进一步提高由检索文本到规则的生成能力,我们设计了混合提示微调训练方法,具体包括:
(1)构建检索文本、关键词、指令混合样本与同一规则标签的训练集。该步骤中,输入为检索文本、关键词、指令混合样本,以同一个模板配置文件为规则标签,输入文本文件和标签分别存在输入、标签文件夹,用同一组训练样本的文件用相同数字命名,文本文件用txt存储,规则标签保持JSON格式。
(2)执行由三者随机抽取到全部抽取检索文本的训练方式。训练参数设置如下:
样本数量级:N3,N3应明显大于设计组件级和模板级微调环节(例如,N3 ≈ 10 *N1);
学习率:L3(例如,L3 ≈ L2);
样本混合权重:设置检索文本、关键词、指令三者训练权重,具体设置方式为在损失函数中,新增三者样本权重系数,检索文本权重设置为1,指令和关键词权重设置为1-当前迭代次数/总迭代次数。
训练过程:
将所有数据的2/3划分为训练集,1/3划分为验证集,以便在训练过程中监控模型性能。
使用训练集对预训练语言模型进行微调,输入为检索文本、关键词和指令混合样本,标签为模板配置文件。
在每个训练批次中,从训练集中随机抽取样本训练。
评估模型性能,记录训练中各次验证输出的性能指标(如准确率、F1分数等)。
在达到既定训练轮数或满足其他停止条件(如性能收敛)时,停止训练并保存模型。
4.结果生成:
在进行完以上各类微调训练后,模型逐步形成了从需求级别的检索文本到最终规则的生成能力,结合规则模板解析引擎,实现由规则配置文件到可视化规则模板的进一步映射。
该部分中,将生成的规则输出到规则模板解析引擎模块,映射到可视化规则模板。映射即为模板解析的逆过程,将最终模板返回给用户,以便用户进行二次编辑或直接使用。同时,进一步优选的,还可以提供反馈机制,让用户对检索结果进行评价,以便对检索方法进行持续优化。
映射流程:
1.配置文件:解析生成的规则配置文件,提取其中的组件类型、属性和参数等信息,使用JSON解析库将其解析为对象。
2.构建组件实例:根据解析出的组件类型、属性和参数信息,创建对应的可视化组件实例。例如,如果配置文件中有一个条件组件,可以在可视化界面上创建一个条件组件,并设置其属性和参数。
3.设置组件关系:解析配置文件中的组件关系(例如连接器或触发器),并在可视化界面上设置相应的组件关系。例如,如果配置文件中有一个连接器将两个条件组件连接起来,可以在可视化界面上将这两个条件组件连接起来。
4.生成可视化模板:将创建的组件实例和设置的组件关系整合到一个可视化规则模板中,供用户二次修改或直接使用。
用户评价优化机制:规则组件的错误通过使用正确样本进行二次训练,模板与用户需求关联性差可通过优化训练输入文本和增加相关的模板微调训练实现。
第三方面,本方案还包括可视化编辑器,具体包含以下部分:
图形化界面:可视化编辑器使用图形化界面,便于用户轻松创建和修改规则。具体使用一系列预定义的图形元素,代表规则模板定义部分的业务模型、规则组件和表达式编辑器。同时图形化界面支持点击、拖拽、放置和快捷键操作,利用菜单面板调用规则模板引擎实现预览、验证、撤销、重做、导入导出规则模板等功能。
帮助支持文档:编辑器提供帮助支持文档,包含可视化编辑器的各种功能及问题反馈。
第四方面,本方案还包括规则模板解析引擎模块,结合图2所示,具体包含以下部分:
词法分析器:词法分析器的输入可以是模板规则的配置文件,也可以是输入的规则模板,词法分析器负责将输入的规则模板文本或规则模板配置文件解析为一系列词法单元(tokens)。使用有限自动机(Finite Automata)实现。词法分析器包括输入缓冲区、状态转换表、输出缓冲区和动作表。输入缓冲区用于存储待解析的模板文本,状态转换表用于表示有限自动机的状态转换关系,输出缓冲区用于存储解析生成的词法单元,动作表用于定义在词法单元生成时执行的动作。
语法分析:使用词法分析器将所有可视化图形元素解析成对应变量和逻辑名,解析规则模板语法结构,包括条件、操作、触发器、自定义规则等组件,验证总体规则是否存在语法错误。解析过程包括:将模板文本解析为词法单元序列、使用自上而下或自下而上的语法分析方法(如LL或LR分析)将词法单元序列解析为抽象语法树(AST)、遍历AST,解析和处理实体参数、属性、组件关系等信息,生成中间表示(IR)、将IR转换为可执行配置文件。验证方法:包括静态验证和动态验证。静态验证主要检查规则模板的语法和语义正确性,如数据类型检查、变量使用检查等。动态验证通过执行编译后的可执行配置文件,验证规则在实际运行时是否符合预期。动态验证可以使用单元测试、集成测试等方法进行。
语义解析:将模板中的条件、组件和连接器等映射到对应实体。执行数据类型检查,解析模板中实体参数和属性并使用实体内部表示和转换方法进行规则替换,将规则内容转换为可执行的对象,最后生成可执行配置文件。语义解析具体步骤:
1.映射模板中的元素到实体:遍历模板中的条件、组件和连接器等元素,根据它们的类型和属性,映射到相应的实体对象。这可以通过查找预先定义的实体类映射表来实现,将模板元素的类型和属性与实体类进行匹配。
2.数据类型检查:对于每个实体对象(即可视化组件实例),需要检查其参数和属性的数据类型是否与预期的类型一致。通过逐个比较实体对象的参数和属性与预定义的类型进行实现,具体使用类型推导算法(如Hindley-Milner类型推导算法)检查数据类型的一致性和正确性。
3.解析实体参数和属性:根据实体内部表示和转换方法,解析实体参数和属性。这可以通过在实体类中定义解析方法来实现,解析方法会读取实体参数和属性,并将其转换为内部表示。
4.规则替换:将解析后的实体参数和属性应用于规则内容,完成规则替换。这可以通过遍历规则内容中涉及实体参数和属性的部分,并用实体内部表示替换这些部分来实现。
5.生成可执行配置文件:将规则内容转换为可执行的对象,并生成可执行配置文件,从而生成一个可视化规则模板。这可以通过将规则内容编码为特定格式(如JSON、XML等)来实现,该格式可以被规则引擎解析和执行。
规则验证与错误处理:调用可执行配置文件进行编译执行测试,向可视化编辑器返回测试结果及可能的错误信息。编译执行测试步骤:
1.将生成的可执行配置文件编译为可执行程序或脚本。
2.为测试用例准备输入数据和预期输出数据。
3.执行可执行程序或脚本,并将实际输出与预期输出进行比较。
4.如果输出不符合预期,则记录错误信息,返回给可视化编辑器;否则,认为测试成功。
规则优化:对测试成功的配置文件及编译后的可执行文件执行规则优化,包括删除冗余组件、合并相同条件等,提高规则执行效率。规则优化方法步骤:
1.遍历AST,找到可能存在冗余的组件节点。冗余组件通常表现为不会影响规则逻辑执行的节点,例如没有任何输出端口被连接的条件组件、无用的数据转换等。识别相同组件:遍历AST,找到具有相同表达式和参数的条件组件。对于每对相同条件,将它们标记为可合并,并记录它们在AST中的位置。
2.对于冗余组件,检查其是否对规则逻辑产生实际影响(未执行节点、调整输出不影响结果的节点等)。如果没有影响,将其从AST中删除。
3.对于相同组件:遍历所有标记为可合并的条件组件,对于每一对,将其中一个条件组件删除,并将另一个条件组件保留作为合并后的条件。同时,记录保留的条件组件在AST中的位置。对于合并后的条件组件,需要重新调整与之相连的逻辑关系:遍历已删除条件组件的输入端口,将所有与其相连的组件连接到保留条件组件的对应输入端口;遍历已删除条件组件的输出端口,将所有与其相连的组件连接到保留条件组件的对应输出端口。
4.对优化后的AST重新生成可执行配置文件,形成优化后的可视化规则模板。
规则存储:对测试成功的可视化规则模板,导入规则模板库并执行模板检索与问答系统微调训练,便于后续用户在此规则模板上优化迭代。
此外,本发明的方案还可以通过设备的方式来实现,即设置为一种电子设备。该设备包含服务器、前端用户交互设备;所述服务器被配置为可以与所述前端用户交互设备进行数据交互,并装载有如上述实施例所述的基于对话检索生成模板的配置。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本方案的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本方案的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如,本方案中的方法实施方式可以被实现为软件程序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中,软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之一。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体实现在任何可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.基于对话检索生成模板的配置系统,其特征在于,所述系统包括:
检索查询规则模板模块,用于初次使用用户获取规则模板,该模块基于注意力机制的语言模型;所述检索查询规则模板模块对所述语言模型进行微调:首先,所述语言模型在关键词文本、规则组件模板间学习并建立映射关系;其次,模型将映射关系迁移到用户的需求描述与规则模板之间;
规则模板定义模块,用于设置规则模板并存储规则模板;所述规则模板包含配置参数、变量、控制结构数据;
可视化编辑器,用于用户对规则模板进行创建或修改,所述可视化编辑器基于Web端实现;
动态配置管理模块,用于规则模板与配置文件的动态加载和更新;所述配置文件至少包含配置参数;
模板检索与生成模块,基于预训练语言模型结合微调方法,实现规则模板的检索,并基于检索的规则模板获得生成规则;
规则模板解析引擎模块,接收所述生成规则,并将生成规则映射到可视化规则模板;
所述检索查询规则模板模块中,注意力机制设置如下:
将输入的每个词法单元的特征X通过权重矩阵分别映射到三个向量空间Q、K、V,其中,Q表示查询向量空间,K表示键空间,V表示值空间;
计算注意力权重:softmax(Q·K^T / sqrt(d_k)),其中,d_k 表示K向量的维度,sqrt()表示平方根,softmax表示归一化函数;
将注意力权重与V相乘,得到加权值;
将各个加权值的和,作为输出。
2.根据权利要求1所述的系统,其特征在于,所述可视化编辑器数据执行流程为:
初始化编辑器,接收用户输入;
基于用户输入实时更新编辑区域;
将用户操作同步到规则模板的配置文件,完成数据绑定。
3.根据权利要求1所述的系统,其特征在于,所述动态配置管理模块在可视化编辑器和后端之间建立API接口,规则模板和配置文件存储在后端;可视化编辑器通过API接口发送加载或更新请求到后端,后端处理请求后,通过API接口发送加载或更新的规则模板和/或配置文件数据;所述后端指本系统中除可视化编辑器之外的其他模块;
所述可视化编辑器和后端之间建立持久通信,并在后端检测到规则模板和/或配置文件有更新时,通过API接口向可视化编辑器主动推送更新数据;
当规则模板和/或配置文件发生变化时,监听该变化,并更新规则模板和/或配置文件关联的界面元素。
4.根据权利要求1所述的系统,其特征在于,所述规则模板定义模块进一步包括:业务模型单元、规则组件单元、表达式编辑器单元;
所述业务模型单元用于规范规则模板的各项定义,所述各项定义包括实体、属性、关系、数据类型、使用条件;
所述规则组件单元用于形成可重用的规则组件,所述规则组件包括条件、操作、触发器、连接器、可配置超参数;所述规则组件构成规则组件库;
所述表达式编辑器单元,用于自定义数学、逻辑或比较表达式型规则组件。
5.根据权利要求1所述的系统,其特征在于,所述模板检索与生成模块的微调方法包括:
规则微调,建立由组件级微调过渡至模板级微调的训练方法,并形成关键词-规则模板生成能力;
检索微调,通过混合提示微调方式,形成检索文本-规则生成能力。
6.根据权利要求5所述的系统,其特征在于,所述规则微调的方式为:
步骤101、进行模板组件配置文件-关键词对抽取,包括:在规则模板库选择组件,所述组件涵盖全部关键词和操作;对于选定的所述组件,在规则模板库中提取其对应的配置代码,所述配置代码包括组件的类型、参数设置、逻辑关系;将选定的所述组件形成组件微样本库;
步骤102、对模板组件配置文件-关键词微调训练;
步骤103、进行模板配置文件-关键词对抽取,包括:获取典型模板及模板配置代码,标注与典型模板关联的关键词,并进行关键词-模板配置文件微调训练;
模板组件配置文件-关键词微调训练样本数量N1与关键词-模板配置文件微调训练样本数量N2之间满足:
N2 ≈ 0.1N1。
7.根据权利要求5所述的系统,其特征在于,所述混合提示微调方式为:
步骤201、建立检索文本、关键词、指令混合样本与同一模板配置文件的训练集,其中,以检索文本、关键词、指令混合样本为输入,以模板配置文件为输出;
步骤202、训练方式采用由检索文本、关键词、指令随机抽取,到全部抽取的方式;
训练中,检索文本、关键词、指令的混合权重更新方式为:将检索文本权重设置为1,关键词和指令权重设置为:1-当前迭代次数/总迭代次数。
8.根据权利要求1所述的系统,其特征在于,所述规则模板解析引擎模块包含词法分析单元、语法分析单元、语义解析单元;
所述词法分析单元,用于将生成规则的配置文件解析为一系列词法单元;
所述语法分析单元,用于将词法单元序列解析为抽象语法树,并遍历抽象语法树,形成可执行配置文件;
所述语义解析单元,用于将可执行配置文件映射到可视化组件实例,并解析可视化组件实例参数和属性,以及执行数据类型检查。
9.基于对话检索生成模板的配置设备,其特征在于,所述设备包含服务器、前端用户交互设备;所述服务器被配置为可以与所述前端用户交互设备进行数据交互,并装载有如权利要求1-8任一所述的基于对话检索生成模板的配置系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311704059.4A CN117389541B (zh) | 2023-12-13 | 2023-12-13 | 基于对话检索生成模板的配置系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311704059.4A CN117389541B (zh) | 2023-12-13 | 2023-12-13 | 基于对话检索生成模板的配置系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117389541A CN117389541A (zh) | 2024-01-12 |
CN117389541B true CN117389541B (zh) | 2024-02-23 |
Family
ID=89465314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311704059.4A Active CN117389541B (zh) | 2023-12-13 | 2023-12-13 | 基于对话检索生成模板的配置系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117389541B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118012494B (zh) * | 2024-04-03 | 2024-07-02 | 青岛鼎信通讯股份有限公司 | 嵌入式软件配置管理、复用系统及方法 |
CN118012413B (zh) * | 2024-04-09 | 2024-06-11 | 西安衍舆航天科技有限公司 | 基于图形化的卫星遥控作业脚本编辑方法及系统 |
CN118467549B (zh) * | 2024-07-12 | 2024-10-11 | 中国人民解放军国防科技大学 | 一种基于数据模型的可视化数据引接方法和装置 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6473896B1 (en) * | 1998-10-13 | 2002-10-29 | Parasoft, Corp. | Method and system for graphically generating user-defined rules for checking language quality |
WO2008095787A1 (en) * | 2007-02-09 | 2008-08-14 | Nokia Corporation | Template-based rule generation |
CN106126221A (zh) * | 2016-06-21 | 2016-11-16 | 浪潮电子信息产业股份有限公司 | 一种表单生成方法、装置和系统 |
CN108984679A (zh) * | 2018-06-29 | 2018-12-11 | 北京百度网讯科技有限公司 | 对话生成模型的训练方法和装置 |
CN109669678A (zh) * | 2018-10-25 | 2019-04-23 | 平安科技(深圳)有限公司 | 模板引擎整合方法、装置、电子设备及存储介质 |
CN110333856A (zh) * | 2019-07-08 | 2019-10-15 | 政采云有限公司 | 服务化可编排的在线模板生成系统及方法 |
CN111078846A (zh) * | 2019-11-25 | 2020-04-28 | 青牛智胜(深圳)科技有限公司 | 一种基于业务场景的多轮对话体系构建方法及系统 |
CN111176650A (zh) * | 2018-11-09 | 2020-05-19 | 阿里巴巴集团控股有限公司 | 解析器生成方法、检索方法、服务器及存储介质 |
WO2021243706A1 (zh) * | 2020-06-05 | 2021-12-09 | 中山大学 | 一种跨语言生成提问的方法和装置 |
CN114780587A (zh) * | 2022-03-28 | 2022-07-22 | 科大国创云网科技有限公司 | 基于droos规则引擎实现调度规则可视化配置动态部署的方法 |
CN116048610A (zh) * | 2022-12-30 | 2023-05-02 | 浙江工业大学 | 一种流程驱动的对话系统实现方法及基于工作流引擎对话机器人 |
CN116450787A (zh) * | 2023-03-27 | 2023-07-18 | 浙江大学 | 一种基于多模态知识增强的生成式对话方法和系统 |
CN117032668A (zh) * | 2023-08-08 | 2023-11-10 | 中国联合网络通信集团有限公司 | 可视化规则引擎的处理方法、装置、系统及平台 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7302383B2 (en) * | 2002-09-12 | 2007-11-27 | Luis Calixto Valles | Apparatus and methods for developing conversational applications |
US10379844B2 (en) * | 2017-03-29 | 2019-08-13 | Ca, Inc. | Validating user interface templates for software probe configuration |
US10860298B2 (en) * | 2018-03-21 | 2020-12-08 | Dspace Digital Signal Processing And Control Engineering Gmbh | Method and system for editing a block diagram model |
-
2023
- 2023-12-13 CN CN202311704059.4A patent/CN117389541B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6473896B1 (en) * | 1998-10-13 | 2002-10-29 | Parasoft, Corp. | Method and system for graphically generating user-defined rules for checking language quality |
WO2008095787A1 (en) * | 2007-02-09 | 2008-08-14 | Nokia Corporation | Template-based rule generation |
CN106126221A (zh) * | 2016-06-21 | 2016-11-16 | 浪潮电子信息产业股份有限公司 | 一种表单生成方法、装置和系统 |
CN108984679A (zh) * | 2018-06-29 | 2018-12-11 | 北京百度网讯科技有限公司 | 对话生成模型的训练方法和装置 |
CN109669678A (zh) * | 2018-10-25 | 2019-04-23 | 平安科技(深圳)有限公司 | 模板引擎整合方法、装置、电子设备及存储介质 |
CN111176650A (zh) * | 2018-11-09 | 2020-05-19 | 阿里巴巴集团控股有限公司 | 解析器生成方法、检索方法、服务器及存储介质 |
CN110333856A (zh) * | 2019-07-08 | 2019-10-15 | 政采云有限公司 | 服务化可编排的在线模板生成系统及方法 |
CN111078846A (zh) * | 2019-11-25 | 2020-04-28 | 青牛智胜(深圳)科技有限公司 | 一种基于业务场景的多轮对话体系构建方法及系统 |
WO2021243706A1 (zh) * | 2020-06-05 | 2021-12-09 | 中山大学 | 一种跨语言生成提问的方法和装置 |
CN114780587A (zh) * | 2022-03-28 | 2022-07-22 | 科大国创云网科技有限公司 | 基于droos规则引擎实现调度规则可视化配置动态部署的方法 |
CN116048610A (zh) * | 2022-12-30 | 2023-05-02 | 浙江工业大学 | 一种流程驱动的对话系统实现方法及基于工作流引擎对话机器人 |
CN116450787A (zh) * | 2023-03-27 | 2023-07-18 | 浙江大学 | 一种基于多模态知识增强的生成式对话方法和系统 |
CN117032668A (zh) * | 2023-08-08 | 2023-11-10 | 中国联合网络通信集团有限公司 | 可视化规则引擎的处理方法、装置、系统及平台 |
Non-Patent Citations (1)
Title |
---|
基于模板匹配的搜索引擎粗糙集特征检索;王学军;《物联网技术》;20230928;第第13卷卷(第第9期期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117389541A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117389541B (zh) | 基于对话检索生成模板的配置系统及设备 | |
CN112199086B (zh) | 自动编程控制系统、方法、装置、电子设备及存储介质 | |
US20060242180A1 (en) | Extracting data from semi-structured text documents | |
EP2557499A1 (en) | A system and method for automatic impact variable analysis and field expansion in mainframe systems | |
CN110502227A (zh) | 代码补全的方法及装置、存储介质、电子设备 | |
US11301643B2 (en) | String extraction and translation service | |
US11763095B2 (en) | Creating apps from natural language descriptions | |
CN115964273A (zh) | 基于深度学习的航天器测试脚本自动生成方法 | |
Kessentini et al. | Automated metamodel/model co-evolution using a multi-objective optimization approach | |
US7958073B2 (en) | Software and methods for task method knowledge hierarchies | |
JP2022019524A (ja) | モデリングパラメータの設定方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム | |
CN106484389B (zh) | 动作流分段管理 | |
Batot et al. | Heuristic-based recommendation for metamodel—ocl coevolution | |
CN116438493A (zh) | 工业自动化系统中的数据提取 | |
Jones et al. | Case studies in systematic software development | |
CN108932225B (zh) | 用于将自然语言需求转换成为语义建模语言语句的方法和系统 | |
CN115469860B (zh) | 基于指令集的需求到软件领域模型的自动生成方法及系统 | |
WO2024049796A1 (en) | Systems and methods for legacy mbse diagram data importation using element specific ml models and schema templates | |
CN117940890A (zh) | 协作式工业集成开发和执行环境 | |
CN114676155A (zh) | 代码提示信息的确定方法、数据集的确定方法及电子设备 | |
Fill | Semantic evaluation of business processes using SeMFIS | |
Ouared et al. | Deep variability modeling to enhance reproducibility of database performance testing | |
US12118338B1 (en) | Facilitating updates to data pipelines using modularly-generated platform- agnostic data pipeline portions systems and methods | |
Zhou et al. | MiniDB: A Teaching Oriented Lightweight Database | |
Naik | Artificial Intelligence and Large Language Models in CAD |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |