CN117033431A - 工单处理方法、装置、电子设备和介质 - Google Patents
工单处理方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN117033431A CN117033431A CN202310838988.8A CN202310838988A CN117033431A CN 117033431 A CN117033431 A CN 117033431A CN 202310838988 A CN202310838988 A CN 202310838988A CN 117033431 A CN117033431 A CN 117033431A
- Authority
- CN
- China
- Prior art keywords
- information
- work order
- data table
- data
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 48
- 230000004044 response Effects 0.000 claims abstract description 6
- 238000013515 script Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000013145 classification model Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供了一种工单处理用户的方法、装置、电子设备和介质,可以应用于大数据技术领域和信息技术领域。所述方法包括:获取待处理工单,抽取待处理工单中的感兴趣信息,将抽取出的待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,预先构建的知识库包括数据库中的汇总数据表及其字段信息、基础数据表及其字段信息以及每一个汇总数据表和基础数据表中的基础数据表之间的关联关系,最后输出匹配结果。通过自动归纳总结数据的加工逻辑并汇集数据关系知识,并建立相应的数据知识库,同时基于知识库设置对感兴趣信息与汇总数据信息的匹配,完成大数据工单的自动应答,释放了大数据支持人员的效能,加快工单流转和闭环效率。
Description
技术领域
本发明涉及大数据技术领域和信息技术领域,更具体地涉及一种工单处理的方法、装置、电子设备和介质。
背景技术
数字经济时代,如何将数据要素转化为数据资产,进而运用数据资产驱动业务创新发展,已成为银行数字化转型的重要探索方向。多源数据的一站式入湖,解决了数据共享问题,而数据仓库通过一定规则的聚合将数据聚集起来,构建主题模型,模型里存放对应主题的聚合表方便分析师以及非分析师能够进行快捷查询,给分行业务人员和数据分析师带来了极大的便利。
数据仓库虽然建立了多表之间的映射关系,但汇总表和基础表之间的加工逻辑仅被各应用开发人员和数据仓库运维开发人员所知悉,并且汇总表的数据可能来源于多个应用,从而形成知识孤岛。在实际业务场景中,业务人员在了解汇总表的基础上,需要结合数据来源的基础表进行定制加工。现阶段,业务人员如需了解汇总表和基础表的加工逻辑以及字段信息,需发大数据邮箱通过提交工单的方式获取支持人员的帮助,支持人员需要联系各应用开发人员了解加工逻辑,并把相关信息同步给业务人员,完成工单闭环,这给支持人员和业务人员带来了巨大的负担和压力。
目前大多数工单问题都是支持人员通过个人积累的经验或联系对应应用开发人员提供逻辑加工脚本的方式解答业务问题,并结合历史工单进行人工归纳总结,形成相关汇总表和基础表的加工逻辑作为知识维护在社区或其他共享媒介。这种方式虽然可以一定程度上解决知识孤岛的问题,但难以形成规模效应,人工维护知识库的成本过高,在实际业务工作中,对数据的需求是变化的,相关应用的建设也是变化的,如何高效建立关系知识形成知识库,并且在大数据支持工作中如何快速完成知识库检索并完成自动应答,是亟待解决的问题。
发明内容
鉴于上述问题,根据本发明的第一方面,本发明的实施例提供了一种工单处理用户的方法,所述方法包括:获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题;抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个;将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数;以及输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
根据一些示例性实施例,所述抽取所述待处理工单中的感兴趣信息包括:利用正则表达式抽取所述业务问题和所述问题描述中出现的数据表表名和/或字段名,作为所述感兴趣信息。
根据一些示例性实施例,所述将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配包括:在所述感兴趣信息包括数据表表名的情况下,将所述数据表表名与所述知识库中存储的M个汇总数据表的表名进行逐一匹配,获取与所述知识库中与所述数据表表名匹配的P个汇总数据表。
根据一些示例性实施例,所述将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配包括:在所述感兴趣信息包括数据表字段名的情况下,将所述数据表字段名与所述知识库中存储的M个汇总数据表的字段名进行逐一匹配,获取与所述知识库中与所述数据表字段名匹配的P个汇总数据表。
根据一些示例性实施例,预先构建所述知识库包括:获取目标脚本数据,其中,所述目标脚本数据包括与构建所述汇总数据表相关的脚本;对所述目标脚本数据进行语法分析,抽取汇总数据表的信息,其中,所述汇总数据表的信息包括所述汇总数据表的表名和字段名;对所述目标脚本数据进行语法分析,抽取汇总数据表和基础数据表之间的关联信息;以及根据抽取出的所述汇总数据表的信息和所述汇总数据表和基础数据表之间的关联信息,构建知识库。
根据一些示例性实施例,所述对所述目标脚本数据进行语法分析,抽取汇总数据表和基础数据表之间的关联信息包括:在所述目标脚本数据中检索插入操作;以及根据检索到的插入操作,抽取汇总数据表和基础数据表之间的关联信息。
根据一些示例性实施例,在抽取所述待处理工单中的感兴趣信息之前,所述方法还包括:利用预先训练的机器学习分类模型,对所述待处理工单进行分类;所述抽取所述待处理工单中的感兴趣信息包括:响应于所述待处理工单被分类至数据库工单类别,抽取所述待处理工单中的感兴趣信息。
根据本发明的第二方面,还提供一种工单处理用户的装置,所述装置包括:工单获取模块,用于获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题;信息抽取模块,用于抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个;匹配模块,用于将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数;以及输出模块,用于输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
根据本发明的第三方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的方法。
根据本发明的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
上述一个或多个实施例具有如下优点或有益效果:通过自动归纳总结数据的加工逻辑并汇集数据关系知识,并建立相应的数据知识库,同时基于知识库设置对感兴趣信息与汇总数据信息的匹配,完成大数据工单的自动应答,释放了大数据支持人员的效能,加快工单流转和闭环效率。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本发明实施例的工单处理用户方法、装置、电子设备、介质的应用场景图。
图2示意性示出了根据本发明实施例的工单处理用户的方法的流程图。
图3示意性示出了根据本发明实施例的将抽取出的待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配流程图。
图4示意性示出了根据本发明实施例的预先构建所述知识库的流程图。
图5示意性示出了根据本发明实施例的工单处理用户的装置的结构框图。
图6示意性示出了根据本发明实施例的适于实现工单处理用户方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本发明的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本发明实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本发明。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在本发明的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
首先,对本文中记载的技术术语作如下解释和说明。
工单:即工作单据,工单定义由一个和多个作业组成的简单维修或制造计划,上级部门下达任务,下级部门领受任务的依据。
脚本:是使用一种特定的描述性语言,依据一定的格式编写的可执行文件。
基于此,本发明的实施例提供一种工单处理方法的方法,所述方法包括:获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题;抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个;将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数;以及输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
在根据本发明实施例的方法中,通过自动归纳总结数据的加工逻辑并汇集数据关系知识,并建立相应的数据知识库,同时基于知识库设置对感兴趣信息与汇总数据信息的匹配,完成大数据工单的自动应答,释放了大数据支持人员的效能,加快工单流转和闭环效率。
需要说明的是,本发明确定的工单处理方法和装置可用于大数据技术领域和信息技术领域。
图1示意性示出了根据本发明实施例的工单处理的方法、装置、设备、介质的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本发明实施例所提供的工单处理的方法一般可以由服务器105执行。相应地,本发明实施例所提供的工单处理用户的装置一般可以设置于服务器105中。本发明实施例所提供的工单处理用户的方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本发明实施例所提供的工单处理用户的装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2~图6对本发明的实施例提供的工单处理用户的方法进行详细描述。
图2示意性示出了根据本发明实施例的工单处理用户的方法的流程图。
如图2所示,该实施例的工单处理用户的方法200可以包括操作S210~操作S240。
在操作S210,获取待处理工单,其中,待处理工单包括业务问题和对该业务问题的问题描述,业务问题包括与数据库中的汇总数据表相关的业务问题。
在本发明的实施例中,业务问题包括:资产业务、负债业务和中间业务中涉及的问题。其中,资产业务是指商业银行吸收资金运作并赚取利息收入或投资收益的活动,主要包括贷款业务、贴现业务、投资业务、同业拆出业务。例如,个人在银行办理的个人信用贷款就属于一种资产业务;负债业务是指商业银行凭借金融牌照合规借入拥有使用权的资金的行为,主要包括存款(储蓄)业务、同业拆入、发行债券业务,例如个人在银行办理的存款储蓄业务就属于一种负债业务;中间业务是指商业银行在表外,利用自身的网络、信息、信用或者牌照优势,为客户提供中介或代理的角色,通常实行有偿服务,主要包括担保、代理、顾问、收付款等业务,例如个人在银行办理的定期理财业务就属于一种中间业务。
在本发明的实施例中,对业务问题的描述是对所述待处理业务问题的具体信息描述,包括业务双方具体个人的姓名和/或身份证号、和/或单位的名称和/或编号、业务处理时间、业务问题编号等。例如,某人在银行办理取款业务,则对该业务的描述需要包括个人的姓名和身份证号,取款业务办理的时间和地点,所取款项的具体数额等信息。
在本发明的实施例中,数据库中预先集成了大量的基础层数据汇总的业务信息和处理逻辑,所述业务信息和处理逻辑是由各应用的开发人员、数据分析师等结合业务经验,关联数据库中各种表之间的数据总结而来,具有一定的专家规则。在本发明的实施例中,汇总数据表是基于数据库中汇总的业务信息和处理逻辑所制作而成。
在操作S220,抽取待处理工单中的感兴趣信息,其中,感兴趣信息包括数据表表名和数据表中的字段名中的至少一个。
在本发明的实施例中,例如,在数据库中存在数据表,表名为法人客户统一视图,该数据表中的字段名包括公司法人客户的姓名。现有待处理工单为某公司的负债业务工单,则其中的感兴趣信息包括公司法人客户的姓名等信息。
在操作S230,将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配。
在本发明的实施例中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数。
在操作S240,输出匹配结果。
在本发明的实施例中,所述匹配结果包括所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
在发明实施例中,首先通过分析数据仓库针对各应用基础数据进行汇总加工的脚本文件,建立汇总数据和基础数据之间的联系,形成关系知识库,克服加工脚本逻辑关系仅限开发人员所掌握的知识孤岛问题。其次基于实际业务生产过程中对数据汇总层和基础层的用数需求,在关系知识库的基础上,本发明提供一种自动匹配的方法,帮助业务人员快速关联数据基础层和加工层的处理逻辑,业务人员可以在此基础上进行逻辑加工,进一步发挥数据的价值,释放用数潜力。
返回操作S220,所述抽取所述待处理工单中的感兴趣信息包括利用正则表达式抽取所述业务问题和所述问题描述中出现的数据表表名和/或字段名,作为所述感兴趣信息。
在本发明的实施例中,正则表达式,又称规则表达式,是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。例如,利用正则表达式/\d{2}-\d{5}/验证由两位数字、一个连字符再加5位数字组成的ID号。
在本发明的实施例中,通过正则表达式抽取感兴趣信息能够有效准确地在庞杂的数据中快速地提取出所需要的信息,提高了工单处理的效率。
返回操作S230,图3示意性示出了根据本发明实施例的将抽取出的待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配流程图。包括操作S310和操作S320。
在操作S310,将数据表表名与所述知识库中存储的M个汇总数据表的表名进行逐一匹配。
在本发明的实施例中,在所述感兴趣信息包括数据表表名的情况下,将所述数据表表名与所述知识库中存储的M个汇总数据表的表名进行逐一匹配,获取与所述知识库中与所述数据表表名匹配的P个汇总数据表。例如,某待处理的工单为某公司的抵押贷款业务,在该工单问题中获取感兴趣信息为公司法人客户信息,该感兴趣信息包括数据库表名“法人客户信息表”,则从知识库中逐一匹配与该表名匹配的汇总表。
在操作S320,将数据表字段名与所述知识库中存储的M个汇总数据表的表名进行逐一匹配。
在本发明的实施例中,在所述感兴趣信息包括数据表字段名的情况下,将所述数据表字段名与所述知识库中存储的M个汇总数据表的字段名进行逐一匹配,获取与所述知识库中与所述数据表字段名匹配的P个汇总数据表。例如,某待处理的工单为某人的定期理财业务,在该工单问题中获取感兴趣信息为理财产品名称,该感兴趣信息包括数据库字段名“理财产品名称”,则从知识库中逐一匹配与该字段名匹配的汇总表。
在本发明的实施例中,通过将感兴趣信息中所包括的表名和字段名与知识库中数据表的表名和字段进行逐一匹配,在保证不会遗漏和感兴趣信息相关的知识库中的数据信息的基础上,保证了能够快速精确地匹配到所需数据信息。
图4示意性示出了根据本发明实施例的预先构建所述知识库的流程图。包括操作S410~操作S440。
在操作S410,获取目标脚本数据。
在本发明的实施例中,数据仓库中存储了大量的数据汇总脚本,这些脚本中包含大量的数据信息与处理逻辑这些处理逻辑是由各应用的开发人员、数据分析师等结合业务经验,关联数据湖中各种表之间的数据总结而来,具有一定的专家规则。在本发明的实施例中,所述目标脚本数据包括与构建所述汇总数据表相关的脚本。
在操作S420,对所述目标脚本数据进行语法分析,抽取汇总数据表的表名和字段名。
在本发明的实施例中,汇总表使用creat语句进行创建,抽取脚本中用于汇总数据的数据库表,并获取其表名和字段名等全部信息。
在操作S430,对所述目标脚本数据进行语法分析,抽取汇总数据表的关联信息。
在操作S440,构建知识库。
在本发明的实施例中,通过操作S420获取的关系信息,结合操作S430获取的字段信息,将汇总表和基础表的关系以及对应的字段信息作为知识存储,构建相应的知识库。例如,某汇总表包括法人客户信息表,该汇总表关联的基础的表包括法人客户银行卡信息表、法人客户存款信息表、法人客户中间业务表等基础表,将该汇总表与基础表的关联信息与对应的字段信息保存到数据库中,通过大量的类似信息的存储从而构建起相应的知识库。
在本发明的实施例中,通过分析数据仓库相关脚本日志,构建汇总表和基础表关系及字段等信息的知识库,解决了知识孤岛等问题。为业务人员解决工单问题提供了直接无误的知识来源。
返回操作S430,对所述目标脚本数据进行语法分析,抽取汇总数据表的关联信息包括在所述目标脚本数据中检索插入操作以及根据检索到的插入操作,抽取汇总数据表和基础数据表之间的关联信息。
在本发明的实施例中,汇总表创建的字段,其信息全部来源于基础表的插入操作,即Insert操作。通过对Insert操作的检索,即可关联汇总表和基础表,从而找到并抽取出汇总表和基础表的关系。
在本发明的实施例中,通过检索插入操作能够精准迅速地从脚本中寻找并抽取汇总表和基础表的关系,在保证了所抽取的信息的准确性的同时提高了知识库构建的效率。
返回操作S210,在抽取所述待处理工单中的感兴趣信息之前,还包括利用预先训练的机器学习分类模型,对所述待处理工单进行分类。
在本发明的实施例中,首先利用图灵机器学习平台对工单问题进行分类。具体使用FastText算法训练领域分类模型,该模型可以根据用户描述,有效识别工单问题类型,从而实现工单预分类。工单的预分类包括大数据工单、平台问题工单、研发需求工单、人工智能工单等。
在本发明的实施例中,业务人员所要处理工单为大数据工单。利用机器学习分类模型对工单进行预分类能够有效的筛选出大数据工单,进而提高了工单处理的效率。
图5示意性示出了根据本发明实施例的工单处理用户的装置的结构框图。
如图5所示,根据该实施例的工单处理用户的装置500包括工单获取模块510、信息抽取模块520、匹配模块530和输出模块540。
工单获取模块510可以用于获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题。在本发明的实施例中,工单获取模块510可以用于执行前文描述的操作S210,在此不再赘述。
信息抽取模块520可以用于抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个。在一实施例中,信息抽取模块520可以用于执行前文描述的操作S220,在此不再赘述。
匹配模块530可以用于将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数。在一实施例中,匹配模块530可以用于执行前文描述的操作S230,在此不再赘述。
输出模块540可以用于输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。在一实施例中,输出模块540可以用于执行前文描述的操作S240,在此不再赘述。
图6示意性示出了根据本发明实施例的适于实现工单处理用户方法的电子设备的方框图。
如图6所示,根据本发明实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本发明实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本发明实施例的方法流程的各种操作。
根据本发明的实施例,电子设备600还可以包括输入/输出(I/O)接口608,输入/输出(I/O)接口608也连接至总线604。电子设备600还可以包括连接至I/O接口608的以下部件中的一项或多项:包括键盘、鼠标等的输入部分608;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分608;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分608。通信部分808经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口608。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本发明实施例的方法。
根据本发明的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本发明的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
本发明的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本发明实施例所提供的方法。
在该计算机程序被处理器601执行时执行本发明实施例的系统/装置中限定的上述功能。根据本发明的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分608被下载和安装,和/或从可拆卸介质611被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分608从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本发明实施例的系统中限定的上述功能。根据本发明的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本发明的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上对本发明的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本发明的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。不脱离本发明的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本发明的范围之内。
Claims (11)
1.一种工单处理方法,其特征在于,所述方法包括:
获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题;
抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个;
将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数;以及
输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
2.根据权利要求1所述的方法,其特征在于,所述抽取所述待处理工单中的感兴趣信息包括:
利用正则表达式抽取所述业务问题和所述问题描述中出现的数据表表名和/或字段名,作为所述感兴趣信息。
3.根据权利要求2所述的方法,其特征在于,所述将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配包括:
在所述感兴趣信息包括数据表表名的情况下,将所述数据表表名与所述知识库中存储的M个汇总数据表的表名进行逐一匹配,获取与所述知识库中与所述数据表表名匹配的P个汇总数据表。
4.根据权利要求2所述的方法,其特征在于,所述将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配包括:
在所述感兴趣信息包括数据表字段名的情况下,将所述数据表字段名与所述知识库中存储的M个汇总数据表的字段名进行逐一匹配,获取与所述知识库中与所述数据表字段名匹配的P个汇总数据表。
5.根据权利要求1-4中任一项所述的方法,其特征在于,预先构建所述知识库包括:
获取目标脚本数据,其中,所述目标脚本数据包括与构建所述汇总数据表相关的脚本;
对所述目标脚本数据进行语法分析,抽取汇总数据表的信息,其中,所述汇总数据表的信息包括所述汇总数据表的表名和字段名;
对所述目标脚本数据进行语法分析,抽取汇总数据表和基础数据表之间的关联信息;以及
根据抽取出的所述汇总数据表的信息和所述汇总数据表和基础数据表之间的关联信息,构建知识库。
6.根据权利要求5所述的方法,其特征在于,所述对所述目标脚本数据进行语法分析,抽取汇总数据表和基础数据表之间的关联信息包括:
在所述目标脚本数据中检索插入操作;以及
根据检索到的插入操作,抽取汇总数据表和基础数据表之间的关联信息。
7.根据权利要求1-4和6中任一项所述的方法,其特征在于,在抽取所述待处理工单中的感兴趣信息之前,所述方法还包括:利用预先训练的机器学习分类模型,对所述待处理工单进行分类;
所述抽取所述待处理工单中的感兴趣信息包括:响应于所述待处理工单被分类至数据库工单类别,抽取所述待处理工单中的感兴趣信息。
8.一种工单处理装置,其特征在于,所述装置包括:
工单获取模块,用于获取待处理工单,其中,所述待处理工单包括业务问题和对该业务问题的问题描述,所述业务问题包括与数据库中的汇总数据表相关的业务问题;
信息抽取模块,用于抽取所述待处理工单中的感兴趣信息,其中,所述感兴趣信息包括数据表表名和数据表中的字段名中的至少一个;
匹配模块,用于将抽取出的所述待处理工单中的感兴趣信息与预先构建的知识库中的信息进行匹配,其中,所述预先构建的知识库包括数据库中的M个汇总数据表及其字段信息、所述数据库中的N个基础数据表及其字段信息、以及每一个所述汇总数据表和所述N个基础数据表中的K个基础数据表之间的关联关系,M为大于等于1的正整数,N为大于等于2的正整数,K为大于等于1且小于等于N的正整数;以及
输出模块,用于输出匹配结果,其中,所述匹配结果包括:所述知识库中与所述待处理工单中的感兴趣信息匹配的P个汇总数据表及其字段信息;以及所述P个汇总数据表中的每一个汇总数据表与K个基础数据表之间的关联关系,P为大于等于1且小于等于M的正整数。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~7中任一项所述的方法。
11.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310838988.8A CN117033431A (zh) | 2023-07-10 | 2023-07-10 | 工单处理方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310838988.8A CN117033431A (zh) | 2023-07-10 | 2023-07-10 | 工单处理方法、装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117033431A true CN117033431A (zh) | 2023-11-10 |
Family
ID=88636268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310838988.8A Pending CN117033431A (zh) | 2023-07-10 | 2023-07-10 | 工单处理方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117033431A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117291163A (zh) * | 2023-11-24 | 2023-12-26 | 青矩技术股份有限公司 | 数据提取方法、装置、设备及存储介质 |
-
2023
- 2023-07-10 CN CN202310838988.8A patent/CN117033431A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117291163A (zh) * | 2023-11-24 | 2023-12-26 | 青矩技术股份有限公司 | 数据提取方法、装置、设备及存储介质 |
CN117291163B (zh) * | 2023-11-24 | 2024-05-28 | 青矩技术股份有限公司 | 数据提取方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190205993A1 (en) | Transaction data categorizer system and method | |
CN111382279B (zh) | 审单方法和装置 | |
CA3033859C (en) | Method and system for automatically extracting relevant tax terms from forms and instructions | |
CN109034988B (zh) | 一种会计分录生成方法和装置 | |
Schintler et al. | Encyclopedia of big data | |
CN108153729B (zh) | 一种面向金融领域的知识抽取方法 | |
US11270375B1 (en) | Method and system for aggregating personal financial data to predict consumer financial health | |
US11615110B2 (en) | Systems and methods for unifying formats and adaptively automating processing of business records data | |
CN112927082A (zh) | 信用风险的预测方法、装置、设备、介质和程序产品 | |
CN113205402A (zh) | 对账方法、装置、电子设备及计算机可读介质 | |
Imran et al. | Data provenance | |
CN110942392A (zh) | 一种业务数据处理方法、装置、设备和介质 | |
CN111027832A (zh) | 一种税务风险确定方法、装置及存储介质 | |
Huang | Data processing | |
Alghushairy et al. | Data storage | |
CN117033431A (zh) | 工单处理方法、装置、电子设备和介质 | |
Owda et al. | Financial discussion boards irregularities detection system (fdbs-ids) using information extraction | |
CN111126073B (zh) | 语义检索方法和装置 | |
CN118886986A (zh) | 产品推荐方法、装置、设备及存储介质 | |
Dimitrakopoulou | Digital literacy | |
Kuiler | Data governance | |
CN112380321A (zh) | 基于票据知识图谱的主次数据库分配方法及相关设备 | |
CN111639910A (zh) | 一种台账生成方法、装置、设备及存储介质 | |
CN117273968A (zh) | 一种跨业务线产品的会计凭证生成方法及其相关设备 | |
CN116797024A (zh) | 业务处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |