[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN118296160A - 知识库的管理系统和相关方法 - Google Patents

知识库的管理系统和相关方法 Download PDF

Info

Publication number
CN118296160A
CN118296160A CN202410468341.5A CN202410468341A CN118296160A CN 118296160 A CN118296160 A CN 118296160A CN 202410468341 A CN202410468341 A CN 202410468341A CN 118296160 A CN118296160 A CN 118296160A
Authority
CN
China
Prior art keywords
knowledge base
repository
uploading
server
index tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410468341.5A
Other languages
English (en)
Inventor
雷正勇
李良杰
张效华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minimally Invasive Software Ltd By Share Ltd
Original Assignee
Shanghai Minimally Invasive Software Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minimally Invasive Software Ltd By Share Ltd filed Critical Shanghai Minimally Invasive Software Ltd By Share Ltd
Priority to CN202410468341.5A priority Critical patent/CN118296160A/zh
Publication of CN118296160A publication Critical patent/CN118296160A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例方案提供了一种知识库的有效共享架构,通过引入知识库的管理系统来实现知识库共享,知识库的管理系统包括:上传服务端、智能分类器、存储服务器和访问控制服务器;所述上传服务端用于为分享客户端提供知识库上传服务,所述智能分类器用于对分享客户端上传的知识库提供分类服务,所述访问控制器用于提供知识库访问控制服务,通过设计合理的知识库共享架构,有利于创建出较为科学合理的知识库共享机制。

Description

知识库的管理系统和相关方法
技术领域
本申请实施例涉及计算机相关技术领域,尤其涉及了一种知识库的管理系统和知识库的管理方法。
背景技术
当前,随时人工智能大模型的爆发,越来越多的领域希望通过引入人工智能大模型来提高生产效率。然而通用的人工智能大模型对特定业务领域的支撑难度还较大,特定业务领域往往需要专用的人工智能大模型。而专用的人工智能大模型的智能化程度,有依赖于可用于训练的特定业务领域的知识库。
现有技术中目前还没有一些较为科学合理的知识库共享机制,这严重限制了人工智能大模型在很多特定业务领域的应用。
发明内容
本申请实施例提供知识库的管理系统和知识库的管理方法,有利于创建出较为科学合理的知识库共享机制。
本申请实施例第一方面提供一种知识库的管理系统,知识库的管理系统可包括:上传服务端、智能分类器、存储服务器和访问控制服务器;其中,
所述上传服务端用于为分享客户端提供知识库上传服务,当其接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集;
所述智能分类器用于对分享客户端上传的知识库提供分类服务,当其接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区;
所述访问控制器用于提供知识库访问控制服务,当其接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1;当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载;所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
在一些可能的实施方式中,所述第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树。
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
在一些可能的实施方式中,所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
在一些可能的实施方式中,所述智能分类器还用于在将所述叶子分类cla1设置为第一知识库的直属分类之后,将所述第一知识库的索引标签集中的索引标签添加到索引标签文件cla1f1中,并对所述索引标签文件cla1f1中的索引标签进行去重处理以得到更新后的索引标签文件cla1f1。
在一些可能的实施方式中,所述上传服务端还用于在所述第一知识库上传成功之后释放第一上传承载,并向第一分享客户端发送第一知识库上传请求响应,第一知识库上传请求响应携带有上传服务端为第一知识库分配的全局唯一标识GUID1,在存储映射表中添加第一记录,所述第一记录用于维护第一知识库的全局唯一标识GUID1和第一知识库的存储索引之间的映射关系,所述第一记录中还包括原创者身份字段,所述原创者身份字段记载有所述第一身份验证数据中包含的原创者身份标识。
在一些可能的实施方式中,所述上传服务端还用于当其接收来自第一分享客户端的携带有全局唯一标识GUID1和第一身份验证数据的第一知识库更新请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则创建所述上传服务端与第一分享客户端之间的第二上传承载,使用所述第二上传承载接收所述第一分享客户端上传的第一知识库的第一更新包,使用第一知识库的第一更新包对存储服务器中存储的第一知识库进行更新。
在一些可能的实施方式中,所述第一记录还包含更新权限字段,所述第一记录的更新权限字段默认为非使能状态,所述上传服务端还用于当所述第一知识库更新请求还携带有允许更新标志位,所述允许更新标志位指示允许第三方更新第一知识库;则将所述第一记录的更新权限字段设置为使能状态,其中,当所述第一记录的更新权限字段处于使能状态,表示第一知识库允许被第三方更新;当所述第一记录的更新权限字段处于非使能状态,表示第一知识库不允许被第三方更新;
所述上传服务端还用于当其接收来自第二分享客户端的携带有全局唯一标识GUID1和第二身份验证数据的第二知识库更新请求,使用第二身份验证数据对所述第二分享客户端进行身份合法性验证,在所述第二分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则判断第一记录的更新权限字段是否处于使能状态,当第一记录的更新权限字段处于使能状态,创建所述上传服务端与第二分享客户端之间的第三上传承载,使用所述第三上传承载接收所述第二分享客户端上传的第一知识库的第二更新包,使用第一知识库的第二更新包对存储服务器中存储的第一知识库进行更新。
本申请实施例第二方面提供一种知识库的管理方法,所述方法可以应用于知识库的管理系统,其中,知识库的管理系统包括:上传服务端、智能分类器、存储服务器和访问控制服务器;其中,
所述方法包括:上传服务端当接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集;
智能分类器当接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区;
所述访问控制器当接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1;当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载;所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
在一些可能的实施方式中,所述第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树;
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
在一些可能的实施方式中,所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
在一些可能的实施方式中,所述智能分类器还用于在将所述叶子分类cla1设置为第一知识库的直属分类之后,将所述第一知识库的索引标签集中的索引标签添加到索引标签文件cla1f1中,并对所述索引标签文件cla1f1中的索引标签进行去重处理以得到更新后的索引标签文件cla1f1。
在一些可能的实施方式中,所述上传服务端还用于在所述第一知识库上传成功之后释放第一上传承载,并向第一分享客户端发送第一知识库上传请求响应,第一知识库上传请求响应携带有上传服务端为第一知识库分配的全局唯一标识GUID1,在存储映射表中添加第一记录,所述第一记录用于维护第一知识库的全局唯一标识GUID1和第一知识库的存储索引之间的映射关系,所述第一记录中还包括原创者身份字段,所述原创者身份字段记载有所述第一身份验证数据中包含的原创者身份标识。
在一些可能的实施方式中,所述上传服务端还用于当其接收来自第一分享客户端的携带有全局唯一标识GUID1和第一身份验证数据的第一知识库更新请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则创建所述上传服务端与第一分享客户端之间的第二上传承载,使用所述第二上传承载接收所述第一分享客户端上传的第一知识库的第一更新包,使用第一知识库的第一更新包对存储服务器中存储的第一知识库进行更新。
在一些可能的实施方式中,所述第一记录还包含更新权限字段,所述第一记录的更新权限字段默认为非使能状态,所述上传服务端还用于当所述第一知识库更新请求还携带有允许更新标志位,所述允许更新标志位指示允许第三方更新第一知识库;则将所述第一记录的更新权限字段设置为使能状态,其中,当所述第一记录的更新权限字段处于使能状态,表示第一知识库允许被第三方更新;当所述第一记录的更新权限字段处于非使能状态,表示第一知识库不允许被第三方更新;
所述上传服务端还用于当其接收来自第二分享客户端的携带有全局唯一标识GUID1和第二身份验证数据的第二知识库更新请求,使用第二身份验证数据对所述第二分享客户端进行身份合法性验证,在所述第二分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则判断第一记录的更新权限字段是否处于使能状态,当第一记录的更新权限字段处于使能状态,创建所述上传服务端与第二分享客户端之间的第三上传承载,使用所述第三上传承载接收所述第二分享客户端上传的第一知识库的第二更新包,使用第一知识库的第二更新包对存储服务器中存储的第一知识库进行更新。
第三方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时,能够用于执行如本申请实施例的任一方法的部分或者全部步骤。
第四方面,本公开实施例还提供了一种计算机程序产品,所述计算机程序产品由计算机处理器执行时,能够用于执行如本申请实施例的任一方法的部分或者全部步骤。
本申请实施例方案提供了一种知识库的有效共享机制,通过引入知识库的管理系统来实现知识库共享,知识库的管理系统包括:上传服务端、智能分类器、存储服务器和访问控制服务器;所述上传服务端用于为分享客户端提供知识库上传服务,所述智能分类器用于对分享客户端上传的知识库提供分类服务,所述访问控制器用于提供知识库访问控制服务,通过设计合理的知识库共享架构,有利于创建出较为科学合理的知识库共享机制。
附图说明
为更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种知识库的管理系统的架构示意图。
图2是本公开实施例提供的一种知识库的管理方法的流程示意图。
图3是本公开实施例提供的一种分类树的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合相关的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分的实施例,而不是全部的实施例。基于本发明中的一些实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。本发明说明书、权利要求书和附图中出现的术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。此外术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统或产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程或方法或产品或设备固有的其它步骤或单元。
参见图1,本申请实施例举例提供一种知识库的管理系统,包括:上传服务端110、智能分类器120、存储服务器130和访问控制服务器140;其中,
所述上传服务端110用于为分享客户端提供知识库上传服务,当其接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集。
所述智能分类器120用于对分享客户端上传的知识库提供分类服务,当其接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区。
所述访问控制器130用于提供知识库访问控制服务,当其接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1;当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载;所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
在一些可能的实施方式中,第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树。
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
在一些可能的实施方式中,所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
在一些可能的实施方式中,所述智能分类器还用于在将所述叶子分类cla1设置为第一知识库的直属分类之后,将所述第一知识库的索引标签集中的索引标签添加到索引标签文件cla1f1中,并对所述索引标签文件cla1f1中的索引标签进行去重处理以得到更新后的索引标签文件cla1f1。
在一些可能的实施方式中,所述上传服务端还用于在所述第一知识库上传成功之后释放第一上传承载,并向第一分享客户端发送第一知识库上传请求响应,其中,第一知识库上传请求响应携带有上传服务端为第一知识库分配的全局唯一标识GUID1,在存储映射表中添加第一记录,所述第一记录用于维护第一知识库的全局唯一标识GUID1和第一知识库的存储索引之间的映射关系,所述第一记录中还包括原创者身份字段,所述原创者身份字段记载有所述第一身份验证数据中包含的原创者身份标识。
在一些可能的实施方式中,所述上传服务端还用于当其接收来自第一分享客户端的携带有全局唯一标识GUID1和第一身份验证数据的第一知识库更新请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过之后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则创建所述上传服务端与第一分享客户端之间的第二上传承载,使用所述第二上传承载接收所述第一分享客户端上传的第一知识库的第一更新包,使用第一知识库的第一更新包对存储服务器中存储的第一知识库进行更新。
在一些可能的实施方式中,所述第一记录还包含更新权限字段,所述第一记录的更新权限字段默认为非使能状态,所述上传服务端还用于当所述第一知识库更新请求还携带有允许更新标志位,所述允许更新标志位指示允许第三方更新第一知识库;则将所述第一记录的更新权限字段设置为使能状态,其中,当所述第一记录的更新权限字段处于使能状态,表示第一知识库允许被第三方更新;当所述第一记录的更新权限字段处于非使能状态,表示第一知识库不允许被第三方更新。
所述上传服务端还用于当其接收来自第二分享客户端的携带有全局唯一标识GUID1和第二身份验证数据的第二知识库更新请求,使用第二身份验证数据对所述第二分享客户端进行身份合法性验证,在所述第二分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则判断第一记录的更新权限字段是否处于使能状态,当第一记录的更新权限字段处于使能状态,创建所述上传服务端与第二分享客户端之间的第三上传承载,使用所述第三上传承载接收所述第二分享客户端上传的第一知识库的第二更新包,使用第一知识库的第二更新包对存储服务器中存储的第一知识库进行更新。
在一些可能实施方式中,知识库选中命令order1还可包含更新订阅标志位,更新订阅标志位用于指示当第一知识库发生更新时通知第一访问客户端。访问控制服务器130在更新订阅表中添加第二记录,第二记录用于记录第一访问客户端的用户身份标识和第一知识库的全局唯一标识GUID1的关联关系。相应的,当第一知识库发生更新时,访问控制服务器130可向第一访问客户端推送第一知识库的更新提示消息。第一访问客户端则可在获悉第一知识库更新后,通过知识库下载流程来下载更新后的第一知识库。
在一些可能实施方式中,在某些场景下,模型训练可能不仅使用从存储服务器下载的知识库,还可能使用一些私有知识库,虽然私有知识库通常不能被完全的公开共享,但借助知识库的管理系统,一些访问客户端之间可实现私有知识库的有限范围共享。例如第一访问客户端可向访问控制服务器130发送私有知识库共享请求,所述私有知识库共享请求携带第二私有知识库的摘要和索引标签集,在私有知识库共享表中添加第三记录,第三记录用于记录第一访问客户端的用户身份标识、第二私有知识库的全局唯一标识GUID1、第二私有知识库的摘要和第二私有知识库的索引标签集的关联关系。
当访问控制服务器130接收到来自第二访问客户端的第一知识库下载请求,向第二访问客户端发送知识库候选界面Page1;当接收到来自第二访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order2,且知识库选中命令order2中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第二下载承载;所述第二访问客户端用于通过第二下载承载从存储服务器下载第一知识库,当确认第一知识库和第二私有知识库的索引标签集之间的相似度超过预设阈值,则访问控制服务器130还可向第二访问客户端推送包含第二私有知识库的摘要的推荐消息,所述推荐消息还携带临时会话创建链接,当临时会话创建链接被点击时将产生请求建立第二访问客户端和第一访问客户端之间零食会话的指令,访问控制服务器在接收到请求建立第二访问客户端和第二访问客户端之间零食会话的指令后,触发建立起第二访问客户端和第一访问客户端之间的临时会话,临时会话可以交互聊天数据和第二私有知识库,其中,临时会话的数据传输链路经过访问控制服务器,访问控制服务器对于临时会话的相关用户面数据(如聊天数据和第二私有知识库等)提供透传服务。进一步的,第二访问客户端和第一访问客户端还可通过临时会话来交互分享经训练的人工智能大模型等。
参见图2,图2是本申请实施例举例提供一种知识库的管理方法的流程示意图,知识库的管理方法应用于知识库的管理系统,知识库的管理系统如图1举例所示。
其中,所述知识库的管理方法包括:
201.上传服务端当接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对第一分享客户端进行身份合法性验证。
202.在第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,上传服务端使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集。
203.智能分类器当接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;智能分类器将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区。
参见图3,图3举例了一种分类树的结构。其中,分类树可包括一个根分类(也可称为根节点),若干层的树干分类(也可称为树干节点)和叶子分类(也可称为叶子节点)。叶子分类没有子分类(也可称为子节点),只有父分类(也可称为父节点)。树干分类即有父分类,也有子分类。
204.所述访问控制器当接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1。
205.当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载。
所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
在一些可能的实施方式中,所述第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树;
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
在一些可能的实施方式中,所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
在一些可能的实施方式中,所述智能分类器还用于在将所述叶子分类cla1设置为第一知识库的直属分类之后,将所述第一知识库的索引标签集中的索引标签添加到索引标签文件cla1f1中,并对所述索引标签文件cla1f1中的索引标签进行去重处理以得到更新后的索引标签文件cla1f1。
在一些可能的实施方式中,所述上传服务端还用于在所述第一知识库上传成功之后释放第一上传承载,并向第一分享客户端发送第一知识库上传请求响应,第一知识库上传请求响应携带有上传服务端为第一知识库分配的全局唯一标识GUID1,在存储映射表中添加第一记录,所述第一记录用于维护第一知识库的全局唯一标识GUID1和第一知识库的存储索引之间的映射关系,所述第一记录中还包括原创者身份字段,所述原创者身份字段记载有所述第一身份验证数据中包含的原创者身份标识。
在一些可能的实施方式中,所述上传服务端还用于当其接收来自第一分享客户端的携带有全局唯一标识GUID1和第一身份验证数据的第一知识库更新请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则创建所述上传服务端与第一分享客户端之间的第二上传承载,使用所述第二上传承载接收所述第一分享客户端上传的第一知识库的第一更新包,使用第一知识库的第一更新包对存储服务器中存储的第一知识库进行更新。
在一些可能的实施方式中,所述第一记录还包含更新权限字段,所述第一记录的更新权限字段默认为非使能状态,所述上传服务端还用于当所述第一知识库更新请求还携带有允许更新标志位,所述允许更新标志位指示允许第三方更新第一知识库;则将所述第一记录的更新权限字段设置为使能状态,其中,当所述第一记录的更新权限字段处于使能状态,表示第一知识库允许被第三方更新;当所述第一记录的更新权限字段处于非使能状态,表示第一知识库不允许被第三方更新;
所述上传服务端还用于当其接收来自第二分享客户端的携带有全局唯一标识GUID1和第二身份验证数据的第二知识库更新请求,使用第二身份验证数据对所述第二分享客户端进行身份合法性验证,在所述第二分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则判断第一记录的更新权限字段是否处于使能状态,当第一记录的更新权限字段处于使能状态,创建所述上传服务端与第二分享客户端之间的第三上传承载,使用所述第三上传承载接收所述第二分享客户端上传的第一知识库的第二更新包,使用第一知识库的第二更新包对存储服务器中存储的第一知识库进行更新。在一些可能实施方式中,知识库选中命令order1还可包含更新订阅标志位,更新订阅标志位用于指示当第一知识库发生更新时通知第一访问客户端。访问控制服务器130在更新订阅表中添加第二记录,第二记录用于记录第一访问客户端的用户身份标识和第一知识库的全局唯一标识GUID1的关联关系。相应的,当第一知识库发生更新时,访问控制服务器130可向第一访问客户端推送第一知识库的更新提示消息。第一访问客户端则可在获悉第一知识库更新后,通过知识库下载流程来下载更新后的第一知识库。
在一些可能实施方式中,在某些场景下,模型训练可能不仅使用从存储服务器下载的知识库,还可能使用一些私有知识库,虽然私有知识库通常不能被完全的公开共享,但借助知识库的管理系统,一些访问客户端之间可实现私有知识库的有限范围共享。例如第一访问客户端可向访问控制服务器130发送私有知识库共享请求,所述私有知识库共享请求携带第二私有知识库的摘要和索引标签集,在私有知识库共享表中添加第三记录,第三记录用于记录第一访问客户端的用户身份标识、第二私有知识库的全局唯一标识GUID1、第二私有知识库的摘要和第二私有知识库的索引标签集的关联关系。
当访问控制服务器130接收到来自第二访问客户端的第一知识库下载请求,向第二访问客户端发送知识库候选界面Page1;当接收到来自第二访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order2,且知识库选中命令order2中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第二下载承载;所述第二访问客户端用于通过第二下载承载从存储服务器下载第一知识库,当确认第一知识库和第二私有知识库的索引标签集之间的相似度超过预设阈值,则访问控制服务器130还可向第二访问客户端推送包含第二私有知识库的摘要的推荐消息,所述推荐消息还携带临时会话创建链接,当临时会话创建链接被点击时将产生请求建立第二访问客户端和第一访问客户端之间零食会话的指令,访问控制服务器在接收到请求建立第二访问客户端和第二访问客户端之间零食会话的指令后,触发建立起第二访问客户端和第一访问客户端之间的临时会话,临时会话可以交互聊天数据和第二私有知识库,其中,临时会话的数据传输链路经过访问控制服务器,访问控制服务器对于临时会话的相关用户面数据(如聊天数据和第二私有知识库等)提供透传服务。进一步的,第二访问客户端和第一访问客户端还可通过临时会话来交互分享经训练的人工智能大模型等。
本申请实施例方案提供了一种知识库的有效共享机制,通过引入知识库的管理系统来实现知识库共享,知识库的管理系统包括:上传服务端、智能分类器、存储服务器和访问控制服务器;所述上传服务端用于为分享客户端提供知识库上传服务,所述智能分类器用于对分享客户端上传的知识库提供分类服务,所述访问控制器用于提供知识库访问控制服务,通过设计合理的知识库共享架构,有利于创建出较为科学合理的知识库共享机制。
本申请实施例还提供一种计算机存储介质,计算机存储介质存储有计算机程序,当所述计算机程序被计算机系统来执行时,能够实现本申请实施例中的任意一种方法的部分或全部步骤。
本申请实施例还提供一种计算机程序,所述计算机存储介质存储有计算机程序,当所述计算机程序被计算机系统来执行时,能够实现本申请实施例中的任意一种方法的部分或全部步骤。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,其取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元等的具体工作过程,可以参考前述方法或其它实施例中的对应过程,在此不再赘述。
各方法实施例为了方便简洁,也可以互为参考引用,不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可通过其它的方式实现。例如以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可有另外划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可忽略或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可位于一个地方,或者也可分布到多个网络单元上。可根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(如个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的一些具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种知识库的管理系统,其特征在于,包括:上传服务端、智能分类器、存储服务器和访问控制服务器;其中,
所述上传服务端用于为分享客户端提供知识库上传服务,当其接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集;
所述智能分类器用于对分享客户端上传的知识库提供分类服务,当其接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区;
所述访问控制器用于提供知识库访问控制服务,当其接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1;当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载;所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
2.根据权利要求1所述的系统,其特征在于,所述第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树;
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
3.根据权利要求2所述的系统,其特征在于,
所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
4.根据权利要求3所述的系统,其特征在于,
所述智能分类器还用于在将所述叶子分类cla1设置为第一知识库的直属分类之后,将所述第一知识库的索引标签集中的索引标签添加到索引标签文件cla1f1中,并对所述索引标签文件cla1f1中的索引标签进行去重处理以得到更新后的索引标签文件cla1f1。
5.根据权利要求3所述的系统,其特征在于,
所述上传服务端还用于在所述第一知识库上传成功之后释放第一上传承载,并向第一分享客户端发送第一知识库上传请求响应,第一知识库上传请求响应携带有上传服务端为第一知识库分配的全局唯一标识GUID1,在存储映射表中添加第一记录,所述第一记录用于维护第一知识库的全局唯一标识GUID1和第一知识库的存储索引之间的映射关系,所述第一记录中还包括原创者身份字段,所述原创者身份字段记载有所述第一身份验证数据中包含的原创者身份标识。
6.根据权利要求5所述的系统,其特征在于,
所述上传服务端还用于当其接收来自第一分享客户端的携带有全局唯一标识GUID1和第一身份验证数据的第一知识库更新请求,使用第一身份验证数据对所述第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则创建所述上传服务端与第一分享客户端之间的第二上传承载,使用所述第二上传承载接收所述第一分享客户端上传的第一知识库的第一更新包,使用第一知识库的第一更新包对存储服务器中存储的第一知识库进行更新。
7.根据权利要求6所述的系统,其特征在于,所述第一记录还包含更新权限字段,所述第一记录的更新权限字段默认为非使能状态,所述上传服务端还用于当所述第一知识库更新请求还携带有允许更新标志位,所述允许更新标志位指示允许第三方更新第一知识库;则将所述第一记录的更新权限字段设置为使能状态,其中,当所述第一记录的更新权限字段处于使能状态,表示第一知识库允许被第三方更新;当所述第一记录的更新权限字段处于非使能状态,表示第一知识库不允许被第三方更新;
所述上传服务端还用于当其接收来自第二分享客户端的携带有全局唯一标识GUID1和第二身份验证数据的第二知识库更新请求,使用第二身份验证数据对所述第二分享客户端进行身份合法性验证,在所述第二分享客户端的身份合法性验证通过后,在存储映射表中查找是否存在与全局唯一标识GUID1匹配的记录,当存储映射表中查找到了与全局唯一标识GUID1匹配的第一记录,则判断第一记录的更新权限字段是否处于使能状态,当第一记录的更新权限字段处于使能状态,创建所述上传服务端与第二分享客户端之间的第三上传承载,使用所述第三上传承载接收所述第二分享客户端上传的第一知识库的第二更新包,使用第一知识库的第二更新包对存储服务器中存储的第一知识库进行更新。
8.一种知识库的管理方法,其特征在于,所述方法应用于知识库的管理系统,知识库的管理系统包括:上传服务端、智能分类器、存储服务器和访问控制服务器;其中,
所述方法包括:上传服务端当接收来自第一分享客户端的携带有第一身份验证数据的第一知识库上传请求,使用第一身份验证数据对第一分享客户端进行身份合法性验证,在所述第一分享客户端的身份合法性验证通过后创建所述上传服务端与第一分享客户端之间的第一上传承载,使用所述第一上传承载接收所述第一分享客户端上传的第一知识库,所述第一知识库包含所述第一知识库的索引标签集;
智能分类器当接收到上传服务端传递过来的所述第一知识库,在分类树中查找出与所述第一知识库的索引标签集匹配度最高的叶子分类cla1;将所述叶子分类cla1设置为第一知识库的直属分类,并将第一知识库存储到存储服务器中与叶子分类cla1对应的存储区;
所述访问控制器当接收到来自第一访问客户端的第一知识库下载请求,则向第一访问客户端发送知识库候选界面Page1;当接收到来自第一访问客户端的通过操作知识库候选界面Page1而得到的知识库选中命令order1,且知识库选中命令order1中记录的被选中的知识库包括第一知识库,则触发建立存储服务器和第一访问客户端之间的第一下载承载;所述第一访问客户端用于通过第一下载承载从存储服务器下载第一知识库,所述第一知识库能够被用于训练人工智能大模型。
9.根据权利要求8所述的方法,其特征在于,所述第一知识库还包含所述第一知识库的摘要,所述知识库候选界面Page1中包含允许展开和折叠的分类树;
其中,当知识库候选界面Page1中的分类树之中的叶子分类cla1被点击时将弹出知识库候选子界面Page11,知识库候选子界面Page11包含以叶子分类cla1作为直属分类的X个知识库的库名,X个知识库包括第一知识库;当第一知识库候选子界面Page11中第一知识库的库名被点击时将弹出显示有第一知识库的摘要的界面Page111。
10.根据权利要求9所述的方法,其特征在于,
所述叶子分类cla1关联了索引标签文件cla1f1,所述索引标签文件cla1f1中记载了多个索引标签,所述分类树中的叶子分类cla2关联了索引标签文件cla2f2,所述索引标签文件cla2f2中记载了多个索引标签,所述第一知识库的索引标签集与所述索引标签文件cla1f1所记载索引标签之间的相似度,大于所述第一知识库的索引标签集与所述索引标签文件cla2f2所记载索引标签之间的相似度。
CN202410468341.5A 2024-04-18 2024-04-18 知识库的管理系统和相关方法 Pending CN118296160A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410468341.5A CN118296160A (zh) 2024-04-18 2024-04-18 知识库的管理系统和相关方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410468341.5A CN118296160A (zh) 2024-04-18 2024-04-18 知识库的管理系统和相关方法

Publications (1)

Publication Number Publication Date
CN118296160A true CN118296160A (zh) 2024-07-05

Family

ID=91676386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410468341.5A Pending CN118296160A (zh) 2024-04-18 2024-04-18 知识库的管理系统和相关方法

Country Status (1)

Country Link
CN (1) CN118296160A (zh)

Similar Documents

Publication Publication Date Title
CN111736775B (zh) 多源存储方法、装置、计算机系统及存储介质
US20170277437A1 (en) Attribute-based dependency identification for operation ordering
CN102368201A (zh) 虚拟化环境中存储优化选择
CN105868231A (zh) 缓存数据的更新方法及装置
EP3491808B1 (en) Interchangeable retrieval of content
US11882154B2 (en) Template representation of security resources
CA2932808A1 (en) Methods for generating an activity stream
CN107580032B (zh) 数据处理方法、装置及设备
CN112150030A (zh) 基于多单位多身份的账号管理方法、终端设备及存储介质
CN102034144A (zh) 用于在场的群组组成算法
CN112099997B (zh) 文件存储方法和电子设备
CN113395340A (zh) 一种信息更新方法、装置、设备、系统和可读存储介质
CN113885797B (zh) 一种数据存储方法、装置、设备及存储介质
CN111274004A (zh) 进程实例管理方法、装置及计算机存储介质
US11494392B2 (en) Tracking entity activity using computer generation of values for blockchain network entries
CN112579877B (zh) 信源系统的控制方法、装置、存储介质和设备
CN114629867A (zh) 在线问诊即时通讯系统和消息处理方法
JP6752944B2 (ja) ユーザ端末から受信されるイメージを他のユーザ端末に共有するための装置および方法
CN118296160A (zh) 知识库的管理系统和相关方法
US11736336B2 (en) Real-time monitoring of machine learning models in service orchestration plane
CN116088829A (zh) 数据处理方法、装置、存储介质及设备
CN112800018B (zh) 一种开发系统
CN112948593A (zh) 知识图谱的生成方法、装置、设备和介质
CN117539962B (zh) 数据处理方法、装置、计算机设备和存储介质
CN116684282B (zh) 新增云端服务器初始化方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination