CN114175021A - 用于为文档评估系统生成逻辑文档的系统和方法 - Google Patents
用于为文档评估系统生成逻辑文档的系统和方法 Download PDFInfo
- Publication number
- CN114175021A CN114175021A CN202080041372.2A CN202080041372A CN114175021A CN 114175021 A CN114175021 A CN 114175021A CN 202080041372 A CN202080041372 A CN 202080041372A CN 114175021 A CN114175021 A CN 114175021A
- Authority
- CN
- China
- Prior art keywords
- document
- sub
- current
- item
- date
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000011156 evaluation Methods 0.000 title claims abstract description 29
- 230000004044 response Effects 0.000 claims description 56
- 238000010801 machine learning Methods 0.000 claims description 13
- 238000012546 transfer Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 81
- 230000008569 process Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 19
- 230000008859 change Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012552 review Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013474 audit trail Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/197—Version control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
Abstract
提供了用于生成文档评估系统的逻辑文档的系统和方法。例如,一种用于为文档评估系统生成逻辑文档的方法包括接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。该方法进一步包括至少部分地基于主文档生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。该方法进一步包括从一个或多个第一子项选择第一子项。
Description
相关申请的交叉引用
本申请要求于2019年4月3日提交的题为“SYSTEMS AND METHODS FOR GENERATINGLOGICAL DOCUMENTS FOR A DOCUMENT EVALUATION SYSTEM(用于为文档评估系统生成逻辑文档的系统和方法)”的美国临时专利申请第62/828,881号的优先权,其通过引用整体并入本文。
背景技术
本发明的某些实施例涉及处理文本数据的评估系统。更具体地,本发明的一些实施例提供了用于为文档评估系统生成逻辑文档的系统和方法。
合同和协议通常会在其存续期内被多次修订。在示例中,主协议已由许多协议修订,这些协议已由后续协议修订。这通常会在各种文档之间创建复杂的关系。例如,某些修订可能不引用主协议,从而在源文档及其从属文档之间产生多个分离度(例如,2或3度)。因此,要确定源文档的任何项(例如,任何条款、规定和/或段落)的当前或历史状态,需要对包括源文档及其所有从属文档在内的整个文档族进行广泛审查。例如,常规的审查过程通常涉及手动审查文档,这是非常低效的,并且很容易由审查人员造成人为错误。这些问题是复杂的,导致当雇用了许多审查人员来评估多个文档族中的大量文档时,关于评估文档规定和款出现不一致和不准确的情况。为了解决这些问题,常规方法通常涉及多轮审查用于质量控制,这进一步提高了评估过程中的低效和不一致性。因此,用于许多文档族中的大量文档的常规评估系统是劳动密集型、耗时且效率低下的。
因此,非常期望提供和/或改进用于为文档评估系统生成逻辑文档的技术。
发明内容
本发明的某些实施例涉及处理文本数据的评估系统。更具体地,本发明的一些实施例提供了用于为文档评估系统生成逻辑文档的系统和方法。
根据一些实施例,一种用于为文档评估系统生成逻辑文档的方法包括接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。该方法进一步包括至少部分地基于主文档生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。该方法进一步包括从一个或多个子文档选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给与对应于所识别的主项的当前文档值;将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及与对应于所识别的主项的当前文档值相关联的当前引用被更改为第一引用。第一引用标识第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将与对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及第一引用和第一日期与局部文档值相关联。
根据某些实施例,一种用于为文档评估系统生成逻辑文档的系统包括一个或多个处理器和存储指令的存储器。当一个或多个处理器执行指令时,系统接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。当由一个或多个处理器执行指令时,使得系统至少部分地基于主文档进一步生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。当由一个或多个处理器执行指令时,使得系统进一步从一个或多个第一子项中选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给与对应于所识别的主项的当前文档值;将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及与对应于所识别的主项的当前文档值相关联的当前引用被更改为第一引用。第一引用标识第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将与对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及第一引用和第一日期与局部文档值相关联。
根据一些实施例,提供了一种存储一个或多个程序的非瞬态计算机可读存储介质。该一个或多个程序包括指令,当由一个或多个处理器执行时,使得用于为文档评估系统生成逻辑文档的系统接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。当由一个或多个处理器执行指令时,使得系统至少部分地基于主文档进一步生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。当由一个或多个处理器执行指令时,使得系统进一步从一个或多个第一子项中选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的当前文档值;将第一日期分配给对应于所识别的主项的当前文档值相关联的当前日期;以及将与对应于所识别的主项的当前文档值相关联的当前引用更改为第一引用。第一引用识别第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及第一引用和第一日期与局部文档值相关联。
取决于实施例,可以实现一个或多个优点。参考下文的具体实施方式和附图,可以充分理解本发明的这些优点和各种附加目的、特征和优点。
附图说明
图1A是示出了根据本发明的一个实施例的用于为文档评估系统生成逻辑文档的系统的简化图。
图1B是示出了根据本发明的一个实施例的作为如图1A所示的系统的一部分的文档处理部件的简化图。
图2是示出了根据本发明的一个实施例的用于生成如图1B所示的文档处理部件的逻辑文档的文档的关系的简化图。
图3A和3B是示出了根据本发明的一个实施例的由如图1B所示的文档处理部件生成的逻辑文档的表示的简化图。
图4A和4B是示出了根据本发明的一个实施例的由如图1B所示的文档处理部件生成的逻辑文档的表示的简化图。
图5是示出了根据本发明的一个实施例的用于为文档评估系统生成逻辑文档的方法的简化图。
图6是示出了根据本发明的一个实施例的用于实现为文档评估系统生成逻辑文档的系统的计算系统的简化图。
具体实施方式
常规的系统和方法通常无法高效和/或准确地评估多个文档族中的大量文档以确定一个族中源文档的所有项(例如,所有条款、规定和/或段落)的当前状态。例如,常规的系统和方法通常涉及手动审查与源文档(例如主协议)相关的所有文档。在一些示例中,手动审查过程包括手动审查文档集,以:(1)识别族中的所有文档,包括与源文档相关的它们的项(例如,条款、规定和/或段落),(2)基于所识别的文档的生效日期或执行日期确定所识别的文档的顺序,以及(3)将每个所识别的项的当前状态(例如,每个所识别的条款、规定和/或段落)输入到数据库中以供后来检索。因此,常规的系统和方法提供的数据通常是静态的并且必须手动维护,即使在特定族内的所有文档中数据可以聚合和报告。因此,在某些示例中,常规的系统和方法缺乏在文档存续期间自动且动态生成、维护和/或查询文档项的状态和/或文档族中文档的关系属性的能力。此外,例如,常规的系统和方法缺乏用于维护和/或查询相关文档的状态和/或属性的用户界面。
本发明的某些实施例涉及处理文本数据的评估系统。更具体地,本发明的一些实施例提供了用于为文档评估系统生成逻辑文档的系统和方法。在一些实施例中,起源于计算机技术的一个或多个解决方案克服了计算机技术领域中具体出现的一个或多个问题。在某些实施例中,系统和方法提供了一种文档评估系统,该系统通过使用集成到评估系统中的逻辑文档自动且动态地适应特定文档族的下层文档中的变化。例如,文档族的新文档可以被实时添加以更新逻辑文档并准确地反映族中源文档的特定项的当前状态。在某些示例中,系统和方法提供逻辑文档的图形表示(例如,时间线),指示源文档的项随时间的变化。在其他示例中,系统和方法提供用户界面,允许用户基于逻辑文档查看源文档中特定项的当前状态和历史更改。例如,用户界面被配置为提供到文档(例如,主协议或子协议)中的感兴趣区域的链接,该感兴趣区域与对应于特定项的当前或历史文档值相关。
某些实施例的优点包括基于文档族中的文档生成逻辑文档的自动和动态性质。在一些实施例中,附加的优点包括减少被雇用来查核文档族中的项的人工审查者的数量和成本。在某些实施例中,其他优点包括能够分组、聚合和更新文档数据,以便以新颖和直观的方式动态显示文档数据并与之交互。
图1A是示出了根据本发明的一个实施例的用于为文档评估系统生成逻辑文档的系统100的简化图。此图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。系统100包括文档组织器部件102、文档处理部件104、机器学习(ML)部件106、提取用户界面(UI)部件108、储存库API部件110和储存库112。例如,文档组织器部件102包括前端UI部件114,并且被配置为组织、分类和选择文档116以存储在储存库112中,和/或由系统100进一步管理和分析文档116。例如,文档处理部件104被包括在储存库API部件110中。
在一些实施例中,文档116包括以自然语言编写的文本数据和/或内容。文档116的示例包括合同、专利许可证、商标许可证、版权许可证、技术许可证、合资企业协议、保密协议、研究协议、材料供应协议、制造协议、工作说明以及上述文档的修订和附录。在某些示例中,储存库API部件110被配置为从文档组织器部件102、文档处理部件104、机器学习部件106和/或提取UI部件108接收数据,并将接收到的数据存储在储存库112中。在其他示例中,提取UI部件提供用户界面,用户界面被配置用于使用户与从文档组织器部件102、文档处理部件104、机器学习部件106和/或储存库API部件110接收的数据和文档交互。在一些示例中,提取UI部件的用户界面被配置为允许用户与存储在储存库112中的数据和文档交互。
在某些实施例中,文档处理部件104被配置为从文档组织器部件102接收与文档116相关联的数据以进行进一步处理。在一些示例中,由文档处理部件104的处理包括例如,对接收到的文档116的数据应用光学字符识别技术。作为示例,文档处理部件104被配置为解析接收到的数据以识别、分类和标记文档116内的特定部分。在某些示例中,文档处理部件104被配置为至少部分地基于文档116的处理向文档116添加元数据。在其他示例中,文档处理部件104被配置为在与文档116相关联的数据的格式和/或呈现样式之间转换,并且例如,生成所转换的数据的格式化文档。在又其他示例中,文档处理部件104被配置为生成经处理的文档116的报告、注释和/或文档。
图1B是示出了根据本发明的一个实施例的作为系统100的一部分的文档处理部件104的简化图。此图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。文档处理部件104被配置为接收与主文档202(例如,主协议“XYZ”)相关联的子文档200。在一些示例中,主文档202包括一个或多个主项204。在某些示例中,子文档200包括一个或多个子项206和日期208。例如,文档的项包括与文档的缔约方的身份(例如,姓名、个人、公司实体)、缔约方地址、文档目的、日期和期限(例如,生效日期、到期日期、终止期限、合同期限)、支付款项、所有权、许可授予、终止权、代表、保证、免责声明、责任限制、赔偿、违约赔偿金、保密权、违约、仲裁、转让权、管辖法律和地点、项的存续、整合声明和项的可分割性有关的条款、规定和/或段落。文档的示例包括专利许可证、商标许可证、版权许可证、技术许可证、合资协议、保密协议、研发协议、技术或软件协议、制造协议、租赁协议、销售协议、咨询协议、材料转让协议和质量控制协议。例如,文档的类型包括协议、合同、修订、附录(addenda)、附录(annexure)、附录(appendices)、附件(attachment)、工作说明、报价、展示和待办事项。
在一些实施例中,文档处理部件104被配置为至少部分基于主文档202生成逻辑文档210。在一些示例中,逻辑文档210与其他子文档相关联,子文档包括例如,工作说明212(例如,工作说明“ABC”)、修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)、修订218(例如,修订“JKL”)和修订220(例如,修订“JKL-2”)。在某些示例中,逻辑文档210包括一个或多个当前文档值222。例如,每个当前文档值(CDV)224对应于一个主项204。例如,逻辑文档210的每个当前文档值224与当前日期和当前引用相关联。在一个示例中,当前引用标识主文档202中与一个主项204相关的区域。
在某些实施例中,文档处理部件104被配置为在系统100接收的一个或多个文档中识别主文档202(例如,主协议“XYZ”)。在一些示例中,文档处理部件104被配置为从主文档202提取一个或多个项204。例如,文档处理部件104被配置为通过使用提取的项204来分配(例如,填充)当前文档值224。在某些示例中,文档处理部件104被配置为识别与主文档202相关的一个或多个子文档200、232。在其他示例中,文档处理部件104被配置为创建全局范围组和局部范围组。例如,全局范围组仅包括范围等于全局值的文档。例如,局部范围组仅包括范围等于局部值的文档。在一个示例中,等于全局值的子文档的范围指示子文档的项修订和/或替换主文档202的相对应的项或向主文档202添加新的项。在另一个示例中,等于局部值的子文档的范围表示子文档的项在范围上仅限于子文档。在一些示例中,文档处理部件104被配置为将所识别的一个或多个子文档200、232分组到全局范围组或局部范围组中。
根据一些实施例,文档处理部件104被配置为,对于全局范围组中的每个子文档,基于其生效日期从最早日期到最晚日期对子文档进行排序。在一些示例中,文档处理部件104被配置为识别被包括在全局范围组的每个子文档中的所有项。在某些示例中,文档处理部件104被配置为将与每个子文档的每个所识别的项相关联的新文档值与主文档202的相对应的项的当前文档值进行比较。例如,文档处理部件104被配置为,如果新文档值不等于当前文档值并且如果新文档值不等于空值,则将逻辑文档210中与主文档202的相对应的项相关联的当前文档值替换为与子文档的所识别的项相关联的新文档值。例如,如果文档处理部件104无法识别与新文档值关联的子文档的项相对应的主文档202的项,则文档处理部件104被配置为将空值分配给与子文档的项相关联的新文档值。在一些示例中,文档处理部件104被配置为针对子文档的每个所识别的项,在逻辑文档210中存储与主文档202的相对应的项相关联的文档值的更改历史。例如,与主文档202的项相关联的文档值的更改历史包括与主文档202的项相关联的当前文档值和历史文档值。例如,文档值的更改历史包括文档值更改的日期。在一个示例中,文档值的更改历史表示审计跟踪,该审计跟踪通知用户主文档和子文档中特定项的更改频率和时间。
根据一些实施例,文档处理部件104被配置为,对于局部范围组中的每个子文档,识别被包括在局部范围组的每个子文档中的所有项。在一些示例中,文档处理部件104被配置为过滤出所识别的项,并从与主文档202的款项相关联的当前文档值将过滤后的项分别存储在逻辑文档210中。
在某些实施例中,文档处理部件104被配置为从子文档200的一个或多个子项206中选择子项226。在一些示例中,文档处理部件104被配置为,如果与所选择的子项226相关的主项228被识别并且如果子文档200的范围被确定为等于全局值,则将与所选择的子项226相关联的新文档值分配给对应于所识别的主项228的当前文档值230,将日期208分配给与对应于所识别的主项228的当前文档值230相关联的当前日期,以及将与对应于所识别的主项228的当前文档值230相关联的当前引用改为第一引用。例如,第一引用标识子文档200中与所选择的子项226相关的区域。在某些示例中,文档处理部件104被配置为,如果与所选择的子项226相关的主项228被识别并且如果确定子文档200的范围不等于全局值,则将对应于所选择的子项226的局部文档值添加到逻辑文档210,将与所选择的子项226相关联的新文档值分配给局部文档值,并将第一引用和日期208与局部文档值关联。
根据一些实施例,文档处理部件104被配置为,对于每个主项204,将与主项204相关联的原始文档值分配给对应于主项204的当前文档值224,将主文档的日期关联到与对应于主项204的当前文档值224相关联的当前日期,并生成与对应于主项204的当前文档值224相关联的当前引用。例如,日期与主文档202的生效日期相关。
根据某些示例,文档处理部件104被配置为,如果没有与所选择的子项226相关的主项被识别并且如果确定子文档200的范围等于全局值,则将对应于所选择的子项226的当前文档值224添加到逻辑文档210,将与所选择的子项226相关联的新文档值分配给所添加的当前文档值,将第一引用与所添加的当前文档值的当前引用关联,以及将日期208与所添加的当前文档值的当前日期关联。例如,第一引用标识子文档200中与所选择的子项226相关的区域。例如,所添加的文档值与当前日期和当前引用相关联。在一些示例中,文档处理部件104被配置为,如果没有与所选择的子项226相关的主项被识别并且如果确定子文档200的范围不等于全局值,则将对应于所选择的子项226的局部文档值添加到逻辑文档210,将与所选子项226相关联的新文档值分配给局部文档值,以及将第一引用和日期208与局部文档值关联。
在一些实施例中,文档处理部件104被配置为向逻辑文档210添加对应于所识别的主项228的历史文档值。例如,历史文档值与历史日期和历史引用相关联。在一些示例中,文档处理部件104被配置为在将日期208分配给与对应于所识别的主项228的当前文档值230相关联的当前日期之前,将与对应于所识别的主项228的当前文档值230相关联的当前日期分配给历史日期。在某些示例中,文档处理部件104被配置为在将与对应于所识别的主项228的当前文档值230相关联的当前引用更改为第一引用之前,将与对应于所识别的主项228的当前文档值230相关联的当前引用分配给历史引用。例如,第一引用标识子文档200中与所选择的子项226相关的区域。例如,日期208与子文档200的生效日期相关。
在某些实施例中,文档处理部件104被配置为接收与主文档202相关联的第二子文档232。例如,第二子文档包括一个或多个第二子项和第二日期。在一些示例中,文档处理部件104被配置为识别与所识别的主项228相关的一个或多个第二项中的第二项234。在某些示例中,文档处理部件104被配置为,如果与所识别的主项228相关的第二项234被识别、如果确定第二子文档232的范围等于全局值并且如果第二日期晚于与对应于所识别的主项228的当前文档值230相关联的当前日期,则将与所识别的第二项234相关联的新文档值分配给对应于所识别的主项228的当前文档值230,将第二日期分配给与对应于所识别的主项228的当前文档值230相关联的当前日期,并将与对应于所识别的主项228的当前文档值230相关联的当前引用更改为第二引用。例如,第二引用标识第二子文档232中与所选择的第二子项234相关的区域。
根据一些实施例,文档处理部件104被配置为向逻辑文档210添加对应于所识别的主项228的历史文档值。例如,历史文档值与历史日期和历史引用相关联。在一些示例中,文档处理部件104被配置为在将与所识别的第二子项232相关联的新文档值分配给对应于所识别的主项228的当前文档值之前,将对应于所识别的主项228的当前文档值分配给历史文档值。在某些示例中,文档处理部件104被配置为在将第二子文档232的日期分配给与对应于所识别的主项228的当前文档值230相关联的当前日期之前,将与对应于所识别的主项228的当前文档值230相关联的当前日期分配给历史日期。在一些示例中,文档处理部件104被配置为在将与对应于所识别的主项228的当前文档值230相关联的当前引用更改为第二引用之前,将与对应于所识别的主项228的当前文档值230相关联的当前引用分配给历史引用。例如,第二引用标识第二子文档232中与所选择的第二子项234相关的区域。例如,第二子文档232的第二日期与第二子文档232的生效日期相关。
根据一些实施例,文档处理部件104被配置为,如果确定第二子文档232的范围等于全局值并且如果确定第二子文档232的第二日期等于或早于与对应于所识别的主项228的当前文档值230相关联的当前日期,则将与所识别的主项228相对应的历史文档值添加到逻辑文档210,将与所识别的第二子项234相关联的新文档值分配给历史文档值,将第二子文档232的第二日期分配给历史日期,并且将第二引用分配给历史引用。例如,历史文档值与历史日期和历史引用相关联。例如,第二引用标识第二子文档232中与所选第二子项234相关的区域。在一个示例中,第二子文档232的第二日期与第二子文档232的生效日期相关。
在一些实施例中,文档处理部件104被配置为,如果确定第二子文档232的范围不等于全局值,则将对应于所识别的第二子项234的局部文档值添加到逻辑文档210中,将与所识别的第二子项234相关联的新文档值分配给局部文档值,并且将第二引用和第二日期与局部文档值关联。例如,第二引用标识第二子文档232中与所选择的第二子项234相关的区域。例如,第二日期与第二子文档232的生效日期相关。
在某些实施例中,逻辑文档210包括一个或多个当前文档值的集合。例如,每个集合对应于如图1A所示的多个文档116的文档项。例如,多个文档116包括主文档202和与主文档202相关联的子文档200。在一些示例中,每个历史文档值与历史日期和历史引用相关联。例如,历史引用标识多个文档116的文档中与文档项相关的区域。例如,历史日期与文档的生效日期相关。在某些示例中,每个集合包括一个或多个当前文档值224中的一个当前文档值。例如,与一个当前文档值相关联的历史日期与当前日期相关。例如,与一个当前文档相关联的历史引用与当前引用相关。
根据一些实施例,文档处理部件104被配置为基于与集合中的历史文档值相关联的历史日期,从最早日期到最晚日期对每个集合进行排序。例如,每个经排序的集合表示与多个文档116的文档项相对应的文档值的时间线。在一些示例中,文档处理部件104被配置为接收如图1A所示的多个文档116。例如,文档处理部件104被配置为从多个文档116识别主文档202。例如,文档处理部件104被配置为从多个文档116确定与主文档202相关联的一个或多个子文档。
根据某些实施例,文档处理部件104被配置为基于一个或多个关键项,从多个文档116确定与主文档202相关联的一个或多个子文档。例如,文档的关键项包括文档类型、文档的日期(例如,生效日期)和文档各方。例如,基于用户需求预确定关键项。在一些示例中,参考图1A,机器学习部件106被配置为通过使用机器学习和自然语言处理(NLP)/文本提取技术来确定多个文档116的项(例如,关键项)。在某些示例中,前端UI部件114被配置为响应于所确定的项的置信度小于预定阈值,显示所确定的项以及与所确定的项相关联的文档以供外部审查和验证。在一些示例中,机器学习部件106被配置为确定与主文档202相关联的一个或多个子文档的范围。例如,机器学习部件106被配置为在具有预定范围的文档集合上进行训练以确定文档的范围。
图2是示出了根据本发明的一个实施例的用于生成文档处理部件104的逻辑文档210的文档的关系300的简化图。此图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。在一些示例中,文档的关系300包括主文档202(例如,主协议“XYZ”)和与主文档202相关联的子文档。在某些示例中,与主文档202相关联的子文档包括工作说明212(例如,工作说明“ABC”)、修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)、修订218(例如,修订“JKL”)和修订220(例如,修订“JKL-2)。”例如,主文档202(例如,主文档“XYZ”)包括2015年1月1日的生效日期。例如,工作说明212(例如,工作说明“ABC”)表示对主文档202的修订并且包括2015年6月1日的生效日期。在一个示例中,修订214(例如,修订“DEF”)表示对主文档202的修订并且包括2015年11月1日的生效日期。在另一个示例中,附录216(例如,附录“GHI”)表示对主文档202的附录并且包括2016年11月1日的生效日期。例如,修订218(例如,修订“JKL”)表示对主文档202的修订并且包括2015年9月15日的生效日期。例如,修订220(例如,修订“JKL-2”)表示对修订218的修订并且包括2016年2月1日的生效日期。
在一些实施例中,工作说明212(例如,工作说明“ABC”)、修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)和修订218(例如,修订“JKL”)与主文档202(例如主协议“XYZ”)直接相关。在一些示例中,工作说明212(例如,工作说明“ABC”)、修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)和修订218(例如,修订“JKL”)在文档文本中包括对主文档202(例如,主协议“XYZ”)的一个或多个引用。在某些示例中,修订220(例如,修订“JKL-2”)与主文档202(例如,主协议“XYZ”)不直接相关。例如,修订220(例如,修订“JKL-2”)与修订218(例如,修订“JKL”)直接相关。例如,修订220(例如,修订“JKL-2”)在文档文本中包括对修订218(例如,修订“JKL”)的一个或多个引用。在一个示例中,修订220(例如,修订“JKL-2”)在文档文本中不包括对主文档202(例如,主协议“XYZ”)的一个或多个引用。在一些示例中,修订220(例如,修订“JKL-2”)对修订218(例如,修订“JKL”)的一个或多个项进行了修订。
在某些实施例中,修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)、修订218(例如,修订“JKL”)和修订220(例如,修订“JKL-2”)包括等于全局值的范围。在一些示例中,修订214(例如,修订“DEF”)、附录216(例如,附录“GHI”)、修订218(例如,修订“JKL”)和修订220(例如,修订“JKL-2”)对如图1B所示的一个或多个主项204进行了修订。在某些示例中,工作说明212(例如,工作说明“ABC”)包括不等于全局值的范围。例如,工作说明212(例如,工作说明“ABC)包括等于局部值的范围。
图3A和3B是示出了根据本发明的一个实施例的由文档处理部件104生成的逻辑文档210的表示的简化图。这些图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。参考图3A,在一些示例中,逻辑文档210的表示包括被包括在逻辑文档210中包括的当前文档值(例如,当前合同值)的顶层视图。例如,顶层视图包括逻辑文档210的所有项(例如,项1、项2、项3、项4、项5、…、项N、项N+1)以及与表格表示中所示的每个项相关联的当前文档值(例如,值11、值21、值32、值40、值50、…、值N1、值N+10)。在某些示例中,参考图1A,前端UI部件114被配置为向系统100的用户显示逻辑文档210的顶层视图。在一些示例中,前端UI部件114被配置为展开顶层视图以向用户显示逻辑文档210的附加信息。
在一些示例中,前端UI部件114被配置为向系统100的用户显示逻辑文档210的细节级视图。在一些示例中,参考图3B,逻辑文档210的细节级视图包括逻辑文档210的所有项的表格表示以及与表格表示中所示的每个项相关联的当前文档值(例如,值11、值21、值32、值40、值50、…、值N1、值N+10)。在某些示例中,逻辑文档210的细节级视图还包括主文档202(例如,主协议“XYZ”)和对应于逻辑文档210的每个项的每个子文档212-220(例如,附录“GHI”、修订“DEF”、修订“JKL”、修订“JKL-2”和工作说明“ABC”)的文档值。在一些示例中,细节级视图还包括每个文档(例如,主协议“XYZ”、附录“GHI”、修订“DEF”、修订“JKL”和修订“JKL-2”以及工作说明“ABC”)的日期。例如,每个文档的日期与文档的生效日期相关。
在某些实施例中,当前文档值和其他文档值以特定顺序显示在细节级视图的表格表示中。例如,主文档202的当前文档值和文档值分别显示在逻辑文档210的表格表示的第一行和第二行中。例如,基于与每个文档相关联的日期来显示子文档212-218(例如,附录“GHI”、修订“DEF”、修订“JKL”和工作说明“ABC”)的文档值,在逻辑文档210的表格表示中,较晚的文档被放置为高于较早的文档。在一个示例中,子文档220(例如,修订“JKL-2”)显示在文档220直接相关的子文档218(例如,修订“JKL”)之后的行中。
根据一些实施例,文档处理部件104被配置为从主文档202(例如,主协议“XYZ”)提取项3的文档值(例如,值30),并将所提取的值(例如,值30)分配给项3的当前文档值。例如,文档处理部件104被配置为响应于确定子文档218(例如,修订“JKL”)的范围等于全局值,从子文档218提取项3的文档值(例如,值31)。例如,文档处理部件104被配置为响应于确定所提取的文档值(例如,值31)不等于项3的当前文档值(例如,值30),将所提取的文档值(例如,值31)分配给项3的当前文档值。在一个示例中,文档处理部件104被配置为在逻辑文档210的图形表示中指示项3的当前文档值在子文档218(例如,修订“JKL”)的日期(例如,2015年9月15日)更改为所提取的文档值(例如,值31)。
根据某些实施例,文档处理部件104被配置为响应于确定子文档220(例如,修订“JKL-2”)的范围等于全局值,从子文档220提取项3的文档值(例如,值32)。例如,文档处理部件104被配置为响应于确定所提取的文档值(例如,值32)不等于项3的当前文档值(例如,值31),将所提取的文档值(例如,值32)分配给项3的当前文档值。在一个示例中,文档处理部件104被配置为在逻辑文档210的图形表示中指示项3的当前文档值在子文档220(例如,修订“JKL-2”)的日期(例如,2016年2月1日)更改为所提取的文档值(例如,值32)。
在一些实施例中,文档处理部件104被配置为分别从主文档202(例如,主协议“XYZ”)提取项4和项5的文档值(例如,值40和值50),并将所提取的值(例如,值40和值50)分配给相应的项4和项5的当前文档值。例如,文档处理部件104被配置为分别从子文档212(例如,工作说明“ABC”)提取项4和项5的文档值(例如,值41和值51)。在一些示例中,文档处理部件104被配置为响应于确定子文档212(例如,工作说明“ABC”)的范围等于局部范围,不将所提取的文档值(例如,值41和值51)分配给相应的项4和项5的当前文档值。在某些示例中,文档处理部件104被配置为在逻辑文档210的图形表示中指示所提取的文档值(例如,值41和值51)分别表示项4和项5的局部文档值。
在某些实施例中,文档处理部件104被配置为从子文档216(例如,附录“GHI”)提取文档值(例如,值N+10)。例如,文档处理部件104被配置为确定所提取的文档值(例如,值N+10)对应于子文档216(如附件“GHI”)之前的主文档202或其他子文档212、214、218、220(例如,工作说明“ABC”、修订“DEF”、修订“JKL”以及修订“JKL-2”)中不存在的新项。在一些示例中,文档处理部件104被配置为向逻辑文档210添加新项(例如,项N+1),并将所提取的文档值(例如,值N+10)分配给所添加的新项(例如,项N+1)的当前文档值。在某些示例中,参考图1A,前端UI部件114被配置为将逻辑文档210的细节级视图折叠到顶层视图。
根据一些实施例,如图2A和2B所示的逻辑文档210的图形表示包括标识主文档或子文档中对应于被包括在逻辑文档210中的文档值的区域的引用。例如,所标识的区域表示与逻辑文档210的文档值相关的主文档或子文档中的文本数据。作为示例,参考图1A,前端UI部件114被配置为在逻辑文档210的顶层视图和细节级视图中提供到所标识的区域的链接,使得响应于点击链接,向用户显示与链接相关联的所标识的区域。例如,前端UI部件114被配置为通过覆盖文档的JSON表示来以PDF格式显示包括所标识的区域的文档的视图。例如,JSON表示包括所标识的区域的位置数据和所标识的区域的文本数据。在一个示例中,文档处理部件104被配置为使用光学字符识别来处理所标识的区域的文本数据。
图4A和4B是示出了根据本发明的一个实施例的由文档处理部件104生成的逻辑文档210的表示的简化图。这些图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。参考图4A,在一些示例中,逻辑文档210的表示包括主文档202(例如,主文档“XYZ”)和子文档212-220(例如,工作说明“ABC”、修订“JKL”、修订“DEF”、修订“JKL-2”和附录“GHI”)的时间线视图,该时间线指示主文档202、其子文档212-220的日期和当前日期。参考图4B,在某些示例中,逻辑文档210的表示包括逻辑文档210的经转换的细节级视图的表格表示,如图3B所示,其中行表示项,列表示文档日期。在一些示例中,文档处理部件104被配置为确定特定日期和项的文档值,并在逻辑文档210的经转换的细节级视图中显示所有确定的文档值。例如,逻辑文档210的经转换的细节级视图被配置为在文档生命周期中的里程碑处标识活动文档值(例如,更改文档值),并为特定项和/或整个文档族提供足迹。例如,足迹允许用户审查被包括在逻辑文档210中的文档的剧本(playbook)使用,并标识文档中与标准项的常规偏差。
在一些实施例中,参考图1A,前端UI部件114被配置为通过使用来自修订了原始文本数据的子文档的文本数据添加到或替换主文档202中的项的原始文本数据来显示基于逻辑文档210的主文档202(例如,主协议“XYZ”)的汇总版本。
图5是示出了根据本发明的一个实施例的用于为文档评估系统生成逻辑文档的方法的简化图。此图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。方法500包括使用一个或多个处理器执行的过程502-518。尽管上文已经使用该方法的一组选定过程示出,但是可以有许多替代物、修改和变型。例如,过程中的一些可以被扩展和/或组合。其他过程可插入上述过程。取决于实施例,过程顺序可以与其他过程互换。
在一些实施例中,方法500的一些或所有过程(例如,步骤)由系统100执行。在某些示例中,方法500的一些或所有过程(例如,步骤)由计算机和/或由代码引导的处理器执行。例如,计算机包括服务器计算机和/或客户端计算机(例如,个人计算机)。在一些示例中,根据非瞬态计算机可读介质(例如,在计算机程序产品中,诸如计算机可读闪存驱动器中)包括的指令执行方法500的一些或所有过程(例如,步骤)。例如,非瞬态计算机可读介质可由包括服务器计算机和/或客户端计算机(例如,个人计算机和/或服务器机架)的计算机读取。例如,由非瞬态计算机可读介质包括的指令由包括服务器计算机的处理器和/或客户端计算机的处理器(例如,个人计算机和/或服务器机架)的处理器执行。
在一些实施例中,在过程502处,接收与主文档相关联的子文档。主文档包括一个或多个主项。子文档包括一个或多个子项和第一日期。在过程504处,至少部分地基于主文档生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。在过程506处,从一个或多个子项选择子项。响应于识别与所选择的子项相关的主项并且响应于确定子文档的范围等于全局范围,在过程508处,将与所选择的子项相关联的新文档值分配给对应于所识别的主项的当前文档值,在过程510处,将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期,并且在过程512处,将与对应于所识别的主项的当前文档值相关联的当前引用更改为第一引用。第一引用标识子文档中与所选择的子项相关的区域。响应于识别与所选择的子项相关的主项并且响应于确定子文档的范围不等于全局范围,在过程514处,将对应于所选择的子项的局部文档值添加到逻辑文档中,在过程516处,将与所选择的子项相关联的新文档值分配给局部文档值,并且在过程518处,将第一引用和第一日期与局部文档值相关联。
图6是示出了根据本发明一个实施例的用于实现处理文本数据的机器学习系统的自适应训练系统的计算系统的简化图。此图仅为示例,不应不适当地限制权利要求的范围。本领域的普通技术人员将认识到许多变型、替代物和修改。计算系统600包括用于通信信息的总线602或其他通信机构、处理器604、显示器606、光标控制部件608、输入设备610、主存储器612、只读存储器(ROM)614、存储单元616和网络接口618。在一些实施例中,方法400的一些或所有过程(例如,步骤)由计算系统600执行。在一些示例中,总线602耦合到处理器604、显示器606、光标控制部件608、输入设备610、主存储器612、只读存储器(ROM)614、存储单元616和/或网络接口618。在某些示例中,网络接口耦合到网络620。例如,处理器604包括一个或多个通用微处理器。在一些示例中,主存储器612(例如,随机存取存储器(RAM)、高速缓存和/或其他动态存储设备)被配置为存储将由处理器604执行的信息和指令。在某些实施例中,主存储器612被配置为在将由处理器604执行的指令的执行期间存储临时变量或其他中间信息。例如,当存储在处理器604可访问的存储单元616中时,指令将计算系统600呈现到专用机器中,该专用机器被定制以执行指令中指定的操作。在一些示例中,ROM 614被配置为存储处理器604的静态信息和指令。在某些示例中,存储单元616(例如,磁盘、光盘或闪存驱动器)被配置为存储信息和指令。
一些实施例中,显示器606(例如,阴极射线管(CRT)、LCD显示器或触摸屏)被配置为向计算系统600的用户显示信息。在一些示例中,输入设备610(例如,字母数字键和其他键)被配置为向处理器604通信信息和命令。例如,光标控制608(例如,鼠标、轨迹球或光标方向键)被配置为向处理器604通信附加信息和命令(例如,控制显示器606上的光标移动)。
根据一些实施例,一种用于为文档评估系统生成逻辑文档的方法包括接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。该方法进一步包括至少部分地基于主文档生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。该方法进一步包括从一个或多个子文档选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给与对应于所识别的主项对应的当前文档值;将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及将与对应于所识别的主项的当前文档值相关联的当前引用更改为第一引用。第一引用标识第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及将第一引用和第一日期与局部文档值相关联。例如,该方法至少根据图1B、图3A、图3B、图4B和/或图5实现。
在一些示例中,对于每个主项,至少部分基于主文档生成逻辑文档包括:将与主项相关联的原始文档值分配给对应于主项的当前文档值;将主文档的第二日期关联到与对应于主项的当前文档值相关联的当前日期;以及生成与对应于主项的当前文档值相关联的当前引用。第二日期与主文档的生效日期相关。
在某些示例中,该方法进一步包括响应于没有识别与所选择的第一子项相关的任何主项并且响应于确定第一子文档的范围等于全局值:将对应于所选择的第一子项的当前文档值添加到逻辑文档;将与所选择的第一子项相关联的新文档值分配给所添加的当前文档值;将第一引用与所添加的当前文档值的当前引用相关联;以及将第一日期与所添加的当前文档值的当前日期相关联。所添加的文档值与当前日期和当前引用相关联。响应于确定第一子文档的范围不等于全局值:将对应于所选择的第一子项的局部文档值添加到逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及第一引用和第一日期与局部文档值相关联。
在一些示例中,该方法进一步包括:将对应于所识别的主项的历史文档值添加到逻辑文档。历史文档值与历史日期和历史引用相关联。在将与所选择的第一子项相关联的新文档值分配给与对应于所识别的主项的当前文档值之前,将与对应于所识别的主项的当前文档值分配给历史文档值。在将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期之前,将与对应于所识别的主项的当前文档值相关联的当前日期分配给历史日期。在将与对应于所识别的主项的当前文档值相关联的当前引用更改为第一引用之前,将与对应于所识别的主项的当前文档值相关联的当前引用分配给历史引用。第一日期与第一子文档的生效日期相关。
在某些示例中,该方法进一步包括:接收与主文档相关联的第二子文档。第二子文档包括一个或多个第二子项和第二日期。识别与所识别的主项相关的一个或多个第二子项的第二子项。响应于识别与所识别的主项相关的一个或多个第二项的第二子项,响应于确定第二子文档的范围等于全局值以及第二日期晚于与对应于所识别的主项的当前文档值相关联的当前日期:将与所识别的第二子项相关联的新文档值分配给对应于所识别的主项的当前文档值;将第二日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及将与对应于所识别的主项的当前文档值相关联的当前引用更改为第二引用。第二引用标识第二子文档中与所识别的第二子项相关的区域。
在一些示例中,该方法进一步包括:将对应于所识别的主项的历史文档值添加到逻辑文档。历史文档值与历史日期和历史引用相关联。在将与所识别的第二子项相关联的新文档值分配给对应于所识别的主项的当前文档值之前,将对应于所识别的主项的当前文档值分配给历史文档值。在将第二日期分配给与对应于所识别的主项的当前文档值相关联的当前日期之前,将与对应于所识别的主项的当前文档值相关联的当前日期分配给历史日期。在将与对应于所识别的主项的当前文档值相关联的当前引用更改为第二引用之前,将与对应于所识别的主项的当前文档值相关联的当前引用分配给历史引用。第二日期与第二子文档的生效日期相关。
在某些示例中,该方法进一步包括,响应于确定第二子文档的范围等于全局值并且第二日期等于或早于与对应于所识别的主项的当前文档值相关联的当前日期:将对应于所识别的主项的历史文档值添加到逻辑文档;将与所识别的第二子项相关联的新文档值分配给历史文档值;将第二日期分配给历史日期;以及将第二引用分配给历史引用。历史文档值与历史日期和历史引用相关联。第二日期与第二子文档的生效日期相关。
在一些示例中,该方法进一步包括响应于确定第二子文档的范围不等于全局值时:将对应于所识别的第二子项的局部文档值添加到逻辑文档;将与所识别的第二子项相关联的新文档值分配给局部文档值;以及将第二引用和第二日期与局部文档值相关联。
在某些实施例中,逻辑文档进一步包括一个或多个历史文档值集合。每个集合对应于多个文档的文档项。该多个文档包括主文档和与主文档相关联的子文档。例如,每个历史文档值与历史日期和历史引用相关联。历史引用标识该多个文档的文档中与文档项相关的区域。历史日期与文档的生效日期相关。例如,每个集合包括一个或多个当前文档值中的一个当前文档值。与一个当前文档值相关联的历史日期与当前日期相关。与一个当前文档相关联的历史引用与当前引用相关。
在一些示例中,该方法进一步包括基于与集合中的历史文档值相关联的历史日期,将每个集合从最早日期到最晚日期进行排序。每个经排序的集合表示与该多个文档的文档项相对应的文档值的时间线。在某些示例中,接收与主文档关联的第一子文档包括:接受多个文档;从多个文档识别主文档;从多个文档中确定与主文档相关联的一个或多个子文档;以及从一个或多个子文档中选择第一子文档。在某些示例中,一个或多个主项包括关于缔约方的身份、日期和期限、支付款项、所有权、许可证授予、终止权、代表、保证、免责声明、责任限制、赔偿、转让权、管辖法律和地点的条款、规定和段落。
在某些示例中,接收与主文档相关联的第一子文档包括通过使用机器学习系统识别一个或多个主项和一个或多个第一子项。例如,接收与主文档相关联的第一子文档进一步包括通过使用机器学习系统在多个文档中识别第一子文档。例如,在多个文档中识别第一子文档基于一个或多个关键项,一个或多个关键项包括第一文档的文档类型、第一日期和第一子文档的各方。
根据某些实施例,一种用于为文档评估系统生成逻辑文档的系统包括一个或多个处理器和存储指令的存储器。当由一个或多个处理器执行时,指令使系统执行接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。当由一个或多个处理器执行时,指令使得系统至少部分地基于主文档进一步执行生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。当由一个或多个处理器执行时,指令使得系统进一步从一个或多个第一子项中选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给与对应于所识别的主项的当前文档值;将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及将与对应于所识别的主项的当前文档值相关联的当前引用被更改为第一引用。第一引用标识第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及将第一引用和第一日期与局部文档值相关联。例如,该系统至少根据图1B、图3A、图3B和图4B实现。
在一些实施例中,逻辑文档进一步包括一个或多个历史文档值集合。每个集合对应于多个文档的文档项,多个文档包括主文档和与主文档相关联的子文档。例如,每个历史文档值与历史日期和历史引用相关联。历史引用识别该多个文档的文档中与文档项相关的区域。历史日期与文档的生效日期相关。例如,每个集合包括一个或多个当前文档值中的一个当前文档值。与一个当前文档值相关联的历史日期与当前日期相关。与一个当前文档值相关联的历史引用与当前引用相关。
在某些示例中,当由一个或多个处理器执行时,指令使得系统进一步执行:基于与集合中的历史文档值相关联的历史日期,将每个集合从最早日期到最晚日期进行排序。每个经排序的集合表示与该多个文档的文档项相对应的文档值的时间线。在一些示例中,接收与主文档相关联的第一个子文档包括:接受多个文档;从多个文档识别主文档;从多个文档中确定与主文档相关联的一个或多个子文档;以及从一个或多个子文档中选择第一子文档。
根据一些实施例,提供了一种存储一个或多个程序的非瞬态计算机可读存储介质。该一个或多个程序包括指令,当由一个或多个处理器执行时,该指令使得用于为文档评估系统生成逻辑文档的系统执行接收与主文档相关联的第一子文档。主文档包括一个或多个主项。第一子文档包括一个或多个第一子项和第一日期。当由一个或多个处理器执行时,指令使得系统至少部分地基于主文档进一步生成逻辑文档。逻辑文档包括一个或多个当前文档值。每个当前文档值对应于一个主项,并与当前日期和当前引用相关联。当前引用标识主文档中与一个主项相关的区域。当由一个或多个处理器执行时,指令使得系统进一步从一个或多个第一子项中选择第一子项。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围等于全局值:将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的当前文档值;将第一日期分配给与对应于所识别的主项的当前文档值相关联的当前日期;以及将与对应于所识别的主项的当前文档值相关联的当前引用更改为第一引用。第一引用标识第一子文档中与所选择的第一子项相关的区域。响应于识别与所选择的第一子项相关的主项,以及响应于确定第一子文档的范围不等于全局值:将对应于所选择的第一子项的局部文档值分配给逻辑文档;将与所选择的第一子项相关联的新文档值分配给局部文档值;以及将第一引用和第一日期与局部文档值相关联。例如,非瞬态计算机可读存储介质至少根据图1B、图3A、图3B和图4B实现。
例如,本发明的各种实施例的一些或所有部件分别和/或与至少另一个部件组合,使用一个或多个软件部件、一个或多个硬件部件和/或软件和硬件部件的一个或多个组合来实现。在另一个示例中,本发明的各种实施例的一些或所有部件分别和/或与至少另一个部件组合,在一个或多个电路(诸如一个或多个模拟电路和/或一个或多个数字电路)中实现。在又一个实施例中,虽然上文所述的实施例指代特定特征,但是本发明的范围还包括具有特征的不同组合的实施例以及不包括所述的全部特征的实施例。在又一个示例中,可以组合本发明的各种实施例和/或示例。
附加地,本文所述的方法和系统可以通过包括可由设备处理子系统执行的程序指令的程序代码在许多不同类型的处理设备上实现。软件程序指令可包括源代码、目标代码、机器代码或可操作以使处理系统执行本文所述的方法和操作的任何其他存储数据。然而,也可以使用其他实现,诸如固件或甚至被配置为执行本文所述的方法和系统的适当设计的硬件。
系统和方法的数据(例如,关联、映射、数据输入、数据输出、中间数据结果、最终数据结果等)可以在一个或多个不同类型的计算机实现的数据存储中存储和实现,诸如不同类型的存储设备和编程结构(例如,RAM、ROM、EEPROM、闪存、平面文档、数据库、编程数据结构、编程变量、IF-THEN(或类似类型)语句结构、应用程序编程接口等)。注意,数据结构描述用于在数据库、程序、存储器或其他计算机可读介质中组织和存储数据以供计算机程序使用的格式。
可以在许多不同类型的计算机可读介质上提供系统和方法,计算机可读介质包括包含指令(例如,软件)的计算机存储机制(例如,CD-ROM、软盘、RAM、闪存、计算机硬盘驱动器、DVD等)以供处理器在执行中使用,以执行方法的操作并实现本文所述的系统。本文描述的计算机部件、软件模块、功能、数据存储器和数据结构可以直接或间接地彼此连接,以便允许其操作所需的数据流。还应注意,模块或处理器包括执行软件操作的代码单元,并且可以实现为例如子例程代码单元、或实现为软件功能代码单元、或实现为对象(如在面向对象的范例中)、或实现为小程序、或在计算机脚本语言中或实现为另一种类型的计算机代码。软件部件和/或功能可能位于单个计算机上或分布在多个计算机上,具体取决于手头的情况。
计算系统可包括客户端设备和服务器。客户端设备和服务器通常彼此远离,并且通常通过通信网络交互。客户端设备和服务器的关系根据在相应计算机上运行且彼此具有客户端设备-服务器关系的计算机程序来产生。
本说明书包含用于特定实施例的许多细节。也可将在本说明书中单独的各实施例的情境中所描述的某些特征以组合的形式实现在单个实施例中。反之,也可单独地在多个实施例中、或在任何合适的子组合中实现在单个实施例的情境中所描述的各种特征。此外,尽管上述特征可被描述为在某些组合中起作用,但在某些情况下,可以从组合中移除来自组合的一个或多个特征,并且组合例如可以被指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了多个操作,但不应当将此理解为要求按所示的特定顺序或顺序地执行此类操作,或者要求要执行所有示出的操作以实现期望的结果。在某些情况下,多任务处理和并行处理可能是有利的。此外,不应当将上文所描述的各实施例中的各种系统组件分开理解为在所有实施例中都要求进行此类分开,并且应当理解,一般可将所描述的程序组件和系统一起集成在单个的软件产品中,或将其封装进多个软件产品中。
尽管已经描述了本发明的特定实施例,但是本领域技术人员将理解,存在与所描述的实施例等效的其他实施例。因此,应当理解,本发明不受所示具体实施例的限制,而仅受所附权利要求书的范围的限制。
Claims (24)
1.一种用于为文档评估系统生成逻辑文档的方法,所述方法包括:
接收与主文档相关联的第一子文档,所述主文档包括一个或多个主项,所述第一子文档包括一个或多个第一子项和第一日期,
至少部分地基于所述主文档生成逻辑文档,所述逻辑文档包括一个或多个当前文档值,每个当前文档值对应于一个主项,并与当前日期和当前引用相关联,所述当前引用标识所述主文档中与所述一个主项相关的区域;
从所述一个或多个第一子项选择第一子项;
响应于识别与所选择的第一子项相关的主项:
响应于确定所述第一子文档的范围等于全局值:
将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值;
将所述第一日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期;
将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为第一引用,所述第一引用标识所述第一子文档中与所选择的第一子项相关的区域;以及
响应于确定所述第一子文档的所述范围不等于所述全局值时:
将对应于所选择的第一子项的局部文档值添加到所述逻辑文档;
将与所选择的第一子项相关联的所述新文档值分配给所述局部文档值;以及
将所述第一引用和所述第一日期与所述局部文档值相关联。
2.如权利要求1所述的方法,其特征在于,对于每个主项,至少部分基于所述主文档生成逻辑文档包括:
将与所述主项相关联的原始文档值分配给对应于所述主项的所述当前文档值;
将所述主文档的第二日期关联到与对应于所述主项的所述当前文档值相关联的所述当前日期;以及
生成与对应于所述主项的所述当前文档值相关联的所述当前引用;
其中所述第二日期与所述主文档的生效日期相关。
3.如权利要求1所述的方法,进一步包括:
响应于没有识别与所选择的第一子项相关的任何主项:
响应于确定所述第一子文档的所述范围等于所述全局值:
将对应于所选择的第一子项的当前文档值添加到所述逻辑文档;所添加的文档值与当前日期和当前引用相关联;
将与所选择的第一子项相关联的所述新文档值分配给所添加的当前文档值;
将所述第一引用与所添加的当前文档值的所述当前引用相关联;
将所述第一日期与所添加的当前文档值的所述当前日期相关联;以及
响应于确定所述第一子文档的所述范围不等于全局值:
将对应于所选择的第一子项的局部文档值添加到所述逻辑文档;
将与所选择的第一子项相关联的所述新文档值分配给所述局部文档值;以及
将所述第一引用和所述第一日期与所述局部文档值相关联。
4.如权利要求1所述的方法,进一步包括:
将对应于所识别的主项的历史文档值添加到所述逻辑文档,所述历史文档值与历史日期和历史引用相关联;
在将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值之前,将对应于所识别的主项的所述当前文档值分配给所述历史文档值;
在将所述第一日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期之前,将与对应于所识别的主项的所述当前文档值相关联的所述当前日期分配给所述历史日期;以及
在将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为所述第一引用之前,将与对应于所识别的主项的所述当前文档值相关联的所述当前引用分配给所述历史引用;
其中所述第一日期与所述第一子文档的生效日期相关。
5.如权利要求1所述的方法,进一步包括:
接收与所述主文档相关联的第二子文档,所述第二子文档包括一个或多个第二子项和第二日期;
识别所述一个或多个第二子项中的与所识别的主项相关的第二子项;
响应于识别所述一个或多个第二子项中的与所识别的主项相关的第二子项:
响应于确定所述第二子文档的所述范围等于所述全局值并且所述第二日期晚于与对应于所识别的主项的所述当前文档值相关联的所述当前日期:
将与所识别的第二子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值;
将所述第二日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期;
将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为第二引用,所述第二引用识别所述第二子文档中与所识别的第二子项相关的区域。
6.如权利要求5所述的方法,进一步包括:
将对应于所识别的主项的历史文档值添加到所述逻辑文档,所述历史文档值与历史日期和历史引用相关联;
在将与所识别的第二子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值之前,将对应于所识别的主项的所述当前文档值分配给所述历史文档值;
在将所述第二日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期之前,将与对应于所识别的主项的所述当前文档值相关联的所述当前日期分配给所述历史日期;以及
在将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为所述第二引用之前,将与对应于所识别的主项的所述当前文档值相关联的所述当前引用分配给所述历史引用;
其中所述第二日期与所述第二子文档的生效日期相关。
7.如权利要求5所述的方法,进一步包括:
响应于确定所述第二子文档的所述范围等于所述全局值并且所述第二日期等于或早于与对应于所识别的主项的所述当前文档值相关联的所述当前日期:
将对应于所识别的主项的历史文档值添加到所述逻辑文档,所述历史文档值与历史日期和历史引用相关联;
将与所识别的第二子项相关联的所述新文档值分配给所述历史文档值;
将所述第二日期分配给所述历史日期;以及
将所述第二引用分配给所述历史引用;
其中所述第二日期与所述第二子文档的生效日期相关。
8.如权利要求5所述的方法,进一步包括:
响应于确定所述第二子文档的所述范围不等于所述全局值:
将对应于所识别的第二子项的局部文档值添加到所述逻辑文档;
将与所识别的第二子项相关联的所述新文档值分配给所述局部文档值;以及
以及将所述第二引用和所述第二日期与所述局部文档值相关联。
9.如权利要求1所述的方法,其特征在于:
所述逻辑文档进一步包括一个或多个历史文档值集合;并且
每个集合对应于多个文档的文档项,所述多个文档包括所述主文档和与所述主文档相关联的子文档。
10.如权利要求9所述的方法,其特征在于:
每个历史文档值与历史日期和历史引用相关联;
所述历史引用识别所述多个文档的文档中与所述文档项相关的区域;以及
所述历史日期与所述文档的生效日期相关。
11.如权利要求10所述的方法,其特征在于:
每个集合包括所述一个或多个当前文档值中的一个当前文档值;
与所述一个当前文档值相关联的所述历史日期与所述当前日期相关;以及
与所述一个当前文档相关联的所述历史引用与所述当前引用相关。
12.如权利要求11所述的方法,进一步包括:
基于与所述集合中的历史文档值相关联的所述历史日期,将每个集合从最早日期到最晚日期进行排序;
其中每个经排序的集合表示与所述多个文档的所述文档项相对应的文档值的时间线。
13.如权利要求1所述的方法,其特征在于,接收与主文档相关联的第一子文档包括:
接受多个文档;
从所述多个文档识别所述主文档;
从所述多个文档确定与所述主文档相关联的一个或多个子文档;以及
以及从所述一个或多个子文档选择所述第一子文档。
14.如权利要求1所述的方法,其特征在于,所述一个或多个主项包括关于缔约方的身份、日期和期限、支付款项、所有权、许可授予、终止权、代表、保证、免责声明、责任限制、赔偿、转让权、管辖法律和地点的条款、规定和段落。
15.如权利要求1所述的方法,其特征在于,接收与主文档相关联的第一子文档包括通过使用机器学习系统识别所述一个或多个主项和所述一个或多个第一子项。
16.如权利要求15所述的方法,其特征在于,接收与主文档相关联的第一子文档进一步包括通过使用机器学习系统在多个文档中识别所述第一子文档。
17.如权利要求1所述的方法,其特征在于,在多个文档中识别所述第一子文档基于一个或多个关键项,所述一个或多个关键项包括所述第一文档的文档类型、所述第一日期和所述第一子文档的各方。
18.一种用于为文档评估系统生成逻辑文档的系统,所述系统包括:
一个或多个处理器;以及
存储器,所述存储器存储指令,当由所述一个或多个处理器执行所述指令时,使得所述系统执行:
接收与主文档相关联的第一子文档,所述主文档包括一个或多个主项,所述第一子文档包括一个或多个第一子项和第一日期,
至少部分地基于所述主文档生成逻辑文档,所述逻辑文档包括一个或多个当前文档值,每个当前文档值对应于一个主项,并与当前日期和当前引用相关联,所述当前引用标识所述主文档中与所述一个主项相关的区域;
从所述一个或多个第一子项中选择第一子项;
响应于识别与所选择的第一子项相关的主项:
响应于确定所述第一子文档的范围等于全局值:
将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值;
将所述第一日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期;
将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为第一引用,所述第一引用识别所述第一子文档中与所选择的第一子项相关的区域;以及
响应于确定所述第一子文档的所述范围不等于全局值:
将对应于所选择的第一子项的局部文档值添加到所述逻辑文档;
将与所选择的第一子项相关联的所述新文档值分配给所述局部文档值;以及
将所述第一引用和所述第一日期与所述局部文档值相关联。
19.如权利要求18所述的系统,其特征在于:
所述逻辑文档进一步包括一个或多个历史文档值集合;并且
每个集合对应于多个文档的文档项,所述多个文档包括所述主文档和与所述主文档相关联的子文档。
20.如权利要求19所述的系统,其特征在于:
每个历史文档值与历史日期和历史引用相关联,
所述历史引用标识所述多个文档的文档中与所述文档项相关的区域;以及
所述历史日期与所述文档的生效日期相关。
21.如权利要求20所述的系统,其特征在于:
每个集合包括所述一个或多个当前文档值中的一个当前文档值;
与所述一个当前文档值相关联的所述历史日期与所述当前日期相关;以及
与所述一个当前文档值相关联的所述历史引用与所述当前引用相关。
22.如权利要求21所述的系统,其特征在于,当由所述一个或多个处理器执行时,所述指令使得所述一个或多个处理器进一步执行:
基于与所述集合中的历史文档值相关联的所述历史日期,将每个集合从最早日期到最晚日期进行排序;
其中每个经排序的集合表示与所述多个文档的所述文档项相对应的文档值的时间线。
23.如权利要求1所述的系统,其特征在于,接收与主文档相关联的第一子文档包括:
接受多个文档;
从所述多个文档识别所述主文档;
从所述多个文档中确定与所述主文档相关联的一个或多个子文档;以及
从所述一个或多个子文档选择所述第一子文档。
24.一种存储一个或多个程序的非瞬态计算机可读存储介质,所述一个或多个程序包括指令,当由一个或多个处理器执行时,所述指令使得用于为文档评估系统生成逻辑文档的系统执行:
接收与主文档相关联的第一子文档,所述主文档包括一个或多个主项,所述第一子文档包括一个或多个第一子项和第一日期,
至少部分地基于所述主文档生成逻辑文档,所述逻辑文档包括一个或多个当前文档值,每个当前文档值对应于一个主项并与当前日期和当前引用相关联,所述当前引用标识所述主文档中与所述一个主项相关的区域;
从所述一个或多个第一子项选择第一子项;
响应于识别与所选择的第一子项相关的主项:
响应于确定所述第一子文档的范围等于全局值:
将与所选择的第一子项相关联的新文档值分配给对应于所识别的主项的所述当前文档值;
将所述第一日期分配给与对应于所识别的主项的所述当前文档值相关联的所述当前日期;并且
将与对应于所识别的主项的所述当前文档值相关联的所述当前引用更改为第一引用,所述第一引用标识所述第一子文档中与所选择的第一子项相关的区域;以及
响应于确定所述第一子文档的所述范围不等于所述全局值:
将对应于所选择的第一子项的局部文档值添加到所述逻辑文档;
将与所选择的第一子项相关联的所述新文档值分配给所述局部文档值;以及
将所述第一引用和所述第一日期与所述局部文档值相关联。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962828881P | 2019-04-03 | 2019-04-03 | |
US62/828,881 | 2019-04-03 | ||
PCT/US2020/026611 WO2020206278A1 (en) | 2019-04-03 | 2020-04-03 | Systems and methods for generating logical documents for a document evaluation system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114175021A true CN114175021A (zh) | 2022-03-11 |
CN114175021B CN114175021B (zh) | 2022-12-23 |
Family
ID=72662324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080041372.2A Active CN114175021B (zh) | 2019-04-03 | 2020-04-03 | 用于为文档评估系统生成逻辑文档的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11222174B2 (zh) |
CN (1) | CN114175021B (zh) |
WO (1) | WO2020206278A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021141937A1 (en) * | 2020-01-06 | 2021-07-15 | Jpmorgan Chase Bank, N.A. | System and method for implementing a digital rights management adoption reference architecture |
WO2023091310A1 (en) * | 2021-11-17 | 2023-05-25 | Docjuris Inc. | Systems and methods for automated intuitive document editing |
US20230229800A1 (en) * | 2022-01-14 | 2023-07-20 | Citrix Systems, Inc. | Content variation to track documents |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1794229A (zh) * | 2004-12-20 | 2006-06-28 | 微软公司 | 管理和使用计算机生成的文档中的数据 |
US20120158637A1 (en) * | 2010-12-20 | 2012-06-21 | Yahoo! Inc. | Dynamic Online Communities |
CN105474209A (zh) * | 2013-06-14 | 2016-04-06 | 微软技术许可有限责任公司 | 管理对共享文档的改动 |
CN106250385A (zh) * | 2015-06-10 | 2016-12-21 | 埃森哲环球服务有限公司 | 用于文档的自动化信息抽象处理的系统和方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7110992B2 (en) | 2000-12-29 | 2006-09-19 | International Business Machines Corporation | Searchable logical document architecture |
US20090281853A1 (en) * | 2008-05-08 | 2009-11-12 | Pramata Corporation | Legal Instrument Management Platform |
US8849873B2 (en) | 2009-03-18 | 2014-09-30 | Bentley Systems, Incorporated | Specifications automation system and method |
US8140558B2 (en) | 2009-05-22 | 2012-03-20 | International Business Machines Corporation | Generating structured query language/extensible markup language (SQL/XML) statements |
US20120284310A1 (en) | 2011-05-02 | 2012-11-08 | Malachi Ventures, Llc | Electronic Management System for Authoring Academic Works |
KR20160058587A (ko) | 2014-11-17 | 2016-05-25 | 삼성전자주식회사 | 문서 요약을 위한 디스플레이 장치 및 방법 |
WO2018006072A1 (en) * | 2016-06-30 | 2018-01-04 | Clause, Inc. | Systems and method for forming, storing, managing,and executing contracts |
WO2018170321A1 (en) * | 2017-03-15 | 2018-09-20 | Exari Group, Inc. | Machine evaluation of contract terms |
-
2020
- 2020-04-02 US US16/838,570 patent/US11222174B2/en active Active
- 2020-04-03 CN CN202080041372.2A patent/CN114175021B/zh active Active
- 2020-04-03 WO PCT/US2020/026611 patent/WO2020206278A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1794229A (zh) * | 2004-12-20 | 2006-06-28 | 微软公司 | 管理和使用计算机生成的文档中的数据 |
US20120158637A1 (en) * | 2010-12-20 | 2012-06-21 | Yahoo! Inc. | Dynamic Online Communities |
CN105474209A (zh) * | 2013-06-14 | 2016-04-06 | 微软技术许可有限责任公司 | 管理对共享文档的改动 |
CN106250385A (zh) * | 2015-06-10 | 2016-12-21 | 埃森哲环球服务有限公司 | 用于文档的自动化信息抽象处理的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114175021B (zh) | 2022-12-23 |
WO2020206278A1 (en) | 2020-10-08 |
US20200320250A1 (en) | 2020-10-08 |
US11222174B2 (en) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022202530B2 (en) | Systems and methods for determining relationships among data elements | |
US10019431B2 (en) | Systems and methods for active column filtering | |
US9760953B1 (en) | Computer implemented methods systems and articles of manufacture for identifying tax return preparation application questions based on semantic dependency | |
US9477786B2 (en) | System for metadata management | |
EP2668725B1 (en) | Generating data pattern information | |
US8176470B2 (en) | Collaborative derivation of an interface and partial implementation of programming code | |
US11734579B2 (en) | Systems and methods for extracting specific data from documents using machine learning | |
US20080208918A1 (en) | Efficient data handling representations | |
CN114175021B (zh) | 用于为文档评估系统生成逻辑文档的系统和方法 | |
US10055452B2 (en) | Most likely classification code | |
US20150331903A1 (en) | System for classification code selection | |
US10922328B2 (en) | Method and system for implementing an on-demand data warehouse | |
US10977746B1 (en) | Computer implemented methods systems and articles of manufacture for suggestion-based interview engine for tax return preparation application | |
US11514031B2 (en) | Product navigator | |
US20230376900A1 (en) | Financial documents examination methods and systems | |
US20240062235A1 (en) | Systems and methods for automated processing and analysis of deduction backup data | |
US11663272B2 (en) | Custom data filtering systems and methods | |
Oliveira | ETL for Data Science?: A Case Study | |
US11704094B2 (en) | Data integrity analysis tool | |
JP6336922B2 (ja) | 業務バリエーションに基づく業務影響箇所抽出方法および業務影響箇所抽出装置 | |
US9330115B2 (en) | Automatically reviewing information mappings across different information models | |
Lee | Can an LLM find its way around a Spreadsheet? | |
CN118364804A (zh) | 表单处理方法、装置、设备、存储介质及产品 | |
HK40009607A (zh) | 用於元數據管理的系統 | |
HK40013245A (zh) | 用於確定數據元素之間的關係的系統和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |