CN115115227A - 一种用于造纸领域的产品质量知识图谱构建方法 - Google Patents
一种用于造纸领域的产品质量知识图谱构建方法 Download PDFInfo
- Publication number
- CN115115227A CN115115227A CN202210753820.2A CN202210753820A CN115115227A CN 115115227 A CN115115227 A CN 115115227A CN 202210753820 A CN202210753820 A CN 202210753820A CN 115115227 A CN115115227 A CN 115115227A
- Authority
- CN
- China
- Prior art keywords
- product quality
- papermaking
- data
- fault
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012216 screening Methods 0.000 claims abstract description 4
- 238000001514 detection method Methods 0.000 claims description 25
- 238000003745 diagnosis Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Animal Behavior & Ethology (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Factory Administration (AREA)
Abstract
本发明公开了一种用于造纸领域的产品质量知识图谱构建方法,基于已有造纸领域结构化数据和互联网数据生成产品质量的相关数据,获取的数据通过收集、筛选、分析、汇总形成造纸领域产品质量的基础数据;根据采集的数据信息,进行分词处理后形成造纸领域产品质量语料库;在语料库中选取部分数据为训练集,通过人工方式进行标注作为训练数据;利用标注好的训练数据来迭代训练命名实体识别模型来实现知识的抽取;本发明通过对相关书籍、网页、论坛等信息获取,得到综合造纸领域的产品质量相关数据资料,构建基于造纸领域的产品质量知识分类体系,通过图数据库的形式进行存储;本发明提供的技术方案还可以从造纸行业泛化到其他行业。
Description
技术领域
本发明涉及知识图谱构建技术领域,尤其涉及一种用于造纸领域的产品质量知识图谱构建方法。
背景技术
知识图谱是以概念、实体为中心,表达概念与概念之间,实体与实体之间的关系。知识图谱能够表达关系复杂的知识,从知识图谱中可以清楚的看到影响因素的关联关系、变量链接的传播路径、数据的层次性。同时通过知识图谱状态的变化能够发现故障时延。知识图谱的这些特性正好能够解决复杂工业过程(如造纸)关系难以表达的难题。
现有技术的缺陷和不足:目前,知识图谱在造纸行业的应用还是一片空白。造纸生产过程规模庞大、结构复杂、生产单元之间的耦合性极强,使得造纸生产过程故障诊断的难度越来越大。由于造纸工业过程无法建立精确的数学模型,所以利用数学模型诊断的方法不适用;造纸生产过程中各个设备变量存在错综复杂的关联关系,基于数据的方法由于不能很好的表达这些关联关系导致诊断能力不足。而造纸产品质量问题以及造纸生产过程的故障诊断都需要这种能够表达复杂关联关系的知识库来帮助相关人员进行故障诊断。鉴于此,需要一种或多种方法针对造纸等复杂工业过程进行知识抽取与知识图谱的建立。
发明内容
本发明要解决的问题是造纸领域知识图谱体系空白问题,为解决上述技术问题,本发明提供了一种用于造纸领域的产品质量知识图谱构建方法。
本发明的目的通过以下的技术方案来实现:
一种用于造纸领域的知识抽取及知识图谱构建方法,包括如下步骤:
步骤(1)、收集数据:
基于已有造纸行业结构化数据、互联网数据以及书籍数据生成造纸行业相关数据,这些数据包括已有相关设备和工艺的结构化数据,以及通过爬虫在相关造纸企业网站、造纸故障类网站、造纸产品质量问题相关网站采集的造纸产品质量问题相关文档信息;这些造纸产品质量相关文档信息包括造纸产品质量标准类文档信息、政策标准、专利、报告、百科;获取的数据通过收集、筛选、分析、汇总后形成造纸领域产品质量的基础数据;
步骤(2)、数据分词:
根据上述步骤(1)采集的数据信息,运用分词模型进行分词处理,最后形成造纸领域产品质量语料库;
步骤(3)、数据标注:
根据上述步骤(2)中的语料库,选取部分数据以汉语每个字为识别单位进行人工标注,然后将标注好的数据作为训练集;
在人工标注过程中,标注的分类包含故障类型、故障名、故障设备名称、故障描述(现象)、故障原因以及故障解决办法。
步骤(4)、知识抽取
根据步骤(3)中的训练集建立命名实体识别模型并进行模型训练,用训练好的模型对所有文档进行知识的抽取。
步骤(5)、构建产品质量知识图谱分类体系
运用自顶而下的方式,采用人工构建的方式来构建基于造纸领域产品质量知识图谱的概念和关系分类体系。
构建基于造纸领域产品质量知识图谱的概念和关系分类体系,包括:
5.1、定义造纸产品质量问题的知识分类体系,设计了6类故障概念,分别是产品质量问题、产生原因、现象、解决办法、部位、检测;
5.2、根据上述步骤5.1中6种已定义的造纸产品质量的故障概念,将泛化的概念共现关系按照语义类型进一步细分为7大类以及14小类的概念关系;
7大类概念关系包括:故障诊断、故障表现、作用部位、质量检测、故障部位、检测结果、诊断依据;14小类的概念关系包括:“产品质量问题”与“现象”、“现象”与“产生原因”、“故障决策”与“现象”之间的关系类型定义为“故障表现”;“产品质量问题”与“发生部位”、“部位”与“现象”之间的关系类型定义为“故障部位”;“产品质量问题”与“检测”、“检测”与“现象”之间的关系类型定义为“质量检测”;“产品质量问题”与“产生原因”、“产生原因”与“解决办法”、“解决办法”与“产品质量问题”之间的关系类型定义为“故障诊断”;“检测”与“部位”、“部位”与“解决办法”之间的关系类型定义为“作用部位”;“检测”与“现象”之间的关系类型定义为“检测结果”;“现象”与“产品质量问题”之间的关系类型定义为“诊断依据”。
步骤(6)、知识存储
根据构建的造纸领域产品质量概念和关系分类体系,将抽取出来的知识分类对应存储于Neo4j图数据库中。
其中,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,节点表示实体或概念,边则由属性或关系构成。实体指的是具有可区别性且独立存在的某种事物。概念是具有同种特性的实体构成的集合,如产品质量、设备、工艺等。概念关系是用来描述两个概念之间的语义关系,是结构化知识的重要组成元素。
与现有技术相比,本发明的技术方案具有如下有益效果:
采用本发明的技术方案,通过对相关网站、书籍等的信息获取,得到造纸领域产品质量的基础数据,构建基于造纸领域产品质量知识图谱的概念和关系分类体系,将抽取出来的知识分类对应存储于Neo4j图数据库中,形成基于造纸领域产品质量知识图谱;本发明提供的技术方案还可以从造纸行业泛化到及其他复杂过程工业。
附图说明
图1是本发明的整体工作示意图;
图2是本发明产品质量故障知识图谱概念和分类体系图;
图3是本发明的具体技术方案流程示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图3所示,本发明提供了一种用于造纸领域的产品质量知识图谱构建方法的具体实例,包括如下步骤:
步骤(1)、收集数据:
基于已有造纸行业结构化数据、互联网数据以及书籍数据生成造纸行业相关数据,这些数据包括已有相关设备和工艺的结构化数据,以及通过爬虫在相关造纸企业网站、造纸故障类网站、造纸产品质量问题相关网站采集的造纸产品质量问题相关文档信息;这些造纸产品质量相关文档信息包括造纸产品质量标准类文档信息、政策标准、专利、报告、百科;获取的数据通过收集、筛选、分析、汇总后形成造纸领域产品质量的基础数据;
步骤(2)、数据分词:
根据上述步骤(1)采集的数据信息,运用分词模型进行分词处理,最后形成造纸领域产品质量语料库;
以Thulac分词模型为例进行说明,Thulac分词模型的具体步骤如下:首先导入Thulac工具包;之后再读取收集到的造纸领域产品质量基础数据;然后调用Thulac工具包中的Thulac模块对收集的造纸领域产品质量的基础数据进行分词处理;接着将分词处理后的数据进行保存;最后对保存的数据进行去除标点符号和非法字符操作并以文本的形式重新保存;
步骤(3)、数据标注:
根据上述步骤(2)中的语料库,选取部分数据以汉语每个字为识别单位进行人工标注,然后将标注好的数据作为训练集;
在人工标注过程中,标注的分类包含故障类型、故障名、故障设备名称、故障描述(现象)、故障原因以及故障解决办法。
对语料库中出现的故障类型、故障名、故障设备名称、故障描述(现象)、故障原因以及故障解决办法等相关词分别标注为故障类型实体、故障名实体、故障设备名称实体、故障描述(现象)实体、故障原因实体、故障解决办法实体。以BMES四位序列标注法进行人工标注为例进行说明:B表示词首,M表示词中,E标注词尾,S表示单个词。
步骤(4)、知识抽取
根据步骤(3)中的训练集建立命名实体识别模型并进行模型训练,用训练好的模型对所有文档进行知识的抽取。
以采用基于双向长短时记忆网络和条件随机场模型(简称Bi-LSTM+CRF模型)进行命名实体识别模型的训练,实现知识的抽取为例进行说明:首先将标注好的汉字映射为词向量作为模型的输入;之后将词向量输入到BiLSTM层,输出每个单词对应于每个标签的得分概率;然后在CRF层通过学习标签之间的顺序依赖信息得到最终的预测结果,并输出每个单词的预测的序列标注;最后,将文档数据输入到训练好的Bi-LSTM+CRF模型中进行知识的抽取。
步骤(5)、构建产品质量知识图谱分类体系
运用自顶而下的方式,采用人工构建的方式来构建基于造纸领域产品质量知识图谱的概念和关系分类体系。
构建基于造纸领域产品质量知识图谱的概念和关系分类体系,包括:
5.1、定义造纸产品质量问题的知识分类体系,设计了6类故障概念,分别是产品质量问题、产生原因、现象、解决办法、部位、检测;
5.2、根据上述步骤5.1中6种已定义的造纸产品质量的故障概念,将泛化的概念共现关系按照语义类型进一步细分为7大类以及14小类的概念关系;
5.1、定义造纸产品质量问题的知识分类体系,设计了6类故障概念,分别是产品质量问题、产生原因、现象、解决办法、部位、检测;
5.2、根据上述步骤5.1中6种已定义的造纸产品质量的故障概念,将泛化的概念共现关系按照语义类型进一步细分为7大类以及14小类的概念关系;如图2所示,7大类概念关系包括:故障诊断、故障表现、作用部位、质量检测、故障部位、检测结果、诊断依据;如图2所示,14小类的概念关系包括:“产品质量问题”与“现象”、“现象”与“产生原因”、“故障决策”与“现象”之间的关系类型定义为“故障表现”;“产品质量问题”与“发生部位”、“部位”与“现象”之间的关系类型定义为“故障部位”;“产品质量问题”与“检测”、“检测”与“现象”之间的关系类型定义为“质量检测”;“产品质量问题”与“产生原因”、“产生原因”与“解决办法”、“解决办法”与“产品质量问题”之间的关系类型定义为“故障诊断”;“检测”与“部位”、“部位”与“解决办法”之间的关系类型定义为“作用部位”;“检测”与“现象”之间的关系类型定义为“检测结果”;“现象”与“产品质量问题”之间的关系类型定义为“诊断依据”。
步骤(6)、知识存储
根据构建的造纸领域产品质量概念和关系分类体系,将抽取出来的知识分类对应存储于Neo4j图数据库中。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:采用本发明的技术方案,通过对相关网站、书籍等的信息获取,得到造纸领域产品质量的基础数据,构建基于造纸领域产品质量知识图谱的概念和关系分类体系,将抽取出来的知识分类对应存储于Neo4j图数据库中,形成基于造纸领域产品质量知识图谱;本发明提供的技术方案还可以从造纸行业泛化到及其他复杂过程工业。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想,以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其他场合的,均应视为本发明的保护范围。
Claims (4)
1.一种用于造纸领域的产品质量知识图谱构建方法,其特征在于,包括如下步骤:
步骤(1)、收集数据:
基于已有造纸行业结构化数据、互联网数据以及书籍数据生成造纸行业;获取的数据通过收集、筛选、分析、汇总后形成造纸领域产品质量的基础数据;
步骤(2)、数据分词:
根据上述步骤(1)采集的数据信息,运用分词模型进行分词处理,最后形成造纸领域产品质量语料库;
步骤(3)、数据标注:
根据上述步骤(2)中的语料库,选取部分数据以汉语每个字为识别单位进行人工标注,然后将标注好的数据作为训练集;
在人工标注过程中,标注的分类包含故障类型、故障名、故障设备名称、故障描述、故障原因以及故障解决办法;
步骤(4)、知识抽取
根据步骤(3)中的训练集建立命名实体识别模型并进行模型训练,用训练好的模型对所有文档进行知识的抽取;
步骤(5)、构建产品质量知识图谱分类体系
运用自顶而下的方式,采用人工构建的方式来构建造纸领域产品质量概念和关系的分类体系;
步骤(6)、知识存储
根据构建的造纸领域产品质量概念和关系分类体系,将抽取出来的知识分类对应存储于Neo4j图数据库中。
2.根据权利要求1所述的一种用于造纸领域的产品质量知识图谱构建方法,其特征在于,步骤(1)中所述的相关数据,包括已有相关设备和工艺的结构化数据,以及通过爬虫在相关造纸企业网站、造纸故障类网站、造纸产品质量问题相关网站采集的造纸产品质量问题相关文档信息;这些造纸产品质量相关文档信息包括造纸产品质量标准类文档信息、政策标准、专利、报告、百科。
3.根据权利要求1中所述的一种用于造纸领域的产品质量知识图谱构建方法,其特征在于,在步骤(5)包括以下子步骤:
5.1、定义造纸产品质量问题的知识分类体系,设计了6类造纸故障概念,分别是产品质量问题、产生原因、现象、解决办法、部位、检测;
5.2、根据上述步骤5.1中6种已定义的造纸过程故障概念,将泛化的概念共现关系按照语义类型进一步细分为7大类的概念关系以及14小类的概念关系。
4.根据权利要求3中所述的一种用于造纸领域的产品质量知识图谱构建方法,其特征在于,7大类的概念关系包括:故障诊断、故障表现、作用部位、质量检测、故障部位、检测结果、诊断依据;
14小类的概念关系包括:“产品质量问题”与“现象”、“现象”与“产生原因”、“故障决策”与“现象”之间的关系类型定义为“故障表现”;“产品质量问题”与“发生部位”、“部位”与“现象”之间的关系类型定义为“故障部位”;“产品质量问题”与“检测”、“检测”与“现象”之间的关系类型定义为“质量检测”;“产品质量问题”与“产生原因”、“产生原因”与“解决办法”、“解决办法”与“产品质量问题”之间的关系类型定义为“故障诊断”;“检测”与“部位”、“部位”与“解决办法”之间的关系类型定义为“作用部位”;“检测”与“现象”之间的关系类型定义为“检测结果”;“现象”与“产品质量问题”之间的关系类型定义为“诊断依据”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210753820.2A CN115115227A (zh) | 2022-06-28 | 2022-06-28 | 一种用于造纸领域的产品质量知识图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210753820.2A CN115115227A (zh) | 2022-06-28 | 2022-06-28 | 一种用于造纸领域的产品质量知识图谱构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115115227A true CN115115227A (zh) | 2022-09-27 |
Family
ID=83330016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210753820.2A Pending CN115115227A (zh) | 2022-06-28 | 2022-06-28 | 一种用于造纸领域的产品质量知识图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115227A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897914A (zh) * | 2020-07-20 | 2020-11-06 | 杭州叙简科技股份有限公司 | 用于综合管廊领域的实体信息抽取及知识图谱构建方法 |
CN112231460A (zh) * | 2020-10-27 | 2021-01-15 | 中国科学院合肥物质科学研究院 | 一种基于农业百科知识图谱的问答系统的构建方法 |
CN113360679A (zh) * | 2021-07-08 | 2021-09-07 | 北京国信会视科技有限公司 | 一种基于知识图谱技术的故障诊断方法 |
CN113569055A (zh) * | 2021-07-26 | 2021-10-29 | 东北大学 | 基于遗传算法优化神经网络的露天矿知识图谱构建方法 |
-
2022
- 2022-06-28 CN CN202210753820.2A patent/CN115115227A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897914A (zh) * | 2020-07-20 | 2020-11-06 | 杭州叙简科技股份有限公司 | 用于综合管廊领域的实体信息抽取及知识图谱构建方法 |
CN112231460A (zh) * | 2020-10-27 | 2021-01-15 | 中国科学院合肥物质科学研究院 | 一种基于农业百科知识图谱的问答系统的构建方法 |
CN113360679A (zh) * | 2021-07-08 | 2021-09-07 | 北京国信会视科技有限公司 | 一种基于知识图谱技术的故障诊断方法 |
CN113569055A (zh) * | 2021-07-26 | 2021-10-29 | 东北大学 | 基于遗传算法优化神经网络的露天矿知识图谱构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862343B (zh) | 基于规则和神经网络的商品评论属性级情感分类方法 | |
US10776583B2 (en) | Error correction for tables in document conversion | |
US20170076225A1 (en) | Model-based classification of content items | |
CN110609983B (zh) | 一种政策文件结构化分解方法 | |
CN111783394A (zh) | 事件抽取模型的训练方法、事件抽取方法和系统及设备 | |
US20170075978A1 (en) | Model-based identification of relevant content | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
Rashid et al. | Feature level opinion mining of educational student feedback data using sequential pattern mining and association rule mining | |
CN111767725A (zh) | 一种基于情感极性分析模型的数据处理方法及装置 | |
CN112183056A (zh) | 基于CNN-BiLSTM框架的上下文依赖的多分类情感分析方法和系统 | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
Abdoun et al. | Automatic text classification of pdf documents using nlp techniques | |
Zuhanda et al. | Supply chain strategy during the COVID-19 terms: sentiment analysis and knowledge discovery through text mining | |
Hossain et al. | Comparative sentiment analysis using difference types of machine learning algorithm | |
CN115115227A (zh) | 一种用于造纸领域的产品质量知识图谱构建方法 | |
Khandokar et al. | Event detection and knowledge mining from unlabelled bengali news articles | |
Banshal et al. | MONOVAB: An Annotated Corpus for Bangla Multi-label Emotion Detection | |
Umidjon | UNLOCKING THE POWER OF NATURAL LANGUAGE PROCESSING (NLP) FOR TEXT ANALYSIS | |
Malkadi et al. | Improving code extraction from coding screencasts using a code-aware encoder-decoder model | |
Fritzner | Automated information extraction in natural language | |
Shahade et al. | Deep learning approach-based hybrid fine-tuned Smith algorithm with Adam optimiser for multilingual opinion mining | |
DURGA et al. | ``Sentiment analysis on bangla youtube comments using machine learning techniques,'' | |
Rahman et al. | ChartSumm: A large scale benchmark for Chart to Text Summarization | |
Detection et al. | 17 Emails Classification | |
Hamadouche et al. | AlgBERT: Automatic Construction of Annotated Corpus for Sentiment Analysis in Algerian Dialect |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |