[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110377891B - 事件分析文章的生成方法、装置、设备及计算机可读存储介质 - Google Patents

事件分析文章的生成方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110377891B
CN110377891B CN201910532927.2A CN201910532927A CN110377891B CN 110377891 B CN110377891 B CN 110377891B CN 201910532927 A CN201910532927 A CN 201910532927A CN 110377891 B CN110377891 B CN 110377891B
Authority
CN
China
Prior art keywords
event
content
knowledge graph
article
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910532927.2A
Other languages
English (en)
Other versions
CN110377891A (zh
Inventor
曾启飞
陈思姣
彭卫华
罗雨
卞东海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910532927.2A priority Critical patent/CN110377891B/zh
Publication of CN110377891A publication Critical patent/CN110377891A/zh
Application granted granted Critical
Publication of CN110377891B publication Critical patent/CN110377891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种事件分析文章的生成方法、装置、设备及计算机可读存储介质。本申请实施例通过利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方,进而,根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容,以及根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容,使得能够对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,由于知识图谱能够有效给事件补充更多的知识内容,通过这些知识内容可以更加全面的报道、分析和预测事件,能够有效提高所生成的文章的深度,满足用户对该事件的获知需求,被用户所采纳的可能性有所提升,从而提高了文章生成的可靠性。

Description

事件分析文章的生成方法、装置、设备及计算机可读存储介质
【技术领域】
本申请涉及文章生成技术,尤其涉及一种事件分析文章的生成方法、装置、设备及计算机可读存储介质。
【背景技术】
互联网高速发展的今天,在文章生成领域,机器自动生成的文章越来越多。机器可以根据所收集的事件的相关新闻,自动生成事件的事件介绍文章,以对事件进行简单的介绍。
然而,由于完全根据某个事件的相关新闻生成该事件的文章,可能会使得所生成的文章的内容无法满足用户对该事件的获知需求,被用户所采纳的可能性并不是很高,从而导致了文章生成的可靠性的降低。
【发明内容】
本申请的多个方面提供一种事件分析文章的生成方法、装置、设备及计算机可读存储介质,用以提高文章生成的可靠性。
本申请的一方面,提供一种事件分析文章的生成方法,包括:
利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方;
根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容;
根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容;
对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
本申请的另一方面,提供一种事件分析文章的生成装置,包括:
确定单元,用于利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方;
获得单元,用于根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容;
所述获得单元,还用于根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容;
生成单元,用于对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
本申请的另一方面,提供一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述一方面所提供的事件分析文章的生成方法。
本申请的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面所提供的事件分析文章的生成方法。
由上述技术方案可知,本申请实施例通过利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方,进而,根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容,以及根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容,使得能够对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,由于知识图谱能够有效给事件补充更多的知识内容,通过这些知识内容可以更加全面的报道、分析和预测事件,能够有效提高所生成的文章的深度,满足用户对该事件的获知需求,被用户所采纳的可能性有所提升,从而提高了文章生成的可靠性。
另外,采用本申请所提供的技术方案,通过结合事件知识图谱、参与方知识图谱和事理知识图谱,能够有效对事件进行全面的报道与分析,并进一步预测可能产生的影响。
另外,采用本申请所提供的技术方案,能够有效地提高用户的体验。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的事件分析文章的生成方法的流程示意图;
图2为本申请另一实施例提供的事件分析文章的生成装置的结构示意图;
图3为适于用来实现本申请实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本申请一实施例提供的事件分析文章的生成方法的流程示意图,如图1所示。
101、利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方。
102、根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容。
103、根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容。
104、对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
本申请中的事件,可以为各个领域内所发生的事件,例如,金融领域内所发生的财经事件,例如,投资融资事件等,本申请对此不进行特别限定。
至此,实现了事件的文章的自动生成,通过所生成的文章可以更加全面的报道、分析和预测事件。
需要说明的是,101~104的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方,进而,根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容,以及根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容,使得能够对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,由于知识图谱能够有效给事件补充更多的知识内容,通过这些知识内容可以更加全面的报道、分析和预测事件,能够有效提高所生成的文章的深度,满足用户对该事件的获知需求,被用户所采纳的可能性有所提升,从而提高了文章生成的可靠性。
所谓的知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库,从图的角度来看,知识图谱本质上是一种概念网络,其中的节点表示物理世界中的实体(或概念),而实体之间的各种语义关系则构成网络中的边,并且边是具有方向性的。由此,知识图谱是对物理世界的一种符号表达。
本申请中所采用的事件知识图谱、参与方知识图谱和事理知识图谱这三个知识图谱,是指针对某一个具体的方向中专业概念的知识图谱。
所述事件知识图谱,可以用于表示事件的内容数据。该事件知识图谱中的节点数据可以包括但不限于事件的名称、事件的发生时间、事件的参与方、事件所属的事件领域以及事件介绍,本申请对此不进行特别限定。
例如,以投资并购事件为例,本申请所采用的事件知识图谱中的节点数据可以为事件的名称、事件的发生时间、投资方、被投资方、事件所属的事件领域以及事件介绍。
所述参与方知识图谱,可以用于表示事件参与方的内容数据。该参与方知识图谱中的节点数据可以包括但不限于参与方所属的领域、参与方的事件相关的行为情况、参与方提供的服务产品和范围、参与方的管理信息以及参与方所在信息链的上下游,本申请对此不进行特别限定。
例如,以投资并购事件为例,本申请所采用的参与方知识图谱中的节点数据可以为企业所属的领域、企业的投资融资行为情况、企业提供的服务产品和范围、企业的管理信息以及企业所在信息链的上下游。
所述事理知识图谱,可以用于表示事件的参与方之间的关系数据,其中,关系可以包括但不限于因果、顺承和转折,本申请对此不进行特别限定。该参与方知识图谱以事件为节点,事件之间的关系为边。
本申请可以通过事理图谱可以用于事件推理,例如:事件发生之后会产生哪些影响,包括正面的影响和负面的影响,对一些事件进行分析,预测可能的影响。
可选地,在本实施例的一个可能的实现方式中,在101之前,还可以进一步根据历史发生的与所述事件的名称相同或相似的事件,获得事件语料数据,进而,则可以根据所述事件语料数据,构建所述事件知识图谱、所述参与方知识图谱和所述事理知识图谱。
具体地,具体可以采用现有的知识图谱构建方法,利用事件语料数据,构建所述事件知识图谱、所述参与方知识图谱和所述事理知识图谱。
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以将所述事件的关联内容和所述事件的影响内容,添加到预先设置的文章模板中,生成所述事件的事件分析文章。
具体地,具体可以根据事件的类型,获得所对应的文章模板。其中,所述文章模板可以采用现有的模板生成方法生成,例如,机器学习、人工配置等。
以投资融资事件为例,该事件所属类型所对应的文章模板可以包括但不限于下列内容模块中的至少一项:
标题和导语;
被投资企业介绍;
投资领域的整体投资行情;
投资领域内相关投资事件;
投资企业、投资领域内竞争和布局。
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以根据预先设置的配置文件,对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
具体地,具体可以根据事件的类型,获得所对应的配置文件。其中,所述配置文件可以采用现有的文件生成方法生成,例如,机器学习、人工配置等。
下面将以投资并购事件“百度领投威马汽车”为例,对本申请所提供的技术方案进行详细说明。
首先,可以利用事件知识图谱,确定事件的名称为“百度领投威马汽车”、所述事件所属的投资领域为“无人驾驶领域”、投资方为“百度(领投)”、被投资方为“威马汽车”。
随后,可以根据事件的名称为“百度领投威马汽车”,利用事件知识图谱,获得事件的发生时间、投资方、被投资方、事件所属的投资领域等事件的介绍内容数据。
然后,具体可以根据被投资方为“威马汽车”,利用参与方知识图谱,获得被投资方的企业所属的领域、企业提供的服务产品和范围、企业的管理信息以及企业所在信息链的上下游等企业基本情况介绍数据。
进一步地,具体可以根据被投资方为“威马汽车”,利用事件知识图谱,获得被投资方所有的融资事件的事件数据。进而,还可以进一步对这些事件数据进行统计处理,以获得统计数据,例如,企业股东等。为了更加清晰地展现统计数据,具体可以利用图表展现统计数据。
接着,具体可以根据所述事件所属的投资领域为“无人驾驶领域”,利用事件知识图谱,获得投资领域内所有投资融资事件的事件数据。进而,还可以进一步对这些事件数据进行统计处理,以获得统计数据,例如,投资融资事件及其投资融资金额等。为了更加清晰地展现统计数据,具体可以利用图表展现统计数据。
进一步地,为了使得统计数据更加有意义,可以只将最近时间范围(如最近1年)内的投资融资事件的事件数据和统计数据。
进一步地,具体可以根据所述事件所属的投资领域为“无人驾驶领域”,,利用参与方知识图谱,获得投资领域内所有企业的企业融资数据,例如,融资轮次数量等。为了更加清晰地展现所获得的企业融资数据,具体可以利用图表展现企业融资数据。
接着,具体可以根据投资方为“百度(领投)”,利用参与方知识图谱,获得投资方的企业所属的领域、企业提供的服务产品和范围、企业的管理信息以及企业所在信息链的上下游等企业基本情况介绍数据。
进一步地,具体可以根据投资方为“百度(领投)”,利用事件知识图谱,获得投资方最近N(如1年或5年等)年内所有投资事件的事件数据。进而,还可以进一步对这些事件数据进行统计处理,以获得统计数据,例如,投资领域、投资数量、投资金额等。为了更加清晰地展现统计数据,具体可以利用图表展现统计数据。
进一步地,为了使得统计数据更加有意义,可以只将最近时间范围(如最近1年)内的投资事件的事件数据和统计数据。
随后,具体可以根据投资方为“百度(领投)”,利用事件知识图谱,确定投资方的竞争企业为“腾讯”,进而,则可以进一步利用事件知识图谱,获得竞争企业最近N(如1年或5年等)年内所有投资事件的事件数据。进而,还可以进一步对这些事件数据进行统计处理,以获得统计数据,例如,投资领域、投资数量、投资金额等。为了更加清晰地展现统计数据,具体可以利用图表展现统计数据。
进一步地,具体可以根据所述事件所属的投资领域为“无人驾驶领域”,,利用事件知识图谱,获得投资领域内投资数量最多的N个企业中每个企业的所有投资事件的事件数据。进而,还可以进一步对这些事件数据进行统计处理,以获得统计数据,例如,投资数量、投资金额等。为了更加清晰地展现统计数据,具体可以利用图表展现统计数据。
最后,根据投资方为“百度(领投)”和被投资方为“威马汽车”,利用参与方知识图谱,获得投资方与被投资方之间的关系。
通常,投资方与被投资方之间往往会存在一定关系,具体可以分为三种关系,分别为横向投资关系、纵向投资关系和混合投资关系。其中,横向投资关系,是指投资方与被投资方所属领域属于相似的行业领域,例如,投资方与被投资方所属领域都为零售行业领域;纵向投资关系,是指投资方与被投资方存在上下游关系,例如,投资方所属领域是汽车行业领域,被投资方所属领域是电池行业领域,那么,投资方与被投资方则存在上下游关系;混合投资关系,是指投资方与被投资方所属的领域属于不同的行业领域之间,往往是大企业作为投资方投资小企业。
在获得投资方与被投资方之间的关系之后,可以进一步利用事理知识图谱,进行分析处理,以获得事件的影响,例如,事件对投资方、被投资方、投资领域所产生的影响。
对于横向投资关系,可以利用事理知识图谱,分析投资方与被投资方两者的市场份额等行业内部信息,投资之后是否会对市场份额等行业内部信息造成影响,是否会导致两者的股价波动;对于纵向投资关系,可以利用事理知识图谱,分析投资方与被投资方两者在产品上的供给关系,投资之后是否会对供给关系造成影响,是否会导致两者的股价波动;对于混合投资关系,可以利用事理知识图谱,分析投资方的相似投资事件的事件影响。
在获得事件的上述关联内容,以及事件的影响内容之后,则可以将所述事件的关联内容和所述事件的影响内容,添加到预先设置的文章模板中,生成所述事件的事件分析文章。
例如,可以将事件的发生时间、投资方、被投资方、事件所属的投资领域等事件的介绍内容数据,添加到文章模板中的“标题和导语”部分,并采用一些辅助词汇,例如,语感词汇、语气词汇、语法结构词汇等,将其连接成能够表达完整意思的段落;
或者,再例如,可以将被投资方的所属的领域、企业提供的服务产品和范围、企业的管理信息以及企业所在信息链的上下游等企业基本情况介绍数据,以及被投资方所有的融资事件的事件数据和统计数据,添加到文章模板中的“被投资企业介绍”部分,并采用一些辅助词汇,例如,语感词汇、语气词汇、语法结构词汇等,以及格式符号,例如,表格线条、图表线条等,将其连接成能够表达完整意思的段落;
或者,再例如,可以将投资领域内所有投资融资事件的事件数据和统计数据,以及投资领域内所有企业的企业融资数据,添加到文章模板中的“投资领域的整体投资行情”部分,并采用一些辅助词汇,例如,语感词汇、语气词汇、语法结构词汇等,以及格式符号,例如,表格线条、图表线条等,将其连接成能够表达完整意思的段落;
或者,再例如,可以将最近时间范围(如最近1年)内的投资融资事件的事件数据和统计数据,添加到文章模板中的“投资领域内相关投资事件”部分,并采用一些辅助词汇,例如,语感词汇、语气词汇、语法结构词汇等,以及格式符号,例如,表格线条、图表线条等,将其连接成能够表达完整意思的段落;
或者,再例如,可以将投资方的企业所属的领域、企业提供的服务产品和范围、企业的管理信息以及企业所在信息链的上下游等企业基本情况介绍数据,投资方最近N(如1年或5年等)年内所有投资事件的事件数据和统计数据,以及事件的影响,添加到文章模板中的“投资企业、投资领域内竞争和布局”部分,并采用一些辅助词汇,例如,语感词汇、语气词汇、语法结构词汇等,以及格式符号,例如,表格线条、图表线条等,将其连接成能够表达完整意思的段落。
至此,完成了投资并购事件“百度领投威马汽车”的事件分析文章的自动生成。通过结合事件知识图谱、参与方知识图谱和事理知识图谱,可以给投资并购事件“百度领投威马汽车”补充更多的内容,通过这些补充的内容,可以更加全面地报道和分析投资并购事件“百度领投威马汽车”。
本实施例中,通过利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方,进而,根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容,以及根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容,使得能够对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,由于知识图谱能够有效给事件补充更多的知识内容,通过这些知识内容可以更加全面的报道、分析和预测事件,能够有效提高所生成的文章的深度,满足用户对该事件的获知需求,被用户所采纳的可能性有所提升,从而提高了文章生成的可靠性。
另外,采用本申请所提供的技术方案,通过结合事件知识图谱、参与方知识图谱和事理知识图谱,能够有效对事件进行全面的报道与分析,并进一步预测可能产生的影响。
另外,采用本申请所提供的技术方案,能够有效地提高用户的体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本申请另一实施例提供的事件分析文章的生成装置的结构示意图,如图2所示。本实施例的事件分析文章的生成装置可以包括确定单元21、获得单元22和生成单元23。其中,确定单元21,用于利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方;获得单元22,用于根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容;所述获得单元22,还用于根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容;生成单元23,用于对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
本申请中的事件,可以为各个领域内所发生的事件,例如,金融领域内所发生的财经事件,例如,投资融资事件等,本申请对此不进行特别限定。
至此,实现了事件的文章的自动生成,通过所生成的文章可以更加全面的报道、分析和预测事件。
需要说明的是,本实施例所提供的事件分析文章的生成装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述生成单元23,具体可以用于将所述事件的关联内容和所述事件的影响内容,添加到预先设置的文章模板中,生成所述事件的事件分析文章。
可选地,在本实施例的一个可能的实现方式中,所述生成单元23,具体可以用于根据预先设置的配置文件,对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
可选地,在本实施例的一个可能的实现方式中,所述获得单元22,还可以进一步用于根据历史发生的与所述事件的名称相同或相似的事件,获得事件语料数据;以及根据所述事件语料数据,构建所述事件知识图谱、所述参与方知识图谱和所述事理知识图谱。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的事件分析文章的生成装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过确定单元利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方,进而,由获得单元根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容,以及根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容,使得生成单元能够对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,由于知识图谱能够有效给事件补充更多的知识内容,通过这些知识内容可以更加全面的报道、分析和预测事件,能够有效提高所生成的文章的深度,满足用户对该事件的获知需求,被用户所采纳的可能性有所提升,从而提高了文章生成的可靠性。
另外,采用本申请所提供的技术方案,通过结合事件知识图谱、参与方知识图谱和事理知识图谱,能够有效对事件进行全面的报道与分析,并进一步预测可能产生的影响。
另外,采用本申请所提供的技术方案,能够有效地提高用户的体验。
图3示出了适于用来实现本申请实施方式的示例性计算机系统/服务器12的框图。图3显示的计算机系统/服务器12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图3所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储装置或者系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器25等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口44进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1所对应的实施例所提供的事件分析文章的生成方法。
本申请另一实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图1所对应的实施例所提供的事件分析文章的生成方法。
具体来说,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或页面组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一个计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种事件分析文章的生成方法,其特征在于,包括:
利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方;
根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容;
根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容;
对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
2.根据权利要求1所述的方法,其特征在于,所述对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章,包括:
将所述事件的关联内容和所述事件的影响内容,添加到预先设置的文章模板中,生成所述事件的事件分析文章;或者
根据预先设置的配置文件,对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据历史发生的与所述事件的名称相同或相似的事件,获得事件语料数据;
根据所述事件语料数据,构建所述事件知识图谱、所述参与方知识图谱和所述事理知识图谱。
4.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述事件包括财经事件。
5.一种事件分析文章的生成装置,其特征在于,包括:
确定单元,用于利用事件知识图谱,确定事件的关联信息,所述事件的关联信息包括所述事件的名称、所述事件所属的事件领域和所述事件的参与方;
获得单元,用于根据所述事件的关联信息,利用参与方知识图谱和所述事件知识图谱,获得所述事件的关联内容,所述事件的关联内容包括所述事件的介绍内容、所述事件领域的领域内容和所述参与方的介绍内容;
所述获得单元,还用于根据所述事件的关联信息,利用事理知识图谱,获得所述事件的影响内容;
生成单元,用于对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
6.根据权利要求5所述的装置,其特征在于,所述生成单元,具体用于
将所述事件的关联内容和所述事件的影响内容,添加到预先设置的文章模板中,生成所述事件的事件分析文章;或者
根据预先设置的配置文件,对所述事件的关联内容和所述事件的影响内容进行组织处理,以生成所述事件的事件分析文章。
7.根据权利要求5所述的装置,其特征在于,所述获得单元,还用于
根据历史发生的与所述事件的名称相同或相似的事件,获得事件语料数据;以及
根据所述事件语料数据,构建所述事件知识图谱、所述参与方知识图谱和所述事理知识图谱。
8.根据权利要求5~7任一权利要求所述的装置,其特征在于,所述事件包括财经事件。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~4中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~4中任一所述的方法。
CN201910532927.2A 2019-06-19 2019-06-19 事件分析文章的生成方法、装置、设备及计算机可读存储介质 Active CN110377891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910532927.2A CN110377891B (zh) 2019-06-19 2019-06-19 事件分析文章的生成方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910532927.2A CN110377891B (zh) 2019-06-19 2019-06-19 事件分析文章的生成方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110377891A CN110377891A (zh) 2019-10-25
CN110377891B true CN110377891B (zh) 2023-01-06

Family

ID=68249198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910532927.2A Active CN110377891B (zh) 2019-06-19 2019-06-19 事件分析文章的生成方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110377891B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110955764B (zh) * 2019-11-19 2021-04-06 百度在线网络技术(北京)有限公司 场景知识图谱的生成方法、人机对话方法以及相关设备
CN114417808B (zh) * 2022-02-25 2023-04-07 北京百度网讯科技有限公司 文章生成方法、装置、电子设备以及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2684397A1 (en) * 2007-04-25 2008-11-06 Counsyl, Inc. Methods and systems of automatic ontology population
GB201200158D0 (en) * 2012-01-05 2012-02-15 Rugerro Gramatica Dott Information network with linked information
US9619450B2 (en) * 2013-06-27 2017-04-11 Google Inc. Automatic generation of headlines
CN106874248B (zh) * 2017-01-22 2020-11-24 百度在线网络技术(北京)有限公司 基于人工智能的文章生成方法和装置
CN106844322A (zh) * 2017-01-22 2017-06-13 百度在线网络技术(北京)有限公司 智能文章生成方法和装置
JP6906419B2 (ja) * 2017-10-13 2021-07-21 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム
CN107943774A (zh) * 2017-11-20 2018-04-20 北京百度网讯科技有限公司 文章生成方法和装置
CN108153723B (zh) * 2017-12-27 2021-10-19 北京百度网讯科技有限公司 热点资讯评论文章生成方法、装置及终端设备
CN108694160B (zh) * 2018-05-15 2021-01-22 北京三快在线科技有限公司 文章生成方法、设备及存储介质
CN109446344B (zh) * 2018-11-14 2021-09-24 同方知网(北京)技术有限公司 一种基于大数据的智能分析报告自动生成系统
CN109684483B (zh) * 2018-12-11 2024-07-02 平安科技(深圳)有限公司 知识图谱的构建方法、装置、计算机设备及存储介质
CN109408672B (zh) * 2018-12-14 2020-09-29 北京百度网讯科技有限公司 一种文章生成方法、装置、服务器及存储介质
CN109902302B (zh) * 2019-03-01 2020-03-24 郑敏杰 一种适用于文本分析或数据挖掘的主题图谱生成方法、装置、设备以及计算机存储介质

Also Published As

Publication number Publication date
CN110377891A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
US20190065624A1 (en) Method and device for obtaining answer, and computer device
CN108073429B (zh) 一种支付方式配置方法、装置、设备及存储介质
WO2024099457A1 (zh) 一种信息推荐方法、装置、存储介质及电子设备
CN108108419B (zh) 一种信息推荐方法、装置、设备和介质
CN109284450B (zh) 订单成单路径的确定方法及装置、存储介质、电子设备
CN111143505A (zh) 文档处理方法、装置、介质及电子设备
CN110377891B (zh) 事件分析文章的生成方法、装置、设备及计算机可读存储介质
CN110675249A (zh) 网络借贷的匹配方法、装置、服务器和存储介质
US10769372B2 (en) Synonymy tag obtaining method and apparatus, device and computer readable storage medium
CN110222017B (zh) 实时数据的处理方法、装置、设备及计算机可读存储介质
CN115392235A (zh) 字符匹配方法、装置、电子设备及可读存储介质
CN108536715B (zh) 一种预览页面生成方法、装置、设备以及存储介质
CN114265835A (zh) 基于图挖掘的数据分析方法、装置及相关设备
CN108062423A (zh) 信息推送方法和装置
CN110362688B (zh) 试题标注方法、装置、设备及计算机可读存储介质
US20150170068A1 (en) Determining analysis recommendations based on data analysis context
CN113609271B (zh) 基于知识图谱的业务处理方法、装置、设备及存储介质
CN112947984B (zh) 应用程序开发方法及装置
CN112307029B (zh) 账单数据存储和账单生成方法、装置、服务器及存储介质
CN110909112A (zh) 数据提取方法、装置、终端设备及介质
CN118331996B (zh) 一种自然语言到sql语句的转换方法及相关装置
CN112767042B (zh) 一种群组生成方法、装置、电子设备及存储介质
CN112949670B (zh) 用于联邦学习模型的数据集切换方法和装置
CN114819905A (zh) 文档集的时间合规审查方法、装置、电子设备及存储介质
CN118747240A (zh) 招聘服务推荐方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant