CN110990708B - 热点事件确定方法、装置、存储介质及电子设备 - Google Patents
热点事件确定方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN110990708B CN110990708B CN201911269466.0A CN201911269466A CN110990708B CN 110990708 B CN110990708 B CN 110990708B CN 201911269466 A CN201911269466 A CN 201911269466A CN 110990708 B CN110990708 B CN 110990708B
- Authority
- CN
- China
- Prior art keywords
- search
- keyword
- event
- determining
- hot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种热点事件确定方法、装置、存储介质及电子设备,其中热点事件确定方法包括:接收检索请求,根据检索请求确定检索文本和请求时刻,从检索文本中提取第一关键词;统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,判断第一检索次数是否满足第一预设条件;若是,则获取第一关键词在请求时刻前的第一预设时长内的第二检索次数;根据第一检索次数和第二检索次数,判断第一关键词的检索增长情况是否满足第二预设条件;若是,则将第一关键词作为热点关键词,确定热点关键词对应的事件为热点事件。本方案中,由于采用检索次数和检索增长情况作为评估指标,从而可以提高热点事件的识别准确度。
Description
技术领域
本申请属于信息技术领域,尤其涉及一种热点事件确定方法、装置、存储介质及电子设备。
背景技术
随着网络的不断发展,基于检索网站进行信息查询已经成为一种人们常用的检索方式。相关技术中,被用户频繁检索的事件被称为热点事件。在确定事件是否被用户频繁检索的过程中,评估指标单一,会导致确定该事件是否为热点事件时的准确度低。
发明内容
本申请实施例提供一种热点事件确定方法、装置、存储介质及电子设备,可以提高热点事件的识别准确度。
第一方面,本申请实施例提供一种热点事件确定方法,包括:
接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
若是,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
若是,则将满足所述第二预设条件的第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
第二方面,本申请实施例提供一种热点事件确定装置,包括:
提取模块,用于接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
第一判断模块,用于统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
第一获取模块,用于若所述第一检索次数满足所述第一预设条件,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
第二判断模块,用于根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
第一确定模块,用于若所述第一关键词的检索增长情况满足所述第二预设条件,则将所述第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的热点事件确定方法。
第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的热点事件确定方法。
本申请实施例提供的热点事件确定方案,当接收到检索请求时,由于采用检索次数和检索增长情况作为评估指标来确定从检索请求的检索文本中提取的第一关键字是否为热点关键词,进而确定热点关键词对应的事件是否为热点事件,可以提高热点事件的识别准确度。
附图说明
下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。
图1是本申请实施例提供的热点事件确定方法的第一流程示意图。
图2是本申请实施例提供的热点事件确定方法的第二流程示意图。
图3是本申请实施例提供的热点事件确定装置的结构示意图。
图4是本申请实施例提供的电子设备的第一结构示意图。
图5是本申请实施例提供的电子设备的第二结构示意图。
具体实施方式
以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文不同模块、引擎及服务可看做为在该运算系统上的实施对象。
本申请实施例提供一种热点事件确定方法,该热点事件确定方法的执行主体可以是本申请实施例提供的热点事件确定装置,或者集成了该热点事件确定装置的电子设备。其中,该电子设备可以是服务器等。
以下进行具体分析说明。
本申请实施例提供一种热点事件确定方法,请参阅图1,图1为本申请实施例提供的热点事件确定方法的第一流程示意图,该热点事件确定方法可以包括以下步骤:
101、接收检索请求,根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词。
本申请实施例中,电子设备在接收到客户端的检索请求后,除了根据检索请求向该客户端返回检索内容以外,还可以确定检索请求的请求时刻,对检索请求进行解析,得到检索文本,并从检索文本中提取关键词,作为第一关键词。可以理解的是,客户端安装在用户终端中,用户终端与作为服务器的电子设备之间建立通信连接。
其中,一个检索请求对应一个检索文本。检索文本是用户在客户端搜索栏中输入的文本。客户端在接收到用户在搜索栏中输入的检索文本后,根据检索文本生成检索请求,然后将检索请求发送给电子设备,以使电子设备根据该检索请求返回检索内容。
其中,该方案的请求时刻可以指客户端发送检索请求的时刻,也可以指电子设备接收检索请求的时刻。
此外,对于关键词的提取方式,本申请实施例不作具体限定。例如,电子设备可以通过关键词提取算法,对检索文本进行分析,从该检索文本中提取一个或多个词语作为第一关键词。
102、统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,并判断第一检索次数是否满足第一预设条件。
本申请实施例中,在根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词之后,电子设备可以将在请求时刻起的第一预设时长内接收到的检索请求中的检索文本作为统计对象,统计具有该第一关键词的检索文本数目。然后,将该检索文本数目作为第一关键词在从请求时刻起的第一预设时长内的第一检索次数。接着,判断第一检索次数是否满足第一预设条件,若是,此时第一关键词有可能是热点关键词,则继续执行103,若否,则判定第一关键词不是热点关键词。
例如,假设第一预设时长是4分钟,电子设备A在10点接收到一检索请求,确定该检索请求中的检索文本为“双十一购物津贴”以及请求时刻为10点,从“双十一购物津贴”中提取第一关键词“购物津贴”。电子设备A将10点至10点4分期间接收到的检索请求中的检索文本作为统计对象。然后统计具有“购物津贴”的检索文本数目,将检索文本数目作为“购物津贴”在从请求时刻起的第一预设时长内的第一检索次数,并判断“购物津贴”的第一检索次数是否满足第一预设条件。若“购物津贴”的第一检索次数满足第一预设条件,此时“购物津贴”可能是热点关键词,则继续执行103。若“购物津贴”的第一检索次数不满足第一预设条件,则判定“购物津贴”不是热点关键词。
其中,该方案的第一预设时长可以是预先设置在电子设备中的时长,如5分钟、4分钟、3分钟等。该方案的第一预设时长也可以是电子设备根据历史热点事件即时获取的时长。
其中,第一预设条件预先设置在电子设备中。第一预设条件可以手动设置,也可以由电子设备按照一定规则进行设置。
第一检索次数满足第一预设条件可以指第一检索次数大于第一阈值的第一关键词,其第一检索次数满足第一预设条件。或者
第一检索次数满足第一预设条件可以指在多个第一目标关键词的排序中名次满足第一预设名次的第一目标关键词,其第一检索次数满足第一预设条件。其中,第一目标关键词是指多个第一关键词中第一检索次数大于第二阈值的第一关键词。或者
第一检索次数满足第一预设条件可以指在多个第二关键词的排序中名次满足第二预设名次的第二目标关键词,其第一检索次数满足第一预设条件。其中,第二目标关键词是指一个或多个第一关键词中第一检索次数大于第三阈值的第一关键词。多个第二关键词是电子设备根据在请求时刻起的第一预设时长内接收到的多个检索文本提取的关键词,且请求时刻是指提取第一关键词的检索文本(1个)的请求时刻。即从接收时间角度来说,用于提取第一关键词的检索文本,是用于提取多个第二关键词的多个检索文本的首个检索文本。因此,多个第二关键词中包括第一关键词。
103、若是,则获取第一关键词在请求时刻前的第一预设时长内的第二检索次数。
本申请实施例中,在判定第一检索次数满足第一预设条件之后,电子设备将在请求时刻前的第一预设时长内接收到的检索请求中的检索文本作为统计对象,统计具有第一关键词的检索文本数目。然后,将该检索文本数目作为该第一关键词在请求时刻前的第一预设时长内的第二检索次数。需要说明的是,在执行此操作时第一关键词的第一检索次数已经满足第一预设条件。
例如,继上述“双十一购物津贴”的例子,在判断“购物津贴”的第一检索次数满足第一预设条件之后,电子设备A将9点56分至10点期间接收到的检索请求中的检索文本作为统计对象。然后统计具有“购物津贴”的检索文本数目,将检索文本数目作为“购物津贴”在请求时刻前的第一预设时长内的第二检索次数。
104、根据第一检索次数和第二检索次数,判断第一关键词的检索增长情况是否满足第二预设条件。
本申请实施例中,在得到第一关键词的第一检索次数和第二检索次数之后,电子设备可以根据第一检索次数和第二检索次数确定第一关键词的检索增长情况,然后判断第一关键词的检索增长情况是否满足第二预设条件,若是,此时第一关键词符合热点关键词的所有条件,则继续执行105,若否,则判定第一关键词不是热点关键词。其中,第二预设条件是预先设置在电子设备中的一个数值。第二预设条件可以手动设置,也可以由电子设备按照一定规则进行设置。
需要说明的是,对于该方案中检索增长情况的表示方式,本申请实施例不作具体限定。
在一些实施例中,在根据第一检索次数和第二检索次数确定第一关键词的检索增长情况时,电子设备可以根据第一检索次数和第二检索次数计算第一关键词的增长率,将增长率作为第一关键词的检索增长情况。
其中,R表示第一关键词的增长率,M1表示第一关键词的第一检索次数,M2表示第一关键词的第二检索次数,增长率的计算公式如下:
在一些实施例中,在根据第一检索次数和第二检索次数确定关键词的检索增长情况时,电子设备可以计算第一检索次数与第二检索次数的差值,将差值作为第一关键词的检索增长情况。
其中,V表示第一关键词的差值,M1表示第一关键词的第一检索次数,M2表示第一关键词的第二检索次数,差值的计算公式如下:
V=M1-M2
105、若是,则将满足第二预设条件的第一关键词作为热点关键词,获取热点关键词对应的事件,并确定事件为热点事件。
本申请实施例中,在判定第一关键词的检索增长情况满足第二预设条件后,电子设备将该第一关键词作为热点关键词,以及获取热点关键词对应的事件,确定该事件为热点事件。其中,热点事件主要以短句形式呈现,热点事件中包括该热点关键词。热点事件和用于提取第一关键词的检索文本在内容上相近,且两者可能相同或不同。
可以理解的是,热点关键词的第一检索次数满足第一预设条件,以及其检索增长情况满足第二预设条件。
由上可知,本申请实施例中,当接收到检索请求时,由于采用检索次数和检索增长情况作为评估指标来确定从检索请求的检索文本中提取的第一关键字是否为热点关键词,进而确定热点关键词对应的事件是否为热点事件,可以提高热点事件的识别准确度。
在一些实施例中,在统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数之前,电子设备还可以执行:
确定检索文本的类型,获取多个历史热点事件的类型;
将检索文本的类型与多个历史热点事件的类型进行匹配,并将匹配成功的历史热点事件作为第二目标历史热点事件;
根据第二目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
该方案中,在根据检索请求确定检索文本之后,统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数之前,电子设备可以确定检索文本的类型,获取多个历史热点事件的类型,将多个历史热点事件中类型与检索文本类型相同的历史热点事件作为第二目标历史热点事件,其中,历史热点事件的类型与检索文本的类型相同,则判定两者匹配。然后,电子设备获取第二目标历史热点事件的热点确定时长,并计算平均热点确定时长,将平均热点确定时长作为第一预设时长。
其中,历史热点事件是电子设备在请求时刻之前已经确定为热点事件的事件。每一个历史热点事件中包括至少一个热点关键词。每一个历史热点事件的热点确定时长是指自确定事件为热点事件的那次检索请求的请求时刻至确定事件为热点事件的时刻的时间段。
此外,对于检索文本的类型和历史热点事件的类型,本申请实施例不作具体限定。例如,检索文本的类型包括娱乐类型、自然灾害类型等。
需要说明的是,该方案中的第一预设时长由类型与检索文本类型相同的历史热点事件统计得来,使得第一预设时长的设置更加合理,从而提高热点事件的识别准确度。
在一些实施例中,在获取热点关键词对应的事件,并确定事件为热点事件之后,电子设备可以在信息库中查找与热点事件匹配的推送内容,并将推送内容设置在推荐界面上。例如,电子设备可以在预设时间(如5分钟)内将与热点事件匹配的推送内容设置在推荐界面上。需要说明的是,匹配成功的推送内容可以指匹配度最高的内容,或匹配成功的内容可以指匹配度最高和第二高的内容等。
请参阅图2,图2为本申请实施例提供的热点事件确定方法的第二流程示意图,该热点事件确定方法可以包括以下步骤:
201、接收检索请求,根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词。
本申请实施例中,电子设备在接收到客户端的检索请求后,除了根据检索请求向该客户端返回检索内容以外,还可以确定检索请求的请求时刻,对检索请求进行解析,得到检索文本,并从检索文本中提取关键词,作为第一关键词。其中,检索文本是用户在客户端搜索栏中输入的文本。请求时刻可以指客户端发送检索请求的时刻,也可以指电子设备接收检索请求的时刻。
在一些实施例中,在从检索文本中提取第一关键词时,电子设备可以去除检索文本中的无效字符;对去除无效字符后的检索文本进行分词处理和停用词去除处理,得到第一关键词。其中,检索文本的无效字符包括表情字符、空格字符、乱码字符等。停用词是指为了提高检索效率在处理自然语言文本之后会自动过滤的词或字。停用词主要分为功能词和词汇词,功能词如“的”、“是”、“和”等没有实际含义的词或字。
202、获取多个历史热点事件的生命时长。
本申请实施例中,在根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词之后,电子设备可以获取多个历史热点事件的生命时长。其中,历史热点事件是电子设备在请求时刻之前已经确定为热点事件的事件。每个历史热点事件有各自的生命时长,两个历史热点事件间的生命时长可以相同或不同。
需要说明的是,历史热点事件可以分为两类:在请求时刻仍是热点事件的事件、在请求时刻不是热点事件的事件。该两类历史热点事件的生命时长获取方式不同。对于在请求时刻仍是热点事件的事件,电子设备获取事件在确定为热点事件的时刻,即起始时刻,将该起始时刻至该请求时刻的时间确定为该事件的生命时长。对于在请求时刻不是热点事件的事件,电子设备获取事件在确定为热点事件的时刻,即起始时刻,以及事件在从热点事件中剔除的时刻,即结束时刻,将起始时刻至结束时刻的时间确定为该事件的生命时长。
203、将生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件。
本申请实施例中,在获取多个历史热点事件的生命时长之后,电子设备将多个历史热点事件中生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件。其中,第二预设时长预先设置在电子设备中,第二预设时长可以手动进行调整。
在一些实施例中,在获取多个历史热点事件的生命时长之后,电子设备还可以将多个历史热点事件中生命时长在第一预设范围内的历史热点事件作为第三目标历史热点事件。然后根据第三目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。其中,第一预设范围预先设置在电子设备中,第一预设范围可以手动进行调整。
204、根据第一目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
本申请实施例中,在将生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件之后,电子设备可以获取第一目标历史热点事件各自的热点确定时长,得到多个热点确定时长。然后计算多个热点确定时长的平均热点确定时长,将平均热点确定时长作为第一预设时长。
其中,每一个历史热点事件中包括至少一个热点关键词。每一个历史热点事件的热点确定时长是指自确定事件为热点事件的那次检索请求的请求时刻至确定事件为热点事件的时刻的时间段。
在一些实施例中,在将平均热点确定时长作为第一预设时长之前,电子设备还可以判断该平均热点确定时长是否大于设定值,若是,则将设定值作为第一预设时长,若否,则将平均热点确定时长作为第一预设时长。其中,设定值是设置在电子设备中第一预设时长的最大数值,例如,设定值可以为5分钟。
205、统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,并判断第一检索次数是否满足第一预设条件。
本申请实施例中,在确定第一预设时长之后,电子设备可以将在请求时刻起的第一预设时长内接收到的检索请求中的检索文本作为统计对象,统计具有该第一关键词的检索文本数目。然后,将该检索文本数目作为第一关键词在从请求时刻起的第一预设时长内的第一检索次数。接着,判断第一检索次数是否满足第一预设条件,若是,此时第一关键词有可能是热点关键词,则执行206,若否,则判定第一关键词不是热点关键词。
其中,第一预设条件预先设置在电子设备中。第一预设条件可以手动设置,也可以由电子设备按照一定规则进行设置。
第一检索次数满足第一预设条件可以指第一检索次数大于第一阈值的第一关键词,其第一检索次数满足第一预设条件。或者
第一检索次数满足第一预设条件可以指在多个第一目标关键词的排序中名次满足第一预设名次的第一目标关键词,其第一检索次数满足第一预设条件。其中,第一目标关键词是指多个第一关键词中第一检索次数大于第二阈值的第一关键词。或者
第一检索次数满足第一预设条件可以指在多个第二关键词的排序中名次满足第二预设名次的第二目标关键词,其第一检索次数满足第一预设条件。其中,第二目标关键词是指一个或多个第一关键词中第一检索次数大于第三阈值的第一关键词。多个第二关键词是电子设备根据在请求时刻起的第一预设时长内接收到的多个检索文本提取的关键词,且请求时刻是指提取第一关键词的检索文本(1个)的请求时刻。即从接收时间角度来说,用于提取第一关键词的检索文本,是用于提取多个第二关键词的多个检索文本的首个检索文本。因此,多个第二关键词中包括第一关键词。
在一些实施例中,在判断第一检索次数是否满足第一预设条件时,电子设备可以判断第一检索次数是否大于第一阈值,其中,当第一检索次数大于第一阈值时判定第一检索次数满足第一预设条件。
需要说明的是,该方案中第一阈值预先设置在电子设备中。第一检索次数满足第一预设条件是指存在第一检索次数大于第一阈值的第一关键词。
例如,假设第一预设时长为3分钟,一个检索请求的检索文本为“国庆阅兵”,以及请求时刻为12点。从“国庆阅兵”中提取的关键词为“阅兵”。电子设备获取12点~12点3分内接收到的700个检索请求,确定700个检索请求的700个检索文本。然后,统计700个检索文本中具有“阅兵”的检索文本数目,作为“阅兵”的第一检索次数。接着,电子设备判断“阅兵”的第一检索次数是否大于第一阈值,若是,则判定“阅兵”的第一检索次数满足第一预设条件,若否,则判定“阅兵”的第一检索次数不满足第一预设条件,以及“阅兵”不是热点关键词。
在一些实施例中,若第一关键词有多个,在判断第一检索次数是否满足第一预设条件时,电子设备可以确定多个第一关键词中第一检索次数大于第二阈值的第一关键词,作为第一目标关键词,其中,第一目标关键词为多个;按照第一检索次数对多个第一目标关键词进行排序,判定在排序中名次满足第一预设名次的第一目标关键词的第一检索次数满足第一预设条件。
其中,第二阈值和第一预设名次预先设置在电子设备中。第一目标关键词是第一检索次数大于第二阈值的第一关键词。
例如,假设第一预设时长为3分钟,一个检索请求的检索文本为“XXX和YYY官宣结婚”,以及请求时刻为13点。从“XXX和YYY官宣结婚”中提取的关键词为“XXX”、“YYY”和“结婚”,即第一关键词为“XXX”、“YYY”和“结婚”。电子设备获取13点~13点3分内接收到的500个检索请求,确定500个检索请求的500个检索文本。然后,统计500个检索文本中具有“XXX”的检索文本数目,作为“XXX”的第一检索次数。同理统计“YYY”的第一检索次数和“结婚”的第一检索次数。接着,电子设备判断“XXX”的第一检索次数是否大于第二阈值,若是,则判定“XXX”为第一目标关键词。同理判断“YYY”是否为第一目标关键词和判断“结婚”是否为第一目标关键词。当判定“XXX”为第一目标关键词、“YYY”为第一目标关键词以及“结婚”为第一目标关键词时,电子设备按照第一检索次数对“XXX”、“YYY”和“结婚”进行排序。若在排序中名次满足第一预设名次的第一目标关键词为“XXX”和“结婚”,则电子设备判定“XXX”的第一检索次数和“结婚”的第一检索次数满足第一预设条件,以及判定“YYY”的第一检索次数不满足第一预设条件,即“YYY”不是热点关键词。
在一些实施例中,在统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,并判断第一检索次数是否满足第一预设条件时,电子设备可以获取在从请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;统计多个检索文本中具有第一关键词的检索文本数目,作为第一关键词在从请求时刻起的第一预设时长内的第一检索次数;将第一检索次数大于第三阈值的第一关键词确定为第二目标关键词,并从多个检索文本中提取多个不同的第二关键词,其中,多个第二关键词包括第一关键词;基于检索次数,对多个第二关键词进行排序,判定在排序中名次满足第二预设名次的第二目标关键词的第一检索次数满足第一预设条件,其中,多个第二关键词包括第二目标关键词。
例如,假设第一预设时长为3分钟,一个检索请求的检索文本为“XXX和YYY官宣结婚”,以及请求时刻为13点。从“XXX和YYY官宣结婚”中提取的关键词为“XXX”、“YYY”和“结婚”,即第一关键词为“XXX”、“YYY”和“结婚”。电子设备获取13点~13点3分内接收到的500个检索请求,确定500个检索请求的500个检索文本,其中,按照接收时间,“XXX和YYY官宣结婚”的检索文本是500个检索文本中的首个检索文本。然后,统计500个检索文本中具有“XXX”的检索文本数目,作为“XXX”的第一检索次数。同理统计“YYY”的第一检索次数和“结婚”的第一检索次数。接着,电子设备判断“XXX”的第一检索次数是否大于第三阈值,若是,则判定“XXX”为第二目标关键词。同理判断“YYY”是否为第二目标关键词和判断“结婚”是否为第二目标关键词。当判定“XXX”为第二目标关键词、“YYY”为第二目标关键词以及“结婚”为第二目标关键词时,电子设备对确定出的500个检索文本进行关键词提取,得到100个不同的第二关键词。其中,100个不同的第二关键词中包括“XXX”、“YYY”以及“结婚”这3个关键词。对于每个第二关键词,统计500个检索文本中具有其的检索文本数目,作为检索次数。之后按照检索次数对100个第二关键词进行排序。若在排序中名次满足第二预设名次的第二目标关键词为“XXX”和“结婚”,则电子设备判定“XXX”和“结婚”的第一检索次数满足第一预设条件,以及判定“YYY”的第一检索次数不满足第一预设条件,即“YYY”不是热点关键词。
其中,第三阈值和第二预设名次预先设置在电子设备中。第二目标关键词是指第一检索次数大于第三阈值的第一关键词。多个第二关键词是电子设备根据在请求时刻起的第一预设时长内接收到的多个检索文本提取的多个不同关键词。
此外,对于第二关键词的提取方式,本申请实施例不作具体限定。例如,电子设备可以通过关键词提取算法,对多个检索文本进行分析,从各个检索文本中提取一个或多个词语关键词,得到多个不同的第二关键词。任意两个第二关键词之间互不相同。
需要说明的是,请求时刻是指提取第一关键词的检索文本(1个)的请求时刻。即从接收时间角度来说,用于提取第一关键词的检索文本,是用于提取多个第二关键词的多个检索文本的首个检索文本。因此,多个第二关键词中包括第一关键词,还包括非第一关键词以外的关键词。
206、若是,则获取第一关键词在请求时刻前的第一预设时长内的第二检索次数。
本申请实施例中,在判定第一检索次数满足第一预设条件之后,电子设备将在请求时刻前的第一预设时长内接收到的检索请求中的检索文本作为统计对象,统计具有第一关键词的检索文本数目。然后,将该检索文本数目作为该第一关键词在请求时刻前的第一预设时长内的第二检索次数。需要说明的是,在执行此操作时第一关键词的第一检索次数已经满足第一预设条件。
207、根据第一检索次数和第二检索次数,判断第一关键词的检索增长情况是否满足第二预设条件。
本申请实施例中,在得到第一关键词的第一检索次数和第二检索次数之后,电子设备可以根据第一检索次数和第二检索次数确定第一关键词的检索增长情况,然后判断第一关键词的检索增长情况是否满足第二预设条件,若是,此时第一关键词符合热点关键词的所有条件,则继续执行105,若否,则判定第一关键词不是热点关键词。其中,第二预设条件是预先设置在电子设备中的一个数值。第二预设条件可以手动设置,也可以由电子设备按照一定规则进行设置。
需要说明的是,对于该方案中检索增长情况的表示方式,本申请实施例不作具体限定。例如,通过第一关键词的增长率表示检索增长情况等。
208、若是,则将满足第二预设条件的第一关键词作为热点关键词,获取热点关键词对应的事件,并确定事件为热点事件。
本申请实施例中,在判定第一关键词的检索增长情况满足第二预设条件后,电子设备将该第一关键词作为热点关键词,以及获取热点关键词对应的事件,确定该事件为热点事件。其中,热点事件主要以短句形式呈现,热点事件中包括该热点关键词。热点事件和用于提取第一关键词的检索文本在内容上相近,且两者可能相同或不同。
在一些实施例中,在获取热点关键词对应的事件时,电子设备可以获取在从请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;将多个检索文本中具有热点关键词的检索文本作为目标检索文本;根据目标检索文本,生成热点关键词对应的事件。
例如,假设第一预设时长为5分钟,某检索请求的检索文本为“GGG官宣结婚”和请求时刻为18点,18点~18点5分接收到700个检索文本,检索文本中提取的关键词“GGG”和“结婚”判定为热点关键词。电子设备可以将700个检索文本中具有“GGG”和“结婚”的多条检索文本作为目标检索文本,根据文档主题生成模型生成多条目标检索文本对应的主题信息,用以表示“GGG”和“结婚”对应的事件。例如,“GGG和DDD官宣结婚”。
209、在信息库中查找与热点事件匹配的多个推送内容。
本申请实施例中,在确定热点关键词对应的事件为热点事件之后,电子设备可以将热点事件与信息库中的推送内容进行匹配,获取与热点事件匹配成功的多个推送内容。可以理解的是,电子设备的信息库中存储大量推送内容,该推送内容主要是与电子设备建立通信连接的其他设备上传的信息。
210、获取多个推送内容的基础权重和热点权重,并根据基础权重和热点权重计算各个推送内容的推荐分数。
本申请实施例中,在信息库中查找与热点事件匹配的多个推送内容之后,电子设备获取基础权重和热点权重,根据基础权重和热点权重计算各个推送内容的推荐分数。其中,基础权重可以是一个或多个。需要说明的是,信息库中的推送内容可以分为两类,一类与热点事件匹配,其在计算推送分数时需要根据基础权重和热点权重进行计算,一类与热点事件不匹配,其在计算推送分数时根据基础权重进行计算。
例如,假设基础权重包括第一基础权重、第二基础权重、第三基础权重,与热点事件匹配的推送内容的推荐分数计算公式如下:
P=k1 p1+k2 p2+k3 p3+k4 p4
与热点事件不匹配的推送内容的推荐分数计算公式如下:
P=k1 p1+k2 p2+k3 p3
其中,P表示推送内容的推荐分数,p1表示推送内容在第一基础权重上的评分,p2表示推送内容在第二基础权重上的评分,p3表示推送内容在第三基础权重上的评分,p4表示推送内容在热点权重上的评分,k1表示第一基础权重,k2表示第二基础权重,k3表示第三基础权重,k4表示热点权重。
211、将推荐分数大于预设分数的推送内容设置在推荐界面上。
本申请实施例中,在得到信息库中每个推送内容的推荐分数之后,电子设备将推荐分数大于预设分数的推送内容设置在推荐界面上。
在一些实施例中,得到信息库中每个推送内容的推荐分数后,电子设备可以按照推荐分数对信息库中的推送内容进行排序,将名次在第二预设范围内的推送内容设置在推荐界面上。例如,将名次在1~50内的推送内容设置在推荐界面上。
请参阅图3,图3为本申请实施例提供的热点事件确定装置的结构示意图。该热点事件确定装置300包括:提取模块301、第一判断模块302、第一获取模块303、第二判断模块304、第一确定模块305。
提取模块301,用于接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
第一判断模块302,用于统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
第一获取模块303,用于若所述第一检索次数满足所述第一预设条件,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
第二判断模块304,用于根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
第一确定模块305,用于若所述第一关键词的检索增长情况满足所述第二预设条件,则将所述第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
在一些实施例中,获取所述热点关键词对应的事件时,第一确定模块305可以用于:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
将所述多个检索文本中具有所述热点关键词的检索文本作为目标检索文本;
根据所述目标检索文本,生成所述热点关键词对应的事件。
在一些实施例中,确定所述事件为热点事件之后,热点事件确定装置300还包括:
第一设置模块,用于在信息库中查找与所述热点事件匹配的推送内容,并将所述推送内容设置在推荐界面上。
在一些实施例中,确定所述事件为热点事件之后,热点事件确定装置300还包括:
查找模块,用于在信息库中查找与所述热点事件匹配的多个推送内容;
第二获取模块,用于获取所述多个推送内容的基础权重和热点权重,并根据所述基础权重和所述热点权重计算各个推送内容的推荐分数;
第二设置模块,用于将推荐分数大于预设分数的推送内容设置在推荐界面上。
在一些实施例中,判断所述第一检索次数是否满足第一预设条件时,第一判断模块302还用于:
判断所述第一检索次数是否大于第一阈值,其中,当所述第一检索次数大于所述第一阈值时判定所述第一检索次数满足第一预设条件。
在一些实施例中,判断所述第一检索次数是否满足第一预设条件时,第一判断模块302还用于:
当所述第一关键词有多个时,确定多个第一关键词中第一检索次数大于第二阈值的第一关键词,作为第一目标关键词,其中,所述第一目标关键词为多个;
按照第一检索次数对多个第一目标关键词进行排序,判定在所述排序中名次满足第一预设名次的第一目标关键词的第一检索次数满足第一预设条件。
在一些实施例中,统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件时,第一判断模块302还用于:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
统计所述多个检索文本中具有所述第一关键词的检索文本数目,作为所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数;
将第一检索次数大于第三阈值的第一关键词确定为第二目标关键词,并从所述多个检索文本中提取多个不同的第二关键词,其中,所述多个第二关键词包括所述第一关键词;
基于检索次数,对所述多个第二关键词进行排序,判定在所述排序中名次满足第二预设名次的第二目标关键词的第一检索次数满足第一预设条件,其中,所述多个第二关键词包括所述第二目标关键词。
在一些实施例中,接收检索请求之前,热点事件确定装置300还包括:
第三获取模块,用于获取多个历史热点事件的生命时长;
第二确定模块,用于将生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件;
第三确定模块,用于根据所述第一目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
在一些实施例中,统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数之前,热点事件确定装置300还包括:
第四获取模块,用于确定所述检索文本的类型,获取多个历史热点事件的类型;
匹配模块,用于将所述检索文本的类型与所述多个历史热点事件的类型进行匹配,并将匹配成功的历史热点事件作为第二目标历史热点事件;
计算模块,用于根据所述第二目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
在一些实施例中,从所述检索文本中提取第一关键词时,提取模块301还用于:
去除所述检索文本中的无效字符;
对去除无效字符后的检索文本进行分词处理和停用词去除处理,得到第一关键词。
由上可知,本申请实施例提供的热点事件确定装置300,提取模块301接收检索请求,根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词,然后第一判断模块302统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,并判断第一检索次数是否满足第一预设条件,若第一检索次数满足第一预设条件,则第一获取模块303获取第一关键词在请求时刻前的第一预设时长内的第二检索次数,第二判断模块304根据第一检索次数和第二检索次数,判断第一关键词的检索增长情况是否满足第二预设条件,若第一关键词的检索增长情况满足第二预设条件,则第一确定模块305将第一关键词作为热点关键词,获取热点关键词对应的事件,并确定事件为热点事件。本方案由于采用第一检索次数和检索增长情况作为确定热点关键词对应的事件为热点事件的评估指标,从而可以提高热点事件的识别准确度。
应当说明的是,本申请实施例提供的热点事件确定装置与上文实施例中的热点事件确定方法属于同一构思,在热点事件确定装置上可以运行热点事件确定方法实施例中提供的任一方法,其具体实现过程详见热点事件确定方法实施例,此处不再赘述。
本申请实施例提供一种计算机可读的存储介质,其上存储有计算机程序,当其存储的计算机程序在计算机上执行时,使得计算机执行如本申请实施例提供的热点事件确定方法中的步骤。其中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM,)或者随机存取器(Random Access Memory,RAM)等。
本申请实施例还提供一种电子设备,请参照图4,电子设备400包括处理器401和存储器402。其中,处理器401与存储器402电性连接。
处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器402内的计算机程序,以及调用存储在存储器402内的数据,执行电子设备400的各种功能并处理数据。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。
此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中,并由处理器401运行存储在存储器402中的计算机程序,从而实现各种功能,如下:
接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
若是,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
若是,则将满足所述第二预设条件的第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
请参照图5,图5为本申请实施例提供的电子设备的第二结构示意图,与图4所示电子设备的区别在于,电子设备还包括:显示组件503、射频电路504以及电源505。其中,显示组件503、射频电路504以及电源505分别与处理器501电性连接。
显示组件503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
电源505可以用于给电子设备500的各个部件供电。在一些实施例中,电源505可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:
接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
若是,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
若是,则将满足所述第二预设条件的第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
在一些实施例中,获取所述热点关键词对应的事件时,处理器501可以执行:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
将所述多个检索文本中具有所述热点关键词的检索文本作为目标检索文本;
根据所述目标检索文本,生成所述热点关键词对应的事件。
在一些实施例中,确定所述事件为热点事件之后,处理器501还可以执行:
在信息库中查找与所述热点事件匹配的推送内容,并将所述推送内容设置在推荐界面上。
在一些实施例中,确定所述事件为热点事件之后,处理器501还可以执行:
在信息库中查找与所述热点事件匹配的多个推送内容;
获取所述多个推送内容的基础权重和热点权重,并根据所述基础权重和所述热点权重计算各个推送内容的推荐分数;
将推荐分数大于预设分数的推送内容设置在推荐界面上。
在一些实施例中,判断所述第一检索次数是否满足第一预设条件时,处理器501可以执行:
判断所述第一检索次数是否大于第一阈值,其中,当所述第一检索次数大于所述第一阈值时判定所述第一检索次数满足第一预设条件。
在一些实施例中,判断所述第一检索次数是否满足第一预设条件时,处理器501可以执行:
当所述第一关键词有多个时,确定多个第一关键词中第一检索次数大于第二阈值的第一关键词,作为第一目标关键词,其中,所述第一目标关键词为多个;
按照第一检索次数对多个第一目标关键词进行排序,判定在所述排序中名次满足第一预设名次的第一目标关键词的第一检索次数满足第一预设条件,其中,所述多个第二关键词包括所述第二目标关键词。
在一些实施例中,统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件时,处理器501可以执行:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
统计所述多个检索文本中具有所述第一关键词的检索文本数目,作为所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数;
将第一检索次数大于第三阈值的第一关键词确定为第二目标关键词,并从所述多个检索文本中提取多个不同的第二关键词,其中,所述多个第二关键词包括所述第一关键词;
基于检索次数,对所述多个第二关键词进行排序,判定在所述排序中名次满足第二预设名次的第二目标关键词的第一检索次数满足第一预设条件,其中,所述多个第二关键词包括所述第二目标关键词。
在一些实施例中,接收检索请求之前,处理器501还可以执行:
获取多个历史热点事件的生命时长;
将生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件;
根据所述第一目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
在一些实施例中,统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数之前,处理器501还可以执行:
确定所述检索文本的类型,获取多个历史热点事件的类型;
将所述检索文本的类型与所述多个历史热点事件的类型进行匹配,并将匹配成功的历史热点事件作为第二目标历史热点事件;
根据所述第二目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
在一些实施例中,从所述检索文本中提取第一关键词时,处理器501可以执行:
去除所述检索文本中的无效字符;
对去除无效字符后的检索文本进行分词处理和停用词去除处理,得到第一关键词。
由上可知,本申请实施例提供的电子设备,当接收到检索请求时,根据检索请求确定检索文本和请求时刻,并从检索文本中提取第一关键词,然后统计第一关键词在从请求时刻起的第一预设时长内的第一检索次数,并判断第一检索次数是否满足第一预设条件,当满足第一预设条件时,获取第一关键词在请求时刻前的第一预设时长内的第二检索次数,接着根据第一检索次数和第二检索次数,判断第一关键词的检索增长情况是否满足第二预设条件,当满足第二预设条件时,将第一关键词作为热点关键词,确定热点关键词对应的事件为热点事件。由于采用第一检索次数和检索增长情况作为确定热点关键词对应的事件为热点事件的评估指标,从而可以提高热点事件的识别准确度。
本申请实施例还提供一种存储介质,该存储介质存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行上述任一实施例中的热点事件确定方法,比如:接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;若是,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;若是,则将满足所述第二预设条件的第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的热点事件确定方法而言,本领域普通测试人员可以理解实现本申请实施例的热点事件确定方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如热点事件确定方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的热点事件确定装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,该存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种热点事件确定方法、装置、存储介质以及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种热点事件确定方法,其特征在于,包括:
接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
确定所述检索文本的类型,获取多个历史热点事件的类型;
将所述检索文本的类型与所述多个历史热点事件的类型进行匹配,并将匹配成功的历史热点事件作为第二目标历史热点事件;
根据所述第二目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长;
统计所述第一关键词在从所述请求时刻起的所述第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
若是,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
若是,则将满足所述第二预设条件的第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
2.根据权利要求1所述的热点事件确定方法,其特征在于,所述获取所述热点关键词对应的事件,包括:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
将所述多个检索文本中具有所述热点关键词的检索文本作为目标检索文本;
根据所述目标检索文本,生成所述热点关键词对应的事件。
3.根据权利要求1所述的热点事件确定方法,其特征在于,所述确定所述事件为热点事件之后,还包括:
在信息库中查找与所述热点事件匹配的推送内容,并将所述推送内容设置在推荐界面上。
4.根据权利要求1所述的热点事件确定方法,其特征在于,所述确定所述事件为热点事件之后,还包括:
在信息库中查找与所述热点事件匹配的多个推送内容;
获取所述多个推送内容的基础权重和热点权重,并根据所述基础权重和所述热点权重计算各个推送内容的推荐分数;
将推荐分数大于预设分数的推送内容设置在推荐界面上。
5.根据权利要求1所述的热点事件确定方法,其特征在于,所述判断所述第一检索次数是否满足第一预设条件,包括:
判断所述第一检索次数是否大于第一阈值,其中,当所述第一检索次数大于所述第一阈值时判定所述第一检索次数满足第一预设条件。
6.根据权利要求1所述的热点事件确定方法,其特征在于,所述判断所述第一检索次数是否满足第一预设条件,包括:
当所述第一关键词有多个时,确定多个第一关键词中第一检索次数大于第二阈值的第一关键词,作为第一目标关键词,其中,所述第一目标关键词为多个;
按照第一检索次数对多个第一目标关键词进行排序,判定在所述排序中名次满足第一预设名次的第一目标关键词的第一检索次数满足第一预设条件。
7.根据权利要求1所述的热点事件确定方法,其特征在于,所述统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件,包括:
获取在从所述请求时刻起的第一预设时长内接收到的多个检索请求,确定多个检索请求的多个检索文本;
统计所述多个检索文本中具有所述第一关键词的检索文本数目,作为所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数;
将第一检索次数大于第三阈值的第一关键词确定为第二目标关键词,并从所述多个检索文本中提取多个不同的第二关键词,其中,所述多个第二关键词包括所述第一关键词;
基于检索次数,对所述多个第二关键词进行排序,判定在所述排序中名次满足第二预设名次的第二目标关键词的第一检索次数满足第一预设条件,其中,所述多个第二关键词包括所述第二目标关键词。
8.根据权利要求1至7任一项所述的热点事件确定方法,其特征在于,所述接收检索请求之前,还包括:
获取多个历史热点事件的生命时长;
将生命时长大于第二预设时长的历史热点事件作为第一目标历史热点事件;
根据所述第一目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长。
9.根据权利要求8或1所述的热点事件确定方法,其特征在于,所述从所述检索文本中提取第一关键词,包括:
去除所述检索文本中的无效字符;
对去除无效字符后的检索文本进行分词处理和停用词去除处理,得到第一关键词。
10.一种热点事件确定装置,其特征在于,包括:
提取模块,用于接收检索请求,根据所述检索请求确定检索文本和请求时刻,并从所述检索文本中提取第一关键词;
第四获取模块,用于确定所述检索文本的类型,获取多个历史热点事件的类型;
匹配模块,用于将所述检索文本的类型与所述多个历史热点事件的类型进行匹配,并将匹配成功的历史热点事件作为第二目标历史热点事件;
计算模块,用于根据所述第二目标历史热点事件的热点确定时长计算平均热点确定时长,作为第一预设时长;
第一判断模块,用于统计所述第一关键词在从所述请求时刻起的第一预设时长内的第一检索次数,并判断所述第一检索次数是否满足第一预设条件;
第一获取模块,用于若所述第一检索次数满足所述第一预设条件,则获取所述第一关键词在所述请求时刻前的所述第一预设时长内的第二检索次数;
第二判断模块,用于根据所述第一检索次数和所述第二检索次数,判断所述第一关键词的检索增长情况是否满足第二预设条件;
第一确定模块,用于若所述第一关键词的检索增长情况满足所述第二预设条件,则将所述第一关键词作为热点关键词,获取所述热点关键词对应的事件,并确定所述事件为热点事件。
11.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至9任一项所述的热点事件确定方法。
12.一种电子设备,包括处理器、存储器,所述存储器有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至9任一项所述的热点事件确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911269466.0A CN110990708B (zh) | 2019-12-11 | 2019-12-11 | 热点事件确定方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911269466.0A CN110990708B (zh) | 2019-12-11 | 2019-12-11 | 热点事件确定方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110990708A CN110990708A (zh) | 2020-04-10 |
CN110990708B true CN110990708B (zh) | 2023-05-02 |
Family
ID=70092478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911269466.0A Active CN110990708B (zh) | 2019-12-11 | 2019-12-11 | 热点事件确定方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990708B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782924B (zh) * | 2020-06-30 | 2023-09-29 | 北京百度网讯科技有限公司 | 内容处理方法、装置、设备以及存储介质 |
CN112650752A (zh) * | 2020-12-22 | 2021-04-13 | 深圳壹账通智能科技有限公司 | 热点key的确定方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102968439A (zh) * | 2012-10-11 | 2013-03-13 | 微梦创科网络科技(中国)有限公司 | 一种推送微博的方法及装置 |
CN103440286A (zh) * | 2013-08-14 | 2013-12-11 | 北京百度网讯科技有限公司 | 一种基于搜索结果来提供推荐信息的方法及装置 |
CN107423444A (zh) * | 2017-08-10 | 2017-12-01 | 世纪龙信息网络有限责任公司 | 热词词组提取方法和系统 |
CN108170692A (zh) * | 2016-12-07 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种热点事件信息处理方法和装置 |
CN108304371A (zh) * | 2017-07-14 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 热点内容挖掘的方法、装置、计算机设备及存储介质 |
CN108572990A (zh) * | 2017-03-14 | 2018-09-25 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN109151498A (zh) * | 2018-09-03 | 2019-01-04 | 北京达佳互联信息技术有限公司 | 热点事件处理方法、装置、服务器及存储介质 |
CN110457580A (zh) * | 2019-07-31 | 2019-11-15 | 百度时代网络技术(北京)有限公司 | 基于搜索的热点推荐方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014130445A (ja) * | 2012-12-28 | 2014-07-10 | Toshiba Corp | 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム |
-
2019
- 2019-12-11 CN CN201911269466.0A patent/CN110990708B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102968439A (zh) * | 2012-10-11 | 2013-03-13 | 微梦创科网络科技(中国)有限公司 | 一种推送微博的方法及装置 |
CN103440286A (zh) * | 2013-08-14 | 2013-12-11 | 北京百度网讯科技有限公司 | 一种基于搜索结果来提供推荐信息的方法及装置 |
CN108170692A (zh) * | 2016-12-07 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种热点事件信息处理方法和装置 |
CN108572990A (zh) * | 2017-03-14 | 2018-09-25 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN108304371A (zh) * | 2017-07-14 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 热点内容挖掘的方法、装置、计算机设备及存储介质 |
CN107423444A (zh) * | 2017-08-10 | 2017-12-01 | 世纪龙信息网络有限责任公司 | 热词词组提取方法和系统 |
CN109151498A (zh) * | 2018-09-03 | 2019-01-04 | 北京达佳互联信息技术有限公司 | 热点事件处理方法、装置、服务器及存储介质 |
CN110457580A (zh) * | 2019-07-31 | 2019-11-15 | 百度时代网络技术(北京)有限公司 | 基于搜索的热点推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
《基于语义统计分析的网络舆情挖掘技术研究》;万源;《万方数据知识服务平台》;20120929;1-117 * |
Also Published As
Publication number | Publication date |
---|---|
CN110990708A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11194965B2 (en) | Keyword extraction method and apparatus, storage medium, and electronic apparatus | |
CN109815314B (zh) | 一种意图识别方法、识别设备及计算机可读存储介质 | |
CN107092588B (zh) | 一种文本信息处理方法、装置和系统 | |
CN105022761B (zh) | 群组查找方法和装置 | |
CN112765499B (zh) | 一种排行榜处理方法、装置、设备及存储介质 | |
WO2015096477A1 (zh) | 信息回复方法及装置 | |
CN110119477B (zh) | 一种信息推送方法、装置和存储介质 | |
CN111737443B (zh) | 答案文本的处理方法和装置、关键文本的确定方法 | |
CN110990708B (zh) | 热点事件确定方法、装置、存储介质及电子设备 | |
CN110069769B (zh) | 应用标签生成方法、装置及存储设备 | |
CN109885651B (zh) | 一种问题推送方法和装置 | |
CN112925912A (zh) | 文本处理方法、同义文本召回方法及装置 | |
CN110245357B (zh) | 主实体识别方法和装置 | |
CN110162769B (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
KR101918358B1 (ko) | 맞춤형 정보를 제공하는 데이터 센터 시스템 | |
CN110990701B (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
CN110555092B (zh) | 舆情处理方法、装置及计算机可读存储介质 | |
CN111930884A (zh) | 一种确定回复语句的方法、设备和人机对话系统 | |
CN110598100A (zh) | 一种热词推荐方法、装置、设备及存储介质 | |
CN112565471B (zh) | 信息推送方法、推送机器人、计算机设备和存储介质 | |
CN112307293B (zh) | 设备功能搜索方法和装置 | |
CN111031118A (zh) | 信息推送方法、装置、电子设备及计算机可读取存储介质 | |
CN115795023B (zh) | 文档推荐方法、装置、设备以及存储介质 | |
CN114610793B (zh) | 一种基于大数据统计分析的交互方法、系统和存储介质 | |
CN111611489B (zh) | 一种搜索处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |