[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN104216901B - 信息搜索的方法和系统 - Google Patents

信息搜索的方法和系统 Download PDF

Info

Publication number
CN104216901B
CN104216901B CN201310214894.XA CN201310214894A CN104216901B CN 104216901 B CN104216901 B CN 104216901B CN 201310214894 A CN201310214894 A CN 201310214894A CN 104216901 B CN104216901 B CN 104216901B
Authority
CN
China
Prior art keywords
search
condition
data
information
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310214894.XA
Other languages
English (en)
Other versions
CN104216901A (zh
Inventor
康彦霞
田旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Feinno Communication Technology Co Ltd
Original Assignee
Beijing Feinno Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Feinno Communication Technology Co Ltd filed Critical Beijing Feinno Communication Technology Co Ltd
Priority to CN201310214894.XA priority Critical patent/CN104216901B/zh
Publication of CN104216901A publication Critical patent/CN104216901A/zh
Application granted granted Critical
Publication of CN104216901B publication Critical patent/CN104216901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息搜索的方法和系统,属于互联网技术领域。所述方法包括:客户端接收用户发送的搜索请求,对搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,搜索条件包括:关键字和搜索时间条件;服务器端根据所述搜索条件在目标数据库中搜索,得到满足搜索条件的信息,并将满足搜索条件的信息写入到临时表中,目标数据库中包括多张目标数据表,每张目标数据表是以天为单位建立的数据表,每张目标数据表中的数据满足预设条件;客户端从临时表中获取满足搜索条件的信息,并输出满足搜索条件的信息。本发明从抽取出的目标数据表中进行搜索,这样不仅提高了搜索的准确率,也提高了搜索的效率。

Description

信息搜索的方法和系统
技术领域
本发明涉及互联网技术领域,特别涉及一种信息搜索的方法和系统。
背景技术
随着互联网的发展,不同的运营商推出了各种网络产品以吸引更多的用户。随着互联网用户的增多,互联网上产生的消息也越来越多,这些消息中可能涉及到政治敏感词汇或是涉密信息,所以如何保证良好的网络环境是需要解决的问题。
目前有一种内容审核系统,运营商可以通过该系统对产品使用过程中产生的消息进行审核。具体的,在后台维护两张表,表1存放产品使用过程中产生的数据的基本信息,表2存放数据的内容。表1和表2通过数据ID关联,表1中一条数据ID对应表2中的多行。当运营商需要进行内容审核时,在客户端上输入搜索关键字,然后对表2进行全文搜索,从而得到需要审核的信息,进一步进行审核。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
目前内容审核系统的搜索关键字的内容都存放在一个字段中,该字段中的有些内容是需要搜索的,也有些内容是不需要搜索的,但现有的全文搜索技术不能对这些内容进行区分,比如搜索关键字‘abc’时,要求返回包括该关键字的标题、内容和昵称,但用现有的全文搜索技术进行关键字搜索的时候,除了包含该关键字的标题、内容和昵称会被搜索出来之外,还会搜索出一些干扰信息,比如包含关键字的链接地址也会被搜索出来,这样就会导致搜索的结果就不准确,也降低了搜索效率。
发明内容
为了解决现有全文搜索不准确、搜索效率低的问题,本发明实施例中提供了一种信息搜索的方法和系统。所述技术方案如下:
一方面,提供了一种信息搜索的方法,所述方法包括:
客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
所述客户端接收用户发送的搜索请求之前,还包括:
服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
另一方面,还提供了一种信息搜索的系统,所述系统包括:客户端和服务器端;
所述客户端,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
所述客户端接收用户发送的搜索请求之前,还包括:
所述服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
所述服务器端具体用于:
根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
所述客户端具体用于:
从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
所述服务器端还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本发明实施例提供的技术方案带来的有益效果是:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一中提供的一种信息搜索的方法流程图;
图2是本发明实施例二中提供的一种信息搜索的方法流程图;
图3是本发明实施例三中提供的一种信息搜索的系统示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
参见图1,本实施例中提供了一种信息搜索的方法,包括:
101、客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
102、所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
103、所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述客户端接收用户发送的搜索请求之前,还包括:
服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
在另一实施例中,所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
在另一实施例中,所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
实施例二
本发明实施例中提供了一种信息搜索的方法,从原始数据库中将需要的数据提取出来建立新的目标数据库,使用新的目标数据库进行信息搜索,并将搜索结果放入临时表中,方便客户端分页加载显示。其中,在目标数据库中组建多张一天为单位建立的目标数据表,这样在获得搜索时间条件后,就可以直接从目标数据库中搜索该搜索时间条件对应的目标数据表,然后再进一步根据关键字进行搜索,以提高搜索效率。参见图2,方法流程包括:
201、服务器端根据预设条件对源数据表进行抽取,并根据所述抽取出来的数据组建目标数据表。
本实施例中,在服务器端仍然维护着现有的两张表,如表1和表2所示:
表1
表2
其中,表1存放产品使用过程中产生的数据的基本信息,表2存放数据的内容,表1和表2通过数据ID关联,表1中一条数据ID对应表2中的多行。其中,表2中的DataType可以至少包括7种不同的数据类型,如Id、Source-来源、Author-作者、Text-文本内容、Video-视频、Photo-图片、bookmark-书签。
表2中插入数据非常频繁,大概是每分钟3千到4千条,通过服务器批量插入,如果一旦因为频繁查询或者更新索引,导致该表处理速度慢,则会产生因插入超时,而丢失数据的情况,也就无法对丢失的数据进行审核。此外,本实施例中,对关键字的搜索需求进行统计,获得被搜索次数比较多的数据类型,如Source-来源,Author-作者和Text-文本内容,因此本实施例中将该被搜索次数比较多的数据类型作为预设条件,对表2进行有针对性的数据抽取,以建立新的数据表,在搜索时对新的数据表进行搜索,这样可以既减少了搜索面积,又提高了搜索的准确性。其中新的数据表中存储着该被搜索次数比较多的数据类型对应的数据。
为了方便描述,将表2称作源数据表,新建的数据表称作目标数据表。具体执行过程中,新增一个目标数据库AUDITSearchDB,在该数据库中按天建立多张目标数据表,每隔预设时间将表2中的数据同步到AUDITSearchDB中,因为目标数据表是按照天建立的,因此目标数据表中只需要两列(DataId和DataValue)即可,其他无关列忽略。预设时间可以是一分钟,两分钟,五分钟等,对此本实施例中并不做具体限定。
其中,将表2中的数据同步到AUDITSearchDB中,包括:将当天被搜索次数比较多的数据类型作为抽取条件,对原始数据库的源数据表进行抽取,获得抽取数据,并将抽取出来的数据存储到AUDITSearchDB中的目标数据表中实现数据同步,其中,预设条件包括但不限于:数据来源、数据作者和文本内容等。如表3所示建立的目标数据表:
表3
列名 数据类型 注释
DataId bigint 数据Id
DataValue nvarchar(max) 字段值
值得说明的是,在建立新的AUDITSearchDB后,服务器端对目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。其中,预设期限是指与当前时间的距离,如预设期限为15天,一个月,或是3个月,如果超出这个期限,则删除在当天时间之前15天、一个月或是3个月的数据,以保证数据的时效性。
202、客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端。
本步骤中,搜索条件包括但不限于:关键字和搜索时间条件等。其中,在内容审核系统上设置搜索的时间条件,并将该条件作为必选项,这样当用户需要进行搜索时,必须选择此项才能进行搜索。具体执行过程中,可以提供多个时间条件供用户选择,如时间条件包括:当天、三号(对应当月的三号,例如3月3号)、五号(对应当月的五号)、三天内、五天内、一个星期内或是一个月内等,对此本实施例中并不做具体限定。当然也可以给用户提供输入接口,用户可以在该输入接口上输入自己需要搜索的时间条件,对此本实施例中并不做具体限定。
客户端在获取到用户的搜索请求后,对其进行分析,提取出其中包括的关键字和搜索时间条件,其中具体分析过程与现有技术类似,本实施例中不再赘述。
203、服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中。
本步骤中优选地,根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
例如,如果用户选择的搜索时间条件为当天,则只需要搜索当天对应的目标数据表,如果用户选择的时间条件为三号,则获取三号对应的目标数据表,在该目标数据表中对关键字进行搜索,得到搜索结果集。如果用户选择的时间条件为三天内,假如当天为5号,则合并3号、4号和5号三天对应目标数据表中的数据,得到联合搜索时间段的表,然后根据该搜索页面时间条件在该联合搜索时间段的表中进行搜索,得到搜索结果集。
进一步地,在获得满足搜索条件的结果后,将该结果插入到AUDITSearchDB的临时表中,以便用户分页加载。
204、客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
本步骤中,为方便查看搜索的结果,客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息,以在客户端展示搜索结果。
本实施例中,为了方便用户查看查询结果,客户端采用分页加载的方式,且为避免在翻页的时候再次查询,本实施例中采用将查询结果写入临时表的方式,这样翻页的时候查询结果就能直接从该临时表中查看,大幅提升了分页加载速度。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。且目标数据表以天为单位建立,一旦出现过期数据,则可将过期数据表直接删除,维护简单。本实施例中采用将查询结果写入临时表的方式,这样翻页的时候查询结果就能直接从该临时表中查看,大幅提升了分页加载速度。
实施例三
参见图3,本发明实施例中提供了一种信息搜索的系统,包括:客户端300和服务器端400;
所述客户端300,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端400,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述客户端300接收用户发送的搜索请求之前,所述服务器端400还用于根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
在另一实施例中,所述服务器端400根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端400根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
在另一实施例中,所述客户端300从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端300从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
在另一实施例中,所述服务器端400还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
本实施例的有益效果包括:在内容审核系统中加入搜索时间条件限制,且从抽取出的目标数据库中进行搜索,由于目标数据库中包括多张以天为单位建立目标数据表,且目标数据表中的数据满足预设条件,所以在对关键字进行搜索时更有针对性,这样不仅提高了搜索的准确率,也提高了搜索的效率。
需要说明的是:上述实施例提供的信息搜索的系统,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例提供的信息搜索的系统与信息搜索的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息搜索的方法,其特征在于,所述方法包括:
客户端接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,每张所述目标数据表是以天为单位建立的数据表,每张所述目标数据表中的数据满足预设条件,所述预设条件是指根据每张所述目标数据表对应的天内数据类型的被搜索次数确定得到的数据类型;
所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
2.根据权利要求1所述的方法,其特征在于,所述客户端接收用户发送的搜索请求之前,还包括:
所述服务器端根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
3.根据权利要求1所述的方法,其特征在于,所述服务器端根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,包括:
所述服务器端根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
4.根据权利要求1所述的方法,其特征在于,所述客户端从所述临时表中获取满足所述搜索条件的信息,并输出满足所述搜索条件的信息,包括:
所述客户端从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述服务器端对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
6.一种信息搜索的系统,其特征在于,所述系统包括:客户端和服务器端;
所述客户端,用于接收用户发送的搜索请求,对所述搜索请求进行解析获取搜索条件,并将所述搜索条件发送给服务器端,其中,所述搜索条件包括:关键字和搜索时间条件;
所述服务器端,用于根据所述搜索条件在目标数据库中搜索,得到满足所述搜索条件的信息,并将所述满足所述搜索条件的信息写入到临时表中,其中,所述目标数据库中包括多张目标数据表,所述每张目标数据表是以天为单位建立的数据表,所述每张目标数据表中的数据满足预设条件,所述预设条件是指根据每张所述目标数据表对应的天内数据类型的被搜索次数确定得到的数据类型;
所述客户端还用于从所述临时表中获取满足所述搜索条件的信息,并输出所述满足所述搜索条件的信息。
7.根据权利要求6所述的系统,其特征在于,所述客户端接收用户发送的搜索请求之前,
所述服务器端还用于根据预设条件对源数据表中的数据进行抽取,并将所述抽取出来的数据存储到目标数据表,其中,所述预设条件包括:数据来源、数据作者和文本内容。
8.根据权利要求6所述的系统,其特征在于,所述服务器端具体用于:
根据所述搜索时间条件判断是否只搜索一天的数据,如果是,则在目标数据库中搜索所述搜索时间条件对应的目标数据表,并在所述搜索时间条件对应的目标数据表中搜索所述关键字,得到满足所述搜索条件的信息,如果否,则在所述目标数据库中搜索所述搜索时间条件对应的多张目标数据表,并将所述搜索时间条件对应的多张目标数据表中的数据进行联合,得到联合后的搜索时间段的表,在所述联合后的搜索时间段的表中搜索所述关键字,得到满足所述搜索条件的信息。
9.根据权利要求6所述的系统,其特征在于,所述客户端具体用于:
从所述临时表中分页加载满足所述搜索条件的信息,并输出满足所述搜索条件的信息。
10.根据权利要求6所述的系统,其特征在于,
所述服务器端还用于对所述目标数据表中的数据进行监控,当发现有超出预设期限的数据时,删除超出所述预设期限的数据。
CN201310214894.XA 2013-05-31 2013-05-31 信息搜索的方法和系统 Active CN104216901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310214894.XA CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310214894.XA CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Publications (2)

Publication Number Publication Date
CN104216901A CN104216901A (zh) 2014-12-17
CN104216901B true CN104216901B (zh) 2017-12-05

Family

ID=52098404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310214894.XA Active CN104216901B (zh) 2013-05-31 2013-05-31 信息搜索的方法和系统

Country Status (1)

Country Link
CN (1) CN104216901B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787029A (zh) * 2016-02-25 2016-07-20 浪潮软件集团有限公司 一种基于solr的关键字词识别办法
CN108268515B (zh) * 2016-12-30 2020-07-31 北京国双科技有限公司 聚合表维度的选择方法和装置
CN107609180B (zh) * 2017-09-29 2020-10-30 浙江佩鼎大数据科技有限公司 一种筛选方法、终端及存储介质
CN111176650B (zh) * 2018-11-09 2023-04-18 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110088A (zh) * 2007-04-17 2008-01-23 南京中兴软创科技有限责任公司 基于缓存技术的数据库访问接口方法
CN101604334A (zh) * 2008-11-18 2009-12-16 北京美智医疗科技有限公司 一种基于缓存技术的医疗影像数据库检索方法及检索系统
CN101789878A (zh) * 2009-12-30 2010-07-28 中兴通讯股份有限公司 网管性能数据的处理方法及装置
CN102117309A (zh) * 2010-01-06 2011-07-06 卓望数码技术(深圳)有限公司 一种数据缓存系统和数据查询方法
CN102722508A (zh) * 2011-09-28 2012-10-10 新奥特(北京)视频技术有限公司 一种现场数据库提取技术统计的方法及系统
CN102737133A (zh) * 2012-06-27 2012-10-17 北京城市网邻信息技术有限公司 一种实时搜索的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950823B2 (en) * 2002-12-23 2005-09-27 International Business Machines Corporation Transparent edge-of-network data cache

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110088A (zh) * 2007-04-17 2008-01-23 南京中兴软创科技有限责任公司 基于缓存技术的数据库访问接口方法
CN101604334A (zh) * 2008-11-18 2009-12-16 北京美智医疗科技有限公司 一种基于缓存技术的医疗影像数据库检索方法及检索系统
CN101789878A (zh) * 2009-12-30 2010-07-28 中兴通讯股份有限公司 网管性能数据的处理方法及装置
CN102117309A (zh) * 2010-01-06 2011-07-06 卓望数码技术(深圳)有限公司 一种数据缓存系统和数据查询方法
CN102722508A (zh) * 2011-09-28 2012-10-10 新奥特(北京)视频技术有限公司 一种现场数据库提取技术统计的方法及系统
CN102737133A (zh) * 2012-06-27 2012-10-17 北京城市网邻信息技术有限公司 一种实时搜索的方法

Also Published As

Publication number Publication date
CN104216901A (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
TWI512506B (zh) Sorting method and device for search results
Mühleisen et al. Web Data Commons-Extracting Structured Data from Two Large Web Corpora.
US9727628B2 (en) System and method of applying globally unique identifiers to relate distributed data sources
US8965915B2 (en) Assisted query formation, validation, and result previewing in a database having a complex schema
CN103324669B (zh) 一种对网页书签进行处理的方法和客户端
US8364718B2 (en) Collaborative bookmarking
CN104462547B (zh) 一种可配置的网页数据采集的方法及系统
CN104281607A (zh) 微博热点话题分析方法
US10592841B2 (en) Automatic clustering by topic and prioritizing online feed items
CN103631794A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN106980651B (zh) 一种基于知识图谱的爬取种子列表更新方法及装置
CN107451208A (zh) 一种数据搜索方法与装置
DE112016005374T5 (de) Identifizieren von Abfragemustern und zugeordneten aggregierten Statistikdaten unter Suchabfragen
CN104391978A (zh) 用于浏览器的网页收藏处理方法及装置
JP2012009014A (ja) ウェブサイトの影響をランク付けする方法、装置、及び製品
US20160103913A1 (en) Method and system for calculating a degree of linkage for webpages
Wolfram Search characteristics in different types of Web-based IR environments: Are they the same?
CN104216901B (zh) 信息搜索的方法和系统
US20150302090A1 (en) Method and System for the Structural Analysis of Websites
KR20150018880A (ko) 정보 취합 분류의 디스플레이 방법 및 시스템
US10482390B2 (en) Information discovery system
US20130173606A1 (en) Normalized search
CN103942268A (zh) 搜索与应用相结合的方法、设备以及应用接口
US10127322B2 (en) Efficient retrieval of fresh internet content
CN102682011B (zh) 建立域名描述名称信息表、搜索的方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 810, 8 / F, 34 Haidian Street, Haidian District, Beijing 100080

Patentee after: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building block A room 602

Patentee before: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.