[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN102063432A - 一种检索方法和系统 - Google Patents

一种检索方法和系统 Download PDF

Info

Publication number
CN102063432A
CN102063432A CN200910211788XA CN200910211788A CN102063432A CN 102063432 A CN102063432 A CN 102063432A CN 200910211788X A CN200910211788X A CN 200910211788XA CN 200910211788 A CN200910211788 A CN 200910211788A CN 102063432 A CN102063432 A CN 102063432A
Authority
CN
China
Prior art keywords
retrieval
result
relevance score
relevance
subclass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910211788XA
Other languages
English (en)
Inventor
张理
李金辉
郭瑞杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN200910211788XA priority Critical patent/CN102063432A/zh
Priority to EP10830383.5A priority patent/EP2499564A4/en
Priority to US12/992,399 priority patent/US8583640B2/en
Priority to JP2012538819A priority patent/JP5615932B2/ja
Priority to PCT/US2010/051332 priority patent/WO2011059595A1/en
Publication of CN102063432A publication Critical patent/CN102063432A/zh
Priority to US14/037,068 priority patent/US9460158B2/en
Priority to US15/246,406 priority patent/US9870408B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种检索方法和系统,所述方法包括:根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取各个第一检索结果的第二相关性分值;多样性字段用于表示所述第一检索结果的属性类别;根据第一相关性分值和第二相关性分值生成各个第一检索结果的相关性参数值;按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。采用本申请的方法或系统,在搜索结果多样性过程中系统资源的消耗更小、运算更快以及扩展更灵活。

Description

一种检索方法和系统
技术领域
本申请涉及网络数据处理领域,特别涉及一种检索方法和系统。
背景技术
在搜索引擎的搜索过程中,对搜索结果按照某些属性(例如:地域、来源或主题等)进行二次排序,使得前n(n>=1)条搜索结果在属性上呈现分布的多样性,这样的现象称为搜索结果多样化。在电子商务搜索中,搜索结果通常按照结果的相关性或者时间来排序,这样的话将会导致供应商不断的发布同一种产品的信息,以使得自己的产品能够占据搜索结果的前几页,从而恶意地挤掉其他供应商的产品展示机会,而且给普通用户找到其他产品造成一定的困难。
为了避免这种现象,现有技术中,有一种通过抽取并按照相关性分级的方式进行检索的方法,其具体实现过程为:预先对搜索结果按照相关性进行分档,相关性分数值相近的搜索结果被划分到同一个档,然后再针对每个档中的搜索结果进行抽取,该抽取的方式为:选取一个字段作为多样化的依据,例如:uid(供应商的唯一标识),则搜索结果中就包括了多样化的供应商产品。在实际中,需要把搜索结果按照uid的值划分成很多子集合,属于同一个uid的搜索结果被划分到一个子集合中,并在该子集合内按照相关性分数值从大到小排序,然后抽取每个子集合中m(m>=1)个最相关的搜索结果,并把抽取出来的这些结果展现在搜索页面的前几页,这就能使得前几页的搜索结果中包含了多个不同uid的产品。
从上述过程中可以看出,在现有技术中,需要按照uid进行子集合划分并排序,虽然也在一定程度上可以实现搜索结果的多样化,但是现有技术在抽取和分档的过程中会对全部的搜索结果进行一次重新组织,这需要在系统内存中重新拷贝一份搜索结果集,这样就造成了大量的搜索引擎服务器端的资源消耗,例如时间,硬件系统的耗费等,从而导致了搜索引擎服务器端的性能降低;进一步的,每个子集合内部的排序其实并不是完全必要的,所以现有技术还进行了一部分无用的运算,这就浪费了用来进行这部分运算的系统资源;另外,现有技术采用相关性分档的做法虽然在一定程度上可以平衡搜索结果的多样性和相关性,但是也无法用一个固定的分档区间正确切分所有搜索结果集合的分布情况。如图1所示,该档位的划分对查询(Query)A是合适的,但是对于Query B的档位划分就不合适了,可以看出对于QueryA来说,相关性接近的搜索结果被划分在相同的分档区间,而对于QueryB,相关性接近的搜索结果并没有被规律的划分在同一分档区间。因此现有技术的灵活性也不够好。
总之,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新的提出一种检索方法,以解决现有技术中在服务器端资源过量消耗的问题。
发明内容
本申请所要解决的技术问题是提供一种检索方法,用以解决现有技术中在服务器端资源过量消耗导致的搜索引擎服务器段性能降低的问题,更进一步的,还可以提升检索方法的灵活性。
本申请还提供了一种检索系统,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种检索方法,包括:
根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
本申请还提供了一种检索系统,该系统包括:
获取单元,用于根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
计算单元,用于根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
设置单元,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
抽取单元,用于按照第二检索结果的预置个数和所述相关性参数值从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
与现有技术相比,本申请包括以下优点:
在本申请中,将现有技术中的第一相关性分数值和计算得到的第二相关性分数值之和作为相关性参数,以该相关性参数来对检索结果进行二次抽取,以使得搜索结果中能够尽量包括多样化的搜索结果,并且本申请在多样化的过程中进行了优化,使得运用本实施例所述的方法过程中系统资源的消耗更小、运算更快以及扩展更灵活,从而提升了搜索引擎服务器段的性能。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术中档位划分的界面示意图;
图2是本申请的一种检索方法实施例1的流程图;
图3是本申请的一种检索方法实施例2的流程图;
图4是本申请的一种检索方法实施例3的流程图;
图5是本申请的一种检索系统实施例1的结构框图;
图6是本申请的一种检索系统实施例2的结构框图;
图7是本申请的一种检索系统实施例3的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请的主要思想之一可以包括,首先采用现有技术中的方法,根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;本申请实施例中,关键是根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值,所述多样性字段用于表示所述第一检索结果的属性类别;然后将所述第一相关性分值和第二相关性分值之和作为所述各个第一检索结果的相关性参数值;最后按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。这样抽出的第二检索结果就可以更加明显的体现出搜索结果多样化;也避免了大量的搜索引擎服务器端的资源消耗,例如时间,硬件系统的耗费等,从而提升了搜索引擎服务器端的性能;进一步的,还能够使得本申请实施例的方法适应更多的搜索结果集合的分布情况,增加了灵活性。
参考图2,示出了本申请一种检索方法实施例1的流程图,可以包括以下步骤:
步骤201:根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合。
在搜索引擎相关的技术领域中,通常把用户的查询表示为符号Query,把与此Query匹配的一条结果表示为Doc,那么与Query匹配的所有结果集就是Doc集合,表示为{Doc}。
在本步骤中,当客户端提交Query之后,搜索引擎服务器内部处理过程的第一步就是把Query映射到{Doc},即Query->{Doc},其中,符号“->”表示映射的意思。同时,搜索引擎服务器为{Doc}中的每个Doc计算出第一相关性分值(Score1),所述Score1用来表示当前Doc与当前Query的匹配程度,用符号表示即:{Doc}->{Doc,Score1}。其中,所述映射过程即是根据Query匹配检索结果的过程,在计算Score1时,可以采用任何相关性算法来计算,譬如经典的TF-IDF算法,当然还可以采用其他方式,例如:信息增益(IG)、互信息(MI)以及熵的方法等。
需要说明的是,第一检索结果获得的算法可以由搜索引擎服务器任意定义,本申请并不限制搜索引擎服务器端采用何种算法获取第一检索结果集合。因此,如果本步骤中的相关性算法不一样,那么后续得到的第一检索结果也会有差别,可以理解的是,这并不会对本申请的后续流程产生影响,因为本申请是针对给定第一检索结果的多样化处理,而无需限制获得第一检索结果的方式。
步骤202:根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别。
在计算出第一检索结果集合中各个第一检索结果的Score1之后,需要根据预置的多样性字段和该Score1来计算各个第一检索结果的第二相关性分值(Score2),其中,多样性字段用于标识第一检索结果的属性类别,例如,在电子商务垂直搜索中,各个检索结果的uid(供应商的标识)或者地理位置信息等;所述Score2用来表示根据Score1的值和各个第一检索结果在该多样性字段下排名位置相关的一个数值,在实际应用中,所述Score2可以采用预先设置函数,并将该函数的参数设置为Score2和各个第一检索结果的排名位置,则该函数的返回值即是Score2的值。该函数中设置排名位置和Score2具有某种关联,例如,第一检索结果的排名越靠前,得到的Score2越大。当然,根据实际情况的不同,本领域技术人员也可以在该函数中采取排名位置和Score2的其他关联方式。
步骤203:根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值。
本步骤的内容是与现有技术中区别所在,即是在步骤102中计算了Score2的基础上,根据Score1和Score2生成所述各个第一检索结果的相关性参数值。具体生成所述各个第一检索结果的相关性参数值的方法可以包括:将Score1和Score2之和作为所述各个第一检索结果的相关性参数值;或者设定一权重值,使得相关性参数值等于Score2乘以该权重值所得的积加上Score1,例如设定所述权重值为2,则所述相关性参数值=Score1+2*Score2。本申请对如何根据Score1和Score2生成所述各个第一检索结果的相关性参数值并不做具体限定,任何根据本申请思想的简单变形都包括在本申请的保护范围之内。在本实施例中,并不是仅仅通过Score1对第一检索结果集合进行划分,而是将Score1和Score2两个参数共同生成的一个新的参数来对第一检索结果做后续的处理。步骤204:按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
在本步骤中,假设多样化字段预置的为uid,本实施例需要的参数还包括第二检索结果的预置个数,其中,具体的,预置个数的第二检索结果可以通过预设多样性值个数以及循环抽取次数获得,即,通过预设的多样性值个数与循环抽取次数的乘积计算获得需要抽取的第二检索结果的个数。该多样性值个数用于表示在后续抽取的第二检索结果中,不同uid的第一检索结果中需要抽取的检索结果的个数,例如,当个数为3时,表示不同的uid的搜索结果中均抽取3个。多样化操作的循环次数,用于表示将抽取的第二检索结果在后续向客户端展示时,共需向客户端展示多少个第二检索结果,例如,当循环次数为1时,则返回3个第二检索结果,当循环次数为2时,则返回6个第二检索结果,以此类推。这样抽取出的第二检索结果就包括了与不同uid相关的检索结果。
在本实施例中,在避免大量的搜索引擎服务器端的资源消耗,例如时间,硬件系统的耗费等,提升搜索引擎服务器端的性能的同时,进一步的,还允许用户可以很灵活的配置检索结果多样化的个数;同时可以通过定义不同的f(Position,Score1)函数来平衡检索结果的相关性和多样性,带给用户以最好的搜索体验。
参考图3,示出了本申请一种检索方法实施例2的流程图,可以包括以下步骤:
步骤301:根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合。
当然,在实际应用中,本申请实施例适用于搜索引擎服务器的检索结果并没有实现多样化的情况,即在获得第一检索结果并按照第一相关性分值进行排序后,该第一检索结果中相同属性的检索结果仍聚集在一起。例如,在搜索引擎服务器端的检索结果的前若干位均为与同一个供应商相关的检索结果。那么,在所述步骤301之后,可以首先对第一检索结果集合进行判断,例如,判断前若干个检索结果是否属于同一类别等,如果第一检索结果集合中的前若干位均为同一类别的检索结果,则可以执行后续步骤。
步骤302:按照预置的多样性字段对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合。
在本实施例中,假设接收得到的预置的多样性字段即是uid,那么如表1所示,多样性字段uid有{A,B,C}三个值,本实施例中第一检索结果集合{Doc}的关于uid的子集合为{A1,A2,A3},{B1,B2,B3},{C1,C2,C3},其中A1~A3的uid=A,A1~A3为A供应商下的检索结果,B1~B3的uid=B,B1~B3为C供应商下的检索结果,C1~C3的uid=C,C1~C3为C供应商下的检索结果。
步骤303:按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的位置。
在本实施例中,具体需要按照Score1的大小对子集合中的各个第一检索结果进行排序。具体如表1所示,表1为本实施例中的第一检索结果集合{Doc}以及每个Doc对应的uid和第一相关性分数值(Score1):
表1
  A1   A2   A3   B1   B2   B3   C1   C2   C3
Score1   300   250   200   150   100   50   40   30   20
uid   A   A   A   B   B   B   C   C   C
步骤304:根据预置的第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置的关系,匹配获取到各个第一检索结果的第二相关性分值。
在实际中,各个第一检索结果在所述分类后的各子集合中的位置与Score2的关系可以通过预置的函数来表示,例如,通过运算预置的第二相关性分值的获取函数,获得第一检索结果的第二相关性分值,所述获取函数的参数分别为所述第一检索结果在所述分类后的各子集合中的位置和第二相关性分值。其中,所述第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置的关系,可以理解为对于按照第一相关性分值排序并且按照多样性字段进行分类之后获得的各子集合中的检索结果的位置与第二相关性分值的大小关系,在实际中可以采用函数f(Position,Score1)的形式来表现,该函数在实际中可以随着用户的需求或者实际情况而采用任何形式和内容,本申请并不限定该函数的形式具体实现。例如,在实际中一个函数的示例可以如下所示:
Figure B200910211788XD0000081
Figure B200910211788XD0000091
上述函数的含义即是,当子集合中第一检索结果的排序位置为1时,则返回300,即是Score2值为300,而其他排序位置的第一检索结果的Score2值为零。
步骤305:根据所述第一相关性分值和第二相关性分值生成所述子集合中各个第一检索结果的相关性参数值。
本实施例生成各个第一检索结果的相关性参数值的方法可以包括:将步骤304中得到的第二相关性分值与第一检索结果的第一相关性分值进行相加,并将得到的和作为各个第一检索结果的相关性参数值。参考表2,示出了本实施例中子集合中各个第一检索结果的第一相关性分值、第二相关性分值以及相关性参数值。本实施例对获得相关性参数值的具体方法并不做限定,任何针对本实施例思想的简单变形都在本实施例的保护范围之内。
表2
  A1   A2   A3   B1   B2   B3   C1   C2   C3
  Score1   300   250   200   150   100   50   40   30   20
  Score2   300   0   0   300   0   0   300   0   0
  Score1+Score2   600   250   200   450   100   50   340   30   20
步骤306:按照所述相关性参数值对所述第一检索结果分类后的各子集合进行排序。
对所述第一检索结果分类后的各子集合再按照步骤305中得到的新的相关性参数值进行排序,可以得到重新排序后的各个第一检索结果在各子集合中的新顺序,在本实施例中,针对所述第一检索结果重新排序后的各子集合的前三位分别为A1、B1和C1。
步骤307:从排序后的各子集合中,按照排序的先后顺序分别抽取预置个数的第二检索结果,并将第二检索结果反馈给客户端。
其中,预置个数的第二检索结果可以通过预设多样性值个数以及循环抽取次数获得,即,通过预设的多样性值个数与循环抽取次数的乘积计算获得需要抽取的第二检索结果的个数。
其中,多样性字段用于表示所述第一检索结果的属性类别,而多样性字段值则是表示所述第一检索结果的属性类别的值,在本实施例中多样性字段即是uid,多样性字段值是A、B和C,按照多样性字段对第一检索结果进行分类后可得到A、B和C三个子集合。其中,可以直接预设每个子集合中需要抽取的第二检索结果的个数,也可以通过预设多样性值个数以及循环抽取次数获得。多样性值个数用于表示在后续抽取的第二检索结果中,不同uid需要抽取的第一检索结果的个数。例如,个数为3时,表示A、B和C供应商的第一检索结果分别需要抽取3个。在本实施例中,在抽取第二检索结果时还需要依据循环抽取次数,所述循环抽取次数可以用来表示每个类别中需要循环抽取第二检索结果的次数。例如,在本实施例中,其循环抽取次数(distinct_times)可以理解为,当循环抽取次数为1时,在每个供应商的检索结果中只抽取3个作为第二检索结果,当循环抽取次数为2时,则抽取每个供应商的检索结果中3*2个作为第二检索结果,其中,抽取方式和循环抽取次数为1时相同,依次类推。
如果按照distinct_count=1,distinct_times=1的设置进行第二检索结果的抽取,最后得到的第二检索结果顺序就是A1~B1~C1;如果按照distinct_count=1,distinct_times=3的设置进行第二检索结果的抽取,最后得到的第二检索结果顺序就是A1~B1~C1~A2~A3~B2~B3~C2~C3。本领域技术人员还可以通过设置不同的distinct_count,distinct_times和f(Position,Score1)函数,以达到不一样的多样化效果,从而能使得搜索结果的多样性与相关性之间能达到平衡。
可以看出,在采用本实施例所述的方法中,第二检索结果的前3条记录中就分别包括了uid为A、B、C的3条检索结果。这样就能够使得最终返回给用户的第二检索结果能够实现多样化,以满足搜索结果多样化的需求,并且在多样化的过程中进行了优化,使得运用本实施例所述的方法过程中系统资源的消耗更小、运算更快以及扩展更灵活。
参考图4,示出了本申请一种检索方法实施例3的流程图,本实施例可以理解为将本申请的检索方法应用于实际中的一个具体例子,可以包括以下步骤:
步骤401:按照第一相关性分值对所述客户端提交的查询数据进行检索。
在本实施例中,在搜索引擎服务器在获取第一检索结果时,需要按照第一相关性分值对当前查询数据进行查询。
步骤402:将检索结果按照预先选取的多样化字段抽取出第一检索结果。
这里的多样化字段需要预先选取,例如,在实施例2中,就是将多样化字段选取为uid。
步骤403:按照预置的多样性字段值对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合。
根据选取的uid在第一检索结果集合中,选择检索结果中和供应商A、B和C都相关的所有的检索结果作为第一检索结果中关于uid的子集合。
步骤404:按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的位置。
步骤405:根据预置的第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置的关系,匹配获取到各个第一检索结果的第二相关性分值。
步骤406:将所述第一相关性分值和第二相关性分值之和作为所述各个第一检索结果的相关性参数值。
步骤407:按照所述相关性参数值对第一检索结果分类后的各子集合进行排序。
步骤408:从排序后的各子集合中,按照排序的先后顺序分别抽取预置个数的第二检索结果。
其中,所述步骤404~408的执行过程可以参见实施例2中的描述。
步骤409:将查询数据、第二检索结果以及两者的对应关系保存至数据库中。
在本实施例中,在得到用户当前的查询数据、第二检索结果以及两者的对应关系之后,将其保存至数据库中。在保存时,可以采用数据表或者其他永久数据结构的形式进行保存。
步骤410:将所述第二检索结果向客户端进行展示。
同时,将所述第二检索结果向客户端进行展示,例如,可以展示实施例2中的前三位第二检索结果:A1、B2和C2,也可以将子集合中所有检索结果都进行展示,例如:A1~B1~C1~A2~A3~B2~B3~C2~C3。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述本申请一种检索方法实施例1所提供的方法相对应,参见图5,本申请还提供了一种检索系统实施例1,在本实施例中,该系统可以包括:
获取单元501,用于根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合。
在搜索引擎相关的技术领域中,通常把用户的查询表示为符号Query,把与此Query匹配的一条结果表示为Doc,那么与Query匹配的所有结果集就是Doc集合,表示为{Doc}。
计算单元502,用于根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别。
在计算出第一检索结果结合中各个第一检索结果的Score1之后,需要根据预置的多样性字段和该Score1来计算各个第一检索结果的第二相关性分值(Score2),其中,多样性字段用于标识第一检索结果的属性类别,例如,各个检索结果的uid或者地理位置信息等;所述Score2用来表示根据Score1的值和各个第一检索结果在该多样性字段下排名位置相关的一个数值。
设置单元503,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值,具体生成相关性参数值的方法可以包括:将所述第一相关性分值和第二相关性分值之和作为所述各个第一检索结果的相关性参数值。
抽取单元504,用于第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
在本步骤中,假设多样化字段预置的为uid,本实施例需要的参数还包括第二检索结果的预置个数,其中,具体的,预置个数的第二检索结果可以通过预设多样性值个数以及循环抽取次数获得,即,通过预设的多样性值个数与循环抽取次数的乘积计算获得需要抽取的第二检索结果的个数。针对所述多样化字段预置的每个多样性值个数,该多样性值个数用于表示在后续抽取的第二检索结果中,不同uid需要抽取的个数,例如,当个数为3时,表示不同的uid的搜索结果中均抽取3个。
本实施例所述的系统可以集成到搜索引擎的服务器上,也可以单独作为一个实体与搜索引擎服务器相连,另外,需要说明的是,当本申请所述的方法采用软件实现时,可以作为搜索引擎的服务器新增的一个功能,也可以单独编写相应的程序,本申请不限定所述方法或系统的实现方式。
与上述本申请一种检索方法实施例2所提供的方法相对应,参见图8,本申请还提供了一种检索装置的优选实施例2,在本实施例中,该装置具体可以包括:
获取单元501,用于根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合。
第一获取子单元601,用于按照预置的多样性字段对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合。
第二获取子单元602,用于按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的位置。
匹配子单元603,用于根据预置的第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置的关系,匹配获取到各个第一检索结果的第二相关性分值。
设置单元503,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值,具体生成相关性参数值的方法可以包括:将所述第一相关性分值和第二相关性分值之和作为所述各个第一检索结果的相关性参数值。
排序子单元604,用于按照所述相关性参数值对所述第一检索结果分类后的各子集合进行排序。
第一抽取子单元605,用于从排序后的各子集合中,按照排序的先后顺序分别抽取预置个数的第二检索结果,并将第二检索结果反馈给客户端。
与上述本申请一种检索方法实施例3所提供的方法相对应,参考图7,本申请还提供了一种检索系统的实施例,在本实施例中,该系统具体可以包括:
检索子单元701,用于按照第一相关性分值对所述客户端提交的查询数据进行检索。
第二抽取子单元702,用于将检索结果按照预先选取的多样化字段抽取出第一检索结果。
第一获取子单元601,用于按照预置的多样性字段值对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合。
第二获取子单元602,用于按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的位置。
匹配子单元603,用于根据预置的第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置与的关系,匹配获取到所述各个第一检索结果的第二相关性分值。
设置单元503,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值,具体生成相关性参数值的方法可以包括:将所述第一相关性分值和第二相关性分值之和作为所述各个第一检索结果的相关性参数值。
排序子单元604,用于按照所述相关性参数值对所述第一检索结果分类后的各子集合进行排序。
第一抽取子单元605,用于从排序后的各子集合中,属于同一个多样性字段值的第一检索结果中,按照排序的先后顺序分别抽取预置个数的第二检索结果。
保存单元703,用于将查询数据、第二检索结果以及两者的对应关系保存至数据库中。
展示单元704,用于将所述第二检索结果向客户端进行展示。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种检索方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种检索方法,其特征在于,该方法包括:
根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值,具体包括:
按照预置的多样性字段对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合;
按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的位置;
根据预置的第二相关性分值与各个第一检索结果在所述分类后的各子集合中的位置的关系,匹配获取到各个第一检索结果的第二相关性分值。
3.根据权利要求2所述的方法,其特征在于,所述按照第二检索结果的预置个数和相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果,具体包括:
按照所述相关性参数值对所述第一检索结果分类后的各子集合进行排序;
从排序后的各子集合中,按照排序的先后顺序分别抽取预置个数的第二检索结果,所述预置个数为多样性值个数和循环抽取次数的乘积。
4.根据权利要求1所述的方法,其特征在于,所述从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果之前,还包括:
将查询数据、第二检索结果以及两者的对应关系保存至数据库中。
5.根据权利要求3所述的方法,其特征在于,所述根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合,具体包括:
按照第一相关性分值对所述客户端提交的查询数据进行检索;
将检索结果按照预先选取的多样化字段抽取出第一检索结果。
6.根据权利要求1所述的方法,其特征在于,所述抽取需要向客户端展示的第二检索结果之后,还包括:
将所述第二检索结果向客户端进行展示。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值具体包括:将第一相关性分值和第二相关性分值之后作为所述各个第一检索结果的相关性参数值。
8.一种检索系统,其特征在于,该系统包括:
获取单元,用于根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
计算单元,用于根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
设置单元,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
抽取单元,用于按照第二检索结果的预置个数和所述相关性参数值从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
9.根据权利要求8所述的系统,其特征在于,所述计算单元具体包括:
第一获取子单元,用于按照预置的多样性字段对第一检索结果集合进行分类,获取所述第一检索结果集合中每一个类别对应的子集合;
第二获取子单元,用于按照所述各个子集合中第一相关性分值大小获取相应的第一检索结果的顺序;
匹配子单元,用于根据预置的所述第一检索结果的顺序与第二相关性分值的关系,匹配获取到各个第一检索结果的第二相关性分值。
10.根据权利要求9所述的系统,其特征在于,所述抽取单元具体包括:
排序子单元,用于按照所述相关性参数值对第一检索结果进行排序;
第一抽取子单元,用于从排序后的各子集合中,按照排序的先后顺序分别抽取预置个数的第二检索结果,所述预置个数为多样性值个数和循环抽取次数的乘积。
11.根据权利要求8所述的系统,其特征在于,所述系统还包括:
保存单元,用于将查询数据、第二检索结果以及两者的对应关系保存至数据库中。
12.根据权利要求11所述的系统,其特征在于,所述获取单元具体包括:
检索子单元,用于按照第一相关性分值对所述客户端提交的查询数据进行检索;
第二抽取子单元,用于将检索结果按照预先选取的多样化字段抽取出第一检索结果。
13.根据权利要求8所述的系统,其特征在于,还包括:
展示单元,用于将所述第二检索结果向客户端进行展示。
14.根据权利要求8所述的系统,其特征在于,所述设置单元,具体用于将第一相关性分值和第二相关性分值之后作为所述各个第一检索结果的相关性参数值。
CN200910211788XA 2009-11-12 2009-11-12 一种检索方法和系统 Pending CN102063432A (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN200910211788XA CN102063432A (zh) 2009-11-12 2009-11-12 一种检索方法和系统
EP10830383.5A EP2499564A4 (en) 2009-11-12 2010-10-04 Search method and system
US12/992,399 US8583640B2 (en) 2009-11-12 2010-10-04 Method and system of search result diversification
JP2012538819A JP5615932B2 (ja) 2009-11-12 2010-10-04 検索方法およびシステム
PCT/US2010/051332 WO2011059595A1 (en) 2009-11-12 2010-10-04 Search method and system
US14/037,068 US9460158B2 (en) 2009-11-12 2013-09-25 Search method and system
US15/246,406 US9870408B2 (en) 2009-11-12 2016-08-24 Search method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910211788XA CN102063432A (zh) 2009-11-12 2009-11-12 一种检索方法和系统

Publications (1)

Publication Number Publication Date
CN102063432A true CN102063432A (zh) 2011-05-18

Family

ID=43991931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910211788XA Pending CN102063432A (zh) 2009-11-12 2009-11-12 一种检索方法和系统

Country Status (5)

Country Link
US (3) US8583640B2 (zh)
EP (1) EP2499564A4 (zh)
JP (1) JP5615932B2 (zh)
CN (1) CN102063432A (zh)
WO (1) WO2011059595A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968413A (zh) * 2011-08-31 2013-03-13 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN103136213A (zh) * 2011-11-23 2013-06-05 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103377240A (zh) * 2012-04-26 2013-10-30 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
CN108536709A (zh) * 2017-03-03 2018-09-14 北京明略软件系统有限公司 一种搜索优化方法及装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600568B2 (en) * 2006-01-23 2017-03-21 Veritas Technologies Llc Methods and systems for automatic evaluation of electronic discovery review and productions
CN102063432A (zh) 2009-11-12 2011-05-18 阿里巴巴集团控股有限公司 一种检索方法和系统
US9195758B2 (en) * 2011-10-21 2015-11-24 Ebay, Inc. System and method for multi-dimensional personalization of search results
US8886639B2 (en) * 2012-04-19 2014-11-11 Sap Ag Semantically enriched search of services
US10032234B2 (en) * 2013-01-29 2018-07-24 Facebook, Inc. Ranking search results using diversity groups
US9355140B1 (en) 2013-03-13 2016-05-31 Google Inc. Associating an entity with a search query
US20140279190A1 (en) * 2013-03-14 2014-09-18 SimpleRelevance Inc. Recommended content generation and distribution
US10592781B2 (en) * 2014-07-18 2020-03-17 The Boeing Company Devices and method for scoring data to quickly identify relevant attributes for instant classification
US10019523B2 (en) * 2014-11-21 2018-07-10 Ebay Inc. Diversifying search results
US9632676B1 (en) * 2015-10-14 2017-04-25 Twiggle Ltd. Systems and methods for navigating a set of data objects
CN105677769B (zh) 2015-12-29 2018-01-05 广州神马移动信息科技有限公司 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统
US10409824B2 (en) * 2016-06-29 2019-09-10 International Business Machines Corporation System, method and recording medium for cognitive proximates
JP2019021228A (ja) 2017-07-21 2019-02-07 富士ゼロックス株式会社 検索装置、検索システム及びプログラム
US10475105B1 (en) * 2018-07-13 2019-11-12 Capital One Services, Llc Systems and methods for providing improved recommendations
US11609919B2 (en) 2019-07-30 2023-03-21 Walmart Apollo, Llc Methods and apparatus for automatically providing personalized search results
US11216519B2 (en) * 2019-07-30 2022-01-04 Walmart Apollo, Llc Methods and apparatus for automatically providing personalized search results

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3060456A (en) 1959-06-09 1962-10-30 Donald Colvin Detergent dispenser for flush valve fixtures
JPS62121576A (ja) 1985-11-22 1987-06-02 Toshiba Corp デ−タベ−スシステム
US4817050A (en) 1985-11-22 1989-03-28 Kabushiki Kaisha Toshiba Database system
US6961712B1 (en) 1996-10-25 2005-11-01 Ipf, Inc. Consumer product information request (CPIR) enabling servlets and web-based consumer product information catalogs employing the same
US6167397A (en) 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
US7177825B1 (en) 1999-05-11 2007-02-13 Borders Louis H Integrated system for ordering, fulfillment, and delivery of consumer products using a data network
US6785671B1 (en) 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US6631367B2 (en) 2000-12-28 2003-10-07 Intel Corporation Method and apparatus to search for information
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7620622B1 (en) 2001-03-08 2009-11-17 Yahoo! Inc. Method and system for indexing information and providing results for a search including objects having predetermined attributes
US7058643B2 (en) 2002-05-22 2006-06-06 Agilent Technologies, Inc. System, tools and methods to facilitate identification and organization of new information based on context of user's existing information
US7797271B1 (en) 2001-06-18 2010-09-14 Versata Development Group, Inc. Custom browse hierarchies for subsets of items in a primary hierarchy
US7127416B1 (en) 2001-06-18 2006-10-24 I2 Technologies Us, Inc. Distributed processing of sorted search results in an electronic commerce system and method
JP2003186912A (ja) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> Webページ検索の適合度計算方法とその装置、Webページ検索の検索結果表示方法とその装置、並びにそれらの方法の実行プログラムとそれらの方法の実行プログラムを記録した記録媒体
US6944612B2 (en) 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
FI20022123A (fi) 2002-12-02 2004-06-03 Stockway Oy Hajautettu tuotetiedon hallinta
US7451130B2 (en) 2003-06-16 2008-11-11 Google Inc. System and method for providing preferred country biasing of search results
US20040210491A1 (en) 2003-04-16 2004-10-21 Pasha Sadri Method for ranking user preferences
US7219090B2 (en) * 2003-04-25 2007-05-15 Overture Services, Inc. Method and system for blending search engine results from disparate sources into one search result
US20050010484A1 (en) 2003-07-11 2005-01-13 Scott Bohannon Apparatus for and method of facilitating fulfillment of buyer's/seller's desire
US7124148B2 (en) 2003-07-31 2006-10-17 Sap Aktiengesellschaft User-friendly search results display system, method, and computer program product
US7440964B2 (en) 2003-08-29 2008-10-21 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7281002B2 (en) * 2004-03-01 2007-10-09 International Business Machine Corporation Organizing related search results
JP2005327225A (ja) * 2004-05-12 2005-11-24 Asuya Eto 文書管理システム、文書管理方式、文書管理プログラム及びプログラム記録媒体
US20050289158A1 (en) 2004-06-25 2005-12-29 Jochen Weiss Identifier attributes for product data stored in an electronic database
US7725463B2 (en) * 2004-06-30 2010-05-25 Microsoft Corporation System and method for generating normalized relevance measure for analysis of search results
US7519595B2 (en) 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US8364670B2 (en) 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US7571157B2 (en) * 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7523099B1 (en) 2004-12-30 2009-04-21 Google Inc. Category suggestions relating to a search
US7792811B2 (en) 2005-02-16 2010-09-07 Transaxtions Llc Intelligent search with guiding info
US20060190425A1 (en) 2005-02-24 2006-08-24 Yuan-Chi Chang Method for merging multiple ranked lists with bounded memory
US7617193B2 (en) * 2005-03-28 2009-11-10 Elan Bitan Interactive user-controlled relevance ranking retrieved information in an information search system
US20060287980A1 (en) 2005-06-21 2006-12-21 Microsoft Corporation Intelligent search results blending
US20100299222A1 (en) 2005-08-19 2010-11-25 Hamilton Iv George B Online purchasing method
US20070078758A1 (en) 2005-09-23 2007-04-05 Susskind Robert A Risk assessment-based shopping of internet auctions
WO2007038713A2 (en) * 2005-09-28 2007-04-05 Epacris Inc. Search engine determining results based on probabilistic scoring of relevance
US7962402B2 (en) 2005-09-29 2011-06-14 Lev Eydelman On-line system for buyer seller matching and negotiation
US7840558B2 (en) 2005-11-04 2010-11-23 Microsoft Corporation Geo-tagged based listing service and mapping engine
US9135304B2 (en) 2005-12-02 2015-09-15 Salesforce.Com, Inc. Methods and systems for optimizing text searches over structured data in a multi-tenant environment
US7680697B2 (en) 2006-01-25 2010-03-16 Kelkoo Sas Searching for a seller of a product
US7814099B2 (en) 2006-01-31 2010-10-12 Louis S. Wang Method for ranking and sorting electronic documents in a search result list based on relevance
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US7761464B2 (en) * 2006-06-19 2010-07-20 Microsoft Corporation Diversifying search results for improved search and personalization
US8135709B2 (en) 2006-07-05 2012-03-13 BNA (Llesiant Corporation) Relevance ranked faceted metadata search method
US7921106B2 (en) 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US20080059429A1 (en) 2006-09-05 2008-03-06 Go Kojima Integrated search processing method and device
US8407229B2 (en) 2006-09-19 2013-03-26 Iac Search & Media, Inc. Systems and methods for aggregating search results
US20080140641A1 (en) 2006-12-07 2008-06-12 Yahoo! Inc. Knowledge and interests based search term ranking for search results validation
US20080140625A1 (en) 2006-12-08 2008-06-12 Electronics And Telecommunications Research Institute System and method for providing geospatial information processing services using web service technologies
US7630972B2 (en) 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
US7958126B2 (en) * 2006-12-19 2011-06-07 Yahoo! Inc. Techniques for including collection items in search results
US7962477B2 (en) * 2007-01-24 2011-06-14 Google Inc. Blending mobile search results
US7765227B1 (en) 2007-03-30 2010-07-27 A9.Com, Inc. Selection of search criteria order based on relevance information
US8352454B2 (en) 2007-04-11 2013-01-08 Travelport Development Llc System and method for performing data searches using multiple data search providers
US7917493B2 (en) 2007-04-19 2011-03-29 Retrevo Inc. Indexing and searching product identifiers
US8468083B1 (en) * 2007-08-10 2013-06-18 Google Inc. Advertisement topic diversification and ranking
US20090048943A1 (en) 2007-08-17 2009-02-19 Hardigree John W Internet based customer driven purchase method and apparatus
CN101868797B (zh) * 2007-09-21 2013-05-01 谷歌公司 跨语言搜索
US8103676B2 (en) 2007-10-11 2012-01-24 Google Inc. Classifying search results to determine page elements
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
CA2623796A1 (en) 2008-03-03 2009-09-03 David A. Wassmann Product information system for aggregating and classifying information from multiple sources with update ability
US8024332B2 (en) 2008-08-04 2011-09-20 Microsoft Corporation Clustering question search results based on topic and focus
US9727628B2 (en) 2008-08-11 2017-08-08 Innography, Inc. System and method of applying globally unique identifiers to relate distributed data sources
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US20100094723A1 (en) 2008-10-14 2010-04-15 Johnson Brian M Systems and methods to intialize a data source based on a compatibility with an application
US8903816B2 (en) * 2009-04-08 2014-12-02 Ebay Inc. Methods and systems for deriving a score with which item listings are ordered when presented in search results
US8626784B2 (en) 2009-05-11 2014-01-07 Microsoft Corporation Model-based searching
US10055786B2 (en) 2009-07-28 2018-08-21 Ebay Inc. System and method enabling searching for items, listings, or products based on listing activity
US8180768B2 (en) 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
US20110072023A1 (en) 2009-09-21 2011-03-24 Yahoo! Inc. Detect, Index, and Retrieve Term-Group Attributes for Network Search
US20110082770A1 (en) 2009-10-06 2011-04-07 Prabhakaran Krishnamoorthy User-Initiated Buyer-Vendor Match Search
CN102063432A (zh) 2009-11-12 2011-05-18 阿里巴巴集团控股有限公司 一种检索方法和系统
US10140339B2 (en) 2010-01-26 2018-11-27 Paypal, Inc. Methods and systems for simulating a search to generate an optimized scoring function
US8788371B2 (en) 2010-05-26 2014-07-22 Ebay Inc. Personalized search widgets for customized user interface
US8463805B2 (en) 2010-09-15 2013-06-11 Cbs Interactive, Inc. Mapping product identification information to a product
US8626604B1 (en) 2011-05-19 2014-01-07 Google Inc. Aggregating product endorsement information
CN102968418A (zh) 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 网站信息检索方法和系统
US20130197971A1 (en) 2011-10-30 2013-08-01 Martin J Wilke Motor vehicle dealer analysis marketing system and method with aftermarket accessories
CN103377240B (zh) 2012-04-26 2017-03-01 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968413A (zh) * 2011-08-31 2013-03-13 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN102968413B (zh) * 2011-08-31 2017-12-26 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN103136213A (zh) * 2011-11-23 2013-06-05 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103136213B (zh) * 2011-11-23 2017-04-12 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103377240A (zh) * 2012-04-26 2013-10-30 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
CN103377240B (zh) * 2012-04-26 2017-03-01 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
CN108536709A (zh) * 2017-03-03 2018-09-14 北京明略软件系统有限公司 一种搜索优化方法及装置
CN108536709B (zh) * 2017-03-03 2021-04-30 北京明略软件系统有限公司 一种搜索优化方法及装置

Also Published As

Publication number Publication date
US8583640B2 (en) 2013-11-12
US20140025672A1 (en) 2014-01-23
US20160364393A1 (en) 2016-12-15
JP5615932B2 (ja) 2014-10-29
US9870408B2 (en) 2018-01-16
US9460158B2 (en) 2016-10-04
JP2013511085A (ja) 2013-03-28
US20120221562A1 (en) 2012-08-30
EP2499564A1 (en) 2012-09-19
WO2011059595A1 (en) 2011-05-19
EP2499564A4 (en) 2018-01-03

Similar Documents

Publication Publication Date Title
CN102063432A (zh) 一种检索方法和系统
CN102456058B (zh) 类目信息提供方法及装置
CN102402605B (zh) 用于搜索引擎索引的混合分布模型
CN102171689B (zh) 用于提供搜索结果的方法、系统
CN109816482B (zh) 电商平台的知识图谱构建方法、装置、设备及存储介质
CN108647276B (zh) 一种搜索方法
CN103514181B (zh) 一种搜索方法和装置
CN103577432A (zh) 一种商品信息搜索方法和系统
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
CN102682001A (zh) 一种确定推荐词的方法及设备
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN110046298A (zh) 一种查询词推荐方法、装置、终端设备及计算机可读介质
CN102053992A (zh) 聚类方法和系统
CN104346446A (zh) 一种基于知识图谱的论文关联信息推荐方法及装置
CN102129431A (zh) 应用于网上交易平台的检索方法和系统
CN105069077A (zh) 搜索方法及装置
CN104636429A (zh) 商标类别检索方法和装置
CN104077407A (zh) 一种智能数据搜索系统及方法
CN103377260A (zh) 一种网络日志url 的分析方法及装置
CN102364467A (zh) 一种网络搜索方法和系统
US20090327339A1 (en) Partition templates for multidimensional databases
CN109635072B (zh) 舆情数据分布式存储方法、装置、存储介质和终端设备
Endrullis et al. Entity search strategies for mashup applications
CN117114829A (zh) 招投标的信息关联方法和系统
CN108170693B (zh) 推送热词的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1153020

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20110518

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1153020

Country of ref document: HK