[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110019980B - 索引处理方法、装置、存储介质和计算机设备 - Google Patents

索引处理方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN110019980B
CN110019980B CN201711207642.9A CN201711207642A CN110019980B CN 110019980 B CN110019980 B CN 110019980B CN 201711207642 A CN201711207642 A CN 201711207642A CN 110019980 B CN110019980 B CN 110019980B
Authority
CN
China
Prior art keywords
user
identifier
user set
index
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711207642.9A
Other languages
English (en)
Other versions
CN110019980A (zh
Inventor
习明昊
刘昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711207642.9A priority Critical patent/CN110019980B/zh
Publication of CN110019980A publication Critical patent/CN110019980A/zh
Application granted granted Critical
Publication of CN110019980B publication Critical patent/CN110019980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种索引处理方法、装置、存储介质和计算机设备,该索引处理方法包括:获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;建立所述新增的用户集标识对于所述多个用户标识的临时索引;在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;在所述倒排索引更新完成后删除所述临时索引。本申请提供的方案提高了信息推广的时效性。

Description

索引处理方法、装置、存储介质和计算机设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种索引处理方法、装置、存储介质和计算机设备。
背景技术
随着计算机技术的发展,通过互联网查看信息的用户越来越多,因此基于互联网针对特定用户集群投放的推广信息越来越多。传统技术中针对特定用户集投放推广信息时,通常是通过建立用户与用户集群之间的倒排索引,进而通过查询倒排索引对属于特定用户集群中的用户进行推广信息推广。
然而,通过互联网查看信息的用户数量日趋庞大,单个用户集群的用户规模达到千万级甚至亿级,这样在新增用户集群时,倒排索引建立的时间较长,从而导致无法及时地对新增用户集群中的用户进行信息推广。
发明内容
基于此,有必要针对目前推广信息推广时效性比较低的问题,提供一种索引处理方法、装置、存储介质和计算机设备。
一种索引处理方法,包括:
获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立所述新增的用户集标识对于所述多个用户标识的临时索引;
在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;
在所述倒排索引更新完成后删除所述临时索引。
一种索引处理装置,包括:
获取模块,用于获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立模块,用于建立所述新增的用户集标识对于所述多个用户标识的临时索引;
更新模块,用于在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;
删除模块,用于在所述倒排索引更新完成后删除所述临时索引。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立所述新增的用户集标识对于所述多个用户标识的临时索引;
在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;
在所述倒排索引更新完成后删除所述临时索引。
一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立所述新增的用户集标识对于所述多个用户标识的临时索引;
在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;
在所述倒排索引更新完成后删除所述临时索引。
上述索引更新方法、装置、存储介质和计算机设备,在新增用户集时,获取新增的用户集标识及该新增用户集的多个用户的用户标识,自动建立新增的用户集标识对于这多个用户标识的临时索引,并且在建立临时索引时,异步根据新增的用户集标识和这多个用户标识来更新历史建立的用户标识对于用户集标识的倒排索引,这样在新增用户集,但倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
附图说明
图1为一个实施例中索引处理方法的应用环境图;
图2为一个实施例中索引处理方法的流程示意图;
图3为一个实施例中通过用户标签定制方式新增用户集的界面示意图;
图4为一个实施例中通过文件上传方式新增用户集的界面示意图;
图5为一个实施例中索引处理的原理示意图;
图6为一个实施例中推广内容投放设置界面的界面示意图;
图7为一个实施例索引处理方法的硬件架构原理图;
图8为一个实施例中索引处理装置的模块结构图;
图9为另一个实施例中索引处理装置的模块结构图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中索引处理方法的应用环境图。参照图1,该索引处理方法应用于索引处理系统。该索引处理系统包括终端110和服务器120。其中,终端110和服务器120通过网络连接。服务器120用于执行索引处理方法。终端110具体可以是台式终端或移动终端,移动终端具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120具体可以是独立的服务器,也可以是多个独立的服务器组成的服务器集群。服务器120可以包括开放服务平台。
图2为一个实施例中索引处理方法的流程示意图。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该索引处理方法具体包括如下步骤:
S202,获取新增的用户集标识及与新增的用户集标识对应的多个用户标识。
其中,用户集标识可以是包括数字、字母和符号中的至少一种字符的字符串,用于唯一标识一个用户集。用户集标识比如TargetID。用户集标识所对应的用户集中包括多个用户标识。用户标识也可以是包括数字、字母和符号中的至少一种字符的字符串,用于唯一标识一个用户。用户标识比如UserID。用户集标识所对应的用户集中包括多个用户标识,与该用户集标识对应。
具体地,服务器可接收推广内容提供方标识登录的第一终端发送的用户集标识,以及与该用户集标识对应的多个用户标识,从而获取到新增的用户集标识及与新增的用户集标识对应的多个用户标识。其中,推广内容提供方标识是用于唯一标识推广内容提供者的字符串。推广内容提供方标识登录的第一终端可通过服务器提供的数据管理平台新增用户集,并指定用户集进行推广内容投放。
在一个实施例中,推广内容提供方标识登录的第一终端,可提供由服务器所提供的数据管理平台的操作界面,并在该操作界面设置新增用户集的操作入口。第一终端可检测对该操作入口的触发操作,根据检测到的触发操作触发相应的触发指令,根据该触发指令向服务器发送新增的用户集标识及与新增的用户集标识对应的多个用户标识。服务器从而接收到新增的用户集标识及与新增的用户集标识对应的多个用户标识。其中,触发入口可以是图标、文字链接或者虚拟按钮等。
在一个实施例中,操作界面中设置的用于新增用户集的触发入口可以是多个。每个触发入口各自对应一种新增用户集的方式。新增用户集的方式具体可以是用户标签定制方式、文件上传方式或者社交关系扩散方式等。
S204,建立新增的用户集标识对于多个用户标识的临时索引。
其中,临时索引是临时建立的索引,在正式索引建立完成后,该临时索引即可被删除。索引是据以查找某一数据所对应的另一数据的映射关系。在本实施例中,临时索引表示数据集与属于该数据集的数据的映射关系。临时索引所反映的映射关系具有方向性。新增的用户集标识对于多个用户标识的临时索引,表示新增的用户集标识映射至该用户集标识所对应的用户集中包括的用户标识的映射关系。
举例说明,假设新增的用户集标识为TargetID1,与新增的用户集标识对应的多个用户标识为UserID1,UserID2和UserID3。那么TargetID1对于UserID1,UserID2和UserID3的临时索引为:TargetID1→(UserID1,UserID2,UserID3)。
在一个实施例中,该临时索引具体可以是位图索引或者散列索引。
S206,在建立临时索引时,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。
其中,倒排索引(Inverted index),也称为反向索引,用于表示数据与该数据所属的数据集的映射关系。在本实施例中,倒排索引所反映的映射关系具有方向性。用户标识对于用户集标识的倒排索引,表示用户标识映射至与该用户标识所属用户集的用户集标识的映射关系。
举例说明,假设用户标识为UserID1,且UserID1包括于用户集TargetID1和用户集TargetID2中。那么,UserID1对于TargetID1和TargetID2的倒排索引为:UserID1→(TargetID1,TargetID2)。
正如前文所描述的,临时索引是由用户集标识映射至用户标识的映射关系,而倒排索引是由用户标识映射至用户集标识的映射关系。那么,可以理解的是,临时索引与倒排索引所反映的映射关系的映射方向相反。
具体地,服务器可在建立临时索引时,即根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。服务器也可事先设置更新倒排索引的触发条件,在满足该触发条件时进行倒排索引更新。该触发条件可以是当前时间点满足预先设置的更新周期的周期性时间点,也可以是新增的用户集标识数量达到预设数据。比如,每隔1小时进行倒排索引更新,或者每新增10个用户集标识时进行倒排索引更新。
在本实施例中,倒排索引即上文中提到的正式索引。由于,推广内容提供者在意图投放推广内容时,通常是通过设置用户集,再针对用户集进行推广内容投放。那么,可以理解的是,建立由用户集标识映射至用户标识的映射关系的效率要高于建立由用户标识映射至用户集标识的映射关系。
举例说明,假设用户集标识为TargetID1和TargetID2,与TargetID1对应的多个用户标识为UserID1,UserID2和UserID3,与TargetID2对应的多个用户标识为UserID2,UserID3和UserID4。那么,可直接建立由用户集标识映射至用户标识的映射关系:TargetID1→(UserID1,UserID2,UserID3)与TargetID2→(UserID2,UserID3,UserID4)。而建立由用户集标识映射至用户标识的映射关系则需对用户集标识和用户标识进行倒排,从而得到UserID1→(TargetID1),UserID2→(TargetID1,TargetID2),UserID3→(TargetID1,TargetID2)与UserID4→(TargetID2)。可以明显看出,建立由用户集标识映射至用户标识的映射关系的效率要高于建立由用户标识映射至用户集标识的映射关系。尤其是在用户集所包括的用户标识数量庞大时,两者的效率差尤为明显。
而服务器在进行推广内容推广时,是针对单个用户进行推广,那么服务器需要先查找该用户所属的用户集,再查找针对该用户集投放的推广内容进行推广。那么,可以理解的是,通过由用户集标识映射至用户标识的映射关系查找用户所属的用户集的效率,低于通过由用户标识映射至用户集标识的映射关系查找用户所属的用户集的效率。因此,服务器将倒排索引设置为正式索引,以提高推广时的查询效率,并在新增用户集时,异步采用临时索引,以提高推广时的时效性。
S208,在倒排索引更新完成后删除临时索引。
具体地,临时索引用于在正式索引,即倒排索引未更新或未更新完成时,供临时查询。那么在倒排索引更新完成后,即可直接查询倒排索引,此时则可删除临时索引,以节约存储资源。
上述索引更新方法,在新增用户集时,获取新增的用户集标识及该新增用户集的多个用户的用户标识,自动建立新增的用户集标识对于这多个用户标识的临时索引,并且在建立临时索引时,异步根据新增的用户集标识和这多个用户标识来更新历史建立的用户标识对于用户集标识的倒排索引,这样在新增用户集,但倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
在一个实施例中,S202包括:获取新增的用户集标识及与新增的用户集标识对应的用户标签;根据用户标签挑选用户标识,得到与新增的用户集标识对应的多个用户标识。
其中,用户标签是反映用户与其它用户的特性或者共性的标记。用户标签比如用户性别或者兴趣爱好等。
具体地,推广内容提供方标识登录的第一终端,可提供由服务器所提供的数据管理平台的操作界面,该操作界面上可设置有用于通过用户标签定制方式新增用户集的操作入口。第一终端可检测对该操作入口的触发操作,根据检测到的触发操作跳转至用户标签设置界面。第一终端可获取通过该用户标签设置界面输入的用户集标识,以及对应该用户集标识输入或者选择的一个或多个用户标签,再将获取的用户集标识及与该用户集标识对应的一个或多个用户标签上传至服务器,服务器再按照这一个或多个用户标签挑选用户标识,得到与该用户集标识对应的多个用户标识。
在一个实施例中,用户集所对应的用户集标识,可以是该用户集中各用户共同对应的用户标签。比如,用户集标识为:人口属性-性别-男。再比如:汽车兴趣-车型-国产等。服务器在按照一个或多个用户标签挑选用户标识时,可以是对已有的用户集进行组合,从而得到与该用户集标识对应的多个用户标识。。其中,用户集组合的方式可以是求取交集、求取并集或者求取差集等。比如,与新增的用户集标识对应的用户标签为汽车兴趣-车型-国产或者合资,那么可将“汽车兴趣-车型-国产”与“汽车兴趣-车型-合资”这两个用户集求取并集。假设,与新增的用户集标识对应的用户标签还包括人口属性-性别-男,那么可再将在前得到的并集与“人口属性-性别-男”这个用户集求取交集。
在一个实施例中,服务器可收集跨领域的用户数据,对收集的用户数据进行分词,并通过语义分析或者词频分析,查找出能够代表用户的关键词,从而根据该关键词形成用户标签。服务器再将相同用户的所有用户标签构成该用户的用户标签集。其中,领域是指用户的活动场景,比如购物场景、发微博消息场景或者评论场景等。跨领域的用户数据则是在用户的不同活动场景下的行为所产生的数据,比如购物场景下产生的购买物品的信息、发微博消息场景下产生的微博消息以及评论场景下产生的评论信息。服务器在按照一个或多个用户标签挑选用户标识时,可以是查询各用户的用户标签集,当用户的用户标签集中包括服务器获取到的用户标签时,即挑选该用户分类至新增的用户集标识所对应的用户集中,从而得到与该用户集标识对应的多个用户标识。
图3示出了一个实施例中通过用户标签定制方式新增用户集的界面示意图。参考图3,推广内容提供者可在该界面输入用户标签,或者通过界面提供的用户标签选项进行用户标签选择。推广内容提供者还可以选择已有用户集进行组合得到新的用户集。
上述实施例中,通过反映用户特性或者共性的用户标签来定制用户集,使得生成的用户集中各用户之间的共性更明显,从而在后续针对用户集进行推广内容投放时更准确。
在一个实施例中,S202包括:获取新增的用户集标识及与新增的用户集标识对应上传的文件;从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识。
其中,文件是用于记载数据的载体。在本实施例中,与新增的用户集标识对应上传的文件可以是文本文件,如TXT格式的文件或者逗号分隔值(CSV,Comma-SeparatedValues)格式的文件。
具体地,推广内容提供方标识登录的第一终端,可提供由服务器所提供的数据管理平台的操作界面,该操作界面上可设置有用于通过文件上传方式新增用户集的操作入口。第一终端可检测对该操作入口的触发操作,根据检测到的触发操作跳转至文件上传界面。第一终端可获取通过该文件上传界面输入的用户集标识,以及对应该用户集标识上传的文件,再将获取的用户集标识及与该用户集标识对应的文件上传至服务器,服务器再从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识。其中,用户标识具体可以是电话号码、社交账号或者终端设备标识等。
在一个实施例中,推广内容提供方标识登录的第一终端,可在同一文件上传界面获取多份上传的文件,并根据指令将多份文件分别设置为对应不同的用户集标识,或者合并后对应相同的用户集标识。
图4示出了一个实施例中通过文件上传方式新增用户集的界面示意图。参考图4,推广内容提供者可在该界面上传记载了用户标识的文件。推广内容提供者可上传多个文件,对于上传的多个文件可以保持为多个用户集,或者合并为同一用户集。
在本实施例中,提供了另外的用户集生成方式,丰富了用户集生成途径。
在一个实施例中,S204包括:创建与新增的用户集标识对应的标志值序列;将多个用户标识各自映射为位置标识,位置标识用于表示用户标识相应的标志值在标志值序列中所在位置;更新标志值序列中与位置标识对应的标志值,更新后的标志值表示相应的用户标识与新增的用户集标识对应。
其中,标志值序列包括一系列的标志值。该标志值有两种取值,分别用来表示相应用户标识是否与该标志值序列对应的用户集标识对应。位置标识用于表示标志值在标志数值序列中的具体位置。
在一个实施例中,该临时索引具体可以是位图索引。具体地,服务器可统计所有用户集包括的用户标识的数量,并将这些用户标识按序排列。服务器可再创建与新增的用户集标识对应的标志值序列,该标志值序列包括的标志值的数量与所有用户集包括的用户标识的数量相同,并将标志值序列中的所有标志值设置为第一数值。可以理解的是,这里的所有用户集包括新增的用户集。
举例说明,图5示出了一个实施例中索引处理的原理示意图。参考图5,服务器中已有的用户集TargetID1和TargetID2,与TargetID1对应的多个用户标识为UserID1、UserID2、UserID3和UserID4,与TargetID2对应的多个用户标识为UserID2、UserID3、UserID4和UserID5。现新增TargetID3,与TargetID3对应的多个用户标识为UserID4、UserID5、UserID6和UserID7。那么此时,所有用户集包括的用户标识的数量为7,且按序排列为UserID1、UserID2、UserID3、UserID4、UserID5、UserID6、UserID7。假设第一数值为0,那么,创建的与新增的用户集标识对应的标志值序列为:[0,0,0,0,0,0,0]。
进一步地,服务器可将多个用户标识各自映射为位置标识。具体地,服务器可将用户标识按序排列时的排位号作为用户标识的位置标识。比如,UserID2排在第二位,那么UserID2的位置标识即为2。其中,位置标识用于表示用户标识相应的标志值在标志值序列中所在位置,也就是。服务器在确定这多个用户标识各自映射的位置标识后,将标志值序列中与这些位置标识对应的标志值更新为第二数值,更新后的标志值表示相应的用户标识与新增的用户集标识对应。这样新增的用户集标识对于更新后的标志值序列即为临时索引。
举例说明,参考图5,对于新增的TargetID3所对应的多个用户标识UserID4、UserID5、UserID6和UserID7。按照用户标识的排序:UserID1、UserID2、UserID3、UserID4、UserID5、UserID6、UserID7,可得到UserID4对应的位置标识为4、UserID5对应的位置标识为5、UserID6对应的位置标识为6以及UserID7对应的位置标识为7。假设第二数值为1,那么则将新增的用户集标识对应的标志值序列[0,0,0,0,0,0,0]中第4、5、6和7位更新为1,得到[0,0,0,1,1,1,1],从而得到TargetID3→[0,0,0,1,1,1,1],表示UserID4、UserID5、UserID6和UserID7包括于TargetID3。
在一个实施例中,该临时索引还可以是散列索引。具体地,服务器可按照用户标识与位置标识的映射关系,将用户标识映射为表示相应标志值在标志值序列中所在位置的位置标识。用户标识与位置标识的映射关系,具体可以是以用户标识为自变量,以位置标识为因变量的映射函数。其中,映射函数具体可以是哈希函数。哈希函数或称为散列函数,可把任意长度的输入压缩为预设长度的输出,该输出为哈希值或称为散列值。
进一步地,服务器将用户标识映射为表示相应标志值在标志值序列中所在位置的位置标识后,查看标志值序列中该位置标识所标识的位置处的标志值,进而将确定的标志值,由表示相应用户标识与新增的用户集标识不对应,更新为表示相应用户标识与新增的用户集标识对应。
在上述实施例中,在新增用户集时,通过建立由用户集标识映射至用户标识的临时索引,极大地提高了索引生成效率,进而在需要进行信息推广时可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
在一个实施例中,S206包括:对于多个用户标识中已建立倒排索引的用户标识,将新增的用户集标识添加至已建立倒排索引的用户标识所对应的倒排索引中;对于多个用户标识中未建立倒排索引的用户标识,新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引。
具体地,服务器可在获取到与新增的用户集标识对应的多个用户标识后,遍历各用户标识,在遍历时,将遍历至的用户标识与已建立倒排索引的用户标识对比。当遍历至的用户标识与已建立倒排索引的用户标识一致时,则将新增的用户集标识添加至已建立倒排索引的用户标识所对应的倒排索引中。当遍历至的用户标识与已建立倒排索引的用户标识不一致时,则新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引。
举例说明,参考图5,历史建立的倒排索引包括:UserID1→(TargetID1)、UserID2→(TargetID1,TargetID2)、UserID3→(TargetID1,TargetID2)、UserID4→(TargetID1,TargetID2)和UserID5→(TargetID2),此时新增用户集TargetID3,且TargetID3对应多个用户标识UserID4,UserID5、UserID6和UserID7。服务器遍历发现UserID4和UserID5为已建立倒排索引的用户标识,则将新增的用户集标识TargetID3添加至已建立倒排索引的用户标识所对应的倒排索引中,得到UserID4→(TargetID1,TargetID2,TargetID3)和UserID5→(TargetID2,TargetID3)。UserID6和UserID7为未建立倒排索引的用户标识,则新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引,得到UserID6→(TargetID3)和UserID7→(TargetID3)。从而得到更新后的倒排索引:UserID1→(TargetID1)、UserID2→(TargetID1,TargetID2)、UserID3→(TargetID1,TargetID2)、UserID4→(TargetID1,TargetID2,TargetID3)、UserID5→(TargetID2,TargetID3)、UserID6→(TargetID3)和UserID7→(TargetID3)。
在本实施例中,在建立临时索引时,异步更新正式的倒排索引,确保正式数据的完整性和准确性。
在一个实施例中,该索引处理方法还包括:获取推广内容投放指令;提取推广内容投放指令中包括的推广内容标识和用户集标识;建立提取的推广内容标识对于提取的用户集标识的投放索引。
其中,推广内容投放指令是用于投放推广内容的指令。推广内容是用于进行推广的数据。推广内容可以是广告。推广内容可以包括图片、文字、图文结合、音频、视频或图形码等中的至少一种形式。
投放索引用于表示投放数据与投放对象的映射关系。在本实施例中,投放索引所反映的映射关系具有方向性。推广内容标识对于用户集标识的投放索引,表示推广内容标识映射至推广内容投放至的用户集的用户集标识的映射关系。
具体地,推广内容提供方标识登录的第一终端,可提供由服务器所提供的推广内容投放平台的操作界面,并在该操作界面设置投放推广内容的操作入口。第一终端可检测对该操作入口的触发操作,根据检测到的触发操作跳转至推广内容投放设置界面。第一终端检测推广内容投放指令,在检测到推广内容投放指令后获取通过该界面设置推广内容标识、指定投放的用户集所对应的用户集标识或者指定投放条件等,将获取的数据携带在推广内容投放指令中发送至服务器。
其中,指定投放条件可以是推广内容投放区域或者推广内容投放时段等。图6示出了一个实施例中推广内容投放设置界面的界面示意图。参考图6,推广内容提供者可在该界面设置推广内容标识、指定投放的用户集所对应的用户集标识或者指定的投放条件等。
进一步地,服务器在接收到推广内容投放指令后,提取该推广内容投放指令中包括的推广内容标识和用户集标识,建立提取的推广内容标识对于提取的用户集标识的投放索引。
举例说明,假设投放的推广内容标识为OrderID1,指向的用户集标识为TargetID1和TargetID2。那么OrderID1对于TargetID1和TargetID2的订单索引为:OrderID1→(TargetID1,TargetID2)。
在一个实施例中,提供数据管理平台的服务器与提供推广内容投放平台的服务器可为相同的服务器。提供数据管理平台的服务器与提供推广内容投放平台的服务器也可为不同的服务器。在提供数据管理平台的服务器与提供推广内容投放平台的服务器为不同的服务器时,两者之间可进行数据共享。比如,提供数据管理平台的服务器可将与用户集相关数据共享至提供推广内容投放平台的服务器。
上述实施例中,针对特定的用户集进行推广内容投放,可使得推广的信息与用户的需求更加匹配,从而使得信息推广更加准确。
在一个实施例中,该索引处理方法还包括:获取携带目标用户标识的推广内容获取请求;响应于推广内容获取请求,查询倒排索引得到与目标用户标识对应的第一用户集标识;根据第一用户集标识查询投放索引得到推广内容标识;推广与推广内容标识对应的推广内容。
其中,目标用户标识是待进行推广内容推广的用户所对应的用户标识。推广内容获取请求是用于请求获取推广内容的请求。
具体地,用户标识登录的第二终端在访问指定内容,或者通过运行于第二终端上的应用程序访问指定内容时,可触发推广内容获取请求,并将当前登录的用户标识作为目标用户标识携带在该推广内容获取请求中发送至服务器,服务器从而获取到携带目标用户标识的推广内容获取请求。
进一步地,服务器响应于该推广内容获取请求,查询倒排索引得到与目标用户标识对应的第一用户集标识,继而查询投放索引得到与第一用户集标识对应的推广内容标识,从而将与推广内容标识对应的推广内容推送至第二终端。
举例说明,当前倒排索引为:UserID1→(TargetID1)、UserID2→(TargetID1,TargetID2)、UserID3→(TargetID1,TargetID2)、UserID4→(TargetID1,TargetID2,TargetID3)、UserID5→(TargetID2,TargetID3)、UserID6→(TargetID3)和UserID7→(TargetID3)。目标用户标识为UserID3,那么与目标用户标识对应的第一用户集标识为TargetID1和TargetID2。当前投放索引为:OrderID1→(TargetID1,TargetID2)和OrderID2→(TargetID3)。那么,与第一用户集标识对应的推广内容标识OrderID1。从而将与OrderID1对应的推广内容推送至第二终端。
在一个实施例中,用户标识登录的第二终端还可以在访问达到预设时间点时,触发推广内容获取请求。其中,访问达到预设时间点可以是通过运行于第二终端上的应用程序开始播放视频或者播放视频达到预设时间点等。
在一个实施例中,服务器查询到的与第一用户集标识对应的推广内容标识可以为多个。此时,服务器按照预设的选择方式从这多个推广内容标识中选择一个推广内容标识,从而将与选中的推广内容标识对应的推广内容推送至第二终端。具体地,服务器可随机选中一个推广内容标识,,从而将与选中的推广内容标识对应的推广内容推送至第二终端。服务器还可继续查询这多个推广内容标识对应的指定投放条件,选择对应的指定投放条件与用户标识所对应的用户标签集匹配的推广内容标识,从而将与选中推广的内容标识对应的推广内容推送至第二终端。服务器还可选择对应推广频次高的推广内容标识,从而将与选中的推广内容标识对应的推广内容推送至第二终端等。
上述实施例中,在获取到推广内容获取请求时,查询该用户标识所对应的用户集标识,再将针对该用户集投放的推广内容进行推广,从而实现对目标用户进行有针对性的内容推广,而且推广的内容更符合用户的需求,从而使得信息推广更加准确。
在一个实施例中,该索引处理方法还包括:当存在临时索引时,响应于推广内容获取请求,查询临时索引得到与目标用户标识对应的第二用户集标识。根据第一用户集标识查询投放索引得到推广内容标识,包括:根据第一用户集标识和第二用户集标识查询投放索引,得到推广内容标识。
具体地,服务器在获取到推广内容获取请求时,可查询是否存在临时索引。当不存在临时索引时,服务器则直接查询倒排索引。当存在临时索引时,服务器可在查询倒排索引时,异步查询临时索引。其中,服务器在查询临时索引时,可并行遍历各新增的用户集标识所对应的标志值序列,得到目标用户标识所对应的用户集标识列表。
服务器可将查询临时索引得到的第二用户集标识,与查询倒排索引得到的第一用户集标识合并,进而查询投放索引得到与合并后的用户集标识对应的推广内容标识,继而按照预设的选择方式从推广内容标识中选择一个推广内容标识,从而将与选中推广内容标识对应的推广内容推送至第二终端。
在本实施例中,进行信息推广时,若存在临时索引,也就是存在新增用户集,那么,在倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
可以理解是的,执行上述各实施例中各方法的服务器可以是独立的服务器,也可以是多个独立的服务器组成的服务器集群。若执行上述各实施例中各方法的服务器为服务器集群,那么上述各实施例中方法的各步骤可以是在不同的服务器上执行。
图7示出了一个实施例索引处理方法的硬件架构原理图。参考图7,该硬件架构包括推广内容提供方标识登录的第一终端,用户标识登录的第二终端和服务器集群。服务器集群包括数据管理服务器(集群)、推广内容投放服务器(集群)、临时存储服务器(集群)、数据库服务器(集群)、接入服务器(集群)和推广服务器(集群)。
推广内容提供方标识登录的第一终端可将新增的用户集标识及与新增的用户集标识对应的用户标签发送至数据管理服务器(集群),数据管理服务器(集群)根据用户标签挑选用户标识,得到与新增的用户集标识对应的多个用户标识,再根据这多个用户标识建立与新增的用户集标识对应的标志值序列(位图格式序列)。
或者,推广内容提供方标识登录的第一终端可将新增的用户集标识及与新增的用户集标识对应上传的文件;发送至数据管理服务器(集群),数据管理服务器(集群)从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识,再根据这多个用户标识建立与新增的用户集标识对应的标志值序列(位图格式序列)。
数据管理服务器(集群)再向临时存储服务器(集群)发送临时索引创建指令,并同时分发建立的与新增的用户集标识对应的标志值序列(位图格式序列)。临时存储服务器(集群)从而建立新增的用户集标识对于所述多个用户标识的临时索引。临时存储服务器集群中的各节点服务器互为冗余,这样在其中一个节点服务器无法工作时,另外的服务器也可正常工作。
数据管理服务器(集群)可在向临时存储服务器(集群)发送临时索引创建指令时,异步向数据库服务器(集群)发送倒排索引更新指令。数据库服务器(集群)从而根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。或者,数据库服务器(集群)可在当前时间到达预设的定期更新的更新时间点时,根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。
数据库服务器(集群)在更新完倒排索引后,可直接通知临时存储服务器(集群)删除临时索引,也可通过数据管理服务器(集群)通知临时存储服务器(集群)删除临时索引。
推广内容提供方标识登录的第一终端可将推广内容投放指令发送至推广内容投放服务器(集群),推广内容投放服务器(集群)提取推广内容投放指令中包括的推广内容标识和用户集标识,建立提取的推广内容标识对于提取的用户集标识的投放索引。
用户标识登录的第二终端可向推广服务器(集群)发起携带目标用户标识的推广内容获取请求。推广服务器(集群)响应于该推广内容获取请求,直接或者通过接入服务器(集群)查询倒排索引得到与目标用户标识对应的第一用户集标识。推广服务器(集群)还可在存在临时索引时,响应于推广内容获取请求,直接或者通过接入服务器(集群)查询临时索引得到与目标用户标识对应的第二用户集标识。其中,接入服务器(集群)用于负载均衡。
推广服务器(集群)再根据第一用户集标识和第二用户集标识,直接或者通过接入服务器(集群)查询投放索引,得到推广内容标识,从而将与推广内容标识对应的推广内容推送至第二终端。
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图8所示,在一个实施例中,提供了一种索引处理装置800。参照图8,该索引处理装置800包括:获取模块801、建立模块802、更新模块803和删除模块804。
获取模块801,用于获取新增的用户集标识及与新增的用户集标识对应的多个用户标识。
建立模块802,用于建立新增的用户集标识对于多个用户标识的临时索引。
更新模块803,用于在建立临时索引时,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。
删除模块804,用于在倒排索引更新完成后删除临时索引。
上述索引处理装置800,在新增用户集时,获取新增的用户集标识及该新增用户集的多个用户的用户标识,自动建立新增的用户集标识对于这多个用户标识的临时索引,并且在建立临时索引时,异步根据新增的用户集标识和这多个用户标识来更新历史建立的用户标识对于用户集标识的倒排索引,这样在新增用户集,但倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
在一个实施例中,获取模块801还用于获取新增的用户集标识及与新增的用户集标识对应的用户标签;根据用户标签挑选用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,获取模块801还用于获取新增的用户集标识及与新增的用户集标识对应上传的文件;从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,建立模块802还用于创建与新增的用户集标识对应的标志值序列;将多个用户标识各自映射为位置标识,位置标识用于表示用户标识相应的标志值在标志值序列中所在位置;更新标志值序列中与位置标识对应的标志值,更新后的标志值表示相应的用户标识与新增的用户集标识对应。
在一个实施例中,更新模块803还用于对于多个用户标识中已建立倒排索引的用户标识,将新增的用户集标识添加至已建立倒排索引的用户标识所对应的倒排索引中;对于多个用户标识中未建立倒排索引的用户标识,新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引。
在一个实施例中,索引处理装置800还包括投放模块805。
投放模块805,用于获取推广内容投放指令;提取推广内容投放指令中包括的推广内容标识和用户集标识;建立提取的推广内容标识对于提取的用户集标识的投放索引。
如图9所示,在一个实施例中,索引处理装置800还包括投放模块805和推广模块806。
推广模块806,用于获取携带目标用户标识的推广内容获取请求;响应于推广内容获取请求,查询倒排索引得到与目标用户标识对应的第一用户集标识;根据第一用户集标识查询投放索引得到推广内容标识;推广与推广内容标识对应的推广内容。
在一个实施例中,推广模块806还用于当存在临时索引时,响应于推广内容获取请求,查询临时索引得到与目标用户标识对应的第二用户集标识;根据第一用户集标识和第二用户集标识查询投放索引,得到推广内容标识。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现索引处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行索引处理方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的索引处理装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行,计算机设备的非易失性存储介质可存储组成该索引处理装置的各个程序模块,比如,图8所示的获取模块801、建立模块802、更新模块803和删除模块804等。各个程序模块组成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的索引处理方法中的步骤。
例如,图10所示的计算机设备可以通过如图8所示的索引处理装置800中的获取模块801获取新增的用户集标识及与新增的用户集标识对应的多个用户标识。通过建立模块802建立新增的用户集标识对于多个用户标识的临时索引。通过更新模块803在建立临时索引时,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引。通过删除模块804在倒排索引更新完成后删除临时索引。
在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行以下步骤:获取新增的用户集标识及与新增的用户集标识对应的多个用户标识;建立新增的用户集标识对于多个用户标识的临时索引;在建立临时索引时,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;在倒排索引更新完成后删除临时索引。
在一个实施例中,获取新增的用户集标识及与新增的用户集标识对应的多个用户标识,包括:获取新增的用户集标识及与新增的用户集标识对应的用户标签;根据用户标签挑选用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,获取新增的用户集标识及与新增的用户集标识对应的多个用户标识,包括:获取新增的用户集标识及与新增的用户集标识对应上传的文件;从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,建立新增的用户集标识对于多个用户标识的临时索引,包括:创建与新增的用户集标识对应的标志值序列;将多个用户标识各自映射为位置标识,位置标识用于表示用户标识相应的标志值在标志值序列中所在位置;更新标志值序列中与位置标识对应的标志值,更新后的标志值表示相应的用户标识与新增的用户集标识对应。
在一个实施例中,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引,包括:对于多个用户标识中已建立倒排索引的用户标识,将新增的用户集标识添加至已建立倒排索引的用户标识所对应的倒排索引中;对于多个用户标识中未建立倒排索引的用户标识,新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取推广内容投放指令;提取推广内容投放指令中包括的推广内容标识和用户集标识;建立提取的推广内容标识对于提取的用户集标识的投放索引。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取携带目标用户标识的推广内容获取请求;响应于推广内容获取请求,查询倒排索引得到与目标用户标识对应的第一用户集标识;根据第一用户集标识查询投放索引得到推广内容标识;推广与推广内容标识对应的推广内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:当存在临时索引时,响应于推广内容获取请求,查询临时索引得到与目标用户标识对应的第二用户集标识。根据第一用户集标识查询投放索引得到推广内容标识,包括:根据第一用户集标识和第二用户集标识查询投放索引,得到推广内容标识。
上述存储介质,在新增用户集时,获取新增的用户集标识及该新增用户集的多个用户的用户标识,自动建立新增的用户集标识对于这多个用户标识的临时索引,并且在建立临时索引时,异步根据新增的用户集标识和这多个用户标识来更新历史建立的用户标识对于用户集标识的倒排索引,这样在新增用户集,但倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取新增的用户集标识及与新增的用户集标识对应的多个用户标识;建立新增的用户集标识对于多个用户标识的临时索引;在建立临时索引时,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引;在倒排索引更新完成后删除临时索引。
在一个实施例中,获取新增的用户集标识及与新增的用户集标识对应的多个用户标识,包括:获取新增的用户集标识及与新增的用户集标识对应的用户标签;根据用户标签挑选用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,获取新增的用户集标识及与新增的用户集标识对应的多个用户标识,包括:获取新增的用户集标识及与新增的用户集标识对应上传的文件;从文件中读取用户标识,得到与新增的用户集标识对应的多个用户标识。
在一个实施例中,建立新增的用户集标识对于多个用户标识的临时索引,包括:创建与新增的用户集标识对应的标志值序列;将多个用户标识各自映射为位置标识,位置标识用于表示用户标识相应的标志值在标志值序列中所在位置;更新标志值序列中与位置标识对应的标志值,更新后的标志值表示相应的用户标识与新增的用户集标识对应。
在一个实施例中,异步根据新增的用户集标识和多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引,包括:对于多个用户标识中已建立倒排索引的用户标识,将新增的用户集标识添加至已建立倒排索引的用户标识所对应的倒排索引中;对于多个用户标识中未建立倒排索引的用户标识,新建未建立倒排索引的用户标识对于新增的用户集标识的倒排索引。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取推广内容投放指令;提取推广内容投放指令中包括的推广内容标识和用户集标识;建立提取的推广内容标识对于提取的用户集标识的投放索引。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:获取携带目标用户标识的推广内容获取请求;响应于推广内容获取请求,查询倒排索引得到与目标用户标识对应的第一用户集标识;根据第一用户集标识查询投放索引得到推广内容标识;推广与推广内容标识对应的推广内容。
在一个实施例中,该计算机程序被处理器执行时,还使得处理器执行以下步骤:当存在临时索引时,响应于推广内容获取请求,查询临时索引得到与目标用户标识对应的第二用户集标识。根据第一用户集标识查询投放索引得到推广内容标识,包括:根据第一用户集标识和第二用户集标识查询投放索引,得到推广内容标识。
上述计算机设备,在新增用户集时,获取新增的用户集标识及该新增用户集的多个用户的用户标识,自动建立新增的用户集标识对于这多个用户标识的临时索引,并且在建立临时索引时,异步根据新增的用户集标识和这多个用户标识来更新历史建立的用户标识对于用户集标识的倒排索引,这样在新增用户集,但倒排索引还未更新或正在更新时,可通过查询临时索引及时地对新增用户集群中的用户进行信息推广,极大地提高了信息推广的时效性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种索引处理方法,包括:
获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立所述新增的用户集标识对于所述多个用户标识的临时索引,所述临时索引,表示所述新增的用户集标识映射至相应用户集标识所对应的用户集中的用户标识的映射关系;
在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引,所述倒排索引,表示用户标识映射至与所述用户标识所属用户集的用户集标识的映射关系;
在所述倒排索引更新完成后删除所述临时索引;
在获取到携带目标用户标识的推广内容获取请求时,基于所述临时索引和所述倒排索引查询与所述目标用户标识对应的用户集标识,并将针对查询到的用户集标识投放的推广内容进行推广。
2.根据权利要求1所述的方法,其特征在于,所述获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识,包括:
获取新增的用户集标识及与所述新增的用户集标识对应的用户标签;
根据所述用户标签挑选用户标识,得到与所述新增的用户集标识对应的多个用户标识。
3.根据权利要求1所述的方法,其特征在于,所述获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识,包括:
获取新增的用户集标识及与所述新增的用户集标识对应上传的文件;
从所述文件中读取用户标识,得到与所述新增的用户集标识对应的多个用户标识。
4.根据权利要求1所述的方法,其特征在于,所述建立所述新增的用户集标识对于所述多个用户标识的临时索引,包括:
创建与所述新增的用户集标识对应的标志值序列;
将所述多个用户标识各自映射为位置标识,所述位置标识用于表示用户标识相应的标志值在所述标志值序列中所在位置;
更新所述标志值序列中与所述位置标识对应的标志值,更新后的标志值表示相应的用户标识与所述新增的用户集标识对应。
5.根据权利要求1所述的方法,其特征在于,所述异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引,包括:
对于所述多个用户标识中已建立倒排索引的用户标识,将所述新增的用户集标识添加至所述已建立倒排索引的用户标识所对应的倒排索引中;
对于所述多个用户标识中未建立倒排索引的用户标识,新建所述未建立倒排索引的用户标识对于所述新增的用户集标识的倒排索引。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
获取推广内容投放指令;
提取所述推广内容投放指令中包括的推广内容标识和用户集标识;
建立提取的所述推广内容标识对于提取的所述用户集标识的投放索引。
7.根据权利要求6所述的方法,其特征在于,所述在获取到携带目标用户标识的推广内容获取请求时,基于所述临时索引和所述倒排索引查询与所述目标用户标识对应的用户集标识,并将针对查询到的用户集标识投放的推广内容进行推广,包括:
获取携带目标用户标识的推广内容获取请求;
响应于所述推广内容获取请求,查询是否存在临时索引,当不存在临时索引时,直接查询所述倒排索引得到与所述目标用户标识对应的第一用户集标识;
根据所述第一用户集标识查询所述投放索引得到推广内容标识;
推广与所述推广内容标识对应的推广内容。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当存在所述临时索引时,响应于所述推广内容获取请求,查询所述临时索引得到与所述目标用户标识对应的第二用户集标识;
所述根据所述第一用户集标识查询所述投放索引得到推广内容标识,包括:
根据所述第一用户集标识和所述第二用户集标识查询所述投放索引,得到推广内容标识。
9.一种索引处理装置,包括:
获取模块,用于获取新增的用户集标识及与所述新增的用户集标识对应的多个用户标识;
建立模块,用于建立所述新增的用户集标识对于所述多个用户标识的临时索引,所述临时索引,表示所述新增的用户集标识映射至相应用户集标识所对应的用户集中的用户标识的映射关系;
更新模块,用于在建立所述临时索引时,异步根据所述新增的用户集标识和所述多个用户标识,更新历史建立的用户标识对于用户集标识的倒排索引,所述倒排索引,表示用户标识映射至与所述用户标识所属用户集的用户集标识的映射关系;
删除模块,用于在所述倒排索引更新完成后删除所述临时索引;
推广模块,用于在获取到携带目标用户标识的推广内容获取请求时,基于所述临时索引和所述倒排索引查询与所述目标用户标识对应的用户集标识,并将针对查询到的用户集标识投放的推广内容进行推广。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,还用于获取新增的用户集标识及与所述新增的用户集标识对应的用户标签;根据所述用户标签挑选用户标识,得到与所述新增的用户集标识对应的多个用户标识。
11.根据权利要求9所述的装置,其特征在于,所述获取模块,还用于获取新增的用户集标识及与所述新增的用户集标识对应上传的文件;从所述文件中读取用户标识,得到与所述新增的用户集标识对应的多个用户标识。
12.根据权利要求9所述的装置,其特征在于,所述建立模块还用于创建与所述新增的用户集标识对应的标志值序列;将所述多个用户标识各自映射为位置标识,所述位置标识用于表示用户标识相应的标志值在所述标志值序列中所在位置;更新所述标志值序列中与所述位置标识对应的标志值,更新后的标志值表示相应的用户标识与所述新增的用户集标识对应。
13.根据权利要求9所述的装置,其特征在于,所述更新模块还用于对于所述多个用户标识中已建立倒排索引的用户标识,将所述新增的用户集标识添加至所述已建立倒排索引的用户标识所对应的倒排索引中;对于所述多个用户标识中未建立倒排索引的用户标识,新建所述未建立倒排索引的用户标识对于所述新增的用户集标识的倒排索引。
14.根据权利要求9至13中任一项所述的装置,其特征在于,所述装置还包括:
投放模块,用于获取推广内容投放指令;提取所述推广内容投放指令中包括的推广内容标识和用户集标识;建立提取的所述推广内容标识对于提取的所述用户集标识的投放索引。
15.根据权利要求14所述的装置,其特征在于,所述推广模块,还用于获取携带目标用户标识的推广内容获取请求;响应于所述推广内容获取请求,查询是否存在临时索引,当不存在临时索引时,直接查询所述倒排索引得到与所述目标用户标识对应的第一用户集标识;根据所述第一用户集标识查询所述投放索引得到推广内容标识;推广与所述推广内容标识对应的推广内容。
16.根据权利要求15所述的装置,其特征在于,所述推广模块,还用于当存在所述临时索引时,响应于所述推广内容获取请求,查询所述临时索引得到与所述目标用户标识对应的第二用户集标识;根据所述第一用户集标识和所述第二用户集标识查询所述投放索引,得到推广内容标识。
17.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述的方法的步骤。
18.一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述的方法的步骤。
CN201711207642.9A 2017-11-27 2017-11-27 索引处理方法、装置、存储介质和计算机设备 Active CN110019980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711207642.9A CN110019980B (zh) 2017-11-27 2017-11-27 索引处理方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711207642.9A CN110019980B (zh) 2017-11-27 2017-11-27 索引处理方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN110019980A CN110019980A (zh) 2019-07-16
CN110019980B true CN110019980B (zh) 2022-10-25

Family

ID=67185981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711207642.9A Active CN110019980B (zh) 2017-11-27 2017-11-27 索引处理方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110019980B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110729053B (zh) * 2019-10-11 2023-02-03 深圳平安医疗健康科技服务有限公司 数据处理方法、装置、计算机设备和存储介质
CN110837827B (zh) * 2019-11-09 2023-05-12 蓝色匠士教育科技有限公司 一种适用于临时学号的试卷打印扫描识别方法及系统
CN111858617B (zh) * 2020-08-06 2024-10-08 贝壳技术有限公司 用户查找方法和装置、计算机可读存储介质、电子设备
CN113761102B (zh) * 2020-11-18 2024-07-16 北京沃东天骏信息技术有限公司 数据处理方法、装置、服务器、系统和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874308A (zh) * 2015-12-14 2017-06-20 北京搜狗科技发展有限公司 一种推荐方法和装置、一种用于推荐的装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150120583A1 (en) * 2013-10-25 2015-04-30 The Mitre Corporation Process and mechanism for identifying large scale misuse of social media networks
CN104361009B (zh) * 2014-10-11 2017-10-31 北京中搜网络技术股份有限公司 一种基于倒排索引的实时索引方法
US20170024657A1 (en) * 2015-07-21 2017-01-26 Yp Llc Fuzzy autosuggestion for query processing services
CN105956085B (zh) * 2016-04-29 2019-08-27 优酷网络技术(北京)有限公司 一种倒排索引的构建方法和装置、检索方法和装置
CN106874392B (zh) * 2017-01-13 2019-12-31 微梦创科网络科技(中国)有限公司 受众用户信息的索引存储及广告信息投放的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874308A (zh) * 2015-12-14 2017-06-20 北京搜狗科技发展有限公司 一种推荐方法和装置、一种用于推荐的装置

Also Published As

Publication number Publication date
CN110019980A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110019980B (zh) 索引处理方法、装置、存储介质和计算机设备
CN107222566B (zh) 信息推送方法、装置及服务器
CN108460041B (zh) 数据的处理方法和装置
CN109033360B (zh) 一种数据查询方法、装置、服务器及存储介质
CN105120004A (zh) 信息的推送方法及装置
CN102307210A (zh) 一种数据下载系统及其数据管理和下载方法
US20080183680A1 (en) Documents searching on peer-to-peer computer systems
CN106210150A (zh) 一种基于行为分析的内容推送系统及方法
CN108055340B (zh) 客户资源分配方法、装置、计算机设备和存储介质
CN105005567B (zh) 兴趣点查询方法和系统
CN110597852A (zh) 数据处理方法、装置、终端及存储介质
EP2962275B1 (en) Crowdsourcing user-provided identifiers and associating them with brand identities
CN108154024B (zh) 一种数据检索方法、装置及电子设备
US20110264683A1 (en) System and method for managing information map
CN107545039B (zh) 关键词的指数获取方法和装置、计算机设备和存储介质
US9529855B2 (en) Systems and methods for point of interest data ingestion
CN107666431B (zh) 书签通讯消息获取方法和装置
CN112148925B (zh) 用户标识关联查询方法、装置、设备及可读存储介质
CN108345699B (zh) 获取多媒体数据的方法、装置及存储介质
CN117649270A (zh) 一种广告推送方法、装置、电子设备及存储介质
CN116680278A (zh) 数据处理方法、装置、电子设备及存储介质
CN112579877A (zh) 信源系统的控制方法、装置、存储介质和设备
CN105653533A (zh) 一种更新分类关联词集合的方法和装置
CN113761102B (zh) 数据处理方法、装置、服务器、系统和存储介质
CN107977381B (zh) 数据配置方法、索引管理方法、相关装置以及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant