CN106294481A - 一种基于图谱的导航方法及装置 - Google Patents
一种基于图谱的导航方法及装置 Download PDFInfo
- Publication number
- CN106294481A CN106294481A CN201510303484.1A CN201510303484A CN106294481A CN 106294481 A CN106294481 A CN 106294481A CN 201510303484 A CN201510303484 A CN 201510303484A CN 106294481 A CN106294481 A CN 106294481A
- Authority
- CN
- China
- Prior art keywords
- participle
- path
- information
- illustrative plates
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种基于图谱的导航方法及装置,所述方法包括:对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。本申请能够针对知识性查询词为用户提供精准度高的、信息量全面的、定位性能好的导航体验。
Description
技术领域
本申请涉及网站导航技术领域,尤其涉及一种基于图谱的导航方法及装置。
背景技术
随着电子商务应用的日益普及,网络购物已融入人们的衣食住行各个方面。用户习惯性的购物方式是在搜索框输入自己感兴趣的查询词(query),query可以分为两类:一类是指包含明确产品信息的query,也称为普通单品性query,例如“连衣裙”、“电视机”、“笔记本”等等;另一类是知识性query,例如“送给小孩的满月礼物”、“含高蛋白的食物”“送给父母的生日礼物”等等。知识性query不包含产品信息,难以明确地表示用户的购物意向。
用户使用普通单品性query进行搜索的目的是为了直接获取指向某项商品的导航信息。普通单品性query具有明确的产品购物意向。用户在使用普通单品性query时关注的是搜索结果的精准性;但用户使用知识性query进行搜索时,用户并没有明确的购物意向,用户需要网站能够搜索与查询词相关性较高的产品搜索结果,还需要网站能够推荐一些其他可选的导航信息,扩展用户的搜索面以便用户逐渐确定自己感兴趣的产品。
现有的导航方法是通过在导航区展示各种商品类目以供用户选择自己感兴趣的类目,再根据用户选择的类目以及输入的查询词在数据库中搜索相关的产品。由于普通单品性query含有有效的产品类分词,因此现有的导航方法能够满足用户的搜索需求;而知识性query并不含有产品类分词,导致现有的导航方法搜索的结果相关性较差或者根本搜索不到结果。另外,现有的导航方法直接将搜索结果展示在导航区域,用户需要逐行逐列的查看各个搜索结果以筛选出自己感兴趣的产品,无法直观地、快速地定位自己感兴趣的产品,导致用户的体验差。综上所述,现有的导航方法不能够针对知识性query为用户提供相关性较高、搜索面较广、定位性能好的导航体验。
发明内容
本申请所要解决的技术问题是提供一种基于图谱的导航方法,用以针对知识性查询词为用户提供相关性较高、搜索面较广、定位性能好的导航体验。
本申请还提供了基于图谱的导航装置,用以保证上述方法在实际中的实现以及应用。
一方面,本申请提供了一种基于图谱的导航方法,该方法包括:
对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;
按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;
在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息;
根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
又一方面,本发明提供了一种基于图谱的导航装置,该装置包括:
分词及识别单元,用于对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;
分词路径确定单元,用于按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;
关联信息查找单元,用于在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息;
图谱绘制及展示单元,用于根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
与现有技术相比,本申请提供的技术方案具有以下有益效果:
本申请首先对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;本申请通过分词处理以及分词类别识别实现对用户搜索意图的多维度分析,根据分词类型生成分词路径为后续的绘制图谱打好基础。然后,本申请通过在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;本申请以预先建立的知识库作为搜索基础,根据分析结果在知识库中查找相关的节点信息和产品信息,一方面扩展了用户的搜索面,另一方面提供相关性较高的搜索结果。最后,本申请根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。由于图谱具有结构清晰、便于定位的优势,因此用户基于图谱能够直观地、快速地定位自己感兴趣的产品。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种基于图谱的导航方法实施例的流程图;
图2为本申请提供的分词路径中节点间关联图;
图3为本申请提供的一种知识库建立方法实施例的流程图;
图4为本申请提供的搜索导航图谱的一种示意图;
图5为本申请提供的搜索导航图谱的另一种示意图;
图6为本申请提供的搜索导航图谱的另一种示意图;
图7为本申请提供的搜索导航图谱的另一种示意图;
图8为本申请提供的搜索导航图谱的另一种示意图;
图9为本申请提供的搜索导航图谱的另一种示意图;
图10为本申请提供的一种基于图谱的导航装置实施例的结构图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,图1是本申请提供的一种基于图谱的导航方法实施例的流程图,如图1所示,该方法包括S11-S14:
S11:对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别。
用户通过终端在网站上输入查询词(query),网站根据该查询词为用户搜索相关的搜索结果。在实际应用中,查询词是指用户在网站搜索框输入的搜索内容,查询词可以是一个字、词或句子等,本申请实施例主要针对的是知识性查询词,知识性查询词的特点是不包含明确的产品信息,难以明确表示用户的购物意向,但其包含有一定的属性特征信息。举个例子,“春节送什么礼物”、“含高蛋白的食物”、“杭州特产”等查询词,这些查询词均具有上述特点,均属于知识性查询词。
用户在网站上输入知识性查询词,网站接收到该知识性查询词之后,先采用分词技术对该知识性查询词进行分词处理得到一个或多个分词,然后通过语义分析对这些分词进行类型识别得到一个或多个类型。根据分词所表征的语义可以将分词分为场景类分词或对象类分词等,另外,场景类分词从等级关系上可以进一步地分为父场景类分词和子场景类分词;父场景类分词和子场景类分词可以由系统预先定义。父场景类分词是指表征业务主体类型的分词;子场景类分词是指表征与业务主体相关的属性特征的分词。更具体的,子场景类分词可以分为地域场景类分词、应用场景类分词等;地域场景类分词是指表征地域属性特征的分词;应用场景类分词是指表征应用场景属性特征的分词;对象类分词是指表征受众的分词;下面通过几个示例对S11进行说明。
例1,用户输入的查询词为“探病送什么礼物给老人”,通过分词处理得到“探病”、“礼物”以及“老人”三个分词;通过语义分析方式识别这三个分词的类型,识别过程是:“探病”是表征应用场景属性特征的分词,其归类为子场景类分词;“礼物”是表征业务主体的分词,其归类为父场景类分词;“老人”是表征受众的分词,其归类为对象类分词。
例2,用户输入的查询词为“过生日送什么礼物”,通过分词处理得到“生日”和“礼物”两个分词;通过语义分析方式识别这两个分词的类型,识别过程是:“生日”是表征应用场景属性特征的分词,其归类为子场景类分词;“礼物”是表征业务主体的分词,其归类为父场景类分词。
例3,用户输入的查询词为“送礼送什么好”,通过分词处理得到一个分词“送礼”;通过语义分析方式识别该分词的类型可知:“送礼”是表征业务主体的分词,其归类为父场景类分词。
本申请实施例利用对用户输入的知识性查询词进行分词处理以及对分词进行类型识别的技术手段,实现对用户搜索意图在语义层面上的精细划分,达到了多维度分析用户搜索意图的目的。
S12:按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点。
在本申请实施例中,预先设定的分词类型等级关系为父场景类分词等级大于子场景类分词等级且子场景类分词等级大于对象类分词等级;在步骤S11对分词进行类型识别之后,按照预先设定的分词类型的等级关系对分词进行排序以生成分词路径。下面结合上文描述的三个示例对步骤S12进行解释说明。
针对上文描述的例1,用户输入的查询词为“探病送什么礼物给老人”,利用步骤S11识别出“探病”为子场景类分词;“礼物”为父场景类分词;“老人”为对象类分词。基于这三种分词类型,步骤S12根据预先设定的分词类型之间等级关系生成分词路径为“礼物—探病—老人”。
针对上文描述的例2,用户输入的查询词为“过生日送什么礼物”,利用步骤S11识别出“生日”为子场景类分词;“礼物”为父场景类分词。基于这两种分词类型,步骤S12根据预先设定的分词类型之间等级关系生成分词路径为“礼物—生日”。
针对上文描述的例3,用户输入的查询词为“送礼送什么好”,利用步骤S11识别出“送礼”为父场景类分词。基于该分词类型,步骤S12根据预先设定的分词类型之间等级关系生成分词路径为“送礼”。在只有一个分词的特殊情况下,路径也就只包含一个节点。
S13:在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息。
本申请实施例中,预先建立的知识库中存储有各个分词路径中节点信息以及各个分词路径分别对应的产品信息;知识库中分词路径中节点间的关联图如图2所示。结合图2对步骤S13的实现过程作进一步解释说明。
当分词路径的最低等级节点为父场景类节点时,该分词路径相关联的其他节点信息包括子场景类节点信息和对象类节点信息,如图2中的(2A)所示。
当分词路径的最低等级节点为子场景类节点时,该分词路径相关联的其他节点信息包括父场景节点信息、对象节点信息和产品信息,如图2中的(2B)所示。
当分词路径的最低等级节点为对象类节点时,该分词路径相关联的其他节点信息包括子场景节点信息和产品信息,如图2中的(2C)所示。
由于用户使用知识性查询词进行搜索时,用户并没有明确的购物意向,因此网站一方面需要基于该知识性查询词扩展搜索面,另一方面还需要搜索与该知识性查询词相关性高、精准性高的产品信息,进而为用户提供相关的搜索导航信息。为了达到该目的,上述步骤S13可以包括:
当所述分词路径的最低等级分词为业务主体类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和对象节点信息;
当所述分词路径的最低等级分词为属性特征类型时,在预先建立的知识库中查找与所述分词路径关联的父场景节点信息、对象节点信息以及关联的产品信息;及,
当所述分词路径的最低等级分词为受众类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息以及关联的产品信息。
由于分词路径中分词等级能够反映出用户搜索意图的精细程度,最低等级分词与用户搜索意图相关性最高,因此从最低等级分词的角度出发查找相关的其他节点信息和产品信息,一方面能够保证扩展的搜索面的对用户的价值较高,另一方面保证搜索的产品信息与用户搜索意图的相关性较高。
S14:根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
本申请实施例是以预先建立的知识库为基础实现导航的,因此知识库质量的好坏直接影响导航的性能。本申请还提供了一种知识库的建立方法,下面对该方法进行解释说明,参见图3,该方法包括:S31和S32,具体如下:
S31:挖掘与业务主体相关的垂直网站得到相关的属性特征信息和对应的产品信息。
业务主体可以由系统预先定义,系统可以通过采集用户的日志数据,分析日志数据来定义业务主体。例如:通过分析用户的日志数据确定用户比较关注“送礼”,那么可以设定业务主体为“送礼”。通过分析用户的日志数据确定用户比较关注“特产”,那么可以设定业务主体为“特产”等等。下面以业务主体“送礼”为例对步骤S31进行解释说明。
挖掘与“送礼”相关的垂直网站(如礼品网站),抓取属性特征信息和产品信息,属性特征信息包括场景类属性特征和对象类属性特征。抓取结果如表1所示。
表1 “送礼”为业务主体挖掘的相关信息
由于垂直网站的信息量较大、相关性较高,因此挖掘的相关信息所涉及的搜索面较广、精准性较高。
另外,为了便于用户筛选自己感兴趣的产品,在上述方法的基础上,还可以增加如下步骤:
计算所述相关的属性特征信息和产品信息的权重;则所述知识库中还包括所述相关的属性特征信息的权重和产品信息的权重。
进一步地,本申请还提供了权重的计算公式,具体如下:
按照公式(1)计算相关的属性特征信息的权重。
其中,Weightnode表示属性特征信息的权重;Ei表示属性特征信息是否在垂直网站i中出现,如果出现,则Ei取值为1,否则Ei取值为0;Wi表示垂直网站i的权重;Wi可以通过人工指定或者基于PageRank算法计算得到;Ni表示垂直网站i内与该属性特征信息相关的产品个数。
特征信息p的产品信息j在垂直网站i的出现情况,如果出现,则Ei取值为1,否则Ei取值为0;Wi表示垂直网站i的权重;Wj表示产品信息j的权重;Wj按照公式(3) 计算得到。
其中,CurrentPosj表示具有属性特征信息p的产品j在网页上的显示位置;CurrentPagej表示具有属性特征信息p的产品j所在网页的位置;
PageCountj表示具有属性特征信息p的产品j所在网页上显示的产品数;
TotalCountj表示具有属性特征信息p的产品j的总个数。
下面以表1展示的各个属性特征信息和产品信息为例,利用上述公式计算各个信息的权重,具体权重情况如下表2所示。
表2 信息权重情况
S32:按照节点关联关系的形式在数据库中保存所述业务主体、相关的属性特征信息以及产品信息彼此间的关联关系,将该数据库作为知识库。
以上述表1呈现的内容为例,对知识库的建立过程作进一步解释说明。业务主体为“送礼”,将其作为父场景节点,然后将挖掘到的属性特征信息“情人节”、“生日”、“探病”、“教师节”以及“妇女节”作为子场景节点;将挖掘到的对象属性特征“女朋友”、“姐姐”、“老人”、“男老师”以及“同事”作为对象节点,基于图2所示的节点关系图来建立这些信息彼此间的关联关系,另外,按照对应的关联关系存储与这些节点对应的产品信息。如果还计算出各个节点的权重(如表2所示),则还需要在知识库中保存各个节点的权重信息。
下面以上文描述的例1-3为基础,结合图4-6对本申请提供的搜索导航图谱展示方式进行解释说明。
针对上文描述的例1,用户输入的查询词为“探病送什么礼物给老人”,经过分词处理以及类型识别生成的分词路径为“礼物—探病—老人”,该分词路径中等级最低的分词为“老人”即对象类分词,结合图2,在知识库中查找与该分词路径相关的子场景节点信息有“探病”、“生日”以及“春节”,查找到与该分词路径相关的产品信息有“营养液”、“蛋白质粉”、“按摩仪”,在该知识库中“礼物”被归一化成“送礼”作为父场景节点,基于查找到的这些节点信息和产品信息绘制搜索导航图谱如图4所示。在图4中,黑色粗线连接而成的路径是用来标识分词路径,分词路径能够表征用户此次搜索的核心内容,实线表示节点间具有直接关联关系的,虚线表示节点间为间接关联关系。基于该图谱,用户沿着黑色粗线的引导,可以快速定位自己感兴趣的产品;同时,除了与此次搜索的主要场景“探病”之外,还为用户提供了与“老人”对象节点具有关联关系的其他场景“春节”场景以及“生日”场景,以扩展用户的搜索面。
针对上文描述的例2,用户输入的查询词为“过生日送什么礼物”,经过分词处理以及类型识别生成的分词路径为“礼物—生日”,该分词路径中等级最低的是“生日”即子场景类分词,结合图2,在知识库查找与该分词路径相关的对象节点信息有“女友”“领导”“爷爷”,查找与该分词路径相关的产品信息有“生日蛋糕”、“香水”、“项链”、“手表”、“音乐盒”,在知识库中“礼物”被归一化为“送礼”作为父场景节点,基于查找到的这些节点信息和产品信息绘制搜索导航图谱如图5所示。在图5中,黑色粗线连接而成的路径是用来标识分词路径,分词路径能够表征用户此次搜索的核心内容,实线表示节点间具有直接关联关系的,虚线表示节点间为间接关联关系,基于该图谱,用户沿着黑色粗线的引导,可以快速定位自己感兴趣的产品;从该查询词可以看出用户想得知生日的时候应该送什么礼物,具体的送给谁并没有明确限定,另外用户也有可能会关心其他场景下送礼物的相关信息,因此,图5展示了与生日场景相关的对象和产品,涉及的信息面比较广,给用户提供较全面、有效的导航信息。
针对上文描述的例3,用户输入的查询词为“送礼送什么好”,经过分词处理以及类型识别生成的分词路径为“送礼”,确定最低等级节点为“送礼”即父场景节点。结合图2,在知识库里以“父场景”节点为基础,查找与父场景节点“送礼”有关联关系的子场景和对象节点,假设查找到的子场景节点信息有“生日”“赔罪”“情人节”、“圣诞节”,查询到的对象节点信息有“父母”、“女友”、“领导”、“儿子”;基于查找到的这些节点信息和产品信息绘制搜索导航图谱如图6所示。在图6中,分词路径只有一个节点“送礼”父场景节点,其余的节点都是与该父场景节点有直接关联关系的节点,从该图可以看出,即便是用户仅输入了一个与产品没有任何关系的词,本发明通过图谱的方式能够为用户提供了多维度的导航信息,以引导用户沿着线条快速定位自己感兴趣的产品。
需要说明的是,上文描述的图4-6仅是几种示例性图谱,在实际实现过程中,图谱的各个节点除了可以采用上述圆形以外,还可以采用正方形、三角形、长方形、多边形、文本框、椭圆等其他节点绘制形式,图谱绘制所采用的线条的颜色、粗细、线段形状、图案、透明度等等均可以根据需求作适应性调整,图谱的形状、大小、样式等均不受限制,另外为了便于用户查看图谱,在图谱中还可以增加文本框信息。
搜索导航图谱给用户提供了节点关联形式的导航信息,用户基于该搜索导航图谱可以进一步关注自己感兴趣的节点信息。例如,当用户查看搜索导航图谱时,用户对某个子场景感兴趣可以通过点击该节点以进一步查看对应的导航信息。响应于用户在所述搜索导航图谱上触发的点击操作,在所述知识库中查找与被点击的节点信息相关的节点信息和/或产品信息,并更新所述搜索导航图谱。例如,当用户对图6的“情人节”子场景感兴趣时,可以点击该节点,响应于用户的该点击操作,系统需要在知识库中查找与该“情人节”子场景节点信息相关的其他节点信息和/或产品信息,并更新该搜索导航图谱。将图6更新为图7。更进一步,当用户对图7中“男友”对象节点感兴趣时,可以点击该节点,系统在知识库中查找与该“男友”节点信息相关的其他节点信息和/或产品信息,并更新该搜索导航图谱。将图7更新为图8。
另外,考虑到图谱展示会受到终端显示界面大小的限制,因此图谱上可绘制的节点个数会受到限制,当在知识库中查找到相关的节点信息和产品信息的个数远远超过图谱可绘制的节点总个数时,在展示图谱时,可以采用周期性轮换的方式来展示相关的节点信息和产品信息。以图8为例,假设图谱可绘制的节点总个数为8,那么当从知识库查找到的相关节点个数超过8时,可以按照周期性轮换的方式展示这些节点,还可以根据节点信息的权重大小确定节点的轮换顺序。例如,当查找到的产品信息除了图8所示的之外,还包括“手机”、“游戏机”、“腰带”、“手表”,则系统以周期性轮换的方式显示这些产品信息,在图8显示产品信息一个周期后更新图谱为图9,周期时间可根据实际情况调整。从图8和图9可以看出,分词路径保持不变,更新变化的是分词路径关联的其他节点信息或产品信息。
上文对本申请提供的一种基于图谱的导航方法进行了描述,下面对本申请提供的一种基于图谱的导航装置进行描述。
参考图10,图10为本申请提供的一种基于图谱的导航装置实施例的结构图,如图10所示,该装置可以包括以下单元:
分词及识别单元1001,用于对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;
分词路径确定单元1002,用于按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;
关联信息查找单元1003,用于在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息;
图谱绘制及展示单元1004,用于根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
优选的,所述装置还包括:
知识库建立单元,用于建立知识库;该知识库建立单元包括:
挖掘子单元,用于挖掘与业务主体相关的垂直网站得到相关的属性特征信息和对应的产品信息;及,
建立子单元,用于按照节点关联关系的形式在数据库中保存所述业务主体、相关的属性特征信息以及产品信息彼此间的关联关系,将该数据库作为知识库。
优选的,所述知识库建立单元还可以包括:
计算子单元,用于计算所述相关的属性特征信息和产品信息的权重;则所述建立子单元还用于在数据库中保存该权重。
优选的,所述关联信息查找单元,包括:
第一查找子单元,用于当所述分词路径的最低等级分词为业务主体类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和对象节点信息;
第二查找子单元,用于当所述分词路径的最低等级分词为属性特征类型时,在预先建立的知识库中查找与所述分词路径关联的父场景节点信息、对象节点信息以及关联的产品信息;及,
第三查找子单元,用于当所述分词路径的最低等级分词为受众类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息以及关联的产品信息。
优选的,所述图谱绘制及展示单元,包括:
图谱绘制子单元,用于按照突出分词路径的方式绘制分词路径以及绘制与所述分词路径关联的其他节点信息和/或产品信息以生成搜索导航图谱;
图谱展示子单元,用于按照周期性轮换的方式更新展示所述搜索导航图谱中与所述分词路径关联的其他节点信息和/或产品信息。
优选的,所述装置还包括:
动态响应更新单元,用于响应于用户在所述搜索导航图谱上触发的点击操作,在所述知识库中查找与被点击的节点信息相关的节点信息和/或产品信息,并更新所述搜索导航图谱。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种基于图谱的导航方法,其特征在于,所述方法包括:
对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;
按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;
在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息;
根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
2.根据权利要求1所述的方法,其特征在于,所述知识库通过以下方式建立,该方式包括:
挖掘与业务主体相关的垂直网站得到相关的属性特征信息和对应的产品信息;
按照节点关联关系的形式在数据库中保存所述业务主体、相关的属性特征信息以及产品信息彼此间的关联关系,将该数据库作为知识库。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
计算所述相关的属性特征信息和产品信息的权重;则所述知识库中还包括所述相关的属性特征信息的权重和产品信息的权重。
4.根据权利要求1所述的方法,其特征在于,在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息,包括:
当所述分词路径的最低等级分词为业务主体类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和对象节点信息;
当所述分词路径的最低等级分词为属性特征类型时,在预先建立的知识库中查找与所述分词路径关联的父场景节点信息、对象节点信息以及关联的产品信息;
当所述分词路径的最低等级分词为受众类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和关联的产品信息。
5.根据权利要求1所述的方法,其特征在于,根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱,包括:
按照突出分词路径的方式绘制分词路径以及绘制与所述分词路径关联的其他节点信息和/或产品信息以生成搜索导航图谱;
按照周期性轮换的方式更新展示所述搜索导航图谱中与所述分词路径关联的其他节点信息和/或产品信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于用户在所述搜索导航图谱上触发的点击操作,在所述知识库中查找与被点击的节点信息相关的节点信息和/或产品信息,并更新所述搜索导航图谱。
7.一种基于图谱的导航装置,其特征在于,所述装置包括:
分词及识别单元,用于对用户输入的查询词进行分词处理得到一个或多个分词,并进行分词类型的识别;
分词路径确定单元,用于按照预先设定的分词类型之间等级关系对所述分词处理后得到的一个或多个分词进行排序并生成表示各分词间关系的分词路径,其中不同分词类型分别对应所述分词路径中的不同节点;
关联信息查找单元,用于在预先建立的知识库中查找所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息;所述知识库存储各个分词路径中的节点信息及各个分词路径分别对应的产品信息;
图谱绘制及展示单元,用于根据所述分词路径关联的产品信息和/或所述分词路径关联的其他节点信息绘制搜索导航图谱,并展示所述搜索导航图谱。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
知识库建立单元,用于建立知识库;该知识库建立单元包括:
挖掘子单元,用于挖掘与业务主体相关的垂直网站得到相关的属性特征信息和对应的产品信息;及,
建立子单元,用于按照节点关联关系的形式在数据库中保存所述业务主体、相关的属性特征信息以及产品信息彼此间的关联关系,将该数据库作为知识库。
9.根据权利要求8所述的装置,其特征在于,所述知识库建立单元还包括:
计算子单元,用于计算所述相关的属性特征信息和产品信息的权重;则所述建立子单元还用于在数据库中保存该权重。
10.根据权利要求7所述的装置,其特征在于,所述关联信息查找单元,包括:
第一查找子单元,用于当所述分词路径的最低等级分词为业务主体类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和对象节点信息;
第二查找子单元,用于当所述分词路径的最低等级分词为属性特征类型时,在预先建立的知识库中查找与所述分词路径关联的父场景节点信息、对象节点信息以及关联的产品信息;及,
第三查找子单元,用于当所述分词路径的最低等级分词为受众类型时,在预先建立的知识库中查找与所述分词路径关联的子场景节点信息和关联的产品信息。
11.根据权利要求7所述的装置,其特征在于,所述图谱绘制及展示单元,包括:
图谱绘制子单元,用于按照突出分词路径的方式绘制分词路径以及绘制与所述分词路径关联的其他节点信息和/或产品信息以生成搜索导航图谱;
图谱展示子单元,用于按照周期性轮换的方式更新展示所述搜索导航图谱中与所述分词路径关联的其他节点信息和/或产品信息。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
动态响应更新单元,用于响应于用户在所述搜索导航图谱上触发的点击操作,在所述知识库中查找与被点击的节点信息相关的节点信息和/或产品信息,并更新所述搜索导航图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510303484.1A CN106294481B (zh) | 2015-06-05 | 2015-06-05 | 一种基于图谱的导航方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510303484.1A CN106294481B (zh) | 2015-06-05 | 2015-06-05 | 一种基于图谱的导航方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106294481A true CN106294481A (zh) | 2017-01-04 |
CN106294481B CN106294481B (zh) | 2019-10-22 |
Family
ID=57656664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510303484.1A Active CN106294481B (zh) | 2015-06-05 | 2015-06-05 | 一种基于图谱的导航方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106294481B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357846A (zh) * | 2017-06-26 | 2017-11-17 | 北京金堤科技有限公司 | 关系图谱的展示方法以及装置 |
CN108335363A (zh) * | 2018-01-22 | 2018-07-27 | 上海星合网络科技有限公司 | 多维知识体系立体展示方法及装置 |
CN108874838A (zh) * | 2017-05-16 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 页面推送方法和装置 |
CN108874819A (zh) * | 2017-05-11 | 2018-11-23 | 上海醇聚信息科技有限公司 | 一种数据库的数据挖掘方法 |
CN110192175A (zh) * | 2017-01-18 | 2019-08-30 | 微软技术许可有限责任公司 | 计算机可导航物理特征图的导航 |
CN110287304A (zh) * | 2019-06-30 | 2019-09-27 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
CN112017662A (zh) * | 2019-05-31 | 2020-12-01 | 阿里巴巴集团控股有限公司 | 控制指令确定方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499277A (zh) * | 2008-07-25 | 2009-08-05 | 中国科学院计算技术研究所 | 一种服务智能导航方法和系统 |
WO2013176961A1 (en) * | 2012-05-22 | 2013-11-28 | Alibaba Group Holding Limited | On-line product search method and system |
CN104462507A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于影视歌曲数据构建知识图谱的方法和装置 |
CN104462501A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于结构化数据的知识图谱构建方法和装置 |
-
2015
- 2015-06-05 CN CN201510303484.1A patent/CN106294481B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499277A (zh) * | 2008-07-25 | 2009-08-05 | 中国科学院计算技术研究所 | 一种服务智能导航方法和系统 |
WO2013176961A1 (en) * | 2012-05-22 | 2013-11-28 | Alibaba Group Holding Limited | On-line product search method and system |
CN104462507A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于影视歌曲数据构建知识图谱的方法和装置 |
CN104462501A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于结构化数据的知识图谱构建方法和装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110192175A (zh) * | 2017-01-18 | 2019-08-30 | 微软技术许可有限责任公司 | 计算机可导航物理特征图的导航 |
CN108874819A (zh) * | 2017-05-11 | 2018-11-23 | 上海醇聚信息科技有限公司 | 一种数据库的数据挖掘方法 |
CN108874819B (zh) * | 2017-05-11 | 2021-09-03 | 上海醇聚信息科技有限公司 | 一种数据库的数据挖掘方法 |
CN108874838A (zh) * | 2017-05-16 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 页面推送方法和装置 |
CN107357846A (zh) * | 2017-06-26 | 2017-11-17 | 北京金堤科技有限公司 | 关系图谱的展示方法以及装置 |
CN107357846B (zh) * | 2017-06-26 | 2018-12-14 | 北京金堤科技有限公司 | 关系图谱的展示方法以及装置 |
CN108335363A (zh) * | 2018-01-22 | 2018-07-27 | 上海星合网络科技有限公司 | 多维知识体系立体展示方法及装置 |
CN112017662A (zh) * | 2019-05-31 | 2020-12-01 | 阿里巴巴集团控股有限公司 | 控制指令确定方法、装置、电子设备和存储介质 |
CN110287304A (zh) * | 2019-06-30 | 2019-09-27 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106294481B (zh) | 2019-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106294481A (zh) | 一种基于图谱的导航方法及装置 | |
WO2022116537A1 (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
Jänicke et al. | On Close and Distant Reading in Digital Humanities: A Survey and Future Challenges. | |
CN103678335B (zh) | 商品标识标签的方法、装置及商品导航的方法 | |
CN105989082B (zh) | 报表视图生成方法和装置 | |
US20200089769A1 (en) | Consumer Insights Analysis Using Word Embeddings | |
CN103631794B (zh) | 一种用于对搜索结果进行排序的方法、装置与设备 | |
CN102929939B (zh) | 个性化信息的提供方法及装置 | |
US6664980B2 (en) | Visual navigation utilizing web technology | |
US20110106791A1 (en) | Method for enriching data sources | |
TW201104554A (en) | Method and system for navigating data and computer program product using the method | |
CN108287864A (zh) | 一种兴趣群组划分方法、装置、介质及计算设备 | |
CN103455487B (zh) | 一种搜索词的提取方法及装置 | |
KR20160133304A (ko) | 사용자 리뷰 제공 방법, 장치 및 컴퓨터 프로그램 | |
US11249945B2 (en) | Cognitive data descriptors | |
TW201923629A (zh) | 資料處理方法及裝置 | |
CN109359287A (zh) | 交互式文化旅游景区景点在线推荐系统及方法 | |
CN110322281A (zh) | 相似用户的挖掘方法及装置 | |
US8996989B2 (en) | Collaborative first order logic system with dynamic ontology | |
CN110413767A (zh) | 基于自然语言生成呈递内容的系统及方法 | |
CN110059233A (zh) | 业务流程的展示方法和装置 | |
CN106776640A (zh) | 一种股票资讯信息展示方法和装置 | |
CN106971004A (zh) | 搜索结果提供方法及装置 | |
CN107908749B (zh) | 一种基于搜索引擎的人物检索系统及方法 | |
WO2017050164A1 (zh) | 一种对象呈现方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |