[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN109145123B - 知识图谱模型的构建方法、智能交互方法、系统及电子设备 - Google Patents

知识图谱模型的构建方法、智能交互方法、系统及电子设备 Download PDF

Info

Publication number
CN109145123B
CN109145123B CN201811156056.0A CN201811156056A CN109145123B CN 109145123 B CN109145123 B CN 109145123B CN 201811156056 A CN201811156056 A CN 201811156056A CN 109145123 B CN109145123 B CN 109145123B
Authority
CN
China
Prior art keywords
current
data
voice data
knowledge
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811156056.0A
Other languages
English (en)
Other versions
CN109145123A (zh
Inventor
崔立学
杨耀威
王亚松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoxin Youe Data Co Ltd
Original Assignee
Guoxin Youe Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoxin Youe Data Co Ltd filed Critical Guoxin Youe Data Co Ltd
Priority to CN201811156056.0A priority Critical patent/CN109145123B/zh
Publication of CN109145123A publication Critical patent/CN109145123A/zh
Application granted granted Critical
Publication of CN109145123B publication Critical patent/CN109145123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据处理技术领域,尤其涉及一种知识图谱模型的构建方法,所述方法包括:获取用户的语音数据;根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据;识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;基于所述实体三元组,构建所述知识图谱模型。本申请实施例提供的知识图谱模型的构建方法,可以针对每个用户的语音数据进行建立知识图谱模型,从而可以利用构建的知识图谱模型为不同用户提供个性化的交互动作。本申请还提供了一种智能交互方法、系统及电子设备及电子设备。

Description

知识图谱模型的构建方法、智能交互方法、系统及电子设备
技术领域
本申请涉及数据处理技术领域,尤其涉及一种知识图谱模型的构建方法、智能交互方法、系统及电子设备。
背景技术
近年来,随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代,智能技术可以为人们在生活的各个方面提供方便快捷的服务。传统的人工服务由于其成本高、服务时间受限、响应速度慢等缺陷,已渐渐不适应新形势下的互联网业务。有鉴于此,语音交互作为人工智能范畴的一个重要应用应运而生。语音设备可以对用户语音进行识别,从而与用户进行语音交互并为用户提供服务,例如,用户可以用语音控制手机拨打电话、发送短信等。
但是在语音交互过程中,语音设备往往不能针对用户自身情况为用户提供个性化服务,且需要用户手动开启语音设备的语音功能。可见,当前的语音交互方式复杂繁琐,不能满足用户的个性化服务需求。
发明内容
有鉴于此,本申请实施例提供一种知识图谱模型的构建方法、智能交互方法、系统及电子设备,可以根据用户的语音数据构建知识图谱模型,满足用户个性化的服务需求。
主要包括以下几个方面:
第一方面,本申请实施例提供了一种信息查询方法,所述方法包括:
一种知识图谱模型的构建方法,其特征在于,所述方法包括:
获取用户的语音数据;
根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据;
识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;基于所述实体三元组,构建所述知识图谱模型。
对于以上知识图谱模型的构建方法,可选地,所述根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据,包括:
根据所述语音数据的声纹特征,确定表征用户身份的身份标识;
为所述语音数据对应的内容数据添加所述身份标识,生成所述预设格式的知识数据。
对于以上知识图谱模型的构建方法,可选地,所述知识数据为包含时间信息、所述身份标识以及所述内容数据的时序数据。
对于以上知识图谱模型的构建方法,可选地,所述识别所述知识数据中的实体,并进行实体之间的关系抽取,包括:基于所述知识数据所体现的上下文信息,进行所述实体的识别及所述关系的抽取。
第二方面,本申请实施例提供了一种智能交互方法,所述方法包括:
获取当前用户的当前语音数据;
根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过上述的知识图谱模型的构建方法得到。
对于以上智能交互方法,可选地,基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,包括:
基于时间信息、所述当前用户的身份信息、所述当前语音数据所对应的内容数据,生成当前知识数据;
识别所述当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组;
在所述知识图谱模型中查找所述当前实体,并获取所述当前实体有关的信息;
根据获取的所述当前实体有关的信息,执行所述交互动作。
对于以上智能交互方法,可选地,还包括:利用所述当前实体三元组对所述知识图谱模型进行更新。
第三方面,本申请实施例还提供了一种知识图谱模型的构建系统,所述系统包括:获取模块、处理模块、识别模块和构建模块;其中,
所述获取模块,用于获取用户的语音数据;
所述处理模块,用于根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,并将所述语音数据转换为预设格式的知识数据;
所述识别模块,用于识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
所述构建模块,用于基于所述实体三元组,构建所述知识图谱模型。
第四方面,本申请实施例还提供了一种智能交互系统,所述系统包括:获取模块、确定模块、服务模块;其中,
所述获取模块,用于获取当前用户的当前语音数据;
所述确定模块,用于根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
所述服务模块,用于基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过上述的知识图谱模型的构建系统的构建得到。
第五方面,本申请实施例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令时实现前述方法的步骤。
第六方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前述方法的步骤。
本申请实施例提供的知识图谱模型的构建方法,可以获取用户的语音数据,并根据获取的语音数据的声纹特征,对用户的语音数据进行归类,并将语音数据转换为预测格式的知识数据。这样,语音数据可以根据用户的声纹特征进行划分,从而可以对不同用户进行区分。进一步地,识别知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组,再基于得到的实体三元组,构建知识图谱模型。这样,构建知识图谱模型是基于每个用户的语音数据进行建立的,在利用构建的知识图谱模型进行智能交互时,可以针对不同用户提供个性化的交互动作,与现有技术中复杂的智能问答方案相比,本申请实施例提供的方案可以结合用户自身情况为用户提供个性化服务,增强用户体验。
为使本申请实施例的上述目的、特征和优点能更明显易懂,下面将结合实施例,并配合所附附图,作详细说明。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种知识图谱模型的构建方法的基本流程图;
图2示出了本申请实施例所提供的一种智能交互方法的基本流程图;
图3示出了本申请实施例所提供的一种知识图谱模型的构建系统的示意图;
图4示出了本申请实施例所提供的一种智能交互系统的示意图;
图5示出了本申请实施例所提供的一种电子设备的结构示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。以下对本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例下述方法、装置、电子设备或计算机存储介质可以应用于任何需要进行知识图谱模型构建的场景或者利用知识图谱进行智能交互的场景,比如,可以应用于智能问答系统、智能交互系统等。本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的知识图谱模型的构建方案或利用知识图谱进行智能交互的方案均在本申请保护范围内。
本申请实施例提供的知识图谱模型的构建方法和智能交互方法,可以获取用户的语音数据,并根据获取的语音数据的声纹特征,对用户的语音数据进行归类,并将语音数据转换为预测格式的知识数据。这样,语音数据可以根据用户的声纹特征进行划分,从而可以对不同用户进行区分。进一步地,识别知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组,再基于得到的实体三元组,构建知识图谱模型。这样,构建知识图谱模型是基于每个用户的语音数据进行建立的,在进行智能交互时,可以基于当前用户的身份信息、当前语音数据所对应的内容数据,利用构建的知识图谱模型为当前用户提供交互动作。这样,可以结合用户自身情况为用户提供个性化服务,增强用户体验。下面实施例将会对知识图谱模型的构建过程以及智能交互过程作详细说明。
首先对本申请实施例提供的知识图谱模型的构建过程做进行说明。如图1所示,本申请实施例提供了一种知识图谱模型的构建方法,包括以下步骤:
S101,获取用户的语音数据。
这里,可以实时采集用户的语音数据。本申请实施例提供的知识图谱模型的构建方法可以应用于智能交互系统中,例如,应用于家庭音响、家庭电视中等家庭设备中。智能交互系统可以随时处于开启状态,进而可以对用户的语音数据进行实时采集,如采集家庭成员之间的日常对话、用户拨打电话时的通话内容、用户与家庭设备之间的对话、用户与外来访客之间的对话等。在获取用户的语音数据过程中,可以先对采集到的语音数据进行过滤,过滤不属于用户的音频数据,例如,可以滤除音频播放设备播放的音频数据,然后在过滤后的音频数据中提取用户的语音数据,这样可以更加有效地对获取的语音数据进行识别。
S102,根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据。
在具体实施中,在获取用户的语音数据之后,可以根据语音数据的声波频谱,确定获取的语音数据的声纹特征,并根据语音数据的声纹特征,对不同用户的语音数据进行归类,并将归类的语音数据转换为预设格式的知识数据保存在语音数据库中。
这里,在根据语音数据的声纹特征对用户的语音数据进行归类,将语音数据转换为预设格式的知识数据时,可以先根据语音数据的声纹特征,确定表征用户身份的身份标识,从而可以根据身份标识确定语音数据来源的用户。在确定表征用户身份的身份标识之后,可以为语音数据对应的内容数据添加身份标识,生成预设格式的知识数据。其中语音数据对应的内容数据可以为语音数据对应的文本数据,或者,可以为基于语音数据提取的关键文本数据段。若内容数据为关键文本数据段,则在将语音数据转换为对应的文本数据之后,还可以在文本数据中提取关键文本数据段,将关键文本数据段作为语音数据对应的内容数据。这里,预设格式可以为“时间信息-身份标识-内容数据”的数据存储格式。在生成预设格式的知识数据时,可以根据获取语音数据的时间、语音数据对应的身份标识以及语音数据的内容数据,生成预设格式的知识数据。相应地,知识数据可以为包含时间信息、身份标识以及内容数据的时序数据。在生成知识数据之后,可以将知识数据保存在用户身份的身份标识对应的数据库存储区域中。
S103,识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组。
在具体实施中,在将语音数据转换为预设格式的知识数据之后,可以对知识数据中的实体进行识别,以及进行实体之间的关系抽取,从而得到包含关系信息的实体三元组。这里的实体可以指具有某类事物特征的数据对象集合。在识别知识数据中的实体,并进行实体之间的关系抽取时,可以基于知识数据所体现的上下文信息,进行实体的识别及关系的抽取。具体如,可以根据知识数据中包含的时间信息,确定预设时间段内生成的知识数据,并根据知识数据中包含的内容数据确定知识数据所体现的上下文信息,从而基于上下文信息对知识数据进行实体的识别及关系的抽取。在识别实体以及抽取实体之间的关系之后,可以根据识别的实体以及实体之间的关系得到包含关系信息的实体三元组。这里的关系信息可以包括实体以及实体之间的关系,相应地,实体三元组可以包括:第一实体、实体之间的关系、第二实体。例如,知识数据1为:时间1;人物1;爸爸,我想吃冰激凌。知识数据2为:时间2;人物2;自己去冰箱拿吧,今天最后一个。在对知识数据进行实体的识别及关系的抽取时,可以结合知识数据1和知识数据2进行实体的识别及实体关系之间的关系抽取,得到的实体三元组可以为:(人物1,儿子-父亲,人物2);(人物1,兴趣-食物,冰激凌);(冰箱,地点-食物,冰激凌)。
需要说明的是,知识数据中实体的识别和实体之间关系的抽取可以是同时进行的。在识别知识数据中的实体并进行实体之间的关系抽取时,可以根据预设的标注策略为知识数据添加标签,这里的预设的标注策略可以包括以下三个部分:
1)根据实体在知识数据中的位置确定实体中词或字的位置标签,例如,位置标签可以包括:实体开始(B)、实体内部(I)、实体结尾(E),单个实体(S)。
2)根据预设的实体关系类型确定实体中词或字的关系标签,例如,关系标签可以包括儿子-父亲、兴趣-食物等预先定义的关系类型。
3)根据实体表示的角色信息确定实体中词或字的角色标签,例如,人物1(实体1)、人物2(实体2)等实体对应的角色标签。
这里,若知识数据中的实体不具有实体关系,则可以将实体的标签设置为预设标签,例如“O”。
根据上述标注策略,若知识数据1为(时间1;人物1;爸爸,我想吃冰激凌),知识数据2为(时间2;人物2;自己去冰箱拿吧,今天最后一个),则在识别知识数据1和知识数据2中的实体和实体之间的关系时,为实体“爸爸”添加的标签可以为(单个实体,儿子-父亲,人物1),为实体“自己”添加的标签可以为(单个实体,儿子-父亲,人物2)。
在为知识数据中的实体添加标签之后,可以根据实体的标签,将具有相同关系类型的实体合并为一个实体三元组,如将(单个实体,儿子-父亲,人物1)与(单个实体,儿子-父亲,人物2)合并为(人物1,儿子-父亲,人物2)。如果一个知识数据中包含两个以上相同关系类型的实体,则可以采用就近原则进行合并。
S104,基于所述实体三元组,构建所述知识图谱模型。
在具体实施中,得到知识数据对应的实体三元组之后,可以根据实体三元组中实体之间的关系,建立不同实体之间的关系网络,从而构建知识图谱模型。由于构建知识图谱模型是基于每个用户的语音数据进行建立的,在利用构建的知识图谱模型进行智能交互时,可以针对不同用户提供个性化的交互动作。
下面对本申请实施例提供的利用构建的知识图谱模型进行智能交互的过程进行说明。如图2所示,本申请实施例提供了一种智能交互的方法,包括以下步骤:
S201,获取当前用户的当前语音数据。
在具体实施中,可以实时采集用户的语音数据,例如,实时采集家庭成员之间的日常对话、用户拨打电话时的通话内容、用户与家庭设备之间的对话、用户与外来访客之间的对话等。当采集到音频数据时,可以先对采集到的音频数据进行过滤,过滤不属于当前用户的音频数据,例如,可以滤除音频播放设备播放的音频数据,然后在过滤后的音频数据中提取当前用户的当前语音数据,这样可以更加有效地对获取的当前语音数据进行识别。
S202,根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息。
在具体实施中,在获取用户的当前语音数据之后,可以根据当前语音数据的声波频谱,确定获取的当前语音数据的声纹特征,并根据当前语音数据的声纹特征,对当前用户进行识别,确定当前用户的身份信息。这里,在根据当前语音数据的声纹特征对当前用户进行识别,确定当前用户的身份信息时,可以根据声纹特征所对应的身份标识确定当前用户的身份信息,身份标识可以为用于表征用户身份的标识。如确定当前用户在家庭成员中的身份信息,例如父亲、儿子等身份信息。
S203,基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作。
其中的知识图谱模型可以通过上述的知识图谱模型的构建方法得到,知识图谱模型的构建方法这里不再赘述。
在具体实施中,在确定当前用户的身份信息之后,可以基于当前用户的身份信息、当前语音数据所对应的内容数据,利用通过上述知识图谱模型的构建方法得到的知识图谱模型,为当前用户提供交互动作。这里的交互动作可以包括语音提示动作、音视频播放动作、界面显示动作等交互动作。
这里,在基于当前用户的身份信息、当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作时,可以基于获取当前语音数据的时间信息、当前用户的身份信息、以及当前语音数据所对应的内容数据,生成当前知识数据,再识别当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组,然后在知识图谱模型中查找当前实体,并获取当前实体有关的信息,然后再根据获取的当前实体有关的信息,执行交互动作。
在具体实施中,在生成当前知识数据时,可以将当前语音数据转换为语音数据对应的文本数据,将转换的文本数据作为当前语音数据的内容数据,然后可以将获取当前语音数据的时间信息、当前用户的身份信息、以及当前语音数据所对应的内容数据按照预设格式进行组合,生成当前知识数据。这里的预设格式可以为“时间信息-身份信息-内容数据”的数据存储格式,这里的身份信息可以为表征当前用户身份的身份标识。相应地,知识数据可以为包含时间信息、身份信息以及内容数据的时序数据。
进一步地,在生成当前知识数据之后,可以识别当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组。其中,关系信息可以包括当前实体以及当前实体之间的关系,相应地,当前实体三元组可以包括:第一当前实体、当前实体之间的关系、第二当前实体。需要说明的是,当前知识数据中实体的识别和当前实体之间关系的抽取可以是同时进行的。在识别当前知识数据中的当前实体并进行实体之间的关系抽取时,可以根据预设的标注策略为当前知识数据添加标签,这里的预设的标注策略可以包括以下三个部分:
1)根据当前实体在当前知识数据中的位置确定当前实体中词或字的位置标签,例如,位置标签可以包括:实体开始(B)、实体内部(I)、实体结尾(E),单个实体(S)。
2)根据预设的实体关系类型确定当前实体中词或字的关系标签,例如,关系标签可以包括儿子-父亲、兴趣-食物等预先定义的关系类型。
3)根据当前实体表示的角色信息确定当前实体中词或字的角色标签,例如,人物1(实体1)、人物2(实体2)等实体对应的角色标签。
这里,如果当前实体不具有实体关系,可以将当前实体的标签设置为预设标签,例如“O”。
这里,在得到当前知识数据所对应的当前实体三元组之后,可以在构建的知识图谱模型中查找当前实体。知识图谱模型中存在当前实体与其他实体之间的关系网络,通过知识图谱模型可以获取当前实体有关的信息,例如,若第一当前实体为家庭成员中的父亲,第二当前实体为电话号码,则可以通过知识图谱模型获取父亲的电话号码。在通过知识图谱模型获取当前实体有关的信息之后,可以根据获取的当前实体有关的信息,执行交互动作,例如,将获取的父亲的电话号码通过语音提示的方式执行交互动作。
进一步地,在根据获取的当前实体有关的信息,执行交互动作之后,还可以利用当前实体三元组对知识图谱模型进行更新,保证知识图谱模型中的当前实体有关的信息为最新的信息,从而可以减少执行交互动作的错误率,为当前用户提供有效的交互动作。
下面通过一个具体的实施例对上述智能交互的过程进行说明。
假设上述智能交互方法应用于家庭智能音响系统中,智能音响系统实时采集家庭成员的会话。若智能音响系统获取的当前用户的当前语音数据为“我的手机在哪”,智能音响系统则根据当前语音数据的声纹特征,对当前用户进行识别,确定当前用户为家庭成员中的父亲,然后将当前语音数据按照预设格式转换为当前知识数据,即将“我的手机在哪儿”转换为“时间信息;父亲;我的手机哪儿”对应的当前知识数据。进而对当前知识数据进行当前实体的识别及当前实体之间的关系的抽取,由当前知识数据得到当前实体三元组:(父亲,通信工具-位置,手机),则智能音响系统可以利用知识图谱模型获取父亲手机相关的信息,如号码、充电位置等信息,从而可以父亲本人的手机号码或手机的国际移动设备识别码,通过局域网或者通信网激活手机的铃声或震动,为家庭成员的父亲找到手机。再例如,若智能音响系统获取的当前用户的当前语音数据为“放首音乐听听”,则智能音响系统可以根据当前用户的用户信息,在当前用户为儿童,为当前用户播放儿歌;在当前用户为大人时,结合当前语音数据的上下文信息,如上下文信息为“我要工作一会,你先不要吵”,则可以为当前用户播放一些工作背景音乐,实现智能化地个性服务。
基于同一申请构思,本申请实施例中还提供了与知识图谱模型的构建方法对应的知识图谱模型的构建系统,由于本申请实施例中的系统解决问题的原理与本申请实施例上述知识图谱模型的构建方法相似,因此系统的实施可以参见方法的实施,重复之处不再赘述。
本申请实施例提供的知识图谱模型的构建系统的示意图如图3所示,该系统30包括:获取模块31、处理模块32、识别模块33和构建模块34。
所述获取模块31,用于获取用户的语音数据;
所述处理模块32,用于根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,并将所述语音数据转换为预设格式的知识数据;
所述识别模块33,用于识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
所述构建模块34,用于基于所述实体三元组,构建所述知识图谱模型。
在具体实施中,所述处理模块32,具体用于根据以下步骤对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据:
根据所述语音数据的声纹特征,确定表征用户身份的身份标识;
为所述语音数据对应的内容数据添加所述身份标识,生成所述预设格式的知识数据。
可选地,所述知识数据为包含时间信息、所述身份标识以及所述内容数据的时序数据。
在具体实施中,所示识别模块33,具体用于根据以下步骤识别所述知识数据中的实体,并进行实体之间的关系抽取:
基于所述知识数据所体现的上下文信息,进行所述实体的识别及所述关系的抽取。
基于同一申请构思,本申请实施例中还提供了与智能交互方法对应的智能交互系统,由于本申请实施例中的系统解决问题的原理与本申请实施例上述智能交互方法相似,因此系统的实施可以参见方法的实施,重复之处不再赘述。
本申请实施例提供的智能交互系统的示意图如图4所示,所述智能交互系统40包括:获取模块41、确定模块42、服务模块43。
所述获取模块41,用于获取当前用户的当前语音数据;
所述确定模块42,用于根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
所述服务模块43,用于基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过上述的知识图谱模型的构建系统得到。
在具体实施中,所示服务模块43,具体用于根据以下步骤提供交互动作:
基于时间信息、所述当前用户的身份信息、所述当前语音数据所对应的内容数据,生成当前知识数据;
识别所述当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组;
在所述知识图谱模型中查找所述当前实体,并获取所述当前实体有关的信息;
根据获取的所述当前实体有关的信息,执行所述交互动作。
在具体实施中,所述智能交互系统40还包括:
更新模块41,用于利用所述当前实体三元组对所述知识图谱模型进行更新。
本申请实施例提供的知识图谱模型的构建系统30和智能交互系统40,可以获取用户的语音数据,并根据获取的语音数据的声纹特征,对用户的语音数据进行归类,并将语音数据转换为预测格式的知识数据。这样,语音数据可以根据用户的声纹特征进行划分,从而可以对不同用户进行区分。进一步地,识别知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组,再基于得到的实体三元组,构建知识图谱模型。这样,构建知识图谱模型是基于每个用户的语音数据进行建立的,在进行智能交互时,可以基于当前用户的身份信息、当前语音数据所对应的内容数据,利用构建的知识图谱模型为当前用户提供交互动作。这样可以结合用户自身情况为用户提供个性化服务,增强用户体验。
本申请实施例还提供了一种电子设备50,该电子设备50的结构如图5所示,包括:处理器51、存储器52和总线53;
所述存储器存储52有所述处理器51可执行的机器可读指令(比如,图3中的获取模块31、处理模块32、识别模块33和构建模块34对应的执行指令),当电子设备运行时,所述处理器51与所述存储器52之间通过总线53通信,所述处理器51执行所述机器可读指令时执行如下处理:
获取用户的语音数据;
根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据;
识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;基于所述实体三元组,构建所述知识图谱模型。
在具体实施中,上述处理器51执行的处理中,
所述根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据,包括:
根据所述语音数据的声纹特征,确定表征用户身份的身份标识;
为所述语音数据对应的内容数据添加所述身份标识,生成所述预设格式的知识数据。
在具体实施中,上述处理器51执行的处理中,
所述知识数据为包含时间信息、所述身份标识以及所述内容数据的时序数据。
在具体实施中,上述处理器51执行的处理中,
所述识别所述知识数据中的实体,并进行实体之间的关系抽取,包括:基于所述知识数据所体现的上下文信息,进行所述实体的识别及所述关系的抽取。
本申请实施例还提供了一种电子设备60,该电子设备60的结构如图6所示,包括:处理器61、存储器62和总线63;
所述存储器存储62有所述处理器61可执行的机器可读指令(比如,图4中的获取模块41、确定模块42和服务模块43对应的执行指令),当电子设备运行时,所述处理器61与所述存储器62之间通过总线63通信,所述处理器61执行所述机器可读指令时执行如下处理:
获取当前用户的当前语音数据;
根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过上述的知识图谱模型的构建方法得到。
在具体实施中,上述处理器61执行的处理中,
基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,包括:
基于时间信息、所述当前用户的身份信息、所述当前语音数据所对应的内容数据,生成当前知识数据;
识别所述当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组;
在所述知识图谱模型中查找所述当前实体,并获取所述当前实体有关的信息;
根据获取的所述当前实体有关的信息,执行所述交互动作。
在具体实施中,上述处理器61执行的处理中,还包括:
利用所述当前实体三元组对所述知识图谱模型进行更新。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一实施例提供的知识图谱模型的构建方法或智能交互方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一实施例提供的知识图谱模型的构建方法或智能交互的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述信息查询方法的步骤,从而解决目前语音设备不能针对用户自身情况为用户提供个性化服务的问题。
本申请实施例所提供的知识图谱模型的构建方法或智能交互方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种知识图谱模型的构建方法,其特征在于,所述方法包括:
获取用户的语音数据;
根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据;
识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;基于所述实体三元组,构建所述知识图谱模型;
其中,所述根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据,包括:
根据所述语音数据的声纹特征,确定表征用户身份的身份标识;
为所述语音数据对应的内容数据添加所述身份标识,生成所述预设格式的知识数据,并将所述知识数据存储在所述用户身份的所述身份标识对应的数据库存储区域中。
2.根据权利要求1所述的方法,其特征在于,所述知识数据为包含时间信息、所述身份标识以及所述内容数据的时序数据。
3.根据权利要求1所述的方法,其特征在于,所述识别所述知识数据中的实体,并进行实体之间的关系抽取,包括:基于所述知识数据所体现的上下文信息,进行所述实体的识别及所述关系的抽取。
4.一种智能交互方法,其特征在于,所述方法包括:
获取当前用户的当前语音数据;
根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过权利要求1-3任一所述的知识图谱模型的构建方法得到。
5.根据权利要求4所述的方法,其特征在于,基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,包括:
基于时间信息、所述当前用户的身份信息、所述当前语音数据所对应的内容数据,生成当前知识数据;
识别所述当前知识数据中包含的当前实体,并进行当前实体之间的关系抽取,得到包含关系信息的当前实体三元组;
在所述知识图谱模型中查找所述当前实体,并获取所述当前实体有关的信息;
根据获取的所述当前实体有关的信息,执行所述交互动作。
6.根据权利要求5所述的方法,其特征在于,还包括:利用所述当前实体三元组对所述知识图谱模型进行更新。
7.一种知识图谱模型的构建系统,其特征在于,所述系统包括:获取模块、处理模块、识别模块和构建模块;其中,
所述获取模块,用于获取用户的语音数据;
所述处理模块,用于根据所述语音数据的声纹特征,对所述用户的语音数据进行归类,并将所述语音数据转换为预设格式的知识数据;
所述识别模块,用于识别所述知识数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
所述构建模块,用于基于所述实体三元组,构建所述知识图谱模型;
其中,所述处理模块,具体用于根据以下步骤对所述用户的语音数据进行归类,将所述语音数据转换为预设格式的知识数据:
根据所述语音数据的声纹特征,确定表征用户身份的身份标识;
为所述语音数据对应的内容数据添加所述身份标识,生成所述预设格式的知识数据,并将所述知识数据存储在所述用户身份的所述身份标识对应的数据库存储区域中。
8.一种智能交互系统,其特征在于,所述系统包括:获取模块、确定模块、服务模块;其中,
所述获取模块,用于获取当前用户的当前语音数据;
所述确定模块,用于根据当前语音数据的声纹特征,对所述当前用户进行识别,确定所述当前用户的身份信息;
所述服务模块,用于基于所述当前用户的身份信息、所述当前语音数据所对应的内容数据,利用知识图谱模型,提供交互动作,所述知识图谱模型通过权利要求7所述的知识图谱模型的构建系统的构建得到。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令时实现如权利要求1~3或4~6任一所述方法的步骤。
CN201811156056.0A 2018-09-30 2018-09-30 知识图谱模型的构建方法、智能交互方法、系统及电子设备 Active CN109145123B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811156056.0A CN109145123B (zh) 2018-09-30 2018-09-30 知识图谱模型的构建方法、智能交互方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811156056.0A CN109145123B (zh) 2018-09-30 2018-09-30 知识图谱模型的构建方法、智能交互方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN109145123A CN109145123A (zh) 2019-01-04
CN109145123B true CN109145123B (zh) 2020-11-17

Family

ID=64814075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811156056.0A Active CN109145123B (zh) 2018-09-30 2018-09-30 知识图谱模型的构建方法、智能交互方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN109145123B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933671A (zh) * 2019-01-31 2019-06-25 平安科技(深圳)有限公司 构建个人知识图谱的方法、装置、计算机设备和存储介质
CN109862473B (zh) * 2019-03-07 2020-10-13 上海优谦智能科技有限公司 一种基于课堂教学场景下的人工智能助教音箱
CN110138986B (zh) * 2019-04-30 2021-01-22 五竹科技(北京)有限公司 与外呼流程相关的知识图谱的构建方法、装置及存储介质
CN110580516B (zh) * 2019-08-21 2021-11-09 厦门无常师教育科技有限公司 一种基于智能机器人的交互方法及装置
CN110570854B (zh) * 2019-08-23 2021-10-15 珠海格力电器股份有限公司 一种智能语音输出方法及装置
CN110674637B (zh) * 2019-09-06 2023-07-11 腾讯科技(深圳)有限公司 一种人物关系识别模型训练方法、装置、设备及介质
CN110674316B (zh) * 2019-09-27 2022-05-31 腾讯科技(深圳)有限公司 一种数据转换的方法及相关装置
CN110750651B (zh) * 2019-10-16 2023-05-26 同方知网数字出版技术股份有限公司 一种基于科技成果的知识图谱构建方法
CN110784768B (zh) * 2019-10-17 2021-06-15 珠海格力电器股份有限公司 一种多媒体资源播放方法、存储介质及电子设备
CN110738982B (zh) * 2019-10-22 2022-01-28 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN111177335B (zh) * 2019-11-29 2023-11-21 广东轩辕网络科技股份有限公司 一种基于知识图谱的智能助理的信息处理方法及装置
CN111098301B (zh) * 2019-12-20 2020-08-18 西南交通大学 一种基于场景知识图谱任务型机器人的控制方法
CN111339314B (zh) * 2020-02-19 2024-02-13 北京百度网讯科技有限公司 一种三元组数据的生成方法、装置和电子设备
CN111460167A (zh) * 2020-03-19 2020-07-28 平安国际智慧城市科技股份有限公司 基于知识图谱定位排污对象的方法及相关设备
CN111488741A (zh) * 2020-04-14 2020-08-04 税友软件集团股份有限公司 一种税收知识数据语义标注方法及相关装置
CN111858892B (zh) * 2020-07-24 2023-09-29 中国平安人寿保险股份有限公司 基于知识图谱的语音交互方法、装置、设备及介质
CN111858966B (zh) * 2020-08-05 2021-12-31 龙马智芯(珠海横琴)科技有限公司 知识图谱的更新方法、装置、终端设备及可读存储介质
CN112331201A (zh) * 2020-11-03 2021-02-05 珠海格力电器股份有限公司 语音的交互方法和装置、存储介质、电子装置
CN112530438B (zh) * 2020-11-27 2023-04-07 贵州电网有限责任公司 一种基于知识图谱辅助声纹识别的身份认证方法
CN113139384A (zh) * 2021-04-28 2021-07-20 北京百度网讯科技有限公司 电话核实、地图处理、知识图谱处理方法和装置
CN113239184B (zh) * 2021-07-09 2021-11-02 腾讯科技(深圳)有限公司 知识库获取方法、装置、计算机设备及存储介质
CN114330369A (zh) * 2022-03-15 2022-04-12 深圳文达智通技术有限公司 基于智能语音分析的地产营销管理方法、装置及设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239456B (zh) * 2014-09-02 2019-05-03 百度在线网络技术(北京)有限公司 用户特征数据的提取方法和装置
CN106095833B (zh) * 2016-06-01 2019-04-16 竹间智能科技(上海)有限公司 人机对话内容处理方法
CN106228988A (zh) * 2016-07-29 2016-12-14 珠海市魅族科技有限公司 一种基于声纹信息的习惯信息匹配方法及装置
CN106873451A (zh) * 2017-01-19 2017-06-20 广东美的厨房电器制造有限公司 一种烹饪设备及其智能烹饪方法
CN107015781B (zh) * 2017-03-28 2021-02-19 联想(北京)有限公司 语音识别方法和系统
CN107147792B (zh) * 2017-05-23 2020-10-27 惠州Tcl移动通信有限公司 一种自动配置音效的方法、装置、移动终端及存储装置
CN107391673B (zh) * 2017-07-21 2020-11-03 苏州狗尾草智能科技有限公司 携带时间戳的中文通用知识图谱的生成方法及装置

Also Published As

Publication number Publication date
CN109145123A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN109145123B (zh) 知识图谱模型的构建方法、智能交互方法、系统及电子设备
CN106845644B (zh) 一种通过相互关系学习用户及移动应用的联系的异构网络
CN109522419B (zh) 会话信息补全方法及装置
CN104794122A (zh) 一种位置信息推荐方法、装置和系统
CN110784768B (zh) 一种多媒体资源播放方法、存储介质及电子设备
CN105469789A (zh) 一种语音信息的处理方法及终端
CN110209809B (zh) 文本聚类方法和装置、存储介质及电子装置
CN111522909B (zh) 一种语音交互方法及服务器
CN113569037A (zh) 一种消息处理方法、装置以及可读存储介质
CN109144285A (zh) 一种输入方法和装置
JP7436077B2 (ja) スキルの音声ウェイクアップ方法および装置
CN101763427A (zh) 一种快速调用功能的输入方法及系统
CN111243604A (zh) 支持多唤醒词的说话人识别神经网络模型的训练方法、说话人识别方法及系统
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质
CN107295105B (zh) 儿童行为的分析方法及终端设备、计算机可读存储介质
CN107678309B (zh) 操控句式生成、应用操控方法及装置、存储介质
CN103533130B (zh) 一种删除联系人信息的方法及移动终端
CN111241401B (zh) 一种搜索请求处理方法及装置
CN110570838B (zh) 语音流处理方法和装置
CN110516236B (zh) 一种社交短文本细粒度情感采集方法
CN115705378A (zh) 一种资源推荐方法、装置及电子设备
CN114449342A (zh) 视频推荐方法、装置、计算机可读存储介质和计算机设备
CN113468306A (zh) 语音对话方法、装置、电子设备及存储介质
CN110362686B (zh) 一种词库的生成方法、装置、终端设备和服务器
CN108831473B (zh) 一种音频处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100070, No. 101-8, building 1, 31, zone 188, South Fourth Ring Road, Beijing, Fengtai District

Applicant after: Guoxin Youyi Data Co., Ltd

Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing

Applicant before: SIC YOUE DATA Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Construction method, intelligent interaction method, system and electronic equipment of knowledge atlas model

Effective date of registration: 20211213

Granted publication date: 20201117

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: Guoxin Youyi Data Co., Ltd

Registration number: Y2021990001166