CN113905135A - 一种智能外呼机器人的用户意向识别方法和装置 - Google Patents
一种智能外呼机器人的用户意向识别方法和装置 Download PDFInfo
- Publication number
- CN113905135A CN113905135A CN202111206048.4A CN202111206048A CN113905135A CN 113905135 A CN113905135 A CN 113905135A CN 202111206048 A CN202111206048 A CN 202111206048A CN 113905135 A CN113905135 A CN 113905135A
- Authority
- CN
- China
- Prior art keywords
- user
- intention
- answer
- model
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000003044 adaptive effect Effects 0.000 claims abstract description 6
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 238000010276 construction Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 16
- 238000003062 neural network model Methods 0.000 claims description 15
- 238000013145 classification model Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Manipulator (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种智能外呼机器人的用户意向识别方法和装置,所述方法包括:获取整通电话的用户录音,并通过语音识别转成通话文本;对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;构建外呼机器人问题与用户回答意图之间的对应关系;利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。所述装置包括:文本转换模块、意图识别模块、序列构建模块和意向识别模块。本发明考虑了外呼机器人的问题序列和用户回答的意图序列信息,可以提升用户意向识别的准确率,还能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能外呼机器人的用户意向识别方法和装置。
背景技术
近年来,随着人工智能技术的飞速发展,智能外呼机器人已经越来越多地应用在企业电话营销领域,例如对用户的购车意向线索清洗、教育产品推销、理财产品营销等。外呼机器人与传统的人工呼叫相比,具有工作效率高、成本低等特点和优势。目前,采用外呼机器人替代人工坐席在企业电话营销领域是大势所趋。外呼机器人和用户的一通电话完成后,通常需要对整通电话的用户意向进行分析,后续,对具有购买意向的客户再通过人工坐席跟进,提升具有购买意向的客户的成交转化率。因此,用户意向的确定在基于外呼机器人的智能营销中起着至关重要的作用。
现有技术中,常用的一种方式是基于规则对用户意向进行分级,例如对整通电话中用户的回答录音通过语音识别技术(ASR,Automatic Speech Recognition)转录成用户回答的文本,再对转录的文本进行意图识别,并基于规则对各意图进行打分,最终得到整通电话用户意向的分值,作为用户意向分级的依据。然而,此类方法依赖对规则的经验性设置,在简单场景下比较有效,在复杂场景下规则设置复杂性大大提升,而且用户意向分类的准确率也得不到保证。例如某具有购买意向的客户在前半段意图识别为不买车,而后半段又表现出买车高意向时,这时通过得分加减很难得到较高的准确率。
此外,现有技术中也有通过训练分类模型来对用户意向进行分类的方法。此类方法对用户的回答直接通过训练分类模型来判断用户的意向。
然而,上述两种方法忽略了外呼机器人的提问问题,由于整通电话是外呼机器人发起提问,用户再回答,并不断循环这一问答过程,而用户的回答是针对问题进行,因此整通电话的问题一回答的序列信息也是至关重要的。
此外,上述两种现有方案都无法对特定级别的用户意向进行召回率或准确率上的修改,其中,准确率=提取出的正确信息条数/提取出的信息条数;召回率=提取出的正确信息条数/样本中的信息条数。例如对于某些厂商,他们的用户线索量非常多,因此,厂商关心的是智能外呼机器人帮忙筛选高意向类别的准确率,而不关心有没有漏检高意向的客户。如果高意向的分类准确率特别高,这样对该类用户进行人工电话介入就可以减少无效的人工电话量。而对另一些厂商,厂商的用户线索较少,因此他们关心高意向类别的召回率,如果外呼机器人筛选后丢掉了一些高意向客户,则对厂商损失较大。因此,针对不同的场景能否灵活配置高准确或者高召回在识别用户意向领域格外重要。
发明内容
为此,本发明提供一种智能外呼机器人的用户意向识别方法和装置,以力图解决或至少缓解上面存在的问题。
根据本发明的第一个方面,提供一种智能外呼机器人的用户意向识别方法,包括:获取整通电话的用户录音,并通过语音识别转成通话文本;对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;构建外呼机器人问题与用户回答意图之间的对应关系;利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
优选地,所述的方法,还包括:根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
优选地,获取整通电话的用户录音,并通过语音识别转成通话文本包括:对所述用户录音的声道通过静音检测算法得到所述外呼机器人每个提问问题的回答录音,按照所述外呼机器人提问问题的顺序组成回答录音序列;通过语音识别将用户回答录音序列转录为用户回答文本序列。
优选地,对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:利用文本分类模型对所述用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
优选地,所述用户意向识别模型通过如下步骤进行训练:对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数。
优选地,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
优选地,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:
采用各个分类的类别中概率值最大的一个类别作为用户的意向。
根据本发明的第二个方面,提供一种智能外呼机器人的用户意向识别装置,包括:文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
优选地,所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
根据本发明的第三个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行上述智能外呼机器人的用户意向识别方法。
根据本发明的第四个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述智能外呼机器人的用户意向识别方法。
本发明和现有技术相比,具有如下有益效果:
本申请的智能外呼机器人的用户意向识别方法和装置不仅考虑了外呼机器人的问题序列和用户回答的意图序列信息,可以提升用户意向识别的准确率,还能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的智能外呼机器人的用户意向识别方法的流程图;
图2示出了根据本发明一个实施例的智能外呼机器人的用户意向识别方法的示意图;
图3示出了根据本发明一个实施例的智能外呼机器人的用户意向识别装置的结构示意图;
图4是根据本申请实施例的第一种计算机可读存储介质的示意性结构框图;
图5是根据本申请实施例的第二种计算机可读存储介质的示意性结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
针对灵活配置高准确或者高召回的问题,本发明提供了智能外呼机器人的用户意向识别方法,能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。
本发明的智能外呼机器人的用户意向识别方法在计算设备中执行。计算设备可以是任意具有存储和计算能力的设备,其例如可以实现为服务器、工作站等,也可以实现为桌面计算机、笔记本计算机等个人配置的计算机,或者实现为手机、平板电脑、智能可穿戴设备、物联网设备等终端设备,但不限于此。
图1示出了根据本发明一种智能外呼机器人的用户意向识别方法的流程图,可以包括如下将要描述的步骤S101至步骤S104:
在步骤S101中,获取整通电话的用户录音,并通过语音识别转成通话文本。
本发明实施例中,获取整通电话的用户录音,并通过语音识别转成通话文本包括:
对用户录音的声道通过静音检测算法得到外呼机器人每个提问问题的回答录音,按照外呼机器人提问问题的顺序组成回答录音序列;通过语音识别将用户回答录音序列转录为用户回答文本序列。
具体地,在外呼机器人和用户对答的电话录音里,外呼机器人播放的录音和用户回答的录音分别处于不同的声道,对用户录音的声道可以通过静音检测算法(VAD,VoiceActivity Detection)得到每个机器人提问问题对应的用户回答录音录音(AS1,AS2,...,ASn)。相应地,外呼机器人的录音可记为(QS1,QS2,...,QSn)。再通过语音识别(ASR,Automatic Speech Recognition)将用户回答录音序列(AS1,AS2,...,ASn)转录为用户回答文本序列(AT1,AT2,...,ATn)。
例如,在某通完整的电话录音内容为,外呼机器人录音序列的语音包含下述内容:(QS1:您好,请问您近期要买车吗?QS2:我们这有优惠活动,要不要给您介绍一下),用户回答录音序列包含下述内容:(AS1:不买;AS2:不用,再见)。对该通电话,序列长度n=2。对上述例子,用户回答文本序列为:(AT1:不买;AT2:不用,再见)。其中语音识别模型可通过调用讯飞、阿里等厂商提供的第三方接口实现或其他方案实现。
在步骤S102中,对所述通话文本进行意图识别,得到每个问题(即外呼机器人的录音中提问的每个问题)对应的用户回答的意图。
本发明实施例中,对通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:
利用文本分类模型对用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
具体地,针对步骤S101得到的用户回答文本序列,利用文本分类模型对用户回答文本序列的各个回答分别进行意图识别,得到对应的意图。本发明实施例中文本分类模型可采用业Textcnn或BERT等模型进行,用户回答的文本序列(AT1,AT2,...,ATn)转化为用户回答的意图序列(AP1,AP2,...,APn),其中
APi∈{A1,A2,...,Ak}
其中,k为用户回答的意图的个数,Ai为意图集合中第i个意图。其中,用户回答的意图序列长度n和意图集合的意图数k不相关。例如对上述例子,用户回答的意图序列为(AP1:不买车意图;AP2:否定意图)。这里意图种类数根据业务需要制定,例如某场景中k=50,这样就将用户回答文本的无限维空间压缩到用户回答的意图空间50维。
在步骤S103中,构建外呼机器人问题与用户回答意图之间的对应关系。
本发明实施例中,步骤S102得到用户回答的意图序列,在真实的外呼电话中,是通过外呼机器人提问问题和用户回答的循环完成的。一来用户回答即使是相同的意图,在不同的问题节点下的意义也不同。二来在外呼机器人流程管理里,会根据用户回答意图配置不同的跳转流程,问题的序列也会影响最终用户意向的判别。因此,结合外呼机器人的问题序列进行用户意向识别是有必要的。
在一通外呼电话中,外呼机器人的问题序列为预设的问题集合中元素的一种排列。外呼机器人的录音(QS1,QS2,...,QSn)可转为问题序列(QP1,QP2,...,QPn),其中
QPi∈{Q1,Q2,...,Qm}
m为外呼机器人问题集合的问题个数,Qi为问题集合中第i个问题。其中问题序列的长度n和问题结合的问题数m不相关。例如,对上述例子,问题的录音序列(QS1:您好,请问您近期要买车吗?QS2:我们这有优惠活动,要不要给您介绍一下)可转化为问题序列(QP1:是否买车问题;QP2:活动引导问题)。
对于一通完整的电话,特征可以抽取为问题一用户回答意图序列对(pairsequence),可记为((QP1,AP1),(QP2,AP2),...,(QPn,APn)),并且有QPi∈{Q1,Q2,...,Qm},APi∈{A1,A2,...,Ak}。每一条序列对可作为一条完整的特征,由于QPi和APi是离散的特征,因此,编码方式可采取one-hot编码,即将(QPi,APi)这样的对(pair)编码为(k+m)维的向量,因此,编码后的一条样本可转化为n*(k+m)维的二维矩阵。
在步骤S104中,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
本发明实施例中步骤S104中所述用户意向识别模型通过如下步骤进行训练:对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数。
本发明实施例步骤S103中得到了一通完整电话的问题一用户回答意图序列对,并将其编码为维度为n*(k+m)维的二维矩阵。本发明实施例采用基于深度学习的分类模型来对样本进行训练,以得到最终的用户意向识别模型,其中特征提取模块可选取为卷积神经网络(Convolutional Neural Networks,CNN),也可以选长短期记忆人工神经网络(Long-Short Term Memory,LSTM),以及Transfomer模型等,本发明实施例中对此不作限制。作为实施例,这里考虑问题一用户回答意图序列对具有长时序列特征,因此选择LSTM作为分类的神经网络。
本实施例采用的LSTM分类网络的训练方法如下:智能外呼机器人收集到的整通电话带用户意向标注的样本,类别分别标注为明确有意向(0类)、可能有意向(1类)、明确无意向(2类)。
带标注的样本进行训练,其中损失函数采用加权损失函数:
其中,C为分类的类别数目,yj和pj分别代表该样本是否属于第j类的真实标签值(属于则值为1,不属于则值为0),以及该样本通过模型预测得到的属于第j类的概率值。λj、ηj分别是准确率加权系数和召回率加权系数。
本发明实施例中所述意图为整通电话中每个机器人提问问题对应的用户回答的倾向性的分类。所述意向为整通电话完成后,对用户倾向性的分类。
如图2所示,本发明实施例的智能外呼机器人的用户意向识别方法,还可以包括步骤S105:
在步骤S105中,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
其中,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:采用各个分类的类别中概率值最大的一个类别作为用户的意向。
例如,对特定场景下想提高第x类的准确率,则训练模型时可以将损失函数的权重设为:
若对特定场景下想提高第y类的召回率,则训练模型时可以将损失函数的权重设为
式中100为给定的一个例子,也可以根据需要改成不同的值,该值越大,表示模型预测为第x类的准确度或者第y类的召回率越高。
本发明实施例中的分类模型为多标签分类模型,根据上述分类模型的损失函数可以看成有C个标签,每个标签是二分类的问题(是和否);而对本实施例中对每通电话样本,需要得出一个意向,因此可以采用取各标签之间概率值最大的那个标签作为最终结果,因此对任意新来的整通电话样本,通过多标签分类模型预测得出用户意向类别为第z类,即
本发明实施例中分别给出了对高准确率场景和高召回率场景基于修改损失函数的模型训练方式。在实际场景中,对于用户意向的管理系统,针对不同厂商的不同需求场景,分为普通模型、高准确率模型和高召回率模型三种来进行管理,对于某些厂商需求对外呼机器人筛选出的买车高意向客户的准确率要求高时,模型管理选取高准确率模型,对于某些厂商需求对外呼机器人筛选出的买车高意向客户的召回率要求高时,模型管理选取高召回率模型,其余无特殊要求的采用普通模型。
如图3所示,本发明实施例还提供一种智能外呼机器人的用户意向识别装置,包括:文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
本发明实施例中所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
本申请实施例还提供了一种计算设备,参照图4,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
本申请实施例还提供了一种计算机可读存储介质。参照图5,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
A9、如A8所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种智能外呼机器人的用户意向识别方法,包括:
获取整通电话的用户录音,并通过语音识别转成通话文本;
对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;
构建外呼机器人问题与用户回答意图之间的对应关系;
利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
2.如权利要求1所述的方法,还包括:
根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;
利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
3.如权利要求1或2所述的方法,其特征在于,获取整通电话的用户录音,并通过语音识别转成通话文本包括:
对所述用户录音的声道通过静音检测算法得到所述外呼机器人每个提问问题的回答录音,按照所述外呼机器人提问问题的顺序组成回答录音序列;
通过语音识别将用户回答录音序列转录为用户回答文本序列。
4.如权利要求3所述的方法,其中,对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:
利用文本分类模型对所述用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
7.如权利要求1所述的方法,其特征在于,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:
采用各个分类的类别中概率值最大的一个类别作为用户的意向。
8.一种智能外呼机器人的用户意向识别装置,包括:
文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;
意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;
序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;
意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
9.一种计算设备,包括:
至少一个处理器和存储有程序指令的存储器;
当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行如权利要求1-7中任一项所述的智能外呼机器人的用户意向识别方法。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-7中任一项所述的智能外呼机器人的用户意向识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111206048.4A CN113905135B (zh) | 2021-10-14 | 2021-10-14 | 一种智能外呼机器人的用户意向识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111206048.4A CN113905135B (zh) | 2021-10-14 | 2021-10-14 | 一种智能外呼机器人的用户意向识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113905135A true CN113905135A (zh) | 2022-01-07 |
CN113905135B CN113905135B (zh) | 2023-10-20 |
Family
ID=79192551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111206048.4A Active CN113905135B (zh) | 2021-10-14 | 2021-10-14 | 一种智能外呼机器人的用户意向识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113905135B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115134466A (zh) * | 2022-06-07 | 2022-09-30 | 马上消费金融股份有限公司 | 意图识别方法、装置及电子设备 |
CN118233438A (zh) * | 2024-05-27 | 2024-06-21 | 烟台小樱桃网络科技有限公司 | 综合实时音视频多媒体通信平台、系统、管理系统及介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6650738B1 (en) * | 2000-02-07 | 2003-11-18 | Verizon Services Corp. | Methods and apparatus for performing sequential voice dialing operations |
US20160247068A1 (en) * | 2013-11-01 | 2016-08-25 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
CN109104534A (zh) * | 2018-10-22 | 2018-12-28 | 北京智合大方科技有限公司 | 一种提高外呼机器人意图检测准确率、召回率的系统 |
CN109285030A (zh) * | 2018-08-29 | 2019-01-29 | 深圳壹账通智能科技有限公司 | 产品推荐方法、装置、终端及计算机可读存储介质 |
CN110689878A (zh) * | 2019-10-11 | 2020-01-14 | 浙江百应科技有限公司 | 一种基于XLNet的智能语音对话意图识别方法 |
CN111611375A (zh) * | 2019-07-03 | 2020-09-01 | 北京航空航天大学 | 一种基于深度学习和转折关系的文本情感分类方法 |
US20200374589A1 (en) * | 2018-07-04 | 2020-11-26 | Tencent Technology (Shenzhen) Company Limited | User feature generation method and apparatus, device, and computer-readable storage medium |
CN112001186A (zh) * | 2020-08-26 | 2020-11-27 | 重庆理工大学 | 一种利用图卷积神经网络和中文句法的情感分类方法 |
WO2020237869A1 (zh) * | 2019-05-31 | 2020-12-03 | 平安科技(深圳)有限公司 | 一种问题意图识别方法、装置、计算机设备及存储介质 |
AU2019260038A1 (en) * | 2018-04-23 | 2020-12-24 | Mio Ahmed | System and method of operating open ended interactive voice response in any spoken languages |
CN112182252A (zh) * | 2020-11-09 | 2021-01-05 | 浙江大学 | 基于药品知识图谱的智能用药问答方法及其设备 |
CN112989843A (zh) * | 2021-03-17 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 意图识别方法、装置、计算设备及存储介质 |
-
2021
- 2021-10-14 CN CN202111206048.4A patent/CN113905135B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6650738B1 (en) * | 2000-02-07 | 2003-11-18 | Verizon Services Corp. | Methods and apparatus for performing sequential voice dialing operations |
US20160247068A1 (en) * | 2013-11-01 | 2016-08-25 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
AU2019260038A1 (en) * | 2018-04-23 | 2020-12-24 | Mio Ahmed | System and method of operating open ended interactive voice response in any spoken languages |
US20200374589A1 (en) * | 2018-07-04 | 2020-11-26 | Tencent Technology (Shenzhen) Company Limited | User feature generation method and apparatus, device, and computer-readable storage medium |
CN109285030A (zh) * | 2018-08-29 | 2019-01-29 | 深圳壹账通智能科技有限公司 | 产品推荐方法、装置、终端及计算机可读存储介质 |
CN109104534A (zh) * | 2018-10-22 | 2018-12-28 | 北京智合大方科技有限公司 | 一种提高外呼机器人意图检测准确率、召回率的系统 |
WO2020237869A1 (zh) * | 2019-05-31 | 2020-12-03 | 平安科技(深圳)有限公司 | 一种问题意图识别方法、装置、计算机设备及存储介质 |
CN111611375A (zh) * | 2019-07-03 | 2020-09-01 | 北京航空航天大学 | 一种基于深度学习和转折关系的文本情感分类方法 |
CN110689878A (zh) * | 2019-10-11 | 2020-01-14 | 浙江百应科技有限公司 | 一种基于XLNet的智能语音对话意图识别方法 |
CN112001186A (zh) * | 2020-08-26 | 2020-11-27 | 重庆理工大学 | 一种利用图卷积神经网络和中文句法的情感分类方法 |
CN112182252A (zh) * | 2020-11-09 | 2021-01-05 | 浙江大学 | 基于药品知识图谱的智能用药问答方法及其设备 |
CN112989843A (zh) * | 2021-03-17 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 意图识别方法、装置、计算设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
叶铱雷;曹斌;范菁;王俊;陈江斌;: "面向任务型多轮对话的粗粒度意图识别方法", 小型微型计算机系统, no. 08, pages 54 - 60 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115134466A (zh) * | 2022-06-07 | 2022-09-30 | 马上消费金融股份有限公司 | 意图识别方法、装置及电子设备 |
CN118233438A (zh) * | 2024-05-27 | 2024-06-21 | 烟台小樱桃网络科技有限公司 | 综合实时音视频多媒体通信平台、系统、管理系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113905135B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112346567B (zh) | 基于ai的虚拟交互模型生成方法、装置及计算机设备 | |
US10262268B2 (en) | Predictive analytic systems and methods | |
CN110188361A (zh) | 结合文本、语音与情绪特征的语音意图识别方法及装置 | |
CN110580516B (zh) | 一种基于智能机器人的交互方法及装置 | |
CN113905135B (zh) | 一种智能外呼机器人的用户意向识别方法和装置 | |
CN114218488A (zh) | 基于多模态特征融合的信息推荐方法、装置及处理器 | |
CN111091460A (zh) | 一种数据处理方法及装置 | |
CN113297365A (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN116631412A (zh) | 一种通过声纹匹配判断语音机器人的方法 | |
CN115269836A (zh) | 意图识别方法及装置 | |
CN111625629A (zh) | 任务型对话机器人应答方法、装置及机器人、存储介质 | |
CN117952122A (zh) | 用户画像模型的训练方法、对话处理方法及相关设备 | |
CN116049411A (zh) | 一种信息匹配方法、装置、设备和可读存储介质 | |
CN114595318A (zh) | 一种客服回复质量评价方法及系统 | |
CN112002306B (zh) | 语音类别的识别方法、装置、电子设备及可读存储介质 | |
CN111968632B (zh) | 通话语音获取方法、装置、计算机设备和存储介质 | |
CN113313386A (zh) | 汽车金融风险智能语音调查系统及调查方法 | |
CN113806682A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN113434630A (zh) | 客服服务评估方法、装置、终端设备及介质 | |
CN115982657B (zh) | 一种智能外呼客服系统的录音审核分类方法及装置 | |
CN113782022B (zh) | 基于意图识别模型的通信方法、装置、设备及存储介质 | |
CN113284498B (zh) | 客户意图识别方法及装置 | |
CN118133045A (zh) | 语音数据处理方法、装置、设备、存储介质和程序产品 | |
CN116910101A (zh) | 结合深度知识追踪的客服推荐方法、话务系统及计算设备 | |
CN117932070A (zh) | 基于多人会话的用户评估方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |