[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110297928A - 表情图片的推荐方法、装置、设备和存储介质 - Google Patents

表情图片的推荐方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN110297928A
CN110297928A CN201910588794.0A CN201910588794A CN110297928A CN 110297928 A CN110297928 A CN 110297928A CN 201910588794 A CN201910588794 A CN 201910588794A CN 110297928 A CN110297928 A CN 110297928A
Authority
CN
China
Prior art keywords
picture
personage
expression
tag
expression picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910588794.0A
Other languages
English (en)
Inventor
王群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910588794.0A priority Critical patent/CN110297928A/zh
Publication of CN110297928A publication Critical patent/CN110297928A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提出一种表情图片的推荐方法、装置、设备和存储介质,其中的方法包括:确定与目标语音对应的分类标签,分类标签包括人物特点标签和情感标签;从图片数据库中,获取与人物特点标签和情感标签匹配的表情图片;推荐表情图片。本发明实施例的方法可以对目标语音建立多种分类标签,多维度地匹配表情图片,使推荐的表情图片更能体现用户的需求,并提高推荐的合理度,优化用户体验。

Description

表情图片的推荐方法、装置、设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种表情图片的推荐方法、装置、设备和存储介质。
背景技术
随着互联网技术的发展,表情图片逐渐成为互联网用户经常使用和表达意思的方式。表情图片不仅能够充分表达用户情绪,而且能够丰富聊天内容,增强用户对聊天工具的使用时长。对于习惯使用文字输入法和收藏表情图片的用户,使用表情图片是非常方便的。但是对于难以掌握传统文字输入法而进行语音聊天的用户来说,灵活地根据聊天场景使用表情图片是一件较为困难的事情。
发明内容
本发明实施例提供一种表情图片的推荐方法、装置、设备和存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种表情图片的推荐方法,包括:
确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签;
从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片;
推荐所述表情图片。
在一种实施方式中,从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片,包括:
确定各所述分类标签的匹配顺序;
按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
在一种实施方式中,按照所述匹配顺序,从所述图片数据库中获取所述表情图片,包括:
从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
从各所述第一预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第二位的分类标签相匹配。
在一种实施方式中,所述分类标签还包括语义标签,按照所述匹配顺序,从所述图片数据库中获取所述表情图片,包括:
从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
从各所述第一预选图片中,筛选出至少一张第二预选图片,所述第二预选图片与所述匹配顺序为第二位的分类标签相匹配;
从各所述第二预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第三位的分类标签相匹配。
在一种实施方式中,从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片,包括:
判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;
如果未获取到与所述人物特点标签和所述情感标签匹配的表情图片,则根据所述人物特点标签和/或所述情感标签,检索至少一张用于生成所述表情图片的常规图片;
在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
在一种实施方式中,确定与目标语音对应的分类标签,包括:
将所述目标语音转化为对应的文字信息;
从预设的表情词表中,获取与所述文字信息对应的分类标签。
在一种实施方式中,所述人物特点标签包括性格信息、年龄信息和性别信息中的至少一种;所述情感标签中包括情感等级信息和情感类别信息。
在一种实施方式中,确定与目标语音对应的分类标签,包括:
将所述目标语音输入人物特点分类模型,所述人物特点分类模型为根据样本语音及其对应的标注数据训练神经网络模型得到的;
根据所述人物特点分类模型输出的多个预选人物特点标签的概率,确定所述目标语音的人物特点标签。
第二方面,本发明实施例提供一种表情图片的推荐装置,包括:
分类标签确定模块,用于确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签;
表情图片获取模块,用于从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片;
推荐模块,用于推荐所述表情图片。
在一种实施方式中,所述表情图片获取模块包括:
匹配顺序确定子模块,用于确定各所述分类标签的匹配顺序;
表情图片获取子模块,用于按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
在一种实施方式中,所述表情图片获取子模块包括:
第一获取单元,用于从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
第一筛选单元,用于从各所述第一预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第二位的分类标签相匹配。
在一种实施方式中,所述分类标签还包括语义标签,所述表情图片获取子模块包括:
第一获取单元,用于从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
第二获取单元,用于从各所述第一预选图片中,筛选出至少一张第二预选图片,所述第二预选图片与所述匹配顺序为第二位的分类标签相匹配;
第二筛选单元,用于从各所述第二预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第三位的分类标签相匹配。
在一种实施方式中,所述表情图片获取模块包括:
判断子模块,用于判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;
常规图片获取子模块,用于在未获取到与所述人物特点标签和所述情感标签匹配的表情图片的情况下,根据所述人物特点标签和/或所述情感标签,检索至少一张用于生成所述表情图片的常规图片;
生成子模块,用于在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
在一种实施方式中,所述分类标签确定模块包括:
转化子模块,用于将所述目标语音转化为对应的文字信息;
分类标签获取子模块,用于从预设的表情词表中,获取与所述文字信息对应的分类标签。
在一种实施方式中,所述人物特点标签包括性格信息、年龄信息和性别信息中的至少一种;所述情感标签中包括情感等级信息和情感类别信息。
在一种实施方式中,所述分类标签确定模块包括:
输入子模块,用于将所述目标语音输入人物特点分类模型,所述人物特点分类模型为根据样本语音及其对应的标注数据训练神经网络模型得到的;
人物特点标签确定子模块,用于根据所述人物特点分类模型输出的多个预选人物特点标签的概率,确定所述目标语音的人物特点标签。
第三方面,本发明实施例提供了一种表情图片的推荐设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述表情图片的推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储表情图片的推荐设备所用的计算机软件指令,其包括用于执行上述表情图片的推荐方法所涉及的程序。
本发明实施例的标签图片的推荐方法可以对目标语音建立多种分类标签,多维度地匹配表情图片,使推荐的表情图片更能体现用户的需求。其中,人物特点标签可以使推荐的表情图片与用户的人物特点贴合,情感标签可以使推荐的表情图片与用户的情感表达贴合。因此,本发明实施例的表情图片的推荐方法可以提高推荐的合理度,优化用户体验。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的表情图片的推荐方法的流程图。
图2-1示出根据本发明实施例的表情图片的推荐方法的应用场景图。
图2-2示出根据本发明实施例的表情图片的推荐方法的应用场景图。
图2-3示出根据本发明实施例的表情图片的推荐方法的应用场景图。
图3示出根据本发明实施例的一种实施方式的表情图片的推荐方法的流程图。
图4示出根据本发明实施例的另一种实施方式的表情图片的推荐方法的流程图。
图5示出根据本发明实施例的表情图片的推荐装置的结构框图。
图6示出根据本发明实施例的一种实施方式中的表情图片的推荐装置的结构框图。
图7示出根据本发明实施例的另一种实施方式中的表情图片的推荐装置的结构框图。
图8示出根据本发明实施例的表情图片的推荐设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的表情图片的推荐方法的流程图。如图1所示,本发明实施例的表情图片的推荐方法可以包括:
步骤S101、确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签。
在一个示例中,目标语音可以为用户输入的一端语音内容,如“我竟无言以对”的目标语音。例如:可以在用户基于终端设备上提供的窗口或应用程序(Application,APP)输入目标语音时,通过终端设备上集成的录音模块采集用户输入的目标语音。终端设备包括但不限于手机、平板电脑、个人计算机等。图2-1和图2-2示出了本发明实施例中的一个应用场景图。在图2-1中,用户可以使用聊天APP提供的语音输入法,在触发响应的录制功能(如长按“按住说话”的按钮),输入目标语音。在图2-2中,用户正在录制目标语音,可以点击发现表情,触发聊天APP为用户推荐表情图片。
在获取到目标语音后,可以对目标语音进行语音解析,以确定目标语音对应的分类标签。分类标签包括人物特点标签和情感标签。
人物特点标签可以包括性格信息,如“活泼型”、“沉稳型”等;还可以包括年龄信息,如“儿童”、“青年”、“中年”和“老年”;还可以包括性别信息,即“男性”和“女性”。
在一个示例中,可以根据目标语音在音量、音调、音长、语速以及音色等方面的分值,确定该目标语音在每个人物特点标签下的总分,并将总分最高的人物特点标签确定为该目标语音的人物特点标签。在另一个示例中,可以通过人物特点分类模型确定目标语音的人物特点标签。例如:预先设定多个人物特点标签,并对每个样本语音进行人工标注,以确定每个样本语音对应的人物特点标签。基于大量的样本语音及其对应的人工标注的人物特点标签,训练神经网络模型,得到人物特点分类模型。进一步地,将目标语音输入人物特点分类模型,可以得到该目标语音在每个预选人物特点标签下的概率,可以将概率超过预设值的预选人物特点标签作为该目标语音的人物特点标签。
例如:预设值为0.6。对目标语音“人家好喜欢呢”输入人物特点分类模型,可以得到该目标语音在各预选人物特点标签“活泼型”、“沉稳型”、“儿童”、“青年”、“中年”、“老年”、“男性”和“女性”下的概率分别为0.9、0.1、0.2、0.7、0.15、0.05、0和1,确定其对应的人物特点标签为“活泼型青年女性”。
情感标签可以包括情感类别信息。例如:“喜”,可以包括喜爱、喜悦、喜欢、高兴、快乐等情感;“怒”,可以包括愤怒、恼怒、发怒、怨恨、愤恨等情感;“哀”,可以包括悲伤、悲痛、怜悯、哀怜、哀悯、哀愁、哀怨、哀思等情感;“乐”,可以包括欢乐、身心愉悦、充满幸福的情感;“惊”,可以包括惊诧、惊愕、惊慌、惊悸、惊奇、惊叹、惊讶等情感;“恐”,可以包括恐慌、恐惧、害怕、担心、担忧、畏惧等情感;“思”可以包括思念、想念、思慕等情感。情感标签中还可以包括情感等级信息,即情感类别信息对应的情感程度。例如:目标语音“人家好喜欢呢”对应的情感标签为“非常喜”,其中“非常”为情感等级信息。又如:目标语音“能不能别再跟我说话了”对应的情感标签为“非常怒”。
在一个示例中,可以通过情感分类模型确定目标语音的情感标签。对每个样本语音的情感标签进行人工标注,进而基于大量的样本语音及其对应的人工标注的情感标签,训练神经网络模型,得到情感分类模型。将目标语音输入情感分类模型,可以得到该目标语音的情感标签。
在一种实施方式中,在步骤S101中可以包括:将所述目标语音转化为对应的文字信息;从预设的表情词表中,获取与所述文字信息对应的分类标签。本实施例中,图片数据库中可以包括用户自己存储的用作表情的图片或应用服务商提供的表情包中的各种图片。可以为图片数据库中的每张图片标注分类标签,并在表情词表中建立各分类标签与各图片的索引关系。进一步地,可以定期更新表情词表。可以通过语音转文字技术将目标语音转换为相应的文本,并根据文本从表情词表中匹配对应的分类标签,进而得到目标语音的分类标签。
步骤S102、从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片。
在确定目标语音对应的人物特点标签和情感标签后,可以从图片数据库中匹配对应的表情图片。例如:可以根据目标语音“人家好喜欢呢”的人物特点标签“活泼型年轻女性”和情感标签“喜”(或“非常喜”),从图片数据库中匹配对应的表情图片。
步骤S103、推荐所述表情图片。
例如:可以在用户终端设备的聊天APP上的用户界面将表情图片显示给用户。用户可以通过选取推荐的表情图片发送给聊天对象。如图2-3示出了基于本发明实施例的方法确定到表情图片的一个示例的示意图。在图2-3中,聊天APP为用户推荐了多张表情图片(表情图片1、表情图片2、表情图片3和表情图片4),用户可以从这多张表情图片中选择并发送给聊天对象。
在一种实施方式中,如图3所示,在步骤S102中可以包括:
步骤S301、确定各所述分类标签的匹配顺序;
步骤S302、按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
由于存在多种分类标签,在从图片数据库中匹配图片时,可以先确定匹配顺序,然后依次匹配和筛选,进而使推荐的表情图片与目标语音更贴合,更有感染力。其中,匹配顺序可以预先根据经验人工设定,也可以基于大量的样本数据进行训练模型得到。例如:在语音聊天场景下使用表情图片表达情感的需求通常会高于语义,那么可以设置情感标签的匹配顺序先于语义标签和人物特点标签的匹配顺序。又如:在情侣聊天场景中,可以设置人物特点标签的匹配顺序先于语义标签。或者,考虑语义标签可以直接从目标语音转文字得到文本中获取,可以更精准匹配表情图片,那么可以设置语义标签的匹配顺序先于人物特点标签。
在一种实施方式中,在步骤S302中可以包括:从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;从各所述第一预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第二位的分类标签相匹配。
例如:情感标签的匹配顺序为第一位;人物特点标签的匹配顺序为第二位。那么可以从图片数据库中,获取与情感标签匹配的多张图片作为第一预选图片;然后,从多张第一预选图片中,获取与人物特点标签匹配的一张或多种图片作为用于推荐的表情图片。
在一种实施方式中,在步骤S303中可以包括:从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;从各所述第一预选图片中,筛选出至少一张第二预选图片,所述第二预选图片与所述匹配顺序为第二位的分类标签相匹配;从各所述第二预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第三位的分类标签相匹配。
例如:情感标签的匹配顺序为第一位;人物特点标签的匹配顺序为第二位;语义标签的匹配顺序为第三位。那么可以从图片数据库中,获取与情感标签匹配的多张图片作为第一预选图片;然后,从多张第一预选图片中,获取与人物特点标签匹配的一张或多种图片作为第二预选图片;接着,从多张第二预选图片中,获取与语义标签匹配的图片作为用于推荐的表情图片。
在一种实施方式中,如图4所示,在步骤S102中,可以包括:
步骤S401、判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;如果未获取到与所述人物特点标签和所述情感标签匹配的表情图片,则进入步骤S402;
步骤S402、根据所述人物特点标签和/或所述情感标签,检索至少一张用于生成所述表情图片的常规图片;
步骤S403、在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
在获取表情图片的过程中,优先从预设的图片数据库中进行匹配。如果匹配到了表情图片,则推荐该表情图片。当在图片数据库无法找到表情图片时,可以从互联网或其他数据库中检索用于生成表情图片的常规图片,并在检索到的常规图片上添加文字进而生成表情图片,并推荐生成的表情图片。在一个示例中,可以根据目标语音的一种或多种分类标签以及常规图片的描述信息,找到描述信息与该目标语音的一种或多种分类标签的相似度最高的常规图片,然后在该常规图片中添加文字,合成一张图片作为表情图片。
在一个示例中,在步骤S102中,可以包括:步骤S401、判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;如果未获取到与所述人物特点标签和所述情感标签匹配的表情图片,则随机获取至少一张用于生成所述表情图片的常规图片;步骤S403、在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。也就是说,可以随机获取一张用于生成表情图片的常规图片,并在该常规图片中添加文字,以合成一张图片作为表情图片。
本实施例中,添加的文字可以为分类标签的全部信息或部分信息。如果分类标签有多个,则可以预选设定。例如:设定情感标签的情感级别信息和情感类别信息作为添加的文字。
本发明实施例的方法可以对目标语音建立多种分类标签,多维度地匹配表情图片,使推荐的表情图片更能体现用户的需求。其中,人物特点标签可以使推荐的表情图片与用户的人物特点贴合,情感标签可以使推荐的表情图片与用户的情感表达贴合。因此,本发明实施例的表情图片的推荐方法可以提高推荐的合理度,优化用户体验。进一步地,在从图片数据库中获取不到与各分类标签对应的表情图片的情况下,可以在常规图片中添加文字,自动生成表情图片,进而可以提高表情图片的成功率。
图5示出根据本发明实施例的表情图片的推荐装置的结果框图。如图5所示,该装置可以包括:
分类标签确定模块501,用于确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签;
表情图片获取模块502,用于从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片;
推荐模块503,用于推荐所述表情图片。
在一种实施方式中,如图6所示,表情图片获取模块502包括:
匹配顺序确定子模块601,用于确定各所述分类标签的匹配顺序;
表情图片获取子模块602,用于按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
在一种实施方式中,表情图片获取子模块602包括:
第一获取单元,用于从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
第一筛选单元,用于从各所述第一预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第二位的分类标签相匹配。
在一种实施方式中,所述分类标签还包括语义标签,表情图片获取子模块602包括:
第一获取单元,用于从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
第二获取单元,用于从各所述第一预选图片中,筛选出至少一张第二预选图片,所述第二预选图片与所述匹配顺序为第二位的分类标签相匹配;
第二筛选单元,用于从各所述第二预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第三位的分类标签相匹配。
在一种实施方式中,如图7所示,表情图片获取模块502包括:
判断子模块701,用于判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;
常规图片获取子模块702,用于在未获取到与所述人物特点标签和所述情感标签匹配的表情图片的情况下,获取常规图片;
生成子模块703,用于在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
在一种实施方式中,分类标签确定模块501可以包括:
转化子模块,用于将所述目标语音转化为对应的文字信息;
分类标签获取子模块,用于从预设的表情词表中,获取与所述文字信息对应的分类标签。
在一种实施方式中,所述人物特点标签包括性格信息、年龄信息和性别信息中的至少一种;所述情感标签中包括情感等级信息和情感类别信息。
在一种实施方式中,分类标签确定模块501可以包括:
输入子模块,用于将所述目标语音输入人物特点分类模型,所述人物特点分类模型为根据样本语音及其对应的标注数据训练神经网络模型得到的;
人物特点标签确定子模块,用于根据所述人物特点分类模型输出的多个预选人物特点标签的概率,确定所述目标语音的人物特点标签。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图8示出根据本发明实施例的表情图片的推荐设备的结构框图。如图8所示,该设备可以包括:存储器801和处理器802,存储器801内存储有可在处理器802上运行的计算机程序。所述处理器802执行所述计算机程序时实现上述实施例中的表情图片的推荐方法。所述存储器801和处理器802的数量可以为一个或多个。
该设备还可以包括:
通信接口803,用于与外界设备进行通信,进行数据交互传输。
存储器801可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器801、处理器802和通信接口803独立实现,则存储器801、处理器802和通信接口803可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponentInterconnect)总线或扩展工业标准体系结构(EISA,Extended IndustryStandardArchitecture)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器801、处理器802及通信接口803集成在一块芯片上,则存储器801、处理器802及通信接口803可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种表情图片的推荐方法,其特征在于,包括:
确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签;
从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片;
推荐所述表情图片。
2.根据权利要求1所述的推荐方法,其特征在于,从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片,包括:
确定各所述分类标签的匹配顺序;
按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
3.根据权利要求2所述的推荐方法,其特征在于,按照所述匹配顺序,从所述图片数据库中获取所述表情图片,包括:
从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
从各所述第一预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第二位的分类标签相匹配。
4.根据权利要求2所述的推荐方法,其特征在于,所述分类标签还包括语义标签,按照所述匹配顺序,从所述图片数据库中获取所述表情图片,包括:
从所述图片数据库中,获取至少一张第一预选图片,所述第一预选图片与所述匹配顺序为第一位的分类标签相匹配;
从各所述第一预选图片中,筛选出至少一张第二预选图片,所述第二预选图片与所述匹配顺序为第二位的分类标签相匹配;
从各所述第二预选图片中,筛选出至少一张所述表情图片,所述表情图片与所述匹配顺序为第三位的分类标签相匹配。
5.根据权利要求1所述的推荐方法,其特征在于,从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片,包括:
判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;
如果未获取到与所述人物特点标签和所述情感标签匹配的表情图片,则根据所述人物特点标签和/或所述情感标签,检索至少一张用于生成所述表情图片的常规图片;
在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
6.根据权利要求1所述的推荐方法,其特征在于,确定与目标语音对应的分类标签,包括:
将所述目标语音转化为对应的文字信息;
从预设的表情词表中,获取与所述文字信息对应的分类标签。
7.根据权利要求1至6任一项所述的推荐方法,其特征在于,所述人物特点标签包括性格信息、年龄信息和性别信息中的至少一种;所述情感标签中包括情感等级信息和情感类别信息。
8.根据权利要求1至6任一项所述的推荐方法,其特征在于,确定与目标语音对应的分类标签,包括:
将所述目标语音输入人物特点分类模型,所述人物特点分类模型为根据样本语音及其对应的标注数据训练神经网络模型得到的;
根据所述人物特点分类模型输出的多个预选人物特点标签的概率,确定所述目标语音的人物特点标签。
9.一种表情图片的推荐装置,其特征在于,包括:
分类标签确定模块,用于确定与目标语音对应的分类标签,所述分类标签包括人物特点标签和情感标签;
表情图片获取模块,用于从图片数据库中,获取与所述人物特点标签和所述情感标签匹配的表情图片;
推荐模块,用于推荐所述表情图片。
10.根据权利要求9所述的推荐装置,其特征在于,所述表情图片获取模块包括:
匹配顺序确定子模块,用于确定各所述分类标签的匹配顺序;
表情图片获取子模块,用于按照所述匹配顺序,从所述图片数据库中获取所述表情图片。
11.根据权利要求9所述的推荐装置,其特征在于,所述表情图片获取模块包括:
判断子模块,用于判断是否从所述图片数据库中获取到与所述人物特点标签和所述情感标签匹配的表情图片;
常规图片获取子模块,用于在未获取到与所述人物特点标签和所述情感标签匹配的表情图片的情况下,根据所述人物特点标签和/或所述情感标签,检索至少一张用于生成所述表情图片的常规图片;
生成子模块,用于在所述常规图片中添加文字,生成用于推荐的表情图片,所述文字根据至少一种所述分类标签得到。
12.根据权利要求9至11任一项所述的推荐装置,其特征在于,所述人物特点标签包括性格信息、年龄信息和性别信息中的至少一种;所述情感标签中包括情感等级信息和情感类别信息。
13.一种表情图片的推荐设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
CN201910588794.0A 2019-07-02 2019-07-02 表情图片的推荐方法、装置、设备和存储介质 Pending CN110297928A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910588794.0A CN110297928A (zh) 2019-07-02 2019-07-02 表情图片的推荐方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910588794.0A CN110297928A (zh) 2019-07-02 2019-07-02 表情图片的推荐方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN110297928A true CN110297928A (zh) 2019-10-01

Family

ID=68029819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910588794.0A Pending CN110297928A (zh) 2019-07-02 2019-07-02 表情图片的推荐方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110297928A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110798397A (zh) * 2019-10-25 2020-02-14 维沃移动通信有限公司 文件发送方法、装置和电子设备
CN111291184A (zh) * 2020-01-20 2020-06-16 百度在线网络技术(北京)有限公司 表情的推荐方法、装置、设备及存储介质
CN111368127A (zh) * 2020-03-06 2020-07-03 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
CN111460177A (zh) * 2020-03-27 2020-07-28 北京奇艺世纪科技有限公司 影视类表情搜索方法、装置、存储介质、计算机设备
CN112383666A (zh) * 2020-11-09 2021-02-19 维沃移动通信有限公司 内容发送方法、装置和电子设备
CN112634407A (zh) * 2020-12-31 2021-04-09 北京捷通华声科技股份有限公司 绘制图像的方法及装置
CN112650399A (zh) * 2020-12-22 2021-04-13 科大讯飞股份有限公司 表情推荐方法及装置
CN113051427A (zh) * 2019-12-10 2021-06-29 华为技术有限公司 一种表情制作方法和装置
CN114553810A (zh) * 2022-02-22 2022-05-27 广州博冠信息科技有限公司 表情图片合成方法及装置、电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021373A (zh) * 2014-05-27 2014-09-03 江苏大学 一种半监督语音特征可变因素分解方法
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN106297826A (zh) * 2016-08-18 2017-01-04 竹间智能科技(上海)有限公司 语音情感辨识系统及方法
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN107977928A (zh) * 2017-12-21 2018-05-01 广东欧珀移动通信有限公司 表情生成方法、装置、终端及存储介质
US20180130459A1 (en) * 2016-11-09 2018-05-10 Microsoft Technology Licensing, Llc User interface for generating expressive content
CN108701125A (zh) * 2015-12-29 2018-10-23 Mz知识产权控股有限责任公司 用于建议表情符号的系统和方法
CN109302339A (zh) * 2018-09-10 2019-02-01 郭素英 一种带个性化语音实现方法及其平台
CN109460485A (zh) * 2018-10-12 2019-03-12 咪咕文化科技有限公司 一种图像库建立方法、装置和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021373A (zh) * 2014-05-27 2014-09-03 江苏大学 一种半监督语音特征可变因素分解方法
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN108701125A (zh) * 2015-12-29 2018-10-23 Mz知识产权控股有限责任公司 用于建议表情符号的系统和方法
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN106297826A (zh) * 2016-08-18 2017-01-04 竹间智能科技(上海)有限公司 语音情感辨识系统及方法
US20180130459A1 (en) * 2016-11-09 2018-05-10 Microsoft Technology Licensing, Llc User interface for generating expressive content
CN107977928A (zh) * 2017-12-21 2018-05-01 广东欧珀移动通信有限公司 表情生成方法、装置、终端及存储介质
CN109302339A (zh) * 2018-09-10 2019-02-01 郭素英 一种带个性化语音实现方法及其平台
CN109460485A (zh) * 2018-10-12 2019-03-12 咪咕文化科技有限公司 一种图像库建立方法、装置和存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110798397A (zh) * 2019-10-25 2020-02-14 维沃移动通信有限公司 文件发送方法、装置和电子设备
CN113051427A (zh) * 2019-12-10 2021-06-29 华为技术有限公司 一种表情制作方法和装置
US11941323B2 (en) 2019-12-10 2024-03-26 Huawei Technologies Co., Ltd. Meme creation method and apparatus
CN111291184A (zh) * 2020-01-20 2020-06-16 百度在线网络技术(北京)有限公司 表情的推荐方法、装置、设备及存储介质
CN111368127A (zh) * 2020-03-06 2020-07-03 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
CN111368127B (zh) * 2020-03-06 2023-03-24 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
CN111460177A (zh) * 2020-03-27 2020-07-28 北京奇艺世纪科技有限公司 影视类表情搜索方法、装置、存储介质、计算机设备
CN111460177B (zh) * 2020-03-27 2023-12-15 北京奇艺世纪科技有限公司 影视类表情搜索方法、装置、存储介质、计算机设备
CN112383666A (zh) * 2020-11-09 2021-02-19 维沃移动通信有限公司 内容发送方法、装置和电子设备
CN112650399A (zh) * 2020-12-22 2021-04-13 科大讯飞股份有限公司 表情推荐方法及装置
CN112650399B (zh) * 2020-12-22 2023-12-01 科大讯飞股份有限公司 表情推荐方法及装置
CN112634407A (zh) * 2020-12-31 2021-04-09 北京捷通华声科技股份有限公司 绘制图像的方法及装置
CN114553810A (zh) * 2022-02-22 2022-05-27 广州博冠信息科技有限公司 表情图片合成方法及装置、电子设备

Similar Documents

Publication Publication Date Title
CN110297928A (zh) 表情图片的推荐方法、装置、设备和存储介质
Mazzei Following the contour of concepts toward a minor inquiry
Pennington Coding of non-text data
KR101634086B1 (ko) 감정 분석을 통한 스티커 추천 방법 및 시스템
Finlayson et al. Disfluency in dialogue: An intentional signal from the speaker?
KR20160089152A (ko) 화행 분석을 통한 스티커 추천 방법 및 시스템
KR101160193B1 (ko) 감성적 음성합성 장치 및 그 방법
Mackenzie ‘Can we have a child exchange?’Constructing and subverting the ‘good mother’through play in Mumsnet Talk
CN107391575A (zh) 一种基于词向量模型的隐式特征识别方法
CN110689261A (zh) 服务质量评测产品定制平台及方法
CN108470188B (zh) 基于图像分析的交互方法及电子设备
CN106991172B (zh) 一种多模态情感交互数据库的建立方法
US20210065695A1 (en) Program storage medium, method, and apparatus for determining point at which trend of conversation changed
Macaulay Extremely common eloquence: constructing Scottish identity through narrative
Freeman et al. Thematic analysis
CN112364234A (zh) 一种在线讨论的自动分组系统
KR101763679B1 (ko) 화행 분석을 통한 스티커 추천 방법 및 시스템
Herbelot The semantics of poetry: A distributional reading
Tomassini et al. The case for linguistic narrative analysis, illustrated studying small firms in tourism
Hermes et al. Hating Skyler White: audience engagement, gender politics and celebrity culture
CN115982400A (zh) 基于多模态的情绪图像的生成方法和服务器
Badley Autoethnography as practice and process: Toward an honest appraisal?
Leigh et al. Making visible an invisible trade: Exploring the everyday experiences of doing social work and being a social worker
CN117352132A (zh) 心理辅导方法、装置、设备及存储介质
JP2020091800A (ja) 情報処理装置、情報処理方法、および情報提供システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191001