[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110164020A - 投票创建方法、装置、计算机设备及计算机可读存储介质 - Google Patents

投票创建方法、装置、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110164020A
CN110164020A CN201910440402.6A CN201910440402A CN110164020A CN 110164020 A CN110164020 A CN 110164020A CN 201910440402 A CN201910440402 A CN 201910440402A CN 110164020 A CN110164020 A CN 110164020A
Authority
CN
China
Prior art keywords
ballot
text information
live streaming
decoding result
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910440402.6A
Other languages
English (en)
Inventor
郎志东
王晓瑞
张罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910440402.6A priority Critical patent/CN110164020A/zh
Publication of CN110164020A publication Critical patent/CN110164020A/zh
Priority to US16/882,510 priority patent/US11263852B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C13/00Voting apparatus
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种投票创建方法、装置、计算机设备及计算机可读存储介质。通过对用户录入的语音进行识别,基于语音识别和语义识别的结果,准确生成投票的题干和选项,来创建投票,用户无需像以往一样,进行长时间的文字输入操作,能够为用户提供更加快捷的投票创建方式,提高了投票创建效率。

Description

投票创建方法、装置、计算机设备及计算机可读存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及投票创建方法、装置、计算机设备及计算机可读存储介质。
背景技术
在直播过程中进行投票,是主播与观众进行互动的一种重要方式,主播可以根据收到的观众投票结果进行后续直播,例如,在一些游戏直播场景中,主播可以对下一局使用哪个游戏人物发起投票,根据投票结果及时调整直播内容。
目前,在传统的投票创建方式中,主播需要进入投票创建页面,在该投票创建页面以文字形式输入投票的题干和选项,输入完成后,点击确认按钮发起投票。在上述过程中,当投票的题干和选项字数较多时,文字输入操作繁琐,耗时较长,导致投票创建效率低,主播难以快速创建投票。
发明内容
本公开提供一种投票创建方法、装置、计算机设备及计算机可读存储介质,以至少解决相关技术中复制粘贴操作效率低下的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种投票创建方法,包括
接收投票发起指令,获取当前输入的语音信息;
对该语音信息进行语音识别,得到文字信息;
对该文字信息进行语义识别,得到该文字信息中至少两个选项词;
基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票。
在一种可能实现方式中,该对该语音信息进行语音识别,得到文字信息,包括:
对该语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将该多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对该解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为该语音信息对应的文字信息。
在一种可能实现方式中,该将该多个解码结果与多个预设词组进行匹配之前,该方法还包括下述任一项:
当在直播过程中接收到投票发起指令时,获取该直播的直播分区信息,根据该直播分区信息,获取与该直播分区信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取该直播的直播画面,对该直播画面进行图像识别,得到该直播画面中的直播文字信息,获取与该直播文字信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取该直播的直播标题,根据该直播标题,获取与该直播标题对应的多个预设词组。
在一种可能实现方式中,该对该文字信息进行语义识别,得到该文字信息中至少两个选项词,包括:
将该文字信息与预设语法规则进行匹配,得到至少两个选项词,该预设语法规则用于限定创建投票时所采用的句式。
在一种可能实现方式中,该基于该文字信息生成投票的题干部分包括:
确定该文字信息中具有目标词性的词;
将该文字信息中除该具有目标词性的词以外的文字信息作为该投票的题干部分。
在一种可能实现方式中,该基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票之后,该方法还包括:
在直播页面的第一目标区域中,显示所创建投票的预览页面。
根据本公开实施例的第二方面,提供一种投票创建装置,包括:
语音信息获取单元,被配置为接收投票发起指令,获取当前输入的语音信息;
语音识别单元,被配置为对该语音信息进行语音识别,得到文字信息;
语义识别单元,被配置为对该文字信息进行语义识别,得到该文字信息中至少两个选项词;
生成单元,被配置为基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票。
在一种可能实现方式中,该语音识别单元被配置为:
对该语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将该多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对该解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为该语音信息对应的文字信息。
在一种可能实现方式中,该装置还包括下述任一个单元:
第一词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播分区信息,根据该直播分区信息,获取与该直播分区信息对应的多个预设词组;
第二词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播画面,对该直播画面进行图像识别,得到该直播画面中的直播文字信息,获取与该直播文字信息对应的多个预设词组;
第三词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播标题,根据该直播标题,获取与该直播标题对应的多个预设词组。
在一种可能实现方式中,该语义识别单元被配置为:
将该文字信息与预设语法规则进行匹配,得到至少两个选项词,该预设语法规则被配置为限定创建投票时所采用的句式。
在一种可能实现方式中,该生成单元被配置为:
确定该文字信息中具有目标词性的词;
将该文字信息中除该具有目标词性的词以外的文字信息作为该投票的题干部分。
在一种可能实现方式中,该装置还包括:
显示单元,被配置为在直播页面的第一目标区域中,显示所创建投票的预览页面。
根据本公开实施例的第三方面,提供一种计算机设备,包括:
处理器;
用于存储该处理器可执行指令的存储器;
其中,该处理器被配置为执行该指令,以实现如上述任一项投票创建方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当该计算机可读存储介质中的指令由计算机设备的处理器执行时,使得该计算机设备能够执行如上述任一项投票创建方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括可执行指令,当该计算机程序产品中的指令由计算机设备的处理器执行时,使得该计算机设备能够执行如上述任一项投票创建方法。
通过对用户录入的语音进行识别,基于语音识别和语义识别的结果,准确生成投票的题干和选项,来创建投票,用户无需像以往一样,进行长时间的文字输入操作,能够为用户提供更加快捷的投票创建方式,提高了投票创建效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种投票创建方法的流程图;
图2为根据一示例性实施例示出的一种具体的投票创建的实现流程图;
图3是根据一示例性实施例示出的一种直播页面的具体形式示意图;
图4是根据一示例性实施例示出的另一种直播页面的具体形式示意图;
图5是根据一示例性实施例示出的一种简易的语法规则示意图;
图6是根据一示例性实施例示出的一种创建投票的预览页面的具体形式示意图;
图7是根据一示例性实施例示出的一种投票创建装置框图;
图8是根据一示例性实施例示出的一种计算机设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种投票创建方法的流程图,如图1所示,该投票创建方法用于计算机设备中,包括以下步骤。
在步骤101中,接收投票发起指令,获取当前输入的语音信息。
在步骤102中,对该语音信息进行语音识别,得到文字信息。
在步骤103中,对该文字信息进行语义识别,得到该文字信息中至少两个选项词。
在步骤104中,基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票。
本公开提供的实施例,通过对用户录入的语音进行识别,基于语音识别和语义识别的结果,准确生成投票的题干和选项,来创建投票,用户无需像以往一样,进行长时间的文字输入操作,能够为用户提供更加快捷的投票创建方式,提高了投票创建效率。
在一种可能实现方式中,该对该语音信息进行语音识别,得到文字信息,包括:
对该语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将该多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对该解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为该语音信息对应的文字信息。
在一种可能实现方式中,该将该多个解码结果与多个预设词组进行匹配之前,该方法还包括下述任一项:
当在直播过程中接收到投票发起指令时,获取该直播的直播分区信息,根据该直播分区信息,获取与该直播分区信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取该直播的直播画面,对该直播画面进行图像识别,得到该直播画面中的直播文字信息,获取与该直播文字信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取该直播的直播标题,根据该直播标题,获取与该直播标题对应的多个预设词组。
在一种可能实现方式中,该对该文字信息进行语义识别,得到该文字信息中至少两个选项词,包括:
将该文字信息与预设语法规则进行匹配,得到至少两个选项词,该预设语法规则用于限定创建投票时所采用的句式。
在一种可能实现方式中,该基于该文字信息生成投票的题干部分包括:
确定该文字信息中具有目标词性的词;
将该文字信息中除该具有目标词性的词以外的文字信息作为该投票的题干部分。
在一种可能实现方式中,该基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票之后,该方法还包括:
在直播页面的第一目标区域中,显示所创建投票的预览页面。
上述实施例仅是本公开的实施方式的一个简要介绍以及各种可能实现方式的简要介绍。
参见图2,该图2为根据一示例性实施例示出具体的投票创建的实现流程图,具体包括如下步骤:
在步骤201中,计算机设备接收投票发起指令,获取当前输入的语音信息。
该计算机设备上可以安装任一种具有互动功能的应用程序,例如,该应用程序可以用于提供视频共享功能。以直播应用为例,在该直播应用运行过程中,接收到投票发起指令时,该计算机设备可以响应于该投票发起指令,调用相关接口,执行后续投票创建步骤。
其中,该投票发起指令用于指示计算机设备开始创建投票,在本公开实施例中,该投票发起指令还用于提供触发语音采集的功能。
在一种可能实现方式中,该投票发起指令可以由对直播页面上的目标控件的点击操作触发,该目标控件可以为用于指示投票功能入口的控件。参见图3,该图3为根据一示例性实施例示出的一种直播页面的具体形式示意图,该直播页面的具体形式示意图中包括直播画面、直播信息、弹幕互动信息以及功能按键等元素。其中,投票控件301即为可以指示投票功能入口的目标控件,用户可以点击该目标控件,以触发投票发起指令。
该计算机设备接收到投票发起指令后,开启语音采集功能以获取用户输入的语音信息,该计算机设备还可以提供确认按键,以确认用户语音输入操作完成。
该计算机设备开启语音采集功能后,用户可以在目标时长内进行语音输入操作,其中,该目标时长可以由开发人员根据具体任务场景设置。当该计算机设备在目标时长内,检测到对确认按键的点击操作,则认为语音信息输入完成,该计算机设备获取该语音信息后,关闭语音采集功能;当该计算机设备在目标时长内,未检测到对确认按键的点击操作,则认为用户未能在目标时长内完成语音输入,该计算机设备关闭语音采集功能,并提示用户重新输入语音信息。
为了更直观地体现语音输入的具体情况,该计算机设备可以显示当前语音输入时长和声音输入状态等。在一种可能实现方式中,该计算机设备可以在该直播页面的第一目标区域显示语音输入页面,该语音输入页面可以包括语音输入状态显示区域和确认按键。其中,该第一目标区域可以为该直播页面中的任一区域,参见图4,该图4为根据一示例性实施例示出的一种直播页面的具体形式示意图,以该第一目标区域为该直播页面400的右上方区域为例,该第一目标区域401中显示的语音输入页面包括语音输入状态显示区域402和确认按键403。该区域402中的数字用于表示当前语音输入时长,折线形状用于表示输入声音的音量浮动,该确认按键403,用于提供确认语音输入完成的功能。
在上述语音输入过程中,可以对用户使用的句式进行限定,以便降低后续语义识别的复杂度,准确获取投票的题干和选项。在一种可能实现方式中,该计算机设备在检测到用户初次使用投票创建功能时,提示用户在语音输入时使用预设句式,该预设句式可以包括描述投票题干的常用句式,例如,“下一局玩……还是……”、“想看……还是……”等句式。
在步骤202中,该计算机设备对该语音信息进行语音识别,得到文字信息。
该计算机设备将语音信息转换为文字信息,具体包括如下步骤:
步骤一、该计算机设备对该语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值。
其中,该解码结果用于指示该语音信息解码后可能对应的文字信息,在解码过程中可以获取多组该语音信息可能对应的文字信息,即可以获取多个解码结果。
在一种可能实现方式中,首先,该计算机设备对获取的语音信息进行预处理,去除静音等无效语音信息,然后,该计算机设备对该语音信息进行声学特征提取,将提取到的声学特征输入声学模型,得到音素信息,将该音素信息与发音词典进行匹配,得到该音素信息可能对应的多个解码结果,最后,该计算机设备通过语言模型,获取该多个解码结果为正确解码结果的概率值,基于该概率值,对每一个解码结果赋予一个初始分值,该解码结果对应的概率值越大,其初始分值越高。需要说明的是,上述对解码结果获取方式的说明仅是一种解码方式的示例性介绍,本公开实施例对具体采用哪种解码方式获取解码结果不做限定。
步骤二、该计算机设备将该多个解码结果与多个预设词组进行匹配。
其中,该多个预设词组可以由开发人员根据具体任务场景进行设定,在一种可能的实现方式中,该多个预设词组可以包括使用频率较大的热门词组,例如热门网络游戏中的英雄名称、地图名称等。
步骤三、当任一解码结果与至少一个预设词组匹配成功时,该计算机设备对该解码结果对应的初始分值加一奖励分值。
其中,该奖励分值用于表示解码结果与预设词组的匹配情况,该奖励分值可以为预先设置的任一数值。
步骤四、该计算机设备将总分值最高的解码结果作为该语音信息对应的文字信息。
当该多个解码结果与该多个预设词组匹配完成时,该计算机设备对该多个解码结果对应的分值进行比较,获取最高分值对应的解码结果作为该语音信息对应的文字信息。
上述语音识别过程中,通过设置预设词组,以及对包括预设词组的解码结果赋予奖励分值,将分值最高的解码结果作为该语音信息的解码结果,来提高预设词组的输出几率,该预设词组包括热门词组以及投票选项使用频率较大的词组,一般情况下,可以认为投票发起用户想要对热门词组或者投票选项来发起投票,在语音识别过程中,提高该预设词组的输出几率,可以提高语音识别结果的准确度。
在步骤203中,该计算机设备对该文字信息进行语义识别,得到该文字信息中至少两个选项词。
语义识别用于对语音识别过程中获取的文字信息,按照预设语法规则进行整合,以输出更符合语法逻辑文字信息。在本公开实施例中,该计算机设备对文字信息进行语义识别过时,还可以基于预设语法规则,提取该文字信息中的目标词组。在一种可能实现方式中,该计算机设备将该文字信息与预设语法规则进行匹配,得到至少两个选项词,该预设语法规则用于限定创建投票时所采用的句式。
其中,该预设语法规则可以为基于扩展巴科斯范式设计的语法规则,该扩展巴科斯范式可以提供一种通过符号对字符串进行限定的语法规则设计方法。参见图5,该图5为根据一示例性实施例示出的一种简易的语法规则示意图,在该示意图中,一个语法规则可以由多个并列的子语法规则进行定义,该多个子语法规则之间可以通过符号“/”进行分割。在该多个子语法规则中,符号“[]”中的字符串定义为可选内容,即在文字信息与该子语法规则匹配过程中,该符号中的字符串可以无对应匹配内容;符号“<>”中的字符串定义为规则名,为必选内容,在文字信息与该子语法规则匹配过程中,该字符串会被文字信息中对应位置的字符串替换,在本公开实施例中,该文字信息中对应位置的字符串可以作为选项词。
上述计算机设备将该文字信息与预设语法规则进行匹配的过程,可以通过编译器实现,其中,该编译器可以包括词法分析器和语法分析器,该词法分析器用于将文字信息中的字符序列转换为单词序列,该语法分析器可以基于预设语法规则对由多个单词序列构成的文本进行分析并确定其语法结构。该计算机设备可以通过编译器,将该文字信息中的字符串与每一个子语法规则中的字符串进行匹配,当该文字信息与任一个子语法规则匹配成功时,则该计算机设备基于该子语法规则,获取文字信息中与符号“<>”中规则名位置相同的字符串作为选项词。
以图5所示的简易语法规则示意图为例,该计算机设备接收到步骤201中用户按照预设句式录入的语音信息“下一句我玩海岛图还是雪地图呀”,在步骤202中将该语音信息转换为文字信息,由编译器将该文字信息与图5所示的语法规则进行匹配。该计算机设备通过该编译器,将该文字信息与该语法规则中的各个子语法规则进行匹配,其中,子语法规则501中包括两个规则名,即“选项1”和“选项2”,该计算机设备识别到文字信息与该子语法规则匹配成功时,获取该文字信息中与该“选项1”和该“选项2”相对应的两个字符串,即“海岛图”和雪地图,作为选项词。
在步骤204中,该计算机设备基于该至少两个选项词生成投票选项。
在步骤205中,该计算机设备基于该文字信息生成投票的题干部分。
该计算机设备获取该文字信息,基于该文字信息生成投票的题干部分,具体可以通过下述任一种方式实现:
(1)该计算机设备将获取的文字信息作为该投票的题干部分。
通过上述方式,可以快速生成投票的题干部分,降低投票创建的耗时,提高投票创建效率。
(2)该计算机设备对该文字信息进行简化,得到该投票的题干部分。在一种可能实现方式中,具体可以通过以下步骤实现:
步骤一、该计算机设备确定该文字信息中具有目标词性的词。
其中,该目标词性可以由开发人员进行设置,开发人员可以根据具体任务场景设置一个或多个目标词性,例如代词、语气助词等对语义影响较小的词。
步骤二、该计算机设备将该文字信息中除该具有目标词性的词以外的文字信息作为该投票的题干部分。
例如,将目标词性设置为代词和语气助词,当该计算机设备获取到的文字信息为“下一局我玩海岛图还是雪地图呀”时,该计算机设备识别到该文字信息中包括具有目标词性的词,即代词和语气助词,则该计算机设备将该代词和语气助词删除,将剩余文字信息,即“下一局玩海岛图还是雪地图”,作为该投票的题干部分。
通过简化该文字信息,可以精简投票题干部分的文字内容,使投票题干部分的语义更清晰,减少用户阅读题干的时间,提高投票效率。
在本公开实施例中,采用先生成投票选项再生成题干部分的执行顺序进行描述,但在一些可能实施方式中,还可以先执行题干部分的生成,再执行投票选项的生成,或者,两个步骤同时进行,本公开实施例对此不做具体限定。
在步骤206中,该计算机设备基于该投票的题干和该投票选项,创建投票。
该计算机设备将获取的该投票的题干和该投票选项发送至服务器,由服务器创建投票,具体可以通过下述方式实现:
该计算机设备获取到投票题干和投票选项后,向服务器发送投票创建请求,该投票创建请求携带投票题干和投票选项,以将该投票题干和该投票选项发送至服务器,该服务器基于该投票题干和该投票选项,创建投票。该服务器完成创建投票后,将该投票发送至观众端的计算机设备。
为了提高投票创建的准确性,该计算机设备在向服务器发送投票创建请求之前,还可以提供预览功能,该计算机设备检测到用户对该确认按键的点击操作时,向服务器发送投票创建请求。也即是,该方法还包括:该计算机设备获取到投票题干和投票选项后,在直播页面的第一目标区域中,显示所创建投票的预览页面。该创建投票的预览页面包括信息显示区域和确认按键,其中,该信息显示区域用于显示获取的投票题干和投票选项,该投票题干和投票选项均为可修改信息。该功能按键用于提供确认该信息显示区域中显示信息,以及完成投票创建的功能。参见图6,该图6为根据一示例性实施例示出的一种创建投票的预览页面的具体形式示意图,该创建投票的预览页面包括信息显示区域601和确认按键602。
需要说明的是,步骤204到步骤206是基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票的过程,在该过程中,还可以采用基于题干部分和选项,采用其他方式来生成投票,本公开实施例对此不做限定。
通过上述投票创建过程可以看出,本公开实施例提供的方案,通过获取用户录入的语音信息,基于该语音信息自动生成投票题干和投票选项,来创建投票,用户无需像以往一样输入大量文字信息来描述投票题干和投票选项,只需通过说话的方式就可以完成投票的创建,简化了投票创建的流程,降低了投票创建的耗时,提高了创建效率。
对于一些涉及到需要连续操作的直播场景,例如,一些需要实时操控游戏界面的游戏直播场景,用户只需进行简单的语音录入操作,计算机设备就可以自动创建投票,无需打断用户的游戏操作,确保了直播过程的连续性和优质的直播效果。
为降低语音识别中文字信息与多个预设词组匹配的耗时,提高语音识别的效率,在一种可能实现方式中,该计算机设备将该多个解码结果与多个预设词组进行匹配之前,该计算机设备可以基于当前直播,对该多个预设词组进行筛选,获取与当前直播相关的多个预设词组,来与该解码结果进行匹配。具体可以通过下述任一种方式实现:
(1)当在直播过程中接收到投票发起指令时,该计算机设备获取该直播的直播分区信息,根据该直播分区信息,获取与该直播分区信息对应的多个预设词组。
其中,该分区信息用于表示该直播属于哪个直播分区,例如,对于任一个直播应用来说,可以预先设置有多个直播分区,主播在进行直播时,可以从多个直播分区中选择直播分区。对于任一个直播分区来说,可能具有该直播分区所特有的一些热词,因此,可以通过将直播分区和热词之间建立一定的对应关系,从而降低需匹配的词组的数量,提高处理效率。
(2)当在直播过程中接收到投票发起指令时,该计算机设备获取该直播的直播画面,对该直播画面进行图像识别,得到该直播画面中的直播文字信息,获取与该直播文字信息对应的多个预设词组。
其中,该直播文字信息用于确定该直播的直播内容的关键词,例如,对于任一个直播应用来说,主播在进行直播时,可以在直播画面中添加文字信息,来说明当前直播内容,即通过该文字信息可以确定该直播内容的关键词。对于任一个直播内容的关键词来说,可能对应于一些特定的热词,因此,可以基于该直播内容的关键词和热词之间的对应关系,对需匹配的词组进行筛选,从而降低需匹配的词组的数量,提高处理效率。
(3)当在直播过程中接收到投票发起指令时,该计算机设备获取该直播的直播标题,根据该直播标题,获取与该直播标题对应的多个预设词组。
其中,该直播标题可以用于确定该直播的关键词,例如,对于任一个直播应用来说,主播在进行直播时,可以预先设置直播标题,一般情况下,认为该直播标题包括此次直播的关键词。对于任一个直播的关键词来说,可能对应于一些特定的热词,因此,可以基于该直播的关键词和热词之间的对应关系,对需匹配的词组进行筛选,从而降低需匹配的词组的数量,提高处理效率。
通过上述对预设词组进行筛选的过程,可以降低该文字信息与多个预设词组的匹配次数,避免不必要的匹配步骤,提高语音识别效率。
图7是根据一示例性实施例示出的一种投票创建装置框图。参照图7,该装置包括获取单元701、语音识别单元702、语义识别单元703和生成单元704。
语音信息获取单元701,被配置为接收投票发起指令,获取当前输入的语音信息;
语音识别单元702,被配置为对该语音信息进行语音识别,得到文字信息;
语义识别单元703,被配置为对该文字信息进行语义识别,得到该文字信息中至少两个选项词;
生成单元704,被配置为基于该文字信息生成投票的题干部分,基于该至少两个选项词生成投票选项,以创建投票。
在一种可能实现方式中,该语音识别单元702被配置为:
对该语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将该多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对该解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为该语音信息对应的文字信息。
在一种可能实现方式中,该装置还包括下述任一单元:
第一词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播分区信息,根据该直播分区信息,获取与该直播分区信息对应的多个预设词组;
第二词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播画面,对该直播画面进行图像识别,得到该直播画面中的直播文字信息,获取与该直播文字信息对应的多个预设词组;
第三词组获取单元,被配置为当在直播过程中接收到投票发起指令时,获取该直播的直播标题,根据该直播标题,获取与该直播标题对应的多个预设词组。
在一种可能实现方式中,该语义识别单元703被配置为:
将该文字信息与预设语法规则进行匹配,得到至少两个选项词,该预设语法规则被配置为限定创建投票时所采用的句式。
在一种可能实现方式中,该生成单元704被配置为:
确定该文字信息中具有目标词性的词;
将该文字信息中除该具有目标词性的词以外的文字信息作为该投票的题干部分。
在一种可能实现方式中,该装置还包括:
显示单元,被配置为在直播页面的第一目标区域中,显示所创建投票的预览页面。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种计算机设备的框图。该计算机设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)801和一个或一个以上的存储器802,其中,所述存储器802中存储有至少一条指令,所述至少一条指令由所述处理器801加载并执行以实现上述各个方法实施例提供的投票创建方法。当然,该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器804,上述指令可由计算机设备800的处理器820执行以完成上述方法。可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种投票创建方法,其特征在于,包括:
接收投票发起指令,获取当前输入的语音信息;
对所述语音信息进行语音识别,得到文字信息;
对所述文字信息进行语义识别,得到所述文字信息中至少两个选项词;
基于所述文字信息生成投票的题干部分,基于所述至少两个选项词生成投票选项,以创建投票。
2.根据权利要求1所述的投票创建方法,其特征在于,所述对所述语音信息进行语音识别,得到文字信息,包括:
对所述语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将所述多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对所述解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为所述语音信息对应的文字信息。
3.根据权利要求2所述的投票创建方法,其特征在于,所述将所述多个解码结果与多个预设词组进行匹配之前,所述方法还包括下述任一项:
当在直播过程中接收到投票发起指令时,获取所述直播的直播分区信息,根据所述直播分区信息,获取与所述直播分区信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取所述直播的直播画面,对所述直播画面进行图像识别,得到所述直播画面中的直播文字信息,获取与所述直播文字信息对应的多个预设词组;
当在直播过程中接收到投票发起指令时,获取所述直播的直播标题,根据所述直播标题,获取与所述直播标题对应的多个预设词组。
4.根据权利要求1所述的投票创建方法,其特征在于,所述对所述文字信息进行语义识别,得到所述文字信息中至少两个选项词,包括:
将所述文字信息与预设语法规则进行匹配,得到至少两个选项词,所述预设语法规则用于限定创建投票时所采用的句式。
5.根据权利要求1所述的投票创建方法,其特征在于,所述基于所述文字信息生成投票的题干部分包括:
确定所述文字信息中具有目标词性的词;
将所述文字信息中除所述具有目标词性的词以外的文字信息作为所述投票的题干部分。
6.根据权利要求1所述的投票创建方法,其特征在于,所述基于所述文字信息生成投票的题干部分,基于所述至少两个选项词生成投票选项,以创建投票之后,所述方法还包括:
在直播页面的第一目标区域中,显示所创建投票的预览页面。
7.一种投票创建装置,其特征在于,包括:
语音信息获取单元,被配置为接收投票发起指令,获取当前输入的语音信息;
语音识别单元,被配置为对所述语音信息进行语音识别,得到文字信息;
语义识别单元,被配置为对所述文字信息进行语义识别,得到所述文字信息中至少两个选项词;
生成单元,被配置为基于所述文字信息生成投票的题干部分,基于所述至少两个选项词生成投票选项,以创建投票。
8.根据权利要求7所述的投票创建装置,其特征在于,所述语音识别单元被配置为:
对所述语音信息进行解码,得到多个解码结果,每个解码结果对应一个初始分值;
将所述多个解码结果与多个预设词组进行匹配;
当任一解码结果与至少一个预设词组匹配成功时,对所述解码结果对应的初始分值加一奖励分值;
将总分值最高的解码结果作为所述语音信息对应的文字信息。
9.一种计算机设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的投票创建方法。
10.一种计算机可读存储介质,当所述存储介质中的指令由计算机设备的处理器执行时,使得所述计算机设备能够执行如权利要求1至6中任一项所述的投票创建方法。
CN201910440402.6A 2019-05-24 2019-05-24 投票创建方法、装置、计算机设备及计算机可读存储介质 Pending CN110164020A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910440402.6A CN110164020A (zh) 2019-05-24 2019-05-24 投票创建方法、装置、计算机设备及计算机可读存储介质
US16/882,510 US11263852B2 (en) 2019-05-24 2020-05-24 Method, electronic device, and computer readable storage medium for creating a vote

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910440402.6A CN110164020A (zh) 2019-05-24 2019-05-24 投票创建方法、装置、计算机设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110164020A true CN110164020A (zh) 2019-08-23

Family

ID=67632563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910440402.6A Pending CN110164020A (zh) 2019-05-24 2019-05-24 投票创建方法、装置、计算机设备及计算机可读存储介质

Country Status (2)

Country Link
US (1) US11263852B2 (zh)
CN (1) CN110164020A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112351348A (zh) * 2020-11-09 2021-02-09 北京达佳互联信息技术有限公司 直播互动方法、装置、电子设备及存储介质
CN112533068A (zh) * 2020-11-23 2021-03-19 腾讯科技(深圳)有限公司 一种直播投票控制方法、装置、电子设备和存储介质
CN113473161A (zh) * 2020-03-31 2021-10-01 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2317205A1 (en) * 2000-08-31 2002-02-28 Upper Canada Systems Information management system and method
US20120046936A1 (en) * 2009-04-07 2012-02-23 Lemi Technology, Llc System and method for distributed audience feedback on semantic analysis of media content
CN103067754A (zh) * 2012-12-30 2013-04-24 深圳市龙视传媒有限公司 一种电视语音投票方法、系统和终端
CN103369122A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
CN103632332A (zh) * 2013-11-29 2014-03-12 腾讯科技(成都)有限公司 题目问答方法、装置及系统
CN106227813A (zh) * 2016-07-22 2016-12-14 百度在线网络技术(北京)有限公司 用于防止语音投票作弊的方法和装置
CN106653002A (zh) * 2016-12-15 2017-05-10 咪咕数字传媒有限公司 一种文字直播方法及平台
CN107172477A (zh) * 2017-06-16 2017-09-15 广州市百果园信息技术有限公司 投票方法及装置
CN107222757A (zh) * 2017-07-05 2017-09-29 深圳创维数字技术有限公司 一种语音搜索方法、机顶盒、存储介质、服务器和系统
CN107481384A (zh) * 2017-06-30 2017-12-15 珠海市魅族科技有限公司 一种投票方法和装置、计算机装置、可读存储介质
CN107820112A (zh) * 2017-11-15 2018-03-20 安徽声讯信息技术有限公司 一种音频文字直播系统
CN108711422A (zh) * 2018-05-14 2018-10-26 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机可读存储介质和计算机设备
CN108806671A (zh) * 2018-05-29 2018-11-13 杭州认识科技有限公司 语义分析方法、装置及电子设备
CN109474763A (zh) * 2018-12-21 2019-03-15 深圳市智搜信息技术有限公司 一种基于语音、语义的ai智能会议系统及其实现方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPS328502A0 (en) * 2002-07-01 2002-07-18 Right Hemisphere Pty Limited Interactive television voice response system
US20050209859A1 (en) * 2004-01-22 2005-09-22 Porto Ranelli, Sa Method for aiding and enhancing verbal communication
US11153425B2 (en) * 2005-09-01 2021-10-19 Xtone, Inc. System and method for providing interactive services
US20070136776A1 (en) * 2005-12-09 2007-06-14 Michael Findlay Television viewers interation and voting method
US9940626B2 (en) * 2006-06-23 2018-04-10 At&T Intellectual Property I, L.P. Methods and apparatus to provide an electronic agent
US20100263015A1 (en) * 2009-04-09 2010-10-14 Verizon Patent And Licensing Inc. Wireless Interface for Set Top Box
US8678932B2 (en) * 2012-03-12 2014-03-25 Brian M. Alman Online skill competition system with competitive consumer judging and method
US10326964B2 (en) * 2014-08-06 2019-06-18 Smart Blonde Co. Interactive broadcast television
US20190189019A1 (en) * 2015-06-08 2019-06-20 Novel Effect, Inc. System and Method for Integrating Special Effects with a Text Source
US10048842B2 (en) * 2015-06-15 2018-08-14 Google Llc Selection biasing
KR102450853B1 (ko) * 2015-11-30 2022-10-04 삼성전자주식회사 음성 인식 장치 및 방법
US9978367B2 (en) * 2016-03-16 2018-05-22 Google Llc Determining dialog states for language models
CN106251869B (zh) * 2016-09-22 2020-07-24 浙江吉利控股集团有限公司 语音处理方法及装置
WO2019079962A1 (en) * 2017-10-24 2019-05-02 Beijing Didi Infinity Technology And Development Co., Ltd. VOICE RECOGNIZING SYSTEM AND METHOD HAVING DECOUPLING AWAKENING EXPRESSION
US10596471B2 (en) * 2017-12-22 2020-03-24 Activision Publishing, Inc. Systems and methods for enabling audience participation in multi-player video game play sessions
US11017778B1 (en) * 2018-12-04 2021-05-25 Sorenson Ip Holdings, Llc Switching between speech recognition systems

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2317205A1 (en) * 2000-08-31 2002-02-28 Upper Canada Systems Information management system and method
US20120046936A1 (en) * 2009-04-07 2012-02-23 Lemi Technology, Llc System and method for distributed audience feedback on semantic analysis of media content
CN103369122A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
CN103067754A (zh) * 2012-12-30 2013-04-24 深圳市龙视传媒有限公司 一种电视语音投票方法、系统和终端
CN103632332A (zh) * 2013-11-29 2014-03-12 腾讯科技(成都)有限公司 题目问答方法、装置及系统
CN106227813A (zh) * 2016-07-22 2016-12-14 百度在线网络技术(北京)有限公司 用于防止语音投票作弊的方法和装置
CN106653002A (zh) * 2016-12-15 2017-05-10 咪咕数字传媒有限公司 一种文字直播方法及平台
CN107172477A (zh) * 2017-06-16 2017-09-15 广州市百果园信息技术有限公司 投票方法及装置
CN107481384A (zh) * 2017-06-30 2017-12-15 珠海市魅族科技有限公司 一种投票方法和装置、计算机装置、可读存储介质
CN107222757A (zh) * 2017-07-05 2017-09-29 深圳创维数字技术有限公司 一种语音搜索方法、机顶盒、存储介质、服务器和系统
CN107820112A (zh) * 2017-11-15 2018-03-20 安徽声讯信息技术有限公司 一种音频文字直播系统
CN108711422A (zh) * 2018-05-14 2018-10-26 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机可读存储介质和计算机设备
CN108806671A (zh) * 2018-05-29 2018-11-13 杭州认识科技有限公司 语义分析方法、装置及电子设备
CN109474763A (zh) * 2018-12-21 2019-03-15 深圳市智搜信息技术有限公司 一种基于语音、语义的ai智能会议系统及其实现方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113473161A (zh) * 2020-03-31 2021-10-01 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质
CN113473161B (zh) * 2020-03-31 2024-05-24 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质
CN112351348A (zh) * 2020-11-09 2021-02-09 北京达佳互联信息技术有限公司 直播互动方法、装置、电子设备及存储介质
WO2022095532A1 (zh) * 2020-11-09 2022-05-12 北京达佳互联信息技术有限公司 直播互动方法及装置
CN112533068A (zh) * 2020-11-23 2021-03-19 腾讯科技(深圳)有限公司 一种直播投票控制方法、装置、电子设备和存储介质
CN112533068B (zh) * 2020-11-23 2023-11-03 腾讯科技(深圳)有限公司 一种直播投票控制方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US11263852B2 (en) 2022-03-01
US20200286318A1 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
JP4768970B2 (ja) 音声アプリケーション言語タグとともに実装される理解同期意味オブジェクト
JP4768969B2 (ja) 高度対話型インターフェースに対する理解同期意味オブジェクト
CN106796787B (zh) 在自然语言处理中使用先前对话行为进行的语境解释
CN109635270B (zh) 双向概率性的自然语言重写和选择
CN106057206B (zh) 声纹模型训练方法、声纹识别方法及装置
CN105575386B (zh) 语音识别方法和装置
CN108847241A (zh) 将会议语音识别为文本的方法、电子设备及存储介质
CN110164435A (zh) 语音识别方法、装置、设备及计算机可读存储介质
CN109767763B (zh) 自定义唤醒词的确定方法和用于确定自定义唤醒词的装置
CN103559880B (zh) 语音输入系统和方法
CN109246473A (zh) 基于声纹识别的个性化视频弹幕的语音交互方法及终端系统
CN110164020A (zh) 投票创建方法、装置、计算机设备及计算机可读存储介质
CN109086276B (zh) 数据翻译方法、装置、终端及存储介质
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
EP2306451B1 (en) Speech recognition
CN106649253B (zh) 基于后验证的辅助控制方法及系统
CN109119071A (zh) 一种语音识别模型的训练方法及装置
CN111832308A (zh) 语音识别文本连贯性处理方法和装置
CN109979450A (zh) 信息处理方法、装置及电子设备
CN111841007A (zh) 游戏的控制方法、装置、设备和存储介质
CN114417827A (zh) 文本上下文处理方法、装置、电子设备和存储介质
CN111968646A (zh) 一种语音识别方法及装置
CN113488034A (zh) 一种语音信息的处理方法、装置、设备及介质
CN112423000B (zh) 数据处理方法、装置、设备以及介质
KR20190070682A (ko) 강의 콘텐츠 구성 및 제공을 위한 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination