CN117056622A - 语音控制方法及显示设备 - Google Patents
语音控制方法及显示设备 Download PDFInfo
- Publication number
- CN117056622A CN117056622A CN202310856095.6A CN202310856095A CN117056622A CN 117056622 A CN117056622 A CN 117056622A CN 202310856095 A CN202310856095 A CN 202310856095A CN 117056622 A CN117056622 A CN 117056622A
- Authority
- CN
- China
- Prior art keywords
- display
- voice
- target search
- server
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000004891 communication Methods 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 37
- 230000006870 function Effects 0.000 description 27
- 230000003993 interaction Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 241000220225 Malus Species 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 235000021016 apples Nutrition 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 240000005373 Panax quinquefolius Species 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种语音控制方法及显示设备。该方法包括:接收从音频接收元件输入的语音,并根据语音生成语音搜索指令;向服务器发送用户输入的语音搜索指令,其中,语音搜索指令携带有目标搜索词,目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序;接收服务器基于语音搜索指令返回的第一显示指令,第一显示指令是根据标签的显示顺序生成的;响应于第一显示指令,在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。通过上述方式,可以优先展示与目标搜索词关联程度更高的业务类型的资源信息,以降低资源信息的展示顺序不符合用户的搜索意图的可能性,方便用户找到目标资源信息。
Description
本申请是2019年10月22日提出的发明名称为“语音控制方法及显示设备”的中国发明专利申请201911008347.X的分案申请,其全部记载均引用至本申请。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种语音控制方法及显示设备。
背景技术
目前智能电视支持的业务场景越来越多,例如可以支持影视、教育、音乐、应用、购物等业务。由于业务之间存在较多交叉和关联性,同一个目标搜索词可能会对应多种业务类型的资源信息。
现有技术中,主要通过语义分析的方法对用户输入的语音搜索指令进行分析和搜索,从而得出该语音搜索指令中目标搜索词所对应的资源信息。由于同一个目标搜索词可能会对应多种业务类型的资源信息,在向用户展示资源信息时,可以将资源信息根据业务类型分类到预设的标签页面列表中对应的标签页面中。标签页面列表中标签页面的次序是预先设置好的,无论用户输入的语音搜索指令包含何种目标搜索词,标签页面均按照固定次序显示对应的业务类型的资源信息。
然而,目标搜索词虽然可以对应多种业务类型的资源信息,不同的目标搜索词侧重的业务均不相同,标签页面均按照固定次序显示对应的业务类型的资源信息,导致了资源信息的展示顺序往往不符合用户的搜索意图,用户的目标资源排在较后位置,进而使得用户从标签页面列表中找到目标搜索资源的时间大大增加,降低了用户体验。
发明内容
本发明实施例提供一种语音控制方法及显示设备,以解决现有技术中资源信息的展示顺序往往不符合用户的搜索意图的问题。
本发明实施例的第一个方面提供一种语音控制方法,包括:
接收从音频接收元件输入的语音,并根据所述语音生成语音搜索指令;
向服务器发送用户输入的语音搜索指令,其中,所述语音搜索指令携带有目标搜索词,所述目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序,标签的不同的显示顺序对应不同的所述目标搜索词;
接收所述服务器基于所述语音搜索指令返回的第一显示指令,所述第一显示指令是根据所述标签的显示顺序生成的;
响应于所述第一显示指令,在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示所述标签。
本发明实施例的第二个方面提供一种语音控制方法,包括:
接收显示设备发送的语音搜索指令,所述语音搜索指令是根据所述显示设备中音频接收元件输入的语音生成的,所述语音搜索指令携带有目标搜索词;
获取所述目标搜索词对应的业务类型的资源信息;
响应于所述业务类型不少于两种,根据所述目标搜索词调整标签的显示顺序,每个所述标签用于加载一种业务类型的资源信息;
根据所述标签的显示顺序生成第一显示指令;
向所述显示设备推送所述第一显示指令,所述第一显示指令用于指示所述显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示所述标签。
本发明实施例的第三个方面提供一种显示设备,包括:
显示器,该显示器被配置为显示用户界面,该用户界面中还包括指示项目被选择的选择器,可通过用户输入而移动所述选择器在所述用户界面中的位置,以使选择不同的所述项目;
与所述显示屏通信的控制器,所述控制器被配置为:
接收从音频接收元件输入的语音,并根据所述语音生成语音搜索指令;
向服务器发送用户输入的语音搜索指令,其中,所述语音搜索指令携带有目标搜索词,所述目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序,标签的不同的显示顺序对应不同的所述目标搜索词;
接收所述服务器基于所述语音搜索指令返回的第一显示指令,所述第一显示指令是根据所述标签的显示顺序生成的;
响应于所述第一显示指令,在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示所述标签。
本发明实施例的第四个方面提供一种服务器,包括:
存储器和处理器;
所述存储器,用于存储所述处理器的可执行指令;
所述处理器配置为:接收显示设备发送的语音搜索指令,所述语音搜索指令是根据所述显示设备中音频接收元件输入的语音生成的,所述语音搜索指令携带有目标搜索词;
获取所述目标搜索词对应的业务类型的资源信息;
响应于所述业务类型不少于两种,根据所述目标搜索词调整标签的显示顺序,每个所述标签用于加载一种业务类型的资源信息;
根据所述标签的显示顺序生成第一显示指令;
向所述显示设备推送所述第一显示指令,所述第一显示指令用于指示所述显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示所述标签。
本发明的第五个方面提供一种存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行第一方面所述的方法。
本发明的第六个方面提供一种存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行第二方面所述的方法。
本发明实施例提供的语音控制方法及显示设备,显示设备接收从音频接收元件输入的语音,并根据语音生成语音搜索指令;随后,显示设备向服务器发送用户输入的语音搜索指令,其中,语音搜索指令携带有目标搜索词,目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序,标签的不同的显示顺序对应不同的目标搜索词;然后,显示设备接收服务器基于语音搜索指令返回的第一显示指令,响应于第一显示指令,显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。通过上述方法,可以根据目标搜索词调整标签页面的显示顺序,从而可以优先展示与目标搜索词关联程度更高的业务类型的资源信息,以降低资源信息的展示顺序不符合用户的搜索意图的可能性,减少用户从标签页面列表中找到目标搜索资源的时间,提高了用户体验。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种显示设备与控制设备之间操作场景的示意图;
图2为本申请实施例提供的一种显示设备200的硬件配置框图;
图3为本申请实施例提供的一种控制设备100的硬件配置框图;
图4为本申请实施例提供的一种显示设备200的功能配置示意图;
图5a为本申请实施例提供的一种显示设备200中软件配置示意图;
图5b为本申请实施例提供的一种显示设备200中应用程序的配置示意图;
图6为本申请实施例提供的一种语音控制方法的信令交互图;
图7a为本申请实施例提供的一种语音唤醒界面的示意图;
图7b为本申请实施例提供的一种搜索结果界面的示意图;
图8为本申请实施例提供的一种标签显示区域的显示原理示意图;
图9a为本申请实施例提供的一种显示设备的界面示意图;
图9b为本申请实施例提供的另一种显示设备的界面示意图
图10为本申请实施例提供的一种语音控制方法的流程示意图;
图11为本申请实施例提供的另一种语音控制方法的信令交互图;
图12为本申请实施例提供的再一种语音控制方法的信令交互图;
图13为本申请实施例提供的一种文本的显示原理示意图;
图14为本申请实施例提供的再一种显示设备的界面示意图;
图15为本申请实施例提供的一种显示设备的结构示意图;
图16为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请示例性实施例的目的、技术方案和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请中示出的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。
应当理解,本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
本申请中使用的术语“模块”,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
本申请中使用的术语“遥控器”,是指电子设备(如本申请中公开的显示设备)的一个组件,通常可在较短的距离范围内无线控制电子设备。一般使用红外线和/或射频(RF)信号和/或蓝牙与电子设备连接,也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如:手持式触摸遥控器,是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。
本申请中使用的术语“手势”,是指用户通过一种手型的变化或手部运动等动作,用于表达预期想法、动作、目的/或结果的用户行为。
图1为本申请实施例提供的一种显示设备与控制设备之间操作场景的示意图。如图1中示出,用户可通过移动终端300和控制设备100操作显示设备200。
其中,控制设备100可以遥控器,包括红外协议通信或蓝牙协议通信,及其他短距离通信方式等,通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键,语音输入、控制面板输入等输入用户指令,来控制显示设备200。如:用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令,来实现控制显示设备200的功能。
在一些实施例中,也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。该应用程序通过配置可以在与智能设备关联的屏幕上,在直观的用户界面(UI)中为用户提供各种控制。
示例的,移动终端300可与显示设备200安装软件应用,通过网络通信协议实现连接通信,实现一对一控制操作的和数据通信的目的。如:可以实现用移动终端300与显示设备200建立控制指令协议,将遥控控制键盘同步到移动终端300上,通过控制移动终端300上用户界面,实现控制显示设备200的功能。也可以将移动终端300上显示音视频内容传输到显示设备200上,实现同步显示功能。
如图1中还示出,显示设备200还与服务器400通过多种通信方式进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。示例的,显示设备200通过发送和接收信息,以及电子节目指南(EPG)互动,接收软件程序更新,或访问远程储存的数字媒体库。服务器400可以一组,也可以多组,可以一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。
显示设备200,可以液晶显示器、OLED显示器、投影显示设备。具体显示设备类型,尺寸大小和分辨率等不作限定,本领技术人员可以理解的是,显示设备200可以根据需要做性能和配置上一些改变。
显示设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能。示例的包括,网络电视、智能电视、互联网协议电视(IPTV)等。
图2为本申请实施例提供的一种显示设备200的硬件配置框图。如图2中示出,显示设备200中包括控制器210、调谐解调器220、通信接口230、检测器240、输入\输出接口250、视频处理器260-1,音频处理器60-2,显示器280,音频输出270、存储器290,供电电源、红外接收器。
显示器280,用于接收源自视频处理器260-1输入的图像信号,进行显示视频内容和图像以及菜单操控界面的组件。显示器280包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件。显示视频内容,可以来自广播电视内容,也可以是说,可通过有线或无线通信协议接收的各种广播信号。或者,可显示来自网络通信协议接收来自网络服务器端发送的各种图像内容。
同时,显示器280,同时显示显示设备200中产生且用于控制显示设备200的用户操控UI界面。
以及,根据显示器280类型不同,还包括用于驱动显示的驱动组件。或者,倘若显示器280为一种投影显示器,还可以包括一种投影装置和投影屏幕。
通信接口230是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如:通信接口230可以是Wifi芯片231,蓝牙通信协议芯片232,有线以太网通信协议芯片233等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器(图中未示出)。
显示设备200可以通过通信接口230与外部控制设备或内容提供设备之间建立控制信号和数据信号发送和接收。以及,红外接收器,可用于接收控制设备100(如:红外遥控器等)红外控制信号的接口器。
检测器240,是显示设备200用于采集外部环境或与外部交互的信号。检测器240包括光接收器242,用于采集环境光线强度的传感器,可以通过采集环境光可以自适应性显示参数变化等。
以及包括图像采集器241,如相机、摄像头等,可以用于采集外部环境场景,以及用于采集用户的属性或与用户交互手势,可以自适应变化显示参数,也可以识别用户手势,以实现与用户之间互动的功能。
在其他一些示例性实施例中,检测器240,还可温度传感器等,如通过感测环境温度,显示设备200可自适应调整图像的显示色温。如当温度偏高的环境时,可调整显示设备200显示图像色温偏冷色调,或当温度偏低的环境时,可以调整显示设备200显示图像偏暖色调。
在其他一些示例性实施例中,检测器240,还可声音采集器等,如麦克风,可以用于接收用户的声音,包括用户控制显示设备200的控制指令的语音信号,或采集环境声音,用于识别环境场景类型,显示设备200可以自适应适应环境噪声。
输入/输出接口250,在控制器210的控制显示设备200与外部其他设备间数据传输。如接收外部设备的视频信号和音频信号、或命令指令等数据。
其中,输入/输出接口250可以包括,但不限于如下:可以高清多媒体接口HDMI接口251、模拟或数据高清分量输入接口253、复合视频输入接口252、USB输入接口254、RGB端口(图中未示出)等任一个或多个接口。
在其他一些示例性实施例中,输入/输出接口250也可以上述多个接口形成复合性的输入/输出接口。
调谐解调器220,通过有线或无线接收方式接收广播电视信号,可以进行放大、混频和谐振等调制解调处理,从多多个无线或有线广播电视信号中解调出用户所选择电视频道频率中所携带的电视音视频信号,以及EPG数据信号。
调谐解调器220,可根据用户选择,以及由控制器210控制,响应用户选择的电视信号频率以及该频率所携带的电视信号。
调谐解调器220,可以接收信号的途径,根据电视信号广播制式不同,有很多种,诸如:地面广播、有线广播、卫星广播或互联网广播信号等;以及根据调制类型不同,可以数字调制,也可以模拟调制方式。根据接收电视信号种类不同,可以模拟信号和数字信号。
在其他一些示例性实施例中,调谐解调器220也可在外置设备中,如外置机顶盒等。这样,机顶盒通过调制解调后输出电视音视频信号,经过输入/输出接口250输入显示设备200中。
视频处理器260-1,用于将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等等视频处理,可得到直接可显示设备200上显示或播放的信号。
示例的,视频处理器260-1,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。
其中,解复用模块,用于对输入音视频数据流进行解复用处理,如输入MPEG-2,则解复用模块进行解复用成视频信号和音频信号等。
视频解码模块,则用于对解复用后的视频信号进行处理,包括解码和缩放处理等。
图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。
帧率转换模块,用于对转换输入视频帧率,如将60Hz帧率转换为120Hz帧率或240Hz帧率,通常的格式采用如插帧方式实现。
显示格式化模块,则用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
音频处理器260-2,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理,得到可以在扬声器中播放的声音信号。
在其他一些示例性实施例中,视频处理器260-1可以包括一颗或多颗芯片组成。音频处理器260-2,也可以包括一颗或多颗芯片组成。
以及,在其他一些示例性实施例中,视频处理器260-1和音频处理器260-2,可以单独的芯片,也可以于控制器210一起集成在一颗或多颗芯片中。
音频输出270,在控制器210的控制下接收音频处理器260-2输出的声音信号,如:扬声器272,以及除了显示设备200自身携带的扬声器272之外,可以输出至外接设备的发生装置的外接音响输出端子274,如:外接音响接口或耳机接口等。
供电电源,在控制器210控制下,将外部电源输入的电力为显示设备200提供电源供电支持。供电电源可以包括安装显示设备200内部的内置电源电路,也可以是安装在显示设备200外部电源,在显示设备200中提供外接电源的电源接口。
用户输入接口,用于接收用户的输入信号,然后,将接收用户输入信号发送给控制器210。用户输入信号可以是通过红外接收器接收的遥控器信号,可以通过网络通信模块接收各种用户控制信号。
示例的,用户通过遥控器或移动终端300输入用户命令,用户输入接口则根据用户的输入,显示设备200则通过控制器210响应用户的输入。
在一些实施例中,用户可在显示器280上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
控制器210,通过存储在存储器290上中各种软件控制程序,来控制显示设备200的工作和响应用户的操作。
如图2所示,控制器210包括RAM213和ROM214以及图形处理器216、CPU处理器212、通信接口218,如:第一接口218-1到第n接口218-n,以及通信总线。其中,RAM213和ROM214以及图形处理器216、CPU处理器212、通信接口218通过总线相连接。
ROM213,用于存储各种系统启动的指令。如在收到开机信号时,显示设备200电源开始启动,CPU处理器212运行ROM中系统启动指令,将存储在存储器290的操作系统拷贝至RAM213中,以使开始运行启动操作系统。当操作系统启动完成后,CPU处理器212再将存储器290中各种应用程序拷贝至RAM213中,然后,开始运行启动各种应用程序。
图形处理器216,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等。包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象。以及包括渲染器,产生基于运算器得到的各种对象,进行渲染的结果显示在显示器280上。
CPU处理器212,用于执行存储在存储器290中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。
在一些示例性实施例中,CPU处理器212,可以包括多个处理器。多个处理器可包括一个主处理器以及多个或一个子处理器。主处理器,用于在预加电模式中执行显示设备200一些操作,和/或在正常模式下显示画面的操作。多个或一个子处理器,用于在待机模式等状态下一种操作。
控制器210可以控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器280上显示UI对象的用户命令,控制器210便可以执行与由用户命令选择的对象有关的操作。
其中,对象可以是可选对象中的任何一个,例如超链接或图标。与所选择的对象有关操作,例如:显示连接到超链接页面、文档、图像等操作,或者执行与图标相对应程序的操作。用于选择UI对象用户命令,可以是通过连接到显示设备200的各种输入装置(例如,鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。
存储器290,包括存储用于驱动显示设备200的各种软件模块。如:存储器290中存储的各种软件模块,包括:基础模块、检测模块、通信模块、显示控制模块、浏览器模块、和各种服务模块等。
其中,基础模块用于产后护理显示设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块用于从各种传感器或用户输入接口中收集各种信息,并进行数模转换以及分析管理的管理模块。
例如:语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块用于控制显示器280进行显示图像内容的模块,可以用于播放多媒体图像内容和UI界面等信息。通信模块,用于与外部设备之间进行控制和数据通信的模块。浏览器模块,用于执行浏览服务器之间数据通信的模块。服务模块,用于提供各种服务以及各类应用程序在内的模块。
同时,存储器290还用存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。
图3为本申请实施例提供的一种控制设备100的配置框图。如图3所示,控制设备100包括控制器110、通信接口130、用户输入/输出接口140、存储器190、供电电源180。
控制设备100被配置为控制显示设备200,以及可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。如:用户通过操作控制设备100上频道加减键,显示设备200响应频道加减的操作。
在一些实施例中,控制设备100可是一种智能设备。如:控制设备100可根据用户需求安装控制显示设备200的各种应用。
在一些实施例中,如图1所示,移动终端300或其他智能电子设备,可在安装操控显示设备200的应用之后,可以起到控制设备100类似功能。如:用户可以通过安装应用,在移动终端300或其他智能电子设备上可提供的图形用户界面的各种功能键或虚拟按钮,以实现控制设备100实体按键的功能。
控制器110包括处理器112和RAM113和ROM114、通信接口130以及通信总线。控制器110用于控制控制设备100的运行和操作,以及内部各部件之间通信协作以及外部和内部的数据处理功能。
通信接口130在控制器110的控制下,实现与显示设备200之间控制信号和数据信号的通信。如:将接收到的用户输入信号发送至显示设备200上。通信接口130可包括如WiFi芯片131、蓝牙模块132、NFC模块133等其他近场通信模块中至少之一种。
用户输入/输出接口140,其中,输入接口包括麦克风141、触摸板142、传感器143、按键144等其他输入接口中至少一者。如:用户可以通过语音、触摸、手势、按压等动作实现用户指令输入功能,输入接口通过将接收的模拟信号转换为数字信号,以及数字信号转换为相应指令信号,发送至显示设备200。
输出接口包括将接收的用户指令发送至显示设备200的接口。在一些实施例中,可以红外接口,也可以是射频接口。如:红外信号接口时,需要将用户输入指令按照红外控制协议转化为红外控制信号,经红外发送模块进行发送至显示设备200。再如:射频信号接口时,需将用户输入指令转化为数字信号,然后按照射频控制信号调制协议进行调制后,由射频发送端子发送至显示设备200。
在一些实施例中,控制设备100包括通信接口130和输出接口中至少一者。控制设备100中配置通信接口130,如:WiFi、蓝牙、NFC等模块,可将用户输入指令通过WiFi协议、或蓝牙协议、或NFC协议编码,发送至显示设备200。
存储器190,用于在控制器110的控制下存储驱动和控制显示设备200的各种运行程序、数据和应用。存储器190,可以存储用户输入的各类控制信号指令。
供电电源180,用于在控制器110的控制下为控制设备100各元件提供运行电力支持。可以电池及相关控制电路。
图4为本申请实施例提供的一种显示设备200功能配置示意图。如图4所示,存储器290用于存储操作系统、应用程序、内容和用户数据等,在控制器210控制下执行驱动显示设备200的系统运行以及响应用户的各种操作。存储器290可以包括易失性和/或非易失性存储器。
存储器290,具体用于存储驱动显示设备200中控制器210的运行程序,以及存储显示设备200内置各种应用程序,以及用户从外部设备下载的各种应用程序、以及与应用相关各种图形用户界面,以及与图形用户界面相关的各种对象,用户数据信息,以及各种支持应用的内部数据。存储器290用于存储OS内核、中间件和应用等系统软件,以及存储输入的视频数据和音频数据、及其他用户数据。
存储器290,具体用于存储音视频处理器260-1和260-2、显示器280、通信接口230、调谐解调器220、检测器240输入/输出接口等驱动程序和相关数据。
在一些实施例中,存储器290可以存储软件和/或程序,用于表示操作系统(OS)的软件程序包括,例如:内核、中间件、应用编程接口(API)和/或应用程序。示例性的,内核可控制或管理系统资源,或其它程序所实施的功能(如中间件、API或应用程序),以及内核可以提供接口,以允许中间件和API,或应用访问控制器,以实现控制或管理系统资源。
示例的,存储器290,包括广播接收模块2901、频道控制模块2902、音量控制模块2903、图像控制模块2904、显示控制模块2905、音频控制模块2906、外部指令识别模块2907、通信控制模块2908、光接收模块2909、电力控制模块2910、操作系统2911、以及其他应用程序2912、浏览器模块等等,其中,外部指令识别模块2907包括图形识别模块2907-1、语音识别模块2907-2、按键指令识别模块2907-3。控制器210通过运行存储器290中各种软件程序,来执行诸如:广播电视信号接收解调功能、电视频道选择控制功能、音量选择控制功能、图像控制功能、显示控制功能、音频控制功能、外部指令识别功能、通信控制功能、光信号接收功能、电力控制功能、支持各种功能的软件操控平台、以及浏览器功能等其他应用。
图5a为本申请实施例提供的一种显示设备200中软件系统的配置框图。
如图5a中所示,操作系统2911,包括用于处理各种基础系统服务和用于实施硬件相关任务的执行操作软件,充当应用程序和硬件组件之间完成的数据处理的媒介。一些实施例中,部分操作系统内核可以包含一系列软件,用以管理显示设备硬件资源,并为其他程序或软件代码提供服务。
其他一些实施例中,部分操作系统内核可包含一个或多个设备驱动器,设备驱动器可以是操作系统中的一组软件代码,帮助操作或控制显示设备关联的设备或硬件。驱动器可以包含操作视频、音频和/或其他多媒体组件的代码。示例的,包括显示屏、摄像头、Flash、WiFi和音频驱动器。
其中,可访问性模块2911-1,用于修改或访问应用程序,以实现应用程序的可访问性和对其显示内容的可操作性。
通信模块2911-2,用于经由相关通信接口和通信网络与其他外设的连接。
用户界面模块2911-3,用于提供显示用户界面的对象,以供各应用程序可访问,可实现用户可操作性。
控制应用程序2911-4,用于可控制进程管理,包括运行时间应用程序等。
事件传输系统2914,可在操作系统2911内或应用程序2912中实现,以一些实施例中,一方面在在操作系统2911内实现,同时在应用程序2912中实现,用于监听各种用户输入事件,将根据各种事件指代响应各类事件或子事件的识别结果,而实施一组或多组预定义的操作的处理程序。
其中,事件监听模块2914-1,用于监听用户输入接口输入事件或子事件。
事件识别模块2914-2,用于对各种用户输入接口输入各类事件的定义,识别出各种事件或子事件,且将其传输给处理用以执行其相应一组或多组的处理程序。
其中,事件或子事件,是指显示设备200中一个或多个传感器检测的输入,以及外界控制设备(如控制设备100等)的输入。如:语音输入各种子事件,手势识别的手势输入,以及控制设备的遥控按键指令输入的子事件等。示例的,遥控器中一个或多个子事件包括多种形式,包括但不限于按键按上/下/左右/、确定键、按键按住等中一个或组合。以及非实体按键的操作,如移动、按住、释放等操作。
界面布局管理器2913,直接或间接接收来自于事件传输系统2914监听到各用户输入事件或子事件,用于更新用户界面的布局,包括但不限于界面中各控件或子控件的位置,以及容器的大小或位置、层级等与界面布局相关各种执行操作。
图5b为本申请实施例提供的一种显示设备200中应用程序的配置示意图。如图5b中所示,应用程序2912包含也可在显示设备200执行的各种应用程序。应用程序可包含但不限于一个或多个应用程序,如:直播电视应用程序、视频点播应用程序、媒体中心应用程序、应用程序中心、游戏应用等。
直播电视应用程序,可以通过不同的信号源提供直播电视。例如,直播电视应用程可以使用来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及,直播电视应用程序可在显示设备200上显示直播电视信号的视频。
视频点播应用程序,可以提供来自不同存储源的视频。不同于直播电视应用程序,视频点播提供来自某些存储源的视频显示。例如,视频点播可以来自云存储的服务器端、来自包含已存视频节目的本地硬盘储存器。
媒体中心应用程序,可以提供各种多媒体内容播放的应用程序。例如,媒体中心,可以为不同于直播电视或视频点播,用户可通过媒体中心应用程序访问各种图像或音频所提供服务。
应用程序中心,可以提供储存各种应用程序。应用程序可以是一种游戏、应用程序,或某些和计算机系统或其他设备相关但可以在智能电视中运行的其他应用程序。应用程序中心可从不同来源获得这些应用程序,将它们储存在本地储存器中,然后在显示设备200上可运行。
在各个程序的使用过程中,用户均不可避免需要进行资源的搜索,在一些实施例中用户的搜索指令可以通过用户输入接口140中的音频接收元件(例如麦克风)输入,在一些实施例中可以通过用户输入接口140中的按键144输入,例如通过遥控器按键输入。下述实施例以通过麦克风进行语音输入为例。
此外,项目可以表示显示设备200与外接设备连接的接口或接口集合显示,或可表示连接至显示设备的外部设备名称等。如:信号源输入接口集合、或HDMI接口、USB接口、PC端子接口等。
以语音输入为例,目前智能电视支持的业务场景越来越多,例如可以支持影视、教育、音乐、应用、购物等业务。由于业务之间存在较多交叉和关联性,同一个目标搜索词可能会对应多种业务类型的资源信息。现有技术中,主要通过语义分析的方法对用户输入的语音搜索指令进行分析和搜索,从而得出该语音搜索指令中目标搜索词所对应的资源信息。由于同一个目标搜索词可能会对应多种业务类型的资源信息,在向用户展示资源信息时,可以将资源信息根据业务类型分类到预设的标签页面列表中对应的标签页面中。标签页面列表中标签页面的次序是预先设置好的,无论用户输入的语音搜索指令包含何种目标搜索词,标签页面均按照固定次序显示对应的业务类型的资源信息。然而,目标搜索词虽然可以对应多种业务类型的资源信息,不同的目标搜索词侧重的业务均不相同,标签页面均按照固定次序显示对应的业务类型的资源信息,导致了资源信息的展示顺序往往不符合用户的搜索意图,目标资源排在较后位置,进而使得用户从标签页面列表中找到目标搜索资源的时间大大增加,降低了用户体验。
为解决上述问题,本申请实施例提供一种语音控制方法,以降低资源信息的展示顺序不符合用户的搜索意图的可能性。
下面以具体地实施例对本申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图6为本申请实施例提供的一种语音控制方法的信令交互图。本实施例涉及的是根据语音搜索指令确定资源信,的过程。本申请实施例以显示设备和服务器为例,对本申请实施例的方法进行说明。如图6所示,该方法包括:
步骤S101、显示设备接收用户输入的语音,并根据所述语音生成语音搜索指令。
其中,显示设备通过音频接收元件接收用户的语音输入,其中,音频接收元件可为麦克风。
在一些实施例中,用户通过声音采集器输入语音,显示设备根据输入的语音生成语音搜索指令,在一些实施例中,显示设备将输入的语音转换为文本数据,然后通过通信接口230将文本数据发送给语音服务器进行解析。
图7a为本申请实施例提供的一种语音唤醒界面的示意图,如图7a所示,在一些实施例中,在用户按下遥控器的语音按键后,遥控器向显示设备发送第一键值/或第一蓝牙指令,电视根据接收到的第一键值/或第一蓝牙指令,唤出第一语音交互界面,此时第一语音交互界面可以以悬浮层的方式叠加在之前的界面上。
图7b为本申请实施例提供的一种搜索结果界面的示意图,在用户输入语音之后,响应于语音呈现的搜索界面如图7b所示,图7b中示例性示出了根据示例性实施例中显示设备200中界面布局管理器2913在呈现搜索结果时呈现用户界面的示意图。如图7b所示,用户界面包括多个视图显示区,示例的,包括从上向下一次设置的搜索词展示区、标签展示区,资源显示区等,各个视图显示区中包括布局一个或多个不同项目。以及用户界面中还包括指示任一项目被选择的选择器,可通过用户输入而移动选择器的位置,以改变选择不同的项目。
需要说明的是,多个视图显示区可以是可视的的界线,也可以是不可视的界线。如:可通过各视图显示区的背景颜色不同标识不同视图显示区,还可以通过边界线等可视的标识,也可以有不可视的隐形边界。也可以不存在可视的或非可视的边界,而仅在屏幕上显示一定范围区域中相关联项目,具有尺寸和/或排布相同改变属性时,而该一定范围区域则被视同一种视图分区的边界的存在。
在一些实施例中,搜索词显示区用于展示用户输入的搜索指令,也可以在搜索词显示区域的左侧显示用户输入的搜索指令或包含用户输入的搜索指令,在右侧展示推荐的搜索词,反之亦然。其中推荐的搜索词是服务器根据用户的搜名指令得到的。
在一些实施例中,在交互界面中,标签展示区域位于搜索词展示区域(若有)的下侧,或资源显示区的上方,用于按照服务器确定的标签次序展示标签,其中权重最大的展示在区域的左侧,从左向右所有标签按照权重由大道小排布。在标签超过一行时,另起一行展示权重比第一行小的标签。
在一些实施例中,资源显示区位于最底部,资源显示区中包含矩阵式分布的空位,空位可以根据被选中的标签加载被选中的标签对应的业务的资源。在标签切换时,空位释放掉原来的资源重新根据被选中的标签加载被选中的标签对应的业务的资源。
步骤S102、显示设备向服务器发送语音搜索指令。
其中,语音搜索指令携带有目标搜索词。
在本实施例中,显示设备和服务器均具有通信功能,互相之间可以进行交互。该显示设备可以录制用户输入的语音并生成语音搜索指令,通过通信接口并向服务器发送该语音搜索指令。示例性的,显示设备可以同于与之连接的手机接受语音的录入;或者,显示设备可以通过与之连接的遥控器接受语音的录入;或者,显示设备还可以通过本身配置的录音组件接受语音的录入。
在一些实施例中,对于录入的语音,显示设备可利用本地的数据库生成语音搜索指令,也可以先将语音在本地生成文本,并将文本发送给语音服务器来通过语音服务器生成语音指令。
本申请实施例对于用户输入的语音搜索指令所使用的语言不做限制,示例性的,可以为中文、英语、法语等。
目标搜索词,也可以理解为搜索关键词,为语音搜索指令中的关键词词语,其可以为名词,例如:“瑜伽”、“晚霞”等,也可以为地名,例如:“北京”、“莫斯科”等,还可以为影音作品的名称。在语音搜索指令中,可以包含一个目标搜索词,也可以包含多个目标搜索词,本申请实施例对于目标搜索词的数量不做限制。
步骤S103、服务器获取目标搜索词对应的业务类型的资源信息。
在本步骤中,服务器可以访问资源库,资源库中存储有不同业务类型的资源信息,每个目标搜索词均对应至少一个业务类型的资源信息。示例性的,“瑜伽”对应有购物业务的资源信息和影视业务的资源信息,“苹果”对应有购物业务的资源信息、影视业务的资源信息和音乐业务的资源信息。上述目标搜索词对应的业务类型可以预先存储在服务器的内存上,也可以存储在存储设备中,还可以通过语音模型输出目标搜索词对应个业务的概率,其中,语音模型是预先由多个目标搜索词及各词对应的业务类型的语料训练生成的。其中,存储设备与服务器连接,存储设备可以设置在服务器内部,也可以设置在服务器外部。
在一些实施例中,服务器可以预先存储有目标搜索词与资源的业务类型的对应关系,根据目标搜索词与资源的业务类型的对应关系可以确定目标搜索词对应的业务类型的资源信息。在一些实施例中,由用户输入的不确定性,可以通过目标搜索词-资源的业务类型深度学习模型来确定目标搜索词对应的业务类型。
由于业务之间存在较多交叉和关联性,同一个目标搜索词可能对应有不同的业务类型。示例性的,“苹果”既可以对应有影视类型的资源信息,也可以对应有音乐类型的资源信息,还可以对应有购物类型的资源信息;“瑜伽”既可以对应有影视类型的资源信息,也可以对应有购物类型的资源信息。需要说明的是,每种业务类型获取的资源信息可以为一个,也可以为多个,本申请实施例对于资源信息的数量不做限制。
在一些实施例中根据目标搜索词确定目标搜索词对应的业务类型和根据目标搜索词在资源库中进行搜索还可以是并行的两个线程,资源库中的所有媒体资源包含很多业务类型的媒体资源,目标搜索词对应的媒体资源可以能仅对应一种业务类型,也可能对应两种或以上业务类型。
步骤S104、响应于业务类型不少于两种,服务器根据目标搜索词调整标签的显示顺序,每个标签用于加载一种业务类型的资源信息。
在本步骤中,不同业务类型的资源可以放在不同的业务标签类型下或者各个资源中均设置有业务类型的标签。服务器从业务类型的资源中获取目标搜索词对应的资源信息。若目标搜索词对应至少两种业务类型,服务器还需要根据目标搜索词调整标签的显示顺序。
其中,标签可以根据业务类型进行划分,例如可划分为音乐标签、购物标签和小说标签,服务器获取的目标搜索词对应的业务类型的资源信息可以按照对应的业务类型映射到在对应的标签内。例如:影视类型的资源信息可以映射到影视标签内,音乐类型的资源信息可以映射到音乐标签内,购物类型的资源信息可以映射到购物标签内,小说类型的资源信息可以映射到小说标签内。
在一些实施例中,服务器可以根据目标搜索词对应至少两种业务类型的权重大小,调整标签的显示顺序。
其中,本申请实施例对于如何确定目标关键词对应的业务类型的权重不做限制,在一些实施例中,目标搜索词对应的业务类型的权重可以预先设置映射关系,服务器根据预先设置的映射关系调整标签的显示顺序。
示例性的,目标关键词“瑜伽”对应有影视类型和购物类型两种业务类型的资源信息,影视类型的权重预先设置为5,购物类型的权重预先设置为3,相应的,由于影视类型的权重大于购物类型的权重,可以将影视类型的标签排在购物类型的标签前面。
在另一些实施例中,服务器还可以通过语音搜索指令中的非目标关键词和目标关键词之间的依赖关系确定目标搜索词对应的业务类型的权重。
步骤S105、服务器根据标签的显示顺序生成第一显示指令。
在本步骤中,当服务器调整标签的显示顺序后,还可以生成第一显示指令,第一显示指令用于发送给显示设备从而指示显示设备显示标签,其中第一显示设备中包括有标签的显示顺序。
在一些实施例中,服务器还可以获取标签对应的业务类型的资源信息对应的地址,并根据调整显示顺序后的标签和与标签对应的业务类型的资源信息对应的地址生成第一显示指令。
步骤S106、服务器向显示设备推送第一显示指令,第一显示指令用于指示显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
在步骤S106中,在服务器获取目标搜索词对应的业务类型的资源信息并调整标签页面的显示顺序后,可以向显示设备推送第一显示指令,以使显示设备通过标签页面区域按照调整后的显示顺序依次展示标签。
图8为本申请实施例提供的一种标签显示区域的显示原理示意图,在一些实施例中,如图8所示,服务器响应于目标搜索词获得的数据包括TAB数据和搜索结果数据,其中TAB数据包含了需要返回的标签及标签的排序,搜索结果数据包含了TAB数据中的所有标签对应的业务数据及数据和标签的映射关系,服务器可以将搜索结果数据和TAB数据封装为对象简谱(javascriptobject notation,JSON)格式发送给显示设备,显示设备接收到JSON数据后,解析出TAB数据和搜索结果数据,并将TAB数据在标签展示区按照服务器确定的顺序进行显示,并根据焦点对应的标签在资源展示区的空位加载焦点位置处的标签所对应的业务数据(示例性的,包括海报信息),以在不同的空位展示该类型业务下的不同资源。
在一些实施例中搜索结果数据中包含和每一个资源向对应的地址信息,空位可以通过加载地址信息展示资源的海报,海报包括资源的展示图片和标题。
步骤S107、显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
其中,资源展示界面可以包含列表展示区和资源展示区域。位于排序首位的标签被设置为默认的被选中的标签。
在一种可实施方式中,显示设备显示的标签显示区域可以包含获取本次语音搜索中对应的业务类型的标签;在另一种可实施方式中,显示设备显示的标签页面列表可以包含所有业务类型的标签,对于获取到资源信息的标签页面可以显示资源信息的具体数量,对于未获取到资源信息的标签页面可以显示数量为零。
示例性的,以目标搜索词为“瑜伽”为例,“瑜伽”对应有影视类型的资源信息,也对应有购物类型的资源信息。相应的,服务器分别获取“瑜伽”对应的影视类型的资源信息和“瑜伽”对应的购物类型的资源信息。将购物类型的资源信息映射到购物类型的标签中,将影视资源类型的资源信息映射到影视类型的标签中,并根据权重大小,将影视类型的标签排在购物类型的标签之前。随后,服务器可以向显示设备发送第一显示指令,显示设备将“瑜伽”对应的资源信息通过标签显示区域进行展示,同时标签页面列表中影视类型的标签排在购物类型的标签之前。
图9a为本申请实施例提供的一种显示设备的界面示意图。图9b为本申请实施例提供的另一种显示设备的界面示意图。如图9a和9b所示,以目标搜索词为“瑜伽”和“瑜伽教学”为例,显示设备的界面上通过标签显示区域来显示目标搜索词“瑜伽”和“瑜伽教学”相关的资源信息,标签显示区域中的标签可例如:影视、教育、购物平台1、应用、购物平台2等,通过用户点击不同的标签,显示设备在资源显示区可以显示该标签对应的资源信息。
在一些实施例中,标签可以和业务类型采用同样的字段,也可以采用不同的字段,目标搜索词为“瑜伽”时,对应的媒资(媒体资源)库中的媒资包括多重,例如属于影视业务的“功夫瑜伽”,“就是爱瑜伽”等,也有属于教育业务的“瑜伽教程”、“跟我学瑜伽”等,也有属于聚好看购物业务的“瑜伽服”、“瑜伽垫”等,也有属于应用业务的APP资源“每日瑜伽”、“瑜伽入门”,还有属于淘宝购物业务的“瑜伽服”、“瑜伽垫”等。
在一些实施例中,第一显示指令中包含了标签数据和媒资的搜索结果数据,以及标签的次序。其中标签的数据是服务器根据对目标搜索词的业务定位确定的。例如目标搜索词定位在影视业务时,或位于影视业务的概率最大时,影视业务对应的标签影视,排序在第一位,其他位次可以随机排布;也可以根据业务概率大小排布,例如,概率越小越靠后,还可以根据用户历史搜索习惯排布,用户使用频率越低越靠后,用户使用频率最高的排在第二位,不影响业务定位的第一位标签。在一些实施例中,“瑜伽”对应的显示顺序是:影视、教育、聚好看购物、应用、淘宝购物,“瑜伽教学”对应的显示顺序是:应用、教育、聚好看购物、影视、淘宝购物。不同的目标搜索词对应的标签可以相同也可以不同,不同的目标搜索词可以对应不同的标签顺序,不同的标签顺序对应不同的目标搜索词。
在一些可选的实施例中,若第一显示指令包含有与标签对应的业务类型的资源信息对应的地址,显示设备根据地址和被选中的标签,在资源展示界面中的资源展示区域展示与被选中的标签对应的一种业务类型的资源信息。
相应的,显示设备还可以接收用户输入的指令,根据指令中的标识播放或显示对应的资源。示例性的,以智能电视为例,在智能电视上通过标签显示区域显示资源信息,用户可以通过遥控器切换不同标签的选中,资源显示区加载与被选中的标签对应的资源信息,若出现想要播放或显示的资源,用户可以通过遥控器向智能电视输入指令,例如向下的按键键值,可以控制焦点从标签展示区移动到资源展示区的空位上。若智能电视接收到用户输入的确定指令,可以根据指令中的标识从服务器中获取焦点处空位对应的资源,进而播放或显示该资源。
本申请实施例提供的语音控制方法,显示设备接收从音频接收元件输入的语音,并根据语音生成语音搜索指令;随后,显示设备向服务器发送用户输入的语音搜索指令,其中,语音搜索指令携带有目标搜索词,目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序,标签的不同的显示顺序对应不同的目标搜索词;然后,显示设备接收服务器基于语音搜索指令返回的第一显示指令,响应于第一显示指令,显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。通过上述方法,可以根据目标搜索词调整标签页面的显示顺序,从而可以优先展示与目标搜索词关联程度更高的业务类型的资源信息,以降低资源信息的展示顺序不符合用户的搜索意图的可能性,减少用户从标签页面列表中找到目标搜索资源的时间,提高了用户体验。
在上述实施例的基础上,下面对服务器如何调整标签页面的显示顺序进行说明。图10为本申请实施例提供的一种语音控制方法的流程示意图。本实施例涉及的是服务器如何调整标签页面的显示顺序的具体过程。本申请实施例以服务器为执行主体对本实施例的方法进行说明。如图10所示,在上述实施例的基础上,该方法包括:
步骤S201、接收显示设备发送的语音搜索指令,语音搜索指令携带有目标搜索词。
步骤S202、获取目标搜索词对应的业务类型的资源信息。
步骤S201-S202的技术名词、技术效果、技术特征,以及可选实施方式,可参照图6所示的步骤S102-S103理解,对于重复的内容,在此不再累述。
步骤S203、响应于业务类型不少于两种,获取目标搜索词对应各业务类型的权重。
在一些实施例中,服务器可以根据目标搜索词,以及,预设的搜索词与业务类型的权重的映射关系,获取目标搜索词对应各业务类型的权重。
在本实施例中,服务器中可以预先存储有预设的搜索词与业务类型的权重的映射关系,在进行语音搜索时,可以从预先存储的映射关系中找到目标搜索词对应的各业务类型的权重。
示例性性的,若语音搜索指令包括目标搜索词“电脑”,服务器中预先存储有搜索词“电脑”与影视类型的权重、教育类型的权重和购物类型的权重的映射关系。基于此,服务器可以直接从数据库中获取目标搜索词“电脑”对应的影视类型的权重1、教育类型的权重2和购物类型的权重3。
在本实施例中,上述目标搜索词与业务类型的权重的映射关系可以作为目标搜索词的属性信息,在一些实施例中,由用户输入的不确定性,可以通过目标搜索词-业务类型深度学习模型来确定目标搜索词对应的业务类型的权重,在目标搜索词对应多个业务类型时,可以对对应的业务类型按照权重大小进行排序。
在一些实施例中,语音搜索指令除目标搜索词之外,还包括至少一个非目标搜索词,服务器基于目标搜索词和至少一个非目标搜索词之间的依赖关系,获取目标搜索词对应各业务类型的权重。
在本实施例中,仅依照目标搜索词确定各业务类型的权重使可能会产生偏差,因此可以通过非目标搜索词辅助确定业务类型的权重。
上述非目标搜索词,可以为语音搜索指令中出目标搜索词以外的词,非目标搜索词通常可以辅助目标搜索词定位业务类型。非目标搜索词可以为动词,例如“看”,“买”,“学”等,还可以是名字“导演”,“演唱会”,“手提包”等。
其中,上述依赖关系可以预先设置。在一种可选的实施方式中,可以配置修饰词规则,与目标搜索词构成定语关系,并将定语关系作为目标搜索词和非目标搜索词之间的依赖关系。
示例性的,语音搜索指令为“便宜的手机”,其中,目标搜索词为“手机”,非目标搜索词为“便宜的”,根据“手机”和“便宜的”之间的依赖,可以确定购物业务的权重大于或影视业务的权重。相应的,服务器可以将购物业务设置为2,将影视业务的权重设置为1。此外,非目标搜索词“便宜的”还可以辅助目标关键词在对应的业务类型下搜索相关资源信息。
在一些实施例中目标搜索词是指和资源的标题的匹配程度高于预设阈值的词。非目标搜索词是指语音指令中出目标搜索词以外的名称,动词或形容词。
在另一种可选的实施方式中,可以配置动词规则,与目标搜索词构成定语关系,并将定语关系作为目标搜索词和非目标搜索词之间的依赖关系。
示例性的,语音搜索指令为“听小苹果”,其中,目标搜索词为“小苹果”,非目标搜索词为“听”,根据“小苹果”和“听”之间的依赖,可以确定音乐业务的权重大于影视业务的权重。相应的,服务器可以将音乐业务的权重设置为2,将影视业务的权重设置为1。
在本实施例中,语音搜索指令中可能包含多个非目标搜索词。相应的,可以考虑多个非目标搜索词与目标搜索词之间的依赖关系确定非业务类型的权重。
示例性的,语音搜索指令为“我想看钟汉良的何以笙箫默”。首先,确定目标搜索词“何以笙箫默”对应有视频业务。随后,确定“我想”、“看”、“钟汉良的”三个非目标搜索词与目标搜索词“何以笙箫默”的依赖关系,根据非目标搜索词与目标搜索词对应的依赖关系分别确定视频业务的权重a1、a2和a3,汇总三个权重a1、a2和a3,得到视频业务的总权重a;相应的,确定目标搜索词“何以笙箫默”对应有音乐业务。随后,确定“我想”、“看”、“钟汉良的”三个非目标搜索词与目标搜索词“何以笙箫默”的依赖关系,根据非目标搜索词与目标搜索词对应的依赖关系分别确定音乐业务的权重b1、b2和b3,汇总三个权重b1、b2和b3,得到音乐业务的总权重b。
在一些实施例中,上述非目标搜索词与业务类型的对应关系可以作为非目标搜索词的属性信息,在一些实施例中,由用户输入的不确定性,可以通过非目标搜索词-业务类型深度学习模型来确定非目标搜索词对应的业务类型的权重,在非目标搜索词对应多个业务类型时,可以对对应的业务类型按照权重大小进行排序。
在一些实施例中,还可以通过大数据的方式统计非目标搜索词和对应的点击数据以确定非目标搜索词所对应的业务类型的权重。
步骤S204、根据目标搜索词对应各业务类型的权重的大小,调整标签的显示顺序。
在本步骤中,当服务器确定出目标搜索词对应各业务类型的权重的大小,可以将标签按照对应的业务类型的权重的由大到小进行排序,从而按照排序结果调整标签页面的显示顺序。
在一些实施例中,服务器可以根据目标搜索词对应各业务类型的权重,定位目标业务类型;其中,目标业务类型的权重最大;根据目标业务类型,调整标签页面显示顺序,以使目标业务类型对应的标签位于标签页面列表的首位。
示例性的,若“苹果”对应有的音乐类型的权重为3,影视类型的权重为2,购物类型的权重为1。由于音乐类型的权重最高,则可以将音乐类型的定位为目标类型,将其排列在标签的首位。
本实施例对于标签显示区域首位以外的位次的排列顺序不做限制。在一些实施例中,将目标类型的标签排在首位后,后续的标签还可以按照权重由大到小进行排列。在一些实施例,将目标类型的标签排在首位后,后续的标签可以随机排列。在一些实施例,将目标类型的标签排在首位后,还可以将待推荐业务类型对应的标签作为第二位。
示例性的,如附图9a和9b,在附图9a中的标签展示区,“影视”标签位于第一位,然后依次是“教育”、“聚好看沟通”、“应用”、“淘宝购物”等标签,如图9a所示,搜索后的默认焦点位于处于首位的标签上,因此资源展示区会在各个空位下载“影视”标签对应的资源信息。
步骤S205、根据标签的显示顺序生成第一显示指令。
步骤S206、向显示设备推送第一显示指令,第一显示指令用于指示显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
步骤S205-S206的技术名词、技术效果、技术特征,以及可选实施方式,可参照图6所示的步骤S105-S106理解,对于重复的内容,在此不再累述。
本申请实施例提供的语音控制方法,服务器获取目标搜索词对应各业务类型的权重;根据目标搜索词对应各业务类型的权重的大小,调整标签显示顺序。通过使权重最大的目标业务类型的标签排在首页,从而可以优先展示与目标搜索词关联程度更高的业务类型的资源信息,以降低资源信息的展示顺序不符合用户的搜索意图的可能性,减少用户从标签显示区域中找到目标搜索资源的时间,提高了用户体验。
若服务器接收到的语音搜索指令中目标搜索词只对应一种业务类型的资源信息,则显示设备可以直接展示目标搜索词对应的业务类型的资源信息。图11为本申请实施例提供的另一种语音控制方法的信令交互图。本实施例涉及的是服务器如何获取目标搜索词对应的资源信息的具体过程。本申请实施例以服务器为例,对本申请实施例的方法进行说明。如图11所示,在上述实施例的基础上,该方法包括:
步骤S301、显示设备接收从音频接收元件输入的语音,并根据语音生成语音搜索指令。
步骤S302、显示设备向服务器发送语音搜索指令。
步骤S303、服务器获取目标搜索词对应的业务类型的资源信息。
步骤S301-S303的技术名词、技术效果、技术特征,以及可选实施方式,可参照图6所示的步骤S101-S103理解,对于重复的内容,在此不再累述。
步骤S304、响应于业务类型为一种,服务器向显示设备推送第二显示指令,第二显示指令用于指示显示设备在资源展示界面中的标签显示区域展示标签,并根据地址和标签,在资源展示界面中的资源展示区域展示与标签对应的一种业务类型的资源信息。
在本步骤中,若语音搜索指令中的目标搜索词对应一种业务类型,则无需对标签页面的显示顺序进行调整,直接可以向显示设备推送第二显示指令,使显示设备展示目标搜索词对应的业务类型的资源信息。
示例性的,若语音搜索指令中的目标搜索词为“瑜伽”,且该目标搜索词“瑜伽”的属性信息仅对应影视业务,服务器可以直接向显示设备推送第二显示指令,使得显示设备展示关于“瑜伽”的影视业务的资源。
在一些实施例中,若目标搜索词只对应一种业务类型,显示设备解析接收到的JSON数据后,TAB数据仅包含一个标签,因此在标签展示区只展示这一个标签,由于焦点默认在该标签上,因此资源展示区的空位加载该标签对应的资源信息。
在一些实施例中,若目标搜索词只对应一种业务类型,且该业务类型下仅有一个资源信息,显示设备还可以直接显示或播放该资源信息对应的资源。
本申请实施例提供的语音控制方法,服务器响应于业务类型为一种,向显示设备推送第二显示指令,第二显示指令用于指示显示设备通过业务类型对应的标签,展示目标搜索词对应的业务类型的资源信息,从而使得目标搜索词只对应一种业务类型时,显示设备可以直接向用户展示目标搜索词对应的该业务类型的资源信息。
服务器接收到显示设备发送的语音搜索指令后,可以对语音搜索指令进行处理,从而获取目标搜索词。图12为本申请实施例提供的再一种语音控制方法的信令交互图。本实施例涉及的是如何准确获取目标搜索词的具体过程。本申请实施例以显示设备、语音服务器和数据服务器为例,对本申请实施例的方法进行说明。如图12所示,在上述实施例的基础上,该方法包括:
步骤S401、显示设备接收从音频接收元件输入的语音,并将语音发送给语音服务器。
步骤S402、语音服务器根据语音,生成语音对应的文本。
在步骤S401和S402中,显示设备可以通过遥控器上的麦克风或者显示设备本体上的麦克风获取用户输入的语音。随后,显示设备获取到的用户输入的自然语言发送给语音服务器,该语音服务器将该语音转化为对应的文本。
需要说明的是,本申请实施例对于如何将语音转化为对应的文本不做限制,可以为现有的转化方法中的任意一种。
步骤S403、语音服务器向显示设备推送第三显示指令,第三显示指令用于指示显示设备显示语音对应的文本。
图13为本申请实施例提供的一种文本的显示原理示意图,图14为本申请实施例提供的再一种显示设备的界面示意图。示例性的,如图13所示,显示设备在接收到语音服务器发送的第三显示指令后,可以创建语音搜索指令对应的文本的布局文件,随后加载布局文件并初始化布局文件中的文本控制,最后显示语音搜索指令对应的文本。示例性的,如图14所示,若语音搜索指令为“瑜伽”,语音服务器在获取语音搜索指令对应的文本后,可以向显示设备推送第三显示指令,显示设备在接收到第三显示指令后,可以在界面上是标签显示区域显示语音搜索指令对应的文本“瑜伽”。
在一些实施例中,语音服务器和数据服务器可以是同一服务器,第三显示指令在搜索完成后和第一显示指令被同时发送给显示装置。文本可以数据服务器可以直接从语音服务器获取该文本展开搜索。
本申请实施例对于显示设备显示语音搜索指令对应的文本的页面不做限制,可以在语音搜索页面显示语音搜索指令对应的文本,也可以在搜索完成后的标签显示区域页面显示语音搜索指令对应的文本。
通过在显示设备上显示语音搜索指令对应的文本,可以让用户判断语音识别是否准确。当语音识别不准确时,显示设备可以在接收用户输入的再次识别指令后,重新向服务器发送语音搜索指令。
步骤S404、显示设备根据文本生成语音搜索指令发送给数据服务器。
在一些实施例中,数据服务器和语音服务器可以是不同的服务器,用户的语音需要在语音服务器上进行解析,然后将文本返回给显示设备之后再由显示设备发送给数据服务器。
在一些实施例中语音搜索指令还包括显示设备的ID等信息,以使的数据服务器能准确的反馈搜索结果给显示设备。
步骤S405、数据服务器对文本进行分词处理,获取目标搜索词。
在本步骤中,数据服务器在获取语音搜索指令对应的文本后,可以将文本进行分词处理,从而获取目标搜索词。
需要说明的是,本申请实施例对于分词的方法也不做限制,一种可选的实施方式中,可以选用正向最大匹配法。
示例性的,用户输入的语音搜索指令为“我想看瑜伽”,数据服务器接收到语音搜索指令转化为文本后,可以采用最大匹配法将“我想看瑜伽”分解为“我”、“想”、“看”、“瑜伽”。随后,从数据服务器中预存的目标搜索词列表中,可以确定该语音搜索指令对应的目标搜索词为“瑜伽”。
步骤S406、数据服务器获取目标搜索词对应的业务类型的资源信息。
步骤S407、数据服务器响应于业务类型不少于两种,根据目标搜索词调整标签的显示顺序,每个标签被用于显示一种业务类型的资源信息。
步骤S408、数据服务器根据标签的显示顺序生成第一显示指令。
步骤S409、数据服务器向显示设备推送第一显示指令,第一显示指令用于指示显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
步骤S410、显示设备在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
步骤S406至步骤S410的技术名词、技术效果、技术特征,以及可选实施方式,可参照图6所示的步骤S103至步骤S107理解,对于重复的内容,在此不再累述。
本申请实施例提供的语音控制方法,获取语音搜索指令对应的文本,对文本进行分词处理,获取目标搜索词和目标搜索词的属性信息,从而确定资源信息集合。通过提高目标搜索词的准确性,降低了搜索结果与用户意图不符的可能性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图15为本申请实施例提供的一种显示设备的结构示意图。该显示设备可以通过软件、硬件或者两者的结合实现,以执行上述语音控制方法。如图10所示,该显示设备包括:
显示装置51,该显示装置被配置为显示用户界面,该用户界面中还包括指示项目被选择的选择器,可通过用户输入而移动选择器在用户界面中的位置,以使选择不同的项目;
与显示装置通信的控制器52,控制器被配置为:
接收从音频接收元件输入的语音,并根据语音生成语音搜索指令;
向服务器发送用户输入的语音搜索指令,其中,语音搜索指令携带有目标搜索词,目标搜索词被用于在业务类型不少于两种时调整标签的显示顺序,标签的不同的显示顺序对应不同的目标搜索词;
接收服务器基于语音搜索指令返回的第一显示指令,第一显示指令是根据标签的显示顺序生成的;
响应于第一显示指令,在资源展示界面中的标签显示区域按照调整后的显示顺序依次展示标签。
一种可选的实施方式中,第一显示指令包含有与标签对应的业务类型的资源信息对应的地址;
控制器52具体被配置为:根据地址和被选中的标签,在资源展示界面中的资源展示区域展示与被选中的标签对应的一种业务类型的资源信息。
一种可选的实施方式中,若业务类型为一种,则控制器52还被配置为:
接收服务器推送的第二显示指令,响应于第二显示指令,显示设备在资源展示界面中的标签显示区域展示标签,并根据地址和标签,在资源展示界面中的资源展示区域展示与标签对应的一种业务类型的资源信息。
一种可选的实施方式中,控制器52具体被配置为:
向语音服务器发送语音;
接收语音服务器返回的文本,其中文本是语音服务器根据语音生成;
根据文本生成语音搜索指令。
一种可选的实施方式中,控制器52还被配置为:
接收语音服务器推送的第三显示指令,显示设备响应于第三显示指令在资源展示界面中的搜索词显示区域展示语音对应的文本,其中搜索词显示区域,标签展示区域,资源展示区域自上而下依次排布。
一种可选的实施方式中,位于排序首位的标签被设置为默认的被选中的标签。
本申请实施例提供的显示设备,可以执行上述方法实施例中显示设备的动作,其实现原理和技术效果类似,在此不再赘述。
图16为本申请实施例提供的一种服务器的结构示意图。如图16所示,该电子设备可以包括:至少一个处理器61和存储器62。图16示出的是以一个处理器为例的电子设备。
存储器62,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器62可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
处理器61用于执行存储器62存储的计算机执行指令,以实现上述服务器侧的语音控制方法。
其中,处理器61可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果通信接口、存储器62和处理器61独立实现,则通信接口、存储器62和处理器61可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口、存储器62和处理器61集成在一块芯片上实现,则通信接口、存储器62和处理器61可以通过内部接口完成通信。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述第一终端侧的方法或第二终端侧的方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种显示设备,其特征在于,所述方法包括:
显示器,被配置为呈现用户界面,所述用户界面中包括一指示项目被选择的选择器,所述选择器用于接收用户输入而移动在所述用户界面中的位置,以使选择不同的项目;
通信器,被配置为与服务器进行数据和信息的通信;
控制器,被配置为:
响应于用户的语音输入,将处理生成的语音文本数据发送至服务器,所述语音文本数据携带有目标搜索词,以供所述服务器根据所述目标搜索词获取对应的媒体资源数据和标签数据,并且对所述标签数据根据所述目标搜索词进行排序;其中,所述标签信息与业务类型相对应,每一个媒体资源数据对应一个标签数据;
接收所述服务器反馈的第一显示指令,其中所述第一显示指令包括媒体资源数据、标签数据以及标签的排序信息;
控制显示器呈现资源展示界面,其中,按照中各标签的排序信息呈现所述标签,以及,所述选择器默认停留在排序第一位的标签上;以及默认呈现于所述排序第一位的标签对应的媒体资源数据。
2.根据权利要求1所述的显示设备,其特征在于,所述控制器执行响应于用户的语音输入,将处理生成的语音文本数据发送至服务器的同时,进一步被配置为:
响应于用户的语音输入,将处理生成的语音文本数据呈现在显示器上。
3.根据权利要求1所述的显示设备,其特征在于,所述控制器在执行控制显示器呈现资源展示界面,其中,按照中各标签的排序信息呈现所述标签,以及,所述选择器默认停留在排序第一位的标签上;以及默认呈现于所述排序第一位的标签对应的媒体资源数据,进一步被配置为:
在资源展示界面中的标签显示区域按照标签的排序展示所述标签;其中,所述资源展示界面包含标签显示区域和资源显示区域;
根据被选择器选中的标签,在所述资源展示界面中的资源展示区域展示与被选中的标签对应的一种业务类型的资源信息;
所述资源展示区域中包含矩阵式分布的空位,所述空位用于根据被选中的标签加载被选中的标签对应的业务的媒体资源;
在标签切换时,所述空位还用于释放掉原来的资源重新根据被选中的标签加载被选中的标签对应的业务的资源。
4.根据权利要求1所述的显示设备,其特征在于,所述服务器包括语音服务器和数据服务器,所述控制器执行响应于用户的语音输入,将处理生成的语音文本数据发送至服务器,进一步被配置为:
向语音服务器发送所述语音;
接收语音服务器返回的语音文本数据,其中所述语音文本数据是所述语音服务器根据所述语音生成;
将所述语音文本数据发送至所述数据服务器。
5.一种语音控制方法,其特征在于,应用于包括显示器、通信器以及控制器的显示设备,所述显示器被配置为呈现用户界面,所述用户界面中包括一指示项目被选择的选择器,所述选择器用于接收用户输入而移动在所述用户界面中的位置,以使选择不同的项目;所述通信器被配置为与服务器进行数据和信息的通信;
所述方法包括:
响应于用户的语音输入,将处理生成的语音文本数据发送至服务器,所述语音文本数据携带有目标搜索词,以供所述服务器根据所述目标搜索词获取对应的媒体资源数据和标签数据,并且对所述标签数据根据所述目标搜索词进行排序;其中,所述标签信息与业务类型相对应,每一个媒体资源数据对应一个标签数据;
接收所述服务器反馈的第一显示指令,其中所述第一显示指令包括媒体资源数据、标签数据以及标签的排序信息;
控制显示器呈现资源展示界面,其中,按照中各标签的排序信息呈现所述标签,以及,所述选择器默认停留在排序第一位的标签上;以及默认呈现于所述排序第一位的标签对应的媒体资源数据。
6.一种语音控制方法,其特征在于,用于与显示设备进行通信连接的服务器,包括:
接收显示设备发送的语音文本数据,对所述语音文本数据进行语义分析;
当所述语音文本数据携带有目标搜索词时,根据所述目标搜索词获取对应的媒体资源数据和标签数据;以及对所述标签数据根据所述目标搜索词进行排序;其中,所述标签信息与业务类型相对应,每一个媒体资源数据对应一个标签数据;
生成第一显示指令后发送至所述显示设备,其中所述第一显示指令包括媒体资源数据、标签数据以及标签的排序信息;以使得所述显示设备按照中各标签的排序信息在用户界面上呈现所述标签。
7.根据权利要求6所述的方法,其特征在于,根据所述目标搜索词获取对应的媒体资源数据和标签数据;以及对所述标签数据根据所述目标搜索词进行排序,具体包括:
若所述服务器从资源库中获取目标搜索词对应的资源信息;
若所述资源信息对应至少两类业务类型,则根据目标搜索词调整标签的显示顺序。
8.根据权利要求7所述的方法,其特征在于,所述根据目标搜索词对所述标签进行排序,具体包括:
在所述服务器中可以预先存储有预设的搜索词与业务类型的权重的映射关系;
在解析出所述语音文本数据中包括目标搜索词时,从预先存储的映射关系中找到目标搜索词对应的各业务类型的权重。
9.根据权利要求7所述的方法,其特征在于,所述根据目标搜索词对所述标签进行排序,具体包括:
解析出所述语音文本数据中包括目标搜索词时以及至少一个非目标搜索词;
基于目标搜索词和至少一个非目标搜索词之间的依赖关系,获取目标搜索词对应各业务类型的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310856095.6A CN117056622A (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310856095.6A CN117056622A (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
CN201911008347.XA CN110737840B (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911008347.XA Division CN110737840B (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117056622A true CN117056622A (zh) | 2023-11-14 |
Family
ID=69270891
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911008347.XA Active CN110737840B (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
CN202310856095.6A Pending CN117056622A (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911008347.XA Active CN110737840B (zh) | 2019-10-22 | 2019-10-22 | 语音控制方法及显示设备 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN110737840B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111324800B (zh) * | 2020-02-12 | 2023-04-21 | 腾讯科技(深圳)有限公司 | 业务事项展示方法、装置和计算机可读存储介质 |
CN113542899B (zh) * | 2020-04-22 | 2024-10-18 | 聚好看科技股份有限公司 | 信息展示方法、显示设备、服务器 |
CN113542900B (zh) * | 2020-04-22 | 2023-02-17 | 聚好看科技股份有限公司 | 媒资信息展示方法及显示设备 |
CN111552794B (zh) * | 2020-05-13 | 2023-09-19 | 海信电子科技(武汉)有限公司 | 提示语生成方法、装置、设备和存储介质 |
CN113805738B (zh) * | 2020-06-12 | 2023-11-14 | 海信视像科技股份有限公司 | 一种控制按键的自定义设置方法、启动方法及显示设备 |
CN112000820A (zh) * | 2020-08-10 | 2020-11-27 | 海信电子科技(武汉)有限公司 | 一种媒资推荐方法及显示设备 |
CN112004157B (zh) * | 2020-08-11 | 2022-06-21 | 海信电子科技(武汉)有限公司 | 一种多轮语音交互方法及显示设备 |
WO2022066692A1 (en) | 2020-09-22 | 2022-03-31 | VIDAA USA, Inc. | Display apparatus |
CN112165641A (zh) * | 2020-09-22 | 2021-01-01 | Vidaa美国公司 | 一种显示设备 |
CN112185339A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种用于供电智能客户的语音合成处理方法及系统 |
CN114372214A (zh) * | 2020-10-15 | 2022-04-19 | 海信电子科技(武汉)有限公司 | 一种显示设备、服务器和内容展示方法 |
CN112989238B (zh) * | 2020-10-21 | 2024-08-27 | 深圳市乐讯科技有限公司 | 一种基于用户习惯的快速呈现页面的方法 |
CN112417271B (zh) * | 2020-11-09 | 2023-09-01 | 杭州讯酷科技有限公司 | 一种带有字段推荐的系统智能构建方法 |
CN112883225B (zh) * | 2021-02-02 | 2022-10-11 | 聚好看科技股份有限公司 | 一种媒体资源搜索、显示方法及设备 |
CN113490041B (zh) * | 2021-06-30 | 2023-05-05 | Vidaa美国公司 | 语音功能切换方法及显示设备 |
CN113077858B (zh) * | 2021-03-19 | 2022-11-29 | 海信视像科技股份有限公司 | 显示设备控件的控制方法、显示设备及服务器 |
CN113158004A (zh) * | 2021-04-29 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 数据搜索处理方法、装置、电子设备和存储介质 |
CN113593559B (zh) * | 2021-07-29 | 2024-05-17 | 海信视像科技股份有限公司 | 一种内容显示方法、显示设备及服务器 |
CN113707145A (zh) * | 2021-08-26 | 2021-11-26 | 海信视像科技股份有限公司 | 显示设备及语音搜索方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102040781B1 (ko) * | 2012-03-16 | 2019-11-06 | 구글 엘엘씨 | 리소스들을 다운로드하기 전에 정보를 제공하는 방법 |
US20140052450A1 (en) * | 2012-08-16 | 2014-02-20 | Nuance Communications, Inc. | User interface for entertainment systems |
CN102929924A (zh) * | 2012-09-20 | 2013-02-13 | 百度在线网络技术(北京)有限公司 | 一种基于浏览内容的取词搜索结果生成方法及装置 |
CN102833610B (zh) * | 2012-09-24 | 2015-05-13 | 北京多看科技有限公司 | 一种节目选择的方法、装置及数字电视终端 |
KR102030114B1 (ko) * | 2013-01-07 | 2019-10-08 | 삼성전자주식회사 | 서버 및 그의 제어 방법 |
CN105320706B (zh) * | 2014-08-05 | 2018-10-09 | 阿里巴巴集团控股有限公司 | 搜索结果的处理方法和装置 |
CN104462262B (zh) * | 2014-11-21 | 2017-10-31 | 北京奇虎科技有限公司 | 一种实现语音搜索的方法、装置和浏览器客户端 |
CN104462510B (zh) * | 2014-12-22 | 2018-09-11 | 北京奇虎科技有限公司 | 基于用户搜索意图的搜索方法及装置 |
CN104462576B (zh) * | 2014-12-29 | 2019-02-26 | 北京奇虎科技有限公司 | 基于标签页提供音乐综合搜索的方法和装置 |
CN106303667A (zh) * | 2016-07-29 | 2017-01-04 | 乐视控股(北京)有限公司 | 语音搜索方法及装置、终端设备 |
CN106469210A (zh) * | 2016-09-02 | 2017-03-01 | 腾讯科技(深圳)有限公司 | 媒体类别标签的展示方法和装置 |
CN109271533A (zh) * | 2018-09-21 | 2019-01-25 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法 |
CN109618206B (zh) * | 2019-01-24 | 2021-11-05 | 海信视像科技股份有限公司 | 呈现用户界面的方法和显示设备 |
CN110309266A (zh) * | 2019-07-05 | 2019-10-08 | 拉扎斯网络科技(上海)有限公司 | 对象搜索方法、装置、电子设备及存储介质 |
-
2019
- 2019-10-22 CN CN201911008347.XA patent/CN110737840B/zh active Active
- 2019-10-22 CN CN202310856095.6A patent/CN117056622A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN110737840A (zh) | 2020-01-31 |
CN110737840B (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110737840B (zh) | 语音控制方法及显示设备 | |
CN109618206B (zh) | 呈现用户界面的方法和显示设备 | |
CN111291265B (zh) | 一种推荐信息生成方法及装置 | |
CN112163086B (zh) | 多意图的识别方法、显示设备 | |
CN111949782B (zh) | 一种信息推荐方法和服务设备 | |
CN112511882B (zh) | 一种显示设备及语音唤起方法 | |
CN112463269B (zh) | 用户界面显示方法及显示设备 | |
CN112000820A (zh) | 一种媒资推荐方法及显示设备 | |
CN110659010A (zh) | 一种画中画显示方法以及显示设备 | |
CN111984763B (zh) | 一种答问处理方法及智能设备 | |
CN110675872A (zh) | 基于多系统显示设备的语音交互方法及多系统显示设备 | |
CN111526402A (zh) | 多屏显示设备的语音搜索视频资源的方法及显示设备 | |
WO2022032916A1 (zh) | 一种显示系统 | |
CN111770370A (zh) | 显示设备、服务器及媒资推荐的方法 | |
CN109597929A (zh) | 搜索结果的展示方法、装置、终端及可读介质 | |
CN112380420A (zh) | 一种搜索方法及显示设备 | |
CN112165641A (zh) | 一种显示设备 | |
CN111866568B (zh) | 一种显示设备、服务器及基于语音的视频集锦获取方法 | |
CN111914134B (zh) | 一种关联推荐方法、智能设备及服务设备 | |
CN111083538A (zh) | 一种背景图像的显示方法及设备 | |
CN113542899B (zh) | 信息展示方法、显示设备、服务器 | |
CN113468351A (zh) | 一种智能设备及图像处理方法 | |
CN111950288B (zh) | 一种命名实体识别中的实体标注方法及智能设备 | |
CN112199560B (zh) | 一种设置项的搜索方法及显示设备 | |
CN112929717B (zh) | 一种焦点管理的方法及显示设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |