[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111782045A - 一种设备角度调节方法、装置、智能音箱及存储介质 - Google Patents

一种设备角度调节方法、装置、智能音箱及存储介质 Download PDF

Info

Publication number
CN111782045A
CN111782045A CN202010614614.4A CN202010614614A CN111782045A CN 111782045 A CN111782045 A CN 111782045A CN 202010614614 A CN202010614614 A CN 202010614614A CN 111782045 A CN111782045 A CN 111782045A
Authority
CN
China
Prior art keywords
target
angle
image
determining
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010614614.4A
Other languages
English (en)
Inventor
杜文彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202010614614.4A priority Critical patent/CN111782045A/zh
Publication of CN111782045A publication Critical patent/CN111782045A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种设备角度调节方法,包括:获取目标图像,利用目标图像得到目标位置信息;根据目标图像和目标位置信息确定目标角度;将目标设备的正面角度调节至目标角度;其中,目标设备包括声音获取设备和声音输出设备;该方法通过调节目标设备的正面角度,可以向用户的方向播放声音,改善了用户体验;同时准确地获取用户发出的语音,以便对语音进行解析得到控制指令并执行,改善了控制效果;此外,本发明还提供了一种装置、设备及计算机可读存储介质,也具有上述有益效果。

Description

一种设备角度调节方法、装置、智能音箱及存储介质
技术领域
本发明涉及智能音箱技术领域,特别涉及一种设备角度调节方法、设备角度调节装置、智能音箱及计算机可读存储介质。
背景技术
智能音箱,是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。相关技术中,由于智能音箱中的麦克风和喇叭的位置一般固定不动,因此当用户在于麦克风收声方向和喇叭出声方向相反的位置对智能音箱进行控制时,智能音箱无法使用户清楚地听到音箱发出的声音,用户体验较差;也无法准确地获取语音,无法准确获取语音就无法准确解析语音并进行相应的操作,控制效果较差,导致用户体验较差。因此相关技术存在用户体验较差的问题。
因此,如何解决相关技术存在的控制效果较差,用户体验较差的问题,是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种设备角度调节方法、设备角度调节装置、智能音箱及计算机可读存储介质,解决了相关技术存在的控制效果和用户体验较差的问题。
为解决上述技术问题,本发明提供了一种设备角度调节方法,包括:
获取目标图像,利用所述目标图像得到目标位置信息;
根据所述目标图像和所述目标位置信息确定目标角度;
将目标设备的正面角度调节至所述目标角度;其中,所述目标设备包括声音获取设备和声音输出设备。
可选地,所述将目标设备的正面角度调节至所述目标角度,包括:
获取当前角度,利用所述当前角度和所述目标角度确定角度差值;
对所述角度差值进行拆分,得到水平角度差值和垂直角度差值;
根据所述水平角度差值对所述目标设备进行水平角度调节,并根据所述垂直角度差值对所述目标设备进行垂直角度调节。
可选地,所述利用所述目标图像得到目标位置信息,包括:
确定所述目标图像中人像像素对应的像素行数;
利用预设距离对应关系确定所述像素行数对应的距离信息;
确定所述目标图像对应的图像获取设备信息,利用所述图像获取设备信息和所述距离信息生成所述目标位置信息。
可选地,所述根据所述目标图像和所述目标位置信息确定目标角度,包括:
确定所述目标图像中所述人像像素对应的目标像素行;
确定所述目标像素行对应的像素高度,并利用所述像素高度确定所述目标像素行对应的相对高度信息;
根据所述目标图像和所述图像获取设备信息确定水平角度信息;
利用所述距离信息、所述相对高度信息和所述水平角度信息计算所述目标角度。
可选地,所述获取目标图像,包括:
对各个图像获取设备进行初始化设置,并在初始化设置后利用各个所述图像获取设备获取多个原始图像;
对各个所述原始图像进行人像检测,将通过所述人像检测的所述原始图像确定为所述目标图像。
可选地,还包括:
从所述目标位置信息中提取距离信息;
确定所述距离信息所处的距离区间,并将语音控制触发阈值设置为所述距离区间对应的预设阈值。
可选地,还包括:
利用声音获取设备获取语音数据;
当所述语音数据对应的音量大于所述语音控制触发阈值时,执行所述语音数据对应的语音控制指令。
本发明还提供了一种设备角度调节装置,包括:
获取模块,用于获取目标图像,利用所述目标图像得到目标位置信息;
角度确定模块,用于根据所述目标图像和所述目标位置信息确定目标角度;
调节模块,用于将目标设备的正面角度调节至所述目标角度;其中,所述目标设备包括声音获取设备和声音输出设备。
本发明还提供了一种智能音箱,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的设备角度调节方法。
本发明还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的设备角度调节方法。
本发明提供的设备角度调节方法,获取目标图像,利用目标图像得到目标位置信息;根据目标图像和目标位置信息确定目标角度;将目标设备的正面角度调节至目标角度;其中,目标设备包括声音获取设备和声音输出设备。
可见,该方法可以根据获取到的目标图像确定用户所处的位置信息,即目标位置信息,并通过目标位置信息和目标图像确定用户头部与智能音箱之间的角度,即目标角度,通过将目标设备的正面角度调整至目标角度,可以使目标设备正对于用户的头部方向,以便向用户对应的方向播放声音或获取用户的语音。通过调节目标设备的正面角度,可以向用户的方向播放声音,改善了用户体验;同时准确地获取用户发出的语音,以便对语音进行解析得到控制指令并执行,改善了控制效果,解决了相关技术存在的控制效果较差,用户体验较差的问题。
此外,本发明还提供了一种设备角度调节装置、智能音箱及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种设备角度调节方法流程图;
图2为本发明实施例提供的一种智能音箱示意图;
图3为本发明实施例提供的一种目标图像示意图;
图4为本发明实施例提供的一种应用场景示意图;
图5为本发明实施例提供的另一种应用场景示意图;
图6为本发明实施例提供的一种设备角度调节装置的结构示意图;
图7为本发明实施例提供的一种智能音箱的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一种可能的实施方式中,请参考图1,图1为本发明实施例提供的一种设备角度调节方法流程图。该方法包括:
S101:获取目标图像,利用目标图像得到目标位置信息。
本实施例中的部分或全部步骤可以由包括有目标设备的智能音箱执行。
目标图像为包括有用户图像的图像,其可以为普通的可见光图像,或者可以为红外光图像。相应的,目标图像的类别不同,其对应的图像获取设备也不同,例如当目标图像为可见光图像时,对应的图像获取设备可以为普通的摄像头或相机;当目标图像为红外光图像时,对应的图像获取设备可以为红外摄像头或红外成像仪。
目标图像的具体获取过程可以根据实际情况进行设置,例如可以按照预设周期获取目标图像,或者在接收到图像获取指令时获取目标图像。由于目标图像中包括用户图像,因此可以利用目标图像生成用户所对应的位置信息,即目标位置信息。目标位置信息表示了用户所处的位置,具体可以包括距离信息和方向信息,分别用于表示用户与智能音箱的距离和用户相对于智能音箱所处的方向,其具体形式可以为极坐标形式,或者可以为直角坐标形式,任意可以准确表明用户位置的坐标形式均可。
S102:根据目标图像和目标位置信息确定目标角度。
目标角度为目标设备与用户的头部正面相对时应当所处的角度,其可以根据目标图像和目标位置信息确定得到。具体的,目标位置信息记录了用户所处的位置,利用其可以确定用户与智能音箱之间的相对位置,但是由于用户具有一定身高,仅利用目标位置信息并不能够确定用户的头部位置。因此可以根据目标图像确定用户的头部位置,并与目标位置信息一起确定目标角度。本实施例并不限定根据目标图像确定用户头部位置的具体方法,例如可以检测用户身高,根据用户身高确定头部位置;或者可以识别用户身份,根据用户身份获取预录入的身高数据,利用身高数据确定头部位置。
S103:将目标设备的正面角度调节至目标角度。
在确定目标角度后,将目标设备的正面角度调节至目标角度,目标设备可以包括声音获取设备和声音输出设备,即目标设备可以为声音获取设备,或者可以为声音输出设备,或者可可以同时包括声音获取设备和声音输出设备。声音获取设备可以为麦克风阵列,声音输出设备可以为喇叭。需要说明的是,由于需要对目标设备的角度进行调节,因此智能音箱内还包括对目标设备进行角度调节所必须的设备和部件,例如马达等。
目标设备的正面角度具体为哪一个角度可以根据需要进行设置,例如当目标设备为喇叭时,可以将喇叭中心所对应的角度确定为正面角度;或者当目标设备为麦克风阵列时,可以将麦克风阵列中处于中心的麦克风所对应的角度确定为正面角度。通过将正面角度调节至目标角度,可以使目标设备与用户的头部正面对应,以便用户听清智能音箱发出的声音,或者使智能音箱更好地获取用户的声音以便做出响应,改善了语音控制的控制效果,改善了用户体验。
应用本发明实施例提供的设备角度调节方法,可以根据获取到的目标图像确定用户所处的位置信息,即目标位置信息,并通过目标位置信息和目标图像确定用户头部与智能音箱之间的角度,即目标角度,通过将目标设备的正面角度调整至目标角度,可以使目标设备正对于用户的头部方向,以便向用户对应的方向播放声音或获取用户的语音。通过调节目标设备的正面角度,可以向用户的方向播放声音,改善了用户体验;同时准确地获取用户发出的语音,以便对语音进行解析得到控制指令并执行,改善了控制效果,解决了相关技术存在的控制效果较差,用户体验较差的问题。
基于上述实施例,本实施例将对上述实施例中的若干步骤进行具体的阐述。其中,为了获取准确的目标图像,可以利用多个图像获取设备获取目标图像,具体的S101步骤可以包括:
S1011:对各个图像获取设备进行初始化设置,并在初始化设置后利用各个图像获取设备获取多个原始图像。
本实施例中,为了获取准确的目标图像以识别用户的人像,可以获取图像前进行初始化设置,初始化过程可以包括焦距的设置、图像获取范围的设置、快门速度的设置等。初始化结束后即可获取原始图像,原始图像即为图像获取设备直接获取到的图像。由于用户可能在智能音箱四周的任意位置,因此智能音箱可以包括多个图像获取设备,本实施例并不限定图像获取设备的具体设置方法和方式,利用其可以获取智能音箱周边所有方向的图像即可。例如可以参考图2,图2为本发明实施例提供的一种智能音箱示意图。图2左半部分为智能音箱的正视图,右半部分为智能音箱的俯视图。圆柱体表示智能音箱,矩形表示图像获取设备,图像获取设备共有四个,分别设置于智能音箱的侧壁上,任意两个相邻的图像获取设备的中轴线呈九十度,即四个图像获取设备在智能音箱的侧壁上均匀分布,各个图像获取设备的图像获取范围均不重叠。
S1012:对各个原始图像进行人像检测,将通过人像检测的原始图像确定为目标图像。
由于目标图像为包括有用户图像的图像,因此需要对原始图像进行人像检测,判断其中是否包括有人像,即用户图像。若存在人像,即通过人像检测,将该原始图像确定为目标图像;若不存在人像,即不通过人像检测,不将其确定为目标图像。
为了快速确定目标位置信息,进而快速得到目标角度并对目标设备的正面角度进行调节,利用目标图像得到目标位置信息的步骤,可以包括:
S1013:确定目标图像中人像像素对应的像素行数。
目标图像中包括人像,构成人像的像素即为人像像素,请参考图3,图3为本发明实施例提供的一种目标图像示意图。目标图像的总像素行即为总共行数,其中人像像素也对应于一定的像素行数。
S1014:利用预设距离对应关系确定像素行数对应的距离信息。
根据近大远小的原则,可以根据人像所对应的像素行数确定距离信息,即用户与智能音箱之间的距离大小。请参考图3和图4,图4为本发明实施例提供的一种应用场景示意图,当一个人距离智能音箱较远时,例如为距离X2时,其对应的人像即为左边的人像,即较小的人像;当同一个人距离智能音箱较近时,例如为距离X1时,其对应的人像即为右边的人像,即较大的人像。在确定人像像素对应的像素行数后,可以调用预设距离对应关系确定对应的距离信息。
为了避免因用户身高的区别造成的距离信息确定不准的问题,本实施例中优选的,可以设置有多个预设距离对应关系,根据实际情况选择对应的预设距离对应关系进行距离信息的确定。具体的,由于人的头部大小区别较小,因此可以检测人像中头部像素对应的头部像素行数,根据头部像素行数选择对应的目标预设距离对应关系,并利用目标预设距离对应关系确定距离信息。
S1015:确定目标图像对应的图像获取设备信息,利用图像获取设备信息和距离信息生成目标位置信息。
由于具有多个图像获取设备,而获取目标图像的图像获取设备只有一个,因此可以获取图像获取设备信息,图像获取设备信息可以表示由哪一个图像获取设备获取到具有人像的目标图像,可以确定用户的大概方向。
基于上述实施例,S102步骤可以包括:
S1021:确定目标图像中人像像素对应的目标像素行。
目标像素行即为用户头部所对应的像素行,其具体可以为用户头顶所对应的像素行,或者可以为头部中部所对应的像素行,目标像素行的具体内容可以根据实际需要进行设置。利用目标像素行可以确定用户的头部高度,以便确定目标角度。
请参考图5,图5为本发明实施例提供的另一种应用场景示意图。不同高度的两个用户,例如为高度H1和高度H2,在于智能音箱的距离为相同距离的条件下,其在目标图像上的人像的高度是不同的,因此其对应的目标像素行也不同。
S1022:确定目标像素行对应的像素高度,并利用像素高度确定目标像素行对应的相对高度信息。
在确定目标像素行后,确定目标像素行对应的像素高度,像素高度为目标图像中从人像最低点到目标像素行的像素行数。在距离信息确定后,像素高度越大,说明用户的身高越高,其头部所处的位置越高。因此在确定像素高度后,利用像素高度确定目标像素行对应的相对高度信息,相对高度信息用于表示用户头部和智能音箱之间的相对高度。具体的,可以根据距离信息确定预设高度对应关系,并在所述预设高度对应关系中确定像素高度对应的高度值作为相对高度信息。进一步,由于智能音箱的放置高度可能出现变化,因此在确定相对高度信息时可以获取当前位置信息,得到智能音箱本身的高度,在利用智能音箱本身的高度与像素高度对应的高度值进行计算,得到相对高度信息。
S1023:根据目标图像和图像获取设备信息确定水平角度信息。
由于图像获取设备信息对应于一定的水平角度范围,因此利用其可以确定用户大概所处的角度范围,通过判断人像在目标图像中的具体位置,可以确定用户在该水平角度范围内的具体角度,因此可以利用目标图像和图像获取设备信息确定水平角度信息,即用户头部所处的水平角度位置。
S1024:利用距离信息、相对高度信息和水平角度信息计算目标角度。
在确定距离信息和相对高度信息后,利用其可以计算得到用户头部与智能音箱之间的垂直角度位置,在确定水平角度位置和垂直角度位置后即可计算目标角度,因此可以利用距离信息、相对高度信息和水平角度信息计算目标角度。
基于上述实施例,S103步骤可以包括:
S1031:获取当前角度,利用当前角度和目标角度确定角度差值。
具体的,角度差值即为需要调整的角度值。
S1032:对角度差值进行拆分,得到水平角度差值和垂直角度差值。
在确定角度差值后,可以对其进行两个方向上的拆分,即水平方向和垂直方向,得到水平角度差值和垂直角度差值。水平角度差值用于表示目标设备水平方向上需要调整的角度,垂直角度差值表示目标设备在垂直方向上需要调整的角度。
S1033:根据水平角度差值对目标设备进行水平角度调节,并根据垂直角度差值对目标设备进行垂直角度调节。
在调节结束后,即可将目标设备的正面角度调节至目标角度。
进一步,基于上述实施例,为了及时对用户的声音控制指令进行响应,本实施例中,可以根据距离信息确定语音控制触发阈值的大小。具体的,还可以包括:
步骤1:从目标位置信息中提取距离信息。
步骤2:确定距离信息所处的距离区间,并将语音控制触发阈值设置为距离区间对应的预设阈值。
本实施例中设置有多个距离区间,不同的距离区间对应于不同的预设阈值。用户发出的声音控制指令在到达智能音箱的过程中会进行衰减,距离较近时衰减较小,距离较远时衰减较大。为了及时对用户的声音控制指令进行响应,因此可以将语音控制触发阈值设置为于距离区间对应的预设阈值,距离越远,预设阈值越小,越容易触发声音控制指令,因此可以在声音控制指令衰减较大的情况下仍能够被触发。在距离较近时,可以将语音控制触发阈值设置较大,避免其他声音造成干扰。
步骤3:利用声音获取设备获取语音数据。
本实施例中,还可以利用声音获取设备获取语音数据,语音数据即为声音控制指令。
步骤4:当语音数据对应的音量大于语音控制触发阈值时,执行语音数据对应的语音控制指令。
下面对本发明实施例提供的设备角度调节装置进行介绍,下文描述的设备角度调节装置与上文描述的设备角度调节方法可相互对应参照。
请参考图6,图6为本发明实施例提供的一种设备角度调节装置的结构示意图,包括:
获取模块610,用于获取目标图像,利用所述目标图像得到目标位置信息;
角度确定模块620,用于根据所述目标图像和所述目标位置信息确定目标角度;
调节模块630,用于将目标设备的正面角度调节至所述目标角度;其中,所述目标设备包括声音获取设备和声音输出设备。
可选地,调节模块630,包括:
差值确定单元,用于获取当前角度,利用所述当前角度和所述目标角度确定角度差值;
拆分单元,用于对所述角度差值进行拆分,得到水平角度差值和垂直角度差值;
调节单元,用于根据所述水平角度差值对所述目标设备进行水平角度调节,并根据所述垂直角度差值对所述目标设备进行垂直角度调节。
可选地,获取模块610,包括:
像素行数确定单元,用于确定所述目标图像中人像像素对应的像素行数;
距离信息确定单元,用于利用预设距离对应关系确定所述像素行数对应的距离信息;
位置信息生成单元,用于确定所述目标图像对应的图像获取设备信息,利用所述图像获取设备信息和所述距离信息生成所述目标位置信息。
可选地,角度确定模块620,包括:
目标像素韩确定单元,用于确定所述目标图像中所述人像像素对应的目标像素行;
相对高度信息确定单元,用于确定所述目标像素行对应的像素高度,并利用所述像素高度确定所述目标像素行对应的相对高度信息;
水平角度信息确定单元,用于根据所述目标图像和所述图像获取设备信息确定水平角度信息;
目标角度计算单元,用于利用所述距离信息、所述相对高度信息和所述水平角度信息计算所述目标角度。
可选地,获取模块610,包括:
原始图像获取单元,用于对各个图像获取设备进行初始化设置,并在初始化设置后利用各个所述图像获取设备获取多个原始图像;
人像检测单元,用于对各个所述原始图像进行人像检测,将通过所述人像检测的所述原始图像确定为所述目标图像。
可选地,还包括:
距离信息提取模块,用于从所述目标位置信息中提取距离信息;
阈值设定模块,用于确定所述距离信息所处的距离区间,并将语音控制触发阈值设置为所述距离区间对应的预设阈值。
可选地,还包括:
语音数据获取模块,用于利用声音获取设备获取语音数据;
执行模块,用于当所述语音数据对应的音量大于所述语音控制触发阈值时,执行所述语音数据对应的语音控制指令。
下面对本发明实施例提供的智能音箱进行介绍,下文描述的智能音箱与上文描述的设备角度调节方法可相互对应参照。
请参考图7,图7为本发明实施例提供的一种智能音箱的结构示意图。其中智能音箱700可以包括处理器701和存储器702,还可以进一步包括多媒体组件703、信息输入/信息输出(I/O)接口704以及通信组件705中的一种或多种。
其中,处理器701用于控制智能音箱700的整体操作,以完成上述的设备角度调节方法中的全部或部分步骤;存储器702用于存储各种类型的数据以支持在智能音箱700的操作,这些数据例如可以包括用于在该智能音箱700上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、只读存储器(Read-OnlyMemory,ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。
多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于智能音箱700与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件705可以包括:Wi-Fi部件,蓝牙部件,NFC部件。
智能音箱700可以被一个或多个应用专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述实施例给出的设备角度调节方法。
下面对本发明实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的设备角度调节方法可相互对应参照。
本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的设备角度调节方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语包括、包含或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上对本发明所提供的设备角度调节方法、设备角度调节装置、智能音箱和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种设备角度调节方法,其特征在于,包括:
获取目标图像,利用所述目标图像得到目标位置信息;
根据所述目标图像和所述目标位置信息确定目标角度;
将目标设备的正面角度调节至所述目标角度;其中,所述目标设备包括声音获取设备和声音输出设备。
2.根据权利要求1所述的设备角度调节方法,其特征在于,所述将目标设备的正面角度调节至所述目标角度,包括:
获取当前角度,利用所述当前角度和所述目标角度确定角度差值;
对所述角度差值进行拆分,得到水平角度差值和垂直角度差值;
根据所述水平角度差值对所述目标设备进行水平角度调节,并根据所述垂直角度差值对所述目标设备进行垂直角度调节。
3.根据权利要求1所述的设备角度调节方法,其特征在于,所述利用所述目标图像得到目标位置信息,包括:
确定所述目标图像中人像像素对应的像素行数;
利用预设距离对应关系确定所述像素行数对应的距离信息;
确定所述目标图像对应的图像获取设备信息,利用所述图像获取设备信息和所述距离信息生成所述目标位置信息。
4.根据权利要求3所述的设备角度调节方法,其特征在于,所述根据所述目标图像和所述目标位置信息确定目标角度,包括:
确定所述目标图像中所述人像像素对应的目标像素行;
确定所述目标像素行对应的像素高度,并利用所述像素高度确定所述目标像素行对应的相对高度信息;
根据所述目标图像和所述图像获取设备信息确定水平角度信息;
利用所述距离信息、所述相对高度信息和所述水平角度信息计算所述目标角度。
5.根据权利要求1所述的设备角度调节方法,其特征在于,所述获取目标图像,包括:
对各个图像获取设备进行初始化设置,并在初始化设置后利用各个所述图像获取设备获取多个原始图像;
对各个所述原始图像进行人像检测,将通过所述人像检测的所述原始图像确定为所述目标图像。
6.根据权利要求1至5任一项所述的设备角度调节方法,其特征在于,还包括:
从所述目标位置信息中提取距离信息;
确定所述距离信息所处的距离区间,并将语音控制触发阈值设置为所述距离区间对应的预设阈值。
7.根据权利要求6所述的设备角度调节方法,其特征在于,还包括:
利用声音获取设备获取语音数据;
当所述语音数据对应的音量大于所述语音控制触发阈值时,执行所述语音数据对应的语音控制指令。
8.一种设备角度调节装置,其特征在于,包括:
获取模块,用于获取目标图像,利用所述目标图像得到目标位置信息;
角度确定模块,用于根据所述目标图像和所述目标位置信息确定目标角度;
调节模块,用于将目标设备的正面角度调节至所述目标角度;其中,所述目标设备包括声音获取设备和声音输出设备。
9.一种智能音箱,其特征在于,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的设备角度调节方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的设备角度调节方法。
CN202010614614.4A 2020-06-30 2020-06-30 一种设备角度调节方法、装置、智能音箱及存储介质 Pending CN111782045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010614614.4A CN111782045A (zh) 2020-06-30 2020-06-30 一种设备角度调节方法、装置、智能音箱及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010614614.4A CN111782045A (zh) 2020-06-30 2020-06-30 一种设备角度调节方法、装置、智能音箱及存储介质

Publications (1)

Publication Number Publication Date
CN111782045A true CN111782045A (zh) 2020-10-16

Family

ID=72761250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010614614.4A Pending CN111782045A (zh) 2020-06-30 2020-06-30 一种设备角度调节方法、装置、智能音箱及存储介质

Country Status (1)

Country Link
CN (1) CN111782045A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112562664A (zh) * 2020-11-27 2021-03-26 上海仙塔智能科技有限公司 音响调节方法、系统、车辆及计算机存储介质
CN115086095A (zh) * 2021-03-10 2022-09-20 Oppo广东移动通信有限公司 设备控制方法及相关装置

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1344400A (zh) * 1999-12-15 2002-04-10 皇家菲利浦电子有限公司 适宜为与数据网络合作而提供的语音命令控制的电子设备
WO2002041664A2 (en) * 2000-11-16 2002-05-23 Koninklijke Philips Electronics N.V. Automatically adjusting audio system
US6741273B1 (en) * 1999-08-04 2004-05-25 Mitsubishi Electric Research Laboratories Inc Video camera controlled surround sound
JP2005057545A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 音場制御装置及び音響システム
WO2006048537A1 (fr) * 2004-11-03 2006-05-11 France Telecom Configuration dynamique d'un systeme sonore
JP2009017094A (ja) * 2007-07-03 2009-01-22 Fujitsu Ten Ltd スピーカシステム
KR20110016272A (ko) * 2009-08-11 2011-02-17 엘지전자 주식회사 이동 단말기 및 그 제어방법
US8379902B2 (en) * 2008-08-04 2013-02-19 Seiko Epson Corporation Audio output control device, audio output control method, and program
CN103334264A (zh) * 2013-06-07 2013-10-02 松下家电研究开发(杭州)有限公司 一种可自动调整控制面板角度的洗衣机及其调整方法
JP2013236354A (ja) * 2012-05-11 2013-11-21 Funai Electric Co Ltd 音響システムおよびスピーカ装置
CN105681968A (zh) * 2014-12-08 2016-06-15 哈曼国际工业有限公司 使用面部识别调节扬声器
CN106679651A (zh) * 2017-02-08 2017-05-17 北京地平线信息技术有限公司 声源定位方法、装置和电子设备
CN107491101A (zh) * 2017-09-14 2017-12-19 歌尔科技有限公司 一种麦克风阵列拾音角度的调节方法、装置及电子设备
CN107680593A (zh) * 2017-10-13 2018-02-09 歌尔股份有限公司 一种智能设备的语音增强方法及装置
CN107704851A (zh) * 2017-10-30 2018-02-16 歌尔股份有限公司 人物识别方法、公共传媒展示装置、服务器和系统
CN107920263A (zh) * 2016-10-11 2018-04-17 杭州萤石网络有限公司 音量调节方法及装置
CN109257682A (zh) * 2018-09-29 2019-01-22 歌尔科技有限公司 拾音调节方法、控制终端及计算机可读存储介质
CN110072172A (zh) * 2019-04-25 2019-07-30 广州小鹏汽车科技有限公司 一种音频信号的输出方法和装置
CN110671793A (zh) * 2019-05-08 2020-01-10 青岛海尔空调器有限总公司 用于控制出风方向和出音方向的方法和装置、空调室内机

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6741273B1 (en) * 1999-08-04 2004-05-25 Mitsubishi Electric Research Laboratories Inc Video camera controlled surround sound
CN1344400A (zh) * 1999-12-15 2002-04-10 皇家菲利浦电子有限公司 适宜为与数据网络合作而提供的语音命令控制的电子设备
WO2002041664A2 (en) * 2000-11-16 2002-05-23 Koninklijke Philips Electronics N.V. Automatically adjusting audio system
JP2005057545A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 音場制御装置及び音響システム
WO2006048537A1 (fr) * 2004-11-03 2006-05-11 France Telecom Configuration dynamique d'un systeme sonore
JP2009017094A (ja) * 2007-07-03 2009-01-22 Fujitsu Ten Ltd スピーカシステム
US8379902B2 (en) * 2008-08-04 2013-02-19 Seiko Epson Corporation Audio output control device, audio output control method, and program
KR20110016272A (ko) * 2009-08-11 2011-02-17 엘지전자 주식회사 이동 단말기 및 그 제어방법
JP2013236354A (ja) * 2012-05-11 2013-11-21 Funai Electric Co Ltd 音響システムおよびスピーカ装置
CN103334264A (zh) * 2013-06-07 2013-10-02 松下家电研究开发(杭州)有限公司 一种可自动调整控制面板角度的洗衣机及其调整方法
CN105681968A (zh) * 2014-12-08 2016-06-15 哈曼国际工业有限公司 使用面部识别调节扬声器
CN107920263A (zh) * 2016-10-11 2018-04-17 杭州萤石网络有限公司 音量调节方法及装置
CN106679651A (zh) * 2017-02-08 2017-05-17 北京地平线信息技术有限公司 声源定位方法、装置和电子设备
CN107491101A (zh) * 2017-09-14 2017-12-19 歌尔科技有限公司 一种麦克风阵列拾音角度的调节方法、装置及电子设备
CN107680593A (zh) * 2017-10-13 2018-02-09 歌尔股份有限公司 一种智能设备的语音增强方法及装置
CN107704851A (zh) * 2017-10-30 2018-02-16 歌尔股份有限公司 人物识别方法、公共传媒展示装置、服务器和系统
CN109257682A (zh) * 2018-09-29 2019-01-22 歌尔科技有限公司 拾音调节方法、控制终端及计算机可读存储介质
CN110072172A (zh) * 2019-04-25 2019-07-30 广州小鹏汽车科技有限公司 一种音频信号的输出方法和装置
CN110671793A (zh) * 2019-05-08 2020-01-10 青岛海尔空调器有限总公司 用于控制出风方向和出音方向的方法和装置、空调室内机

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112562664A (zh) * 2020-11-27 2021-03-26 上海仙塔智能科技有限公司 音响调节方法、系统、车辆及计算机存储介质
CN115086095A (zh) * 2021-03-10 2022-09-20 Oppo广东移动通信有限公司 设备控制方法及相关装置

Similar Documents

Publication Publication Date Title
KR102444061B1 (ko) 음성 인식이 가능한 전자 장치 및 방법
CN104049721B (zh) 信息处理方法及电子设备
US10297250B1 (en) Asynchronous transfer of audio data
CN113014983B (zh) 视频播放方法、装置、存储介质及电子设备
CN111988647A (zh) 音画同步调整方法、装置、设备以及介质
US20200202856A1 (en) Vision-based presence-aware voice-enabled device
CN109448705B (zh) 一种语音切分方法及装置、计算机装置和可读存储介质
US20140241702A1 (en) Dynamic audio perspective change during video playback
CN104485115A (zh) 发音评价设备、方法和系统
CN104485116A (zh) 语音质量评价设备、方法和系统
CN111782045A (zh) 一种设备角度调节方法、装置、智能音箱及存储介质
CN113676592A (zh) 录音方法、装置、电子设备及计算机可读介质
US20140064517A1 (en) Multimedia processing system and audio signal processing method
CN104662889B (zh) 用于在便携式终端中进行拍摄的方法和设备
CN109726709A (zh) 基于卷积神经网络的图标识别方法和装置
US20220225049A1 (en) An apparatus and associated methods for capture of spatial audio
CN107079219A (zh) 面向用户体验的音频信号处理
CN113115176B (zh) 一种音响参数确定方法和系统
CN113033245A (zh) 一种功能调节方法、装置、存储介质及电子设备
CN104505103A (zh) 语音质量评价设备、方法和系统
CN107450882B (zh) 一种调节声音响度的方法、装置及存储介质
CN113014844A (zh) 一种音频处理方法、装置、存储介质及电子设备
JP2022529856A (ja) タッチパッド入力を備えたゲームコントローラ
US10244342B1 (en) Spatially representing graphical interface elements as binaural audio content
KR20130054131A (ko) 디스플레이장치 및 그 제어방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination