CN102437825B

CN102437825B - 控制装置和控制方法

Info

Publication number: CN102437825B
Application number: CN201110282325.XA
Authority: CN
Inventors: 阪井佑介; 近藤真生
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-09-29
Filing date: 2011-09-22
Publication date: 2016-12-07
Anticipated expiration: 2031-09-22
Also published as: EP2437473B1; US20120078619A1; JP2012075039A; CN102437825A; US9426270B2; EP2437473A3; EP2437473A2

Abstract

提供了装置、方法和非暂时性记录介质。该装置可以包括控制单元，根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和话音声音的音量。当要基于优先级进行音量控制时，控制单元基于所分配的优先级选择性地控制内容声音的音量和话音声音的音量，以使得具有较高优先级的声音的音量变得比另一声音的音量更响。

Description

控制装置和控制方法

相关申请的交叉引用

本申请要求于2010年9月29日在日本专利局提交的日本专利申请No.2010-219866的优先权，其全部内容通过参考合并于此。

技术领域

本公开涉及控制装置和控制方法。

背景技术

近年来，允许在用户之间与外部装置进行主叫-被叫(caller-callee)通信同时再现内容数据的诸如个人计算机(PC)之类的装置已经广泛应用。在这样的装置中，一些装置允许用户通过例如使用与内容数据的再现有关的应用和与语音通信有关的应用的混音功能来独立地控制内容数据的音量和用户话音的音量。但是，这样的装置的用户在需要时需要根据例如通信情况手动地控制音量。因此，使用这种装置的用户体会到不方便。

因而，已经开发了用于自动控制音量的技术。例如，为了在一种类型的声音正被输入的同时输出与其它类型的声音数据对应的声音，日本未审查专利申请公开No.11-45096描述了用于降低一种类型的声音的音量的技术。

当在一种类型的声音正被输入的同时输出与其它类型的声音数据对应的声音时，采用现有技术的用于自动控制音量的控制装置(下文中称为“现有控制装置”)降低一种类型的声音的音量。也就是，如果例如现有控制装置在再现内容数据的同时进行在用户之间与外部装置的主叫-被叫通信，则每次输出用户的话音时，现有控制装置自动降低再现的内容数据的声音(下文中称为“内容声音”)的音量。因此，当使用现有技术时，在需要时用户不需要手动地控制内容声音的音量和话音的音量。结果，用户可以体会到某种程度的便利性。

但是，如上所述，如果在正输出一种类型的声音的同时输出与其它类型的声音数据对应的声音，则现有装置降低该一种类型的声音的音量。因此，在现有装置中，即使在用户不想要降低例如内容声音的音量时，也不利地自动降低该音量。

因此，即使在采用现有技术时，也很难增加用户体会到的便利性。

发明内容

因此，本公开提供了能够在控制装置进行与通信目标装置的主叫-被叫通信时改进用户的便利性的新颖的和改进的控制装置和控制方法。

根据实施例的一个方面，一种装置可以包括控制单元，用于根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和话音声音的音量。另外，当要基于优先级进行音量控制时，该控制单元可以基于所分配的优先级选择性地控制内容声音的音量和话音声音的音量，以使得具有较高优先级的声音的音量变得比其它声音的音量更响。

根据实施例的另一方面，一种方法可以包括：由处理器根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和话音声音的音量。该方法还可以包括：当要基于优先级进行音量控制时，基于所分配的优先级选择性地控制内容声音的音量和话音声音的音量，以使得具有较高优先级的声音的音量变得比其它声音的音量更响。

根据实施例的另一方面，一种非暂时性记录介质可以记录有可由处理器执行的指令的计算机可读程序。该程序可以包括：根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和话音声音的音量。该程序还可以包括：当要基于优先级进行音量控制时，基于所分配的优先级选择性地控制内容声音的音量和话音声音的音量，以使得具有较高优先级的声音的音量变得比其它声音的音量更响。

根据本公开，当控制装置进行与通信目标装置的主叫-被叫通信时，可以改进用户的便利性。

附图说明

图1是按照根据本公开的实施例的控制装置进行的便利性改进方法的处理例子的流程图；

图2是根据本公开的实施例的控制装置进行的基于优先级的音量控制处理的例子的流程图；

图3例示根据本公开的实施例的控制装置进行的内容声音和话音声音的音量控制的例子；

图4是根据本公开的实施例的控制装置进行的话音声音的音量控制处理的例子的流程图；

图5是根据本公开的第一实施例的控制装置的配置例子的框图；

图6例示根据本公开的实施例的控制装置的硬件配置的例子；以及

图7是根据本公开的第二实施例的控制装置的配置例子的框图。

具体实施方式

以下参考附图详细描述本公开的示例实施例。注意，如在此使用的，在描述具有基本相同的功能结构的组件时将使用相同的附图标记，因此不再重复其描述。

另外，按以下顺序进行描述：

1.根据本公开的实施例的技术方法

2.根据本公开的实施例的控制装置

3.根据本公开的实施例的程序

1.根据本公开的实施例的技术方法

在描述根据本公开的实施例的控制装置的示例配置(下文中也称为“控制装置100”)之前，描述根据本公开的实施例的便利性改进方法。注意，以下所述的按照根据本公开的实施例的便利性改进方法的处理可以被认为是按照根据本公开的实施例的控制方法的处理。

另外，参考其中例如控制装置100进行用于再现内容数据和同时与至少一个通信目标装置进行主叫-被叫通信的情况进行以下描述。如在此使用的，术语“根据本公开的实施例的内容数据”指的是声音数据或声音和图像(静止图像/运动图像)数据。内容数据的例子包括音乐数据和视频数据。另外，根据本公开的实施例的主叫-被叫通信的例子是通过语音呼叫的通信。但是，根据本公开的实施例的主叫-被叫通信不限于此。例如，根据本公开的实施例的主叫-被叫通信可以是使用捕捉的图像和语音的主叫-被叫通信(例如视频呼叫)，该捕捉的图像是通过图像捕捉获得的运动图像。注意，根据本公开的实施例的捕捉的图像是例如通过图像捕捉获得的运动图像(或者在时间轴方向上连续捕捉的静止图像的集合)。

便利性改进方法的简要概况

如上所述，如果在输出一种类型的声音的同时现有装置输出与其它类型的声音数据对应的声音，则现有装置降低该一种类型的声音的音量。但是，在现有装置具有进行在用户之间与外部装置的主叫-被叫通信同时再现内容数据的功能的情况下，现有装置可能自动降低内容声音的音量，尽管用户不希望降低内容声音的音量。例如，当再现电影(内容项的例子)的高潮场景时，用户不想自动降低内容声音的音量。在这样的不希望的情况下，自动降低音量可能削弱用户便利性。从而，即使在使用现有控制装置时，也不一定增加用户便利性。

相反，即使当再现电影(内容项的例子)的高潮场景时，用户可能希望自动降低内容声音的音量。例如，如果用户想要对语音通信设置优先于再现的内容的优先级，则用户将内容声音的音量设置为自动降低。在这样的情况下，如现有技术中那样，当一种类型的声音正被输出时并且如果输出与其它类型的声音数据对应的声音，则降低该一种类型的声音的音量。以此方式，可以增加用户的便利性。

因此，根据本公开的实施例，控制装置100基于分配给与所检测的话音声音对应的用户的优先级来选择性地控制内容声音的音量和话音声音的音量。更具体地，控制装置100选择性地控制内容声音的音量和话音声音的音量，以使得具有较高优先级的声音的音量变得更响。

如在此使用的，术语“根据本公开的实施例的优先级”指的是由控制装置100使用来确定当控制内容声音和话音声音的音量时优先增加内容声音和话音声音的音量的哪个的索引。例如，如果将优先级分配给内容数据和与话音声音对应的用户之一，则控制装置100确定具有分配给其的优先级的一个具有更高的优先级。相反，如果优先级分配给两者，则控制装置100确定具有较高优先级的一个具有更高的优先级。优先级的例子是“阶梯形式的”值，比如从1到10的值。注意，根据本公开的实施例的优先级不限于阶梯形式的值。例如，可以采用允许这样的确定的任意格式。另外，当使用阶梯形式的值表示根据本公开的实施例的优先级时，例如，更大的值可以表示更高的优先级。但是，更小的值可以表示更高的优先级。参考其中使用阶梯形式的值表示根据本公开的实施例的优先级并且更大的值表示更高的优先级的情况进行以下描述。

例如，内容数据包括元数据形式的优先级。在上述情况下，控制装置100在需要时参考正被再现的内容数据的元数据。因此，控制装置100可以基于例如每个场景(当内容数据表示视频数据时)或基于每个段落(当内容数据表示音乐数据时)动态地分析内容数据的优先级。此时，例如，由内容数据的创建者预设分配给内容数据的优先级。但是，设置者不限于创建者。例如，控制装置100可以根据例如用户操作设置优先级。另外，上述元数据可以包括在例如内容数据中或者可以与内容数据分离(即外部元数据)。

另外，例如，控制装置100基于存储在控制装置100中的优先级信息或者从通信目标装置发送的优先级信息来标识分配给与话音声音对应的用户的优先级。如在此使用的，术语“根据本公开的实施例的优先级信息”指的是包括用户名和与用户名关联的优先级的信息。例如，当产生优先级信息时，设置优先级信息中所包括的优先级。但是，优先级的设置不限于此。例如，控制装置100可以根据例如用户操作来设置优先级。

此外，如果对于同一用户存在多个优先级信息项(例如在控制装置100中存储的优先级信息和从通信目标装置发送的优先级信息)，则控制装置100例如选择性地使用这些优先级信息项之一。在上述情况下，控制装置100基于预定设置或者通过用户操作设置的设置来选择要使用的优先级信息项之一(例如，控制装置100优先选择在控制装置100中存储的优先级信息)。注意，当对于同一用户存在多个优先级信息项时控制装置100进行的处理不限于上述处理。例如，控制装置100可以计算在对于同一用户的多个优先级信息项中设置的优先级的平均值并使用该平均值作为新的优先级。

在控制装置100中，用于标识分配给与话音声音对应的用户的优先级的技术不限于上述技术。例如，控制装置100可以基于优先级信息和存储在控制装置100中并包括用户名和与该用户名关联的用户标识信息的用户信息来标识分配给与话音声音对应的用户的优先级。更具体地，控制装置100基于用户信息标识给出话音的用户并从优先级信息获取分配给标识的用户的优先级。根据本公开的实施例，用于标识用户并且记录在用户信息中的信息的例子包括关于用户的语音印记(print)信息(语音的频率和强度)以及指示用户的面部的特征的面部信息(例如骨骼信息和指示眼睛、鼻子和嘴巴之间的位置关系的信息)。例如，控制装置100将话音声音与记录的用户语音印记信息相比较或者将从捕捉的图像提取的面部信息与记录的面部信息相比较。通过使用任意的语音印记验证技术或者面部识别技术，可以标识给出话音的用户。

如上所述，通过根据设置的优先级选择性地控制内容声音的音量和话音声音的音量，控制装置100可以将具有分配给其较高优先级的声音的音量增加得比其他声音的音量更多。从而，通过根据设置的优先级动态地控制音量，控制装置100可以将内容声音的音量增加得比话音声音的音量更多或者将话音声音的音量增加得比内容声音的音量更多。

因此，控制装置100可以在降低不期望的情况出现的概率的同时控制声音的音量，因此，可以增加用户便利性。

尽管已经参考其中控制装置100基于优先级控制声音的音量的例子进行了以上描述，但是根据本公开的实施例的控制装置100执行的处理不限于此。例如，当控制装置100使用捕捉的图像和语音以主叫-被叫通信与通信目标装置通信(例示视频呼叫)时，控制装置100可以进一步更新在主叫-被叫通信中再现的内容数据的图像与捕捉的图像的显示比率。根据本公开的实施例，作为结合声音音量的选择性控制更新显示比率的例子，当控制装置100增加使用通信目标装置说话的通信伙伴方用户的话音声音时，控制装置100也增加通信伙伴方用户的捕捉图像的显示尺寸。相反，例如，控制装置100可以结合上述捕捉图像的更新降低内容数据的图像的显示尺寸。应该注意，根据本公开的实施例，用于结合声音音量的选择性控制的更新而更新显示尺寸的处理不限于上述例子。

因为控制装置100结合上述选择性音量控制来改变显示比率，因此控制装置100的用户可以视觉上识别通信目标装置的哪个用户具有拥有更响的音量的话音声音。因此，通过结合上述选择性音量控制而改变显示比率，控制装置100可以进一步增加用户便利性。

另外，如果未向内容数据和与话音声音对应的用户分配优先级，则控制装置100确定例如与话音声音对应的用户具有比分配给内容数据的优先级更高的优先级(例外处理的例子)。其后，控制装置100选择性地控制内容声音的音量和话音声音的音量。因此，即使未向内容数据和与话音声音对应的用户分配优先级，控制装置100也可以基于预定确定的结果将话音声音的音量增加得比内容声音的音量更多。注意，尽管参考其中如果未向内容数据和与话音声音对应的用户分配优先级则话音声音具有优先级的情况进行以上描述，但是，控制装置100可以控制音量使得内容声音具有优先级。通过基于预定确定结果控制内容声音的音量和话音声音的音量，即使在未向内容数据和与话音声音对应的用户分配优先级时，控制装置100也可以自动控制音量。

根据便利性改进方法的处理的具体例子

接下来描述用于实现根据本公开的实施例的便利性改进方法的处理的具体例子。图1是例示由根据本公开的实施例的控制装置100进行的根据便利性改进方法的处理的例子的流程图。

控制装置100将内容声音的音量设置为第一参考值(步骤S100)并将话音声音的音量设置为第二参考值(步骤S102)。

如在此使用的，根据本公开的实施例的术语“第一参考值”指的是用作内容声音的音量的参考的值。另外，根据本公开的实施例的术语“第二参考值”指的是用作话音声音的音量的参考的值。即，在步骤S100和S102中进行的处理对应于用于设置内容声音和话音声音的音量的初始值的处理。

另外，图1例示了其中在已经进行步骤S100中的处理之后进行步骤S102中的处理的例子。但是，根据该便利性改进方法的处理不限于此。例如，控制装置100可以在已经进行了步骤S102中的处理之后进行步骤S100中的处理。或者，控制装置100可以同时进行步骤S100和S102中的处理。

当进行步骤S100和S102中的处理时，控制装置100确定是否进行了按照根据本公开的实施例的便利性改进方法的音量控制(步骤S104)。此时，控制装置100基于例如确定音量控制的开/关的硬件开关或者基于从诸如远程控制器之类的外部操作设备传输的外部操作信号确定音量控制的开/关的软件开关的状态来进行步骤S104中的确定。但是，根据本公开的实施例的控制装置100在步骤S104中进行的处理不限于此。

例如，控制装置100可以检测用户进行的预定运动，并基于检测结果确定是否进行音量控制。在这样的情况下，例如，控制装置100对控制装置100中包括的成像设备(以下描述的成像单元)或外部成像设备(以下描述的成像装置)产生的捕捉图像进行图像处理，并在捕捉的图像中检测用户进行的预定运动(例如指示音量控制的开/关的手的形状或周期性运动)。其后，例如，如果检测到对于音量控制的开启操作，则控制装置100确定要进行音量控制。那时，如果检测到用于音量控制的开启操作，则控制装置100确定音量控制继续直到例如检测到音量控制的关闭操作。但是，控制装置100进行的处理不限于此。例如，控制装置100可以确定仅当检测到音量控制的开启操作时才进行音量控制。

另外，控制装置100可以基于控制装置100中包括的声音输入设备(以下描述的声音输入单元)或者外部声音输入设备(以下描述的声音输入装置)产生的距离信息确定是否进行音量控制。该距离信息指示该声音输入设备或外部声音输入设备和用户之间的距离。例如，如果该距离信息指示的距离小于或等于预定阈值(或小于预定阈值)，则控制装置100可以确定进行音量控制。在此情况下，例如，控制装置100确定进行音量控制直到该距离信息指示的距离大于预定阈值(或大于或等于预定阈值)为止。注意，上述距离信息由包括在例如声音输入设备或外部声音输入设备中的距离传感器产生。但是，该距离传感器不是一定要被包括在声音输入设备或外部声音输入设备中，而可以是独立的设备。在这样的情况下，距离信息产生单元(未示出)或者具有与声音输入单元分离的主体的距离测量单元(未示出)或者声音输入单元(以下描述)产生距离信息。另外，在此情况下，距离信息指示控制装置100中包括的声音输入设备(以下描述的声音输入单元)或者外部声音输入设备(以下描述的声音输入装置)和用户之间的粗略距离。

如果在步骤S104中确定不进行音量控制，则控制装置100完成根据该便利性改进方法的处理。注意，图1所示的根据该便利性改进方法的处理不是限于进行一次的处理，而是图1所示的根据该便利性改进方法的处理即使在已经完成该处理一次以后也可以再次由控制装置100周期地或者非周期地进行。

但是，如果在步骤S104中确定要进行音量控制，则控制装置100确定是否正再现内容数据(步骤S106)。例如，如果存储在存储单元(以下描述)中的内容数据正被再现或者从诸如通信目标装置或服务器的外部装置发送的内容数据正被再现，则控制装置100确定内容数据正被再现。此时，例如，控制装置100可以再现流内容数据或者下载从外部装置发送的内容数据。

如果在步骤S106中确定内容数据没有正被再现，则控制装置100重复从步骤S104开始的处理。

但是，如果在步骤S106中确定内容数据正被再现，则控制装置100确定是否检测到话音声音(步骤S108)。此时，当例如控制装置100包括声音输入设备(以下描述的声音输入单元)时并且如果检测到由声音输入设备产生的声音信号，或者当检测到从通信目标装置接收的外部声音信号时，控制装置100确定检测到话音声音。但是，当例如控制装置100不包括这种话音输入设备且如果检测到由外部声音输入设备(以下描述的声音输入单元)产生的声音信号或从通信目标装置接收到的外部声音信号时，控制装置100确定检测到话音声音。

如果在步骤S108中确定未检测到话音声音，则控制装置100重复从步骤S104开始的处理。

但是，如果在步骤S108中确定检测到话音声音，则控制装置100基于优先级进行音量控制(步骤S110)。

基于优先级的音量控制处理的例子

图2是由根据本公开的实施例的控制装置100基于优先级进行的音量控制处理的例子的流程图。即。图2例示了图1所示的步骤S110中进行的处理的例子。

控制装置100确定是否已经向正被再现的内容数据分配了优先级(步骤S200)。控制装置100在步骤S200中使用内容数据的元数据进行确定。

(1)未向内容数据分配优先级的情况

如果在步骤S200中确定未向正被再现的内容数据分配优先级，则控制装置100确定是否已经向与话音声音对应的用户分配了优先级(步骤S202)。那时，例如，控制装置100通过基于存储在控制装置100中的优先级信息或者从通信目标装置发送的优先级信息标识在主叫-被叫通信中分配给与话音声音对应的用户的优先级来进行步骤S202中的处理。

如果在步骤S202中确定向与话音声音对应的用户分配了优先级，则控制装置100进行以下描述的步骤S206和S208中进行的处理。

但是，如果在步骤S202中确定未向与话音声音对应的用户分配优先级，则控制装置100确定将比正被再现的内容数据的优先级更高的优先级分配给与话音声音对应的用户(步骤S204)。在此，在步骤S204中进行的处理是基于优先级的音量控制处理中的一种例外处理。

当在步骤S202中确定向与话音声音对应的用户分配了优先级或者当进行步骤S204中的处理时，控制装置100将内容声音的音量设置为比第二参考值更低的值(步骤S206)。另外，控制装置100控制话音声音的音量(步骤S208)。

注意，在图2中，例示了其中在已经进行了步骤S206中的处理之后进行步骤S208中的处理的情况。但是，控制装置100进行的音量控制处理不限于此。例如，控制装置100可以在已经进行了步骤S208中的处理之后进行步骤S206中的处理。或者，控制装置100可以同时进行步骤S206和S208中的处理。

图3例示了由根据本公开的实施例的控制装置100进行的内容声音和话音声音的音量控制的例子。

在图3中，与声音输入设备(以下描述的声音输入单元)或者外部声音输入设备(以下描述的声音输入装置)产生的声音信号对应的话音声音被称为“第一话音声音”，并且与从通信目标装置传输的外部声音信号对应的话音声音(即通信伙伴方的话音)被称为“第二话音声音”。注意，下文中，图3中所示的第一话音声音和第二话音声音统称为“话音声音”。另外，在图3中，示出了其中第二话音声音的数量是一的例子，即其中控制装置100仅与一个通信目标装置通信的例子。此外，在图3中，示出了其中第二参考值低于第一参考值的例子。但是，根据本公开的实施例的第一参考值和第二参考值之间的关系不限于此。例如，根据本公开的实施例，第二参考值可以高于第一参考值。

如图3所示的“A”所指示，如果检测到第一话音声音或者第二话音声音，则控制装置100控制内容声音的音量和话音声音的音量。更具体地，例如，控制装置100将内容声音的音量设置为低于第二参考值的值。另外，例如，控制装置100将话音声音的音量设置为高于第二参考值的第三参考值。如在此使用的，术语“第三参考值”指的是在根据本公开的实施例的音量控制处理中由控制装置100设置的话音声音的音量的最大值。另外，例如，第三参考值可以是预定值或者可通过用户操作改变的值。

尽管图3例示了其中控制内容声音的音量和话音声音的音量的例子，但是根据本公开的实施例的控制装置100进行的音量控制处理不限于此。例如，控制装置100可以选择性地控制内容声音的音量和话音声音的音量。例如，控制装置100可以将内容声音的音量设置为低于第二参考值的值而不控制话音声音的音量。或者，控制装置100可以将话音声音的音量设置为第三参考值而不控制内容声音的音量(在第一参考值＜第三参考值的情况下)。即，控制装置100可以选择性地控制内容声音的音量和话音声音的音量，使得具有更高优先级的声音增加得更多。

如图3所示的“B”所指示的，如果未检测到第一话音声音和第二话音声音，则控制装置100确定其中未检测到话音声音的状态是否持续达预定时间段(由图3所示的“C”指示的时间段)。如果控制装置100确定在预定时间段(图3中所示的“C”所指示的时间段)内还没有检测到话音声音，则控制装置100将内容声音的音量设置为第一参考值，并将话音声音的音量设置为第二参考值。因此，控制装置100再次控制内容声音的音量和话音声音的音量。当控制装置100确定其中未检测到话音声音的状态持续达预定时间段(图3中所示的“C”指示的时间段)时，控制装置100为何再次控制内容声音的音量和话音声音的音量的原因是，在主叫-被叫通信的情况下，存在在话音声音消失后随后的话音声音立即被检测到的可能性。因此，通过设置用于检测的预定时间段，可以防止由频繁的音量控制操作引起的内容声音和话音声音的音量的频繁改变。

另外，当控制装置100显著增大内容声音的音量和话音声音的音量时，控制装置100逐渐增大音量达预定时间段(例如由图3所示的“D”和“E”指示的时间段)(该操作被称为“淡入”)。另外，当控制装置100降低内容声音的音量和话音声音的音量时，控制装置100逐渐降低音量达预定时间段(例如由图3所示的“D”和“E”指示的时间段)(该操作被称为“淡出”)。那时，例如，如图3中的“D”所示，控制内容声音的音量所需的预定时间段可以被设置为与控制话音声音的音量所需的预定时间段相同。或者，例如，如图3中所示的“E”所指示，这些预定时间段可以被设置为不同的值。

例如，控制装置100以图3所示的方式控制内容声音的音量和话音声音的音量。注意，在图3中，与第二话音声音的音量同步地控制第一话音声音的音量。但是，由根据本公开的实施例的控制装置100进行的话音声音的音量的音量控制处理不限于此。例如，如果检测到多个话音声音，则控制装置100可以控制与具有更高优先级的用户对应的话音声音的音量。

话音声音的音量控制处理的例子

图4是根据本公开的实施例的控制装置100进行的话音声音的音量控制处理的例子的流程图。即，图4例示了图2中所示的步骤S208中进行的处理的例子。

如在图2所示的步骤S202中那样，控制装置100确定是否向与话音声音对应的用户分配了优先级(步骤S300)。

如果在步骤S300中确定未向与话音声音对应的用户分配优先级，则控制装置100将话音声音的音量设置为第三参考值(步骤S302)。其后，控制装置100完成话音声音的声音控制处理。

但是，如果在步骤S300中确定向与话音声音对应的用户分配了优先级，则控制装置100确定是否已经检测到多个话音声音(步骤S304)。如果在步骤S304中确定还没有检测到多个话音声音，则控制装置100进行步骤S302中的处理，其后，完成话音声音的音量控制处理。

但是，如果在步骤S304中确定已经检测到多个话音声音，则控制装置100将与具有分配给其的较高优先级的用户对应的话音声音的音量设置为第三参考值(步骤S306)。其后，控制装置100完成话音声音的音量控制处理。

那时，在步骤S306，控制装置100控制与具有较高优先级的一个或多个用户对应的话音声音的音量，并且不控制与其他用户对应的话音声音的音量。但是，根据本公开的实施例在步骤S306中进行的处理不限于此。例如，控制装置100可以根据分配给相应的用户的优先级来控制话音声音的音量。例如，通过使用包括优先级和与优先级相关的音量的查找表，控制装置100根据分配给用户的优先级设置音量。

例如，控制装置100进行图4所示的处理。因此，即使当存在多个话音声音时，控制装置100也可以根据分配给相应用户的优先级来控制话音声音的音量。应该注意，根据本公开的实施例的话音声音的音量控制处理不限于图4所示的处理。

回去参考图2，接下来描述根据本公开的实施例的控制装置100基于优先级进行的音量控制处理的例子。在完成步骤S208中的处理之后，控制装置100确定是否出现其中还未检测到话音声音达预定时间段的状态(步骤S210)。在此情况下，步骤S210中的预定时间段对应于例如图3中所示的“C”指示的时段。

如果在步骤S210中确定未出现其中还未检测到话音声音达预定时间段的状态，则控制装置100重复从步骤S208开始的处理。但是，如果在步骤S210中确定出现其中还未检测到话音声音达预定时间段的状态，则控制装置100完成基于优先级进行的音量控制处理。

(2)向内容数据分配优先级的情况

接下来描述当向内容数据分配优先级时基于优先级进行的音量控制处理的例子。如果在步骤S200中确定向正被再现的内容数据分配了优先级，则控制装置100确定是否向与话音声音对应的用户分配了优先级，如步骤S202中那样(步骤S212)。

如果在步骤S212中确定未向与话音声音对应的用户分配优先级，则控制装置100进行以下描述的步骤S216和S218中的处理。

但是，如果在步骤S212中确定向与话音声音对应的用户分配了优先级，则控制装置100确定分配给内容数据的优先级是否高于分配给与话音声音对应的用户的优先级(步骤S214)。

如果在步骤S214中确定分配给内容数据的优先级高于分配给与话音声音对应的用户的优先级，则控制装置100进行步骤S206之后的处理。

但是，如果在步骤S214中确定分配给内容数据的优先级不高于分配给与话音声音对应的用户的优先级，则控制装置100不控制内容声音的音量(步骤S216)。另外，控制装置100进行设置以使得话音声音的音量低于第一参考值(步骤S218)。

注意，图2例示了其中控制装置100在步骤S216中不控制内容声音的音量的例子。但是，根据本公开的实施例，在步骤S216中进行的处理不限于此。例如，如果确定分配给内容数据的优先级不高于分配给与话音声音对应的用户的优先级，控制装置100可以将内容声音的音量设置为比第一参考值高的值。另外，如果第二参考值低于第一参考值，控制装置100在步骤S218中将话音声音的音量设置为比第二参考值低的值。

注意，在图2中，例示了其中在已经进行步骤S216中的处理之后进行步骤S218中的处理的情况。但是，由控制装置100进行的音量控制处理不限于此。例如，控制装置100可以在已经进行步骤S218中的处理之后进行步骤S216中的处理。或者，控制装置100可以同时进行步骤S216和S218中的处理。

在完成步骤S218中的处理之后，控制装置100确定是否出现其中还未检测到话音声音达预定时间段的状态，如步骤S210中那样(步骤S220)。

如果在步骤S220中确定未出现其中还未检测到话音声音达预定时间段的状态，则控制装置100停止处理直到确定未检测到话音声音达预定时间段。但是，如果在步骤S220中确定出现其中未检测到话音声音达预定时间段的状态，则控制装置100完成基于优先级进行的音量控制处理。

通过进行例如图2所示的处理，控制装置100基于分配给内容数据的优先级和/或分配给与话音声音对应的用户的优先级来进行音量控制处理。但是，应该注意，根据本公开的实施例基于优先级进行的音量控制处理不限于图2所示的例子。

回去参考图1，接下来描述用于实现根据本公开的实施例的便利性改进方法的处理的例子。在完成步骤S110中的处理(基于优先级进行的音量控制处理)之后，控制装置100重复从步骤S100开始的处理。

控制装置100通过进行例如图1所示的处理而在主叫-被叫通信中选择性地控制被再现的内容数据的声音的音量和话音声音的音量。那时，控制装置100通过进行例如图2所示的基于优先级的音量控制处理来选择性地控制内容声音的音量和话音声音的音量，使得具有较高优先级的声音的音量变得更高。从而，控制装置100可以通过进行图1所示的处理来实现根据本公开的实施例的便利性改进方法。因此，当进行与目标通信装置的主叫-被叫通信时可以增加用户的便利性。但是，应该注意，用于实现根据本公开的实施例的便利性改进方法的处理不限于图1所示的处理。

2.根据本公开的实施例的控制装置

接下来描述可以进行与根据本公开的实施例的便利性改进方法有关的处理的根据本公开的实施例的控制装置100的配置的例子。

第一实施例

图5是根据本公开第一实施例的控制装置100的配置例子的框图。

在图5中，与控制装置100一起示出了显示系统200和通信目标装置300。显示系统200在显示屏幕上显示图像(静止图像或运动图像)，产生通过在显示屏幕的显示方向上捕捉图像获得的捕捉的图像，并输入和输出声音以便使用语音实现主叫-被叫通信。通信目标装置300经由网络400连接到控制装置100。如在此使用的，使用网络400的连接意味着装置之一经由网络与其它装置通信或者装置处于可相互通信的状态。另外，网络400的例子包括诸如局域网(LAN)或广域网(WAN)之类的有线网络、诸如经由基站的无线WAN(WWAN)之类的无线网络以及使用诸如TCP/IP(传输控制协议/因特网协议)之类的通信协议的因特网。注意，不仅使用网络400而且例如使用直接连接来进行控制装置100和通信目标装置300之间的通信。

通过使用图5所示的配置，使用控制装置100和显示系统200的用户可以使用捕捉的图像和语音通过例如视频呼叫与通信目标装置300的用户通信。注意，可以用包括例如麦克风和扬声器并输入和输出声音以便实现使用语音的主叫-被叫通信的声音输入和输出系统(未示出)替换图5所示的显示系统200。在这样的情况下，使用控制装置100和声音输入和输出系统(未示出)的用户通过语音呼叫与通信目标装置300的用户通信。

另外，图5例示了包括进行显示操作的显示装置500、进行图像捕捉操作的成像装置600、输出声音的声音输出装置700和接收声音的声音输入装置800的显示系统200的例子。但是，根据本公开的实施例的显示系统200的配置不限于上述配置。例如，显示系统200可以是其中显示装置500、成像装置600和声音输出装置700集成的装置(例如具有成像功能和声音输出功能的显示装置)。或者，显示系统200可以是具有例如显示功能、成像功能、声音输出功能和声音输入功能的单个单元。

在此配置中，通过产生通过使用显示系统200捕捉显示屏幕的显示方向上的图像获得的捕捉的图像，可以捕捉观看显示屏幕的用户的图像。从而，通过处理由显示系统200产生的捕捉的图像，控制装置100可以容易地进行例如脸部识别处理以标识分配给与话音声音对应的用户的优先级。

如图5所示，控制装置100包括存储单元102、通信单元104、输入单元106和控制单元108。

控制装置100可以进一步包括例如只读存储器(ROM)(未示出)、随机存取存储器(RAM)(未示出)以及可由用户操作的操作单元(未示出)。控制装置100经由用作数据传输路径的总线将这样的组件彼此连接。

ROM(未示出)例如存储由控制单元108使用的程序和诸如计算参数的控制数据。例如，RAM(未示出)临时存储由控制单元108执行的程序。操作单元(未示出)的例子是按钮、方向键或其组合。注意，控制装置100可以连接到用作控制装置100的外部单元的操作输入设备(例如键盘和鼠标)。

控制装置的硬件配置的例子

图6例示了根据本公开的实施例的控制装置100的硬件配置的例子。在图6中，示出用于使用语音的主叫-被叫通信的控制装置100的硬件配置的部分的例子。另外，在图6中示出了具有类似的配置的通信目标装置300(即用作通信伙伴方的其它控制装置100)。即，根据本公开的实施例的控制装置100的硬件配置不限于图6所示。例如，控制装置100包括用作存储单元102的记录介质(未示出)和用作输入单元106的输入和输出接口(未示出)。另外，在图6中，示出了包括用作声音输出装置700并由扬声器形成的声音输出设备700A(对应于以下描述的声音输出单元)的控制装置100的例子。

提供记录介质(未示出)作为控制装置100的存储单元。记录介质存储例如用户信息、优先级信息、内容数据和应用。记录介质的例子包括诸如硬盘的磁记录介质、以及非易失性存储器，诸如电可擦除可编程只读存储器(EEPROM)、闪存、磁阻随机存取存储器(MRAM)、铁电随机存取存储器(FeRAM)或者相位改变随机存取存储器(PRAM)。另外，控制装置100可以包括可从控制装置100移除的记录介质(未示出)。

输入和输出接口(未示出)的例子包括声音输入端子、声音输出端子、通用串行总线(USB)端子、数字视频接口(DVI)端子、高清多媒体接口(HDMI)端子和各种处理电路。

如图6所示，控制装置100包括例如通信模块150、MPU 152、内容数据处理电路154、模拟到数字(AD)转换器156、混音器158和放大器160。通信目标装置300包括例如通信模块350、MPU 352、内容数据处理电路354、AD转换器356、混音器358和放大器360。因为通信目标装置300的组件可以具有与以下描述的控制装置100的相应组件相同的配置，因此以下不提供通信目标装置300的描述。

通信模块150被提供为控制装置100的通信单元。通信单元150用作经由网络400(或直接)有线或无线地与诸如显示系统200、通信目标装置300或者服务器(未示出)之类的外部装置通信的通信单元104。通信接口(未示出)的例子包括通信天线和RF电路、IEEE 802.15.1端口及发送和接收电路、IEEE 802.11b端口及发送和接收电路以及LAN端子及发送和接收电路。

注意，控制装置100可以使用例如通信模块150和/或输入和输出接口(未示出)与显示系统200传递声音信号和图像信号。因而，在根据本公开的实施例的控制装置100中，通信模块150可以用作通信单元104和输入单元106。另外，在图6中，控制装置100仅包括一个通信模块150。但是，根据本公开的实施例的控制装置100的配置不限于此。例如，控制装置100可以包括多个通信模块，通信模块之一可以用作通信单元104，并且其他通信模块可以用作输入单元106。

MPU 152由包括微处理单元(MPU)和用于实现诸如语音印记验证处理、面部识别处理和图像处理之类的各种功能的多个电路的集成电路形成。MPU152用作进行控制装置100的整体控制的控制单元152。另外，在控制装置100中，MPU 152用作例如再现处理单元110、检测单元112、确定单元114、音量控制单元116和显示控制单元118。注意，尽管在图5中，控制装置100包括与MPU 152分离的内容数据处理电路154和混音器158，控制装置100的配置不限于这样的配置。例如，在根据本公开的实施例的控制装置100中，MPU 152可以具有内容数据处理电路154的功能和混音器158的功能。

例如，MPU 152使用语音印记识别执行声音标识程序，并处理从AD转换器156发送的声音数据1。因此，MPU 152标识与声音数据1中包括的话音声音对应的用户(图6所示的例子中的用户A)。其后，MPU 152将与所标识的用户有关的用户信息经由通信模块150(称为信号线L1)发送到通信目标装置300。

另外，例如，MPU 152执行混音器控制程序，该混音器控制程序基于优先级进行音量控制处理。因此，MPU 152使用发送的用户信息、经由通信模块150(称为信号线L2)从通信目标装置300发送的用户信息和正再现的内容数据的优先级来控制混音器158。

内容数据处理电路154进行与内容数据的再现有关的处理。内容数据处理电路154的例子是诸如编码器和解码器之类的各种电路集成到其中的集成电路。内容数据处理电路154再现表示内容声音的声音数据3，并将声音数据3发送到混音器158。

AD转换器156将从声音输入装置800A接收的声音信号1转换成声音数据1。声音数据1可以包括例如用户A的话音声音和/或从声音输出设备700A输出的声音。其后，AD转换器156将声音数据1发送到通信模块150(称为信号线L3)。因此，声音数据1被发送到通信目标装置300。另外，AD转换器156将声音数据1发送到MPU 152和混音器158。

在MPU 152的控制下，混音器158控制声音数据1、包括话音声音并经由通信模块150(称为信号线L4)发送的声音数据2以及表示内容声音的声音数据3的音量。

由混音器158控制的声音数据被转换成声音信号并被放大器160放大。其后，声音信号被发送到声音输出设备700A。从而，从声音输出设备700A输出具有通过基于优先级的音量控制处理而控制的音量的内容声音和话音声音。

控制装置100具有例如图6所示的配置，并实现根据便利性改进方法的处理。但是，应该注意，根据本公开的实施例的控制装置100的配置不限于图6的配置。

回去参考图5，描述根据本公开的第一实施例的控制装置100的配置的例子。提供存储单元102作为控制装置100的存储单元。存储单元102的例子包括诸如硬盘的磁记录介质和诸如闪存的非易失性存储器。

存储单元102存储例如用户信息、优先级信息、内容数据和应用。在图5中，作为例子，用户信息130、优先级信息132和内容数据134存储在存储单元102中。

提供通信单元104作为控制装置100的通信单元。通信单元104经由网络400(或直接)有线或无线地与诸如显示系统200、通信目标装置300或服务器(未示出)之类的外部装置通信。控制装置100使用通信单元104与至少一个通信目标装置通信，并可以进行主叫-被叫通信(使用语音或者捕捉的图像和语音两者的主叫-被叫通信)。另外，通信单元104在控制单元108的控制下进行通信。

通信单元104的例子包括通信天线和RF电路以及LAN端子及发送和接收电路。但是，通信单元104不限于此。例如，通信单元104可以具有可经由网络400与外部装置通信的任意配置。

例如，输入单元106接收由捕捉图像的成像装置600产生的捕捉的图像和由声音输入装置800产生的声音信号。其后，输入单元106将接收的(输入的)捕捉的图像和声音信号发送到控制单元108。输入单元106的例子包括声音输入端子、声音输出端子、USB端子、DVI端子、HDMI端子和各种处理电路。但是，输入单元106不限于此。例如，输入单元106可以具有可以从外部装置有线或无线地接收捕捉的图像和声音信号的任意配置。

另外，在接收到由声音输入装置800产生的距离数据后，输入单元106将该距离数据发送到控制单元108。

控制单元108由其中集成诸如MPU、内容数据处理电路和混音器之类的各种处理电路的集成电路形成。控制单元108进行控制装置100的整体控制。此外，控制单元108包括再现处理单元110、检测单元112、确定单元114、音量控制单元116和显示控制单元118。因此，控制单元108在按照根据本公开的实施例的便利性改进方法的处理中起着主要作用。

再现处理单元110再现存储在存储单元102中的内容数据或者从诸如通信目标装置300或者服务器(未示出)之类的外部装置发送并由通信单元104接收的内容数据。

检测单元112基于从输入单元106发送的声音信号和由通信单元104接收的外部声音信号来检测主叫-被叫通信中用户的话音声音。

确定单元114确定是否进行音量控制。更具体地，确定单元114基于例如确定音量控制的开/关的硬件开关或软件开关的状态、捕捉的图像和距离信息进行图1所示的步骤S104中的处理。

注意，在图5中，控制装置100包括确定单元114。但是，根据本公开的实施例，控制装置100的配置不限于此。例如，控制装置100可以具有不包括确定单元114的配置。在这样的情况下，控制装置100在确定要在图1所示的步骤S104中进行音量控制时进行按照根据本公开的实施例的便利性改进方法的处理。

音量控制单元116在基于优先级进行的音量控制处理中起着主要作用。更具体地，音量控制单元116例如基于分配给由再现处理单元再现的内容数据和与检测单元检测到的话音声音对应的用户的优先级进行图2所示的处理。其后，音量控制单元116将与具有控制的音量的声音对应的声音信号经由通信单元104发送到声音输出装置700。随后，声音输出装置700输出具有控制的音量的声音。

另外，当音量控制单元116控制内容声音的音量或者话音声音的音量时，音量控制单元116逐渐增加或降低音量使得实现淡入或淡出。

此外，如果确定单元114确定要进行音量控制，则音量控制单元116选择性地控制内容声音的音量和话音声音的音量。因为音量控制单元116根据确定单元114进行的确定结果来控制音量，因此控制装置100可以基于硬件开关或软件开关的状态、用户进行的预定运动或者用户和声音输入装置800之间的距离来选择性地使能或禁用音量控制。

显示控制单元118控制在显示屏幕上的图像的显示。更具体地，如果例如再现处理单元110再现与包括图像的内容有关的内容数据，则显示控制单元118使得显示装置500或者包括在显示控制单元118中的显示单元(以下描述)显示图像。另外，例如，当控制装置100使用捕捉的图像和语音进行与通信目标装置300的主叫-被叫通信时，显示控制单元118同时在显示屏幕中显示由再现处理单元110再现的内容数据表示的图像和由通信单元104从通信目标装置300接收的捕捉的图像。或者，例如，当控制装置100使用捕捉的图像和语音进行与通信目标装置300的主叫-被叫通信时，除了由内容数据表示的图像之外，显示控制单元118还可以在显示屏幕中显示由输入单元106接收的捕捉的图像。即，显示控制单元118将用于主叫-被叫通信的捕捉的图像与例如由内容数据表示的图像一起显示在显示屏幕中。

另外，当内容数据表示的图像和捕捉的图像同时显示在显示屏幕中时，显示控制单元118例如结合音量控制单元116进行的内容声音的音量和话音声音的音量的选择性音量控制来改变内容数据表示的图像与用于主叫-被叫通信的捕捉的图像的显示比率。

根据本公开的第一实施例，控制装置100可以通过图5所示的配置实现根据该便利性改进方法的处理。从而，通过采用例如图5所示的配置，当进行与至少一个通信目标装置的主叫-被叫通信时，控制装置100可以改进用户便利性。但是，应该注意，根据本公开的第一实施例的控制装置100的配置不限于此。

第二实施例

图7是根据本公开的第二实施例的控制装置100的配置示例的框图。像图5中那样，在图7中，还示出了经由网络400连接的通信目标装置300。

如图7所示，根据本公开的第二实施例，控制装置100具有基本类似于图5所示的根据第一实施例的控制装置100的配置。但是，不像图5所示的根据第一实施例的控制装置100那样，根据第二实施例的控制装置100不包括输入单元106，并且进一步包括声音输入单元120、成像单元122、显示单元124和声音输出单元126。

提供声音输入单元120作为控制装置100的声音信号产生单元。声音输入单元120的例子是麦克风。注意，声音输入单元120可以是可从控制装置100移除的。

另外，声音输入单元120可以包括测量声音输入单元120和用户之间的距离的距离传感器。因此，声音输入单元120可以产生距离信息。但是，控制装置100的配置不限于其中声音输入单元120包括距离传感器的配置。例如，声音输入单元120可以具有与声音输入单元120的主体分离的、用作距离信息产生单元(未示出)的距离传感器。

提供成像单元122作为控制装置100的成像单元。成像单元122捕捉显示单元124的显示屏幕的显示方向上的图像并产生捕捉的图像。注意，如果根据本公开的第二实施例的控制装置100不具有使用捕捉的图像和语音进行主叫-被叫通信的功能，则控制装置100可以具有不包括成像单元122的配置。

成像单元122的例子是包括例如包含镜头和图像传感器对以及信号处理装置的成像设备。在该成像设备中，包括了光学镜头和包括诸如电荷耦合器件(CCD)或者互补金属氧化物半导体(CMOS)之类的多个成像元件。信号处理电路包括例如自动增益控制(AGC)电路和AD转换器。信号处理电路将由图像传感器产生的模拟信号转换成数字信号(图像数据)并进行各种信号处理。信号处理电路进行的信号处理的例子包括例如白平衡校正处理、内插处理、色调校正处理、伽马校正处理、YCbCr转换处理、边缘增强处理和编码处理。

提供显示单元124作为控制装置100的显示单元。显示单元124显示各种类型的信息和图像。在显示单元124上显示的屏幕的例子包括显示由内容数据表示的图像的内容显示屏幕、显示用于主叫-被叫通信的捕捉的图像的屏幕和用于指令控制装置100进行期望的操作的操作屏幕。注意，在上述显示用于主叫-被叫通信的捕捉的图像的屏幕中，捕捉的图像和由内容表示的图像可以按平行或者重叠的方式显示。

显示单元124的例子包括液晶显示器(LCD)、有机电致发光显示器和有机发光二极管(OLED)显示器。

提供声音输出单元126作为控制装置100的声音输出单元。声音输出单元126输出各种声音、比如内容声音、用于主叫-被叫通信的话音声音和控制装置100的系统声音。

声音输出单元126的例子是包括数字信号处理器(DSP)、放大器和扬声器的声音输出设备。

根据第二实施例，控制装置100具有基本类似于图5所示的根据第一实施例的控制装置100的配置。因此，像根据第一实施例的控制装置100那样，通过采用图7所示的配置，根据第二实施例的控制装置100可以实现根据便利性改进方法的处理。因此，通过采用例如图7所示的配置，控制装置100可以改进在进行与至少一个通信目标装置的主叫-被叫通信时用户的便利性。但是，应该注意，根据第二实施例的控制装置100的配置不限于图7所示的配置。例如，像图5所示的根据第一实施例的控制装置100那样，根据第二实施例的控制装置100可以包括输入单元106。

如上所述，根据本公开的实施例的控制装置100基于分配给正被再现的内容数据的优先级和/或分配给与检测到的话音声音对应的用户的优先级来选择性地控制内容声音的音量和话音声音的音量。因此，通过根据设置的优先级动态地控制音量，控制装置100可以将内容声音的音量增大到比话音声音的音量更响的音量。或者，控制装置100可以将话音声音的音量增大到比内容声音的音量更响的音量。

以此方式，控制装置100可以在降低上述不期望的情形出现的可能性的同时控制音量，因此，控制装置100可以增加与目标通信装置的主叫-被叫通信中的用户便利性。

尽管已经参考控制装置100描述了本公开的实施例，但是本公开的实施例不限于此。例如，本公开的实施例可应用于各种装置，比如计算机(例如PC或服务器)、显示装置(例如电视接收机或者标志(signage)装置)、便携式通信装置(例如蜂窝电话)、视频/音乐回放装置(或者视频/音乐记录和再现装置)、游戏控制台和机顶盒。

尽管已经参考显示系统200描述了本公开的实施例，但是本公开的实施例不限于此。例如，本公开的实施例可应用于各种装置，比如计算机(例如PC)、显示装置(例如电视接收机或者标志装置)和便携式通信装置(例如蜂窝电话)。注意，根据本公开的实施例的显示系统200可以是用于显示图像的装置、用于捕捉图像的装置、用于产生声音信号的装置和用于输出声音的装置的组合。

3.根据本公开的实施例的程序

通过使用使得计算机用作根据本公开的实施例的控制装置的程序(例如实现图1、2和4所示的按照根据本公开的实施例的便利性改进方法的处理的程序)，当进行与通信目标装置的主叫-被叫通信时，可以增加用户的便利性。

尽管已经参考附图描述了根据本公开的示例实施例，但是应该认识到，本公开不限于这样的示例实施例。很显然许多替换、修改和变更对本领域技术人员来说显然在所附权利要求的精神和宽广范围内。即，意图覆盖落在本公开的精神和技术范围内的所有这样的替换、修改和变更。

例如，根据本公开的实施例的控制装置100可以单独地包括图5和图7中所示的再现处理单元110、检测单元112、确定单元114、音量控制单元116和显示控制单元118(例如控制装置100可以由独立的处理电路形成)。

另外，尽管已经参考提供的使得计算机用作根据本公开的实施例的控制装置的程序(计算机可读程序)进行以上描述，但是本公开的实施例也可以提供具有在其上记录的上述程序的诸如非暂时性记录介质的记录介质。

上述配置仅仅是本公开的实施例的例子，因此被包含在本公开的技术范围内。

Claims

1.一种控制装置，包括：

控制单元，根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和所述话音声音的音量，其中，所述控制单元标识用户和记录的用户信息，该记录的用户信息包括关于所述用户的话音信息或指示用户的脸的特征的脸部信息；

其中，当要基于优先级进行音量控制时，所述控制单元基于所分配的优先级选择性地控制所述内容声音的音量和所述话音声音的音量，以使得具有较高优先级的声音的音量变得比其它声音的音量更响，

其中，所述控制单元同时控制显示屏幕中的内容的图像和与话音声音对应的用户的图像的显示，并且

其中，所述控制单元基于分配的优先级而控制内容的图像相对于与话音声音对应的用户的图像的显示比率。

2.如权利要求1所述的装置，其中，所述控制单元通过逐渐增加具有较高优先级的声音的音量来控制所述具有较高优先级的声音的音量以变得更响。

3.如权利要求2所述的装置，其中，当具有较高优先级的声音的音量正逐渐增加时，所述控制单元逐渐降低另一声音的音量。

4.如权利要求1所述的装置，其中，所述话音声音包括多个话音声音，以及

其中，当要基于优先级进行音量控制，并且话音声音基于分配的优先级而具有比内容声音更高的优先级时，所述控制单元根据分别分配给与所述多个话音声音对应的用户的优先级来选择性地控制所述多个话音声音的音量。

5.如权利要求1所述的装置，其中，当要基于优先级进行音量控制，并且内容声音基于分配的优先级而具有比话音声音更高的优先级时，所述控制单元将话音声音的音量设置为低于参考值的值，其中所述内容声音的音量被初始设置为所述参考值。

6.如权利要求1所述的装置，其中，当要基于优先级进行音量控制，并且话音声音基于分配的优先级而具有比内容声音更高的优先级时，所述控制单元将内容声音的音量设置为低于参考值的值，其中所述话音声音的音量被初始设置为所述参考值。

7.如权利要求1所述的装置，其中，当未向与话音声音对应的用户和内容数据分配优先级时，所述控制单元将较高的优先级分配给与话音声音对应的用户和内容数据中的一个。

8.如权利要求1所述的装置，其中，所述控制单元基于指示在与话音声音对应的用户和声音输入设备之间的距离的距离信息来进行音量控制。

9.一种控制方法，包括：

由处理器根据分配给与话音声音对应的用户的优先级和分配给内容数据的优先级来选择性地控制内容声音的音量和话音声音的音量，其中，控制单元标识用户和记录的用户信息，该记录的用户信息包括关于所述用户的话音信息或指示用户的脸的特征的脸部信息；

其中，当要基于优先级进行音量控制时，基于所分配的优先级选择性地控制所述内容声音的音量和所述话音声音的音量，以使得具有较高优先级的声音的音量变得比其它声音的音量更响，

其中，同时控制显示屏幕中的内容的图像和与话音声音对应的用户的图像的显示，并且

其中，基于分配的优先级而控制内容的图像相对于与话音声音对应的用户的图像的显示比率。