CN111800280B - 听力设备系统中讲话者的优先化 - Google Patents
听力设备系统中讲话者的优先化 Download PDFInfo
- Publication number
- CN111800280B CN111800280B CN202010267903.1A CN202010267903A CN111800280B CN 111800280 B CN111800280 B CN 111800280B CN 202010267903 A CN202010267903 A CN 202010267903A CN 111800280 B CN111800280 B CN 111800280B
- Authority
- CN
- China
- Prior art keywords
- user
- speaker
- hearing device
- score
- speaking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012913 prioritisation Methods 0.000 title abstract description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000004590 computer program Methods 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000007423 decrease Effects 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010370 hearing loss Effects 0.000 description 2
- 231100000888 hearing loss Toxicity 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/185—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with management of multicast group membership
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1881—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with schedule organisation, e.g. priority, sequence management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42391—Systems providing special services or facilities to subscribers where the subscribers are hearing-impaired persons, e.g. telephone devices for the deaf
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/50—Aspects of automatic or semi-automatic exchanges related to audio conference
- H04M2203/5072—Multiple active speakers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明涉及听力设备系统中讲话者的优先化。提出了一种用于控制听力设备(12)的方法。每个听力设备(12)由用户(24)佩戴,听力设备(12)彼此通信地互连以用于数据交换以形成听力设备系统(10)。该方法包括:利用用户(24)的听力设备(12)的麦克风(14)获取每个用户(24)的声音信号(30);从声音信号(30)确定讲话者信号(34),该讲话者信号(34)表明用户(24)是否是讲话用户(28);从用户(24)的讲话者信号(34)确定每个用户(24)的优先级分数(36);以及经由用户的听力设备(12)将来自讲话用户(28)的声音信号(30)输出到用户(24),使得来自具有小于阈值的优先级分数(36)的讲话用户(28)的声音信号被静音。
Description
技术领域
本发明涉及一种用于控制听力设备的方法,计算机程序,计算机可读介质和系统。
背景技术
在一些听力设备中,可以集成无线网络,这可以改善听力设备的用户之间的噪声中的通信。听力设备可以适于利用其集成的麦克风来拾取用户的语音,可以经由无线网络将获取的音频信号传输到其他听力设备,并且可以经由另一听力设备的集成扬声器使所拾取的语音可听见。
与多个参与者进行的对话有被混乱和低效的风险。尤其是听力受损的人可能难以参与与占主导地位的讲话者的讨论,该讲话者给了其他人很少的参与时间。
US 7 330 541 B1描述了一种会议系统,该会议系统在适当的时间提供自动会议节制,以抑制正在进行的会议中的混乱。会议桥可以提供多模式讲话者选择,以为无序会议提供自动会议节制。
发明内容
本发明的目的是提供一种自动化的方法,其中在由多个听力设备构成的听力系统中的信噪比增加了,其中音频信号从活跃的讲话者被发送到听力设备的其他用户。
该目的通过独立权利要求的主题解决。根据从属权利要求和以下描述,其他示例性实施例是显而易见的。
本发明的一方面涉及一种用于控制听力设备的方法,每个听力设备由用户佩戴,所述听力设备彼此通信地互连以用于数据交换以形成听力设备系统。
听力设备可包括处理器,麦克风,扬声器,存储器和/或壳体,以及其他电子和机械组件。听力设备的示例有耳后(BTE),耳道内接收器(RIC),耳内(ITE),耳道完全(CIC)和耳道不可见(IIC)设备。听力设备可以是适于补偿用户的听力损失的助听器。
每个听力设备可以包括数据通信接口,使得其适于与其他听力设备进行通信。
根据本发明的实施例,该方法包括:利用用户的听力设备的麦克风来获取每个用户的声音信号。当听力设备的用户例如在会务或会议期间进行对话时,可以使用该方法和听力设备系统。在对话期间,听力设备的麦克风可以获取用户语音的声音信号。听力系统可以将该声音信号传输到听力系统的其他听力设备,在这里它可以由其他听力设备的扬声器输出。
根据本发明的实施例,该方法包括:从声音信号确定讲话者信号,该讲话者信号表明该用户是否是讲话用户。每个听力设备可以适于自己的声音检测。当语音信号的幅度大于阈值时,例如可以使用波束形成器从音频信号中提取用户的语音信号,并且讲话者信号可以为1。否则,讲话者信号可以是0。本文提到的音频信号,语音信号,讲话者信号和其他信号可以是数字信号。特别地,它们可以是时间相关的信号。
根据本发明的实施例,该方法包括:从用户的讲话者信号确定每个用户的优先级分数。优先级分数可以是指示符和/或数值,其表明用户关于讲话的优先级。例如,当用户开始讲话时,优先级分数可能为高并且当用户继续讲话时,优先级分数可能会降低。
根据本发明的实施例,该方法包括:经由用户的听力设备将来自讲话用户的声音信号输出到用户,使得来自具有小于阈值的优先级分数的讲话用户的声音信号被静音。讲话用户可以是具有表明他正在讲话的讲话者信号的用户。可能是诸如从在第一听力设备处获取的音频信号中提取的语音信号之类的经处理的声音信号被发送到第二听力设备。音频信号也可能是由第二听力设备输出的。
使音频信号静音可能意味着音频信号根本不在听力设备处输出。也可能是通过用作为未静音的音频信号的较高的因子减弱音频信号而使音频信号静音。
特别地,仅具有特定优先级分数的用户的那些音频信号可以在听力设备处输出。因此,可以减少听力设备输出的音频信号的数量,这可以增加听力设备处的信噪比。因此,尤其可以支持听障人士跟随有许多讲话者的讨论。
优先级分数可以是数值,对于具有较高讲话优先级的用户而言可以更高。利用阈值用户的优先级分数通过固定阈值或动态阈值被比较。例如,可以确定阈值,以使得允许最大特定数量的用户讲话。
根据本发明的实施例,所述方法包括:从讲话者信号为每个用户确定讲话的时间。通常,可以确定实际讲话时间和/或总讲话时间。实际讲话时间可以是自从用户已经开始讲话而没有停止的时间。总讲话时间可以是自从特定的时间点(例如会务或会议的开始)用户已经讲话期间的时间。
根据本发明的实施例,当用户的实际讲话时间高于阈值时,降低用户的优先级分数。当用户开始讲话时,优先级分数可以被设置为起始值。在特定时间(例如5分钟)后,该起始值可能会不断降低。
根据本发明的实施例,当用户的总讲话时间高于另一用户的总讲话时间时,降低该用户的优先级分数。可以根据用户的总讲话时间对其进行排序。具有较高总讲话时间的用户可能比具有较低总讲话时间的用户具有较低或降低的优先级分数。
根据本发明的实施例,从用户的讲话者信号和来自其他用户的讲话者信号来确定用户的优先级分数。所有讲话者信号都可以被用于对用户进行优先化。当在另一个用户正在讲话期间,用户的讲话者信号表明开始讲话时,可以降低用户的优先级分数。可以从讲话者信号中确定何时一个用户正在中断另一用户。对另一个用户进行解释的用户可能会收到较低或降低的优先级分数。
根据本发明的实施例,从讲话者信号中为用户确定实际讲话时间、总讲话时间和讲话者中断(interruption)中的至少一个,并且通过加权实际讲话时间、总讲话时间和讲话者中断中的至少一个来确定用户的优先级分数。例如,可以为这些属性中的一个、两个或多个赋予数值,该数值可以乘以权重因子,并且可以相加。实际和总讲话时间可以以时间单位(例如秒)确定。讲话者中断可以被提供为数字。
根据本发明的实施例,该方法包括:从用户的讲话者信号确定每个用户的惩罚分数。可能的是,除了优先级分数之外,还确定了与优先级分数无关的惩罚分数。惩罚分数可以表明应该从对话中排除的用户。例如,当惩罚分数高于阈值时,可以使用户的声音信号静音。可能优先级分数将允许用户讲话,但是该用户具有惩罚分数,这导致用户的静音。
根据本发明的实施例,用户的惩罚分数取决于用户的讲话者信号有多频繁地表明了在另一用户正在讲话期间该用户开始讲话的次数。换句话说,可以从用户的讲话者中断来确定用户的惩罚分数。但是,还可以检测其他行为,这可能导致惩罚分数的增加,例如喊叫,即语音信号的幅度高于阈值。
根据本发明的实施例,为用户分配不同的用户角色。例如,可以将一个或多个用户声明为主持人、教师等,即,人,其被允许比其他用户更频繁地讲话。可以利用连接到听力系统的辅助设备的用户界面来执行分配。
可以取决于用户的用户角色来确定用户的优先级分数。例如,不同的角色可能具有不同的权重,这些权重用于从实际和总讲话时间,讲话者中断等来计算优先级分数。
根据本发明的实施例,该方法包括:从用户的惩罚分数确定对话混乱值。用户的惩罚分数越高,则对话的顺序就越低。例如,增加的讲话者中断和/或增加的喊叫用户可能表明对话更加混乱。可以通过添加惩罚分数来确定表明对话的该顺序/混乱的对话混乱值,该惩罚分数可以被加权。
根据本发明的实施例,通过加权惩罚分数从惩罚分数确定对话混乱值。例如,惩罚分数可以取自三个类别,例如“绿色”、“黄色”和“红色”,并且这些类别可以被不同地加权。例如,“红色”可以具有比“黄色”较高的权重值。
根据本发明的实施例,基于对话混乱值来选择用于使用户静音的优先级分数的阈值。例如,当对话混乱值低时,阈值可能高,并且根本没有用户被静音。当对话混乱值增加时,可以选择阈值,使得仅一些用户的音频信号被转发给其他用户。对于高的对话混乱值,例如高于预定阈值的对话混乱值,可以选择优先级分数阈值,以使除一个用户之外的所有用户被静音。
根据本发明的实施例,通过加权实际讲话时间、总讲话时间和讲话者中断中的至少一个来确定用户的优先级分数,并且基于对话混乱值来选择加权。另一种可能性是根据对话混乱值来调整优先级分数的加权。例如,对于较低的对话混乱值,与较高的对话混乱值相比,可能不考虑或以较低的权重考虑实际讲话时间和/或讲话者中断的次数。
本发明的其他方面涉及一种用于控制听力设备的计算机程序,该计算机程序在由处理器执行时适于执行如上和下文所述的方法,并且涉及一种计算机可读介质,在其中存储了这样的计算机程序。计算机可读介质可以是硬盘,USB(通用串行总线)存储设备,RAM(随机存取存储器),ROM(只读存储器),EPROM(可擦除可编程只读存储器)或闪存。计算机可读介质还可以是数据通信网络,例如互联网,其允许下载程序代码。通常,计算机可读介质可以是非暂时性或暂时性介质。
本发明的另一方面涉及一种听力设备系统,其包括多个听力设备,每个听力设备由用户佩戴并且所述听力设备彼此通信地互连以进行数据交换,其中,所述听力设备系统适于执行上面和下面描述的方法。例如,该方法可以完全由听力设备的处理器执行。然而,也可能是该方法的某些步骤是由用户携带的辅助设备(例如智能电话)执行的,和/或该方法的某些步骤是由可连接听力设备的互联网服务器执行的。
必须理解,上文和下文所述方法的特征可以是上文和下文所述计算机程序,计算机可读介质和听力系统的特征,并且反之亦然。
根据下文描述的实施例,本发明的这些和其他方面将变得显而易见并得到阐明。
附图说明
下面,参照附图更详细地描述本发明的实施例。
图1示意性地示出了根据本发明的实施例的听力设备系统。
图2示意性地示出了根据本发明的另一实施例的听力设备系统。
图3示出了根据本发明的实施例的用于控制听力设备的方法的流程图。
在参考标记列表中以摘要形式列出了附图中使用的参考标记及其含义。原则上,图中相同的部分具有相同的参考标记。
具体实施方式
图1示出了听力设备系统10,该听力设备系统10包括多个听力设备12。每个听力设备12可以由用户戴在他的头上,例如戴在耳朵后面和/或耳朵中。
每个听力设备12包括麦克风14,处理器16和输出设备18,例如扬声器。输出设备18还可以适于供应耳蜗植入物。在操作模式中,听力设备12利用麦克风14获取声音信号,处理器16处理该声音信号,例如以补偿用户的听力损失,并通过输出设备18输出处理后的声音信号。
每个听力设备12还包括用于与另一听力设备12(或另外的设备)进行无线数据通信的通信接口20。听力设备系统10中的所有听力设备12可以以这种方式彼此互连和/或可以形成通信网络。在另一种操作模式中,利用该听力设备12之一的麦克风获取的声音信号可以经由该网络被传输到另一个听力设备12,并可以利用另一个听力设备12的输出设备18在那里被输出。
听力设备12可以经由通信接口20与辅助设备22通信地互连,辅助设备22也可以由用户携带。例如,辅助设备22可以是智能电话。一个,一些或所有用户可以携带这样的辅助设备22。
图2示出了听力设备系统10的另一实施例,该系统由在对话中坐在桌子26周围的若干用户24使用。每个用户在他或她的耳朵后面佩戴一个或两个听力设备12。如图2所示,听力设备12可以与诸如智能电话或网络设备22’的辅助设备22彼此通信。
例如,讲话者28的声音可以被相应的听力设备拾取,并经由通信接口20流传输到辅助设备22和/或网络设备22’。如上和如下所述,网络设备22’可以混合流,即音频信号,并且可以将混合后的音频信号发送回听力设备12,在该听力设备12处输出混合后的音频信号。必须注意,这些方法步骤也可以由听力设备12单独和/或由例如经由网络设备22’连接到听力设备12的服务器执行。
辅助设备22和/或网络设备22’可以具有用户界面,用户24可以使用该用户界面来改变听力设备系统10的设置,例如对话期间用户的角色。
通常,听力设备12与网络设备22’之间的数据流(可能包括获取的音频信号)可能是专有的。用户24的辅助设备22与用户24的听力设备12之间和/或辅助设备22与网络设备22’之间和/或听力设备12与网络设备22’之间的元数据的交换可能是经由蓝牙。替选地,可以经由蓝牙来传送数据流和/或音频信号。
图3示出了用于控制图1或2的听力设备12和/或听力设备系统10的方法的流程图。该方法可以由听力设备12自动执行(例如,由其处理器执行),即听力设备系统10可被视为分布式系统。还可能的是,该方法至少部分地由一个或多个辅助设备22,网络设备22’执行,和/或由经由互联网连接到听力设备12、网络设备22’和/或一个或多个辅助设备22的服务器执行。方法步骤或方法步骤的至少一部分可以在基于云的系统中执行。
在步骤S10中,利用用户24的听力设备12的麦克风14为每个用户24获取声音信号30。必须注意,声音信号30可以包括数字化数据和/或可以由数据包构成。声音信号30可以表明在用户24附近和/或由用户24产生的声音。特别地,当用户24讲话时,相应的声音信号通常包含具有相当高的信噪比的用户的声音。
没有听力设备的人可能也是对话的参与者,并且这些人可能正在使用带有麦克风的辅助设备22以直接用于获取声音信号。这些声音信号可以在下文中被处理为由听力设备12获取的声音信号30。
在步骤S12中,从用户24的声音信号30为每个用户24确定语音信号32和讲话者信号34。例如,波束形成器系统可以被用来拾取用户24自己的声音和/或被用来从声音信号30中提取语音信号32。
例如,通过假设当声音信号30的电平高于阈值时,对应的用户正在讲话,可以直接从声音信号30确定讲话者信号34。讲话者信号34可以是随时间变化的信号,其值为1(用户正在讲话)和0(用户没有正在讲话)。
在步骤S14中,从用户24的讲话者信号34确定每个用户24的优先级分数36和可选的惩罚分数38。作为讲话者信号34,优先级分数36和惩罚分数38可以是随着时间的信号和/或可能采用在某个时间点处的特定数值。
可以从讲话的时间确定用户24的优先级分数36,该讲话的时间由相应的讲话者信号34确定。实际的讲话的时间可以是自从用户24已经开始讲话以来的时间。总讲话时间可以是所有实际讲话时间的总和。
通常,当用户24的讲话的时间增加时,优先级分数36降低。例如,当用户的实际讲话时间高于阈值时,可以降低用户24的优先级分数36。还可能的是,当用户24的总讲话时间高于另一个用户24的总讲话时间时,用户24的优先级分数36降低。下表中示出了其具体示例。
也可能是,当用户的讲话者信号34表明在另一个用户24正在讲话期间所述用户24开始讲话时,即,当所述用户24中断另一个用户时,用户24的优先级分数36降低。
上述值也可以用权重值加权,并且可以将结果求和以确定优先级分数36。例如,通过对实际讲话时间、总讲话时间和讲话者中断中的至少一个进行加权来确定用户24的优先级分数36。
以下,示出了用于确定用户24的优先级分数36的中间值的示例。对于特定的值和属性(例如实际讲话时间,总讲话时间等),提供了如何能够计算中间值/加权值的规则。通常,使用以下符号:s1=规则1的分数,w1=规则1的权重,…,u1=用户1)。
通常,优先级分数36越高,用户24的优先级越高。相反,属性值越低,用户24的优先级越高。属性的值可能与分数相反,即优先级=1为最高。
计算优先级分数(priority score)的另一个示例是
Priority_score(u1)=w1*s1+w2*s2+w3*s3-w*s4
即,可以通过对不同属性的分数加权来确定优先级分数。
辅助设备22有可能提供显示优先级分数36的用户界面。每个用户24可以看到其优先级分数36,其优先级以及其评分的理由。利用该用户界面,用户24还可以表明他接下来想要提高他的语音(参见上表的属性3)。
如表中所示,还可以为每个用户24确定惩罚分数38。作为优先级分数,可以从用户24的讲话者信号34确定每个用户24的惩罚分数38。例如,用户24的惩罚分数38可以取决于用户的讲话者信号34有多频繁地表明了在另一个用户正在讲话期间用户24开始讲话的次数。
在表的示例中,惩罚分数38包括四个不同的值,其可以用不同的颜色表示。颜色“绿色”表示没有惩罚,颜色“红色”表示最大可能的惩罚。惩罚分数38的影响可能是用户的讲话在10分钟的持续时间内不被流传输到其他用户,即,在此持续时间内,他的音频信号30可以被静音。在持续时间之后,惩罚分数38可以减小一个值,例如从“橙色”减小到“黄色”。当对话结束时,所有惩罚分数38可被重置为零。如果用户为此具有管理员和/或主持人角色,则还可以由用户通过用户界面来设置惩罚分数38的重置。
通常,上表中的属性可能仅对优先级分数36,仅对惩罚分数38或对优先级分数36和惩罚分数38有所贡献。
如上所述,可以将用户24分配给不同的用户角色。这样的用户角色可以是会议负责人,演示者,默认/来宾,会议主持人等。根据不同的用户角色,可以为用户分配不同的规则。演示者可能没有讲话持续时间限制。会议主持人可以设置用户规则以在主持期间支持其自己。会议主持人可能会放松其惩罚分数38。
可以取决于用户24的用户角色来确定用户24的优先级分数36和/或惩罚分数38。例如,可以定义权重,合并哪些规则以以为每个用户角色分别得出分数36、38。那些权重可以由具有主持人角色的用户24和/或经由用户界面通过所有用户的投票来设置。
下表显示了具有两个用户角色“演示者”和“默认”以及相应权重的示例。
在步骤S16中,从用户24的惩罚分数38确定对话混乱值40。对话混乱值40可以看作是在整个对话期间有规律地估计对话混乱的量度。对话混乱值ccv,40可以通过以下加以计算
ccv=#yellow_points*w_yellow+#orange_points*w_orange+#red_points+w_red
其中,#yello_points(#orange_points,#red_points)是根据其惩罚分数38的为黄色(橙色,红色)的用户24的数量。w_yellow(w_orange,w_red)是权重,其例如可以针对黄色为1(针对橙色为5,针对红色为10)。
可以通过对惩罚分数38加权和/或对加权的惩罚分数38求和,从惩罚分数38中确定对话混乱值40。
其他属性可以合并到对话混乱值ccv,40中:
·多少个讲话者同时为活跃的?
·有多少重叠的讲话?这可以基于成功的中断和/或失败的中断来确定。
·在特定时间跨度内进行了几次对话轮次(讲话用户28改变了几次和/或有多频繁)?
这些属性也可以被加权,例如,被添加到对话混乱值ccv,40中。
对话混乱值ccv,40可以用作控制参数,定义同时执行限制活跃的讲话者28的数量的规则有多严格,以及多么严格地控制对话(混乱)。例如,可以基于对话混乱值40来选择优先级分数36的加权。
作为示例,对话至少可以具有三个控制程度,例如“非常严格”,“中等”和“关闭”。可以例如在“ccv>10”时,由系统10自动地选择控制程度,然后“控制程度=默认+1”。
在控制程度“关闭”中,可以不提供对开放通道的数量的限制,即,可以不使用户静音和/或不进行干预。
在控制程度“非常严格”中,可能存在例如如上所述的优先级分数36和惩罚分数38的最大影响。
在控制程度“中等”中,可以在特定程度上放宽规则和/或影响。
优先级分数36的规则和/或加权可以被放宽。例如,并非所有规则都被结合到优先级分数中。此外,可以减少所有规则和/或规则参数的加权,这可以导致不太明显的优先级分数。当对于每个用户24的排名不明显时,可以放松自动讲话者选择的影响。越多的用户24具有相同的优先级分数36,对对话的控制就越少。例如,如果三个用户24具有相同的最高优先级分数36,则所有三个用户可以具有相同的权限,而无需系统10的干预。
作为另一个示例,可以减轻惩罚分数38的影响,例如,代替用户24的10分钟阻断,可以仅将用户24阻断2分钟。此外,可以放宽结合到惩罚分数38中的规则。例如,在上面第一表的规则4中,代替“#interruption>=1,用户=黄色”,可以应用“#interruption>=3,用户=黄色”。也可能并非所有规则都被结合到惩罚分数38中。
也有可能在会议开始时设定控制程度或允许的混乱。所有用户都可以通过投票执行此设置。系统10然后可以取平均值。设置也可以由会议组织者(人),演示者(人),会议主持人(人)完成。也可能的是,分配的用户(例如上次会议中具有最高优先级排名的三个用户)执行设置。所有这些设置可以经由辅助设备22的用户界面输入到系统10中。
在步骤S18中,来自讲话用户28的声音信号30或语音信号32经由用户的听力设备12输出和/或流传输到用户24,其中,取决于优先级分数36以及可选地,惩罚分数38,某些讲话用户28可以被静音。例如,来自具有小于阈值的优先级分数36的讲话用户28的声音信号30(或语音信号32)可以被静音。
可以动态地确定优先级分数36的阈值。例如,可以选择始终仅允许n个用户24(例如1、2、3,…个用户)不被静音。从第一表中还可以看出,可以基于对话混乱值40选择用于静音用户24的优先级分数36的阈值。
也可能是具有高于阈值的惩罚分数38的用户24被静音。如上所述,当用户24的惩罚分数38具有值“红色”时,可以与优先级分数36无关地使用户24被静音。
当讲话用户24被静音时,他的流可以以时间常数淡出,例如被优化为自然。这可以包括针对特定的会话不当行为预定义的超时持续时间。代替完全淡出用户24,他的流传输的语音可能变得更柔和。
当一个活跃的讲话者24被取消静音时(即当他曾被静音并且惩罚分数38和惩罚分数38现在表明他被允许讲话时),他的流可以被淡入。
虽然已经在附图和前面的描述中详细图示和描述了本发明,但是这样的图示和描述应被认为是说明性或示例性的而不是限制性的;本发明不限于所公开的实施例。通过研究附图,公开内容和所附权利要求,本领域技术人员和通过实践要求保护的发明可以理解和实现所公开的实施例的其他变型。在权利要求中,词语“包括”不排除其他元件或步骤,并且不定冠词“一(a/an)”不排除多个。单个处理器或控制器或其他单元可以满足权利要求中记载的若干项的功能。在互不相同的从属权利要求中记载某些措施的事实并不表示不能有利地使用这些措施的组合。权利要求中的任何参考标记都不应被解释为限制范围。
参考标记列表
10 听力设备系统
12 听力设备
14 麦克风
16 处理器
18 输出设备
20 通信接口
22 辅助设备
22’ 网络设备
24 用户
26 表
28 讲话者
30 声音信号
32 语音信号
34 讲话者信号
36 优先级分数
38 惩罚分数
40 对话混乱值
Claims (11)
1.一种用于控制听力设备(12)的方法,每个听力设备(12)由用户(24)佩戴,所述听力设备(12)彼此被通信地互连以用于数据交换以便形成听力设备系统(10),
其中,所述方法包括:
利用所述用户(24)的所述听力设备(12)的麦克风(14),获取每个用户(24)的声音信号(30);
从所述声音信号(30)确定讲话者信号(34),所述讲话者信号(34)表明所述用户(24)是否是讲话用户(28);
从所述用户(24)的所述讲话者信号(34)确定每个用户(24)的优先级分数(36);
从所述用户(24)的所述讲话者信号(34),确定每个用户(24)的惩罚分数(38),其中,用户(24)的所述惩罚分数(38)取决于所述用户的所述讲话者信号(34)所表明的在另一个用户正在讲话期间所述用户(24)开始讲话的频繁性的次数;以及
经由所述用户的所述听力设备(12)将来自讲话用户(28)的声音信号(30)输出到所述用户(24),使得来自具有小于阈值的优先级分数(36)的讲话用户(28)的声音信号被静音,并且,当用户(24)的所述惩罚分数(38)高于阈值时,所述用户(24)的声音信号(30)被静音。
2.根据权利要求1所述的方法,还包括:
从所述讲话者信号(34)为每个用户(24)确定讲话的时间;
其中,当所述用户的实际讲话时间高于阈值时,降低用户(24)的所述优先级分数(36);并且/或者
其中,当用户(24)的总讲话时间高于另一个用户的总讲话时间时,降低该用户(24)的所述优先级分数(36)。
3.根据权利要求1或2所述的方法,
其中,从用户(24)的讲话者信号(34)和来自其他用户的所述讲话者信号(34)确定所述用户(24)的所述优先级分数(36);
其中,当所述用户的所述讲话者信号(34)表明在另一用户正在讲话期间所述用户(24)开始讲话时,所述用户(24)的所述优先级分数(36)被降低。
4.根据权利要求3所述的方法,
其中,从所述讲话者信号(34)为用户(24)确定实际讲话时间、总讲话时间和讲话者中断中的至少一项;
其中,通过加权所述实际讲话时间、所述总讲话时间和所述讲话者中断中的至少一项,来确定所述用户(24)的所述优先级分数(36)。
5.根据权利要求1所述的方法,
其中,用户(24)被分配有不同的用户角色;
其中,取决于用户的所述用户角色,确定所述用户(24)的所述优先级分数(36)。
6.根据权利要求4所述的方法,还包括:
从所述用户的所述惩罚分数(38),确定对话混乱值(40)。
7.根据权利要求6所述的方法,
其中,通过对惩罚分数(38)加权来从所述惩罚分数(38)确定所述对话混乱值(40)。
8.根据权利要求6所述的方法,
其中,基于所述对话混乱值(40),选择用于使用户(24)静音的所述优先级分数(36)的所述阈值。
9.根据权利要求6至8中的任意一项所述的方法,
其中,通过加权所述实际讲话时间、所述总讲话时间和所述讲话者中断中的至少一项,来确定用户(24)的所述优先级分数(36);
其中,基于所述对话混乱值(40),选择进行所述加权。
10.一种计算机可读介质,其存储了用于控制听力设备(12)的计算机程序,所述计算机程序在由处理器执行时适于执行权利要求1至9中的任意一项所述的方法。
11.一种听力设备系统(10),其包括多个听力设备(12),每个听力设备(12)由用户佩戴,并且所述听力设备(12)彼此被通信地互连以用于数据交换;
其中,所述听力设备系统(10)适用于执行权利要求1至9中的任意一项所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19168155.0A EP3723354B1 (en) | 2019-04-09 | 2019-04-09 | Prioritization and muting of speakers in a hearing device system |
EP19168155.0 | 2019-04-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111800280A CN111800280A (zh) | 2020-10-20 |
CN111800280B true CN111800280B (zh) | 2024-07-05 |
Family
ID=66323666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010267903.1A Active CN111800280B (zh) | 2019-04-09 | 2020-04-08 | 听力设备系统中讲话者的优先化 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11184484B2 (zh) |
EP (1) | EP3723354B1 (zh) |
CN (1) | CN111800280B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107408027A (zh) * | 2015-03-31 | 2017-11-28 | 索尼公司 | 信息处理设备、控制方法及程序 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804340B2 (en) | 2001-05-03 | 2004-10-12 | Raytheon Company | Teleconferencing system |
US7180997B2 (en) | 2002-09-06 | 2007-02-20 | Cisco Technology, Inc. | Method and system for improving the intelligibility of a moderator during a multiparty communication session |
US7330541B1 (en) | 2003-05-22 | 2008-02-12 | Cisco Technology, Inc. | Automated conference moderation |
EP1560140A1 (de) | 2004-02-02 | 2005-08-03 | Vodafone Holding GmbH | Verfahren und System zur elektronischen Interaktion in einem Netzwerk |
US20050239486A1 (en) | 2004-04-05 | 2005-10-27 | D Avello Robert F | Methods and systems for controlling communications in an ad hoc communication network |
US20060176831A1 (en) | 2005-02-07 | 2006-08-10 | Greenberg Joel K | Methods and apparatuses for selecting users to join a dynamic network conversation |
US8855275B2 (en) * | 2006-10-18 | 2014-10-07 | Sony Online Entertainment Llc | System and method for regulating overlapping media messages |
WO2008082203A1 (en) | 2006-12-29 | 2008-07-10 | Samsung Electronics Co., Ltd. | Method for merging and splitting of sessions in session based applications like ims applications simple im and poc |
US8275108B2 (en) * | 2008-02-26 | 2012-09-25 | International Business Machines Corporation | Hierarchal control of teleconferences |
US8645872B2 (en) | 2010-11-30 | 2014-02-04 | Verizon Patent And Licensing Inc. | User interfaces for facilitating merging and splitting of communication sessions |
US8739045B2 (en) * | 2011-03-02 | 2014-05-27 | Cisco Technology, Inc. | System and method for managing conversations for a meeting session in a network environment |
CN104756473B (zh) * | 2012-09-14 | 2017-08-29 | 谷歌公司 | 处理并发语音 |
EP3202160B1 (en) | 2014-10-02 | 2018-04-18 | Sonova AG | Method of providing hearing assistance between users in an ad hoc network and corresponding system |
WO2016126819A1 (en) * | 2015-02-03 | 2016-08-11 | Dolby Laboratories Licensing Corporation | Optimized virtual scene layout for spatial meeting playback |
US9591141B1 (en) | 2015-08-11 | 2017-03-07 | International Business Machines Corporation | Controlling conference calls |
CN109076294B (zh) * | 2016-03-17 | 2021-10-29 | 索诺瓦公司 | 多讲话者声学网络中的助听系统 |
KR102444165B1 (ko) * | 2017-01-20 | 2022-09-16 | 삼성전자주식회사 | 적응적으로 회의를 제공하기 위한 장치 및 방법 |
WO2019122343A1 (en) * | 2017-12-22 | 2019-06-27 | British Telecommunications Public Limited Company | Managing streamed audio communication sessions |
-
2019
- 2019-04-09 EP EP19168155.0A patent/EP3723354B1/en active Active
-
2020
- 2020-03-26 US US16/831,405 patent/US11184484B2/en active Active
- 2020-04-08 CN CN202010267903.1A patent/CN111800280B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107408027A (zh) * | 2015-03-31 | 2017-11-28 | 索尼公司 | 信息处理设备、控制方法及程序 |
Also Published As
Publication number | Publication date |
---|---|
US11184484B2 (en) | 2021-11-23 |
US20200329155A1 (en) | 2020-10-15 |
CN111800280A (zh) | 2020-10-20 |
EP3723354A1 (en) | 2020-10-14 |
EP3723354B1 (en) | 2021-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10834493B2 (en) | Time heuristic audio control | |
Mauger et al. | Clinical evaluation of the Nucleus® 6 cochlear implant system: Performance improvements with SmartSound iQ | |
CN106463107B (zh) | 在耳机与源之间协作处理音频 | |
EP1622349B1 (en) | Teleconference volume level monitoring and feedback on the volume level | |
EP3257236B1 (en) | Nearby talker obscuring, duplicate dialogue amelioration and automatic muting of acoustically proximate participants | |
US20120189140A1 (en) | Audio-sharing network | |
US9424843B2 (en) | Methods and apparatus for signal sharing to improve speech understanding | |
JP2017510200A (ja) | ヘッドセットと音源との間のオーディオの協調的処理 | |
US20160352913A1 (en) | Method and system for adjusting volume of conference call | |
US20180048683A1 (en) | Private communications in virtual meetings | |
CN112887872B (zh) | 一种耳机语音指令的播放方法、耳机和存储介质 | |
Ricketts et al. | Directional microphone hearing aids in school environments: Working toward optimization | |
CN111800280B (zh) | 听力设备系统中讲话者的优先化 | |
US11178498B2 (en) | Hearing device system and a method for dynamically presenting a hearing device modification proposal to a user of a hearing device | |
EP3819904A1 (en) | Method of determining the speech in a web-rtc audio or video communication and/or collaboration session and communication system | |
JP2009027239A (ja) | 通信会議装置 | |
US10483933B2 (en) | Amplification adjustment in communication devices | |
CN114697845A (zh) | 用于在评估听力损失时交互式地辅助用户的系统和方法 | |
US11570558B2 (en) | Stereo rendering systems and methods for a microphone assembly with dynamic tracking | |
Scollie | 20Q: The Ins and outs of frequency lowering amplification | |
AU2020100464A4 (en) | A hearing device system and a method for dynamically presenting a hearing device modification proposal to a user of a hearing device | |
EP3291226B1 (en) | A method of treating speech data, a device for handling telephone calls and a hearing device | |
Bramsløw et al. | Hearing aids | |
Kuvadia et al. | Data Logging-Hearing Aid Behavior in the Real World | |
US20170125010A1 (en) | Method and system for controlling voice entrance to user ears, by designated system of earphone controlled by Smartphone with reversed voice recognition control system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |