JP7474548B2 - オーディオデータの再生の制御 - Google Patents
オーディオデータの再生の制御 Download PDFInfo
- Publication number
- JP7474548B2 JP7474548B2 JP2022150997A JP2022150997A JP7474548B2 JP 7474548 B2 JP7474548 B2 JP 7474548B2 JP 2022150997 A JP2022150997 A JP 2022150997A JP 2022150997 A JP2022150997 A JP 2022150997A JP 7474548 B2 JP7474548 B2 JP 7474548B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- audio
- adjusted
- reproduction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 12
- 230000004048 modification Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000003111 delayed effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241001342895 Chorus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Description
- オーディオデータの再生と同時にユーザに伝えられる音声信号を受信するステップと、
- 調整されたオーディオデータを取得するために、オーディオデータの選択された要素の音量及び/又はスペクトル外観を修正するステップと、
- 調整されたオーディオデータを再生するステップと
を含む。
- オーディオデータの再生と同時にユーザに伝えられる音声信号を受信するステップと、
- 調整されたオーディオデータを取得するために、オーディオデータの選択された要素の音量及び/又はスペクトル外観を修正するステップと、
- 調整されたオーディオデータを再生するステップと
を実施させる。
- オーディオデータの再生と同時にユーザに伝えられる音声信号を受信するように構成された受信ユニットと、
- 調整されたオーディオデータを取得するために、オーディオデータの選択された要素の音量及び/又はスペクトル外観を修正するように構成された修正ユニットと、
- 調整されたオーディオデータを再生するように構成された再生ユニットと
を含む。
21 入力部
22 受信ユニット
23 修正ユニット
24 再生ユニット
25 制御モジュール
26 ローカルストレージユニット
27 出力部
28 ユーザインターフェース
30 装置
31 メモリデバイス
32 処理デバイス
33 入力部
34 出力部
40 自動車
41 スピーカー
42 インフォテインメントシステム
43 ナビゲーションシステム
44 環境センサ
45 データ伝送ユニット
46 メモリ
47 ネットワーク
50 電子機器
51 スピーカー
52 ソケット
53 画面
AAD 調整されたオーディオデータ
AD オーディオデータ
E 要素
FIL フィルタ
GC 利得制御部
MIC マイク
OUT オーディオ出力
SEL セレクタ
SP 音声信号
S1 音声信号を受信する
S2 オーディオデータの選択された要素の音量及び/又はスペクトル外観を修正する
S3 調整されたオーディオデータを再生する
S4 受信された音声信号を再生する
Claims (13)
- オーディオデータ(AD)の再生を制御するための、装置(20)が行う方法であって、
- 前記オーディオデータ(AD)の再生と同時にユーザに伝えられる音声信号(SP)を受信すること(S1)と、
- 調整されたオーディオデータ(AAD)を取得するために、前記オーディオデータ(AD)の選択された要素(E)の音量及び/又はスペクトル外観を修正すること(S2)と、
- 前記調整されたオーディオデータ(AAD)を再生すること(S3)と
を含む、方法において、
前記オーディオデータ(AD)の前記選択された要素(E)を、前記オーディオデータ(AD)のバックグラウンドトラックの処理とは別個に、前記オーディオデータ(AD)のフォアグラウンドトラック内の音声コンテンツを弱めるか又は除去することによって修正する(S2)ことを特徴とする、
方法。 - 前記調整されたオーディオデータ(AAD)と同時に、前記受信された音声信号(SP)を再生すること(S4)を更に含む、請求項1に記載の方法。
- 前記受信された音声信号(SP)を再生すること(S4)は、前記オーディオデータ(AD)と関連付けられたメタ情報に基づいて且つ/又は外部データに基づいて遅延される、請求項2に記載の方法。
- 伝えられる前記音声信号(SP)は、アナウンス、通知、音声通話の音声情報又は別のユーザによって発せられた音声情報である、請求項1又は2に記載の方法。
- 前記オーディオデータ(AD)の前記選択された要素(E)は、バックグラウンドの音楽をフィルタリングすることによって更に調整される(S2)、請求項1又は2に記載の方法。
- 前記オーディオデータ(AD)の前記選択された要素(E)は、前記オーディオデータ(AD)のセグメントをループさせることによって更に調整される(S2)、請求項1又は2に記載の方法。
- 前記音声信号(SP)の再生速度は、前記ループされたセグメントの持続時間に適合される、請求項6に記載の方法。
- 前記調整されたオーディオデータ(AAD)の持続時間は、前記受信された音声信号(SP)の持続時間に依存する、請求項1又は2に記載の方法。
- 前記調整されたオーディオデータ(AAD)の前記持続時間は、前記音声信号(SP)に続く前記ユーザによるフィードバックを可能にする、請求項8に記載の方法。
- コンピュータプログラムコードであって、命令を含み、前記命令は、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、オーディオデータ(AD)の再生を制御するために、請求項1又は2に記載の方法を実施させる、コンピュータプログラムコード。
- オーディオデータ(AD)の再生を制御するための装置(20)であって、
- 前記オーディオデータ(AD)の再生と同時にユーザに伝えられる音声信号(SP)を受信する(S1)ように構成された受信ユニット(22)と、
- 調整されたオーディオデータ(AAD)を取得するために、前記オーディオデータ(AD)の選択された要素(E)の音量及び/又はスペクトル外観を修正する(S2)ように構成された修正ユニット(23)と、
- 前記調整されたオーディオデータ(AAD)を再生する(S3)ように構成された再生ユニット(24)と
を含む、装置において、
前記修正ユニット(23)は、前記オーディオデータ(AD)の前記選択された要素(E)を、前記オーディオデータ(AD)のバックグラウンドトラックの処理とは別個に、前記オーディオデータ(AD)のフォアグラウンドトラック内の音声コンテンツを弱めるか又は除去することによって修正する(S2)ように構成されていることを特徴とする、
装置(20)。 - 自動車(40)において、請求項11に記載の装置(20)を含むか、又はオーディオデータ(AD)の再生を制御するために、請求項1又は2に記載の方法を実施するように構成されることを特徴とする自動車(40)。
- オーディオデータ(AD)を再生することができる電子機器(50)において、請求項11に記載の装置(20)を含むか、又はオーディオデータ(AD)の再生を制御するために、請求項1又は2に記載の方法を実施するように構成されることを特徴とする電子機器(50)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21198891 | 2021-09-24 | ||
EP21198891.0A EP4156181A1 (en) | 2021-09-24 | 2021-09-24 | Controlling playback of audio data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023047338A JP2023047338A (ja) | 2023-04-05 |
JP7474548B2 true JP7474548B2 (ja) | 2024-04-25 |
Family
ID=77951556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022150997A Active JP7474548B2 (ja) | 2021-09-24 | 2022-09-22 | オーディオデータの再生の制御 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230096846A1 (ja) |
EP (1) | EP4156181A1 (ja) |
JP (1) | JP7474548B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012025270A (ja) | 2010-07-23 | 2012-02-09 | Denso Corp | 車両用の音量制御装置および音量制御装置用のプログラム |
JP2013205680A (ja) | 2012-03-29 | 2013-10-07 | Panasonic Corp | 音声出力装置および音声出力方法 |
JP2020197651A (ja) | 2019-06-04 | 2020-12-10 | クラリオン株式会社 | ミキシング処理装置及びミキシング処理方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09330089A (ja) * | 1996-06-07 | 1997-12-22 | Fujitsu Ten Ltd | 音声制御装置 |
US10156455B2 (en) * | 2012-06-05 | 2018-12-18 | Apple Inc. | Context-aware voice guidance |
US9972316B2 (en) | 2015-12-30 | 2018-05-15 | Harman International Industries, Incorporated | Isolation and enhancement of short duration speech prompts in an automotive system |
US20180081618A1 (en) * | 2016-09-16 | 2018-03-22 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Audio segment playback coordination |
US10014841B2 (en) | 2016-09-19 | 2018-07-03 | Nokia Technologies Oy | Method and apparatus for controlling audio playback based upon the instrument |
US9942678B1 (en) * | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10531196B2 (en) * | 2017-06-02 | 2020-01-07 | Apple Inc. | Spatially ducking audio produced through a beamforming loudspeaker array |
US11729549B2 (en) | 2019-12-30 | 2023-08-15 | Harman International Industries, Incorporated | Voice ducking with spatial speech separation for vehicle audio system |
-
2021
- 2021-09-24 EP EP21198891.0A patent/EP4156181A1/en active Pending
-
2022
- 2022-09-21 US US17/949,714 patent/US20230096846A1/en active Pending
- 2022-09-22 JP JP2022150997A patent/JP7474548B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012025270A (ja) | 2010-07-23 | 2012-02-09 | Denso Corp | 車両用の音量制御装置および音量制御装置用のプログラム |
JP2013205680A (ja) | 2012-03-29 | 2013-10-07 | Panasonic Corp | 音声出力装置および音声出力方法 |
JP2020197651A (ja) | 2019-06-04 | 2020-12-10 | クラリオン株式会社 | ミキシング処理装置及びミキシング処理方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4156181A1 (en) | 2023-03-29 |
US20230096846A1 (en) | 2023-03-30 |
JP2023047338A (ja) | 2023-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108989953B (zh) | 空间上回避通过波束形成扬声器阵列产生的音频 | |
US10848889B2 (en) | Intelligent audio rendering for video recording | |
CN107210032A (zh) | 在掩蔽语音区域中掩蔽再现语音的语音再现设备 | |
JP6931819B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
CN108737930B (zh) | 车辆导航系统中的可听提示 | |
CN110696756A (zh) | 一种车辆的音量控制方法及装置、汽车、存储介质 | |
JP2013531273A (ja) | スピーカ及びマイクロホンを備える音声認識システムを調整する方法、及び音声認識システム | |
WO2020027061A1 (ja) | 会話サポートシステム、その方法、およびプログラム | |
US20220167087A1 (en) | Audio output using multiple different transducers | |
KR20210047674A (ko) | 스피커를 이용한 차량용 진동 시트 및 그 제어 방법 | |
JP7474548B2 (ja) | オーディオデータの再生の制御 | |
JP4829184B2 (ja) | 車載装置および音声認識方法 | |
JP6995254B2 (ja) | 音場制御装置及び音場制御方法 | |
CN110942770B (zh) | 音声识别装置、音声识别方法、存储音声识别程序的非暂时性计算机可读介质 | |
JP7493875B2 (ja) | 音声処理装置および音声処理方法 | |
KR20230156967A (ko) | 오디오 줌 | |
JP2010085877A (ja) | 音響補完装置 | |
US20240334125A1 (en) | Audio processing based on target signal-to-noise ratio | |
JP4765394B2 (ja) | 音声対話装置 | |
WO2024205944A1 (en) | Audio processing based on target signal-to-noise ratio | |
CN117922456A (zh) | 车辆控制方法、装置、车辆及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220922 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240229 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7474548 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |