RU2018141215A - Способ и устройство для обработки видео- и аудиосигналов и программа - Google Patents
Способ и устройство для обработки видео- и аудиосигналов и программа Download PDFInfo
- Publication number
- RU2018141215A RU2018141215A RU2018141215A RU2018141215A RU2018141215A RU 2018141215 A RU2018141215 A RU 2018141215A RU 2018141215 A RU2018141215 A RU 2018141215A RU 2018141215 A RU2018141215 A RU 2018141215A RU 2018141215 A RU2018141215 A RU 2018141215A
- Authority
- RU
- Russia
- Prior art keywords
- video
- audio signals
- signals according
- processing
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 3
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims 35
- 238000000605 extraction Methods 0.000 claims 8
- 239000000284 extract Substances 0.000 claims 4
- 238000000926 separation method Methods 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3081—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is a video-frame or a video-field (P.I.P)
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/9201—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
- H04N5/9202—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/802—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/22—Source localisation; Inverse modelling
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Otolaryngology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
- Discrete Mathematics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- User Interface Of Digital Computer (AREA)
Claims (34)
1. Устройство для обработки видео- и аудиосигналов, содержащее:
часть управления отображением, выполненную с возможностью вызывать отображение видеообъекта на основании видеосигнала;
часть выбора объекта, выполненную с возможностью выбирать заданный видеообъект из одного видеообъекта или среди множества видеообъектов; и
часть извлечения, выполненную с возможностью извлекать аудиосигнал видеообъекта, выбранного частью выбора объекта, в качестве аудиосигнала объекта.
2. Устройство для обработки видео- и аудиосигналов по п.1, в котором часть извлечения извлекает аудиосигнал объекта из аудиосигнала.
3. Устройство для обработки видео- и аудиосигналов по п.2, в котором часть извлечения извлекает сигнал, отличный от аудиосигнала объекта выбранного видеообъекта, в качестве фонового звукового сигнала из аудиосигнала.
4. Устройство для обработки видео- и аудиосигналов по п.1, в котором
часть выбора объекта производит информацию местоположения объекта, указывающую позицию в пространстве выбранного видеообъекта, и
часть извлечения извлекает аудиосигнал объекта на основании информации местоположении объекта.
5. Устройство для обработки видео- и аудиосигналов по п.4, в котором часть извлечения извлекает аудиосигнал объекта через разделение источника звука с использованием информации местоположения объекта.
6. Устройство для обработки видео- и аудиосигналов по п.5, в котором часть извлечения выполняет формирование фиксированного луча в качестве разделения источника звука.
7. Устройство для обработки видео- и аудиосигналов по п.1, дополнительно содержащее часть распознавания видеообъекта, выполненную с возможностью распознавать видеообъект на основании видеосигнала, в котором
часть управления отображением вызывает отображение изображения на основании результата распознавания видеообъекта вместе с видеообъектом.
8. Устройство для обработки видео- и аудиосигналов по п.7, в котором часть распознавания видеообъекта распознает видеообъект из распознавания лиц.
9. Устройство для обработки видео- и аудиосигналов по п.7, в котором часть управления отображением вызывает отображение рамки в виде изображения в области видеообъекта.
10. Устройство для обработки видео- и аудиосигналов по п.1, в котором часть выбора объекта выбирает видеообъект в ответ на манипуляцию выбора пользователем.
11. Устройство для обработки видео- и аудиосигналов по п.1, в котором часть выбора объекта производит метаданные выбранного видеообъекта.
12. Устройство для обработки видео- и аудиосигналов по п.11, в котором часть выбора объекта производит информацию местоположения объекта, указывающую позицию в пространстве выбранного видеообъекта в качестве метаданных.
13. Устройство для обработки видео- и аудиосигналов по п.11, в котором часть выбора объекта производит данные приоритета обработки выбранного видеообъекта в качестве метаданных.
14. Устройство для обработки видео- и аудиосигналов по п.11, в котором часть выбора объекта производит информацию распространения, указывающую состояние распространения области выбранного видеообъекта в качестве метаданных.
15. Устройство для обработки видео- и аудиосигналов по п.11, дополнительно содержащее часть кодирования аудио, выполненную с возможностью кодировать аудиосигнал объекта и метаданные.
16. Устройство для обработки видео- и аудиосигналов по п.15, дополнительно содержащее:
часть кодирования видео, выполненную с возможностью кодировать видеосигнал; и
часть мультиплексирования, выполненную с возможностью мультиплексировать битовый поток видео, полученный посредством кодирования видеосигнала, и битовый поток аудио, полученный путем кодирования аудиосигнала объекта, и метаданные.
17. Устройство для обработки видео- и аудиосигналов по п.1, дополнительно содержащее часть захвата изображения, выполненную с возможностью получать видеосигнал путем проведения фотосъемки.
18. Устройство для обработки видео- и аудиосигналов по п.1, дополнительно содержащее часть получения звука, выполненную с возможностью получать аудиосигнал путем осуществления получения звука.
19. Способ обработки видео- и аудиосигналов, содержащий:
этап управления отображением, вызывающий отображение видеообъекта на основании видеосигнала;
этап выбора объекта для выбора заданного видеообъекта из одного видеообъекта или множества видеообъектов; и
этап извлечения для извлечения аудиосигнала видеообъекта, выбранного на этапе выбора объекта, в качестве аудиосигнала объекта.
20. Программа, в соответствии с которой компьютер выполняет процесс обработки, содержащая:
этап управления отображением, вызывающий отображение видеообъекта на основании видеосигнала;
этап выбора объекта для выбора заданного видеообъекта из одного видеообъекта или множества видеообъектов; и
этап извлечения для извлечения аудиосигнала видеообъекта, выбранного на этапе выбора объекта, в качестве аудиосигнала объекта.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016107042 | 2016-05-30 | ||
JP2016-107042 | 2016-05-30 | ||
PCT/JP2017/018499 WO2017208820A1 (ja) | 2016-05-30 | 2017-05-17 | 映像音響処理装置および方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018141215A true RU2018141215A (ru) | 2020-05-26 |
RU2018141215A3 RU2018141215A3 (ru) | 2020-07-24 |
RU2743732C2 RU2743732C2 (ru) | 2021-02-25 |
Family
ID=60478597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018141215A RU2743732C2 (ru) | 2016-05-30 | 2017-05-17 | Способ и устройство для обработки видео- и аудиосигналов и программа |
Country Status (8)
Country | Link |
---|---|
US (3) | US11184579B2 (ru) |
EP (1) | EP3467823B1 (ru) |
JP (2) | JP6984596B2 (ru) |
KR (2) | KR102650850B1 (ru) |
CN (2) | CN109313904B (ru) |
BR (1) | BR112018074203A2 (ru) |
RU (1) | RU2743732C2 (ru) |
WO (1) | WO2017208820A1 (ru) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2743732C2 (ru) | 2016-05-30 | 2021-02-25 | Сони Корпорейшн | Способ и устройство для обработки видео- и аудиосигналов и программа |
WO2018033137A1 (zh) * | 2016-08-19 | 2018-02-22 | 北京市商汤科技开发有限公司 | 在视频图像中展示业务对象的方法、装置和电子设备 |
CN106774930A (zh) * | 2016-12-30 | 2017-05-31 | 中兴通讯股份有限公司 | 一种数据处理方法、装置及采集设备 |
BR112019020887A2 (pt) * | 2017-04-13 | 2020-04-28 | Sony Corp | aparelho e método de processamento de sinal, e, programa. |
EP3618463A4 (en) * | 2017-04-25 | 2020-04-29 | Sony Corporation | SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM |
EP3489821A1 (en) * | 2017-11-27 | 2019-05-29 | Nokia Technologies Oy | A user interface for user selection of sound objects for rendering, and/or a method for rendering a user interface for user selection of sound objects for rendering |
EP3734594A4 (en) | 2017-12-28 | 2020-11-11 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND PROGRAM |
KR20190142192A (ko) * | 2018-06-15 | 2019-12-26 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
EP3588988B1 (en) * | 2018-06-26 | 2021-02-17 | Nokia Technologies Oy | Selective presentation of ambient audio content for spatial audio presentation |
KR20200107758A (ko) * | 2019-03-08 | 2020-09-16 | 엘지전자 주식회사 | 음향 객체 추종을 위한 방법 및 이를 위한 장치 |
CN110072137B (zh) * | 2019-04-26 | 2021-06-08 | 湖南琴岛网络传媒科技有限公司 | 一种视频直播的数据传输方法及传输装置 |
JP7163876B2 (ja) * | 2019-07-02 | 2022-11-01 | トヨタ車体株式会社 | 車内会話支援装置 |
EP3963896B1 (en) | 2019-08-14 | 2024-07-17 | Samsung Electronics Co., Ltd. | Immersive display system and method thereof |
CN110602424A (zh) * | 2019-08-28 | 2019-12-20 | 维沃移动通信有限公司 | 视频处理方法及电子设备 |
US11997456B2 (en) * | 2019-10-10 | 2024-05-28 | Dts, Inc. | Spatial audio capture and analysis with depth |
CN110970056B (zh) * | 2019-11-18 | 2022-03-11 | 清华大学 | 一种从视频中分离音源的方法 |
US11356796B2 (en) * | 2019-11-22 | 2022-06-07 | Qualcomm Incorporated | Priority-based soundfield coding for virtual reality audio |
JP6739064B1 (ja) * | 2020-01-20 | 2020-08-12 | パナソニックIpマネジメント株式会社 | 撮像装置 |
US11704087B2 (en) * | 2020-02-03 | 2023-07-18 | Google Llc | Video-informed spatial audio expansion |
CN111583916B (zh) * | 2020-05-19 | 2023-07-25 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN111863002A (zh) * | 2020-07-06 | 2020-10-30 | Oppo广东移动通信有限公司 | 处理方法、处理装置、电子设备 |
CN111885414B (zh) * | 2020-07-24 | 2023-03-21 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及可读存储介质 |
CN111916102B (zh) * | 2020-07-31 | 2024-05-28 | 维沃移动通信有限公司 | 电子设备的录音方法及录音装置 |
CN112153461B (zh) * | 2020-09-25 | 2022-11-18 | 北京百度网讯科技有限公司 | 用于定位发声物的方法、装置、电子设备及可读存储介质 |
CN114374903B (zh) * | 2020-10-16 | 2023-04-07 | 华为技术有限公司 | 拾音方法和拾音装置 |
CN112822539B (zh) * | 2020-12-30 | 2023-07-14 | 咪咕文化科技有限公司 | 信息显示方法、装置、服务器及存储介质 |
JP2023040568A (ja) * | 2021-09-10 | 2023-03-23 | ヤマハ株式会社 | 演奏収録方法、演奏収録システムおよびプログラム |
KR102500255B1 (ko) * | 2022-03-03 | 2023-02-17 | (주)에이아이매틱스 | 음성 개인정보 보호 기술을 이용한 기계학습 데이터베이스 구축 시스템 |
WO2023175848A1 (ja) * | 2022-03-17 | 2023-09-21 | 日本電気株式会社 | 表示支援装置、表示支援方法、および記録媒体 |
WO2023248678A1 (ja) * | 2022-06-24 | 2023-12-28 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及び情報処理システム |
Family Cites Families (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4653102A (en) * | 1985-11-05 | 1987-03-24 | Position Orientation Systems | Directional microphone system |
US5793875A (en) * | 1996-04-22 | 1998-08-11 | Cardinal Sound Labs, Inc. | Directional hearing system |
JP4216364B2 (ja) | 1997-08-29 | 2009-01-28 | 株式会社東芝 | 音声符号化/復号化方法および音声信号の成分分離方法 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
JP2001285234A (ja) * | 2000-04-04 | 2001-10-12 | Sony Corp | データ多重化装置およびデータ多重化方法、並びに記録媒体 |
US7088911B2 (en) * | 2000-04-26 | 2006-08-08 | Sony Corporation | Recording apparatus and method, playback apparatus and method, and recording medium therefor |
DE60010457T2 (de) * | 2000-09-02 | 2006-03-02 | Nokia Corp. | Vorrichtung und Verfahren zur Verarbeitung eines Signales emittiert von einer Zielsignalquelle in einer geräuschvollen Umgebung |
JP3912003B2 (ja) | 2000-12-12 | 2007-05-09 | 株式会社日立製作所 | 通信装置 |
US6829018B2 (en) * | 2001-09-17 | 2004-12-07 | Koninklijke Philips Electronics N.V. | Three-dimensional sound creation assisted by visual information |
US20050228665A1 (en) * | 2002-06-24 | 2005-10-13 | Matsushita Electric Indusrial Co, Ltd. | Metadata preparing device, preparing method therefor and retrieving device |
KR100542129B1 (ko) * | 2002-10-28 | 2006-01-11 | 한국전자통신연구원 | 객체기반 3차원 오디오 시스템 및 그 제어 방법 |
JP4269883B2 (ja) * | 2003-10-20 | 2009-05-27 | ソニー株式会社 | マイクロホン装置、再生装置及び撮像装置 |
US8194707B2 (en) * | 2005-02-28 | 2012-06-05 | Broadcom Corporation | Method and system for dynamically allocating video multiplexing buffer based on queuing theory |
JP4441879B2 (ja) * | 2005-06-28 | 2010-03-31 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びに記録媒体 |
JP5082327B2 (ja) * | 2006-08-09 | 2012-11-28 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
JP2008193196A (ja) * | 2007-02-01 | 2008-08-21 | Casio Comput Co Ltd | 撮像装置および指定音声出力方法 |
WO2008102732A1 (ja) * | 2007-02-19 | 2008-08-28 | Kabushiki Kaisha Toshiba | データ多重化/分離装置 |
JP2008271157A (ja) | 2007-04-19 | 2008-11-06 | Fuji Xerox Co Ltd | 音声強調装置及び制御プログラム |
US8218033B2 (en) | 2007-09-10 | 2012-07-10 | Sanyo Electric Co., Ltd. | Sound corrector, sound recording device, sound reproducing device, and sound correcting method |
JP2009156888A (ja) * | 2007-12-25 | 2009-07-16 | Sanyo Electric Co Ltd | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 |
US8743284B2 (en) * | 2007-10-08 | 2014-06-03 | Motorola Mobility Llc | Synchronizing remote audio with fixed video |
US20090174805A1 (en) * | 2008-01-07 | 2009-07-09 | Motorola, Inc. | Digital camera focusing using stored object recognition |
US20100123785A1 (en) * | 2008-11-17 | 2010-05-20 | Apple Inc. | Graphic Control for Directional Audio Input |
JP5326910B2 (ja) | 2009-01-20 | 2013-10-30 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US20100254543A1 (en) * | 2009-02-03 | 2010-10-07 | Squarehead Technology As | Conference microphone system |
JP5229053B2 (ja) | 2009-03-30 | 2013-07-03 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
JP5801026B2 (ja) * | 2009-05-28 | 2015-10-28 | 株式会社ザクティ | 画像音響処理装置及び撮像装置 |
KR20100134329A (ko) * | 2009-06-15 | 2010-12-23 | 삼성전자주식회사 | 디지털 촬영 장치 및 그 제어 방법 및 제어 방법을 실행시키기 위한 컴퓨터 프로그램을 저장한 저장 매체 |
JP5635097B2 (ja) * | 2009-08-14 | 2014-12-03 | ディーティーエス・エルエルシーDts Llc | オーディオオブジェクトを適応的にストリーミングするためのシステム |
JP5435221B2 (ja) * | 2009-09-25 | 2014-03-05 | 日本電気株式会社 | 音源信号分離装置、音源信号分離方法及びプログラム |
KR20110038313A (ko) * | 2009-10-08 | 2011-04-14 | 삼성전자주식회사 | 영상촬영장치 및 그 제어방법 |
CN101727908B (zh) * | 2009-11-24 | 2012-01-18 | 哈尔滨工业大学 | 基于混合信号局部峰值方差检测的盲源分离方法 |
TWI396862B (zh) * | 2009-12-04 | 2013-05-21 | Teco Elec & Machinery Co Ltd | 聲源定位系統、方法及電腦可讀取儲存媒體 |
JP5143172B2 (ja) * | 2010-03-19 | 2013-02-13 | 三洋電機株式会社 | 撮像装置及び画像再生装置 |
KR101155611B1 (ko) * | 2010-04-30 | 2012-07-11 | 주식회사 에스원 | 음원 위치 산출 장치 및 그 방법 |
JP5748422B2 (ja) * | 2010-06-29 | 2015-07-15 | 株式会社ザクティ | 電子機器 |
KR101750338B1 (ko) * | 2010-09-13 | 2017-06-23 | 삼성전자주식회사 | 마이크의 빔포밍 수행 방법 및 장치 |
JP5198530B2 (ja) * | 2010-09-28 | 2013-05-15 | 株式会社東芝 | 音声付き動画像呈示装置、方法およびプログラム |
JP4945675B2 (ja) * | 2010-11-12 | 2012-06-06 | 株式会社東芝 | 音響信号処理装置、テレビジョン装置及びプログラム |
US8761412B2 (en) * | 2010-12-16 | 2014-06-24 | Sony Computer Entertainment Inc. | Microphone array steering with image-based source location |
JP5857674B2 (ja) * | 2010-12-22 | 2016-02-10 | 株式会社リコー | 画像処理装置、及び画像処理システム |
JP2012178807A (ja) * | 2011-02-28 | 2012-09-13 | Sanyo Electric Co Ltd | 撮像装置 |
JP2012234150A (ja) * | 2011-04-18 | 2012-11-29 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US9973848B2 (en) * | 2011-06-21 | 2018-05-15 | Amazon Technologies, Inc. | Signal-enhancing beamforming in an augmented reality environment |
EP2754303A4 (en) * | 2011-09-06 | 2015-03-11 | High Sec Labs Ltd | SINGLE FIBER OPTIC KVM EXTENSION |
JP2013106298A (ja) | 2011-11-16 | 2013-05-30 | Sony Corp | 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置 |
JP5685177B2 (ja) * | 2011-12-12 | 2015-03-18 | 本田技研工業株式会社 | 情報伝達システム |
JP2013171089A (ja) * | 2012-02-17 | 2013-09-02 | Toshiba Corp | 音声補正装置、方法、及びプログラム |
JP2013183315A (ja) * | 2012-03-02 | 2013-09-12 | Nec Casio Mobile Communications Ltd | ハンズフリー通話装置 |
US9495591B2 (en) * | 2012-04-13 | 2016-11-15 | Qualcomm Incorporated | Object recognition using multi-modal matching scheme |
JP6103826B2 (ja) * | 2012-06-08 | 2017-03-29 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
EP2680616A1 (en) * | 2012-06-25 | 2014-01-01 | LG Electronics Inc. | Mobile terminal and audio zooming method thereof |
US9007524B2 (en) * | 2012-09-25 | 2015-04-14 | Intel Corporation | Techniques and apparatus for audio isolation in video processing |
JP6216169B2 (ja) * | 2012-09-26 | 2017-10-18 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP2014086551A (ja) | 2012-10-23 | 2014-05-12 | Canon Inc | 撮像装置及びカメラ |
JP2014143678A (ja) * | 2012-12-27 | 2014-08-07 | Panasonic Corp | 音声処理システム及び音声処理方法 |
KR101997449B1 (ko) * | 2013-01-29 | 2019-07-09 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어 방법 |
WO2014125835A1 (ja) * | 2013-02-15 | 2014-08-21 | パナソニック株式会社 | 指向性制御システム、キャリブレーション方法、水平偏差角算出方法及び指向性制御方法 |
US9338420B2 (en) * | 2013-02-15 | 2016-05-10 | Qualcomm Incorporated | Video analysis assisted generation of multi-channel audio data |
BR122022005104B1 (pt) * | 2013-03-28 | 2022-09-13 | Dolby Laboratories Licensing Corporation | Método para renderizar um áudio de entrada, aparelho para renderizar um áudio de entrada e meio não transitório |
EP2982139A4 (en) * | 2013-04-04 | 2016-11-23 | Nokia Technologies Oy | AUDIOVISUAL PROCESSING APPARATUS |
JP6250297B2 (ja) * | 2013-04-15 | 2017-12-20 | シャープ株式会社 | 音声入力装置、および画像表示装置 |
KR102150013B1 (ko) * | 2013-06-11 | 2020-08-31 | 삼성전자주식회사 | 음향신호를 위한 빔포밍 방법 및 장치 |
GB2516056B (en) * | 2013-07-09 | 2021-06-30 | Nokia Technologies Oy | Audio processing apparatus |
US9729994B1 (en) * | 2013-08-09 | 2017-08-08 | University Of South Florida | System and method for listener controlled beamforming |
US9596437B2 (en) * | 2013-08-21 | 2017-03-14 | Microsoft Technology Licensing, Llc | Audio focusing via multiple microphones |
US9621919B2 (en) * | 2013-10-23 | 2017-04-11 | Qualcomm Incorporated | Multi-layer video file format designs |
KR20150068112A (ko) * | 2013-12-11 | 2015-06-19 | 삼성전자주식회사 | 오디오를 추적하기 위한 방법 및 전자 장치 |
US9338575B2 (en) * | 2014-02-19 | 2016-05-10 | Echostar Technologies L.L.C. | Image steered microphone array |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
US9516412B2 (en) * | 2014-03-28 | 2016-12-06 | Panasonic Intellectual Property Management Co., Ltd. | Directivity control apparatus, directivity control method, storage medium and directivity control system |
US20150281832A1 (en) * | 2014-03-28 | 2015-10-01 | Panasonic Intellectual Property Management Co., Ltd. | Sound processing apparatus, sound processing system and sound processing method |
KR20150118855A (ko) * | 2014-04-15 | 2015-10-23 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 레코딩 방법 |
US10182280B2 (en) * | 2014-04-23 | 2019-01-15 | Panasonic Intellectual Property Management Co., Ltd. | Sound processing apparatus, sound processing system and sound processing method |
US9913027B2 (en) * | 2014-05-08 | 2018-03-06 | Intel Corporation | Audio signal beam forming |
JP6463904B2 (ja) | 2014-05-26 | 2019-02-06 | キヤノン株式会社 | 信号処理装置及び音源分離方法及びプログラム |
JP6464449B2 (ja) * | 2014-08-29 | 2019-02-06 | 本田技研工業株式会社 | 音源分離装置、及び音源分離方法 |
US10110652B2 (en) * | 2014-10-14 | 2018-10-23 | Intel IP Corporation | Carriage of media content quality information |
WO2016098315A1 (ja) * | 2014-12-15 | 2016-06-23 | パナソニックIpマネジメント株式会社 | マイクアレイ、監視システム及び収音設定方法 |
WO2016103645A1 (ja) * | 2014-12-22 | 2016-06-30 | パナソニックIpマネジメント株式会社 | 指向性制御システム、指向性制御装置、それらのいずれかを備える異常音検出システム及び指向性制御方法 |
US20180270571A1 (en) * | 2015-01-21 | 2018-09-20 | Harman International Industries, Incorporated | Techniques for amplifying sound based on directions of interest |
JP2016146547A (ja) * | 2015-02-06 | 2016-08-12 | パナソニックIpマネジメント株式会社 | 収音システム及び収音方法 |
CN105989845B (zh) * | 2015-02-25 | 2020-12-08 | 杜比实验室特许公司 | 视频内容协助的音频对象提取 |
WO2016185668A1 (ja) * | 2015-05-18 | 2016-11-24 | パナソニックIpマネジメント株式会社 | 指向性制御システム及び音声出力制御方法 |
US10909384B2 (en) * | 2015-07-14 | 2021-02-02 | Panasonic Intellectual Property Management Co., Ltd. | Monitoring system and monitoring method |
EP3185590B1 (en) * | 2015-12-22 | 2020-08-19 | Oticon A/s | A hearing device comprising a sensor for picking up electromagnetic signals from the body |
US9756421B2 (en) * | 2016-01-22 | 2017-09-05 | Mediatek Inc. | Audio refocusing methods and electronic devices utilizing the same |
WO2017136354A1 (en) * | 2016-02-01 | 2017-08-10 | Dolby Laboratories Licensing Corporation | Enabling personalized audio in adaptive streaming |
RU2743732C2 (ru) | 2016-05-30 | 2021-02-25 | Сони Корпорейшн | Способ и устройство для обработки видео- и аудиосигналов и программа |
US10074012B2 (en) * | 2016-06-17 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Sound and video object tracking |
US9749738B1 (en) * | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
US20180341455A1 (en) * | 2017-05-25 | 2018-11-29 | Motorola Mobility Llc | Method and Device for Processing Audio in a Captured Scene Including an Image and Spatially Localizable Audio |
US10134414B1 (en) * | 2017-06-30 | 2018-11-20 | Polycom, Inc. | Interference-free audio pickup in a video conference |
-
2017
- 2017-05-17 RU RU2018141215A patent/RU2743732C2/ru active
- 2017-05-17 BR BR112018074203-1A patent/BR112018074203A2/pt unknown
- 2017-05-17 CN CN201780032313.7A patent/CN109313904B/zh active Active
- 2017-05-17 KR KR1020227038777A patent/KR102650850B1/ko active IP Right Grant
- 2017-05-17 KR KR1020187033085A patent/KR102465227B1/ko active IP Right Grant
- 2017-05-17 JP JP2018520782A patent/JP6984596B2/ja active Active
- 2017-05-17 EP EP17806378.0A patent/EP3467823B1/en active Active
- 2017-05-17 WO PCT/JP2017/018499 patent/WO2017208820A1/ja unknown
- 2017-05-17 CN CN202311581249.1A patent/CN117612539A/zh active Pending
- 2017-05-17 US US16/303,331 patent/US11184579B2/en active Active
-
2021
- 2021-11-16 US US17/527,578 patent/US11902704B2/en active Active
- 2021-11-25 JP JP2021190720A patent/JP7396341B2/ja active Active
-
2024
- 2024-01-09 US US18/407,825 patent/US20240146867A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20190222798A1 (en) | 2019-07-18 |
US11184579B2 (en) | 2021-11-23 |
KR102465227B1 (ko) | 2022-11-10 |
WO2017208820A1 (ja) | 2017-12-07 |
JPWO2017208820A1 (ja) | 2019-03-28 |
RU2743732C2 (ru) | 2021-02-25 |
JP7396341B2 (ja) | 2023-12-12 |
JP2022036998A (ja) | 2022-03-08 |
EP3467823A4 (en) | 2019-09-25 |
RU2018141215A3 (ru) | 2020-07-24 |
KR102650850B1 (ko) | 2024-03-26 |
KR20190013748A (ko) | 2019-02-11 |
EP3467823A1 (en) | 2019-04-10 |
BR112018074203A2 (pt) | 2019-05-14 |
US11902704B2 (en) | 2024-02-13 |
US20220078371A1 (en) | 2022-03-10 |
CN117612539A (zh) | 2024-02-27 |
KR20220155396A (ko) | 2022-11-22 |
EP3467823B1 (en) | 2024-08-21 |
JP6984596B2 (ja) | 2021-12-22 |
US20240146867A1 (en) | 2024-05-02 |
CN109313904A (zh) | 2019-02-05 |
CN109313904B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2018141215A (ru) | Способ и устройство для обработки видео- и аудиосигналов и программа | |
US10692480B2 (en) | System and method of reading environment sound enhancement based on image processing and semantic analysis | |
RU2469418C2 (ru) | Устройство обработки изображений, способ обработки изображений и программа | |
US11853370B2 (en) | Scene aware searching | |
JP2020536455A5 (ru) | ||
KR102340196B1 (ko) | 동영상 처리 장치 및 방법 | |
WO2016187888A1 (zh) | 基于字符识别的关键词通知方法及设备、计算机程序产品 | |
CN107436921B (zh) | 视频数据处理方法、装置、设备及存储介质 | |
RU2016114565A (ru) | Устройство обработки информации, способ и программа | |
KR101378493B1 (ko) | 영상 데이터에 동기화된 텍스트 데이터 설정 방법 및 장치 | |
CN103488764A (zh) | 个性化视频内容推荐方法和系统 | |
RU2010123366A (ru) | Приемное устройство, передающее устройство, система связи, способ управления отображением, программа и структура данных | |
EP3889804A1 (en) | Video quality evaluation method, apparatus and device, and storage medium | |
JP2014006680A5 (ja) | 情報処理装置、情報処理システム、情報処理方法および記録媒体 | |
KR20140044663A (ko) | 방송 수신 장치 및 디스플레이 장치와 이를 이용한 검색 방법 | |
RU2016135266A (ru) | Способ и устройство для воспроизведения субтитров 3d видео | |
CN103986981A (zh) | 多媒体文件的情节片段的识别方法及装置 | |
US20150095929A1 (en) | Method for recognizing content, display apparatus and content recognition system thereof | |
KR102426089B1 (ko) | 전자 장치 및 전자 장치의 요약 영상 생성 방법 | |
CN103594086B (zh) | 语音处理系统、装置及方法 | |
KR20200013145A (ko) | 하이라이트 추출 방법 및 하이라이트 추출 장치 | |
KR101857450B1 (ko) | 컨텐츠 제공 장치, 단말 장치를 포함하는 정보 제공 시스템 및 그 제어 방법 | |
CN105975054A (zh) | 一种信息处理方法和装置 | |
KR101730464B1 (ko) | 사물 인터넷 기반의 카메라를 이용한 멀티미디어 데이터 및 메타 데이터 표출 시스템과 그 방법 | |
TW201615025A (en) | Video capture system and video capture method thereof |