JP7427408B2 - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents
情報処理装置、情報処理方法、及び情報処理プログラム Download PDFInfo
- Publication number
- JP7427408B2 JP7427408B2 JP2019184431A JP2019184431A JP7427408B2 JP 7427408 B2 JP7427408 B2 JP 7427408B2 JP 2019184431 A JP2019184431 A JP 2019184431A JP 2019184431 A JP2019184431 A JP 2019184431A JP 7427408 B2 JP7427408 B2 JP 7427408B2
- Authority
- JP
- Japan
- Prior art keywords
- display
- unit
- speaker
- information processing
- display target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 100
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000012545 processing Methods 0.000 claims description 51
- 238000003384 imaging method Methods 0.000 claims description 7
- 238000000034 method Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/567—Multimedia conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/22—Synchronisation circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
- H04M2201/405—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/41—Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Ophthalmology & Optometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
以下、図9を参照しつつ、情報処理装置1の制御部11によって実行される表示制御処理の手順の一例について説明する。ここでは、図1に示す会議システム100において、情報処理装置1Aに着目して前記表示制御処理を説明する。例えば、情報処理装置1Aの制御部11は、ユーザの音声を受信することにより前記表示制御プログラムの実行を開始することによって、前記表示制御処理の実行を開始する。なお、前記表示制御処理は、情報処理装置1A,1Bのそれぞれにおいて、個別に並行して実行される。
2 :表示装置
14 :マイク
15 :カメラ
100 :会議システム
111 :音声受信部
112 :画像取得部
113 :話者特定部
114 :表示対象特定部
115 :表示処理部
Claims (11)
- 撮像部により撮像される撮像画像を取得する画像取得部と、
発話者を特定する話者特定部と、
前記画像取得部により取得される前記撮像画像から、前記話者特定部により特定される前記発話者に対応する表示対象を特定する表示対象特定部と、
前記表示対象特定部により特定される前記表示対象に対応する表示情報を第1表示部に表示させる表示処理部と、
を備え、
前記表示対象特定部により特定された前記表示対象が第2表示部の表示画面である場合に、前記表示処理部は、前記表示画面に表示される表示内容を、当該表示内容に対応する表示データに基づいて前記第1表示部に表示させる、情報処理装置。 - 前記表示対象特定部は、前記撮像画像に基づいて前記発話者の視線方向を特定し、特定した前記視線方向に基づいて前記撮像画像から前記表示対象を特定する、
請求項1に記載の情報処理装置。 - 音声を受信する音声受信部をさらに備え、
前記表示対象特定部は、前記音声受信部により受信される前記音声に対応する発話内容に基づいて前記撮像画像から前記表示対象を特定する、
請求項1に記載の情報処理装置。 - 音声を受信する音声受信部をさらに備え、
前記表示対象特定部は、前記撮像画像に基づいて前記発話者の視線方向を特定し、特定した前記視線方向と前記音声受信部により受信される前記音声に対応する発話内容とに基づいて前記撮像画像から前記表示対象を特定する、
請求項1に記載の情報処理装置。 - 前記表示対象特定部により特定された前記表示対象が前記発話者とは異なる人物である場合に、前記表示処理部は、前記撮像画像に含まれる前記発話者の画像と前記人物の画像とを前記第1表示部に並べて表示させる、
請求項1から請求項4のいずれか1項に記載の情報処理装置。 - 前記表示対象特定部により特定された前記表示対象が物体である場合に、前記表示処理部は、前記撮像画像に含まれる前記物体の画像を前記第1表示部に表示させ、前記撮像画像に含まれる前記発話者の画像を前記第1表示部に表示させない、
請求項1から請求項4のいずれか1項に記載の情報処理装置。 - 前記表示処理部は、さらに、前記表示対象特定部により特定された前記表示対象に応じた特定情報を前記第1表示部に表示させる、
請求項1から請求項6のいずれか1項に記載の情報処理装置。 - 音声を集音するマイクの指向性を前記人物の方向に設定する、
請求項5に記載の情報処理装置。 - 前記表示処理部は、前記表示情報を前記第1表示部に表示させてから、所定時間経過するまで又は前記表示対象特定部により異なる前記表示対象が特定されるまで、継続して当該表示情報を前記第1表示部に表示させる、
請求項1から請求項8のいずれか1項に記載の情報処理装置。 - 撮像部により撮像される撮像画像を取得する画像取得ステップと、
発話者を特定する話者特定ステップと、
前記画像取得ステップにより取得される前記撮像画像から、前記話者特定ステップにより特定される前記発話者に対応する表示対象を特定する表示対象特定ステップと、
前記表示対象特定ステップにより特定される前記表示対象に対応する表示情報を第1表示部に表示させる表示ステップと、
を一又は複数のプロセッサーが実行し、
前記表示対象特定ステップにより特定された前記表示対象が第2表示部の表示画面である場合に、前記表示ステップにおいて、前記表示画面に表示される表示内容を、当該表示内容に対応する表示データに基づいて前記第1表示部に表示させる、情報処理方法。 - 撮像部により撮像される撮像画像を取得する画像取得ステップと、
発話者を特定する話者特定ステップと、
前記画像取得ステップにより取得される前記撮像画像から、前記話者特定ステップにより特定される前記発話者に対応する表示対象を特定する表示対象特定ステップと、
前記表示対象特定ステップにより特定される前記表示対象に対応する表示情報を第1表示部に表示させる表示ステップと、
を一又は複数のプロセッサーに実行させるための情報処理プログラムであって、
前記表示対象特定ステップにより特定された前記表示対象が第2表示部の表示画面である場合に、前記表示ステップにおいて、前記表示画面に表示される表示内容を、当該表示内容に対応する表示データに基づいて前記第1表示部に表示させる、情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019184431A JP7427408B2 (ja) | 2019-10-07 | 2019-10-07 | 情報処理装置、情報処理方法、及び情報処理プログラム |
US17/035,636 US20210105437A1 (en) | 2019-10-07 | 2020-09-28 | Information processing device, information processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019184431A JP7427408B2 (ja) | 2019-10-07 | 2019-10-07 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021061527A JP2021061527A (ja) | 2021-04-15 |
JP7427408B2 true JP7427408B2 (ja) | 2024-02-05 |
Family
ID=75274497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019184431A Active JP7427408B2 (ja) | 2019-10-07 | 2019-10-07 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210105437A1 (ja) |
JP (1) | JP7427408B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022109048A (ja) * | 2021-01-14 | 2022-07-27 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
WO2023191814A1 (en) * | 2022-04-01 | 2023-10-05 | Hewlett-Packard Development Company, L.P. | Audience configurations of audiovisual signals |
KR102720846B1 (ko) * | 2022-06-07 | 2024-10-24 | 엘지전자 주식회사 | 파 엔드 단말기 및 그의 음성 포커싱 방법 |
US11881025B1 (en) * | 2022-07-11 | 2024-01-23 | Hewlett-Packard Development Company, L.P. | Compound images |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003023612A (ja) | 2001-07-10 | 2003-01-24 | Mitsubishi Electric Corp | 画像通信端末装置 |
JP2003323628A (ja) | 2002-05-02 | 2003-11-14 | Nippon Hoso Kyokai <Nhk> | 発言者特定映像装置およびそのプログラムならびに発言者特定映像表示方法 |
JP2005124160A (ja) | 2003-09-25 | 2005-05-12 | Fuji Photo Film Co Ltd | 会議支援システム、情報表示装置、プログラム、及び制御方法 |
JP2009206924A (ja) | 2008-02-28 | 2009-09-10 | Fuji Xerox Co Ltd | 情報処理装置、情報処理システム及び情報処理プログラム |
JP2017034502A (ja) | 2015-08-03 | 2017-02-09 | 株式会社リコー | 通信装置、通信方法、プログラムおよび通信システム |
-
2019
- 2019-10-07 JP JP2019184431A patent/JP7427408B2/ja active Active
-
2020
- 2020-09-28 US US17/035,636 patent/US20210105437A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003023612A (ja) | 2001-07-10 | 2003-01-24 | Mitsubishi Electric Corp | 画像通信端末装置 |
JP2003323628A (ja) | 2002-05-02 | 2003-11-14 | Nippon Hoso Kyokai <Nhk> | 発言者特定映像装置およびそのプログラムならびに発言者特定映像表示方法 |
JP2005124160A (ja) | 2003-09-25 | 2005-05-12 | Fuji Photo Film Co Ltd | 会議支援システム、情報表示装置、プログラム、及び制御方法 |
JP2009206924A (ja) | 2008-02-28 | 2009-09-10 | Fuji Xerox Co Ltd | 情報処理装置、情報処理システム及び情報処理プログラム |
JP2017034502A (ja) | 2015-08-03 | 2017-02-09 | 株式会社リコー | 通信装置、通信方法、プログラムおよび通信システム |
Also Published As
Publication number | Publication date |
---|---|
JP2021061527A (ja) | 2021-04-15 |
US20210105437A1 (en) | 2021-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7427408B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP5201050B2 (ja) | 会議支援装置、会議支援方法、会議システム、会議支援プログラム | |
US10848889B2 (en) | Intelligent audio rendering for video recording | |
JP4474013B2 (ja) | 情報処理装置 | |
WO2013024704A1 (ja) | 画像処理装置および方法、並びにプログラム | |
KR101077267B1 (ko) | 얼굴인식 회의 속기 시스템 및 방법 | |
JP2019220848A (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2014146066A (ja) | 文書データ生成装置、文書データ生成方法及びプログラム | |
EP2503545A1 (en) | Arrangement and method relating to audio recognition | |
JP2023131635A (ja) | 表示システム、表示方法、撮像装置、プログラム | |
JP7400364B2 (ja) | 音声認識システム及び情報処理方法 | |
JP5272820B2 (ja) | テレビ会議装置、テレビ会議システム、テレビ会議方法、及びテレビ会議プログラム | |
US11184184B2 (en) | Computer system, method for assisting in web conference speech, and program | |
WO2021192991A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2019149083A (ja) | 議事録生成装置、議事録生成方法、及びプログラム | |
JP2009060220A (ja) | コミュニケーションシステム及びコミュニケーションプログラム | |
JP2019176375A (ja) | 動画出力装置、動画出力方法および動画出力プログラム | |
JP2019135609A (ja) | 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム | |
JP2007251355A (ja) | 対話システム用中継装置、対話システム、対話方法 | |
CN112584225A (zh) | 视频录制处理方法、视频播放控制方法及电子设备 | |
JP7397084B2 (ja) | データ作成方法及びデータ作成プログラム | |
TWI581626B (zh) | 影音自動處理系統及方法 | |
CN111816183B (zh) | 基于音视频录制的语音识别方法、装置、设备及存储介质 | |
JP2021105688A (ja) | 会議支援装置 | |
JP7525222B2 (ja) | 遠隔会議システム、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7427408 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |