[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2003283673A - Conference call system - Google Patents

Conference call system

Info

Publication number
JP2003283673A
JP2003283673A JP2002085071A JP2002085071A JP2003283673A JP 2003283673 A JP2003283673 A JP 2003283673A JP 2002085071 A JP2002085071 A JP 2002085071A JP 2002085071 A JP2002085071 A JP 2002085071A JP 2003283673 A JP2003283673 A JP 2003283673A
Authority
JP
Japan
Prior art keywords
telephone
voice
voice data
image
conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002085071A
Other languages
Japanese (ja)
Inventor
Hiroaki Nakamura
博明 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2002085071A priority Critical patent/JP2003283673A/en
Publication of JP2003283673A publication Critical patent/JP2003283673A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a conference call system in which each telephone terminal can receive voice data and image data matching its acoustic outputting characteristic and image displaying characteristic. <P>SOLUTION: The voice processing section 30 of a server 10 processes the voices of the voice data V of a speaker transmitted to the telephone terminal at each destination, so that the voices expressed by the voice data V may become suitable to the voice band A of the loudspeaker of the telephone terminal at each destination stored in the storing section 40 of the server 10. The image processing section 50 of the server 10 processes the image data D of the photograph of the face of the speaker, so that the image shown by the image data D transmitted to the telephone terminal at each destination together with the voice data V may become suitable to the screen size of the telephone terminal at each transmitting destination stored in the storing section 40. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、複数の電話端末を
用いて電話会議を実施するための電話会議装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a conference call device for conducting a conference call using a plurality of telephone terminals.

【0002】[0002]

【従来の技術】従来より、遠隔地にいるユーザ同士が電
話会議を実施するシステムが利用されている。近年、テ
レビ電話の低価格化、パソナルコンピュータおよびイン
タネットの普及、設置電話器や、携帯電話器を含む移動
電話器など(これらを以下全部電話端末という)の機能
の充実に伴い、様々な種類の電話端末を利用した電話会
議システムも提案されている。これらの電話会議システ
ムは、発言者となる会議参加者の電話端末装置からの音
声データを多重化処理し、各々の出席者の電話端末装置
に送信することによって電話会議を実施するものであ
る。中には、音声データを送信すると共に、発言者(音
声データの送主)の顔写真の画像データや、バーチャル
会議室の画像に会議出席者の顔写真の画像を合成して得
た画像データなども送信して、出席者全員が同じ会議室
で実施する通常の会議に感覚的に近づけるシステムや、
会議の内容を記録したり、会議参加者に対する課金処理
や、会議参加の受付および登録などの処理を自動的に行
うことが可能な、より効率良く会議を進行することを図
るシステムなども提案されている。
2. Description of the Related Art Conventionally, a system has been used in which users at remote locations hold a telephone conference. In recent years, various types have been introduced due to the price reduction of videophones, the spread of personal computers and the Internet, and the enhancement of functions such as installed telephones and mobile telephones including mobile telephones (these are all called telephone terminals below). A telephone conference system using the above-mentioned telephone terminals has also been proposed. These telephone conference systems carry out a telephone conference by multiplexing voice data from the telephone terminal devices of conference participants who are speakers and transmitting it to the telephone terminal devices of each attendee. Some of them are voice data and the image data of the face photo of the speaker (sender of the voice data) and the image data of the image of the meeting attendees combined with the image of the virtual meeting room. A system that allows all attendees to feel like a normal meeting held in the same meeting room,
A system has been proposed that aims to record the content of the conference, automatically processes the billing for the conference participants, accepts and registers the conference participation, and promotes the conference more efficiently. ing.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、電話会
議に参加する参加者が用いる電話端末の多様化に伴い、
従来の電話会議システムにおいては、下記のような問題
が生じる場合がある。例えば、音声出力装置(ここでは
電話端末のスピーカなどに当たる)から出力される音声
を聞き取りやすくするためには、音声出力装置の音響出
力特性(スピーカが表現できる音声帯域など)に合わせ
てこの音声出力装置に入力される音声データの帯域や周
波数特性を最適化(イコライジング)する必要がある。
これに対して、従来の電話会議システムにおいては、異
なる電話端末に対して、同様の特性(周波数特性、信号
レベルなど)の音声データが送信される。そのため、電
話端末の種類によっては、音声が聞き取りにくいという
問題が生じる。
However, with the diversification of telephone terminals used by participants participating in a conference call,
The conventional telephone conference system may have the following problems. For example, in order to make it easier to hear the voice output from the voice output device (here, it corresponds to the speaker of the telephone terminal, etc.), this voice output is performed according to the acoustic output characteristics of the voice output device (such as the voice band that the speaker can express). It is necessary to optimize (equalize) the band and frequency characteristics of voice data input to the device.
On the other hand, in the conventional conference call system, voice data having similar characteristics (frequency characteristics, signal level, etc.) is transmitted to different telephone terminals. Therefore, depending on the type of telephone terminal, there is a problem that it is difficult to hear the voice.

【0004】また、電話端末が携帯電話器である場合、
その携帯電話器の音響出力特性は、電話会議専用端末の
音響出力特性より劣るにも拘わらず、前述したように、
従来の電話会議システムにおいて携帯電話器と電話会議
専用端末とには、同様の特性の音声データが送信されて
いる。音声帯域の広い音声データは、そのデータのサイ
ズは必然的に音声帯域の狭い音声データより大きく、狭
い音声帯域しか表現できない携帯電話器は、音声帯域の
広い音声データを受信しても表現し切れない上に、大き
いサイズの音声データを受信する時間がかかるので、無
駄が生じ、効率は良くない。
When the telephone terminal is a mobile telephone,
Although the acoustic output characteristics of the mobile phone are inferior to the acoustic output characteristics of the conference call terminal, as described above,
In a conventional conference call system, voice data having similar characteristics is transmitted to a mobile phone and a conference call exclusive terminal. The voice data with a wide voice band is inevitably larger in size than the voice data with a narrow voice band, and a mobile phone that can only express a narrow voice band cannot express it even if it receives voice data with a wide voice band. In addition, it takes time to receive a large amount of audio data, resulting in waste and inefficiency.

【0005】また、音声データと共に何らかの画像デー
タを参加者の電話端末に送信する電話会議システムにお
いては、送信される画像データが電話端末の画像表示特
性(電話端末の画像表示部の画面サイズ、解像度など)
に適していないと、電話端末側では、上述した音声デー
タを受信した際と同様に、効率が悪いという問題が生じ
ると共に、場合によっては、送信されてきた画像データ
により表される画像が良く見えず、確認できなかったり
するなどの問題も生じかねない。
Further, in a teleconference system for transmitting some image data together with voice data to a telephone terminal of a participant, the image data to be transmitted has image display characteristics of the telephone terminal (screen size and resolution of the image display section of the telephone terminal). Such)
If it is not suitable for, the telephone terminal side suffers from the problem of inefficiency as well as when receiving the above-mentioned voice data, and in some cases, the image represented by the transmitted image data looks good. However, problems such as not being able to confirm may occur.

【0006】本発明は上記事情に鑑みなされたものであ
り、各参加者の電話端末に適した音声データおよび画像
データを送信し、効率の良い電話会議を可能にする電話
会議装置を提供することを目的とするものである。
[0006] The present invention has been made in view of the above circumstances, and provides a telephone conference device that enables efficient telephone conference by transmitting voice data and image data suitable for each participant's telephone terminal. The purpose is.

【0007】[0007]

【課題を解決するための手段】本発明の第1の電話会議
装置は、複数の電話端末を用いて電話会議を実施するた
めの電話会議装置であって、各々の前記電話端末の音響
出力特性を取得する音響出力特性取得手段と、前記複数
の電話端末から入力された音声データを受信する受信手
段と、前記音声データを前記複数の電話端末に送信する
送信手段と、前記音声データにより表される音声が、前
記送信手段の送信先の各々の前記電話端末の音響出力特
性に適した音声になるように、前記音声データに対して
音声処理を施す音声処理手段とからなるものであること
を特徴とするものである。
A first conference call device of the present invention is a conference call device for conducting a conference call using a plurality of telephone terminals, and the acoustic output characteristics of each of the telephone terminals. Represented by the voice data, a sound output characteristic acquisition unit for acquiring the voice output characteristic, a reception unit for receiving the voice data input from the plurality of telephone terminals, a transmission unit for transmitting the voice data to the plurality of telephone terminals. Voice processing means for performing voice processing on the voice data so that the voice that is suitable for the acoustic output characteristics of each of the telephone terminals of the transmission destinations of the transmitting means. It is a feature.

【0008】ここで、前記電話端末の「音響出力特性」
とは、電話端末が音響を空間へ出力する特性を意味し、
例えば、電話端末のスピーカが表現できる音声の帯域
や、音量、音質などを例として挙げることができる。
Here, "acoustic output characteristics" of the telephone terminal
Means the characteristic that a telephone terminal outputs sound to space,
For example, the bandwidth of the voice that can be expressed by the speaker of the telephone terminal, the volume, the sound quality, and the like can be given as examples.

【0009】本発明の第2の電話会議装置は、複数の電
話端末を用いて電話会議を実施するための電話会議装置
であって、前記複数の電話端末の画像表示特性を取得す
る画像表示特性取得手段と、前記複数の電話端末から入
力された音声データを受信する受信手段と、前記音声デ
ータおよび該音声データと共に所定の画像データを前記
複数の電話端末に送信する送信手段と、前記所定の画像
データを記憶する記憶手段と、前記所定の画像データに
より表される画像が、前記送信手段の送信先の各々の前
記電話端末の画像表示特性に適した画像になるように、
前記所定の画像データに対して画像処理を施す画像処理
手段とを備えてなるものであることを特徴とするもので
ある。
A second conference call device of the present invention is a conference call device for conducting a conference call using a plurality of telephone terminals, the image display characteristic for acquiring the image display characteristic of the plurality of telephone terminals. Acquisition means, reception means for receiving voice data input from the plurality of telephone terminals, transmission means for transmitting the voice data and predetermined image data together with the voice data to the plurality of telephone terminals, and the predetermined A storage unit that stores image data, and an image represented by the predetermined image data are images suitable for image display characteristics of each of the telephone terminals of the transmission destinations of the transmission unit,
An image processing means for performing image processing on the predetermined image data is provided.

【0010】ここで、電話端末の「画像表示特性」と
は、電話端末側において画像を表示する際の特性を意味
し、コンピュータのモニタや、設置電話器、携帯電話器
の液晶表示部などの画面サイズや、解像度などを例とし
て挙げることができる。
Here, the "image display characteristic" of the telephone terminal means a characteristic at the time of displaying an image on the telephone terminal side, such as a monitor of a computer, an installed telephone, a liquid crystal display portion of a portable telephone, or the like. The screen size and resolution can be given as examples.

【0011】また、本発明の第2の電話会議装置におい
て、音声データと共に送信される前記「所定の画像デー
タ」とは、会議主催者や参加者の意図によって必要とさ
れる画像データや、電話会議装置の仕様上に決められた
画像データなどを意味する。例えば、発言者の顔を確認
できる画像データや、会議参加者全員の顔写真画像を配
置したバーチャル会議室を示すような画像データであっ
てもよい。
Further, in the second telephone conference apparatus of the present invention, the "predetermined image data" transmitted together with the voice data means the image data required by the intention of the conference organizer or the participants and the telephone call. It means image data and the like determined according to the specifications of the conference device. For example, it may be image data capable of confirming the face of the speaker, or image data showing a virtual conference room in which the face photograph images of all the conference participants are arranged.

【0012】また、本発明における音響出力特性取得手
段および画像表示特性取得手段は、参加者から音声デー
タを受信した際に、その音声データの付属情報(例えば
携帯電話からの音声データの場合)などから該当する特
性を自動的に取得するものであってもよいし、予め参加
者に登録させることによって取得するものであってもよ
い。
Further, the sound output characteristic acquisition means and the image display characteristic acquisition means in the present invention, when the voice data is received from the participant, the attached information of the voice data (for example, in the case of the voice data from the mobile phone), etc. The characteristic may be automatically acquired, or may be acquired by registering the participant in advance.

【0013】本発明の電話会議装置は、各々の前記電話
端末のユーザが用いる言語種を登録する言語種登録手段
と、前記音声データを各々の前記ユーザが用いる言語種
に変換する言語種変換手段とを更に備え、前記送信手段
が、前記言語種変換手段により変換された前記音声デー
タを該当する電話端末に送信するものであることが好ま
しい。
The telephone conference apparatus of the present invention includes a language type registration means for registering a language type used by each user of the telephone terminal, and a language type conversion means for converting the voice data into a language type used by each user. It is preferable that the transmitting means further comprises: and the transmitting means transmits the voice data converted by the language type converting means to a corresponding telephone terminal.

【0014】[0014]

【発明の効果】本発明の第1の電話会議装置によれば、
各々の会議参加者の電話端末に発言者からの音声データ
を送信する際に、音声データにより表される音声が、送
信先の電話端末の音響出力特性に適した音声になるよう
に、音声処理を行うようにしているので、送信先の電話
端末側の音響出力特性を生かすと共に、電話端末の音響
出力能力を超えた音声データを受信することに起因する
時間の無駄などの問題を防ぐことができる。
According to the first telephone conference device of the present invention,
When the voice data from the speaker is transmitted to the telephone terminal of each conference participant, the voice processing is performed so that the voice represented by the voice data becomes a voice suitable for the acoustic output characteristics of the destination telephone terminal. Since the sound output characteristics of the destination telephone terminal side are utilized, it is possible to prevent problems such as waste of time due to receiving voice data that exceeds the sound output capability of the telephone terminal. it can.

【0015】本発明の第2の電話会議装置によれば、各
々の会議参加者の電話端末に発言者からの音声データと
共に画像データを送信する際に、画像データにより表さ
れる画像が、送信先の電話端末の画像表示特性に適した
画像になるように、画像処理を行うようにしているの
で、送信先の電話端末側の画像表示特性を生かすと共
に、電話端末の画像表示能力を超えた画像データを受信
および表示することに起因する時間の無駄、画像確認の
困難などの問題を防ぐことができる。
According to the second conference call device of the present invention, when the image data is transmitted to the telephone terminals of the respective conference participants together with the voice data from the speaker, the image represented by the image data is transmitted. Since image processing is performed so that the image is suitable for the image display characteristics of the destination telephone terminal, the image display characteristics of the destination telephone terminal side are utilized and the image display capability of the telephone terminal is exceeded. It is possible to prevent problems such as waste of time and difficulty in image confirmation due to receiving and displaying image data.

【0016】本発明の第1と第2の電話会議装置に、音
声データを電話端末のユーザが所望する言語種に変換す
る言語種変換手段を備えることによって、異なる言語種
の会議参加者による電話会議ができる。
By providing the first and second telephone conference devices of the present invention with language type conversion means for converting voice data into a language type desired by the user of the telephone terminal, telephone calls made by conference participants of different language types. You can have a meeting.

【0017】[0017]

【発明の実施の形態】以下、図面を参照して、本発明の
実施形態について説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.

【0018】図1は、本発明の電話会議装置の実施形態
となる電話会議システムの構成を示すブロック図であ
る。図示のように、本実施形態の電話会議システムは、
インタネット電話を利用するパソナルコンピュータ1
や、携帯電話2や、液晶ディスプレイ付きの設置電話3
や、テレビ会議装置4などの電話端末と、これらの電話
端末を用いて電話会議を実施するためのサーバ10とか
らなるものである。サーバ10と各々の電話端末とは、
電話網やインターネットなどの公衆通信網を介して接続
される。
FIG. 1 is a block diagram showing the configuration of a telephone conference system which is an embodiment of the telephone conference apparatus of the present invention. As shown in the figure, the telephone conference system of this embodiment is
Personal computer using internet telephone 1
Or mobile phone 2 or installed phone 3 with liquid crystal display
Or a telephone terminal such as the video conference apparatus 4 and a server 10 for conducting a telephone conference using these telephone terminals. The server 10 and each telephone terminal
Connected via a public communication network such as a telephone network or the Internet.

【0019】図2は、図1に示す電話会議システムのサ
ーバ10の構成を示すブロック図である。図示のよう
に、サーバ10は、各々の電話端末からの入力を受け付
ける受信部15と、会議開催前に各々の電話端末を介し
て、会議参加者に、氏名、顔写真画像データD、端末
種、端末のスピーカの帯域A、画像表示部の画面サイズ
S、使用する言語種Lの登録を行わせる登録部25と、
登録部25の登録内容を参加者毎に記憶する記憶部40
と、会議開始後に受信部15を介して受信した発言者の
音声データVにより表される音声(以下略した発言者の
音声という)の帯域が、送信先の各々の電話端末のスピ
ーカの帯域Aに適合するように、音声データVに対して
音声処理を行う音声処理部30と、音声処理部30によ
り出力された音声データV’を送信先の電話端末のユー
ザが使用する言語種に変換する言語変換部45と、発言
者の顔写真画像データDを記憶部40から読み出すと共
に、該顔写真画像データDにより表される写真画像(以
下略して写真画像という)が、送信先の電話端末の画像
表示部の画面サイズに適した大きさになるように処理す
る画像処理部50と、言語変換部45と画像処理部50
から夫々出力された音声データV’’と画像データD’
とを合成して、合成データMを得る合成処理部60と、
合成データMを該当する電話端末に送信する送信部70
とを備えてなるものである。
FIG. 2 is a block diagram showing the configuration of the server 10 of the telephone conference system shown in FIG. As shown in the figure, the server 10 receives the input from each of the telephone terminals, and receives the name, face photograph image data D, and terminal type of the conference participant via each telephone terminal before the conference is held. , A band A of the speaker of the terminal, a screen size S of the image display unit, a registration unit 25 for registering a language type L to be used,
Storage unit 40 that stores the registration contents of the registration unit 25 for each participant
And the band of the voice represented by the voice data V of the speaker (hereinafter, referred to as the voice of the speaker) received via the receiving unit 15 after the start of the conference is the band A of the speaker of each telephone terminal of the transmission destination. So that the voice data V is output, the voice processing unit 30 for performing voice processing on the voice data V and the voice data V ′ output by the voice processing unit 30 are converted into the language type used by the user of the destination telephone terminal. The language conversion unit 45 and the face photograph image data D of the speaker are read from the storage unit 40, and the photograph image represented by the face photograph image data D (hereinafter abbreviated as photograph image) is stored in the destination telephone terminal. An image processing unit 50 that processes the image display unit to a size suitable for the screen size of the image display unit, a language conversion unit 45, and an image processing unit 50.
Audio data V ″ and image data D ′ respectively output from
A combination processing unit 60 for combining and to obtain combined data M,
A transmitter 70 for transmitting the composite data M to the corresponding telephone terminal.
It is equipped with and.

【0020】図3は、会議開催前に、登録部25により
登録された内容を記憶した記憶部40の記憶内容の1例
を示している。図示のように、記憶部40には、参加者
のユーザが使用する端末種、端末のスピーカの帯域A、
言語種L、顔写真画像データDが参加者のユーザ(ユー
ザ1、ユーザ2、...ユーザ4)毎に記憶されてい
る。このように、会議参加者が登録部25において登録
が終われば、会議開催の準備が整ったこととなる。
FIG. 3 shows an example of the stored contents of the storage unit 40 which stores the contents registered by the registration unit 25 before the conference is held. As illustrated, the storage unit 40 stores in the storage unit 40 the type of terminal used by the user of the participant, the band A of the speaker of the terminal,
The language type L and the facial photograph image data D are stored for each participant user (user 1, user 2, ... User 4). In this way, when the conference participants are registered in the registration unit 25, the preparation for holding the conference is completed.

【0021】次いで、図3に示す例を用いて、会議開始
後の本実施形態の電話会議システムのサーバ10の動作
を具体的に説明する。
Next, the operation of the server 10 of the telephone conference system of the present embodiment after the conference is started will be specifically described by using the example shown in FIG.

【0022】図4は、会議開始後のサーバ10の動作を
示すフローチャートである。図示のように、会議が開始
すると、サーバ10の受信部15が、いずれかの電話端
末から音声データVを受信すると(S10)、音声処理
部30は、記憶部40の記憶内容を参照し、各々の送信
先の電話端末のスピーカの音声帯域Aを確認する(S2
0)と共に、音声データVの音声の帯域を、送信先の電
話端末のスピーカの帯域に会わせるように、音声データ
Vに対して音声処理を行って、処理済みの音声データ
V’を言語変換部45に出力する(S25)。
FIG. 4 is a flowchart showing the operation of the server 10 after the start of the conference. As illustrated, when the conference starts, when the receiving unit 15 of the server 10 receives the voice data V from any of the telephone terminals (S10), the voice processing unit 30 refers to the storage content of the storage unit 40, Confirm the voice band A of the speaker of each destination telephone terminal (S2
Along with 0), voice processing is performed on the voice data V so that the voice band of the voice data V matches the band of the speaker of the destination telephone terminal, and the processed voice data V ′ is converted into a language. It is output to the unit 45 (S25).

【0023】言語変換部45は、音声処理部30から出
力されてきた音声データV’を受信すると、まず、記憶
部40の記憶内容を参照し、この音声データV’の送信
元のユーザが使用する言語種Lと、各々の送信先のユー
ザが使用する言語種Lと比較する(S30)。送信元の
言語種と送信先の言語種とが同一であれば(S30:N
o。例えば送信元はユーザ1であり、送信先はユーザ3
である場合)、音声データV’を変換処理済み音声デー
タV’’としてそのまま合成処理部60に出力するが、
送信元の言語種と送信先の言語種が異なっていれば(S
30:Yes。例えば送信元はユーザ1であり、送信先
はユーザ2である場合)、音声データV’を送信先のユ
ーザの言語種に変換して変換処理済み音声データV’’
を合成処理部60に出力する(S35)。音声処理部3
0と言語変換部45とは、ステップS20からステップ
S35までの処理を全ての送信先の電話端末に対して行
うことによって、すべての参加者の電話端末に送信する
音声データV’’を得る。
Upon receiving the voice data V ′ output from the voice processing unit 30, the language conversion unit 45 first refers to the stored contents of the storage unit 40 and uses it by the user who is the sender of this voice data V ′. The language type L to be used is compared with the language type L used by each destination user (S30). If the source language type and the destination language type are the same (S30: N
o. For example, the transmission source is the user 1 and the transmission destination is the user 3
If it is), the audio data V ′ is directly output to the synthesis processing unit 60 as the converted audio data V ″.
If the source language type and the destination language type are different (S
30: Yes. For example, when the transmission source is the user 1 and the transmission destination is the user 2), the voice data V ′ is converted into the language type of the transmission destination user, and the converted voice data V ″ is converted.
Is output to the synthesis processing unit 60 (S35). Voice processing unit 3
0 and the language conversion unit 45 obtain the voice data V ″ to be transmitted to the telephone terminals of all the participants by performing the processing from step S20 to step S35 for all the telephone terminals of the destinations.

【0024】一方、ステップS20からステップS35
までの処理と併行して、画像処理部50は、記憶部40
から、音声データVの送信元のユーザの顔写真画像デー
タDを読み出す(S40)と共に、各々の送信先の電話
端末の画面サイズSを確認し、顔写真のサイズが、送信
先の電話端末の画面サイズSに適合した大きさになるよ
うに、顔写真画像データDに対して画像処理を行って、
処理済みの画像データD’を合成処理部60に出力する
(S45、S50)。画像処理部50は、全ての送信先
の電話端末に対して、ステップS40からステップS5
0までの処理を行って、全ての参加者の電話端末に送信
する発言者の顔写真画像データD’を得る。
On the other hand, steps S20 to S35
In parallel with the above processing, the image processing unit 50
The face photograph image data D of the sender of the voice data V is read from (S40), and the screen size S of each destination telephone terminal is confirmed, and the size of the face photograph is the same as that of the destination telephone terminal. Image processing is performed on the face photograph image data D so that the size matches the screen size S,
The processed image data D ′ is output to the synthesis processing unit 60 (S45, S50). The image processing unit 50 performs steps S40 to S5 for all the destination telephone terminals.
The process up to 0 is performed to obtain the face photograph image data D ′ of the speaker to be transmitted to the telephone terminals of all the participants.

【0025】合成処理部60は、言語変換部45から出
力された、各々の送信先の電話端末に送信するための音
声データV’’(ユーザ1に対してはV1’’、ユーザ
2に対してはV2’’、...)と、画像処理部50か
ら出力された、各々の送信先の電話端末に送信するため
の発言者の顔写真画像データD’とを送信先の電話端末
毎に合成して送信部70に出力し(S60)、送信部7
0により、合成データM(ユーザ1に対してM1、ユー
ザ2に対してM2、...)を夫々の該当するユーザの
電話端末に送信する(S70)。
The synthesis processing unit 60 outputs the voice data V ″ (V1 ″ for the user 1 and the user 2 for the user 2 which is output from the language conversion unit 45 and is to be transmitted to each destination telephone terminal. , V2 ″, ...) and the face photograph image data D ′ of the speaker output from the image processing unit 50 for transmission to each destination telephone terminal are transmitted to each destination telephone terminal. And outputs to the transmission unit 70 (S60).
By 0, the composite data M (M1 for user 1, M2 for user 2, ...) Is transmitted to the telephone terminals of the corresponding users (S70).

【0026】このように、本実施形態の電話会議システ
ムによれば、発言者の音声データと顔写真画像データと
を会議参加者の電話端末に送信する際に、各々の送信先
の電話端末のスピーカの音声帯域と画面サイズに合わせ
て、音声データと顔写真画像データに対して夫々音声処
理と画像処理を行うようにすることによって、送信先の
電話端末装置側においては、自分のスピーカの音声帯域
を越えた帯域を有する音声データまたは自分の画面サイ
ズより大きい画像のデータを受信することを避け、時間
の無駄を無くすと共に、自分の音響出力特性および画像
表示特性に適した音声および画像を得ることができる。
As described above, according to the telephone conference system of this embodiment, when the voice data of the speaker and the face photograph image data are transmitted to the telephone terminals of the conference participants, the telephone terminals of the respective destinations are transmitted. By performing voice processing and image processing on the voice data and the facial photograph image data, respectively, according to the voice band and screen size of the speaker, the telephone terminal device side of the destination transmits the voice of its own speaker. Avoid receiving audio data that has a band that exceeds the band or image data that is larger than your screen size to avoid wasting time and obtain audio and images that are suitable for your own acoustic output characteristics and image display characteristics. be able to.

【0027】また、図1に示す電話会議システムにおい
て、送信先のユーザが使用する言語種にあわせて言語種
の変換を行うことによって、異なる言語種の参加者によ
る電話会議を実現することができる。
Further, in the telephone conference system shown in FIG. 1, by converting the language type according to the language type used by the destination user, it is possible to realize a telephone conference with participants of different language types. .

【0028】上述において、本発明の電話会議装置の望
ましい実施形態について説明したが、本発明は、上述し
た実施形態に限られるものではなく、本発明の主旨を変
えない限り、様々な変更を加えることができる。
Although the preferred embodiment of the telephone conference apparatus of the present invention has been described above, the present invention is not limited to the above-mentioned embodiment, and various modifications are made unless the gist of the present invention is changed. be able to.

【0029】例えば、画像処理部50は、送信先の電話
端末の画面サイズに合わせて送信する画像データの画像
の大きさを調整するようにしているが、送信先の電話端
末の解像度に合わせて画像データに対する画像処理を行
うようにしてもよい。
For example, the image processing section 50 adjusts the size of the image of the image data to be transmitted according to the screen size of the destination telephone terminal, but according to the resolution of the destination telephone terminal. Image processing may be performed on the image data.

【0030】また、音声処理部30は、送信先の電話端
末のスピーカの音声帯域に合わせて送信する音声データ
の音声の帯域の処理を行うようにしているが、送信先の
電話端末のスピーカの音量範囲や、音質などに基づいた
音声処理を行うようにしてもよい。
Further, the voice processing section 30 is adapted to process the voice band of the voice data to be transmitted in accordance with the voice band of the speaker of the destination telephone terminal. You may make it perform the audio | voice processing based on a volume range, sound quality, etc.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の電話会議装置の実施形態となる電話会
議システムの構成を示す図
FIG. 1 is a diagram showing a configuration of a telephone conference system as an embodiment of a telephone conference apparatus of the present invention.

【図2】図1に示す画像サービスシステムに備えられた
サーバ10の構成を示す図
FIG. 2 is a diagram showing a configuration of a server 10 included in the image service system shown in FIG.

【図3】図2に示すサーバ10の記憶部40の記憶内容
の例を示す図
3 is a diagram showing an example of stored contents of a storage unit 40 of the server 10 shown in FIG.

【図4】図2に示すサーバ10の動作を示すフローチャ
ート
FIG. 4 is a flowchart showing the operation of the server 10 shown in FIG.

【符号の説明】[Explanation of symbols]

1 パソナルコンピュータ 2 携帯電話器 3 設置電話器 4 テレビ会議装置 10 サーバ 15 受信部 25 登録部 30 音声処理部 40 記憶部 45 言語変換部 50 画像処理部 60 合成処理部 70 送信部 V 音声データ D 顔写真画像データ L 言語種 1 Personal computer 2 mobile phones 3 installed telephones 4 video conferencing equipment 10 servers 15 Receiver 25 Registration Department 30 voice processing unit 40 storage 45 Language converter 50 Image processing unit 60 Synthesis processing unit 70 Transmitter V voice data D face photograph image data L language type

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 複数の電話端末を用いて電話会議を実施
するための電話会議装置であって、 各々の前記電話端末の音響出力特性を取得する音響出力
特性取得手段と、 前記複数の電話端末から入力された音声データを受信す
る受信手段と、 前記音声データを前記複数の電話端末に送信する送信手
段と、 前記音声データにより表される音声が、前記送信手段の
送信先の各々の前記電話端末の音響出力特性に適した音
声になるように、前記音声データに対して音声処理を施
す音声処理手段とからなるものであることを特徴とする
電話会議装置。
1. A conference call device for conducting a conference call using a plurality of telephone terminals, comprising: acoustic output characteristic acquisition means for obtaining acoustic output characteristics of each of the telephone terminals; and the plurality of telephone terminals. Receiving means for receiving voice data input from the transmitting means, transmitting means for transmitting the voice data to the plurality of telephone terminals, and voice represented by the voice data for each telephone of the transmission destinations of the transmitting means. A telephone conferencing apparatus comprising: a voice processing means for performing voice processing on the voice data so that the voice is suitable for the acoustic output characteristic of the terminal.
【請求項2】 複数の電話端末を用いて電話会議を実施
するための電話会議装置であって、 前記複数の電話端末の画像表示特性を取得する画像表示
特性取得手段と、 前記複数の電話端末から入力された音声データを受信す
る受信手段と、 前記音声データおよび該音声データと共に所定の画像デ
ータを前記複数の電話端末に送信する送信手段と、 前記所定の画像データを記憶する記憶手段と、 前記所定の画像データにより表される画像が、前記送信
手段の送信先の各々の前記電話端末の画像表示特性に適
した画像になるように、前記所定の画像データに対して
画像処理を施す画像処理手段とを備えてなるものである
ことを特徴とする電話会議装置。
2. A conference call device for conducting a conference call using a plurality of telephone terminals, the image display characteristic obtaining means obtaining image display characteristics of the plurality of telephone terminals, and the plurality of telephone terminals. Receiving means for receiving the voice data input from, a transmitting means for transmitting the voice data and predetermined image data together with the voice data to the plurality of telephone terminals, and a storage means for storing the predetermined image data, An image subjected to image processing on the predetermined image data so that the image represented by the predetermined image data becomes an image suitable for the image display characteristics of each of the telephone terminals of the transmission destinations of the transmission means. A telephone conference apparatus comprising: a processing unit.
【請求項3】 各々の前記電話端末のユーザが用いる言
語種を登録する言語種登録手段と、 前記音声データを各々の前記ユーザが用いる言語種に変
換する言語種変換手段とを更に備え、 前記送信手段が、前記言語種変換手段により変換された
前記音声データを該当する電話端末に送信するものであ
ることを特徴とする請求項1または2記載の電話会議装
置。
3. A language type registering unit for registering a language type used by each user of the telephone terminal, and a language type converting unit for converting the voice data into a language type used by each user, 3. The telephone conference apparatus according to claim 1, wherein the transmitting unit transmits the voice data converted by the language type converting unit to a corresponding telephone terminal.
JP2002085071A 2002-03-26 2002-03-26 Conference call system Withdrawn JP2003283673A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002085071A JP2003283673A (en) 2002-03-26 2002-03-26 Conference call system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002085071A JP2003283673A (en) 2002-03-26 2002-03-26 Conference call system

Publications (1)

Publication Number Publication Date
JP2003283673A true JP2003283673A (en) 2003-10-03

Family

ID=29232166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002085071A Withdrawn JP2003283673A (en) 2002-03-26 2002-03-26 Conference call system

Country Status (1)

Country Link
JP (1) JP2003283673A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010130362A (en) * 2008-11-27 2010-06-10 Nec Infrontia Corp Key telephone set, telecommunication system, reception control method, and program
JP2011066585A (en) * 2009-09-16 2011-03-31 Brother Industries Ltd Communication terminal device, communication control method, and communication control program,
WO2011158442A1 (en) * 2010-06-15 2011-12-22 日本電気株式会社 Information processing system and information processing method
JP2013098936A (en) * 2011-11-04 2013-05-20 Canon Inc Imaging device, communication device, control method for the same devices, and program
JP2013211764A (en) * 2012-03-30 2013-10-10 Brother Ind Ltd Audio controller, audio control method, and audio control program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010130362A (en) * 2008-11-27 2010-06-10 Nec Infrontia Corp Key telephone set, telecommunication system, reception control method, and program
JP2011066585A (en) * 2009-09-16 2011-03-31 Brother Industries Ltd Communication terminal device, communication control method, and communication control program,
WO2011158442A1 (en) * 2010-06-15 2011-12-22 日本電気株式会社 Information processing system and information processing method
JP2012004705A (en) * 2010-06-15 2012-01-05 Nec Corp Information processing system, information processing method, and information processing program
US9392065B2 (en) 2010-06-15 2016-07-12 Nec Corporation Information processing system and information processing method
JP2013098936A (en) * 2011-11-04 2013-05-20 Canon Inc Imaging device, communication device, control method for the same devices, and program
JP2013211764A (en) * 2012-03-30 2013-10-10 Brother Ind Ltd Audio controller, audio control method, and audio control program

Similar Documents

Publication Publication Date Title
EP1920567B1 (en) System for service sharing and controling contents in a voice session and method thereof
US7225224B2 (en) Teleconferencing server and teleconferencing system
US8989361B2 (en) Methods, systems, and products for monitoring conferences
JP3866793B2 (en) Network system
AU2005203246B2 (en) Call processing apparatus and method in video communication network
CN100373851C (en) Communication method, communication server device, communication terminal device, and communication system
KR20050083647A (en) Sign language interpretation system and sign language interpretation method
KR101918674B1 (en) Videoconferencing Server for Providing Multi-Screen Videoconferencing by Using Plural Videoconferencing Terminals and Audio Echo-Cancelling Method therefor
US7277115B2 (en) Communication terminal device capable of transmitting visage information
KR20070111523A (en) Broadcasting system and data transmission method
JP2005286972A (en) Multi-point conference connection system and multi-point conference connection method
CN108322429B (en) Recording control method in real-time communication, real-time communication system and communication terminal
JP2003283673A (en) Conference call system
JP2003283672A (en) Conference call system
JP2005168012A (en) Video phone compatible type internet phone
US20070120949A1 (en) Video, sound, and voice over IP integration system
TW587384B (en) Phone receiver sharing device and system and method applying such device for multi-party communication
JP5136823B2 (en) PoC system with fixed message function, communication method, communication program, terminal, PoC server
JP2004007482A (en) Telephone conference server and system therefor
JP2004248127A (en) Television conference system
KR100782077B1 (en) Pending image transmission method of multi-party video communication terminal
JP2006140596A (en) Communication terminal
KR101039433B1 (en) Video call terminal supporting video conferencing
KR101427278B1 (en) Video conference server and video conference terminal and video conference method using the same
JP2003163906A (en) Television conference system and method therefor

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050607