JP4504216B2 - Image processing apparatus and image processing program - Google Patents
Image processing apparatus and image processing program Download PDFInfo
- Publication number
- JP4504216B2 JP4504216B2 JP2005031796A JP2005031796A JP4504216B2 JP 4504216 B2 JP4504216 B2 JP 4504216B2 JP 2005031796 A JP2005031796 A JP 2005031796A JP 2005031796 A JP2005031796 A JP 2005031796A JP 4504216 B2 JP4504216 B2 JP 4504216B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- data
- unique
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
本発明は、入力画像を記号の集合体で構成した画像に置換して、かかる置換画像を動画再生する画像処理装置および画像処理プログラムに関する。 The present invention relates to an image processing apparatus and an image processing program for replacing an input image with an image composed of a collection of symbols and reproducing the replacement image as a moving image.
近年、電子メールやインターネットが広く普及し、これに伴い、電子メールやインターネットの掲示板等で、文章表現ツールの1種としていわゆる「顔文字」が広く使用されている。「顔文字」は、表情を模した画像が記号(文字)の組み合わせにより作成されたテキストデータである。 In recent years, e-mail and the Internet have become widespread, and accordingly, so-called “emoticons” are widely used as a kind of text expression tool in e-mail and Internet bulletin boards. “Emoji” is text data in which an image simulating an expression is created by a combination of symbols (characters).
かかる「顔文字」は、使用者個人が記号を組み合わせて作成するもの以外に、予めコンピュータ内部に記憶されていたり、サーバからのダウンロードにより取得することができる。使用者は、かかる「顔文字」を表現内容に合わせて適宜選択し、文章中に添付することにより、文章表現に加え、自己の気分や感情を表現する。この「顔文字」の添付により、文章だけでは伝達できない情緒が表現され、自己と他者との間で高度なコミュニケーションを行うことができる上、文章の娯楽性を向上させることができるのである。 Such “emoticons” can be stored in advance in the computer or obtained by downloading from a server, in addition to those created by a user combining symbols. The user appropriately selects such “emoticon” according to the expression content and attaches it to the sentence, thereby expressing his / her feelings and emotions in addition to the sentence expression. By attaching this “emoticon”, an emotion that cannot be transmitted only by the text is expressed, and advanced communication can be performed between the self and others, and the entertainment of the text can be improved.
また、かかる「顔文字」を顔画像のパターンに対応付けて記憶させており、カメラにて撮像された使用者の顔の表情(顔画像のパターン)に応じて、対応する「顔文字」を文中に入力する顔文字入力のためのシステムが開示されている(特許文献1参照)。
しかしながら、上記文献に開示されたシステムでは、カメラから取り込んだ使用者の顔の表情に応じて画像を添付できるものの、「顔文字」は、不特定多数の者が共通の認識を持つことのできる表情を模した画像であって個々の使用者の特徴が反映されたものではない。このため、「顔文字」を使用した表現は個性のない画一的な表現になってしまうという問題点があった。更に、「顔文字」等による表現は、広く普及しているので新鮮さに欠け、閲覧する者の興趣を高め難いという問題点があった。 However, in the system disclosed in the above document, although an image can be attached according to the facial expression of the user captured from the camera, the “emoticon” can be shared by many unspecified people. It is an image that imitates an expression and does not reflect the characteristics of each user. For this reason, there is a problem that the expression using the “emoticon” becomes a uniform expression without individuality. Furthermore, since expressions such as “emoticons” are widespread, there is a problem that they lack freshness and it is difficult to enhance the interest of the viewer.
一方で、入力された画像の各部を、濃淡に応じて予め定めた記号(テキストデータ)にて置換し、画像(いわゆる「アスキー画像」)を形成する手法が広く知られている。これによれば、入力された画像を「顔文字」同様、テキストデータにて表現することができ、入力された画像とは異なる態様でありながらも、入力された画像の特徴を反映した表現を行うことができる。しかし、かかる画像は、明瞭さに欠けた画像品質が悪いものとなりがちであるという問題点があった。また、動画再生においては、処理するデータ量が多くなり、その処理が煩雑となるという問題点があった。 On the other hand, a method of forming each image (so-called “ASCII image”) by replacing each part of the input image with a predetermined symbol (text data) according to the density is widely known. According to this, like the “emoticon”, the input image can be expressed by text data, and although the aspect is different from the input image, the expression reflecting the characteristics of the input image It can be carried out. However, such an image has a problem that the image quality lacking in clarity tends to be poor. Further, in the reproduction of moving images, there is a problem that the amount of data to be processed increases and the processing becomes complicated.
本発明は、上記問題点を解決するためになされたものであり、入力された画像の特徴が反映された簡素な画像を記号データで形成して動画再生することにより、高い娯楽性を有する演出を行うことのできる画像処理装置および画像処理プログラムを提供することを目的としている。 The present invention has been made in order to solve the above-mentioned problems, and by creating a simple image reflecting the characteristics of an input image with symbol data and reproducing the moving image, the present invention has high entertainment. An object of the present invention is to provide an image processing apparatus and an image processing program capable of performing the above.
この目的を達成するために、請求項1記載の画像処理装置は、複数の画像フレームを有し連続した画像を現出させ得る画像データを入力する画像データ入力手段と、その画像データ入力手段により入力された画像データを各画像フレーム毎に加工する加工手段と、その加工手段により加工された画像フレームをその入力順に従って順次出力することにより画像データを出力する出力手段とを備えた画像処理部と、その画像処理部の出力手段により出力された前記画像フレームを順に表示して前記画像データを動画表示する表示装置とを備えており、前記画像処理部は、複数の記号の画像データが記憶された記号データ記憶手段を備えており、前記画像処理部の加工手段は、前記画像データ入力手段にて入力された画像データを線画像データに変換する線画変換手段と、前記画像データ入力手段にて入力された画像データの画像フレーム又は前記線画変換手段により変換された線画像データを有する画像フレームを所定数のブロックに分割する分割手段と、その分割手段により分割されたブロック単位で、前記線画像データの態様に応じて割当てられている記号を前記記号データ記憶手段に記憶される記号の画像データの中から抽出する抽出手段と、その抽出手段により抽出された記号の画像データで、対応するブロックの前記線画像データを置換した置換画像データを形成する画像形成手段とを備えており、前記画像処理部の出力手段は、前記置換画像データにて形成された置換画像データを出力するものであり、前記表示装置にて前記置換画像データの動画表示を行い、前記画像処理部は、前記画像データ入力手段として撮影により画像データを取得する撮像装置を備えており、更に、その撮像装置により背景画像として取得された背景画像データを記憶する背景画像記憶手段を備えると共に、前記画像処理部の加工手段は、前記撮像装置により取得された画像データから前記背景画像記憶手段に記憶される背景画像データとの共通部分を除いて、前記画像フレーム毎に固有の固有画像データを抽出する固有画像データ抽出手段を備え、前記画像処理部の線画変換手段は、その固有画像データ抽出手段により抽出された固有画像データを線画像データに変換するものであり、前記画像処理部の画像形成手段は、その固有画像データから変換された線画像データによって置換画像データを形成するものであり、前記画像処理部の加工手段は、前記分割手段により前記画像フレームを分割した場合に、その画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数が予め定めた下限値以下であると、前記画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数を増加させる方向に、前記線画像データまたは前記固有画像データを伸張する画像データ伸張手段を備えており、前記画像処理部の画像形成手段は、その画像データ伸張手段により前記線画像データまたは固有画像データが伸張された場合には、伸張後の画像データに基づいて置換画像データを形成するものである。
In order to achieve this object, an image processing apparatus according to
請求項2記載の画像処理装置は、請求項1記載の画像処理装置において、前記画像データ伸張手段は、抽出元の画像フレームに対して前記固有画像データ抽出手段により抽出された前記固有画像データが占める割合が、所定の割合以下であるか否かを判断する判断手段を備えており、その判断手段により、前記固有画像データが占める割合が所定の割合以下であると判断された場合に、前記固有画像データを有するブロック数が予め定めた下限値以下であるとして、前記固有画像データの伸張を行うものである。
The image processing apparatus according to
請求項3記載の画像処理装置は、請求項1又は2に記載の画像処理装置において、前記画像処理部の加工手段は、前記分割手段により前記画像フレームを分割した場合に、その画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数が予め定めた上限値以上であると、前記線画像データまたは前記固有画像データを圧縮し、前記画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数を減少させる画像データ圧縮手段を備えており、前記画像処理部の画像形成手段は、その画像データ圧縮手段により前記画像データが圧縮された場合には、圧縮後の画像データに基づいて置換画像データを形成するものである。
The image processing apparatus of
請求項4記載の画像処理装置は、請求項1から3のいずれかに記載の画像処理装置において、伴奏情報を記憶する伴奏情報記憶手段と、その伴奏情報記憶手段に記憶される伴奏情報に基づいて伴奏を発生する伴奏発生手段と、音声データを入力する音声データ入力手段と、その音声データ入力手段により入力された音声データと、伴奏発生手段にて発生された伴奏とを発音する発音手段と、各伴奏情報に対応し、且つ、前記発音手段により発音される伴奏に合わせて前記表示装置に表示される歌詞データを記憶する歌詞データ記憶手段とを備えており、その歌詞データ記憶手段に記憶される歌詞データと共に、前記出力手段により出力された前記置換画像データを前記表示装置に表示するものである。 An image processing apparatus according to a fourth aspect is the image processing apparatus according to any one of the first to third aspects, based on accompaniment information storage means for storing accompaniment information and accompaniment information stored in the accompaniment information storage means. Accompaniment generating means for generating accompaniment, sound data input means for inputting sound data, sound generating means for sounding sound data input by the sound data input means and accompaniment generated by the accompaniment generating means Lyric data storage means corresponding to each accompaniment information and storing lyric data displayed on the display device in accordance with the accompaniment sounded by the sounding means, and stored in the lyric data storage means The replacement image data output by the output means is displayed on the display device together with the lyrics data.
請求項5記載の画像処理装置は、請求項1から4のいずれかに記載の画像処理装置において、請求項1から4のいずれかに記載の画像処理部を備え回線を介して相手側装置に接続されると共に、音声データを入力する音声データ入力手段と、その音声データ入力手段により入力された音声データを前記回線に出力するデータ信号に変換するデータ変換手段と、前記画像処理部の画像形成手段により形成された置換画像データに対応する識別コードを音声データのデータ信号に変換して前記データ変換手段により変換されたデータ信号に重畳する重畳手段とを有する送信側装置を備えており、前記画像処理部の出力手段は、その重畳手段により重畳されたデータ信号を前記回線に出力して前記相手側装置に置換画像データを出力するものである。 An image processing apparatus according to a fifth aspect is the image processing apparatus according to any one of the first to fourth aspects, wherein the image processing apparatus according to any one of the first to fourth aspects comprises the image processing unit according to any one of the first to fourth aspects. Audio data input means for inputting audio data, data conversion means for converting the audio data input by the audio data input means into a data signal output to the line, and image formation of the image processing unit A transmission-side device having a superimposing unit that converts an identification code corresponding to the replacement image data formed by the unit into a data signal of audio data and superimposes it on the data signal converted by the data conversion unit, The output unit of the image processing unit outputs the data signal superimposed by the superimposing unit to the line and outputs replacement image data to the counterpart device.
請求項6記載の画像処理装置は、請求項5記載の画像処理装置において、前記送信側装置は、前記音声データ入力手段により入力された音声データについて、非再生領域として設定される非再生周波数成分を除去する除去手段を備えており、前記重畳手段は、前記置換画像データの識別コードを、前記除去手段により除去された非再生周波数成分の帯域のデータ信号に変換して前記データ変換手段により変換されたデータ信号に重畳するものである。
The image processing apparatus according to claim 6, wherein, in the image processing apparatus according to
請求項7記載の画像処理装置は、請求項5または6に記載の画像処理装置において、前記送信側装置は、前記音声データ入力手段により入力された音声データについて、可聴限界を越えた限界周波数成分を除去する第2除去手段を備えており、前記重畳手段は、前記置換画像データの識別コードを、前記第2除去手段により除去された限界周波数成分のデータ信号に変換して前記データ変換手段により変換されたデータ信号に重畳するものである。
The image processing apparatus according to claim 7, wherein, in the image processing apparatus according to
請求項8記載の画像処理装置は、請求項5から7のいずれかに記載の画像処理装置において、前記回線を介して前記送信側装置に接続されると共に、前記表示装置と、音声データを受信する音声データ受信手段と、その音声データ受信手段により受信された音声データを音声で再生する音声再生手段と、前記音声データ受信手段により受信された音声データに前記置換画像データに対応する識別コードのデータ信号が含まれている場合にそのデータ信号から前記置換画像データを再生する画像データ再生手段とを有し、その画像データ再生手段により再生された置換画像データを前記表示装置にて表示する相手側装置を備えている。 The image processing apparatus according to claim 8, wherein the receiving the image processing apparatus according to any one of claims 5-7, which is connected to the transmitting-side device through the line, and the display device, the audio data Voice data receiving means, voice playback means for playing back the voice data received by the voice data receiving means, and voice data received by the voice data receiving means in an identification code corresponding to the replacement image data. An image data reproducing means for reproducing the replacement image data from the data signal when a data signal is included, and the display device for displaying the replacement image data reproduced by the image data reproducing means A side device is provided.
請求項9記載の画像処理プログラムは、複数の画像フレームを有し連続した画像を現出させ得る画像データを入力する画像データ入力手段を備えたコンピュータに、その画像データ入力手段により入力された画像データを各画像フレーム毎に加工する加工ステップと、その加工ステップにより加工された画像フレームをその入力順に従って順次出力することにより画像データを出力する出力ステップとを備えた画像処理ステップを実行させ、その画像処理ステップの出力ステップにより出力された前記画像フレームを順に表示して前記コンピュータの表示装置に前記画像データを動画表示させるものであって、前記コンピュータは、複数の記号の画像データが記憶された記号データ記憶手段を備えており、前記画像処理ステップの加工ステップは、前記画像データ入力手段にて入力された画像データを線画像データに変換する線画変換ステップと、前記画像データ入力手段にて入力された画像データの画像フレーム又は前記線画変換ステップにより変換された線画像データを有する画像フレームを所定数のブロックに分割する分割ステップと、その分割ステップにより分割されたブロック単位で、前記線画像データの態様に応じて割当てられている記号を前記記号データ記憶手段に記憶される記号の画像データの中から抽出する抽出ステップと、その抽出ステップにより抽出された記号の画像データで、対応するブロックの前記線画像データを置換した置換画像データを形成する画像形成ステップとを前記コンピュータに実行させ、前記画像処理ステップの出力ステップは、前記置換画像データにて形成された置換画像データを出力するものであり、前記表示装置にて前記置換画像データの動画表示を行い、前記コンピュータは、前記画像データ入力手段として撮影により画像データを取得する撮像装置を備えており、更に、その撮像装置により背景画像として取得された背景画像データを記憶する背景画像記憶手段を備え、前記画像処理ステップの加工ステップは、前記撮像装置により取得された画像データから前記背景画像記憶手段に記憶される背景画像データとの共通部分を除いて、前記画像フレーム毎に固有の固有画像データを抽出する固有画像データ抽出ステップを前記コンピュータに実行させ、前記画像処理ステップの線画変換ステップは、その固有画像データ抽出ステップにより抽出された固有画像データを線画像データに変換するものであり、前記画像処理ステップの画像形成ステップは、その固有画像データから変換された線画像データによって置換画像データを形成するものであり、前記画像処理ステップの加工ステップは、前記分割ステップにより前記画像フレームを分割した場合に、その画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数が予め定めた下限値以下であると、前記画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数を増加させる方向に、前記線画像データまたは前記固有画像データを伸張する画像データ伸張ステップをコンピュータに実行させ、前記画像処理ステップの画像形成ステップは、その画像データ伸張ステップにより前記線画像データまたは固有画像データが伸張された場合には、伸張後の画像データに基づいて置換画像データを形成するものである。
The image processing program according to
請求項10記載の画像処理プログラムは、請求項9記載の画像処理プログラムにおいて、前記画像データ伸張ステップは、抽出元の画像フレームに対して前記固有画像データ抽出ステップにより抽出された前記固有画像データが占める割合が、所定の割合以下であるか否かを判断する判断ステップを前記コンピュータに実行させ、その判断ステップにより、前記固有画像データが占める割合が所定の割合以下であると判断された場合に、前記固有画像データを有するブロック数が予め定めた下限値以下であるとして、前記固有画像データの伸張を行うものである。 An image processing program according to a tenth aspect of the present invention is the image processing program according to the ninth aspect , wherein the unique image data extracted by the unique image data extracting step is extracted from the original image frame. When the computer executes a determination step for determining whether the proportion is less than or equal to a predetermined proportion , and the determination step determines that the proportion occupied by the unique image data is less than or equal to a predetermined proportion The unique image data is expanded on the assumption that the number of blocks having the unique image data is equal to or less than a predetermined lower limit value.
請求項1記載の画像処理装置によれば、画像データ入力手段にて入力された画像データは、線画変換手段により、線画像データに変換される。また、分割手段により、その入力された画像データの画像フレーム又は線画変換手段により変換された線画像データを有する画像フレームは、所定数のブロックに分割され、分割されたブロック単位で、線画像データの態様と近似する記号が、抽出手段により、記号データ記憶手段に記憶される記号の画像データの中から抽出される。そして、抽出された記号の画像データで対応するブロックの線画像データを置換した置換画像データが置換画像形成手段により形成される。形成された置換画像データは、出力手段により表示装置に出力され、表示装置にて置換画像データの動画表示が行われる。 According to the image processing apparatus of the first aspect, the image data input by the image data input means is converted into line image data by the line drawing conversion means. Further, the image frame of the input image data by the dividing unit or the image frame having the line image data converted by the line drawing converting unit is divided into a predetermined number of blocks, and the line image data is divided into divided blocks. The symbol that approximates this aspect is extracted from the symbol image data stored in the symbol data storage means by the extraction means. Then, replacement image data obtained by replacing the line image data of the corresponding block with the extracted symbol image data is formed by the replacement image forming means. The formed replacement image data is output to the display device by the output means, and the replacement image data is displayed as a moving image on the display device.
よって、入力された画像を記号の画像データで構成された画像に変換して出力することができ、単純な画像が自己の動作に応じてアクションするというコミカルで娯楽性の高い演出を提供することができる。更に、入力された画像が変換された線画から記号の画像データを形成するので、出力画像をシンプルな画像とすることができ、入力画像データ全体を記号データで構成した置換画像データに変換する場合に比べて、表示装置に表示する画像をシンプル且つシャープな画像とすることができるという効果がある。 Therefore, it is possible to convert an input image into an image composed of symbol image data and output it, and to provide a comical and highly entertaining effect that a simple image acts according to its own operation. Can do. Furthermore, since the image data of the symbol is formed from the line drawing obtained by converting the input image, the output image can be a simple image, and the entire input image data is converted to the replacement image data composed of the symbol data. As compared with the above, there is an effect that the image displayed on the display device can be a simple and sharp image.
加えて、表示装置にて表示される画像を、入力された実際の画像データとは異なる画像でありつつ、実画像の特徴的部分を残した画像することができるという効果がある。例えば、入力された画像中の人物を予め用意されたキャラクタ(「顔文字」を含む)に置換して画像出力する場合には、予め作成されたキャラクタに置き換えられるだけであるので、対象人物の特徴が反映され難い。また、特徴を少しでも反映しようとすれば多くのキャラクタデータが必要になる。しかし、置換画像データは、記号データを用いて入力された画像データから形成されるので、表示装置での出力画像が画一的な画像とならず、個々の画像データのニュアンスが反映された高度な表現を実現することができる。 In addition, there is an effect that the image displayed on the display device can be an image that is different from the input actual image data, but leaves the characteristic portion of the actual image. For example, when an image is output by replacing a person in the input image with a character prepared in advance (including “emoticon”), it is simply replaced with a character created in advance. The characteristics are difficult to be reflected. Also, a large amount of character data is required to reflect the features even a little. However, since the replacement image data is formed from the image data input using the symbol data, the output image on the display device does not become a uniform image, and the nuance of the individual image data is reflected. Can be realized.
また、撮像装置により取得された画像データから背景画像データとの共通部分を除いて、画像フレーム毎に、固有の固有画像データが固有画像データ抽出手段により抽出される。置換画像データは、抽出された固有画像データが変換された線画像データから形成される。 Further, the unique image data is extracted by the unique image data extraction unit for each image frame, except for the common part with the background image data from the image data acquired by the imaging device. The replacement image data is formed from line image data obtained by converting the extracted unique image data.
よって、背景画像部分を省略して置換画像データを形成することができ、画像データの全てから置換画像データを形成する場合に比べて、置換画像データの形成速度を高速にすることができるという効果がある。また、形成された置換画像データを表示装置等へ出力する場合に、そのデータ出力速度を高速にすることができるという効果がある。更に背景画像データを除去することにより、置換画像データの変換元の画像データの猥雑さを軽減することができる。従って、表示装置に簡素な置換画像データを出力でき、出力される画像が何を表現したものであるか不明確(識別困難)になることを回避できるという効果がある。背景画像データが含まれた猥雑(複雑)な画像データである場合、個々のオブジェクトの境界が不明確になりかねず、かかる画像データを置換画像データに変換すると、場合によっては、個々のオブジェクトとは異なる形状に分割あるいは連結された画像が出現しかねない。しかし、(背景画像データが除去された)固有画像データが変換された線画像データから置換画像データを形成するので、かかる不具合を軽減し、簡素で明瞭な置換画像データを表示装置に表示できる。 Accordingly, the replacement image data can be formed by omitting the background image portion, and the replacement image data can be formed at a higher speed than the case where the replacement image data is formed from all the image data. There is. Further, when the formed replacement image data is output to a display device or the like, the data output speed can be increased. Further, by removing the background image data, it is possible to reduce the complexity of the image data from which the replacement image data is converted. Therefore, simple replacement image data can be output to the display device, and it is possible to avoid unclear (difficult to identify) what the output image represents. In the case of complicated (complex) image data including background image data, the boundaries of individual objects may be unclear, and when such image data is converted into replacement image data, May appear in an image divided or connected into different shapes. However, since the replacement image data is formed from the line image data obtained by converting the unique image data (with the background image data removed), it is possible to reduce such problems and display simple and clear replacement image data on the display device.
また、分割手段により画像フレームを分割した場合に、その画像フレーム内において線画像データまたは固有画像データを有するブロック数が予め定めた下限値以下であると、画像データ伸張手段により、線画像データまたは固有画像データを有するブロック数を増加させる方向に、線画像データまたは固有画像データは伸張される。そして、伸張後の画像データに基づいて置換画像データが形成される。 Further, in case of dividing an image frame by dividing means, when the number of blocks is less than a predetermined lower limit value having a linear image data or unique image data in the image frame, the image data expansion means, the line image data or The line image data or the unique image data is expanded in the direction of increasing the number of blocks having the unique image data. Then, replacement image data is formed based on the decompressed image data.
撮像装置にて画像データを取得する場合、撮像装置と被撮影体(固有画像データに対応するもの)との距離によっては、被撮影体の大きさが背景画像に対して(著しく)小さくなる場合がある。かかる場合の画像データにおいては、画像フレーム内において、固有画像データ(線画像データ)を有するブロック数が減少する。少ない数の記号データで構成される置換画像データは、元の画像(被撮影体)の微細な部分の画像表現が省略されるため、その特徴を具有するものとはなり難く、場合によっては、オブジェクトを表現した画像とは認識できない単なる記号の配列になりかねない。 When acquiring image data with an imaging device, depending on the distance between the imaging device and the subject (corresponding to the unique image data), the size of the subject is (remarkably) smaller than the background image There is. In the image data in such a case, the number of blocks having unique image data (line image data) is reduced in the image frame. The replacement image data composed of a small number of symbol data is less likely to have the characteristics because the image representation of the fine part of the original image (the subject) is omitted, and in some cases, It may be just an array of symbols that cannot be recognized as an image representing the object.
しかし、固有画像データ(線画像データ)を伸張すれば、画像フレーム内において固有画像データ(線画像データ)を有するブロック数を増加させることができる。つまり、微細部分についても表現し得る画像に拡大した上で、置換画像データを形成することができるので、入力された画像データの固有画像データが小さくとも、元の画像の特徴を備えた置換画像データを形成することができるという効果がある。 However, if the unique image data (line image data) is expanded, the number of blocks having the unique image data (line image data) in the image frame can be increased. In other words, since the replacement image data can be formed after enlarging the image to be able to express even a fine portion, the replacement image having the characteristics of the original image even if the unique image data of the input image data is small. There is an effect that data can be formed.
請求項2記載の画像処理装置によれば、請求項1記載の画像処理装置の奏する効果に加え、抽出元の画像フレームに対して抽出された固有画像データの占める割合が所定の割合以下であると判断手段により判断された場合に、固有画像データを有するブロック数が予め定めた下限値以下であるとして固有画像データの伸張が行われれる。よって、伸張するべき固有画像データの選別を的確に行うことができるという効果がある。
According to the image processing apparatus according to
固有画像データの大きさをブロック数で測る(ブロック単位でカウントする)場合には、ブロック全面にドットが配されていなくとも1カウントされる。このため、ブロック単位で固有画像データの大きさを測る場合、簡便である一方、測定結果が実際の大きさよりも大きい側にシフトしがちになり、場合によっては、伸張する必要のある固有画像データが伸張されないという事態が発生しかねない。しかし、抽出元の画像フレームに対して抽出された固有画像データの占める割合が所定の割合以下である場合に、固有画像データの伸張を行うので、的確に伸張の必要のある固有画像データを選別することができるのである。 When the size of the unique image data is measured by the number of blocks (counted in units of blocks), 1 is counted even if no dots are arranged on the entire block. Therefore, when measuring the size of the unique image data in units of blocks, it is convenient, but the measurement result tends to shift to a larger side than the actual size, and in some cases, the unique image data that needs to be expanded There is a possibility that the situation will not be expanded. However, when the ratio of the extracted unique image data to the extraction source image frame is equal to or less than the predetermined ratio, the unique image data is decompressed, so that the unique image data that needs to be decompressed accurately is selected. It can be done.
請求項3記載の画像処理装置によれば、請求項1又は2に記載の画像処理装置の奏する効果に加え、分割手段により画像フレームを分割した場合に、その画像フレーム内において線画像データまたは固有画像データを有するブロック数が予め定めた上限値以上であると、画像データ圧縮手段により、線画像データまたは固有画像データは圧縮され、画像フレーム内において線画像データまたは固有画像データを有するブロック数を減少させる。置換画像データは、圧縮後の画像データに基づいて形成される。よって、表示装置の画面に適度な大きさで置換画像データを表示することができるという効果がある。 According to the image processing device of the third aspect , in addition to the effect produced by the image processing device according to the first or second aspect, when the image frame is divided by the dividing means, the line image data or the unique image is included in the image frame. If the number of blocks having image data is greater than or equal to a predetermined upper limit, the line image data or unique image data is compressed by the image data compression means, and the number of blocks having line image data or unique image data in the image frame is determined. Decrease. The replacement image data is formed based on the compressed image data. Therefore, there is an effect that the replacement image data can be displayed on the screen of the display device with an appropriate size.
請求項4記載の画像処理装置によれば、請求項1から3のいずれかに記載の画像処理装置の奏する効果に加え、音声データ入力手段により入力された音声データと伴奏発生手段にて発生された伴奏とが発音手段により発音される。また、各伴奏情報に対応した歌詞データが、発音手段により発音される伴奏に合わせて表示装置に表示される。そして、かかる歌詞データと共に、出力手段により出力された置換画像データが表示装置に表示される。よって、発音された伴奏情報に合わせつつ、表示される歌詞データを見ながら歌唱する環境を構築できる上、置換画像データによる演出を行うことができるという効果がある。 According to the image processing apparatus of the fourth aspect , in addition to the effect produced by the image processing apparatus according to any one of the first to third aspects, the sound data input by the sound data input means and the accompaniment generation means are generated. The accompaniment is pronounced by the pronunciation means. In addition, lyrics data corresponding to each accompaniment information is displayed on the display device in accordance with the accompaniment sounded by the sound generation means. Then, the replacement image data output by the output means is displayed on the display device together with the lyrics data. Therefore, there is an effect that it is possible to construct an environment for singing while viewing the displayed lyric data while matching the sounded accompaniment information, and it is possible to produce an effect using the replacement image data.
一般に、音声データ入力手段と、伴奏情報発生手段と、発音手段と、歌詞データが表示される表示装置とを有する装置は、「カラオケ」と称されており、歌唱者の歌唱を補助する娯楽用の装置(機能)である。故に、「カラオケ」の機能と置換画像データを表示装置にて動画表示する機能を共に有する装置を提供することにより、「カラオケ」に新たな興趣を付加することができ、その娯楽性を向上させることができる。また、置換画像データは歌詞データと共に表示装置に表示されるので、置換画像データが表示装置に表示されても、歌詞が非表示となることはなく、歌唱者が歌唱不能となることを回避できるという効果がある。 Generally, an apparatus having an audio data input means, an accompaniment information generation means, a sound generation means, and a display device on which lyrics data is displayed is called “karaoke” and is used for entertainment for assisting a singer's singing. This is a device (function). Therefore, by providing a device having both the function of “Karaoke” and the function of displaying the replacement image data as a moving image on the display device, it is possible to add a new interest to “Karaoke” and improve its entertainment. be able to. Further, since the replacement image data is displayed on the display device together with the lyrics data, even if the replacement image data is displayed on the display device, the lyrics are not hidden, and it is possible to prevent the singer from being unable to sing. There is an effect.
請求項5記載の画像処理装置によれば、請求項1から4のいずれかに記載の画像処理装置の奏する効果に加え、音声データ入力手段により入力された音声データは、データ変換手段により回線に出力するデータ信号に変換される。また、置換画像データに対応する識別コードは、重畳手段により音声データのデータ信号に変換され、データ変換手段により変換されたデータ信号に重畳される。そして、出力手段により、その重畳されたデータ信号が回線に出力され、これにより置換画像データが相手側装置に出力される。 According to the image processing apparatus of the fifth aspect , in addition to the effect produced by the image processing apparatus according to any one of the first to fourth aspects, the audio data input by the audio data input means is connected to the line by the data conversion means. It is converted into a data signal to be output. Further, the identification code corresponding to the replacement image data is converted into a data signal of audio data by the superimposing unit and is superimposed on the data signal converted by the data converting unit. Then, the superimposed data signal is output to the line by the output means, whereby the replacement image data is output to the counterpart device.
よって、置換画像データを、ビットマップデータなどよりも大幅にデータ量の少ない識別コードで相手側装置に送信することができ、送信する置換画像データのデータ量を低減することができるという効果がある。これによれば、(データ量が少ないため)音声データの一部として置換画像データ(識別コード)を相手側装置に送出することができる。また、かかる識別コードを、音声データの一部として相手側装置に送出するので、送信側装置は音声データを送出する手段を備えておれば良く、わざわざ、画像データを送信する為の手段(置換画像データを画像データの態様で送信するための手段)を設ける必要がない。従って、装置コストを低減することができるという効果がある。 Therefore, the replacement image data can be transmitted to the counterpart apparatus with an identification code whose data amount is significantly smaller than that of bitmap data or the like, and the data amount of the replacement image data to be transmitted can be reduced. . According to this, the replacement image data (identification code) can be sent to the counterpart device as part of the audio data (because the data amount is small). Further, since the identification code is sent to the counterpart device as a part of the voice data, the sending device only needs to be provided with a means for sending the voice data. There is no need to provide means for transmitting image data in the form of image data. Therefore, there is an effect that the apparatus cost can be reduced.
請求項6記載の画像処理装置によれば、請求項5記載の画像処理装置の奏する効果に加え、送信側装置において、入力された音声データは、非再生領域として設定される非再生周波数成分が除去手段により除去される。そして、重畳手段により、置換画像データの識別コードが、除去手段により除去された非再生周波数成分の帯域のデータ信号に変換されて、データ変換手段により変換されたデータ信号に重畳される。 According to the image processing apparatus of the sixth aspect , in addition to the effect produced by the image processing apparatus of the fifth aspect , in the transmission side apparatus, the input audio data has a non-reproduction frequency component set as a non-reproduction area. It is removed by removing means. Then, the identification code of the replacement image data is converted into a data signal in the band of the non-reproduction frequency component removed by the removing unit, and is superimposed on the data signal converted by the data converting unit.
よって、送信側装置からの音声データを受信した相手側装置において、置換画像データの識別コードが音声データとして再生されることを、非実行とすることができるという効果がある。つまり、元々再生されない非再生周波数成分の音声データに置換画像データの識別コードは変換されているので、相手側装置においては、置換画像データの識別コードを含む音声データを受信しても、再生されるべき正当な(置換画像データの識別コードを除いた)音声データのみが再生される。従って、置換画像データがノイズとなって音声データで出力されてしまうが故に、必要な音声データの聞き取りが不能になるといった不具合を回避でき、相手側装置側における受話者に、違和感を抱かせることがないという効果がある。このため、受信した音声データから置換画像データの識別コードを分離して音声データの再生を行うという処理および装置を相手側装置に設ける必要がなく、相手側装置のコストを低減することができる。 Therefore, there is an effect that it is possible to make it non-executable that the identification code of the replacement image data is reproduced as audio data in the counterpart device that has received the audio data from the transmitting device. That is, since the replacement image data identification code is converted into the non-reproduction frequency component audio data that is not originally reproduced, even if the other device receives the audio data including the replacement image data identification code, it is reproduced. Only valid audio data (excluding the identification code of the replacement image data) to be reproduced is reproduced. Therefore, since the replacement image data is output as voice data as noise, it is possible to avoid a problem that it becomes impossible to hear the necessary voice data, and to make the receiver on the other device side feel uncomfortable. There is an effect that there is no. For this reason, it is not necessary to provide the other apparatus with a process and apparatus for reproducing the audio data by separating the identification code of the replacement image data from the received audio data, and the cost of the other apparatus can be reduced.
請求項7記載の画像処理装置によれば、請求項5または6に記載の画像処理装置の奏する効果に加え、送信側装置は、音声データ入力手段により入力された音声データについて、可聴限界を越えた限界周波数成分が、第2除去手段により除去される。そして、重畳手段により、置換画像データの識別コードが、第2除去手段により除去された限界周波数成分のデータ信号に変換されデータ変換手段により変換されたデータ信号に重畳される。 According to the image processing apparatus of the seventh aspect , in addition to the effect achieved by the image processing apparatus of the fifth or sixth aspect , the transmitting side apparatus exceeds the audible limit for the audio data input by the audio data input means. The marginal frequency component is removed by the second removing means. Then, the identification code of the replacement image data is converted by the superimposing unit into the data signal of the limit frequency component removed by the second removing unit and superimposed on the data signal converted by the data converting unit.
よって、送信側装置からの音声データを受信した相手側装置において、置換画像データのコードを含んだ状態で音声データが再生されても、その再生された音声帯域が可聴限界範囲を超えているので、かかる置換画像コードに起因するノイズを、相手側装置側における受話者に、極めて聴きとられ難いものとすることができるという効果がある。言い換えれば、再生される音声データの聞き取り性が悪いという不快感や違和感を受話者に抱かせることがない。従って、受信した音声データから置換画像データの識別コードを分離して音声データの再生を行うという処理および装置を相手側装置に設ける必要がなく、相手側装置のコストを低減することができる。 Therefore, even if the audio data is reproduced with the replacement image data included in the counterpart device that has received the audio data from the transmission side device, the reproduced audio band exceeds the audible limit range. Thus, there is an effect that the noise caused by the replacement image code can be made extremely difficult to be heard by the receiver on the counterpart device side. In other words, the listener does not feel uncomfortable or uncomfortable that the hearability of the reproduced audio data is poor. Therefore, it is not necessary to provide the counterpart apparatus with a process and apparatus for reproducing the audio data by separating the identification code of the replacement image data from the received audio data, and the cost of the counterpart apparatus can be reduced.
特に、不特定多数の相手側装置が想定される場合には、相手側装置が画像を表示する手段を備えず、音声データの送受信のみ行う装置(例えば通常の電話機など)であることも十分に考えられるが、かかる装置であっても、受信した音声データの再生に支障を来すことなく、良好な品質で音声出力を行わせることができる。 In particular, when an unspecified number of other-side devices are assumed, it is also sufficient that the other-side device is not provided with a means for displaying an image and is a device that only transmits and receives audio data (for example, a normal telephone). Although it is conceivable, even with such a device, it is possible to output sound with good quality without hindering reproduction of received sound data.
請求項8記載の画像処理装置によれば、請求項5から7のいずれかに記載の画像処理装置の奏する効果に加え、表示装置を備えた相手側装置を備えており、該相手側装置において、音声データ受信手段により音声データが受信される。受信された音声データは、音声再生手段により音声で再生される。ここで、受信された音声データに置換画像データに対応する識別コードのデータ信号が含まれている場合には、画像データ再生手段によりそのデータ信号から置換画像データが再生される。そして、再生された置換画像データが表示装置にて表示される。 According to the image processing device of the eighth aspect , in addition to the effect of the image processing device according to any one of the fifth to seventh aspects, the counterpart device provided with the display device is provided. The voice data is received by the voice data receiving means. The received audio data is reproduced as audio by the audio reproducing means. If the received audio data includes a data signal of an identification code corresponding to the replacement image data, the replacement image data is reproduced from the data signal by the image data reproduction means. Then, the reproduced replacement image data is displayed on the display device.
よって、置換画像データに対応する識別コードを含んでいる音声データを受信した相手側装置において、表示装置に的確に置換画像データを出力することができる。このため、送信側装置と相手側装置とにより、実際の映像を出力するテレビ電話とは異なる趣を持った画像によるコミュニケーションをはかることができるという効果がある。相手側装置にて表示される置換画像データは、送信側装置にて実際に撮影(入力)された画像データでない、加工(デフォルメ)されたものである。つまり、相手側装置では、送信側装置にて入力された画像データが(入力された画像データが再現された状態で)出力されるわけではない。従って、送信側装置の操作者(送話者)がカメラ等にて撮影されることを好まない場合や、諸事情により実際の映像を相手側に送信したくない場合には、実際の映像(入力された画像でデータ)をデフォルメした置換画像データにより、送話者は相手側に伝達したい内容を伝えることができる。ここで、置換画像データは、入力された画像データから形成されており、入力された画像データの特徴的部分を反映させることができるものであるので、相手側装置において、実際の映像(入力された画像データ)に代えて置換画像データが出力されても、自己の表現したい事項を画像を通じて、送話者から相手側に的確に伝達する高度なコミュニケーションを行うことができるという効果がある。 Therefore, in the counterpart device that has received the audio data including the identification code corresponding to the replacement image data, the replacement image data can be accurately output to the display device. For this reason, there is an effect that communication by an image having a taste different from that of a videophone that outputs an actual video can be performed between the transmission side device and the counterpart side device. The replacement image data displayed on the counterpart device is processed (deformed), not image data actually captured (input) on the transmitting device. That is, the counterpart device does not output the image data input by the transmitting device (in a state where the input image data is reproduced). Therefore, if the operator (speaker) of the transmission side apparatus does not like to be photographed by a camera or the like, or if it is not desired to transmit the actual video to the other side due to various circumstances, the actual video ( By using the replacement image data obtained by deforming the data) with the input image, the transmitter can transmit the contents to be transmitted to the other party. Here, the replacement image data is formed from the input image data and can reflect the characteristic part of the input image data. Even if the replacement image data is output instead of the image data), there is an effect that it is possible to perform high-level communication that accurately transmits the item that the user wants to express to the other party through the image.
請求項9記載の画像処理プログラムによれば、入力された画像データは、線画変換ステップにより、線画像データに変換される。また、その入力された画像データの画像フレーム又は線画変換ステップにより変換された線画像データを有する画像フレームは、分割ステップにより所定数のブロックに分割され、分割されたブロック単位で、線画像データの態様と近似する記号が、抽出ステップにより、複数の記号の画像データの中から抽出される。そして、抽出された記号の画像データで対応するブロックの線画像データを置換した置換画像データが、置換画像形成ステップにより形成される。 According to the image processing program of the ninth aspect , the input image data is converted into line image data by the line drawing conversion step. Further, the image frame of the input image data or the image frame having the line image data converted by the line drawing conversion step is divided into a predetermined number of blocks by the dividing step, and the line image data is divided into divided blocks. The symbol that approximates the aspect is extracted from the image data of the plurality of symbols by the extraction step. Then, replacement image data in which the line image data of the corresponding block is replaced with the extracted symbol image data is formed by the replacement image forming step.
よって、表示装置などに、入力された画像を記号の画像データで構成された画像に変換して出力し得、コミカルな娯楽性の高い画像による演出を提供することができる。更に、入力された画像が変換された線画から記号の画像データを形成するので、出力画像をシンプルな画像とすることができ、入力画像データ全体を記号データで構成した置換画像データに変換する場合に比べて、表示装置に表示する画像をシンプル且つシャープな画像とすることができるという効果がある。 Therefore, an input image can be converted into an image composed of symbol image data and output to a display device or the like, and an effect can be provided by a comical and highly entertaining image. Furthermore, since the image data of the symbol is formed from the line drawing obtained by converting the input image, the output image can be a simple image, and the entire input image data is converted to the replacement image data composed of the symbol data. As compared with the above, there is an effect that the image displayed on the display device can be a simple and sharp image.
加えて、表示装置にて表示される画像を、入力された実際の画像データとは異なる画像でありつつ、実画像の特徴的部分を残した画像することができるという効果がある。例えば、入力された画像中の人物を予め用意されたキャラクタ(「顔文字」を含む)に置換して画像出力する場合には、予め作成されたキャラクタに置き換えられるだけであるので、対象人物の特徴が反映され難い。また、特徴を少しでも反映しようとすれば多くのキャラクタデータが必要になる。しかし、置換画像データは、記号データを用いて入力された画像データから形成されるので、表示装置での出力画像が画一的な画像とならず、個々の画像データのニュアンスが反映された高度な表現を実現することができる。 In addition, there is an effect that the image displayed on the display device can be an image that is different from the input actual image data, but leaves the characteristic portion of the actual image. For example, when an image is output by replacing a person in the input image with a character prepared in advance (including “emoticon”), it is simply replaced with a character created in advance. The characteristics are difficult to be reflected. Also, a large amount of character data is required to reflect the features even a little. However, since the replacement image data is formed from the image data input using the symbol data, the output image on the display device does not become a uniform image, and the nuance of the individual image data is reflected. Can be realized.
また、入力された画像データから背景画像データとして入力された背景画像データとの共通部分を除いて、画像フレーム毎に固有の固有画像データが、固有画像データ抽出ステップにより抽出される。その固有画像データ抽出ステップにより抽出された固有画像データは、線画変換ステップにより線画像データに変換され、画像形成ステップにより、その固有画像データから変換された線画像データから置換画像データが形成される。 Also, the unique image data unique to each image frame is extracted by the unique image data extraction step, except for the common part with the background image data inputted as background image data from the inputted image data. The unique image data extracted by the unique image data extraction step is converted into line image data by the line drawing conversion step, and the replacement image data is formed from the line image data converted from the unique image data by the image forming step. .
よって、背景画像部分を省略して置換画像データを形成することができるので、画像データの全てから置換画像データを形成する場合に比べて、置換画像データの形成速度を高速にすることができるという効果がある。また、形成された置換画像データを表示装置等へ出力する場合に、そのデータ出力速度を高速にすることができるという効果がある。更に背景画像データを除去することにより、置換画像データへの変換元の画像データの猥雑さを軽減することができる。従って、表示装置に出力する場合に、簡素な置換画像データを出力でき、出力される画像が何を表現したものであるか不明確(識別困難)になることを回避できるという効果がある。背景画像データが含まれた猥雑(複雑)な画像データである場合、個々のオブジェクトの境界が不明確になりかねず、かかる画像データを置換画像データに変換すると、場合によっては、個々のオブジェクトとは異なる形状に分割あるいは連結された画像が出現しかねない。しかし、(背景画像データが除去された)固有画像データが変換された線画像データから置換画像データを形成するので、かかる不具合を軽減し、簡素で明瞭な置換画像データを、表示装置に表示できるのである。 Therefore, since the replacement image data can be formed by omitting the background image portion, the replacement image data can be formed at a higher speed than the case where the replacement image data is formed from all the image data. effective. Further, when the formed replacement image data is output to a display device or the like, the data output speed can be increased. Further, by removing the background image data, it is possible to reduce the complexity of the original image data converted into the replacement image data. Therefore, when outputting to a display device, simple replacement image data can be output, and it is possible to avoid unclear (difficult to identify) what the output image represents. In the case of complicated (complex) image data including background image data, the boundaries of individual objects may be unclear, and when such image data is converted into replacement image data, May appear in an image divided or connected into different shapes. However, since the replacement image data is formed from the line image data obtained by converting the unique image data (with the background image data removed), it is possible to reduce such problems and display simple and clear replacement image data on the display device. It is.
また、分割ステップにより画像フレームを分割した場合に、その画像フレーム内において線画像データまたは固有画像データを有するブロック数が予め定めた下限値以下であると、画像フレーム内において線画像データまたは固有画像データを有するブロック数を増加させる方向に、線画像データまたは固有画像データが伸張される。そして、伸張後の画像データに基づいて置換画像データが形成される。 Further, when an image frame is divided by the dividing step, if the number of blocks having line image data or unique image data in the image frame is equal to or less than a predetermined lower limit value, the line image data or unique image in the image frame Line image data or unique image data is expanded in the direction of increasing the number of blocks having data. Then, replacement image data is formed based on the decompressed image data.
撮像装置にて画像データを取得する場合、撮像装置と被撮影体(固有画像データに対応するもの)との距離によっては、被撮影体の大きさが背景画像に対して(著しく)小さくなる場合がある。かかる場合の画像データにおいては、画像フレーム内において、固有画像データ(線画像データ)を有するブロック数が減少する。少ない数の記号データで構成される置換画像データは、元の画像(被撮影体)の微細な部分の画像表現が省略されるため、その特徴を具有するものとはなり難く、場合によっては、オブジェクトを表現した画像とは認識できない単なる記号の配列になりかねない。 When acquiring image data with an imaging device, depending on the distance between the imaging device and the subject (corresponding to the unique image data), the size of the subject is (remarkably) smaller than the background image There is. In the image data in such a case, the number of blocks having unique image data (line image data) is reduced in the image frame. The replacement image data composed of a small number of symbol data is less likely to have the characteristics because the image representation of the fine part of the original image (the subject) is omitted, and in some cases, It may be just an array of symbols that cannot be recognized as an image representing the object.
しかし、固有画像データ(線画像データ)を伸張すれば、画像フレーム内において固有画像データ(線画像データ)を有するブロック数を増加させることができる。つまり、微細部分についても表現し得る画像に拡大した上で、置換画像データを形成することができるので、入力された画像データの固有画像データが小さくとも、元の画像の特徴を備えた置換画像データを形成することができるという効果がある。 However, if the unique image data (line image data) is expanded, the number of blocks having the unique image data (line image data) in the image frame can be increased. In other words, since the replacement image data can be formed after enlarging the image to be able to express even a fine portion, the replacement image having the characteristics of the original image even if the unique image data of the input image data is small. There is an effect that data can be formed.
請求項10記載の画像処理プログラムによれば、請求項9記載の画像処理プログラムの奏する効果に加え、抽出元の画像フレームに対して抽出された固有画像データの占める割合が所定の割合以下であると判断ステップにより判断された場合に、固有画像データを有するブロック数が予め定めた下限値以下であるとして固有画像データの伸張が行われれる。よって、伸張するべき固有画像データの選別を的確に行うことができるという効果がある。
According to claim 10, wherein the image processing program, in addition to the effects of the image processing program according to
固有画像データの大きさをブロック数で測る(ブロック単位でカウントする)場合には、ブロック全面にドットが配されていなくとも1カウントされる。このため、ブロック単位で固有画像データの大きさを測る場合、簡便である一方、測定結果が実際の大きさよりも大きい側にシフトしがちになり、場合によっては、伸張する必要のある固有画像データが伸張されないという事態が発生しかねない。しかし、抽出元の画像フレームに対して抽出された固有画像データの占める割合が所定の割合以下である場合に、固有画像データの伸張を行うので、的確に伸張の必要のある固有画像データを的確に選別することができるのである。 When the size of the unique image data is measured by the number of blocks (counted in units of blocks), 1 is counted even if no dots are arranged on the entire block. Therefore, when measuring the size of the unique image data in units of blocks, it is convenient, but the measurement result tends to shift to a larger side than the actual size, and in some cases, the unique image data that needs to be expanded There is a possibility that the situation will not be expanded. However, since the unique image data is expanded when the ratio of the extracted unique image data to the extraction source image frame is equal to or less than a predetermined ratio, the unique image data that needs to be accurately decompressed is accurately detected. Can be sorted into
以下、本発明の好ましい実施例について、添付図面を参照して説明する。図1は、本発明の画像処理装置としてのカラオケ装置1を示す概略図である。このカラオケ装置1は、画像処理部としての本体1aと、表示装置としてのCRTディスプレイ2と、本体1aを遠隔操作するための電子早見本30とを備えており、本体1aとCRTディスプレイ2とはケーブル4を介して接続されている。該カラオケ装置1は、入力された画像データを記号で構成されたアスキー画像に変換する画像処理を実行し、変換されたアスキー画像をCRTディスプレイ2に出力することにより演出を実行する機能を備えている。
Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a schematic diagram showing a
また、カラオケ装置1は、いわゆる通信カラオケであって、回線を介して接続されるカラオケサーバから配信された楽曲データ(伴奏情報)や歌詞データを、本体1a内に記憶している。そして、電子早見本30から、歌唱者により選曲された楽曲を示す楽曲コードが送信されると、本体1a内から対応する楽曲データと歌詞データとを読出し、楽曲データに基づいて伴奏を自動演奏するとともに、その楽曲の進行に合わせて歌詞と映像(またはアスキー画像)とをCRTディスプレイ2に表示するように構成されている。
The
このカラオケ装置1の本体1aは、制御部5と、該制御部5に接続されるCCDカメラ3とマイクロフォン23とを備えている。制御部5のケーシング前面には、数値を入力するためのテンキーや、各種コマンドを制御部5に入力するコマンドボタンを備えた操作パネル20が配設されている。かかるテンキーやコマンドボタンの操作により、使用者は、選曲や、演奏テンポの設定、音程の設定、音量の設定、リバーブなどの音響効果の設定や、文字の入力などを行うことができる。また、該操作パネル20には、液晶表示器(以下単に「LCD」と称す)が設けられており、テンキーにより入力された数値やコマンドボタンにより入力されたコマンドの内容、電子早見本30から送信されたコマンドの内容、更には、カラオケ装置1の動作状態等がこのLCDに表示される。
The main body 1 a of the
操作パネル20の下方には、電子早見本30との間で赤外線データによる無線通信を行うための無線通信部26が配設されている。電子早見本30から赤外線データで送信される各種コマンドや楽曲コードなどのデータは、この無線通信部26により受信される。この無線通信部26により、電子早見本30からの楽曲コードや所定の処理の実行を指示するコマンドを受信した場合には、本体1aは、その楽曲コードやコマンドに基づいた処理を実行する。無線通信部26の右方には、入力端子を介してマイクロフォン23が接続されており、歌唱者の発声は、かかるマイクロフォン23から制御部5内に入力される。
Below the
CCDカメラ3は、連続的に画像を撮像する一般的な撮像装置であり、CRTディスプレイ2の筐体上面に設置されている。CCDカメラ3により撮像された画像(画像データ)は、非図示のケーブルを介して制御部5内に入力される。CCDカメラ3内には、A/Dコンバータなどが内蔵されており、制御部5には、デジタルデータに変換された画像データが入力される。制御部5は、このCCDカメラ3により入力された画像データに基づいて、アスキー画像を作成する。
The
電子早見本30は、楽曲の選択および選択した楽曲の指定(楽曲コードの本体1aへの送信)に加え、本体1a(制御部5)を遠隔操作(演奏の中止やスキップ等)するための装置であり、タッチパネルディスプレイ40を備えた表示本体30aと、該表示本体30aを立設した状態で維持するためのクレイドル44とを備えている。表示本体30aには、本体1aとの間で赤外線データによる無線通信を行うための無線通信部36が、その筐体上部に設けられている。電子早見本30へ送信される楽曲コード等のデータや、所定の処理の実行を指示するコマンドは、この無線通信部36から赤外線データで出力される。
The
また、表示本体30aは、案内画像を表示するタッチパネルディスプレイ40を備えている。タッチパネルディスプレイ40は、画像を表示するLCDで構成された表示装置41と、その表示装置41上に設けられ押下により信号入力を実行するタッチパネル42とを備えている。
The
案内画像は、選曲のための各種データや、選曲の為の各種操作を行うための操作ボタンを表示する画像であり、使用者が視覚的に電子早見本30の操作を理解することができるように構成されている。尚、案内画像(即ち表示装置41)に表示された各操作ボタンの押下は、表示装置41上に設けられたタッチパネル42により、その押下位置に対応する電気信号として入力される。これにより、押下された操作ボタンの入力としてCPU12(図2参照)に認識され、対応する動作(コマンド入力)が実行される。
The guide image is an image displaying various data for music selection and operation buttons for performing various operations for music selection, so that the user can visually understand the operation of the electronic
具体的には、この案内画像は、複数画面で構成されており、各画面において、カテゴリや歌手毎に分類された項目や、その項目の選択によって表示される曲名などが表示される。各曲名の表示は、曲名を指定するための操作ボタンとなっており、この曲名の表示が押下されることにより選曲がなされる(楽曲データの指定)。この選曲が実行される画面内には、アスキーアートボタン42aが表示されている。
Specifically, this guidance image is composed of a plurality of screens, and on each screen, an item classified for each category and singer, a song name displayed by selection of the item, and the like are displayed. The display of each song name is an operation button for designating the song name, and the song selection is made by pressing this song name display (designation of song data). An
アスキーアートボタン42aは、本体1aにアスキー画像による演出を指示するためのものである。このアスキーアートボタン42aが、その画面上から(タッチパネル42を介して)押下されると、選曲された楽曲コードに、アスキー画像による演出を本体1aに指示するアスキーアートコードが付加されて、本体1aに送信される。本体1aでは、受信した楽曲コードにアスキーアートコードが付加されていると、かかる楽曲再生中のCRTディスプレイ2における演出を、予め記憶された映像に代えて、アスキー画像を表示することにより実行する。
The
更に、操作ボタンとしては、楽曲の選択等、電子早見本30においての各処理を実行させるボタンに加え、本体1aを操作するためのボタンが各種設けられている。かかる操作ボタンの操作(表示された操作ボタンの画面上からの押下)により、本体1aの操作パネル20に備えられたボタン操作と同様に、選曲や、演奏テンポの設定、音程の設定、音量の設定、リバーブなどの音響効果の設定や、文字の入力などを行うことができる。つまり、上記の本体1aの操作パネル20の機能の一部は、この電子早見本30による遠隔操作によっても実行される。
Furthermore, as the operation buttons, various buttons for operating the main body 1a are provided in addition to buttons for executing various processes in the electronic
クレイドル44は、表示本体30aの下部と左右との三方を支持する矩形状に形成されており、このクレイドル44と表示本体30aとは着脱可能に構成されている。また、クレイドル44は、電子早見本30と本体1aとの接続架台であり、かかるクレイドル44によって、本体1aに取り付けられた電子早見本30は、有線により本体1aと電気的に接続される。このクレイドル44を介した有線接続により、電子早見本30に内蔵されたバッテリに対する充電が実行される。また、本体1aから電子早見本30に、新たな楽曲に対応する楽曲コードや曲名などのデータを送信することができる。
The
図2は、上記のように構成されたカラオケ装置1の電気的構成を示すブロック図である。カラオケ装置1は、本体1aと、CRTディスプレイ2と、電子早見本30とを備え、本体1aは、更に、制御部5とCCDカメラ3とマイクロフォン23とを備えている。
FIG. 2 is a block diagram showing an electrical configuration of the
制御部5は、演算装置であるCPU11によりカラオケ装置1の制御を行うものであり、CPU11と、ROM12と、RAM13と、画像用RAM27と、ハードディスク14と、モデム15と、ディスクプレイヤー16と、映像処理部17と、入出力ポート(I/O)19と、音源であるシンセサイザを備えた伴奏装置21と、電子早見本30(クレイドル44)を有線接続するためのLANポート25と、電子早見本30からの赤外線データを受信するための無線通信部26とを備えている。これらの各デバイスはCPU11に接続され、CPU11により制御される。また、制御部5は、ディスクプレイヤー16と映像処理部17とに接続されたビデオミキサ18と、入出力ポート(I/O)19に接続された操作パネル20と、伴奏装置21に接続されたアンプミキサ22と、アンプミキサ22に接続されたスピーカ24とを備えている。また、入出力ポート(I/O)19には、CCDカメラ3が接続されている。
The
CPU11は、電子早見本30や操作パネル20から楽曲コードが入力された場合、その楽曲コードを、RAM13の所定のエリアに設けられた予約曲リストエリアに登録したり、その予約曲リストエリアに記憶される楽曲コードを登録順に読み出して、楽曲の再生出力を制御するものである。尚、後述するカラオケ再生処理(図4参照)では、かかる予約曲リストエリアに楽曲コードが登録されていると、楽曲コードの入力有りと判断して、楽曲を再生する処理を実行する。楽曲が再生されると、対応する楽曲コードは、予約曲リストエリアから削除される。また、CPU11は、楽曲の演奏時に行われる演出の1つとして、CCDカメラ3により撮像された画像からアスキー画像を形成し、CRTディスプレイ2に出力する制御を行う。
When the music code is input from the
ROM12は、CPU11により実行される各種のプログラムや固定値などを記憶した不揮発性のメモリである。
The
RAM13は、ROM12内に記憶されるプログラムや後述するハードディスク14に記憶される制御プログラムの実行に際して各種のデータ等を一時的に記憶するためのメモリであり、背景画像メモリ13aと、アスキー画像バッファ13bと、アスキーアートフラグ13cとを備えている。
The
背景画像メモリ13aは、背景画像としてCCDカメラ3により撮像(取得)された画像データを記憶するためのメモリである。背景画像は、アスキー画像による1の演出、即ち1の楽曲の再生が実行される毎に、アスキー画像による演出に先だってCCDカメラ3により撮像される。新たに背景画像が撮像されると、この背景画像メモリ13aに記憶される背景画像の画像データは、新たに撮像された背景画像の画像データによって更新される。
The
アスキー画像の形成に際しては、入力された画像データから、背景画像メモリ13aに記憶される背景画像の画像データに対応する部分の画像データが除かれ、背景画像の画像データが除かれた残りの部分(人物画像データ、固有画像データ)がアスキー画像に変換される。
When forming the ASCII image, the image data of the portion corresponding to the image data of the background image stored in the
CCDカメラ3は、通常の撮像において、その撮像範囲に存在する各種のオブジェクトの画像データが、各オブジェクトが詳細に識別し得る解像度で、即ち、良好な画像品質を実現する画素数で取得されるように設計されている。このため、CCDカメラ3の設置場所によっては、取得される画像データが複雑なもの(複数のオブジェクトが混在する画像)となる。かかる複雑な画像データをアスキー画像に変換する場合には、入り組んだオブジェクトの輪郭線の処理が不的確になりかねず、個々のオブジェクトがアスキー画像にて的確に表現されないという事態が発生しかねない。しかし、取得された画像データから背景画像を除いた画像データ(人物画像データ)を、アスキー画像に変換するので、変換元の画像データを簡素にすることができる。このため、形成されるアスキー画像をオブジェクト(本実施の形態では主として人物)が的確かつ明確に示された画像とすることができる。
In normal imaging, the
具体的には、背景画像以外の部分とは、例えば、CCDカメラ3による背景画像の撮像後、CCDカメラ3の撮像範囲に入ったオブジェクトの画像であり、本実施の形態では、人物(歌唱者)の画像である。つまり、本実施の形態では、アスキー画像への変換対象を人物(動きのある動体)の画像としており、変化の乏しい背景画像に比べてかかる人物画像(背景画像以外の部分)は、一連の撮像での特徴的部分となる。故に、一連の撮像を通して共通する変化の乏しい背景画像の画像データを除去して、その残りの部分である人物画像データにてアスキー画像を形成しても、演出の意図を大きく変化させることはないばかりか、画像の特徴的部分に絞り込んだ単純明快なアスキー画像をCRTディスプレイ2に表示することができる。
Specifically, the portion other than the background image is, for example, an image of an object that has entered the imaging range of the
アスキー画像バッファ13bは、後述するアスキー変換処理(S28、図6参照)において、形成されたアスキー画像を一時的に記憶するためのメモリである。アスキー画像は、記号データを組み合わせて形成された画像であり、即ち、巨視的に画像の態様を成す記号の集合体である。詳細には、アスキー画像は、アスキー変換処理(S28)にて、変換元の線画像データをブロックに分割した後、各ブロックの分割画像を、近似する態様の記号データに置換(嵌め込み)して形成される。置換された記号データは、ブロックの位置に従って、順に、このアスキー画像バッファ13bに記憶される。 The ASCII image buffer 13b is a memory for temporarily storing the ASCII image formed in the ASCII conversion process (S28, see FIG. 6) described later. The ASCII image is an image formed by combining symbol data, that is, a collection of symbols that macroscopically form an image. Specifically, the ASCII image is divided (inserted) into symbol data in an approximate form after dividing the line image data of the conversion source into blocks in the ASCII conversion process (S28). It is formed. The replaced symbol data is sequentially stored in the ASCII image buffer 13b in accordance with the block position.
ここで、アスキー画像バッファ13bには、ブロックの位置に従って、順に記号データが記憶され、画像フレームの端部に達した場合には改行コードが記憶される。このため、アスキー画像バッファ13bには、変換前の線画像データの画像フレームの座標に対応付けて、記号データが記憶されることとなる。その結果、記憶された記号データを、アスキー画像バッファ13bから順に取り出すことにより、元画像に対応したアスキー画像を出力することができる。尚、アスキー画像バッファ13bに記憶される記号データは、記号を示す記号コードであっても良く、記号コードが画像に展開されたドットデータ(記号の画像データ)であっても良い。 Here, the ASCII image buffer 13b stores the symbol data in order according to the position of the block, and stores the line feed code when the end of the image frame is reached. For this reason, the ASCII image buffer 13b stores symbol data in association with the coordinates of the image frame of the line image data before conversion. As a result, an ASCII image corresponding to the original image can be output by sequentially extracting the stored symbol data from the ASCII image buffer 13b. The symbol data stored in the ASCII image buffer 13b may be a symbol code indicating a symbol, or may be dot data (symbol image data) obtained by expanding the symbol code into an image.
アスキーアートフラグ13cは、選曲された楽曲に対応する演出を、その楽曲データに対応して予め記憶されている映像で実行するか、アスキー画像で実行するかを識別するためのフラグである。このアスキーアートフラグ13cは、電子早見本30から送信された楽曲コードにアスキーアートコードが付加されていた場合にオンされ、入力された楽曲コードに対応する楽曲の再生が終了するとオフされる。
The
画像用RAM27は、DRAMまたはSDRAMなどで構成された大容量のRAMであり、画像データを一時的に記憶するものである。背景画像撮影後にCCDカメラ3から入力された画像データ(背景と人物とが撮像された画像)は、1の画像フレーム毎に、この画像用RAM27に記憶される。記憶された画像データは、アスキー画像を作成する際に、1の画像フレーム毎に、この画像用RAM27から読み出されてアスキー画像へと変換される。
The
ハードディスク14は、書換可能な大容量の不揮発性のメモリであり、本カラオケ装置1を制御する制御プログラム14aと、記号データメモリ14bと、楽曲データメモリ14cと、歌詞データメモリ14dとを備えている。尚、図4〜図6に示したフローチャートのプログラムは、制御プログラム14aの一部として格納されている。
The
記号データメモリ14bは、記号の画像データ(記号データ)を記憶するメモリであり、各記号を示す記号コードに対応付けられて、各記号の画像がドットデータで記憶されている。アスキー画像の作成時には、この記号データメモリ14bが参照され、線画像データに近似する記号のドットデータがテンプレートマッチングにより抽出されて、アスキー画像が形成される。尚、本カラオケ装置1においては、記号コードには、ASCIIコードに準じたJIS7単位符号(8ビットのデータで表現されるコード)が採用されている。尚、コード体系は、JIS7単位符号に限られるものでなく、例えば、他のASCIIコードや、EBCDICコード、Unicode、更には、JIS漢字コードなどを適宜用いることができる。
The
楽曲データメモリ14cは、再生する楽曲の楽曲データを記憶するメモリである。各楽曲データは、1の楽曲コードを指定する楽曲コードのそれぞれに対応して記憶されている。楽曲コードが入力されると、その楽曲コードに対応する1の楽曲データ(MIDI(Musical Instrument Digital Interface)形式のデータや、音符長を示すデータなど)が、この楽曲データメモリ14cから読み出され、後述する伴奏装置21に出力される。
The
歌詞データメモリ14dは、楽曲の歌詞データ(タイトルデータを含む)を記憶するメモリである。各歌詞データは、1の楽曲コードを指定する楽曲コードのそれぞれに対応して、テキストデータで記憶されている。また、この歌詞データメモリ14dに記憶される歌詞データは、JIS漢字コードで形成されている。楽曲コードが入力されると、CPU11により、この歌詞データメモリ14dから対応する歌詞データ(タイトルデータを含む)が読み出されると共に、漢字コードに対応してハードディスク14の所定の領域に記憶された文字の画像データに、読み出した歌詞データは展開され、歌詞文字画像データ(ドットデータ)が生成される。
The lyric data memory 14d is a memory for storing lyric data (including title data) of music. Each lyric data is stored as text data corresponding to each music code designating one music code. The lyric data stored in the lyric data memory 14d is formed of JIS kanji codes. When the music code is input, the
新曲等のリリースにより、歌唱者が所望する楽曲は変化するため、楽曲データメモリ14cに記憶される楽曲データと、歌詞データメモリ14dに記憶される歌詞データとは、定期的に更新される。本カラオケ装置1は、上記したように通信カラオケであり、回線を介して楽曲データ等を配信するカラオケサーバに接続されると共に、本カラオケ装置1からカラオケサーバにアクセスし、楽曲データと、その楽曲データに対応する歌詞データとを(場合によっては楽曲データに対応する映像データも)、1の楽曲コードに対応付けられた一連のデータとしてダウンロードすることができるように構成されている。ダウンロードされた楽曲データは、この楽曲データメモリ14cに書き加えられる(追加して記憶される)。また、歌詞データについては、歌詞データメモリ14dに書き加えられる(追加して記憶される)。
Since the song desired by the singer changes due to the release of a new song or the like, the song data stored in the
モデム15は、変復調装置であり、アナログ信号とデジタル信号との変換を行う装置である。また、伝送制御用の各種手順信号を送受信するものである。カラオケ装置1から回線に出力されるデータ(例えば、カラオケサーバへのアクセス要求など)は、このモデム15によってデジタル信号からアナログ信号に変換された後に回線に出力される。また、回線から受信したデータ(カラオケサーバからダウンロードされる楽曲データや歌詞データなど)は、このモデム15によりアナログ信号からデジタル信号に変換される。
The
このモデム15は、回線制御を行うためのネットワークコントロールユニット(以下単に「NCU」と称す)を内蔵しており、このNCUを介してカラオケ装置1は回線に接続されている。このNCUにより通信相手を呼び出すためのダイヤル信号が送出される。
The
ディスクプレイヤー16は、歌唱者が歌詞を参照しながら歌唱する際に、CRTディスプレイ2に表示される映像を記憶したCDやDVDを再生する再生装置である。本カラオケ装置1は、楽曲データの再生時におけるCRTディスプレイ2での演出を、ディスクプレイヤー16にて再生される映像とするか、CCDカメラ3により取得された画像データに基づくアスキー画像とするかを、選択可能に構成されている。かかる演出をアスキー画像で行うことが指定されている場合には、ディスクプレイヤー16による映像の再生は非実行とされる。尚、アスキー画像による演出が指定された場合に、ディスクプレイヤー16によっても映像を再生し、その映像とアスキー画像とを共にCRTディスプレイ2に表示するように、本カラオケ装置1を構成しても良い。映像とアスキー画像とを共にCRTディスプレイ2に表示する場合には、CRTディスプレイ2の画面を分割すると共に各分割画面にそれぞれ映像とアスキー画像とを個別に表示してもよく、映像にアスキー画像を重ねて1画面で表示しても良い。
The
映像処理部17は、CPU11にて生成された歌詞文字画像データ(ドットデータ)のテロップやアスキー画像のCRTディスプレイ2への出力を制御する装置である。ビデオミキサ18は、CPU11にて生成され且つ映像処理部17から出力される歌詞文字画像データと、ディスクプレイヤー16によって再生される映像またはアスキー画像とを合成して、CRTディスプレイ2に表示させるための映像合成装置である。
The
伴奏装置21は、伴奏を発生するものであって各種楽器音などの楽音波形を記憶している。(楽曲データメモリ14cから読み出された楽曲データの)MIDI形式のデータが示す音色と音程と音量とに対応する音楽信号を、音符長を示すデータにて示される長さ分、楽音波形に基づいてデジタル信号で生成する。生成された音楽信号は、アナログ信号に変換されて、アンプミキサ22に出力される。
The
アンプミキサ22は、伴奏装置21からの音楽信号とマイクロフォン23から入力された発声(音声データ)とをミキシングして増幅する装置であり、ミキシングされた信号は、電気的に増幅されてスピーカ24から出力される。
The amplifier mixer 22 is a device that mixes and amplifies the music signal from the
電子早見本30は、上記したように表示本体30aと、クレイドル44とを備えており、表示本体30aは、演算装置であるCPU31と、CPU31により実行される各種のプログラムや固定値などを記憶した不揮発性のメモリであるROM32と、ROM32内に記憶される制御プログラムの実行に際して各種のデータ等を一時的に記憶するためのメモリであるRAM33と、ハードディスク34と、インターフェース35と、無線通信部36と、クレイドル44を介して表示本体30aと本体1aとを有線接続するためのLANポート37と、表示装置41とタッチパネル42とを有するタッチパネルディスプレイ40と、タッチパネルディスプレイ40に設けられた表示装置41を制御する表示制御部38と、タッチパネルディスプレイ40に設けられたタッチパネル42による入力を制御する入力制御部と、LANポート37とクレイドル44との間に介在して、表示本体30aとクレイドル44とを接続するコネクタ43とを備えている。
The electronic
ハードディスク34は、書換可能な大容量の不揮発性のメモリであり、選曲可能な楽曲のタイトルデータが楽曲コードに対応つけて記憶されている。また、各楽曲のタイトルデータには、ジャンルや歌手名などのカテゴリデータが付加されており、カテゴリ毎に表示装置41へ表示することができるようになっている。更に、ハードディスク34には、案内画像の各画面の書式データが記憶されている。
The
CPU31は、楽曲のタイトルデータの出力要求がなされる(使用者により選曲操作が開始される)と、選曲の操作手順に応じて、案内画像の各画面の書式や、タイトルデータなどをハードディスク34から読み出す。そして、表示制御部38に、楽曲のタイトルデータなどのデータを対応する案内画像の画面の書式で、表示装置41に表示させる。画面上から(タッチパネル42の押下により)選曲、即ち、楽曲データの指定が実行されると、CPU31は、選曲された楽曲コードを無線通信部36から無線で出力する。ここで、選曲と共に画面上から(タッチパネル42の押下により)アスキーアートボタン42aが押下された場合には、CPU31は、楽曲コードにアスキーアートコードを付加して出力する。アスキーアートコードは、使用者によりアスキー画像による演出を本体1aに指示するコマンドであり、アスキーアートコードが楽曲コードに付加されていた場合には、本体1aは、アスキー画像による演出指示と認識し、アスキー画像による演出を実行する。
When the
次に、図4〜図6のフローチャートを参照して、本カラオケ装置1により実行される各処理について説明する。
Next, each process executed by the
図4は、本体1aの制御部5のCPU11により実行されるカラオケ再生処理のフローチャートである。カラオケ再生処理は、歌唱者等により指定された楽曲について、伴奏を発生させ、歌詞データを表示すると共に、CRTディスプレイ2にて楽曲の演出を行う処理である。このカラオケ再生処理は、楽曲の再生が指定されること、即ち、楽曲コードの入力により開始されるので、まず、楽曲コードが入力されたか否かを確認する(S1)。ここで、楽曲コードが入力されていなければ(S1:No)、このカラオケ再生処理を終了する。一方、楽曲コードが入力されていれば(S1:Yes)、入力された楽曲コードにアスキーコードが付加されているか否かを確認し(S2)、入力された楽曲コードにアスキーコードが付加されていなければ(S2:No)、S3〜S6の処理をスキップして、その処理を楽曲データ出力処理(S7)に移行する。一方、アスキーアートコードが付加されていると(S2:Yes)、楽曲再生中の演出をアスキー画像で行うことの要求であると認識し、アスキーアートフラグ13cをオンする(S3)。
FIG. 4 is a flowchart of the karaoke playback process executed by the
次に、「背景画像を撮影します」の表示を、所定時間CRTディスプレイ2に出力して背景画像の撮像を告知し(S4)、歌唱者などに注意を促す。本実施の形態では、アスキー画像による演出が指定されと、その楽曲の再生が開始される前に、背景画像の撮影を実行する。ここで、「背景画像を撮影します」の表示と共に撮影領域の画像がCRTディスプレイ2に出力され、背景画像の撮影領域を歌唱者等に認識させることができるようになっている。
Next, the display of “capturing the background image” is output to the
その後、CCDカメラ3によって撮像された画像を取込み(1の画像フレームの取得)、取得した画像データを背景画像メモリ13aに書き込む(S5)。続いて、「撮影を開始します」の表示を、所定時間CRTディスプレイ2に出力する(S6)。そして、入力された楽曲コードに対応する楽曲データを、楽曲データメモリ14cから読み出して、伴奏装置21に出力する楽曲データ出力処理を実行する(S7)。伴奏装置21には、1の楽曲コードに対応する楽曲データが一括出力され、出力された楽曲データは、伴奏装置21内に設けられた所定のメモリに一括して記憶される。
Thereafter, an image captured by the
次に、伴奏装置21に出力された楽曲データに対応する歌詞データを、歌詞データメモリ14dから読み出して映像処理部17に出力する歌詞データ出力処理を実行する(S8)。この歌詞データ出力処理(S8)では、入力された楽曲コードにて指定される歌詞データ(タイトルデータを含む)を読み出すと共に、読み出した歌詞データを、その歌詞データを構成する漢字コードに対応してハードディスク14の所定の領域に記憶された文字の画像データに展開し、歌詞文字画像データ(ドットデータ)を生成する。そして、生成された歌詞文字画像データを映像処理部17に出力する。1の楽曲コードに対応する歌詞データ(歌詞文字画像データ)は、楽曲再生開始前に映像処理部17内に設けられた所定のメモリに一括して記憶される。
Next, the lyric data output process which reads the lyric data corresponding to the music data output to the
次いで、アスキーアートフラグ13cがオンであるか否かを確認し(S9)、アスキーアートフラグ13cがオンであれば(S9:Yes)、CCDカメラ3により取得された画像データ(1の画像フレーム)から、1フレームのアスキー画像を形成するアスキーアート処理を実行する(S10)。アスキーアート処理(S10)の実行後は、楽曲の再生中であるか否かを確認し(S11)、楽曲の再生中であれば(S11:Yes)、S15の処理に移行し、再生中でなければ(S11:No)、楽曲が終了したタイミングであるか否かを確認する(S12)。ここで、楽曲が終了したタイミングであれば(S12:Yes)、アスキーアートフラグ13cをオフして、このカラオケ再生処理を終了する。
Next, it is confirmed whether or not the
また、S12の処理で確認した結果、楽曲が終了したタイミングでなければ(S12:No)、楽曲の再生を開始するタイミングであるので、再生開始を映像処理部17およびに伴奏装置21指示する(S14)。これにより、映像処理部17による制御によって、伴奏装置21にて生成される伴奏に対応する歌詞データ(歌詞文字画像データ)が、ビデオミキサ18を介してCRTディスプレイ2に出力される。また、伴奏装置21により伴奏が生成され、生成された伴奏がスピーカ24から出力される。
As a result of checking in the process of S12, if the timing is not the end of the music (S12: No), it is the time to start playing the music, so the
S14の処理の後は、アスキー画像バッファ13bに記憶されるアスキー画像をビデオミキサ18に出力する(S15)。出力されたアスキー画像は、ビデオミキサ18において歌詞データ(歌詞文字画像データ)と合成され、映像処理部17による制御によってCRTディスプレイ2に出力される。
After the process of S14, the ASCII image stored in the ASCII image buffer 13b is output to the video mixer 18 (S15). The output ASCII image is combined with the lyrics data (lyric character image data) in the
その後、その処理をS10の処理に移行する。これにより、入力された画像データの1の画像フレーム毎にアスキー画像の1フレームを形成するアスキーアート処理(S10)が、楽曲が終了する(S12:Yes)まで繰り返して実行され、CRTディスプレイ2においてアスキー画像が動画表示される。 Thereafter, the process proceeds to S10. As a result, the ASCII art process (S10) for forming one ASCII image frame for each image frame of the input image data is repeatedly executed until the music ends (S12: Yes). The image is displayed as a movie.
一方、S9の処理で確認した結果、アスキーアートフラグ13cがオフであれば(S9:No)、入力された楽曲コードにはアスキーアートコードが付加されていなかった、即ち、楽曲再生中の演出をアスキー画像で行うことは要求されていないと認識し、ディスク再生処理を実行する(S16)。ディスク再生処理(S16)は、楽曲毎に予め定められた映像をディスクプレイヤー16に再生させる処理である。ハードディスク14の所定の領域には、楽曲コードとCDまたはDVDの識別コードとが対応付けられた対応テーブルが記憶されており、かかる対応テーブルに基づいて、CPU11は、入力された楽曲コードに対応するCDまたはDVDの識別コードをディスクプレイヤー16に指示する。ディスクプレイヤー16におけるCDまたはDVDの選択は、機械的な動作にて実行されるため、このディスク再生処理(S16)において、ディスクプレイヤー16におけるその選択動作が完了するまで、処理をウェイトする。
On the other hand, if the
ウェイト終了後、再生開始をディスクプレイヤー16、映像処理部17、伴奏装置21に指示して(S17)、このカラオケ再生処理を終了する。かかる再生指示により、入力された楽曲コードに対応する楽曲の伴奏がスピーカ24から出力されると共に、その楽曲の歌詞データ(歌詞文字画像データ)と対応する映像とがビデオミキサ18を介してCRTディスプレイ2に出力される。
After the end of the wait, the
尚、CPU11は、S14,S17の処理にて再生開始を指示した後は、映像処理部17と伴奏装置21とにタイミング信号を出力し、CRTディスプレイ2への歌詞データ(歌詞文字画像データ)の出力と、伴奏装置21による伴奏の生成とを同期させる。
The
図5は、図4のカラオケ再生処理の中で実行されるアスキーアート処理(S10)のフローチャートである。この図5に示したアスキーアート処理(S10)を、アスキー画像が形成される課程を模式的に示した図である図3を参照しつつ説明する。 FIG. 5 is a flowchart of the ASCII art process (S10) executed in the karaoke playback process of FIG. The ASCII art process (S10) shown in FIG. 5 will be described with reference to FIG. 3, which is a diagram schematically showing a process of forming an ASCII image.
アスキーアート処理(S10)では、まず、画像用RAM27に記憶されている1の画像フレームの画像データを読み出す(S21)。そして、画像用RAM27に記憶される画像データと、背景画像メモリ13aに記憶される背景画像の画像データとを、共に、80×25文字を作成するドット数となるように、データを圧縮する(S22)。
In the ASCII art process (S10), first, image data of one image frame stored in the
1の記号は8×16ドットで構成されるため、総ドット数を80×25×128とするデータサイズに画像データは圧縮される。背景画像メモリ13aおよび画像用メモリ27に記憶される各画像データは、CRTディスプレイ2に出力した場合に良好な画像品質を実現し得る画素数を有しており、データ量が多い。このため、画像用RAM27に記憶される画像データを、そのまま、線画像データに変換し、更に、アスキー画像へ変換すると多大な処理時間が必要となり、出力されるアスキー画像の動画が、被撮影体の実際の動作から大きく遅延しかねない。更に、一般的な表示装置における標準の表示サイズは、全画面表示において80×25文字(記号)を表示するサイズとされているので、それ以上の文字(記号)にてアスキー画像が形成されると、その一部が非表示になりかねない。故に、アスキー画像作成にかかる処理時間を短縮し、更に、作成されたアスキー画像の大きさが一般的な表示装置に適合するように、このS22の処理にてデータを圧縮している。尚、必ずしも、画像データを、総ドット数80×25×128とするデータサイズに圧縮する必要はなく、その圧縮後のデータサイズは、作成するアスキー画像の態様(細密度)や、表示装置等に応じて適宜採用することができる。
Since the
S22の処理の後は、圧縮された両画像データをドット毎に比較し、共通部分を抽出して、その共通部分によりマスクを作成する(S23)。次に、圧縮後の画像データから、作成されたマスクに対応する部分、即ち、背景画像部分を削除し、人物画像データ(背景画像以外の部分の画像データ)を抽出する(S24)。この人物画像データが抽出された状態を図3(a)に示す。この図3(a)に表示される枠にて区画された画像が1の画像フレームを模式的に示しており、中心に描画された人物画像が抽出された人物画像データに対応している。図3(a)は、S24の処理によりマスク処理が実行された後であるので、背景画像が消去され、画像フレーム内には人物画像のみが表示されている。 After the process of S22, both compressed image data are compared for each dot, a common part is extracted, and a mask is created using the common part (S23). Next, the portion corresponding to the created mask, that is, the background image portion is deleted from the compressed image data, and person image data (image data of a portion other than the background image) is extracted (S24). FIG. 3A shows a state where the person image data is extracted. The image divided by the frame displayed in FIG. 3A schematically shows one image frame, and corresponds to human image data in which a human image drawn at the center is extracted. In FIG. 3A, since the mask process is executed by the process of S24, the background image is deleted, and only the person image is displayed in the image frame.
尚、マスクは、圧縮後の画像データを比較することにより形成するものに限られず、画像用RAM27に記憶される画像データと、背景画像メモリ13aに記憶される背景画像の画像データとのそれぞれを、圧縮前に比較して、マスクを作成しても良く、さらに、画像用RAM27に記憶される圧縮前の画像データから作成したマスクを用いて人物画像データを抽出しても良い。
The mask is not limited to the one formed by comparing the compressed image data, and each of the image data stored in the
そして、抽出された人物画像の面積(ドット数)が、画像フレームの全体面積に対して半分以上を占めているか否か(人物画像面積≧1/2×(画像フレームの全体面積))を調べる(S25)。ここで、その抽出された人物画像の面積が、画像フレームの全体面積に対して半分以上を占めている場合は(S25:Yes)、人物画像が十分な大きさで撮影されていると判断し、そのままアスキー画像データに変換するべく、人物画像データからノイズを除去する(S26)。続いて、ノイズの除去された人物画像データをラプラシアン変換により線画像データに変換する(S27)。これにより、面で表された画像データから、その特徴部分を線で表現した線画像に変換される。この人物画像データをラプラシアン変換により線画像データに変換した状態を図3(b)に示す。その後、線画像データをアスキー画像に変換するアスキー変換処理を実行して(S28)、このアスキーアート処理(S10)を終了する。 Then, it is checked whether or not the area (number of dots) of the extracted person image occupies more than half of the entire area of the image frame (person image area ≧ 1/2 × (total area of the image frame)). (S25). Here, when the area of the extracted person image occupies more than half of the entire area of the image frame (S25: Yes), it is determined that the person image is captured with a sufficient size. Then, the noise is removed from the person image data in order to convert it into ASCII image data as it is (S26). Subsequently, the human image data from which noise has been removed is converted into line image data by Laplacian conversion (S27). As a result, the image data represented by the plane is converted into a line image in which the characteristic portion is represented by a line. FIG. 3B shows a state in which this person image data is converted into line image data by Laplacian conversion. Thereafter, an ASCII conversion process for converting the line image data into an ASCII image is executed (S28), and the ASCII art process (S10) is terminated.
一方、S25の処理で確認した結果、抽出された人物画像の面積(ドット数)が、画像フレームの全体面積に対して半分未満であれば(S25:No)、人物画像は基準よりも小さく不適切な大きさで撮影されていることが示されている。そこで、人物画像の面積が画像フレームの全体面積に対して半分以上となるように、人物画像データを拡大(伸張)する。アスキー画像を形成する場合に変換元の画像データ(本実施形態では人物画像データ)が小さくなると、変換元の画像データを有するブロック数が少なくなり、その結果、少ない数の記号にて小さなアスキー画像が形成されてしまう。少ない記号で組み立てられた小さなアスキー画像には、元の画像の特徴が反映され難く、場合によっては何を表したものであるかの識別が不能となる。そこで、本実施の形態では、画像フレーム全体の半分の面積を下限値とし、かかる値以下である場合に人物画像データを拡大して、元画像(撮像された人物)の特徴が反映されたアスキー画像が形成されるように構成されている。 On the other hand, if the area (number of dots) of the extracted person image is less than half of the entire area of the image frame as a result of checking in the process of S25 (S25: No), the person image is smaller than the reference and is not valid. It is shown that it was shot at an appropriate size. Therefore, the human image data is enlarged (expanded) so that the area of the human image is more than half of the entire area of the image frame. If the conversion source image data (person image data in this embodiment) is reduced when forming an ASCII image, the number of blocks having the conversion source image data decreases, and as a result, a small ASCII image with a small number of symbols. Will be formed. A small ASCII image assembled with a small number of symbols is difficult to reflect the characteristics of the original image, and in some cases, it is impossible to identify what it represents. Therefore, in the present embodiment, half the area of the entire image frame is set as the lower limit value, and the person image data is enlarged when the area is equal to or lower than the lower limit value, and the ASCII characteristic of the original image (captured person) is reflected. An image is formed.
故に、まず、画面(画像フレーム)横軸に対する人物画像データのドット分布を算出し、横軸方向の分布の中心(中央座標)を決定してから(S29)、人物画像の面積を、画像フレーム全体の半分の面積にて除して拡大率を算出し(S30)、S29の処理で決定された中央座標を中心に、その算出された拡大率で人物画像データを拡大する(S31)。これによれば、人物画像の中心から等方的にズームアップされた画像を形成できるので、拡大された画像がいびつな画像になることを回避できる。その後、S26の処理に移行して、拡大された人物画像データに基づいたアスキー画像の形成を実行する。 Therefore, first, the dot distribution of the human image data with respect to the horizontal axis of the screen (image frame) is calculated, the center (central coordinate) of the distribution in the horizontal axis direction is determined (S29), and then the area of the human image is determined as the image frame. The enlargement ratio is calculated by dividing the area by half of the entire area (S30), and the person image data is enlarged with the calculated enlargement ratio around the central coordinates determined in the process of S29 (S31). According to this, since an image zoomed isotropically from the center of the person image can be formed, it is possible to avoid the enlarged image from becoming a distorted image. Thereafter, the process proceeds to S26, and ASCII image formation based on the enlarged person image data is executed.
尚、画像データの拡大を判断する下限値は、必ずしも、画像フレーム全体の半分の面積に限られるものでなく、良好なアスキー画像が形成できる範囲で任意に設定できる。更に、人物画像の大きさは、人物画像データのドット数によって判定したが、これに代えて、画像フレームを80×25に分割し、人物画像データを有するブロック数が所定の数(例えば半分)以下であるか否かによって、人物画像データの拡大の実行と非実行とを判定しても良い。これによれば、判定にかかる処理時間を短縮することができる。 Note that the lower limit value for determining the enlargement of the image data is not necessarily limited to half the area of the entire image frame, and can be arbitrarily set within a range in which a good ASCII image can be formed. Further, the size of the person image is determined by the number of dots of the person image data. Instead, the image frame is divided into 80 × 25, and the number of blocks having the person image data is a predetermined number (for example, half). Whether or not to enlarge the human image data may be determined depending on whether or not the following is true. According to this, the processing time for determination can be shortened.
図6は、図5のアスキーアート処理(S10)の中で実行されるアスキー変換処理(S28)のフローチャートである。この図6に示したアスキー変換処理(S28)を図3を参照しつつ説明する。 FIG. 6 is a flowchart of the ASCII conversion process (S28) executed in the ASCII art process (S10) of FIG. The ASCII conversion process (S28) shown in FIG. 6 will be described with reference to FIG.
アスキー変換処理(S28)では、まず、線画像データを有する画像フレームの横方向Xのサイズを、記号データの横サイズZ1で除し、横分割数mを求める(S41)。具体的には、本実施の形態では、1の記号データは8×16ドットの大きさとされており、記号データの横サイズZ1は、8ドットである。また、横方向Xに配列する文字(記号)数は、80であるので、横方向Xのサイズは、ドット換算で、8ドット×80、即ち、640ドットのサイズである。従って、このS41の処理により、横分割数mは、640を8で除した値「80」となる。 In the ASCII conversion process (S28), first, the size in the horizontal direction X of the image frame having line image data is divided by the horizontal size Z1 of the symbol data to obtain the horizontal division number m (S41). Specifically, in this embodiment, one symbol data has a size of 8 × 16 dots, and the horizontal size Z1 of the symbol data is 8 dots. Since the number of characters (symbols) arranged in the horizontal direction X is 80, the size in the horizontal direction X is 8 dots × 80, that is, a size of 640 dots in terms of dots. Therefore, by the processing of S41, the horizontal division number m becomes “80” obtained by dividing 640 by 8.
続いて、その画像フレームの縦方向Yのサイズを記号データの縦サイズZ2で除し、縦分割数nを求める(S42)。具体的には、本実施の形態では、記号データの縦サイズZ2は、16ドットである。また、縦方向Yに配列する文字(記号)数は、25であるので、縦方向Yのサイズは、ドット換算で、16ドット×25、即ち、400ドットのサイズである。従って、このS42の処理により、縦分割数nは、400を16で除した値「25」となる。 Subsequently, the vertical division number n is obtained by dividing the size of the image frame in the vertical direction Y by the vertical size Z2 of the symbol data (S42). Specifically, in the present embodiment, the vertical size Z2 of the symbol data is 16 dots. Since the number of characters (symbols) arranged in the vertical direction Y is 25, the size in the vertical direction Y is 16 dots × 25, that is, 400 dots in terms of dots. Therefore, the vertical division number n becomes a value “25” obtained by dividing 400 by 16 by the processing of S42.
このS41,S42の処理により、図3(b)に示すように、画像フレームは所定の大きさのブロックに分割される。本実施の形態においては、画像フレームを、記号データと同じ8×16ドットの大きさのブロックに分割する。これによれば、テンプレートマッチングに際し、ブロックに分割された線画像データの各部(分割画像)と記号データとの大きさを整合させる処理を行うことなく、直ちにマッチングを行うことができるので、迅速にマッチングを行うことができる。尚、画像データが、総ドット数80×25×128以上または以下のデータサイズに圧縮されている場合など、画像フレームを分割するS41,S42において生じた端数は繰り上げとし、80×25以上または80×25以下のブロック数に分割される。 By the processing of S41 and S42, the image frame is divided into blocks of a predetermined size as shown in FIG. In the present embodiment, the image frame is divided into blocks having the same size of 8 × 16 dots as the symbol data. According to this, at the time of template matching, matching can be performed immediately without performing processing for matching the size of each part (divided image) of the line image data divided into blocks and the symbol data. Matching can be performed. Note that, when the image data is compressed to a total dot number of 80 × 25 × 128 or less or less, the fraction generated in S41 and S42 for dividing the image frame is rounded up to 80 × 25 or more or 80 Divided into blocks of × 25 or less.
そして、変数iおよび変数jにそれぞれ「0」をセットした後(S43)、S44〜S51の処理により、分割された線画像データを、各ブロック毎に、記号データに変換する処理を実行する。この記号データに変換する処理は、画像フレーム内の各ブロックの行毎に、上段から下段に向かって実行される。画像フレーム内の各位置は、横方向をX、縦方向をYとする座標(Xi,Yj)で指定される。 Then, after each variable i and variable j are set to “0” (S43), the process of converting the divided line image data into symbol data is executed for each block by the processes of S44 to S51. The process of converting to symbol data is executed from the upper level to the lower level for each row of each block in the image frame. Each position in the image frame is specified by coordinates (Xi, Yj) in which the horizontal direction is X and the vertical direction is Y.
具体的には、S44の処理により、変数jが縦分割数n未満であるか(j<n)否かを調べる(S44)。ここで、変数jが縦分割数n未満でなければ(S44:No)、変数jが縦分割数nに到達したことが示されており、記号データへの変換が分割されたブロックの最下段まで完了したと判断して、このアスキー変換処理(S28)を終了する。 Specifically, it is checked whether or not the variable j is less than the vertical division number n (j <n) by the process of S44 (S44). Here, if the variable j is not less than the vertical division number n (S44: No), it is indicated that the variable j has reached the vertical division number n, and the lowest level of the block into which the conversion to the symbol data is divided is shown. This ASCII conversion process (S28) is terminated.
一方、変数jが縦分割数n未満であれば(S44:Yes)、記号データへの変換が未完了であるので、変数iが横分割数m未満であるか(i<m)であるか否かを調べる(S45)。変数iが横分割数m未満であれば(S45:Yes)、横方向Xの1行の変換が未完了であるので、変換する1の領域(ブロック)の座標を求める(S46)。変換する1のブロックの横方向Xの座標は、変数iに記号データの横サイズZ1に乗ずること(i×Z1→Xi)によって求められ、縦方向Yの座標は、変数jに記号データの横サイズZ2に乗じて(j×Z2→Yi)求められる。例えば、開始時には、変数i=変数j=0であるので、座標(X0,Y0)は、(0,0)となる。その次の変換対象のブロックの座標(X1,Y0)は、(X0,Y0)よりもそのブロックの大きさ分横方向Xにシフトした位置である。つまり、次に変換される1の領域(ブロック)のX座標(X1)は、(i×Z1→Xi)に従って、変数i=1を記号データの横サイズZ1に乗じて求められる。同様に、次の段に移動した場合の座標(X0,Y1)は、そのY座標が、(j×Z2→Yi)に従って、変数j=1を記号データの縦サイズZ2に乗じて求められる。 On the other hand, if the variable j is less than the vertical division number n (S44: Yes), conversion to the symbol data is incomplete, so whether the variable i is less than the horizontal division number m (i <m). Whether or not is checked (S45). If the variable i is less than the horizontal division number m (S45: Yes), since the conversion of one row in the horizontal direction X is incomplete, the coordinates of one area (block) to be converted are obtained (S46). The coordinate in the horizontal direction X of one block to be converted is obtained by multiplying the variable i by the horizontal size Z1 of the symbol data (i × Z1 → Xi), and the coordinate in the vertical direction Y is the horizontal value of the symbol data in the variable j. It is obtained by multiplying the size Z2 (j × Z2 → Yi). For example, since variable i = variable j = 0 at the start, the coordinates (X0, Y0) are (0, 0). The coordinates (X1, Y0) of the next block to be converted are positions shifted in the horizontal direction X by the size of the block from (X0, Y0). That is, the X coordinate (X1) of one region (block) to be converted next is obtained by multiplying the variable i = 1 by the horizontal size Z1 of the symbol data according to (i × Z1 → Xi). Similarly, the coordinates (X0, Y1) when moving to the next stage are obtained by multiplying the variable j = 1 by the vertical size Z2 of the symbol data according to the Y coordinate (j × Z2 → Yi).
そして、求められた座標(Xi,Yj)と、座標(Xi+Z1,Yj+Z2)とを対角線とする領域(1のブロックの指定)に分割された線画像データの各部(分割画像)に最も近似する1の記号データを、記号データメモリ14bに記憶される記号データの中からテンプレートマッチングにより検出する(S47)。続いて、その検出された記号データを座標に対応付けてアスキー画像バッファ13bに書込み(S48)、その後、変数iに1を加算して(i+1→i)(S49)、その処理をS45の処理に移行する。これにより、1の行に属するブロックについて変換が終わるまで、S45〜S49の処理が繰り返される。
Then, 1 that most closely approximates each part (divided image) of the line image data divided into a region (designation of one block) having the obtained coordinates (Xi, Yj) and coordinates (Xi + Z1, Yj + Z2) as diagonal lines. The symbol data is detected from the symbol data stored in the
また、S45の処理で確認した結果、変数iが横分割数m未満でなければ(S45:No)、変数iが横分割数mに到達したことが示されており、横方向Xの1の行について、各ブロックの線画像データの記号データへの変換が完了したと判断して、アスキー画像バッファに改行コードを書き込んだ後(S50)、変数jに1を加算する(j+1→j)と共に、変数iに「0」をセットして(S51)、その処理をS44の処理に移行する。これにより、次の段へと変換対象位置が移動する。そして、上記したように、S44の処理にて、線画像データの記号データへの変換が終了した(S44:No)と判断されるまで、S44〜S51の処理が繰り返される。これにより、図3(c)に示すように、線画像データが、分割されたブロックごとに記号データへと変換されたアスキー画像が形成される。 As a result of checking in the process of S45, if the variable i is not less than the horizontal division number m (S45: No), it is indicated that the variable i has reached the horizontal division number m. After determining that the conversion of the line image data of each block into the symbol data has been completed for the row and writing the line feed code to the ASCII image buffer (S50), 1 is added to the variable j (j + 1 → j) and Then, “0” is set to the variable i (S51), and the process proceeds to S44. As a result, the conversion target position moves to the next stage. Then, as described above, the processes of S44 to S51 are repeated until it is determined in the process of S44 that the conversion of the line image data into the symbol data has been completed (S44: No). As a result, as shown in FIG. 3C, an ASCII image is formed by converting the line image data into symbol data for each divided block.
尚、本実施の形態では、線画像データに変換後(S27)に、アスキー変換処理(S28)において、画像フレームの分割(S41,S42)を行ったが、画像フレームの分割(S41,S42)後に、線画像データへの変換(S27)を行っても良い。 In this embodiment, the image frame is divided (S41, S42) in the ASCII conversion process (S28) after being converted into line image data (S27). However, the image frame is divided (S41, S42). Later, conversion to line image data (S27) may be performed.
このように、本実施の形態のカラオケ装置1によれば、楽曲データの再生中におけるCRTディスプレイ2での演出を、アスキー画像での演出にて実行することができ、楽曲毎に予め定められた映像を出力する演出とは異なる新鮮な興趣を提供することができる。また、歌唱者の動きがアスキー画像に反映されるため、歌唱者がコミカルな挙動などを歌唱と共に行えば、余興として高い娯楽性を実現することができる。
As described above, according to the
尚、楽曲に応じて予め定められた映像の出力と、アスキー画像の出力とを切り替えるスイッチを設けると共に、かかるスイッチの状態を所定時間毎に監視する監視手段を設け、その監視手段により検出されるスイッチの状態に応じて、出力する画像を切り替えるように構成しても良い。これによれば、使用者が任意のタイミングにおいて、映像の出力と、アスキー画像の出力とを切り替えることができる。 In addition, a switch that switches between a predetermined video output and an ASCII image output according to the music is provided, and a monitoring unit that monitors the state of the switch every predetermined time is provided, and is detected by the monitoring unit. You may comprise so that the image to output may be switched according to the state of a switch. According to this, the user can switch between video output and ASCII image output at any timing.
更に、カラオケ装置1は、カラオケ装置1に設けられたCCDカメラ3から入力される画像データをアスキー画像に変換して、CRTディスプレイ2に出力するように構成され、また、マイクロフォン23から入力された音声データをカラオケ装置1のスピーカ24から出力するように構成された。これに代えて、アスキー画像に変換する画像データの入力および変換されたアスキー画像の出力を、カラオケ装置1以外の外部装置にて実行するように構成しても良い。かかる外部装置は、カラオケ装置1とは別体で設けられ、且つ、カラオケ装置1と通信可能に形成されるデバイスであり、撮像装置(および表示装置)を備えた携帯電話や、PDA(Personal Digital Assistance)、パーソナルコンピュータ
に加え、上記の電子早見本30にCCDカメラ3を搭載したもの等が例示される。また、マイクロフォン23およびスピーカ24に代えて、上記した外部装置に設けられたマイクロフォンやスピーカを利用して音声データの入出力を行うように構成しても良い。
Further, the
これによれば、各個人がそれぞれ所有する携帯電話等から画像データと音声データとを入力することにより、入力された画像データに基づくアスキー画像と音声データとを、カラオケ装置1を介して、他の携帯電話等の外部装置に出力することができる。このため、画像データや音声データの入出力デバイスの自由度を向上させることができ、特定の者にのみアスキー画像を閲覧させたいという要望や、携帯可能なデバイスでアスキー画像を手元で閲覧したいという要望等、多種多様な利用者の嗜好に応じることができる。
According to this, by inputting image data and sound data from a mobile phone or the like owned by each individual, the ASCII image and sound data based on the input image data can be transferred via the
次に、図7から図11を参照して、本発明の第2の実施形態について説明する。第1の実施形態では、画像処理装置はカラオケ装置1にて構成された。これに代えて、第2の実施形態では、画像処理装置はインターネットプロトコル(Internet Protocol)を用いた
電話装置(以下単に「IP電話装置」と称す)にて構成され、画像処理部を有する送信側装置と、表示装置を有する受信側装置とを備えている。尚、上記した第1の実施形態と同じ部分には同じ符号を付し、その説明を省略する。
Next, a second embodiment of the present invention will be described with reference to FIGS. In the first embodiment, the image processing apparatus is configured by the
図7は、第2の実施形態の画像処理装置であるIP電話装置200を備えた電話システム220を示した概略図である。各IP電話装置200(200a,200b,200c)は、いずれもデータを送信する送信側装置であり且つデータを受信する相手側装置でもある。従って、各IP電話装置200は、それぞれ、画像処理部と表示装置との両者を備えている。また、図7に示すように、IP電話装置200a,200bは、コンピュータ本体とそのコンピュータ本体へ各種データやコマンドなどを入力するためのキーボードと、コンピュータ本体で実行される処理をモニターするためのCRTディスプレイ112とを備えたパーソナルコンピュータ(以下単に「PC」と略す)である。IP電話装置200cは受話器と送話器とを備えた電話機である。尚、テレビ電話装置200以外にIPパケット網に接続される他の電話装置は、図示を省略している。
FIG. 7 is a schematic diagram showing a
各IP電話装置200a,200b,200cは、IPネットワーク網に接続され、かかるIPネットワーク網を介して、相互に音声データや画像データ等のデータのパケット通信を行う装置であり、音声データおよび画像データのパケット処理機能やIP電話固有のプロトコル処理機能を備えIPアダプタとして機能する通信制御部120(図8参照)を内蔵している。また、各IP電話装置200a,200b,200cは、音声とともに画像を相手側装置との間で送受信するテレビ電話機能を有しており、送話者の画像を撮像するためのCCDカメラ116と、受信した画像データを再生表示するための表示装置(例えばCRTディスプレイ112等)とを備えている。
Each of the
送信側装置であるIP電話装置200(例えばIP電話装置200aとする)は、送話者の要求(指定)に応じて、CCDカメラ116の入力画像をアスキー画像に変換し、変換されたアスキー画像に対応するコードを音声データと共に相手側装置のIP電話装置200b,200cに送出するように構成されている。送出されるデータは、IPアダプタにより、所定の長さに区切られてデータブロック化され、1のデータブロックが1のパケットに入れられて相手側装置へと送出される。
The IP telephone device 200 (for example, the
一方、相手側装置であるIP電話装置200(例えばIP電話装置200aを送信側装置とした場合のIP電話装置200b,200c)は、受信したパケットの遅延時間調整と、パケットの順序調整を行った後、パケットからデータを取り出すようになっており、受信したデータにアスキー画像に対応するコードが含まれていると、アスキー画像を再生して自己の表示装置(例えばCRTディスプレイ112等)に出力するように構成されている。
On the other hand, IP telephone apparatus 200 (for example,
各IP電話装置200a,200b,200cは、ADSL(Asymmetric
Degital Subscriber Line)をアクセス回線として、IPネットワーク網に接続されている。IPネットワーク網は、非図示のゲートキーパによって呼制御が行われる通信業者が専用に構築したネットワーク回線であり、回線経路に設置されたルータによって相手側装置まで、各パケットを送信するものである。更に、IPネットワーク網は、非図示のVoIPゲートウェイを介して既存の電話網と相互に接続されており、一般の電話とも相互に通信可能に構成されている。
Each of the
(Degital Subscriber Line) is connected to the IP network as an access line. The IP network is a network line that is exclusively constructed by a communication company whose call control is performed by a gatekeeper (not shown), and transmits each packet to a partner apparatus by a router installed in the line route. Furthermore, the IP network is connected to an existing telephone network via a VoIP gateway (not shown), and is configured to be able to communicate with a general telephone.
尚、アクセス回線は、通常の一般公衆回線や、ISDN回線、ケーブルテレビのインターネット接続回線などであってもよい。また、IPネットワーク網は、一般のインターネットのIPパケット網を使用しても良い。 The access line may be a normal general public line, an ISDN line, a cable TV internet connection line, or the like. The IP network may be a general Internet IP packet network.
図8は、上記のように構成された電話システム220のIP電話装置200の電気的構成を示すブロック図である。尚、IP電話装置200bは、IP電話装置200aと同様に構成されているのでその説明を省略し、IP電話装置200cについては、IP電話装置200aと異なる部分のみ説明する。
FIG. 8 is a block diagram showing an electrical configuration of the
IP電話装置200aは、PCに電話機能を実現する各デバイスが搭載されたものであり、CPU101、ROM102、RAM103、画像用RAM105、音声用RAM106を備えている。演算装置であるCPU101は、ROM102に記憶される制御プログラムや、後述するハードディスク104に記憶される制御プログラム104aにより、IP電話装置200aを制御するものである。ROM102は、CPU101により実行される各種のプログラムや固定値などを記憶した不揮発性のメモリである。RAM103は、CPU101による各種プログラムの実行に際して、各種のデータ等を一時的に記憶するためのメモリであり、背景画像メモリ103aと、アスキー画像バッファ103bと、アスキーアートフラグ103cとを備えている。
The
背景画像メモリ103aおよびアスキー画像バッファ103bは、第1の実施形態のカラオケ装置1(制御部5のRAM13)に設けられた背景画像メモリ13aおよびアスキー画像バッファ13bと同様のメモリである。背景画像メモリ103aには、背景画像としてCCDカメラ3により撮像(取得)された画像データが記憶され、アスキー画像バッファ103bには、アスキー変換処理(S28、図6参照)において、形成されたアスキー画像が一時的に記憶される。
The background image memory 103a and the ASCII image buffer 103b are the same memories as the
アスキーアートフラグ103cは、相手側装置に送出する画像データをCCDカメラ116で撮像された画像とするか、アスキー画像とするかを識別するためのフラグである。このアスキーアートフラグ103cは、後述する電話処理(図9参照)を実行する入力画面(電話処理のメイン画面)において、アスキー画像指定コマンドが入力されるとオンされ、その後に回線が開放されるとオフされる。
The
画像用RAM105および音声用RAM106は、DRAMまたはSDRAMなどで構成された大容量のRAMであり、画像用RAM105は、第1の実施形態の画像用RAM27と同様に、背景画像撮影後にCCDカメラ116にて取得された画像データを一時的に記憶するものである。また、音声用RAM106は音声データを一時的に記憶するものであり、マイクロフォン115を介して入力された音声データ(送話者の発声)は、音声用CODEC109により符号化された後、この音声用RAM106に記憶される。
The
図8に示すように、CPU101、ROM102、RAM103、画像用RAM105、音声用RAM106はバスライン107を介して互いに接続されており、バスライン107はまた入出力ポート108にも接続されている。この入出力ポート108は、バスライン107の他に、ハードディスク104、音声用CODEC109、画像用CODEC110、CRTディスプレイ112、キーボード113、スピーカ114、マイクロフォン115、CCDカメラ116、通信制御部120と接続されている。
As shown in FIG. 8, the
ハードディスク104は、書換可能な大容量の不揮発性のメモリであり、本IP電話装置200aを制御する制御プログラム104aと、記号データメモリ104bとを備えている。尚、図9〜図11に示したフローチャートのプログラムは、制御プログラム104aの一部として格納されている。記号データメモリ104bは、第1の実施形態のカラオケ装置1(制御部5のハードディスク14)に設けられた記号データメモリ14bと同様のメモリであり、記号の画像データが記憶されている。
The
音声用CODEC109および画像用CODEC110は、音声データと画像データとを、それぞれ、符号化および復号化する電子回路(ハードウェア)である。音声用CODEC109は、アナログデータで入力される音声データ(送話者の発声)を、所定のサンプリング周期で取得して、量子化、符号化することにより、デジタルデータに変換する処理(符号化)を行う回路である。符号化された音声データは、音声用RAM106に書き込まれる。通信制御部120にて受信された相手側装置からの音声データは、この音声用CODEC109にて復号化(伸張)された後、スピーカ114から出力される。
The
画像用CODEC110は、CCDカメラ116から入力され、画像用RAM105に記憶された画像データを、相手側装置に送信するデータ形式に圧縮符号化するものである。また、通信制御部120にて受信された相手側装置からの画像データは、この画像用CODEC110にて復号化(伸張)された後、CRTディスプレイ112から出力される。
The
尚、IP電話装置200aでは、符号化された音声データに対し、更に、帯域圧縮符号化が行われている。この音声データの帯域圧縮符号化には、離散コサイン変換(DCT)が適用されている。離散コサイン変換は、画像を小さなブロックに分割して周波数成分係数を量子化および符号化して圧縮する一般的な方式である。従って、相手側装置からの音声データを受信した場合には、まず、離散コサイン変換の逆変換(IDCT)処理を行ってから、音声用CODEC109にてアナログデータに復号化して再生出力する。
In
通信制御部120は、IP電話装置200aが他のIP電話装置200b,200c(または他の電話装置)との間で、IPネットワーク網を介したパケット通信を実行するための装置であり、モデム121、信号分離部123、信号多重部124、バッファ125を備えている。
The
モデム121は、ADSLモデムであり、IP電話装置200aから送出するデータ(信号)をADSL回線に適応したADSL信号に変換すると共に、IP電話装置200aにて受信したADSL信号をIP電話装置200a内で処理する適切な信号(例えばイーサネット(登録商標)の信号)に変換する信号変換機である。また、モデム121は、通信相手を呼び出すためにダイヤル信号を送出し、回線を制御するNCUの機能を備えている。
The modem 121 is an ADSL modem, converts data (signal) transmitted from the
信号分離部123は、IP電話装置200b,200c等の相手側装置から受信したデータについて、画像データと音声データとに分離する装置である。後述するように、本電話システム220においてアスキー画像データは、音声データとして相手側装置から送出されているので、この信号分離部123においては分離されない。信号多重部124は、送信バッファ125aに記憶される音声データ及び画像データを時間軸方向に、画像フレームと音声データとを多重化する装置であり、多重化されたデータは、モデム121を介して送出される。
The
バッファ125は、一時的にデータを記憶しておくメモリであり、送出するデータを一時的に記憶するための送信バッファ125aと、受信したデータを一時的に記憶するための受信バッファ125bとを備えている。送信バッファ125aには、後述する電話処理(図9参照)にて圧縮符号化された音声データ及び画像データが記憶されている。記憶される音声データ及び画像データは、所定のタイミングでこの送信バッファ125aから読み出されて、信号多重部124に出力される。受信バッファ125bには、信号分離部123により分離された画像データと音声データとが、それぞれフレーム単位で記憶されている。受信バッファ125bにデータが記憶されていることがCPU101により認識されると、受信バッファ125bに記憶されるデータは、この受信バッファ125bから読み出され、復号化と再生出力とが実行される。
The
このように、IP電話装置200aは、通信制御部120を介し(ADSL回線を経て)、IPネットワーク網に接続されており、IPネットワーク網を経由して他のIP電話装置200b,200cなどと相互に接続されている。これにより、IP電話装置200aと他のIP電話装置200b,200c(または他の電話装置)との間で、音声データ及び画像データを送受信するテレビ電話を実行することができるようになっている。
As described above, the
尚、IP電話装置200cは、電話機であるので、マイクフォン115として送話器が、スピーカ114としては受話器が機能し、CRTディスプレイ112の代わりにLCDが設けられると共に、アスキー画像指定コマンドを入力するコマンド入力ボタンを備えている。
Since
次に、図9から図11を参照して、上記のように構成されたIP電話装置200にて実行される各処理について説明する。
Next, with reference to FIGS. 9 to 11, each process executed by the
図9は、上記のIP電話装置200(200a,200b)にて実行される電話処理を示したフローチャートである。IP電話装置200a,200bはPCであるので、電話処理は、キーボード113操作により、開始を要求する所定のコマンドが入力されると開始され、まず、電話処理のメイン画面をCRTディスプレイ2に表示する(S101)。その後、相手側装置の電話番号が指定されたか否かを確認し(S102)、相手側装置の電話番号が指定されていなければ(S102:No)、その指定を待機する。尚、S102の処理においては、所定時間の経過が監視されており、所定時間が到来しても相手側装置の電話番号が指定されていない場合には、その処理をS114の各処理に移行する。
FIG. 9 is a flowchart showing telephone processing executed by the IP telephone apparatus 200 (200a, 200b). Since the
一方、相手側装置の電話番号が指定されていれば(S102:Yes)、アスキー画像指定コマンドが入力されたか否かを確認する(S103)。アスキー画像指定コマンドは、相手側装置に送信する画像データをアスキー画像とすることを指示するコマンドであり、メイン画面の表示に従って所定のキー操作を行うことにより入力される。 On the other hand, if the telephone number of the counterpart device is designated (S102: Yes), it is confirmed whether an ASCII image designation command has been input (S103). The ASCII image designation command is a command for instructing the image data to be transmitted to the counterpart device to be an ASCII image, and is input by performing a predetermined key operation according to the display on the main screen.
ここで、アスキー画像指定コマンドが入力されていなければ(S103:No)、S104の処理をスキップしてその処理をS105の処理に移行する。一方、アスキー画像指定コマンドが入力されていると(S103:Yes)、アスキーアートフラグ103cをオンし(S104)、その後、相手側装置を発呼する(S105)。S105の処理により発呼要求がIPネットワーク網に設置されたゲートキーパに送信され、ゲートキーパの動作によって、発呼側装置であるIP電話装置200aと相手側装置との間の通話状態が確立される。
If no ASCII image designation command is input (S103: No), the process of S104 is skipped and the process proceeds to S105. On the other hand, if an ASCII image designation command is input (S103: Yes), the
その後、アスキーアートフラグ103cがオンであるか否かを確認し(S106)、アスキーアートフラグ103cがオンであれば(S106:Yes)、アスキーアート処理を実行して(S107)、CCDカメラ116から取り込んだ画像データをアスキー画像データに変換する。アスキーアート処理(S107)は、図5に示した第1の実施形態のアスキーアート処理(S10)同様の処理である。尚、第1の実施形態においては、アスキー変換処理(S28)のS47の処理により、アスキー画像バッファ13bには、テンプレートマッチングにより検出された記号データ(画像データ)が書き込まれるように構成したが、第2の実施形態では、アスキー変換処理(S28)のS47の処理において、テンプレートマッチングにより検出された記号データに対応する記号コードが、アスキー画像バッファ13bに書き込まれるものとする。
Thereafter, it is confirmed whether or not the
また、S106の処理とS107の処理との間には、背景画像をCCDカメラ116にて撮像し、撮像された背景画像の画像データを背景画像データメモリ103aに書き込む非図示のステップが設けられている。かかるステップは、回線閉結後の初回のアスキーアートフラグ103cの状態確認(S106)直後に実行され、それ以降は、非実行とされる。
Further, a step (not shown) is provided between the process of S106 and the process of S107, in which a background image is captured by the
その後、相手側装置から受信した画像データが受信バッファ125bに記憶されているか否かを確認すると共に、画像データが受信バッファ125bに記憶されていると、その画像データをCRTディスプレイ112に再生出力する画像出力処理を実行する(S108)。この画像出力処理により出力される画像データは、メイン画面の一部にマルチウィンドウを開いて表示される。尚、受信バッファ125bに記憶される画像データは、上記したように画像用CODEC110にて復号化されてCRTディスプレイ112に出力される。
Thereafter, it is confirmed whether or not the image data received from the counterpart device is stored in the reception buffer 125b. When the image data is stored in the reception buffer 125b, the image data is reproduced and output to the
画像出力処理(S108)の後は、マイクロフォン115から入力された音声データを相手側装置に送信するための音声送出処理を実行した後(S109)、相手側装置から受信した音声データを、スピーカ114から再生出力する音声出力処理を実行する(S110)。その後、通話が終了したか否かを確認し、通話終了であれば(S111:Yes)、相手側装置との通話状態を解消し(通話終了をゲートキーパに通知する)(S112)、アスキーアートフラグ103aをオフする(S113)。続いて、各処理を実行して(S114)、受信した画像データを画像出力するためのマルチウィンドウ表示を終了する処理を行うと共に、電話処理を終了する終了コマンドや他のコマンド(例えば電話番号の登録処理の実行コマンドなど)の入力や、新たな電話番号の指定を待機する。そして、この各処理(S114)において、終了コマンドの入力が認識されると、メイン画面を終了してこの電話処理を終了する。また、その他のコマンドが入力された場合には、入力されたコマンドの内容に応じた処理を実行する。新たな電話番号の指定が認識された場合には、その処理をS103の処理に移行する。
After the image output process (S108), after executing the voice transmission process for transmitting the voice data input from the
更に、S106の処理で確認した結果、アスキーアートフラグ103cがオフであれば(S106:No)、CCDカメラ116から入力された画像データ(映像)を相手側装置に送出する通常の画像送出処理を実行する(S115)。背景画像の撮影後にCCDカメラ116から入力された画像データは、画像用RAM105に画像フレーム単位で記憶されている。この画像送出処理(S115)では、画像用RAM105に記憶される画像データを、入力順に従って画像用CODEC110に出力する。画像用RAM105から1の画像フレームの出力が終了すると、この画像送出処理(S115)を終了し、その処理をS108の処理に移行する。画像用CODEC110に出力された画像データは、圧縮符号化された後、通信制御部120に出力される。
Further, if the
また、S111の処理で確認した結果、通話終了でなければ(S111:No)、その処理をS106の処理に移行し、通話終了が認識される(S111:Yes)まで、S106の処理〜S111の処理、または、S106,S115、S108〜S111の処理を繰り返し、通話状態を維持する。 If the result of confirmation in S111 is not the end of the call (S111: No), the process proceeds to S106, and the process from S106 to S111 is performed until the end of the call is recognized (S111: Yes). The process or the processes of S106, S115, and S108 to S111 are repeated to maintain the call state.
尚、IP電話装置200cにおいても、上記と同様の電話処理が実行されるが、S101の処理は省略され、発呼と着呼とを交互に検出する待機状態となっている。そして、オフフック状態が検出されると、発呼要求と判断して、S102の処理が実行されることとなる。また、アスキー画像指定コマンドは、そのコマンド入力ボタンを操作することにより入力される。
In the
図10は、図9の電話処理の中で実行される音声送出処理(S109)のフローチャートである。この音声送出処理(S109)は、上記したようにマイクロフォン115から入力された音声データ(送話者の発声)を、相手側装置に送出する処理である。マイクロフォン115から入力された音声データは、音声用CODEC109によりデジタルデータに変換され音声用RAM106に記憶されている。そして、この音声用RAM106に記憶される音声データをDCT処理(離散コサイン変換処理)した後(S121)、そのDCT処理された音声データについて最可聴限界以下の成分を除去する(S122)。
FIG. 10 is a flowchart of the voice transmission process (S109) executed in the telephone process of FIG. This voice sending process (S109) is a process for sending the voice data (speaker's voice) input from the
最可聴限界とは、通常の人間の聴力で聴きとることのできる限界の音声であり、周波数帯域と音量のレベルとにより決定される。例えば、20ヘルツ〜5キロヘルツは、小さな音でも良く聞こえる周波数帯域であり、これよりも高い周波数や低い周波数になればなるほど可聴困難な領域となる。また、同じ周波数帯域であっても、音量レベルが低いと、可聴困難となる。最可聴限界以下とは、周波数帯域および音量レベルの因子により、通常、人間の聴力で聴きとることのできない音声の領域である。 The most audible limit is a limit sound that can be heard with normal human hearing, and is determined by a frequency band and a volume level. For example, 20 Hz to 5 kHz is a frequency band in which even a small sound can be heard well, and the higher the frequency or the lower the frequency, the more difficult it is to hear. Even in the same frequency band, if the volume level is low, it becomes difficult to hear. Below the maximum audible limit is a region of sound that cannot be heard by human hearing normally due to factors of frequency band and volume level.
従って、S122の処理により、最可聴限界以下の成分であるか否かは、DCT処理された音声データの各成分の周波数帯域と音量レベルとにより判別される。尚、周波数帯域毎に定められた音量レベルが最可聴限界を示す閾値としてハードディスク104の所定のエリアに記憶されている。
Therefore, whether or not the component is below the maximum audible limit is determined by the processing of S122 based on the frequency band and volume level of each component of the audio data subjected to DCT processing. The volume level determined for each frequency band is stored in a predetermined area of the
次に、アスキーアートフラグ103aがオンであるか否かを確認し(S123)、オフであれば(123:No)、S124,S125の処理をスキップして、その処理をS126の処理に移行する。オンであれば(S123:Yes)、アスキー画像バッファ103bに記憶される記号コード(8ビットのデータ、2進数のデータ)を、除去した最可聴限界以下の成分として、音声データに付加する(S124)。つまり、除去された音声データの成分の周波数帯域に、記号データを、その周波数帯域に対応して予め定められた音量レベル以下となる大きさで組み込む(限界周波数成分のデータ信号に変換する)。 Next, it is confirmed whether or not the ASCII art flag 103a is on (S123). If it is off (123: No), the processes of S124 and S125 are skipped, and the process proceeds to the process of S126. If it is on (S123: Yes), the symbol code (8-bit data, binary data) stored in the ASCII image buffer 103b is added to the audio data as a component below the maximum audible limit (S124). ). That is, the symbol data is incorporated into the frequency band of the removed audio data component in a magnitude that is equal to or lower than a predetermined volume level corresponding to the frequency band (converted to a data signal of a limit frequency component).
これにより、記号データを、音声データの可聴限界以下の成分として、音声データに重畳(保有)させることができ、記号データが音声データ中に含まれていても、再生する音声の品質に大きな影響を与えることはない。従って、かかる記号コードの部分を除去せずに音声データを再生出力しても、付加された記号コードによる耳障りなノイズや可聴不能とする音声品質の低下が発生することはない。故に、相手側装置が、汎用の電話装置であっても、通話に支障を来すことはない。 As a result, the symbol data can be superimposed (held) on the audio data as a component below the audible limit of the audio data, and even if the symbol data is included in the audio data, the quality of the reproduced audio is greatly affected. Never give. Therefore, even if the audio data is reproduced and output without removing such a symbol code portion, the added symbol code does not cause annoying noise or voice quality deterioration that makes it inaudible. Therefore, even if the counterpart device is a general-purpose telephone device, it does not hinder the call.
尚、相手側装置が、最可聴限界以下の成分を音声として出力しないとする(再生しない周波数帯(非再生領域)が予め設けられている)ものであれば、相手側装置において、最可聴限界以下の成分として保有される記号データは、音声データとしては出力されない。かかる場合の、音声データの最可聴限界以下の成分を除去するS122の処理が、請求項8記載の第1除去手段に該当する。尚、再生しない周波数帯(非再生領域)は、最可聴限界以下の成分の領域に限られるものではなく、所定の周波数帯域に設定されていても良い。 If the counterpart device does not output a component below the maximum audible limit as a sound (a frequency band that is not reproduced (non-reproduction area) is provided in advance), the maximum audible limit is established in the counterpart device. Symbol data held as the following components is not output as audio data. In this case, the process of S122 for removing the component below the maximum audible limit of the audio data corresponds to the first removing means according to claim 8. The frequency band that is not reproduced (non-reproduction area) is not limited to the area of components below the maximum audible limit, and may be set to a predetermined frequency band.
また、アスキー画像バッファ103bには、分割されたブロックの位置(座標)に従って、順に記号コードが記憶されており、S124の処理では、アスキー画像バッファ103bから、その記憶された順(アドレスの順)に従って記号コードを読み出し、その読み出した順に音声データに付加する。このため、受信した音声データから順次、最可聴限界以下の成分を取り出せば、記号コードの配列を元画像の座標に従ったものとでき、かかる記号コードの配列から元のアスキー画像を再生出力することができる。 The ASCII image buffer 103b stores symbol codes in order according to the position (coordinates) of the divided blocks. In the process of S124, the stored order (address order) from the ASCII image buffer 103b. The symbol codes are read according to the above and added to the audio data in the read order. For this reason, if components below the maximum audible limit are sequentially extracted from the received audio data, the symbol code arrangement can be made in accordance with the coordinates of the original image, and the original ASCII image is reproduced and output from the symbol code arrangement. be able to.
また、第2の実施形態においては、音声用CODEC109にてサンプリングされた1サンプリング単位の音声データからDCT処理により変換した1単位の音声データに、1の記号コードを付加するものとする。尚、1単位の音声データに付加する記号コードは2以上の複数の記号コードであってもよく、1単位の音声データにいくつの記号コードを付加するかは、伝送速度や画像品質を加味して、適宜、設定されるものとする。
In the second embodiment, it is assumed that one symbol code is added to one unit of audio data converted by DCT processing from one sampling unit of audio data sampled by the
S124の処理の後は、音声データにアスキー画像を形成する記号コードが含まれていることを示すアスキー保有コードを、音声データに付加して(S125)、そのアスキー保有コードの付加された音声データを通信制御部120に出力し(S126)、この音声送出処理(S109)を終了する。 After the process of S124, an ASCII possession code indicating that the symbol data for forming the ASCII image is included in the speech data is added to the speech data (S125), and the speech data to which the ASCII possession code is added. Is output to the communication control unit 120 (S126), and the voice transmission process (S109) is terminated.
通信制御部120では、音声送出処理(S109)により入力された音声データを時間軸方向に区切ってパケット化する共に、相手側装置の識別子などと共にアスキー保有コードがパケットのヘッダデータとして付加される。そしてパケット化されたデータを所定の伝送方式で回線へ出力する。これにより、アスキー画像は、音声データの態様で相手側装置に送出されることとなる。
In the
尚、アスキー画像の出力でない場合など、画像送出処理(S115)により、画像用CODEC110を介して通信制御部120に送出された画像データが、送信バッファ125aに記憶されていると、その画像データと対応する音声データとが信号多重部124により多重化された後、パケット化されて、回線に出力される。
When the image data sent to the
図11は、図9の電話処理の中で実行される音声出力処理(S110)のフローチャートである。この音声出力処理(S110)では、まず、通信制御部120の受信バッファ125bに、音声データが記憶されているか否かを確認し(S131)、記憶されていなければ(S131:No)、この音声出力処理(S110)を終了する。一方、受信バッファ125bに音声データが記憶されていると(S131:Yes)、受信バッファ125bに記憶されている音声データを読み出し、読み出した音声データにアスキー保有コードが付加されているか否かを確認する(S132)。アスキー保有コードが付加されていた場合には(S132:Yes)、その音声データに最可聴限界以下の周波数成分として具有される2進数の値を、受信した音声データの順に従って、順次、RAM103の所定領域に書き込む(S133)。尚、受信バッファ125bに記憶されている音声データは、最可聴限界以下の周波数成分の2進数の値をRAM103の所定領域に書き込んだ後、受信バッファ125bから消去される。その後、RAM103の所定領域に書き込まれた2進数を8ビット毎に読み取り、ハードディスク14の記号データメモリ14bを参照して、読み取った8ビットの記号コードを記号データに変換する(S134)。そして、変換された記号データを、CRTディスプレイ112に表示される電話処理のメイン画面の所定領域(所定のウィンドウ)に出力する(S135)。尚、IP電話機200cにおいては、このS135の処理により、アスキー画像データがLCDに出力される。
FIG. 11 is a flowchart of the voice output process (S110) executed in the telephone process of FIG. In this audio output process (S110), first, it is confirmed whether or not audio data is stored in the reception buffer 125b of the communication control unit 120 (S131). If not stored (S131: No), this audio is processed. The output process (S110) ends. On the other hand, when the audio data is stored in the reception buffer 125b (S131: Yes), the audio data stored in the reception buffer 125b is read, and it is confirmed whether or not the ASCII holding code is added to the read audio data. (S132). When the ASCII possession code is added (S132: Yes), the binary value included in the sound data as a frequency component below the maximum audible limit is sequentially stored in the
その後、受信バッファ125bに記憶される音声データにIDCT処理(離散コサイン逆変換処理)を行ってから(S136)、IDCT処理された音声データを、音声用CODEC109に出力して(S137)、この音声出力処理(S110)を終了する。音声用CODEC109に出力された音声データは、復号化によりアナログデータに変換されて、スピーカ114から再生出力される。
Thereafter, the audio data stored in the reception buffer 125b is subjected to IDCT processing (inverse discrete cosine transform processing) (S136), and the audio data subjected to IDCT processing is output to the audio CODEC 109 (S137). The output process (S110) ends. The audio data output to the
一方、S132の処理で確認した結果、アスキー保有コードが付加されていなければ(S132:No)、音声データには、アスキー画像を形成するデータ(記号コード)が含まれていないと判断し、S133〜S135の処理をスキップして、その処理をS136の処理に移行する。 On the other hand, if the ASCII possession code is not added as a result of the confirmation in the process of S132 (S132: No), it is determined that the data (symbol code) forming the ASCII image is not included in the audio data, and S133. The process of S135 is skipped and the process proceeds to S136.
パケット内の各音声データから、アスキー画像を形成する記号コードが含まれているか否かを判断する場合には、最可聴限界以下の成分の2進数のデータが「0」が、記号コードが含まれていないが故であるのか、画像データの無地部分であるが故であるかの判別が困難になる。場合によっては、1の画像フレームに対応する全パケットについて、データの読み取りを終了するまで、その判別ができず、アスキー画像形成の処理速度を低下させがねない。しかし、第2の実施形態においては、アスキー画像を形成する記号コードを含む音声データであることは、アスキー保有コードにて示されるので、音声データに記号コードが含まれているか否かを容易に判定でき、アスキー画像形成をスムーズに実行することができる。 When it is determined from each audio data in the packet whether or not a symbol code forming an ASCII image is included, the binary data of the component below the maximum audible limit is “0” and the symbol code is included. It is difficult to determine whether this is because it is not, or because it is a plain part of the image data. In some cases, all packets corresponding to one image frame cannot be discriminated until data reading is completed, and the processing speed of ASCII image formation may be reduced. However, in the second embodiment, since the voice data including the symbol code forming the ASCII image is indicated by the ASCII possessed code, it is easily determined whether or not the symbol data is included in the voice data. As a result, ASCII image formation can be executed smoothly.
このように、第2の実施形態によれば、音声と画像とを相手側装置に出力するIP電話装置200において、相手側装置に送出する画像をアスキー画像とすることができる。このため、実際の映像を出力するテレビ電話とは異なる趣を持った画像によるコミュニケーションをはかることができる。また、実際の映像をそのまま相手側装置に送出したくない場合などにおいては、送話者側のプライバシーを守りつつ、元の映像に基づいた高度なコミュニケーションを行うことができる。また、アスキー画像は、記号の組み合わせにより描画されるものであるので、画像形成機能のない装置やプログラムであっても、文字記号を表示する機能を備えていれば、アスキー画像を現出させて演出を実行することができる。
As described above, according to the second embodiment, in the
尚、第2の実施形態においては、送信側装置となるIP電話装置200は、アスキー画像指定コマンドが入力された場合に実際の映像に代えてアスキー画像を相手側装置に送出したが、実際の映像と共にアスキー画像を相手側装置に送出するように構成しても良い。アスキー画像と実際の映像(CCDカメラ116から入力された画像データ)とを共に相手側装置に送出することにより送信側装置から送出する画像データの量が増加しても、アスキー画像は音声データとして送出されるので、画像データを送出する処理(画像データ送出処理)が煩雑になることはない。
In the second embodiment, the
また、送信側装置となるIP電話装置200を、上記のように、実際の映像と共にアスキー画像を送出するように構成した場合において、相手側装置となるIP電話装置200に、実際の映像の出力とアスキー画像の出力とを切り替えるスイッチと、かかるスイッチの状態を割り込み処理にて監視する監視手段とを設け、その監視手段により検出されるスイッチの状態に応じて、受信した映像とアスキー画像との一方を出力するように構成しても良い。
In addition, when the
以上、上記各実施の形態に基づき本発明を説明したが、本発明は、上記各実施の形態に何ら限定されるものでなく、本発明の趣旨を逸脱しない範囲内で種々の改良変形が可能であることは容易に推察できるものである。 Although the present invention has been described based on the above embodiments, the present invention is not limited to the above embodiments, and various improvements and modifications can be made without departing from the spirit of the present invention. It can be easily guessed.
例えば、上記各実施の形態では、アスキー変換処理(S28)において、画像フレームは、記号の大きさと同じ大きさのブロックに分割したが、記号の大きさブロックの大きさとは、テンプレートマッチングの際に整合されていればよく、マッチングする際に一方の画像を拡大または縮小しても良い。このため、分割されるブロックの大きさは、必ずしも記号の大きさと整合させる必要はない。 For example, in each of the above embodiments, in the ASCII conversion process (S28), the image frame is divided into blocks having the same size as the symbol size. The symbol size block size is the same as that in template matching. As long as they are matched, one image may be enlarged or reduced when matching. For this reason, the size of the block to be divided does not necessarily match the size of the symbol.
また、分割するブロック数は、80×25に限られるものでなく、更に、そのブロック数を可変値とし、使用者が操作パネルからその値を入力することにより任意に設定できるようにしてもよい。使用者によりブロック数が設定された場合には、S41およびS42の処理において、その設定されたブロック数となるように横分割数mと、縦分割数nが設定される。これにより、使用者の意向を反映したアスキー画像を作成でき、表現の自由度を向上させて娯楽性を向上させると共に、使用者が自己の操作によって所望の変形を施すことができるので、作成されるアスキー画像に対し、使用者に高い満足度を付与し得る。 Further, the number of blocks to be divided is not limited to 80 × 25. Further, the number of blocks may be a variable value, and may be arbitrarily set by the user inputting the value from the operation panel. . When the number of blocks is set by the user, the horizontal division number m and the vertical division number n are set so that the set number of blocks is obtained in the processing of S41 and S42. As a result, an ASCII image reflecting the user's intention can be created, and the degree of freedom of expression is improved and the entertainment is improved, and the user can perform desired deformation by his / her own operation. A high degree of satisfaction can be given to the user with respect to the ASCII image.
更に、上記各実施の形態では、背景画像は、アスキー画像による1の演出が開始される毎に行うように構成されたが、背景画像の取得(背景画像メモリ13a,103aに記憶される背景画像の画像データの更新)は、必ずしも、アスキー画像による演出が実行される毎に行われる必要はない。例えば、操作者により要求された場合にのみ背景画像を撮像し、背景画像が取得された場合に限って、背景画像メモリ13a,103aに記憶される背景画像の画像データを、新たに取得した背景画像の画像データにより更新するようにしても良い。
Further, in each of the above-described embodiments, the background image is configured to be performed every time an effect of the ASCII image is started. However, the background image is acquired (the background image stored in the
また、上記各実施の形態においては、各画像フレームのそれぞれをアスキー画像に変換したが、取得された全画像データ(画像フレーム)から、所定間隔で画像フレームをサンプリングし、サンプリングされた画像フレームについてのみアスキー画像を形成して、他の画像フレームについては廃棄するように構成しても良い。また、サンプリングする所定間隔については、使用者が任意に設定できるようにしても良い。これによれば、効率的にアスキー画像を形成してその形成処理の速度全体を高速化できる上、コマ送り表示として再生されるアスキー画像の動画の娯楽性を高めることができる。 In each of the above embodiments, each of the image frames is converted to an ASCII image. However, image frames are sampled at predetermined intervals from all acquired image data (image frames), and the sampled image frames are sampled. Only the ASCII image may be formed and the other image frames may be discarded. In addition, the user may arbitrarily set the predetermined interval for sampling. According to this, it is possible to efficiently form an ASCII image and increase the overall speed of the forming process, and it is possible to improve the entertainment of the moving image of the ASCII image reproduced as a frame advance display.
更に、アスキーアート処理(S28,S107)においては、人物画像の面積が画像フレーム全体の半分未満である場合に、人物画像の面積が画像フレーム全体の半分となるように1段階で画像の拡大を行った。これに代えて、1回で拡大される拡大率を固定倍率とし、段階的に元の人物画像を拡大するように構成しても良い。これによれば、操作者所望の倍率に人物画像を拡大することができる。 Further, in the ASCII art process (S28, S107), when the area of the person image is less than half of the entire image frame, the image is enlarged in one step so that the area of the person image becomes half of the entire image frame. It was. Instead of this, it may be configured to enlarge the original person image in a stepwise manner with an enlargement ratio that is enlarged once as a fixed magnification. According to this, the person image can be enlarged to a magnification desired by the operator.
加えて、上記各実施の形態では、画像フレームを分割した場合に、その画像フレーム内における人物画像の面積が所定の面積未満であると、人物画像データの拡大を行ったが、人物画像の面積が所定の面積以上(人物画像データを有するブロック数が所定数以上)である場合については、人物画像データの圧縮を実行しても良い。これによれば、表示画面に対して、人物画像が大きすぎるために視認性が悪化することを、回避できる。尚、かかる場合の人物画像データの圧縮を実行する処理が、請求項5記載の画像データ圧縮手段に該当する。
In addition, in each of the above embodiments, when the image frame is divided, the human image data is enlarged if the area of the human image in the image frame is less than the predetermined area. Is greater than or equal to a predetermined area (the number of blocks having person image data is greater than or equal to a predetermined number), the person image data may be compressed. According to this, it is possible to avoid deterioration in visibility due to the person image being too large with respect to the display screen. In this case, the process for executing the compression of the human image data corresponds to the image data compression means according to
更に、上記各実施の形態では、画像データを入力する画像データ入力手段として、リアルタイムで画像データを取得するCCDカメラを採用したが、入力される画像データはリアルタイムで取得されたものに限られるものでなく、予め画像データが記憶された記憶媒体とその記憶媒体に記憶される画像データを読み取る読み取り手段とにより画像データを入力する画像データ入力手段を構成しても良い。 Furthermore, in each of the above-described embodiments, a CCD camera that acquires image data in real time is adopted as the image data input means for inputting image data. However, the input image data is limited to that acquired in real time. Alternatively, the image data input means for inputting the image data may be configured by a storage medium in which image data is stored in advance and a reading means for reading the image data stored in the storage medium.
1 カラオケ装置(画像処理装置)
1a 本体(画像処理部)
2 CRTディスプレイ(表示装置)
3,116 CCDカメラ(画像データ入力手段、撮像装置)
13a,103a 背景画像メモリ(背景画像記憶手段)
14b,104b 記号データメモリ(記号データ記憶手段)
14c 楽曲データメモリ(伴奏情報記憶手段)
14d 歌詞データメモリ(歌詞データ記憶手段)
21,115 伴奏装置(伴奏発生手段)
23 マイクロフォン(音声データ入力手段)
24 スピーカ(発音手段)
109 音声用CODEC(データ変換手段の一部、音声再生手段の一部)
120 通信制御部(出力手段、データ変換手段の一部、音声データ受信手段)
200 IP電話装置、相手側装置、送信側装置
S15 出力手段の一部
S23,S24 固有画像データ抽出手段、固有画像データ抽出ステップ
S25,S29〜S31 画像データ伸張手段、画像データ伸張ステップ
S25 判断手段、判断ステップ
S27 線画変換手段、線画変換ステップ
S41,S42 分割手段、分割ステップ
S47 抽出手段、抽出ステップ
S48 画像形成手段の一部、画像形成ステップ
S121,S122 データ変換手段の一部
S122 第2除去手段
S124 重畳手段
S132,S137 音声再生手段の一部
S134,S135 画像データ再生手段の一部
S10 アスキーアート処理(加工手段の一部、画像処理プログラム)
1 Karaoke device (image processing device)
1a Body (image processing unit)
2 CRT display (display device)
3,116 CCD camera (image data input means, imaging device)
13a, 103a Background image memory (background image storage means)
14b, 104b Symbol data memory (symbol data storage means)
14c Music data memory (accompaniment information storage means)
14d Lyric data memory (lyric data storage means)
21,115 Accompaniment device (accompaniment generating means)
23 Microphone (voice data input means)
24 Speaker (pronunciation means)
109 CODEC for voice (part of data conversion means, part of voice playback means)
120 Communication control unit (output means, part of data conversion means, voice data receiving means)
200 IP telephone apparatus, counterpart apparatus, transmission apparatus S15 part of output means S23, S24 unique image data extraction means, unique image data extraction steps S25, S29-S31 image data expansion means, image data expansion step S25 determination means, Determination step S27 Line drawing conversion means, line drawing conversion steps S41, S42 division means, division step S47 extraction means, extraction step S48 part of image formation means, image formation steps S121, S122 part of data conversion means S122 second removal means S124 Superimposing means S132, S137 Part of sound reproducing means S134, S135 Part of image data reproducing means S10 ASCII art processing (part of processing means, image processing program)
Claims (10)
前記画像処理部は、複数の記号の画像データが記憶された記号データ記憶手段を備えており、前記画像処理部の加工手段は、前記画像データ入力手段にて入力された画像データを線画像データに変換する線画変換手段と、前記画像データ入力手段にて入力された画像データの画像フレーム又は前記線画変換手段により変換された線画像データを有する画像フレームを所定数のブロックに分割する分割手段と、その分割手段により分割されたブロック単位で、前記線画像データの態様に応じて割当てられている記号を前記記号データ記憶手段に記憶される記号の画像データの中から抽出する抽出手段と、その抽出手段により抽出された記号の画像データで、対応するブロックの前記線画像データを置換した置換画像データを形成する画像形成手段とを備えており、前記画像処理部の出力手段は、前記置換画像データにて形成された置換画像データを出力するものであり、
前記表示装置にて前記置換画像データの動画表示を行い、
前記画像処理部は、前記画像データ入力手段として撮影により画像データを取得する撮像装置を備えており、更に、その撮像装置により背景画像として取得された背景画像データを記憶する背景画像記憶手段を備えると共に、
前記画像処理部の加工手段は、前記撮像装置により取得された画像データから前記背景画像記憶手段に記憶される背景画像データとの共通部分を除いて、前記画像フレーム毎に固有の固有画像データを抽出する固有画像データ抽出手段を備え、
前記画像処理部の線画変換手段は、その固有画像データ抽出手段により抽出された固有画像データを線画像データに変換するものであり、
前記画像処理部の画像形成手段は、その固有画像データから変換された線画像データによって置換画像データを形成するものであり、
前記画像処理部の加工手段は、前記分割手段により前記画像フレームを分割した場合に、その画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数が予め定めた下限値以下であると、前記画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数を増加させる方向に、前記線画像データまたは前記固有画像データを伸張する画像データ伸張手段を備えており、
前記画像処理部の画像形成手段は、その画像データ伸張手段により前記線画像データまたは固有画像データが伸張された場合には、伸張後の画像データに基づいて置換画像データを形成するものであることを特徴とする画像処理装置。 Image data input means for inputting image data having a plurality of image frames and capable of appearing continuous images, processing means for processing the image data input by the image data input means for each image frame, and An image processing unit including an output unit that outputs image data by sequentially outputting image frames processed by the processing unit according to the input order; and the image frames output by the output unit of the image processing unit in order In an image processing apparatus comprising a display device for displaying and displaying the image data as a moving image,
The image processing unit includes a symbol data storage unit that stores image data of a plurality of symbols, and the processing unit of the image processing unit converts the image data input by the image data input unit into line image data A line drawing conversion means for converting the image data into a predetermined number of blocks; and an image frame of the image data input by the image data input means or an image frame having line image data converted by the line drawing conversion means Extraction means for extracting, in block units divided by the dividing means, symbols assigned according to the mode of the line image data from the symbol image data stored in the symbol data storage means; An image forming method for forming replacement image data by replacing the line image data of the corresponding block with the image data of the symbol extracted by the extraction means Includes bets, output means of the image processing unit, and outputs a replacement image data formed by the replacement image data,
It performs video display of the replacement image data at the display device,
The image processing unit includes an imaging device that acquires image data by photographing as the image data input unit, and further includes a background image storage unit that stores background image data acquired as a background image by the imaging device. With
The processing means of the image processing unit removes unique image data unique to each image frame by excluding a common part with the background image data stored in the background image storage means from the image data acquired by the imaging device. A unique image data extracting means for extracting,
The line drawing conversion means of the image processing unit converts the unique image data extracted by the unique image data extraction means into line image data,
The image forming unit of the image processing unit forms replacement image data by line image data converted from the unique image data,
When the image processing unit of the image processing unit divides the image frame, the number of blocks having the line image data or the unique image data in the image frame is equal to or less than a predetermined lower limit value. An image data expansion means for expanding the line image data or the unique image data in a direction to increase the number of blocks having the line image data or the unique image data in the image frame;
The image forming unit of the image processing unit forms replacement image data based on the decompressed image data when the line image data or unique image data is decompressed by the image data decompressing unit. An image processing apparatus.
その判断手段により、前記固有画像データが占める割合が所定の割合以下であると判断された場合に、前記固有画像データを有するブロック数が予め定めた下限値以下であるとして、前記固有画像データの伸張を行うものであることを特徴とする請求項1記載の画像処理装置。 The image data decompression unit includes a determination unit that determines whether or not a ratio of the unique image data extracted by the unique image data extraction unit to a source image frame is equal to or less than a predetermined ratio. And
When the determining means determines that the ratio occupied by the unique image data is equal to or less than a predetermined ratio, the number of blocks having the unique image data is determined to be equal to or less than a predetermined lower limit value. The image processing apparatus according to claim 1 , wherein the image processing apparatus performs expansion.
前記画像処理部の画像形成手段は、その画像データ圧縮手段により前記画像データが圧縮された場合には、圧縮後の画像データに基づいて置換画像データを形成するものであることを特徴とする請求項1又は2に記載の画像処理装置。 When the image processing unit of the image processing unit divides the image frame, the number of blocks having the line image data or the unique image data in the image frame is greater than or equal to a predetermined upper limit value. Image data compression means for compressing the line image data or the unique image data and reducing the number of blocks having the line image data or the unique image data in the image frame;
The image forming unit of the image processing unit forms replacement image data based on the compressed image data when the image data is compressed by the image data compression unit. Item 3. The image processing apparatus according to Item 1 or 2 .
その伴奏情報記憶手段に記憶される伴奏情報に基づいて伴奏を発生する伴奏発生手段と、
音声データを入力する音声データ入力手段と、
その音声データ入力手段により入力された音声データと、伴奏発生手段にて発生された伴奏とを発音する発音手段と、
各伴奏情報に対応し、且つ、前記発音手段により発音される伴奏に合わせて前記表示装置に表示される歌詞データを記憶する歌詞データ記憶手段とを備えており、
その歌詞データ記憶手段に記憶される歌詞データと共に、前記出力手段により出力された前記置換画像データを前記表示装置に表示するものであることを特徴とする請求項1から3のいずれかに記載の画像処理装置。 Accompaniment information storage means for storing accompaniment information;
Accompaniment generating means for generating accompaniment based on the accompaniment information stored in the accompaniment information storage means;
Voice data input means for inputting voice data;
A sounding means for sounding the sound data input by the sound data input means and the accompaniment generated by the accompaniment generating means;
Lyric data storage means corresponding to each accompaniment information and storing lyric data displayed on the display device in accordance with the accompaniment sounded by the sounding means,
With the lyrics data stored in the lyrics data memory means, according to any one of claims 1 to 3, characterized in that the replacement image data output by said output means is for displaying on said display device Image processing device.
前記画像処理部の出力手段は、その重畳手段により重畳されたデータ信号を前記回線に出力して前記相手側装置に置換画像データを出力するものであることを特徴とする請求項1から4のいずれかに記載の画像処理装置。 5. An audio data input unit that includes the image processing unit according to any one of claims 1 to 4 and is connected to a counterpart device via a line, and that inputs audio data; and an audio that is input by the audio data input unit Data conversion means for converting data into a data signal to be output to the line, and an identification code corresponding to replacement image data formed by the image forming means of the image processing section is converted into a data signal of audio data to convert the data A transmitting side device having superimposing means for superimposing on the data signal converted by the means,
Said output means of the image processing unit of claims 1 to 4, characterized in that in which the data signal superimposed by the superimposing means and outputting to said line and outputs the replacement image data to the partner apparatus The image processing apparatus according to any one of the above.
前記重畳手段は、前記置換画像データの識別コードを、前記第1除去手段により除去された非再生周波数成分の帯域のデータ信号に変換して前記データ変換手段により変換されたデータ信号に重畳するものであることを特徴とする請求項5記載の画像処理装置。 The transmission side device includes first removal means for removing a non-reproduction frequency component set as a non-reproduction area for the audio data input by the audio data input means,
The superimposing unit converts the identification code of the replacement image data into a data signal of a band of the non-reproducing frequency component removed by the first removing unit and superimposes it on the data signal converted by the data converting unit The image processing apparatus according to claim 5, wherein:
前記重畳手段は、前記置換画像データの識別コードを、前記第2除去手段により除去された限界周波数成分のデータ信号に変換して前記データ変換手段により変換されたデータ信号に重畳するものであることを特徴とする請求項5または6に記載の画像処理装置。 The transmission side device includes second removal means for removing a limit frequency component exceeding an audible limit for the voice data input by the voice data input means,
The superimposing means converts the identification code of the replacement image data into a data signal of a limit frequency component removed by the second removing means and superimposes it on the data signal converted by the data converting means. The image processing apparatus according to claim 5 or 6 .
前記コンピュータは、複数の記号の画像データが記憶された記号データ記憶手段を備えており、
前記画像処理ステップの加工ステップは、前記画像データ入力手段にて入力された画像データを線画像データに変換する線画変換ステップと、前記画像データ入力手段にて入力された画像データの画像フレーム又は前記線画変換ステップにより変換された線画像データを有する画像フレームを所定数のブロックに分割する分割ステップと、その分割ステップにより分割されたブロック単位で、前記線画像データの態様に応じて割当てられている記号を前記記号データ記憶手段に記憶される記号の画像データの中から抽出する抽出ステップと、その抽出ステップにより抽出された記号の画像データで、対応するブロックの前記線画像データを置換した置換画像データを形成する画像形成ステップとを前記コンピュータに実行させ、前記画像処理ステップの出力ステップは、前記置換画像データにて形成された置換画像データを出力するものであり、
前記表示装置にて前記置換画像データの動画表示を行い、
前記コンピュータは、前記画像データ入力手段として撮影により画像データを取得する撮像装置を備えており、更に、その撮像装置により背景画像として取得された背景画像データを記憶する背景画像記憶手段を備え、
前記画像処理ステップの加工ステップは、前記撮像装置により取得された画像データから前記背景画像記憶手段に記憶される背景画像データとの共通部分を除いて、前記画像フレーム毎に固有の固有画像データを抽出する固有画像データ抽出ステップを前記コンピュータに実行させ、
前記画像処理ステップの線画変換ステップは、その固有画像データ抽出ステップにより抽出された固有画像データを線画像データに変換するものであり、
前記画像処理ステップの画像形成ステップは、その固有画像データから変換された線画像データによって置換画像データを形成するものであり、
前記画像処理ステップの加工ステップは、前記分割ステップにより前記画像フレームを分割した場合に、その画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数が予め定めた下限値以下であると、前記画像フレーム内において前記線画像データまたは前記固有画像データを有するブロック数を増加させる方向に、前記線画像データまたは前記固有画像データを伸張する画像データ伸張ステップをコンピュータに実行させ、
前記画像処理ステップの画像形成ステップは、その画像データ伸張ステップにより前記線画像データまたは固有画像データが伸張された場合には、伸張後の画像データに基づいて置換画像データを形成するものであることを特徴とする画像処理プログラム。 Processing for processing image data input by the image data input means for each image frame in a computer having image data input means for inputting image data having a plurality of image frames and capable of appearing continuous images An image processing step comprising: a step, and an output step for outputting image data by sequentially outputting the image frame processed by the processing step according to the input order; In the image processing program for displaying the image frames in order and displaying the image data as a moving image on the display device of the computer ,
The computer includes symbol data storage means in which image data of a plurality of symbols is stored,
The processing step of the image processing step includes a line drawing conversion step of converting the image data input by the image data input means into line image data, and an image frame of the image data input by the image data input means or the A division step for dividing an image frame having line image data converted by the line drawing conversion step into a predetermined number of blocks, and a block unit divided by the division step , are allocated according to the mode of the line image data . An extraction step for extracting the symbol from the symbol image data stored in the symbol data storage means, and a replacement image obtained by replacing the line image data of the corresponding block with the symbol image data extracted by the extraction step and an image forming step of forming a data is executed on the computer, the image processing Output step of step is for outputting the replacement image data formed by the replacement image data,
The moving image of the replacement image data is displayed on the display device,
The computer includes an imaging device that acquires image data by photographing as the image data input unit, and further includes a background image storage unit that stores background image data acquired as a background image by the imaging device,
In the processing step of the image processing step, unique image data unique to each image frame is removed from the image data acquired by the imaging device except for a common portion with the background image data stored in the background image storage unit. Causing the computer to execute a unique image data extraction step to extract,
The line drawing conversion step of the image processing step converts the unique image data extracted by the unique image data extraction step into line image data,
The image forming step of the image processing step is to form replacement image data by line image data converted from the unique image data,
In the processing step of the image processing step, when the image frame is divided by the dividing step, the number of blocks having the line image data or the unique image data in the image frame is equal to or less than a predetermined lower limit value. , Causing the computer to execute an image data expansion step of expanding the line image data or the unique image data in a direction to increase the number of blocks having the line image data or the unique image data in the image frame,
In the image forming step of the image processing step, when the line image data or unique image data is expanded by the image data expansion step, replacement image data is formed based on the expanded image data. An image processing program characterized by the above.
その判断ステップにより、前記固有画像データが占める割合が所定の割合以下であると判断された場合に、前記固有画像データを有するブロック数が予め定めた下限値以下であるとして、前記固有画像データの伸張を行うものであることを特徴とする請求項9記載の画像処理プログラム。
The image data decompression step includes a determination step of determining whether a ratio of the unique image data extracted by the unique image data extraction step to a source image frame is equal to or less than a predetermined ratio. Let the computer run,
In the determination step, when it is determined that the ratio occupied by the unique image data is equal to or less than a predetermined ratio, the number of blocks having the unique image data is determined to be equal to or less than a predetermined lower limit value. claim 9, wherein the image processing program, characterized in that performs a decompression.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005031796A JP4504216B2 (en) | 2005-02-08 | 2005-02-08 | Image processing apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005031796A JP4504216B2 (en) | 2005-02-08 | 2005-02-08 | Image processing apparatus and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006221253A JP2006221253A (en) | 2006-08-24 |
JP4504216B2 true JP4504216B2 (en) | 2010-07-14 |
Family
ID=36983569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005031796A Expired - Fee Related JP4504216B2 (en) | 2005-02-08 | 2005-02-08 | Image processing apparatus and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4504216B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011078377A1 (en) * | 2009-12-25 | 2011-06-30 | 楽天株式会社 | Image generation device, image generation method, image generation program, and recording medium |
JP5498341B2 (en) * | 2010-09-30 | 2014-05-21 | 株式会社エクシング | Karaoke system |
JP2013229761A (en) * | 2012-04-25 | 2013-11-07 | Sharp Corp | Output device, display device, display system, program, and computer-readable recording medium |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108805A (en) * | 1991-10-17 | 1993-04-30 | Nippondenso Co Ltd | Fingerprint collating device |
JPH05166006A (en) * | 1991-12-17 | 1993-07-02 | Nec Corp | Character normalizing device |
JPH09160575A (en) * | 1995-12-08 | 1997-06-20 | Yamaha Corp | Karaoke display device |
JP2000035843A (en) * | 1998-07-17 | 2000-02-02 | Matsushita Electric Ind Co Ltd | Hypertext display device and system |
JP2002133421A (en) * | 2000-10-18 | 2002-05-10 | Fujitsu Ltd | Moving body recognition method and device |
JP2002288627A (en) * | 2001-03-27 | 2002-10-04 | Minolta Co Ltd | Image processing program and image processing device |
-
2005
- 2005-02-08 JP JP2005031796A patent/JP4504216B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108805A (en) * | 1991-10-17 | 1993-04-30 | Nippondenso Co Ltd | Fingerprint collating device |
JPH05166006A (en) * | 1991-12-17 | 1993-07-02 | Nec Corp | Character normalizing device |
JPH09160575A (en) * | 1995-12-08 | 1997-06-20 | Yamaha Corp | Karaoke display device |
JP2000035843A (en) * | 1998-07-17 | 2000-02-02 | Matsushita Electric Ind Co Ltd | Hypertext display device and system |
JP2002133421A (en) * | 2000-10-18 | 2002-05-10 | Fujitsu Ltd | Moving body recognition method and device |
JP2002288627A (en) * | 2001-03-27 | 2002-10-04 | Minolta Co Ltd | Image processing program and image processing device |
Also Published As
Publication number | Publication date |
---|---|
JP2006221253A (en) | 2006-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100735444B1 (en) | Method for outputting audio data and music image | |
JP5225847B2 (en) | Information processing terminal, music information generation method, and program | |
KR100614276B1 (en) | Interactive Broadcasting System | |
JP2008085421A (en) | Video telephone, calling method, program, voice quality conversion-image editing service providing system, and server | |
JP4504216B2 (en) | Image processing apparatus and image processing program | |
JP2005286966A (en) | Information processing device and information processing system | |
JP4471640B2 (en) | Music player | |
JP5498341B2 (en) | Karaoke system | |
JP5283433B2 (en) | Digital still camera, image processing method and program | |
JP4296976B2 (en) | Communication terminal device | |
JP2006084515A (en) | Music play-back apparatus | |
KR100365862B1 (en) | Method for performing music function in portabl mobile wireless terminal | |
JP4171687B2 (en) | Music player | |
KR20080032751A (en) | Method of creating moving pictures and method of offering contents in portable terminal | |
JP2002300434A (en) | Program transmission system and device thereof | |
KR102307639B1 (en) | Hand Phone Band Screen accompaniment Service System | |
JP2009157746A (en) | Speech processing system, terminal device, server device, speech processing method and program | |
WO2023243375A1 (en) | Information terminal, information processing method, program, and information processing device | |
JP2002024143A (en) | Receiving terminal, communication terminal and animation character display method | |
JP3589702B2 (en) | Communication terminal device | |
JPH1115486A (en) | Music reproducing device | |
JP2017078731A (en) | Moving image processing system, moving image processing program and portable terminal | |
JP2003195863A (en) | Information generating device, portable telephone set, and information generating method | |
JP2006039705A (en) | Content creation device, content creation method, and content creation system | |
KR101023301B1 (en) | Method for sending and editing mp3 file in wireless terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100125 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100407 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4504216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140430 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |