JP2008210382A - Music data processor - Google Patents
Music data processor Download PDFInfo
- Publication number
- JP2008210382A JP2008210382A JP2008032848A JP2008032848A JP2008210382A JP 2008210382 A JP2008210382 A JP 2008210382A JP 2008032848 A JP2008032848 A JP 2008032848A JP 2008032848 A JP2008032848 A JP 2008032848A JP 2008210382 A JP2008210382 A JP 2008210382A
- Authority
- JP
- Japan
- Prior art keywords
- music
- character
- acoustic signal
- feature amount
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
Description
本発明は、利用者に対し、楽曲検索再生時、あるいは楽曲データ操作時に視覚的で直感的な楽曲内容の把握を可能にする楽曲データ処理装置に関する。 The present invention relates to a music data processing apparatus that enables a user to grasp music contents visually and intuitively during music search reproduction and music data operation.
MDプレーヤや、DVDプレーヤ、あるいはハードディスクに大量の音楽が格納されているような楽曲データベースから、利用者が好みの楽曲を検索する場合、楽曲の曲名や歌手名などをキーワードとして検索したり、曲名や歌手名などのテキスト情報の一覧が表示されたリストの中から、利用者が自分の好みに合うと思う楽曲を選択する場合が多い。しかし、上記のように、曲名や歌手名などのテキスト情報からだけでは、その楽曲が、例えばテンポの速い曲であるか遅い曲であるかや、激しい曲か穏やかな曲かなどの楽曲自体の内容を知るのは困難である。曲名や歌手名以外により多くのテキスト情報を書誌情報として準備すれば、選択時の助けにはなるが、書誌情報を準備したり、登録するには、別途作業が必要になる。CDDBなどの楽曲の書誌情報を蓄積したデータベースを利用するソフトウエアなどの場合では、書誌情報の自動挿入による操作性・利便性の改善が試みられているが、テキスト情報だけでは楽曲の内容を把握し理解するのに時間がかかり、楽曲の内容を直感的にイメージしにくい。 When a user searches for a favorite song from an MD player, a DVD player, or a song database in which a large amount of music is stored on the hard disk, the song title or singer name is searched as a keyword, In many cases, the user selects a song that he / she finds fits his / her preference from a list in which a list of text information such as a singer name is displayed. However, as described above, only from text information such as the song name and singer name, the song itself is, for example, a song with a fast tempo, a song with a slow tempo, an intense song, or a gentle song. It is difficult to know the contents. If more text information than bibliographic information is prepared as bibliographic information, it will help at the time of selection, but separate work is required to prepare and register bibliographic information. In the case of software that uses a database that stores the bibliographic information of music such as CDDB, attempts have been made to improve operability and convenience by automatically inserting bibliographic information. It takes time to understand and understand the contents of the music intuitively.
これに対し、その楽曲に対応付けて、楽曲自体の内容あるいは雰囲気を表現する静止画を表示できれば、テキスト情報に加えて静止画のイメージ情報をもとにより楽曲の内容を把握しやすくなるので、利用者にとって求める楽曲を分類したり検索したりするのが容易になる。しかし、現状では楽曲の内容に合った静止画を用意するのが煩雑であり、かつ内容を表現する複数の代表的な静止画を用意しても、それを楽曲に適切に対応させることが難しい。 On the other hand, if it is possible to display a still image that expresses the content or atmosphere of the song itself in association with the song, it becomes easier to grasp the content of the song based on the image information of the still image in addition to the text information. It becomes easy for the user to classify and search for the desired music. However, at present, it is cumbersome to prepare a still image that matches the content of the music, and even if multiple representative still images that express the content are prepared, it is difficult to properly correspond to the music .
また、現在では楽曲を再生する際、キャラクタなどを表示する技術がある。しかし、それらは楽曲内容に関係なくランダムに表示するものであったり、楽曲の曲名や歌詞など楽曲情報をキーワードとして表示するものだったりする。前者の方法では、楽曲の内容を把握することは不可能であり、後者の方法では、楽曲情報を登録する作業が別途必要となり時間もかかる。 Currently, there is a technique for displaying a character or the like when playing a music piece. However, they may be displayed randomly regardless of the music content, or may display music information such as the song title and lyrics as keywords. In the former method, it is impossible to grasp the contents of the music, and in the latter method, a work for registering music information is separately required and takes time.
本発明は、楽曲の音響信号の内容に基づいて、その楽曲に適合する静止画を付与する手段を提案することにより、多くの楽曲データの中から利用者の希望する楽曲を容易に検索あるいは選択することを可能にする手段を提供することを目的としてなされたものである。また、楽曲の音響信号の内容に基づいて、その楽曲に適合するキャラクタを動作させる手段を提案することにより、楽曲再生時に、利用者が楽曲内容を聴覚だけではなく視覚的に把握することを可能にする手段を提供することを目的としてなされたものである。 The present invention proposes a means for assigning a still image suitable for a song based on the contents of the acoustic signal of the song, thereby easily searching for or selecting a song desired by the user from a lot of song data. It has been made for the purpose of providing a means for making it possible. In addition, by suggesting a means to operate a character that matches the music based on the contents of the acoustic signal of the music, it is possible for the user to visually grasp the music contents as well as the hearing during music playback. It was made for the purpose of providing a means to make.
請求項1記載の楽曲データ処理装置は、楽曲の音響信号を入力する音響信号入力手段と、音響信号からあらかじめ定めた特徴量を抽出する特徴量抽出手段と、特徴量をもとに楽曲の特徴を表現する2次元または3次元キャラクタの形状及びまたはキャラクタの動作を選択するキャラクタ付与手段と、特徴量とキャラクタの形状及びまたはキャラクタの動作を関連付けて保管するキャラクタ保管手段とを備えることを特徴とする。
The music data processing device according to
請求項2記載の楽曲データ処理装置は、楽曲の音響信号を、ある周期ごとに入力する音響信号入力手段と、音響信号からあらかじめ定めた特徴量を抽出する特徴量抽出手段と、特徴量の変化に連動して2次元または3次元キャラクタの形状及びまたは動作を選択するキャラクタ付与手段と、特徴量とキャラクタの形状及びまたはキャラクタの動作を関連付けて保管するキャラクタ保管手段とを備えることを特徴とする。
The music data processing apparatus according to
請求項3記載の発明は、請求項1または請求項2記載の楽曲データ処理装置において、特徴量抽出が、楽曲登録時または楽曲再生時に抽出することを特徴とする。 According to a third aspect of the present invention, in the music data processing apparatus according to the first or second aspect, the feature amount is extracted at the time of music registration or music reproduction.
請求項4記載の発明は、請求項3記載の楽曲データ処理装置において、楽曲再生時に抽出することを特徴とする特徴量抽出が、楽曲の再生と同時に並行して行う、あるいは楽曲の再生の前にあらかじめ抽出しておくことを特徴とする。 According to a fourth aspect of the present invention, in the music data processing apparatus according to the third aspect, the feature amount extraction is performed at the time of music playback, or is performed in parallel with music playback or before music playback. It is characterized by extracting in advance.
請求項5記載の発明は、請求項1または請求項2に記載の楽曲データ処理装置において、特徴量抽出手段が、楽曲の全体、楽曲の一部分及び、楽曲の複数の部分に対し、任意の組み合わせからなる領域から楽曲の音響信号の特徴量を抽出することを特徴とする。 According to a fifth aspect of the present invention, in the music data processing apparatus according to the first or second aspect, the feature amount extraction unit is an arbitrary combination of the whole music, a part of the music, and a plurality of parts of the music The feature quantity of the acoustic signal of a music is extracted from the area | region which consists of.
請求項6記載の発明は、請求項1または請求項2に記載の楽曲データ処理装置において、音響信号入力手段が、楽曲の圧縮された音響信号を入力することを特徴とする。 According to a sixth aspect of the present invention, in the music data processing apparatus according to the first or second aspect, the acoustic signal input means inputs a compressed acoustic signal of the music.
請求項7記載の発明は、請求項1または請求項2に記載の楽曲データ処理装置において、楽曲と特徴量とキャラクタの形状及びまたはキャラクタの動作を関連付けて管理を行うデータ管理手段をさらに備えることを特徴とする。 A seventh aspect of the present invention is the music data processing apparatus according to the first or second aspect, further comprising data management means for performing management by associating the music, the feature amount, the character shape and / or the character motion. It is characterized by.
請求項8記載の発明は、請求項1または請求項2に記載の楽曲データ処理装置において、キャラクタ保管手段において、キャラクタの形状とキャラクタの動作のうち少なくともどちらか1つを特徴量と関連付けて保管することを特徴とする。 According to an eighth aspect of the present invention, in the music data processing apparatus according to the first or second aspect, the character storage means stores at least one of the character shape and the character action in association with the feature amount. It is characterized by doing.
請求項1に記載の発明により、楽曲の音響信号に対し、あらかじめ定めた特徴量を抽出し、その特徴量を用いて、該当する楽曲を特徴づけるキャラクタを付与することにより、利用者がその楽曲の内容を視覚的に把握することが可能になる。 According to the first aspect of the present invention, a predetermined feature value is extracted from an acoustic signal of a music piece, and a character characterizing the corresponding music piece is assigned using the feature quantity, so that the user can obtain the music piece. It becomes possible to grasp the contents of.
請求項2に記載の発明により、楽曲の音響信号に対し、あらかじめ定めた特徴量を何度か抽出し、その特徴量の変化を用いて、該当する楽曲を特徴づけるキャラクタの形状及びまたはキャラクタの動作を変化させることにより、利用者がその楽曲の内容を視覚的に把握することが可能となる。 According to the second aspect of the present invention, a predetermined feature amount is extracted several times from the sound signal of the music piece, and the shape of the character characterizing the corresponding music piece and / or By changing the operation, the user can visually grasp the contents of the music.
請求項3に記載の発明により、特徴量を抽出するタイミングを、楽曲登録時と楽曲再生時とで選択することが可能となる。 According to the third aspect of the present invention, it is possible to select the timing for extracting the feature amount at the time of music registration and at the time of music playback.
請求項4に記載の発明により、特徴量抽出の精度を上げるために一定の時間を要する場合も、あらかじめ抽出した特徴量を初期値として用いることにより、高い精度での特徴量の利用が可能になる。 According to the fourth aspect of the present invention, even when a certain amount of time is required to improve the accuracy of feature quantity extraction, it is possible to use the feature quantity with high accuracy by using the feature quantity extracted in advance as an initial value. Become.
請求項5に記載の発明により、特徴量抽出の領域を選択可能にすることにより、利用者は楽曲のイントロ部分や、エンディング部分あるいは、好みのフレーズの部分に近い特徴を持つ楽曲を、キャラクタの形状及び動作から容易に知ることが可能となる。 According to the fifth aspect of the present invention, by enabling selection of the feature extraction area, the user can select a song having characteristics close to the intro part, ending part, or favorite phrase part of the character. It can be easily known from the shape and operation.
請求項6に記載の発明により、音楽CDなどで利用されているリニアPCM方式のディジタルオーディオだけでなく、AAC、MP3、WMAその他の圧縮されたオーディオデータに対しても、楽曲の音響信号から抽出される特徴量に応じてキャラクタを対応付けることが可能となる。 According to the invention described in claim 6, not only linear PCM digital audio used in music CDs but also compressed audio data such as AAC, MP3, WMA and the like are extracted from the sound signal of the music. Characters can be associated according to the feature amount.
請求項7に記載の発明により、楽曲の音響信号、特徴量、キャラクタの形状及びまたは動作などのデータが保存・管理されることが可能となる。 According to the seventh aspect of the present invention, it is possible to store and manage data such as music acoustic signals, feature amounts, character shapes and / or actions.
請求項8に記載の発明により、キャラクタの形状と動作のうちどちらか1つを固定することが可能になる。 According to the eighth aspect of the present invention, it becomes possible to fix one of the shape and the motion of the character.
楽曲の一覧表示時に、映像データの一覧をサムネイル表示するように、楽曲に対してもその特徴量をもとに付与したサムネイル用静止画を対応させ表示することによって、利用者が楽曲や楽曲群の内容を視覚的・直感的に把握することが可能になる。 When displaying a list of songs, the thumbnails of the video data are displayed in correspondence with the music so that the list of video data is displayed as thumbnails. It becomes possible to grasp the contents of the contents visually and intuitively.
(実施の形態1)
以下、本発明の実施の形態1について、図面を参照しながら説明する。図1は本発明の実施の形態1における楽曲検索装置の全体構成を示すブロック図である。図1において、11は音響信号入力手段、12は特徴量抽出手段、13はサムネイル付与手段、14はデータ管理手段、15はブラウズ手段、16はブラウズ要件入力手段、17は書誌情報入力手段を表している。
(Embodiment 1)
以上のように構成された楽曲検索装置について、以下、その動作について図1を用いて説明する。本装置は大きく分けて、対象となる楽曲の音響信号及びその付随するデータを登録する楽曲データ登録部111と、登録された楽曲データを管理するデータ管理手段14、及び管理されたデータの中から利用者の所望する楽曲をブラウズする楽曲ブラウズ部112より構成される。
The operation of the music search apparatus configured as described above will be described below with reference to FIG. This apparatus is roughly divided into a music
まず、楽曲データ登録部111について概説する。データ管理手段14は、楽曲ごとにその音響信号及び以下に記述する付随情報を関連させて記録し、検索参照可能とするものである。最初に、音響信号入力手段11は登録対象として入力された楽曲の音響信号をデータ管理手段14に登録すると共に、付随情報生成のため後段の特徴量抽出手段12に出力する。音響信号入力手段11は、入力される音響信号がアナログ信号の場合は、デジタル化した後、後段に出力する。また、圧縮された音響信号の場合は、圧縮データをデータ管理手段14に登録し、圧縮データを伸張した後、伸張データを特徴量抽出手段12に出力する。
First, the music
次に、特徴量抽出手段12は、入力された音響信号から、その音響信号の物理的特徴を表すいくつかの特徴量を抽出し、付随情報としてデータ管理手段14に登録し、後段のサムネイル付与手段13に特徴量を出力する。サムネイル付与手段13は、入力された特徴量からサムネイル用静止画を生成し、付随情報としてデータ管理手段14に登録する。上記手続きと関連して、書誌情報入力手段17は、入力した楽曲名や歌手名及びジャンル名などの書誌情報を、付随情報としてデータ管理手段14に登録する。
Next, the feature
利用者は、ブラウズ要件入力手段16より、歌手名やジャンル名などをキーワードとして入力し、データ管理手段14は、前記キーワードをもとに管理しているデータを検索し、該当する楽曲候補を抽出し、結果をブラウズ手段15に出力する。ブラウズ手段15は、データ管理手段14より入手した結果に対し、該当楽曲に関連付けられたサムネイル用静止画を楽曲名などの書誌情報と共に一覧表示する。一覧表示されたリストの中から、利用者が、サムネイル用静止画や書誌情報から得られる情報をもとに、ブラウズ要件入力手段16を通じて所望する楽曲を選択する。ブラウズ要件入力手段16は、選択された楽曲の音響信号をデータ管理手段14からブラウズ手段15に出力させ、ブラウズ手段15は前記楽曲を再生する。
A user inputs a singer name, a genre name, or the like as a keyword from the browsing requirement input means 16, and the data management means 14 searches data managed based on the keyword and extracts a corresponding music candidate. The result is output to the browsing means 15. In response to the result obtained from the
特徴量抽出手段12で抽出される特徴量として、スペクトル変化度P1(フレーム間のスペクトル変化の度合い)、平均発音数P2(楽曲中で発音される音の発音頻度)、発音非周期性P3(楽曲中で発音される音の非周期性の度合い)、拍周期P4(楽曲の4分音符に相当する時間長)、が挙げられるが、上記4種類の特徴量の他に、拍周期比率P5、拍強度P6、拍強度比P7などのパラメータについても特徴量として利用してもよい。これらの特徴量の算出方法の詳細は、特願2001−082150に記載されている。なお、対象となる楽曲から特徴量を抽出するにあたり、特徴量の抽出範囲は、楽曲の全体、楽曲の一部分及び、
楽曲の複数の部分に対し、任意の組み合わせからなる領域から抽出してよい。
As feature quantities extracted by the feature quantity extraction means 12, the degree of spectrum change P1 (the degree of spectrum change between frames), the average number of pronunciations P2 (the pronunciation frequency of sounds produced in the music), the pronunciation aperiodicity P3 The degree of non-periodicity of the sound generated in the music) and the beat period P4 (the length of time corresponding to a quarter note of the music), but in addition to the above four types of feature quantities, the beat period ratio P5 Parameters such as the beat intensity P6 and the beat intensity ratio P7 may also be used as feature quantities. Details of the calculation method of these feature amounts are described in Japanese Patent Application No. 2001-082150. In extracting the feature value from the target music, the feature value extraction range includes the entire music, a part of the music, and
You may extract from the area | region which consists of arbitrary combinations with respect to several parts of a music.
次に、サムネイル付与手段の動作について説明する。サムネイル付与手段は前段で抽出された特徴量P1からPNのN個の値を入力し、この値をもとに、サムネイル用静止画を生成する。サムネイル用静止画生成の実施例として、2次元あるいは3次元形状静止画の生成、及び色彩静止画の生成を説明する。 Next, the operation of the thumbnail providing unit will be described. The thumbnail assigning unit inputs N values of feature values P1 to PN extracted in the previous stage, and generates a still image for thumbnails based on these values. As an example of thumbnail still image generation, generation of a two-dimensional or three-dimensional shape still image and generation of a color still image will be described.
2次元あるいは3次元形状静止画の生成については、N個の特徴量の中からM個の特徴量をあらかじめ選定しておき、M個の値をもつグラフを生成する。グラフは円グラフや棒グラフとして表示した静止画でもよいし、M次元の値を2次元あるいは3次元の形状に表現した静止画として生成したものでもよい。 For generating a two-dimensional or three-dimensional shape still image, M feature amounts are selected in advance from N feature amounts, and a graph having M values is generated. The graph may be a still image displayed as a pie chart or a bar graph, or may be generated as a still image expressing M-dimensional values in a two-dimensional or three-dimensional shape.
色彩静止画の生成については、N個の特徴量の中からM個の特徴量をあらかじめ選定しておき、M個の値を用いて色空間に変換する。(数1)はあらかじめ定めた前記3つの特徴量をもとに3原色を用いて色空間の値に変換する例である。 For generation of a color still image, M feature values are selected in advance from N feature values and converted to a color space using M values. (Equation 1) is an example of conversion to a color space value using the three primary colors based on the above-described three feature amounts.
また、前記拍周期P4は楽曲の4分音符の時間長を表し、楽曲のテンポを表現する数値であるので、(数2)により、前記拍周期P4を用いてテンポの速い楽曲はより赤い色に、テンポの遅い楽曲はより青い色に静止画を表示するようにしてもよい。 The beat period P4 represents the time length of the quarter note of the music, and is a numerical value representing the tempo of the music. Therefore, according to (Equation 2), a music with a fast tempo using the beat period P4 has a red color. In addition, a still image may be displayed in a blue color for music with a slow tempo.
以上の動作により、サムネイル付与手段13は、楽曲に対するサムネイル用静止画を生成し、データ管理手段14はこれを楽曲と関連付けて管理する。さらに書誌情報入力手段17から、楽曲名、歌手名、ジャンル名などの書誌情報を入力し、データ管理手段14はこれらを楽曲と関連させて管理する。楽曲の音響信号、書誌情報、特徴量、サムネイル用静止画などのデータはそれぞれ関連付けられレコードの形でデータ管理手段14にて管理される。図3にデータ管理手段14が管理するレコード形式の一例を示す。32は特徴量の内容を示し、31は楽曲の音響信号の前に書誌情報と特徴量が付随情報1として並べられたレコードを示す。33は付随情報2であり、サムネイル用静止画データを含む。33の付随情報2と31の音響信号は、各楽曲にユニークに与えられた曲IDをもとに相互に関連付けられている。
Through the above operation, the
次に利用者が、ブラウズ要件入力手段16より、例えばジャンル名を検索のキーワードとして入力すると、ブラウズ要件入力手段16は、データ管理手段14に対し前記キーワードをもとに楽曲データの検索を指示し、データ管理手段14は検索結果である指定したジャンルに相当する楽曲の一覧を、各楽曲に関連付けられた書誌情報やサムネイル用静止画及び31で示す曲ID共にブラウズ手段15に出力し、ブラウズ手段15は、楽曲に関連付けられた書誌情報やサムネイル用静止画を表示する。利用者はブラウズ手段15にて表示された、書誌情報やサムネイル用静止画の一覧の中から所望の楽曲を、ブラウズ要件入力手段16にて選択し、ブラウズ要件入力手段16は選択された楽曲の曲IDをもとにデータ管理手段14に検索を指示する。データ管理手段14は、曲IDに対応する楽曲の音響信号データをブラウズ手段15に出力し、ブラウズ手段15が楽曲の再生を行う。
Next, when the user inputs, for example, a genre name as a search keyword from the browse
以上では、上記の動作を実現する装置として本発明の実施の形態1を述べたが、前記各手段をコンピュータ上で上記動作を実現するプログラムとして全体を構成してもよい。また、前記プログラムは楽曲データ登録部111及びデータ管理手段を実現するプログラムはサーバ上で実行され、楽曲ブラウズ部112はインターネットを経由して、端末側のコンピュータで実行されるプログラムとしてもよい。あるいは、サーバ上では、データ管理手段を実現するプログラムが実行され、楽曲データ登録部111及び楽曲ブラウズ部112を実現するプログラムはインターネットを経由して、それぞれ同じコンピュータあるいは異なるコンピュータ上で実行される形態としてもよい。
In the above, the first embodiment of the present invention has been described as an apparatus for realizing the above-described operation. However, the respective units may be configured as a program for realizing the above-described operation on a computer. In addition, the program may be a program that executes the music
(実施の形態2)
以下、本発明の実施の形態2について、図面を参照しながら説明する。図2は本発明の実施の形態2における楽曲検索装置の全体構成を示すブロック図である。図2において、11は音響信号入力手段、12は特徴量抽出手段、23はサムネイル付与手段、24はデータ管理手段、25はブラウズ手段、26はブラウズ要件入力手段、27は静止画入力手段を表している。
(Embodiment 2)
以上のように構成された楽曲検索装置について、以下、その動作について図2を用いて説明する。本装置は大きく分けて、対象となる楽曲の音響信号及びその付随するデータを登録する楽曲データ登録部211と、登録された楽曲データを管理するデータ管理手段24、及び管理されたデータの中から、利用者の所望する楽曲をブラウズする楽曲ブラウズ部212より構成される。本装置は実施の形態1における各ブロックで示される各手段を利用し、一部を新しい機能に置き換えたものである。以下にその内容を説明する。
The operation of the music search apparatus configured as described above will be described below with reference to FIG. This apparatus is roughly divided into a music
音響信号入力手段11及び特徴量入力手段12は、実施の形態1の音響信号入力手段11及び特徴量入力手段12と同じ動作をし、サムネイル付与手段23に対し、楽曲から抽出した特徴量を出力する。このとき同時に静止画入力手段27からサムネイル用静止画が入力されている場合は、サムネイル付与手段23は前記サムネイル用静止画と前記特徴量をデータ管理手段24に出力し、データ管理手段24はこれらを楽曲の音響信号データと共に関連付けて管理する。
The acoustic signal input unit 11 and the feature
静止画入力手段27からサムネイル用静止画が入力されていない場合は、サムネイル付与手段23は入力された楽曲から抽出された上記の特徴量Pをキーとして、データ管理手段24にて管理されている付随情報の中の特徴量PXを検索し、(数3)にて各特徴量間のユークリッド距離を算出しその逆数Lを、類似度を表す値として求める。
When a still image for thumbnail is not input from the still
サムネイル付与手段23は、算出された類似度の中で最も大きい値Lmを持つ特徴量PXmを求め、PXmに関連付けて管理されているサムネイル用静止画データを抽出する。その後、楽曲に関連させてサムネイル用静止画、特徴量P及び類似度Lmを、データ管理手段24に出力し、データ管理手段24はこれらを関連付けて管理する。図3の34は、サムネイル用静止画データと類似度データを持つレコードである付随情報3の例を示す。
The
利用者は、ブラウズ要件入力手段26により、楽曲データの一覧表示を指定し、データ管理手段24はブラウズ要件入力手段26からの指示で、検索結果である曲ID、サムネイル用静止画データ、特徴量及び類似度の一覧をブラウズ手段25に出力する。ブラウズ手段25はサムネイル用静止画の一覧を表示する。 The user designates the list display of the music data by the browse requirement input means 26, and the data management means 24, in response to an instruction from the browse requirement input means 26, searches for the music ID, thumbnail still image data, feature amount as a search result. The similarity list is output to the browsing means 25. The browsing means 25 displays a list of thumbnail still images.
また、ブラウズ手段25は、サムネイル用静止画を表示するときに、サムネイル用静止画に関連付けられた類似度データをもとにサムネイル用静止画の表示の明るさを調節したり、色合いを調整することによって、同じサムネイル用静止画を割り当てられた楽曲間の類似の程度を表現してもよい。また、類似度を各楽曲に対応された特徴量のうち全ての特徴量からユークリッド距離を用いて算出したが、任意の特徴量の組み合わせからなる値の間でのユークリッド距離として算出してもよいし、距離ではなく、単純な値の差や、特定の特徴量を強調するような係数を用いて算出した値を類似度として用いてもよい。さらに、発明の実施の形態1にあった書誌情報入力手段を、実施の形態2に追加し、書誌情報の入力を可能にし、ブラウズ手段25は、サムネイル用静止画と共に、楽曲の曲名などの書誌情報を表示するようにしてもよい。図4はブラウズ手段25によって提示された一覧表示の例を示す。41はブラウズ画面であり、42はサムネイル用静止画の例である。また、実施の形態1と同様に、コンピュータ上で実施の形態2の動作を実現するプログラムとして全体を構成してもよいし、前記プログラムはサーバ上で実行される部分と、インターネットを経由して、1つのあるいは複数のコンピュータ上で実行される部分をもった形態としてもよい。
Further, when displaying the thumbnail still image, the browsing means 25 adjusts the display brightness of the thumbnail still image or the color tone based on the similarity data associated with the thumbnail still image. Thus, the degree of similarity between music pieces assigned the same thumbnail still image may be expressed. Also, the similarity is calculated from all the feature values corresponding to each music using the Euclidean distance. However, the similarity may be calculated as a Euclidean distance between values composed of combinations of arbitrary feature values. However, instead of the distance, a value calculated using a simple value difference or a coefficient that emphasizes a specific feature amount may be used as the similarity. Further, the bibliographic information input unit according to the first embodiment of the invention is added to the second embodiment, and bibliographic information can be input. The
(実施の形態3)
以下、本発明の実施の形態3について、図面を参照しながら説明する。図5は本発明の実施の形態3における楽曲データ処理装置の全体構成を示すブロック図である。図5において、51は音響信号入力手段、52は特徴量抽出手段、53はキャラクタ付与手段、54はデータ管理手段、55は表示動作手段、56はキャラクタ保管手段を表している。
(Embodiment 3)
以上のように構成された楽曲データ処理装置について、以下、その動作について図5を用いて説明する。本装置は大きく分けて、対象となる楽曲の音響信号及びその付随するデータを登録する楽曲データ登録部511と、登録された楽曲データを管理するデータ管理手段54、及び管理されたデータの中から楽曲の特徴に対応するキャラクタを表示、動作させる表示動作手段55より構成される。まず、楽曲データ登録部511について概説する。データ管理手段54は、楽曲ごとにその音響信号及び以下に記述する付随情報を関連させて記録し、検索参照可能とするものである。
The operation of the music data processing apparatus configured as described above will be described below with reference to FIG. This apparatus is roughly divided into a music
最初に、音響信号入力手段51は登録対象として入力された楽曲の音響信号をデータ管理手段54に登録すると共に、付随情報生成のため後段の特徴量抽出手段52に出力する。音響信号入力手段51は、入力される音響信号がアナログ信号の場合は、デジタル化した後、後段に出力する。また、圧縮された音響信号の場合は、圧縮データをデータ管理手段54に登録し、圧縮データを伸張した後、伸張データを特徴量抽出手段52に出力する。
First, the acoustic
次に、特徴量抽出手段52は、入力された音響信号から、その音響信号の物理的特徴を表すいくつかの特徴量を抽出し、付随情報としてデータ管理手段54に登録し、後段のキャラクタ付与手段56に特徴量を出力する。なお、特徴量として、実施の形態1と同様に、スペクトル変化度P1、平均発音数P2、発音非周期性P3、拍周期P4が挙げられるが、上記4種類の特徴量の他に、拍周期比率P5、拍強度P6、拍強度比P7などのパラメータについても特徴量として利用してもよい。また、対象となる楽曲から特徴量を抽出するにあたり、特徴量の抽出範囲は、楽曲の全体、楽曲の一部分及び、楽曲の複数の部分に対し、任意の組
み合わせからなる領域から抽出してよい。
Next, the feature
次に、キャラクタ付与手段53について説明する。キャラクタ付与手段53は前段で抽出された特徴量P1からPNのN個の値を入力し、この特徴量との距離が最も近い特徴量に対応付けられた2次元あるいは3次元キャラクタの形状及び動作を後段のキャラクタ保管手段より選択し、付随情報としてデータ管理手段54に登録する。以下に、キャラクタ選択の実施例を説明する。
Next, the
キャラクタ保管手段56は、あらかじめ楽曲の特徴量と、キャラクタの形状及びキャラクタの動作を対応させておく。特徴量の特定の、あるいは任意の組み合わせのパラメータごとに対応させてもよいし、P1からPNのN個の値の統計と対応させてもよい。前段キャラクタ付与手段53に特徴量が入力されると、キャラクタ付与手段53は、キャラクタ保管手段56から前記方法により楽曲の特徴量との距離が最も近い特徴量に対応付けられたキャラクタの形状及びキャラクタの動作を選択する。さらに、キャラクタの動作のテンポについては、動作の周期を指定する時間のパラメータとして前記拍周期P4を用いると、前記拍周期P4が楽曲の4部音符の時間長を表すので、キャラクタは対応する楽曲のテンポに合わせた動きで動作する。この他にも、他の特徴量をキャラクタの動作パラメータとして利用することにより、楽曲の内容をより多くの動きによって表現してもよい。前段キャラクタ付与手段53は、上記手段によりキャラクタの形状、動作、及び動作の周期を指定し、データ管理手段に登録する。
The
また、楽曲の特徴量と、キャラクタの形状または動作を対応させる際、特願2001−082150にも記載されているように、SD(semantic differencial)法等による官能評価実験などにより、楽曲に対する利用者の主観的な印象を元にしてキャラクタの形状や動作を決定すると、より楽曲の内容に合ったものになる。 Further, when associating the feature amount of the music with the shape or motion of the character, as described in Japanese Patent Application No. 2001-082150, the user with respect to the music is performed by a sensory evaluation experiment using an SD (semantic differential) method or the like. If the shape and movement of the character are determined based on the subjective impression of the song, it will be more suitable for the content of the music.
以上の動作により、キャラクタ付与手段53は、楽曲に対するキャラクタを選択し、データ管理手段54はこれを楽曲と関連付けて管理する。楽曲の音響信号、特徴量、キャラクタの形状、キャラクタの動作などのデータはそれぞれ関連付けられレコードの形でデータ管理手段54によって管理される。図7にデータ管理手段54が管理するレコード形式の一例を示す。72は特徴量の内容を示し、73はキャラクタの情報を示す。71は楽曲の音響信号の前に特徴量とキャラクタ情報が付随情報として並べられたレコードを示す。74はキャラクタ保管例であり、xは特徴量の値である。なお、74の他にも、あらかじめいくつかの楽曲レコードをキャラクタ保管手段に登録しておくなどしてもよい。75はキャラクタの形状情報一覧であり、76はキャラクタの動作情報一覧である。
With the above operation, the character giving means 53 selects a character for the music piece, and the data management means 54 manages it in association with the music piece. The data management means 54 manages the sound signal, feature quantity, character shape, character motion, and other data of the music piece in association with each other. FIG. 7 shows an example of a record format managed by the data management means 54. 72 indicates the contents of the feature amount, and 73 indicates character information.
楽曲再生時、データ管理手段54は、管理しているデータより該当する楽曲情報を抽出し、結果を表示動作手段55に出力する。表示動作手段55は、データ管理手段54より入手した結果に対し、該当楽曲に関連付けられたキャラクタを動作させる。また、上記の実施例では、一度登録した楽曲のデータはデータ管理手段54によって保存され、楽曲再生時に前記データを読み出すが、データ管理手段を用いず楽曲再生ごとに特徴量を抽出し、キャラクタと関係付けて表示動作させてもよい。また、楽曲再生ごとに特徴量を抽出する際、あらかじめ抽出した特徴量を初期値として用いることによって、特徴量の精度を高めてもよい。また
、実施の形態1と同様に、コンピュータ上で実施の形態3の動作を実現するプログラムとして全体を構成してもよいし、前記プログラムはサーバ上で実行される部分と、インターネットを経由して、1つのあるいは複数のコンピュータ上で実行される部分を持った形態としてもよい。
At the time of music reproduction, the data management means 54 extracts the corresponding music information from the managed data and outputs the result to the display operation means 55. The
(実施の形態4)
以下、本発明の実施の形態4について、図面を参照しながら説明する。図6は本発明の実施の形態4における楽曲データ処理装置の全体構成を示すブロック図である。図6において、61は音響信号入力手段、62は特徴量抽出手段、63はキャラクタ付与手段、64はデータ管理手段、65は表示動作手段、66はキャラクタ保管手段を表している。
(Embodiment 4)
以上のように構成された楽曲データ処理装置について、以下、その動作について図6を用いて説明する。本装置は大きく分けて、対象となる楽曲の音響信号及びその付随するデータを登録する楽曲データ登録部611と、登録された楽曲データを管理するデータ管理手段64、及び管理されたデータの中から楽曲の特徴に対応するキャラクタを表示、動作させる表示動作手段65より構成される。本装置は実施の形態3における各ブロックで示される各手段を利用し、一部を新しい機能に置き換えたものである。以下にその内容を説明する。
The operation of the music data processing apparatus configured as described above will be described below with reference to FIG. The apparatus is roughly divided into a music
音響信号入力手段61は、特徴量抽出手段62とデータ管理手段64に対し、楽曲の音響信号を、一定時間デルタTごとの時間T(T1、T2、…Tn、…)に出力する。特徴量抽出手段62は、入力された、時間Tnにおける音響信号の物理的特徴を表すいくつかの特徴量を抽出し、付随情報としてデータ管理手段64に登録し、後段のキャラクタ付与手段63に特徴量を出力する。キャラクタ付与手段63は、一定時間Tごとに抽出された特徴量との距離が最も近い特徴量に対応付けられた2次元あるいは3次元キャラクタの形状及びまたは動作をそれぞれ後段のキャラクタ保管手段より選択し、時間Tnと共に付随情報としてデータ管理手段64に登録する。楽曲再生時、データ管理手段64は、管理しているデータより該当する楽曲情報を抽出し、結果を表示動作手段65に出力する。表示動作手段65は、データ管理手段64より入手した結果に対し、該当楽曲に関連付けられたキャラクタを動作させる。
The acoustic signal input means 61 outputs the acoustic signal of the music to the feature quantity extraction means 62 and the data management means 64 at a time T (T1, T2,... Tn,...) Every fixed time delta T. The feature
以上の動作により、キャラクタ付与手段63は、楽曲に対するキャラクタを選択し、データ管理手段64はこれを楽曲と関連付けて管理する。楽曲の音響信号、特徴量、キャラクタの形状、一定時間Tごとにおけるキャラクタの動作などのデータはそれぞれ関連付けられレコードの形でデータ管理手段64によって管理される。上記の実施例では、一度登録した楽曲のデータはデータ管理手段64によって保存され楽曲再生時に前記データを読み出すが、データ管理手段を用いず楽曲再生ごとに特徴量を抽出し、キャラクタと関係付けて表示動作させてもよい。また、上記の実施例では、一定時間Tごとに、キャラクタの形状及び動作の変更の有無に関わらず、それらのデータをデータ管理手段64に登録するが、時間Tnにおいて、直前の時間Tn−1におけるキャラクタの形状及び動作に変更があった場合、変更したデータのみをデータ管理手段64に登録してもよい。また、時間周期デルタTを短くすることによって、より楽曲の内容に合ったものになる。また、実施の形態1と同様に、コンピュータ上で実施の形態4の動作を実現するプログラムとして全体を構成してもよいし、前記プログラムはサーバ上で実行される部分と、インターネットを経由して、1つのあるいは複数のコンピュータ上で実行される部分を持った形態としてもよい。 With the above operation, the character giving means 63 selects a character for the music, and the data management means 64 manages this in association with the music. The data management means 64 manages the acoustic signal of the music, the feature amount, the character shape, and the data such as the character motion at a predetermined time T in the form of records. In the above embodiment, once registered music data is stored by the data management means 64, and the data is read at the time of music reproduction. However, the feature quantity is extracted for each music reproduction without using the data management means, and is associated with the character. A display operation may be performed. In the above-described embodiment, the data is registered in the data management means 64 at every fixed time T regardless of whether the character shape and the movement are changed. However, at time Tn, the previous time Tn−1 is registered. When there is a change in the shape and action of the character, only the changed data may be registered in the data management means 64. Further, by shortening the time period delta T, it becomes more suitable for the contents of the music. Further, as in the first embodiment, the whole may be configured as a program for realizing the operation of the fourth embodiment on a computer. The program may be executed on a server and via the Internet. It is good also as a form with the part performed on one or several computers.
本発明にかかる楽曲データ処理装置は、2次元や3次元のキャラクタを楽曲の特徴に合わせて自動的に動作させ、楽曲の再生と連動して表示することが可能になる。その結果、好みの楽曲の内容を聴覚だけでなく視覚的にも鑑賞できるようになるため、家庭や劇場あるいは車内等の移動空間でのエンターテイメント端末などに適用できる。 The music data processing apparatus according to the present invention can automatically display a two-dimensional or three-dimensional character according to the characteristics of the music and display it in conjunction with the reproduction of the music. As a result, the contents of the favorite music can be viewed visually as well as audibly, so that it can be applied to an entertainment terminal in a moving space such as a home, a theater or a car.
11,51,61 音響信号入力手段
12,52,62 特徴量抽出手段
13,23 サムネイル付与手段
14,24,54,64 データ管理手段
15,25 ブラウズ手段
16,26 ブラウズ要件入力手段
17 書誌入力手段
27 静止画入力手段
111,211,511,611 楽曲データ登録部
112,212 楽曲データブラウズ部
31 付随情報1
32 特徴量
33 付随情報2
34 付随情報3
41 ブラウズ画面
42 サムネイル用静止画
53,63 キャラクタ付与手段
55,65 表示動作手段
56,66 キャラクタ保管手段
71 楽曲レコード
72 特徴量
73 キャラクタ情報
74 キャラクタ情報保管例
75 キャラクタの形状情報
76 キャラクタの動作情報
11, 51, 61 Acoustic signal input means 12, 52, 62 Feature amount extraction means 13, 23 Thumbnail assignment means 14, 24, 54, 64 Data management means 15, 25 Browse means 16, 26 Browse requirement input means 17 Bibliographic input means 17 27 Still image input means 111, 211, 511, 611 Music
32
34
41
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008032848A JP2008210382A (en) | 2008-02-14 | 2008-02-14 | Music data processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008032848A JP2008210382A (en) | 2008-02-14 | 2008-02-14 | Music data processor |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002041065A Division JP4196052B2 (en) | 2002-02-19 | 2002-02-19 | Music retrieval / playback apparatus and medium on which system program is recorded |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008210382A true JP2008210382A (en) | 2008-09-11 |
Family
ID=39786585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008032848A Pending JP2008210382A (en) | 2008-02-14 | 2008-02-14 | Music data processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008210382A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010042449A2 (en) * | 2008-10-06 | 2010-04-15 | Vergence Entertainment Llc | System for musically interacting avatars |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63170697A (en) * | 1987-09-04 | 1988-07-14 | ヤマハ株式会社 | Musical sound image converter |
JP2000276137A (en) * | 1999-03-23 | 2000-10-06 | Yamaha Corp | Musical image display device |
-
2008
- 2008-02-14 JP JP2008032848A patent/JP2008210382A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63170697A (en) * | 1987-09-04 | 1988-07-14 | ヤマハ株式会社 | Musical sound image converter |
JP2000276137A (en) * | 1999-03-23 | 2000-10-06 | Yamaha Corp | Musical image display device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010042449A2 (en) * | 2008-10-06 | 2010-04-15 | Vergence Entertainment Llc | System for musically interacting avatars |
WO2010042449A3 (en) * | 2008-10-06 | 2010-07-22 | Vergence Entertainment Llc | System for musically interacting avatars |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100762585B1 (en) | Rhythm-based music synchronization device and method | |
CN101185138B (en) | Display device | |
JP5706718B2 (en) | Movie synthesis system and method, movie synthesis program and storage medium thereof | |
JP2008217254A (en) | Playlist creation device and playlist creation method | |
JP4962067B2 (en) | Music playback device, music playback method, and music playback program | |
JP4196052B2 (en) | Music retrieval / playback apparatus and medium on which system program is recorded | |
EP2073193A1 (en) | Method and device for generating a soundtrack | |
JP2007299382A (en) | System and method for searching media content using meta data | |
JP2011107808A (en) | Device, method and program for recommending content | |
US20120124473A1 (en) | System and method for playing music using music visualization technique | |
JP2010066366A (en) | Music information processing device, music distribution system and music information processing method | |
Knees et al. | Searching for audio by sketching mental images of sound: A brave new idea for audio retrieval in creative music production | |
JP2012088402A (en) | Information processor, information processing method, and program | |
JP5344756B2 (en) | Information processing apparatus, information processing method, and program | |
JP5516720B2 (en) | Category generation program, category generation apparatus, and category generation method | |
JP4611819B2 (en) | Music management apparatus and information display method | |
JP5025398B2 (en) | Image reproducing apparatus and program | |
JP2008210382A (en) | Music data processor | |
JP5085577B2 (en) | Playlist creation device, music playback device, playlist creation method, and playlist creation program | |
JP6733240B2 (en) | How to update the content list | |
JP2008299411A (en) | Multimedia reproduction equipment | |
JP4459269B2 (en) | Song search device, song search method, song search program, and information recording medium | |
EP4443421A1 (en) | Method for generating a sound effect | |
WO2021100493A1 (en) | Information processing device, information processing method, and program | |
JP2008048054A (en) | Moving image generation method, program and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100913 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101116 |