[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2007171772A - 音楽情報処理装置、音楽情報処理方法および制御プログラム - Google Patents

音楽情報処理装置、音楽情報処理方法および制御プログラム Download PDF

Info

Publication number
JP2007171772A
JP2007171772A JP2005371955A JP2005371955A JP2007171772A JP 2007171772 A JP2007171772 A JP 2007171772A JP 2005371955 A JP2005371955 A JP 2005371955A JP 2005371955 A JP2005371955 A JP 2005371955A JP 2007171772 A JP2007171772 A JP 2007171772A
Authority
JP
Japan
Prior art keywords
music
data
music data
information processing
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005371955A
Other languages
English (en)
Inventor
Kenji Tokura
健治 都倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP2005371955A priority Critical patent/JP2007171772A/ja
Publication of JP2007171772A publication Critical patent/JP2007171772A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】予めユーザ等が分類することなく、大量に保存された音楽データに対応する楽曲の中から、類似する楽曲を判別する。
【解決手段】複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理装置10において、音楽データDmpの特徴量を抽出し、特徴量データDcを生成する特徴量演算装置16と、所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量データに基づいて算出し、最も類似度の高い音楽データDmpを所定の楽曲に類似する楽曲の音楽データとして判別する音楽選択装置15と、を備える。
【選択図】図1

Description

本発明は、音楽情報処理装置、音楽情報処理方法および制御プログラムに係り、特に楽曲の類似性を判別する技術に関する。
従来、音楽データを保存し再生する際には、できるだけ劣化の少ない状態で保存する必要があったために、アナログデータもしくは特定の分解能において離散データにサンプリングされたデジタルデータ(例えば、PCM)によって保存する必要があり、膨大な情報量が必要であった。さらに、音楽データを保存するための記録媒体も限られていたために、大量の音楽データを保存しておくことは困難であった。
しかしながら、近年においては、従来と同程度以上の比較的劣化の少ない状態において、同一の音楽に対する音楽データを数分の1から数十分の1に圧縮する圧縮技術が発達してきている。例えば、圧縮技術としては、MP3、WMA、AAC(MPEG)等
が挙げられる。
これと同時に、音楽データを保存する装置についても発達し、多くの情報量を保存する記録メディアも提案されており、多量の情報を同一の記録メディアに同時に保存することが可能となってきた。例えば、記録メディアとしては、HDD、半導体メモリなどが挙げられる。
これらの音楽データを保存するための技術の発達に伴って、同一の記録メディアに大量の音楽データが格納されることとなった結果、それらの中から目的とする音楽データを選択することが望まれるようになってきている。
例えば、従来においては、ユーザが予め分類したり、音楽データに予め付加されているアーティスト情報、曲名情報等によって分類したり、音楽データが音データの周波数情報(音階情報)とビート情報(リズム)の組み合わせでできていることを用いて、その組み合わせを数値化して分類するなどの技術が提案されている(例えば、特許文献1参照)。
特開2000−35796号公報
上記従来の技術においては、音楽を特徴付けるに際し、音楽に付随したテキスト情報(歌詞、キーワード、作曲者名、歌手名、音楽名、アルバム名)を用いることが提案されている。
また、音楽の中のいわゆる「さび」と呼ばれる特定の部分における音楽データから、曲想(ビート、リズム、和音)などを検出して音楽を特徴づけることも可能である。
しかしながら、一般的な楽曲(音楽)は、曲の最初から最後までの間にいくつかの音楽テーマの組み合わせによって構成されているため、テキスト情報や「さび」と呼ばれる特定の部分における音楽データから音楽を特徴づけたとしても、必ずしも、楽曲全体の特徴付けを行ったことにはならないという問題点が生じる。
このため、大量に音楽データを保存し、ある音楽データに対応する楽曲に類似した楽曲を検索するような用途には、必ずしも適していないという問題点があった。
そこで、本発明の目的は、予めユーザ等が分類することなく、大量に保存された音楽データに対応する楽曲の中から、類似する楽曲を判別することが可能な音楽情報処理装置、音楽情報処理方法および制御プログラムを提供することにある。
上記課題を解決するため、複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理装置において、前記音楽データの特徴量を抽出し、特徴量データを生成する特徴量抽出部と、前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量データに基づいて算出し、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別する類似判別部と、を備えたことを特徴としている。
上記構成によれば、特徴量抽出部は、音楽データの特徴量を抽出し、特徴量データを生成する。
これにより類似判別部は、所定の楽曲に対応する音楽データと、他の音楽データの類似度を特徴量データに基づいて算出し、最も類似度の高い音楽データを所定の楽曲に類似する楽曲の音楽データとして判別する。
この場合において、前記音楽データは圧縮データであり、前記特徴量抽出部は、前記圧縮データに基づいて前記特徴量データを生成するようにしてもよい。
また、前記特徴量抽出部は、前記特徴量データとしてハミング距離データを生成するようにしてもよい。
さらに、前記特徴量抽出部は、前記特徴量データとしてウェーブレット変換により得られる圧縮データを用いるようにしてもよい。
さらにまた、前記類似判別部は、前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出するようにしてもよい。
また、前記複数の音楽データを記憶する音楽データ記憶部と、前記音楽データ記憶部に記憶されている前記音楽データに基づいて前記楽曲の再生を行う再生部と、を備え、前記類似判別部は、前記所定の楽曲を現在前記再生部で再生中の楽曲として、前記音楽データ記憶部に記憶されている音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別し、前記再生部は、当該最も類似度の高い楽曲を次回の再生対象の楽曲とするようにしてもよい。
また、複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理方法において、前記音楽データの特徴量を抽出する特徴量抽出過程と、前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量に基づいて算出し、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別する類似判別過程と、を備えたことを特徴としている。
この場合において、前記類似判別過程は、前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出するようにしてもよい。
また、予め記憶されている複数の音楽データに基づいて前記楽曲の再生を行う再生過程を備え、前記類似判別過程は、前記所定の楽曲を現在前記再生部で再生中の楽曲として、予め記憶されている前記音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別し、前記再生過程は、当該最も類似度の高い楽曲を次回の再生対象の楽曲とするようにしてもよい。
また、複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理装置をコンピュータにより制御する制御プログラムにおいて、前記音楽データの特徴量を抽出させ、前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量に基づいて算出させ、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別させる、ことを特徴としている。
この場合において、前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出させるようにしてもよい。
また、予め記憶されている複数の音楽データに基づいて前記楽曲の再生を行わせるに際し、前記所定の楽曲を現在前記再生部で再生中の楽曲として、予め記憶されている音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別させ、当該最も類似度の高い楽曲を次回の再生対象の楽曲とさせるようにしてもよい。
本発明によれば、予めユーザ等が分類することなく、大量に保存された音楽データに対応する楽曲データ(楽曲)の中から、一つの楽曲データ(楽曲)に類似する楽曲データ(楽曲)を判別することができる。
以下、本発明の好適な実施形態を図面に基づいて説明する。
[1]第1実施形態
図1は、実施形態の音楽情報処理装置の概要構成ブロック図である。
本第1実施形態の音楽情報処理装置10は、音圧データの繰り返しパターンを検出して特徴量データとし、この特徴量データに基づいて楽曲の類似性を判別するものである。
音楽情報処理装置10は、ハードディスク、半導体メモリカード等の記録メディアから音楽データDmを読み取るメディア読取装置11と、メディア読取装置11により読み取られた音楽データDmに基づいて楽曲再生を行う再生装置12と、メディア読取装置11により読み取られた音楽データの圧縮処理を行って圧縮音楽データDmpを生成し出力する音楽データ圧縮装置13と、再生装置12において再生すべき音楽データDmあるいは圧縮音楽データDmpを指示するとともに、後述する音楽データ保存装置17に保存されている圧縮音楽データDmpを再生装置12に供給する音楽情報処理装置15と、圧縮音楽データDmpに基づいて音楽データDmの特徴量を抽出し、特徴量データDcを生成し出力する特徴量演算装置16と、音楽データ圧縮装置13から出力された圧縮音楽データDmpおよび特徴量演算装置16から出力された特徴量データDcを記憶し、保存する音楽データ保存装置17と、当該音楽情報処理装置10全体を制御するシステム制御装置18と、ユーザがシステム制御装置18との間でやり取りを行うためのユーザインターフェイス装置19と、を備えて構成されている。
ここで、概要動作を説明する。
システム制御装置18の制御下で、メディア読取装置11は記録メディア内に保存された多数の音楽データの中から選択された音楽データDmを読み取ると、当該音楽データDmにおいて設定されているデータビットレートに合わせて順次音楽データDmを再生装置12および音楽データ圧縮装置13に出力する。なお、音楽データDmの再生を行わず、音楽データの保存処理のみを行う場合には、音楽データDmを再生装置12に出力する必要はない。
これにより、再生装置12は、音楽データDmに基づいて音楽データDmに対応する楽曲を再生する。また再生装置12は、音楽情報処理装置から後述する圧縮音楽データが入力された場合には、当該圧縮音楽データを伸長し、対応する楽曲を再生することとなる。
これと並行して、音楽データ圧縮装置13は、システム制御装置18の制御下で、音楽データDmを圧縮して圧縮音楽データDmpとして特徴量演算装置16および音楽データ保存装置17に出力する。
特徴量演算装置16は、システム制御装置18の制御下で、入力された圧縮音楽データDmpから特徴量を抽出し、音楽データ圧縮装置13における圧縮処理の終了タイミングとほぼ同時に特徴量データDcの生成を完了し音楽データ保存装置17に出力する。
ここで、特徴量演算処理について詳細に説明する。
図2は、第1実施形態の特徴量演算の処理フローチャートである。
通常、メディア読取装置11から再生装置12に送られる音楽データDmは、PCMデータと呼ばれるもので、複数のサンプリング音楽データA(i)により構成されている。
ここで、サンプリング音楽データA(i)は、所定の周波数およびデータビット長、例えば、44.1kHz、16bitにてアナログ音楽信号をサンプリングすることにより得られる。
まず、音楽データ圧縮装置13は、音楽データDmを構成するサンプリング音楽データA(i)が入力されると(ステップS101)、サンプリング音楽データA(i)の圧縮を行う(ステップS102)。ここでは、順次入力されるデータ音圧を算出し、その音圧データの一定区間tでの平均を取得することでデータの圧縮を行う。
そして、圧縮音楽データDmpを構成するサンプリング圧縮音楽データC(j)とされる。このサンプリング圧縮音楽データC(j)は、音楽データ圧縮装置13の図示しない一時保存メモリに順次保存される(ステップS103)。そして、全てのサンプリング音楽データA(i)がサンプリング圧縮音楽データC(j)とされるまでステップS102およびステップS103の処理が繰り返される(ステップS104)。
一つの音楽に対して処理が終了した段階では、N個のデータが音楽データ圧縮装置13の図示しない一時保存メモリに保存されており、その数Nは、N=T/tとなる。ここでTは音楽の総再生時間である。
一時保存メモリにN個のデータが保存された段階、すなわち、全ての入力された音楽データDmのサンプリング圧縮音楽データC(j)が生成された段階で、特徴量演算装置16は、次の規格化処理を行う(ステップS105)。
CC(i)=C(i)/(C(1)C(2)+…+C(N))
このようにして得られたデータの系列CC(i)に対して、相関を示すデータH(k、m)を生成する(ステップS106)。このデータH(k、m)は、ハミング(hamming)距離の総和に相当するデータである。
H(k、m)=ΣΣ(CC(i+m+j)−CC(i+m+k+j))
ここで、jは、0〜jjの整数であり、jjの値は、例えばt×j=20秒程度になるように選択する。
図3、図4および図5に、得られたデータH(k、m)をグラフ化した説明図である。
横軸がk(曲の再生時間)であり、縦軸がm(相関基準時間)を示しており、ここでは相関性を示すデータとしてハミング距離を用いているために、値が小さいほど相関性が高く、値が大きいほど相関性が低いことになる。
図3の場合には、60秒付近、及び120秒付近にこの音楽の全体像から見たときに差異の大きいパターンが存在していることが分かる。
図4の場合には、60秒付近、及び120秒付近にこの音楽の全体像から見たときに差異の大きいパターンが存在していることが分かるが、分布としては、図3よりもなだらかな形状となっている。
図5の場合には、90秒付近にのみ音楽の全体像から見たときに差異の大きいパターンが存在していることが分かる。
図3〜図5は、ハミング距離データH(k、m)の分布を分かり易く表示したものであるが、それぞれの音楽にとって一意に決まる代表値のセットとなるが、このままでは、情報量が多く、取扱いが困難である。
そこで、このハミング距離データH(k、m)の取扱いを容易とすべく、例えば、max(k)=8、max(m)=8として64wordのデータとして、それぞれの音楽の特徴量データ、すなわち、ハミング距離データN(k1、m1)として定義する(ステップS107)。
そして、それぞれの圧縮音楽データDmpを保存すると同時に、その音楽データDmpにハミング距離データN(k1、m1)を関連付けて保存する。
ここで求められているハミング距離データN(k1、m1)は、音楽の一部分だけのデータを用いてその部分の特徴量を算出したものではなく、音楽全体の特徴量を示したものである。感性的な定義を用いると、このハミング距離データN(k1、m1)が大きい部分の分布が図3、図4のような場合には、はっきりと分かれているような曲風であることを示している。
これらの結果、音楽データ保存装置17は、システム制御装置18の制御下で、入力された圧縮音楽データDmpおよび特徴量データDcを関連付けて保存することとなる。
一方、音楽情報処理装置15は、音楽データ保存装置17に保存された圧縮音楽データDmpの中からユーザインターフェイス装置19を介して指示されたユーザが希望する圧縮音楽データDmpあるいは現在再生装置12で再生している楽曲に類似する楽曲に対応する圧縮音楽データDmpを選択して、再生装置12に出力することとなる。
このとき、音楽情報処理装置15は、現在再生装置12において再生している音楽の特徴量をハミング距離データN(k1、m1)として保持すると同時に、システム制御装置18の制御下で、音楽データ保存装置17に保存されている特徴量演算装置16によって求められた特徴量データであるハミング距離データN(k1、m1)の中から、現在再生装置12において再生している音楽に最も類似する、すなわち、最もハミング距離が近いハミング距離データN(k1、m1)を検索し、最もハミング距離が近いハミング距離データN(k1、m1)に関連づけられた圧縮音楽データDmpを再生装置12に出力し、再生を行わせることとなる。
図6は、音楽情報処理装置における検索処理の処理フローチャートである。
以下の説明では、一例として、現在既に演奏している音楽に対して、最も類似した音楽を検索する場合について説明する。
保存されている圧縮音楽データDmpの総数をMとした場合、現在再生している音楽のハミング距離データH1(k、m)を取得し(ステップS201)、保存されている各圧縮音楽データDmpに対応するハミング距離データN(k1、m1)との差であるハミング距離差を求め(ステップS203)、得られたハミング距離差を図示しない一時保存メモリに保存する(ステップS204)。
そして、保存されている各圧縮音楽データDmpに対応するハミング距離データN(k1、m1)のすべてについてハミング距離差を算出するまで、ステップS202〜S204の処理を繰り返す(ステップS205)。
そして、最もハミング距離差が小さいハミング距離データN(k1、m1)を算出し(ステップS206)、当該ハミング距離データN(k1、m1)に対応する圧縮音楽データDmpを選択して再生装置12で再生させる(ステップS207)。
上述したように、本実施形態では、第1回目の再生時にハミング距離データN(k1、m1)を取得することとなるため、実際の検索処理の段階では、各曲に対して64wordのデータのみであり、そのハミング距離算出を繰り返すことで類似音楽を検索することが可能になる。すなわち、音楽データ保存装置17に保存されているデータに対して、リアルタイムで同様にハミング距離を算出する場合に比較して、非常に容易に類似音楽を検索することが可能となる。
ところで、通常、音楽データを処理する場合、入力に関しては、特に制御することなくメディア読取装置11からストリーミングで流れてくるデータを逐次処理することで対応できると、既存のシステムに組み込み易くなる。つまり、一般的な再生作業をしながら同時にデータを取得できるということになる。
すなわち、本実施形態の技術によれば、ストリーミングで流れてくる音楽データDmに対して、最初の段階でデータに圧縮処理を行うために、システムの内部に保存されるデータは圧縮音楽データDmpであっても、その総数はN個である。そのN個のデータに対しても、圧縮音楽データDmpが生成された段階で、直ちにハミング距離データN(k1、m1)を求めることで、最終的にk×mに順次処理を実施することが可能である。
このことは、音楽情報処理装置においてデータの流れを一方向に制御でき(フィードバックがない)、確実に結果が一意に決まり、作業をするための作業メモリ領域を最小限にすることができ、既存のシステムに対してデータを分岐するだけで情報を取得できるということである。
このため、例えば、既存のシステムに対して、上述した特徴量データを算出する演算ルーチンを、デジタルシグナルプロセッサ(DSP)等に追加して組み込むだけで、目的とする特徴量データを取得でき、既存のシステムに対する整合性も大きいことがわかる。
本実施形態の方式に対し、予め曲の特徴量のある部分を推定し、その部分に対して特徴量を算出する方式を考えた場合、一旦特徴量のある部分を見つけるという手順で、曲の最後の部分まで処理を実施し、その上で、再度その特徴量のある部分に戻って処理をするという2段階を踏む必要がある。その場合、本実施形態におけるようなメディア読取装置11からストリーミング的にデータが流れてくる場合には、再度処理をするために必要な情報を全て保存しておく必要がある。
これは、第一段階の特徴量を見つけるという作業が、曲の最後まで到達しなければ確定しないことに依存している。そのために非常に大きな演算用のデータを内部に一時保存するか、もしくは、メディア読取装置11に対して、目的とする部分を再度送ってもらうために必要なフィードバックの手順が必要となり、本実施形態と比較してデメリットがあることが明白である。
以上の説明のように、本第1実施形態によれば、多量に保存された音楽データ(圧縮音楽データ)の中から、現在再生している音楽(音楽データ)に類似した特徴を有する音楽データを容易かつ迅速に検索することが可能となる。また、この場合に、既存のシステムとの整合性を保つことができる。
[2]第2実施形態
つぎに、本発明の第2実施形態について図面を参照して説明する。
上記第1実施形態においては、最初に音圧データの平均値を用いて音楽データの圧縮を行い、得られた圧縮音楽データを用いて特徴量データを算出する場合について説明したが、同一(あるいは同様)の楽曲パターンであっても、音圧レベルが大きく異なっている場合には、特徴量データが大きく異なる場合がある。
そこで、本第2実施形態では、音圧レベルの影響を低減すべく、ウェーブレット変換を用いて特徴量データの算出を行うようにしている。
図7は、第2実施形態の特徴量演算の処理フローチャートである。
まず、音楽データ圧縮装置13は、音楽データDmを構成するサンプリング音楽データA(i)が入力されると(ステップS301)、サンプリング音楽データA(i)の圧縮を行う(ステップS302)。ここでは、順次入力されるデータ音圧を算出し、その音圧データに対してウェーブレット変換を行うことで圧縮を行う。
そして、圧縮音楽データDmpを構成するサンプリング圧縮音楽データC(j)とされる。
ここで、ウェーブレット変換について説明する。
図8は、ある音楽データのウェーブレット変換を行い、周波数時間分離を実施した場合の説明図である。
図8中において、データは、
Pk,n
で表されており、nはウェーブレット変換の次数の代表値である。
実際には、これらのデータPk,nのなかからいずれか一つのデータを圧縮音楽データDmpとして用いることとなる。
この場合に、例えば、n次のデータPk,nを用いた場合には、初期データである音楽データDmに対して1/nにデータ量が圧縮されると同時に、周波数軸上での分離が進められたデータであるために、全体としては、音圧(音量)の影響を低減することが可能となる。
ところで、一般的に音楽の特徴量に関しては、周波数に対する依存があり、低周波の場合にはビート、高周波の場合には、楽器音が中心となり、必要な周波数領域(=ウェーブレット変換における次数)を選択することが可能であるが、聴覚的に圧縮されていることが認識されやすい周波数領域に対応する次数を選択することが有効である。
このようにして得られたサンプリング圧縮音楽データC(j)は、音楽データ圧縮装置13の図示しない一時保存メモリに順次保存される(ステップS303)。そして、全てのサンプリング音楽データA(i)がサンプリング圧縮音楽データC(j)とされるまでステップS302およびステップS303の処理が繰り返される(ステップS304)。
一つの音楽に対して処理が終了した段階では、N個のデータが音楽データ圧縮装置13の図示しない一時保存メモリに保存されており、その数Nは、N=T/tとなる。ここでTは音楽の総再生時間でありる。
一時保存メモリにN個のデータが保存された段階、すなわち、全ての入力された音楽データDmのサンプリング圧縮音楽データC(j)が生成された段階で、特徴量演算装置16は、次の規格化処理を行う(ステップS105)。
CC(i)=C(i)/(C(1)C(2)+…+C(N))
このようにして得られたデータの系列CC(i)に対して、相関を示すデータH(k、m)を生成する(ステップS306)。このデータH(k、m)は、ハミング(hamming)距離の総和に相当するデータである。
H(k、m)=ΣΣ(CC(i+m+j)−CC(i+m+k+j))
ここで、jは、0〜jjの整数であり、jjの値は、例えばt×j=20秒程度になるように選択する。
さらに、このハミング距離データH(k、m)の取扱いを容易とすべく、例えば、max(k)=8、max(m)=8として64wordのデータとして、それぞれの音楽の特徴量データ、すなわち、ハミング距離データN(k1、m1)として定義する(ステップS307)。
そして、それぞれの圧縮音楽データDmpを保存すると同時に、その音楽データDmpにハミング距離データN(k1、m1)を関連付けて保存する。
これらの結果、音楽データ保存装置17は、システム制御装置18の制御下で、入力された圧縮音楽データDmpおよび特徴量データDcを関連付けて保存することとなる。
一方、音楽情報処理装置15は、音楽データ保存装置17に保存された圧縮音楽データDmpの中からユーザインターフェイス装置19を介して指示されたユーザが希望する圧縮音楽データDmpあるいは現在再生装置12で再生している楽曲に類似する楽曲に対応する圧縮音楽データDmpを選択して、再生装置12に出力することとなる。
このとき、音楽情報処理装置15は、現在再生装置12において再生している音楽の特徴量をハミング距離データN(k1、m1)として保持すると同時に、システム制御装置18の制御下で、音楽データ保存装置17に保存されている特徴量演算装置16によって求められた特徴量データであるハミング距離データN(k1、m1)の中から、現在再生装置12において再生している音楽に最も類似する、すなわち、最もハミング距離が近いハミング距離データN(k1、m1)を検索し、最もハミング距離が近いハミング距離データN(k1、m1)に関連づけられた圧縮音楽データDmpを再生装置12に出力し、再生を行わせることとなる。
以上の説明のように、本第2実施形態によっても、多量に保存された音楽データ(圧縮音楽データ)の中から、現在再生している音楽(音楽データ)に類似した特徴を有する音楽データを容易かつ迅速に検索することが可能となる。また、この場合に、既存のシステムとの整合性を保つことができる。
以上、図面を参照して本発明の実施形態を詳述してきたが、本発明は、上記の実施形態に限定されるものではなく、要旨を逸脱しない範囲の種々の設計変更を含むものである。
例えば、以上の説明においては、ハードディスク、半導体メモリカード等の記録メディアからメディア読取装置11により音楽データDmを読み取る構成としていたが、記録メディアに代えて、ネットワークを介して、外部のサーバ装置などから音楽データを取得する構成とすることも可能である。
また、音楽データに代えて、圧縮音楽データを取得することも可能である。
実施形態の音楽情報処理装置の概要構成ブロック図である。 第1実施形態の特徴量演算の処理フローチャートである。 得られたデータH(k、m)をグラフ化した説明図(その1)である。 得られたデータH(k、m)をグラフ化した説明図(その2)である。 得られたデータH(k、m)をグラフ化した説明図(その3)である。 音楽情報処理装置における検索処理の処理フローチャートである。 第2実施形態の特徴量演算の処理フローチャートである。 ある音楽データのウェーブレット変換を行い、周波数時間分離を実施した場合の説明図である。
符号の説明
10…音楽情報処理装置、11…メディア読取装置、12…再生装置、13…音楽データ圧縮装置、15…音楽選択装置(類似判別部)、16…特徴量演算装置(特徴量抽出部)、17…音楽データ保存装置、18…システム制御装置、19…ユーザインターフェイス装置、Dm…音楽データ、Dmp…圧縮音楽データ、Dc…特徴量データ。

Claims (12)

  1. 複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理装置において、
    前記音楽データの特徴量を抽出し、特徴量データを生成する特徴量抽出部と、
    前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量データに基づいて算出し、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別する類似判別部と、
    を備えたことを特徴とする音楽情報処理装置。
  2. 請求項1記載の音楽情報処理装置において、
    前記音楽データは圧縮データであり、
    前記特徴量抽出部は、前記圧縮データに基づいて前記特徴量データを生成することを特徴とする音楽情報処理装置。
  3. 請求項1または請求項2記載の情報処理装置において、
    前記特徴量抽出部は、前記特徴量データとしてハミング距離データを生成することを特徴とする音楽情報処理装置。
  4. 請求項1または請求項2記載の情報処理装置において、
    前記特徴量抽出部は、前記特徴量データとしてウェーブレット変換により得られる圧縮データを用いることを特徴とする音楽情報処理装置。
  5. 請求項1ないし請求項4のいずれかに記載の音楽情報処理装置において、
    前記類似判別部は、前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出することを特徴とする音楽情報処理装置。
  6. 請求項1ないし請求項5のいずれかに記載の音楽情報処理装置において、
    前記複数の音楽データを記憶する音楽データ記憶部と、
    前記音楽データ記憶部に記憶されている前記音楽データに基づいて前記楽曲の再生を行う再生部と、を備え、
    前記類似判別部は、前記所定の楽曲を現在前記再生部で再生中の楽曲として、前記音楽データ記憶部に記憶されている音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別し、
    前記再生部は、当該最も類似度の高い楽曲を次回の再生対象の楽曲とすることを特徴とする音楽情報処理装置。
  7. 複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理方法において、
    前記音楽データの特徴量を抽出する特徴量抽出過程と、
    前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量に基づいて算出し、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別する類似判別過程と、
    を備えたことを特徴とする音楽情報処理方法。
  8. 請求項7記載の音楽情報処理装置において、
    前記類似判別過程は、前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出することを特徴とする音楽情報処理方法。
  9. 請求項7または請求項8記載の音楽情報処理方法において、
    予め記憶されている複数の音楽データに基づいて前記楽曲の再生を行う再生過程を備え、
    前記類似判別過程は、前記所定の楽曲を現在前記再生部で再生中の楽曲として、予め記憶されている前記音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別し、
    前記再生過程は、当該最も類似度の高い楽曲を次回の再生対象の楽曲とすることを特徴とする音楽情報処理方法。
  10. 複数の音楽データに対応する複数の楽曲のうち、所定の楽曲に類似する楽曲に対応する音楽データを検索する音楽情報処理装置をコンピュータにより制御する制御プログラムにおいて、
    前記音楽データの特徴量を抽出させ、
    前記所定の楽曲に対応する音楽データと、他の音楽データの類似度を前記特徴量に基づいて算出させ、最も類似度の高い音楽データを前記所定の楽曲に類似する楽曲の音楽データとして判別させる、
    ことを特徴とする制御プログラム。
  11. 請求項10記載の制御プログラムにおいて、
    前記圧縮データを、曲の再生時間を表す軸および相関基準時間を表す軸で表される平面上に展開した場合に得られるパターンに基づいて前記類似度を算出させることを特徴とする制御プログラム。
  12. 請求項10または請求項11記載の制御プログラムにおいて、
    予め記憶されている複数の音楽データに基づいて前記楽曲の再生を行わせるに際し、
    前記所定の楽曲を現在前記再生部で再生中の楽曲として、予め記憶されている音楽データに対応する楽曲のうち、最も類似度の高い楽曲を判別させ、
    当該最も類似度の高い楽曲を次回の再生対象の楽曲とさせる、
    ことを特徴とする制御プログラム。

JP2005371955A 2005-12-26 2005-12-26 音楽情報処理装置、音楽情報処理方法および制御プログラム Pending JP2007171772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005371955A JP2007171772A (ja) 2005-12-26 2005-12-26 音楽情報処理装置、音楽情報処理方法および制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005371955A JP2007171772A (ja) 2005-12-26 2005-12-26 音楽情報処理装置、音楽情報処理方法および制御プログラム

Publications (1)

Publication Number Publication Date
JP2007171772A true JP2007171772A (ja) 2007-07-05

Family

ID=38298386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005371955A Pending JP2007171772A (ja) 2005-12-26 2005-12-26 音楽情報処理装置、音楽情報処理方法および制御プログラム

Country Status (1)

Country Link
JP (1) JP2007171772A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012015809A (ja) * 2010-06-30 2012-01-19 Kddi Corp 楽曲選択装置、楽曲選択方法および楽曲選択プログラム
CN110516109A (zh) * 2019-08-30 2019-11-29 腾讯科技(深圳)有限公司 音乐标签的关联方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134613A (ja) * 1999-08-26 2001-05-18 Sony Corp 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
JP2004334160A (ja) * 2002-09-24 2004-11-25 Matsushita Electric Ind Co Ltd 特徴量抽出装置
JP2005032409A (ja) * 2003-06-19 2005-02-03 Matsushita Electric Ind Co Ltd 楽曲再生装置および楽曲再生方法
WO2005050620A1 (en) * 2003-11-18 2005-06-02 Koninklijke Philips Electronics N.V. Matching data objects by matching derived fingerprints
JP2005522744A (ja) * 2002-04-05 2005-07-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声コンテンツを特定する方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134613A (ja) * 1999-08-26 2001-05-18 Sony Corp 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
JP2005522744A (ja) * 2002-04-05 2005-07-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声コンテンツを特定する方法
JP2004334160A (ja) * 2002-09-24 2004-11-25 Matsushita Electric Ind Co Ltd 特徴量抽出装置
JP2005032409A (ja) * 2003-06-19 2005-02-03 Matsushita Electric Ind Co Ltd 楽曲再生装置および楽曲再生方法
WO2005050620A1 (en) * 2003-11-18 2005-06-02 Koninklijke Philips Electronics N.V. Matching data objects by matching derived fingerprints
JP2007519986A (ja) * 2003-11-18 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 導出されたフィンガープリントのマッチングによるデータオブジェクトのマッチング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012015809A (ja) * 2010-06-30 2012-01-19 Kddi Corp 楽曲選択装置、楽曲選択方法および楽曲選択プログラム
CN110516109A (zh) * 2019-08-30 2019-11-29 腾讯科技(深圳)有限公司 音乐标签的关联方法、装置及存储介质

Similar Documents

Publication Publication Date Title
JP4640407B2 (ja) 信号処理装置、信号処理方法及びプログラム
JP4487958B2 (ja) メタデータ付与方法及び装置
US7386357B2 (en) System and method for generating an audio thumbnail of an audio track
JP4581476B2 (ja) 情報処理装置および方法、並びにプログラム
JP4274221B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US10235981B2 (en) Intelligent crossfade with separated instrument tracks
US20110112672A1 (en) Systems and Methods of Constructing a Library of Audio Segments of a Song and an Interface for Generating a User-Defined Rendition of the Song
JP2005521979A5 (ja)
JPH06110945A (ja) 音楽データベース作成装置及びその検索装置
JP2014006480A (ja) 情報処理装置、情報処理方法及びプログラム
EP1320101A2 (en) Sound critical points retrieving apparatus and method, sound reproducing apparatus and sound signal editing apparatus using sound critical points retrieving method
JP2004184510A (ja) 楽曲データ作成装置及び方法
CN110010159B (zh) 声音相似度确定方法及装置
JP2009266005A (ja) 画像検索方法、画像検索プログラム、楽曲再生装置、および楽曲検索用物品
WO2017168644A1 (ja) 楽曲展開解析装置、楽曲展開解析方法および楽曲展開解析プログラム
US20070051230A1 (en) Information processing system and information processing method
JP4877811B2 (ja) 特定区間抽出装置、音楽記録再生装置、音楽配信システム
JP3612272B2 (ja) 音楽情報検索装置、音楽情報検索方法および音楽情報検索用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007171772A (ja) 音楽情報処理装置、音楽情報処理方法および制御プログラム
JP5085577B2 (ja) プレイリスト作成装置、楽曲再生装置、プレイリスト作成方法およびプレイリスト作成プログラム
JP2008304610A (ja) 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体
JPWO2006077769A1 (ja) 提示データ選択装置及び提示データ選択方法等
Six et al. A robust audio fingerprinter based on pitch class histograms applications for ethnic music archives
JP2009092977A (ja) 車載装置および楽曲検索システム
KR20040000796A (ko) 멜로디 기반 검색이 가능한 음악 재생장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111004