[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5054646B2 - 拍位置推定装置、拍位置推定方法および拍位置推定プログラム - Google Patents

拍位置推定装置、拍位置推定方法および拍位置推定プログラム Download PDF

Info

Publication number
JP5054646B2
JP5054646B2 JP2008243199A JP2008243199A JP5054646B2 JP 5054646 B2 JP5054646 B2 JP 5054646B2 JP 2008243199 A JP2008243199 A JP 2008243199A JP 2008243199 A JP2008243199 A JP 2008243199A JP 5054646 B2 JP5054646 B2 JP 5054646B2
Authority
JP
Japan
Prior art keywords
beat
analysis
section
interval
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008243199A
Other languages
English (en)
Other versions
JP2010072595A (ja
Inventor
広海 石先
啓一郎 帆足
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2008243199A priority Critical patent/JP5054646B2/ja
Publication of JP2010072595A publication Critical patent/JP2010072595A/ja
Application granted granted Critical
Publication of JP5054646B2 publication Critical patent/JP5054646B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽曲データの拍位置を推定する拍位置推定装置、拍位置推定方法および拍位置推定プログラムに関する。
従来、音楽波形信号から自動で拍やテンポ情報を抽出する手法が知られている。たとえば、特許文献1に記載される装置および方法は、入力された音楽信号に対して複数の異なる推定範囲を設定し、推定範囲ごとのテンポ推定と複数の推定範囲の各テンポ値とを統合して、音楽データについて時間的に変動するテンポ値を得ている。そのようにして、楽曲の途中でテンポが変化するような音楽データのテンポ推定を可能にしている。また、特許文献2、3および非特許文献3に記載される方法は、PCMデータから得られた音楽波形信号に対し、STFTに基づいた時系列パワースペクトラム、もしくはそれに相応する特徴量を計算し、自己相関および相互相関を利用することにより拍位置を推定している。
また、非特許文献1記載の方法では、リズム特徴量としてビートヒストグラムと呼ばれるものを特徴量としている。ビートヒストグラムは、各周波数帯域における音楽音響信号の時間包絡と自己相関から抽出されたテンポの統計量として計算される。非特許文献2に記載の方法は調和音のオンセット(音の立ち上がり)コードの遷移確率、打楽器のパターン情報に基づいて実時間での拍推定を行っている。打楽器のパターンとはスペクトルの低周波域にエネルギーが局在しているバスドラムと、広い周波数域にエネルギーが広がっているスネアドラムの組み合わせである。このような打楽器のパターン情報に基づき、音楽的に一般的な知識とされている事前情報を用いることで拍位置を推定している。
特開2003−263162号公報 特開2002−116754号公報 特開2007−33851号公報 G.Tzanetakis and P.Cook, "Musical genre classification of audio signals", IEEE, Trans on Speech and Audio Processing, Vol.10, No.5, pp.293-302 Goto.M, "An audio-based real-time beat tracking system for music with or without drum-sounds.", Journal of New Music Research, June 2001, Vol.30, No.2, pp.159-171 Miguel Alonso, Bertrand David, and Gael Richard, "Tempo and beat estimation of music signals", In Proc.ISMIR2004.
特許文献1には、楽曲の途中でテンポが変化するような音楽データのテンポ推定を可能にするために、多段的な分析により時系列でテンポ変動を推定可能な方法が記載されている。第1段階にて大きな信号幅によるテンポ推定を適用し、第2段階では第1段階で推定されたテンポに基づいて設定された区間に対してテンポ推定を行う。しかしながら、上記のような多段的な分析では、解析量が膨大になるため実時間推定は困難である。また、特許文献1にも記載されているように、特許文献2、3、非特許文献1〜3記載の技術では、大幅なテンポ変化に対応することができない。
本発明は、このような事情に鑑みてなされたものであり、計算量を軽減しつつ、大幅なテンポ変化に対応して正確に拍位置を推定できる拍位置推定装置、拍位置推定方法および拍位置推定プログラムを提供することを目的とする。
(1)上記の目的を達成するため、本発明の拍位置推定装置は、曲データの拍位置を推定する拍位置推定装置であって、最初の解析区間を設定する初期設定部と、前記最初の解析区間に続く解析区間を逐次設定する解析区間設定部と、前記各解析区間内に検証区間を設定する検証区間設定部と、前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出部と、前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証部と、を備え、前記検証結果に基づき楽曲データ全体にわたり拍位置を推定することを特徴としている。なお、拍位置とは、楽曲の再生に対して時間軸上に周期的に刻まれる拍の時刻を指す。また、楽曲データ全体にわたりとは、拍位置の推定が必要とされる楽曲の範囲全体という意味であり、必ずしも一曲全てを意味しない。
このように、本発明の拍位置推定装置は、解析区間内に検証区間を設定し、両区間で検出された拍位置が互いに一致するかを検証する。そして、その検証結果に基づいて楽曲データ全体にわたり拍位置を推定する。これにより、楽曲データに存在するテンポの変動に対して正確に拍位置を推定することができる。また、従来のテンポ変動に対応可能な方式に比べて楽曲データ全体にわたり何度も重複して解析する必要がなく、計算量を軽減することができる。
(2)また、本発明の拍位置推定装置は、前記検証区間設定部が、前記各解析区間で検出された拍位置に基づいて、検証区間を設定することを特徴としている。これにより、効率よく精度の高い検証をすることができる。
(3)また、本発明の拍位置推定装置は、前記解析区間設定部が、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴としている。これにより、効率よく、正確な拍位置を検出するのに適当な解析区間を設定することができる。
(4)また、本発明の拍位置推定装置は、前記解析区間についての拍位置の検出結果に基づき、前記解析区間の開始位置が適当か否かを判定する位置判定部を更に備え、判定の結果、前記解析区間の開始位置が不適当である場合に、前記解析区間設定部は、開始位置をシフトさせた次の解析区間を設定することを特徴としている。このように、本発明の拍位置推定装置は、解析区間の開始位置が適当か否かを判定し、適当でないときには解析区間をシフトさせる。これにより、たとえばほとんど音が無い区間や語りが記録されている区間を含めないように解析区間を設定することができ、効率よく、正確な拍位置を検出するのに適当な解析区間を設定することができる。
(5)また、本発明の拍位置推定装置は、前記解析区間設定部が、前記検証の結果、前記拍位置が一致しないときに、前記検証区間で検出された拍位置を基準にして、次の解析区間の長さおよび開始位置を設定することを特徴としている。これにより、たとえば検証区間で検出された拍間隔を基準に解析区間の長さを設定し、検証区間で検出された拍位置を開始位置として解析区間を設定することができる。
(6)また、本発明の拍位置推定装置は、前記解析区間設定部が、前記検証の結果、前記拍位置が一致しないときに、前記検証区間で検出された拍位置の間隔より標準最低拍間隔以上長い間隔を次の解析区間の長さに設定することを特徴としている。標準最低拍間隔とは、一般的な楽曲のテンポの範囲の上限から導かれる最低の拍間隔をいう。通常、一般的な楽曲のテンポの範囲は、50BPM以上、250BPM以下である。したがって、上限の250BPMにおける拍間隔は、0.24秒であるため、標準最低拍間隔として0.24秒をとることができる。これにより、検証区間で検出された拍位置を2つ以上含む区間を解析区間として設定でき、効率よく、正確な拍位置を検出することができる。
(7)また、本発明の拍位置推定装置は、前記解析区間設定部が、直前に設定された解析区間内で検出された最初の拍位置から、前記解析区間または前記検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定することを特徴としている。これにより、検出結果を基準として一拍ごとシフトさせた解析区間を設定することができ、拍位置を考慮しつつ精密に拍位置を検出することが可能となる。
(8)また、本発明の拍位置推定装置は、前記解析区間設定部が、直前に設定された解析区間内で検出された最後の拍位置から、前記解析区間または前記検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定することを特徴としている。これにより、検出結果を基準として、各解析区間の最後の一拍のみ重なるようにシフトさせた解析区間を設定することができ、拍位置を考慮しつつ効率的に拍位置を検出することが可能となる。
(9)また、本発明の拍位置推定装置は、前記解析区間設定部が、前記検証の結果、前記拍位置が一致しない区間に重ならないよう、次の解析区間の開始位置を設定することを特徴としている。これにより、不規則な拍をとる区間や拍の無い区間をとばして効率よく拍位置を検出することができる。
(10)また、本発明の拍位置推定装置は、前記各解析区間で検出された拍位置を楽曲データ全体にわたり統合する統合部を更に備えることを特徴としている。これにより、拍位置を統合してより妥当性の高い拍位置を楽曲データ全体にわたり推定することができる。
(11)また、本発明の拍位置推定方法は、楽曲データの拍位置を推定する拍位置推定方法であって、最初の解析区間を設定すると、前記最初の解析区間に続く解析区間を逐次設定する解析区間設定ステップと、前記各解析区間内に検証区間を設定する検証区間設定ステップと、前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出ステップと、前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証ステップと、を含み、前記検証区間設定ステップでは、前記各解析区間で検出された拍位置に基づいて、検証区間を設定し、前記解析区間設定ステップでは、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴としている。これにより、計算量を軽減しつつ、大幅なテンポ変化に対応して正確に拍位置を推定できる。
(12)また、本発明の拍位置推定プログラムは、楽曲データの拍位置を推定する拍位置推定プログラムであって、最初の解析区間を設定する初期設定処理と、前記最初の解析区間に続く解析区間を逐次設定する解析区間設定処理と、前記各解析区間内に検証区間を設定する検証区間設定処理と、前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出処理と、前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証処理と、をコンピュータに実行させ、前記検証区間設定処理では、前記各解析区間で検出された拍位置に基づいて、検証区間を設定し、前記解析区間設定処理では、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴としている。これにより、計算量を軽減しつつ、大幅なテンポ変化に対応して正確に拍位置を推定できる。
本発明によれば、楽曲データに存在するテンポの変動に対して正確に拍位置を推定することができる。また、従来のテンポ変動に対応可能な方式に比べて楽曲データ全体にわたり何度も重複して解析する必要がなく、計算量を軽減することができる。
次に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。
(拍位置推定装置の構成)
図1は、拍位置推定装置100の構成を示すブロック図である。拍位置推定装置100は、楽曲データの拍位置を推定する。具体的には、拍位置推定装置100は、楽曲データを提供するコンテンツサーバであってもよいし、携帯電話機や携帯音楽プレーヤー等の携帯端末であってもよい。
図1に示すように、拍位置推定装置100は、初期設定部101、解析区間設定部102、検証区間設定部103、楽曲データベース106、区間抽出部107、拍位置検出部110、位置判定部111、記録部113、検証部114、統合部118、基本拍位置推定部119、拍情報記憶部120、およびメタ情報生成部121を備えている。
初期設定部101は、解析対象となる楽曲データの信号を抽出するため最初の解析区間を設定する。最初の解析区間の長さは、たとえば約1.2秒を基準にして設定することができる。約1.2秒は、一般的な楽曲のテンポ範囲が50BPM以上250BPM以下であることを考慮し、拍間隔が最長となる長さである。また、最初の解析区間の開始位置は楽曲データの信号の開始位置などに設定することができる。ただし、開始位置の設定はこの限りではない。なお、以下の説明では、特に言及しない限り解析区間の長さおよび開始位置の設定の際には、長さは標準最低拍間隔を加えるものとする。また、開始位置は標準最低拍間隔の半分だけ、早い位置を開始位置とするものとする。あらかじめ長めの解析区間を設定し、拍位置の検出状況に応じて解析区間を短くすることにより、効率よく、かつ精度よく拍位置を推定することができる。なお、携帯端末上で拍位置推定するような場合には、対象の区間を装置上にて実行できる区間長に管理することで、メモリ制限等の問題を回避できる。
解析区間設定部102は、最初の解析区間に続く解析区間を逐次設定する。解析区間設定部102は、検証結果に基づき楽曲データ全体にわたり複数の解析区間を逐次設定する。検証結果に基づくことで、効率よく、正確な拍位置を検出するのに適当な解析区間を設定することができる。また、拍位置推定装置100は、解析区間の開始位置が適当か否かを判定し、適当でないときには、解析区間設定部102により解析区間をシフトさせる。たとえば音が無い区間や語りが記録されている区間を含めないように解析区間を設定することができる。
解析区間設定部102は、検証部114により解析区間で検出された拍位置と検証区間で検出された拍位置とが一致するか否かを判定された結果、拍位置が一致しないときに、検証区間で検出された拍位置を基準にして、次の解析区間の長さおよび開始位置を設定する。たとえば検証区間で検出された拍間隔を基準に解析区間の長さを設定し、検証区間で検出された拍位置を開始位置として解析区間を設定することができる。
また、検証区間で検出された拍位置の間隔より標準最低拍間隔以上長い間隔を次の解析区間の長さに設定してもよい。その場合には、対象とする最初の拍位置より標準最低拍間隔の半分だけ早い位置を開始位置とし解析区間を設定する。これにより、検証区間で検出された拍位置を少なくとも2つ以上含む区間を解析区間として設定でき、効率よく正確な拍位置を検出することができる。このようにして、拍位置推定装置100は、検証結果に基づき楽曲データ全体にわたり拍位置を推定する。これにより、計算量を低減しつつ、テンポ変化に対応して正確に拍位置を推定できる。
なお、解析区間設定部102は、直前に設定された解析区間内で検出された最初の拍位置から、解析区間または検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定してもよい。これにより、検出結果を基準として一拍ごとシフトさせた解析区間を設定することができ、拍位置を考慮しつつ精密に拍位置を検出することが可能となる。
また、解析区間設定部102は、直前に設定された解析区間内で検出された最後の拍位置から、解析区間または検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定してもよい。これにより、検出結果を基準として、各解析区間の最後の一拍のみ重なるようにシフトさせた解析区間を設定することができ、拍位置を考慮しつつ効率的に拍位置を検出することが可能となる。
また、解析区間設定部102は、検証の結果、解析区間と検証区間とで検出された拍位置が一致しない区間があるときにその区間に重ならないよう、次の解析区間の開始位置を設定してもよい。つまり不適当と判定される区間を進めて(とばして)解析区間の開始位置を設定することができる。これにより、不規則な拍をとる区間や拍の無い区間を無視して効率よく拍位置を検出することができる。なお、検証結果を反映せずに所定長さの解析区間を所定間隔ごとに設定することもできる。
検証区間設定部103は、各解析区間で検出された拍位置に基づいて、各解析区間内に検証区間を設定する。たとえば、隣り合う拍位置の間隔(拍間隔)から標準最低拍間隔分長い区間を検証区間とすることが好ましい。また、2つの拍間隔分の長さとしてもよい。楽曲データベース106は、拍位置推定の対象となりうる楽曲データを蓄積する。楽曲データは、AAC等のファイル形式で格納されている。
区間抽出部107は、設定された区間の楽曲データを抽出する。区間は、解析区間であってもよいし、検証区間でもよい。具体的には、楽曲データベース106内に格納された楽曲データを呼び出し、拍位置推定の対象となる区間における楽曲信号を抽出する。区間抽出部107は、楽曲データのフォーマットが解析に適さないフォーマットであった場合、解析に適したファイル形式に変換を行う。
拍位置検出部110は、区間抽出部107により抽出された各解析区間または検証区間の楽曲データについて拍位置を検出する。そして、検出された拍位置を暫定的な拍位置として扱う。たとえば、自己相関をベースにした拍位置検出を行うことができる。そして、複数設定された解析区間の楽曲データの拍位置を繰り返し検出し、各解析区間について検出区間の楽曲データの拍位置も検出する。拍位置検出の処理については後述する。拍位置検出の方法はこの方法に限定されず、検知関数(自己相関計算の対象となる関数、以下同様)を計算する段階で、ローパスフィルタ等の帯域制限フィルタや、バンドパスフィルタ等の帯域通過フィルタを適用してもよい。
位置判定部111は、解析区間についての拍位置の検出結果に基づき、解析区間の開始位置が適当か否かを判定する。たとえば、解析区間の平均音量が50db以下の場合や解析区間内での相関が低い場合などには、解析区間の開始位置は不適当と判定する。判定の結果、適当であれば検証区間の設定に移り、不適当であれば、拍位置推定装置100は、解析区間設定部102により解析区間の開始位置を再設定する。
記録部113は、検出された拍位置を記録する。解析区間における各検出結果のみならず、検証区間における検出結果も記録する。記録部113は、各区間について拍位置検出部110により検出された拍位置を順次記録していく。記録部113は、解析区間、検出区間ごとに検出結果を保持する。
検証部114は、各解析区間で検出された拍位置と各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する。一致とは、それぞれ検出された拍位置が所定の誤差範囲内にあることをいう。誤差範囲としては標準最低拍間隔またはその半分を設定することができる。たとえば、検証区間で検出された各拍位置(楽曲開始から各拍までの時間が経過した時点)の誤差範囲内に解析区間で検出された拍位置のいずれかがあるか否かを判定することにより検証を行う。
また、解析区間で検出された各拍位置についてその誤差範囲内に検証区間で検出された拍位置があるか否かを判定し、さらに検証区間で検出された各拍位置についてその誤差範囲内に解析区間で検出された拍位置があるか否かを判定することとしてもよい。このような処理により、検証部114は、解析区間における検出結果と、検証区間における検出結果を比較し、拍位置が一致する場合には解析区間は適当と判定し、一致しない場合には解析区間は不適当と判定する。
統合部118は、各解析区間で検出された拍位置を楽曲データ全体にわたり統合する。これにより、さらに妥当性の高い拍位置を楽曲データ全体にわたり推定することができる。たとえば、複数設定された各解析区間における推定拍位置の情報を時系列に基づいて累積し、各時点で推定された拍の累積個数を拍の尤もらしさとして利用することができる。なお、統合部118を設けずに拍位置検出部110により検出された拍位置を推定結果としてもよい。
基本拍位置推定部119は、統合された拍位置から楽曲データ全体にわたり基本拍位置を推定する。基本拍位置推定部119は、統合部118によって得られた統合された拍位置の情報から尤もらしい拍を有効な拍として推定する。統合および基本拍位置推定の処理については後述する。
拍情報記憶部120は、楽曲データ全体にわたり推定された拍位置を特定する拍情報を記憶する。メタ情報生成部121は、楽曲データ全体にわたり推定された拍位置を特定するメタ情報を生成する。このように最終的な解析結果をメタ情報として出力することができる。なお、拍位置推定装置100は、統合部118および基本拍位置推定部119を備えずに、拍位置検出部110により検出された拍位置を、楽曲全体にわたり推定された拍位置とすることができる。
拍位置推定装置100は、制御部(図示せず)により、各部の制御を行うとともに拍位置検出を終了するか継続するかの判定を行う。たとえば、対象となる楽曲データ全体にわたり拍位置の検出が行われたとき終了と判定し、対象となる楽曲データ全体にわたり拍位置が検出されていないときには継続と判定する。制御部は、全楽曲データの区間に対して検出が行われていない場合、区間抽出部107に次の区間の楽曲データを抽出するよう指示する。
このようにして、解析区間の位置および解析区間の長さを対象となる楽曲データから自動で設定することができる。なお、上記の例に限らず、楽曲データに対して事前に検知関数を計算し、最初の解析区間を設定することもできる。
(拍位置推定装置の動作)
次に、拍位置推定装置100の動作を説明する。図2は、本発明に係る拍位置推定装置100の特徴的な動作の一例を示すフローチャートである。まず、拍位置推定装置100は、最初の解析区間を設定する(ステップS1)。そして、全ての解析区間について拍位置の検出および検証が終了しているか否かを判定する(ステップS2)。全ての解析区間について拍位置の検出および検証が終了している場合には、拍を統合し(ステップS3)、統合された拍の位置を推定された拍位置として出力し、終了する。一方、全ての解析区間について拍位置の検出および検証が終了していない場合には、設定された解析区間の楽曲データを抽出する(ステップS4)。
そして抽出された解析区間の楽曲データについて拍位置を検出する(ステップS5)。次に検出された拍位置に基づいて解析区間の位置は適当か否かを判定する(ステップS6)。解析区間の位置が適当でないと判定された場合には、判定結果を反映して解析区間を設定する(ステップS7)。解析区間の位置が適当であると判定された場合には検証区間を設定し(ステップS8)、検証区間の楽曲データを抽出し(ステップS9)、その楽曲データについて拍位置を検出する(ステップS10)。
次に、解析区間において検出された拍位置と検証区間において検出された拍位置とが一致するか否かを判定(検証)する(ステップS11)。拍位置が一致しないと判定された場合には、ステップS7に戻り、検証結果を反映した解析区間を設定する。その際には検証結果に基づいて解析区間の長さおよび位置を設定することができる。拍位置が一致する場合には、一致した拍位置を記録し(ステップS12)、次の解析区間を設定し(ステップS13)、ステップS2に戻る。
(解析区間の設定および拍位置検出)
図3(a)〜(d)は、それぞれ解析区間の設定、解析区間における拍位置の検出、検証区間の設定、および検証区間における拍位置の検出を示す概略図である。図3(a)に示すように、拍位置推定の対象となる楽曲データに対して、まず解析区間201が設定される。そして、図3(b)に示すように、解析区間201について拍位置P1〜P3が検出される。次に、図3(c)に示すように、検出された拍間隔よりやや広い検証区間301が設定される。そして、図3(d)に示すように、検証区間301について拍位置R1、R2が検出される。拍位置R1、R2のそれぞれの誤差範囲内に、解析区間201について検出された拍位置P1〜P3が入っているかを判定することにより検証処理を行う。たとえば、図3に示す解析区間における第1、第2拍位置P1、P2と検証区間における第1、第2拍位置R1、R2が一致しない場合に不適当と判定される。
なお、図3に示す例では、最初の解析区間における推定結果の第1から第2拍目を含む区間に対して検証区間を設定しているが、検証区間はこの限りではなく、第3拍目までを含む形や、第2〜第3拍目のみを含む区間、もしくは解析区間のすべてを含む区間を検証区間とすることができる。また、検証区間を複数設定し、各検証区間に対して検証することとしてもよい。
(拍位置検出)
図4は、拍位置検出処理を示すフローチャートである。上記のように設定された解析区間の楽曲データを抽出し、入力波形に対して短時間フーリエ変換を適用し、入力波形におけるスペクトログラムを計算する(ステップT1)。スペクトログラムから時系列でのパワー関数を求め(ステップT2)、自己相関関数により拍間隔を算出し(ステップT3)、相互相関関数により拍位置を算出することで拍位置を検出する(ステップT4)。
(解析区間の設定)
図5(a)〜(c)は、それぞれ解析区間の設定例を示す概略図である。解析区間設定部102は、解析区間の位置をシフトさせて次の解析区間の開始位置を設定する。たとえば、図5(a)に示すように、直前の解析区間202の終了位置の直後に次の解析区間203の開始位置を設定する。また、図5(b)に示すように、直前の解析区間202の位置と重複して次の解析区間204設定してもよい。また、図5(c)に示すように、直前の解析区間202で検出された拍間隔を飛ばして次の解析区間205設定してもよい。図5(b)に示す解析区間の設定方式では、直前の解析区間202の検出結果を利用し、検出された拍位置の間隔分、解析区間をシフトさせる。なお、シフト量は1拍分(拍間隔)とすることが好ましいがこれに限らない。
(統合および基本拍位置推定)
次に、統合および基本拍位置推定について説明する。図6は、検出した拍位置の統合処理を示す概略図である。たとえば、統合部118は、図5(a)〜(c)に示すいずれかの方法で解析区間をシフトさせ、各時系列上で重複して得られた検出結果を加算する。
図6に示すように、Beat_(n)は各解析区間によって検出された拍位置を示すパワー関数である。Integrated_Beatは統合後の推定拍位置となる。Integrated_Beatは、Beat_(n)の時系列上の各拍位置における検出結果N(整数)を累積することで得られる。図6では、統合された拍位置の情報は関数Integrated_Beatとして表されている。また、Integrated_Beatにはハニング窓等の窓関数を掛け合わせることで、スムージング等の処理をした後にピーク検出を行うことで拍位置の推定結果を得ることや、ピーク間隔によってテンポ(BPM)計算を行うことができる。たとえば、図6におけるIntegrated_Beatで最大値の1/2以上である拍のみを抽出し、基本拍位置として推定することができる。
なお、拍位置の推定の際には、検出された拍位置をbI(1),bI(2),…,bI(m)としたときに、以下の数式を用いて拍位置を算出することもできる。
以上の拍位置推定の各処理はプログラムをコンピュータに実行させることにより行うことができる。なお、上記の実施形態では検証結果を解析区間に反映させるが、検証結果にかかわらず解析区間を設定することとしてもよい。その場合でも、解析区間の検出拍位置と検証区間の検出拍位置とを比較し検証を行うため、拍位置の精度を高めることは可能である。
本発明に係る拍位置推定装置100の構成を示すブロック図である。 本発明に係る拍位置推定装置100の特徴的な動作を示すフローチャートである。 (a)解析区間の設定、(b)解析区間における拍位置の検出、(c)検証区間の設定、および(d)検証区間における拍位置の検出を示す概略図である。 拍位置検出処理を示すフローチャートである。 (a)〜(c)解析区間の設定例を示す概略図である。 検出した拍位置の統合処理を示す概略図である。
符号の説明
100 拍位置推定装置
101 初期設定部
102 解析区間設定部
103 検証区間設定部
106 楽曲データベース
107 区間抽出部
110 拍位置検出部
111 位置判定部
113 記録部
114 検証部
118 統合部
119 基本拍位置推定部
120 拍情報記憶部
121 メタ情報生成部
201〜205 解析区間
301 検証区間
P1〜P3、R1、R2 拍位置

Claims (12)

  1. 楽曲データの拍位置を推定する拍位置推定装置であって、
    最初の解析区間を設定する初期設定部と、
    前記最初の解析区間に続く解析区間を逐次設定する解析区間設定部と、
    前記各解析区間内に検証区間を設定する検証区間設定部と、
    前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出部と、
    前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証部と、を備え、
    前記検証結果に基づき楽曲データ全体にわたり拍位置を推定することを特徴とする拍位置推定装置。
  2. 前記検証区間設定部は、前記各解析区間で検出された拍位置に基づいて、検証区間を設定することを特徴とする請求項1記載の拍位置推定装置。
  3. 前記解析区間設定部は、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴とする請求項1または請求項2記載の拍位置推定装置。
  4. 前記解析区間についての拍位置の検出結果に基づき、前記解析区間の開始位置が適当か否かを判定する位置判定部を更に備え、
    判定の結果、前記解析区間の開始位置が不適当である場合に、前記解析区間設定部は、開始位置をシフトさせた次の解析区間を設定することを特徴とする請求項1から請求項3のいずれかに記載の拍位置推定装置。
  5. 前記解析区間設定部は、前記検証の結果、前記拍位置が一致しないときに、前記検証区間で検出された拍位置を基準にして、次の解析区間の長さおよび開始位置を設定することを特徴とする請求項1から請求項4のいずれかに記載の拍位置推定装置。
  6. 前記解析区間設定部は、前記検証の結果、前記拍位置が一致しないときに、前記検証区間で検出された拍位置の間隔より標準最低拍間隔以上長い間隔を次の解析区間の長さに設定することを特徴とする請求項5記載の拍位置推定装置。
  7. 前記解析区間設定部は、直前に設定された解析区間内で検出された最初の拍位置から、前記解析区間または前記検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定することを特徴とする請求項1から請求項6のいずれかに記載の拍位置推定装置。
  8. 前記解析区間設定部は、直前に設定された解析区間内で検出された最後の拍位置から、前記解析区間または前記検証区間で検出された拍間隔の一拍分シフトさせた位置を開始位置として次の解析区間を設定することを特徴とする請求項1から請求項7のいずれかに記載の拍位置推定装置。
  9. 前記解析区間設定部は、前記検証の結果、前記拍位置が一致しない区間に重ならないよう、次の解析区間の開始位置を設定することを特徴とする請求項1から請求項8のいずれかに記載の拍位置推定装置。
  10. 前記各解析区間で検出された拍位置を楽曲データ全体にわたり統合する統合部を更に備えることを特徴とする請求項1から請求項9のいずれかに記載の拍位置推定装置。
  11. 楽曲データの拍位置を推定する拍位置推定方法であって、
    最初の解析区間を設定すると、
    前記最初の解析区間に続く解析区間を逐次設定する解析区間設定ステップと、
    前記各解析区間内に検証区間を設定する検証区間設定ステップと、
    前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出ステップと、
    前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証ステップと、を含み、
    前記検証区間設定ステップでは、前記各解析区間で検出された拍位置に基づいて、検証区間を設定し、
    前記解析区間設定ステップでは、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴とする拍位置推定方法。
  12. 楽曲データの拍位置を推定する拍位置推定プログラムであって、
    最初の解析区間を設定する初期設定処理と、
    前記最初の解析区間に続く解析区間を逐次設定する解析区間設定処理と、
    前記各解析区間内に検証区間を設定する検証区間設定処理と、
    前記各解析区間または検証区間の楽曲データについて拍位置を検出する拍位置検出処理と、
    前記各解析区間で検出された拍位置と前記各解析区間内の検証区間で検出された拍位置とが一致するか否かを検証する検証処理と、をコンピュータに実行させ、
    前記検証区間設定処理では、前記各解析区間で検出された拍位置に基づいて、検証区間を設定し、
    前記解析区間設定処理では、前記検証結果に基づき楽曲データ全体にわたり解析区間を逐次設定することを特徴とする拍位置推定プログラム。
JP2008243199A 2008-09-22 2008-09-22 拍位置推定装置、拍位置推定方法および拍位置推定プログラム Expired - Fee Related JP5054646B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008243199A JP5054646B2 (ja) 2008-09-22 2008-09-22 拍位置推定装置、拍位置推定方法および拍位置推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008243199A JP5054646B2 (ja) 2008-09-22 2008-09-22 拍位置推定装置、拍位置推定方法および拍位置推定プログラム

Publications (2)

Publication Number Publication Date
JP2010072595A JP2010072595A (ja) 2010-04-02
JP5054646B2 true JP5054646B2 (ja) 2012-10-24

Family

ID=42204385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008243199A Expired - Fee Related JP5054646B2 (ja) 2008-09-22 2008-09-22 拍位置推定装置、拍位置推定方法および拍位置推定プログラム

Country Status (1)

Country Link
JP (1) JP5054646B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508457A (zh) * 2020-04-14 2020-08-07 上海影卓信息科技有限公司 音乐节拍检测方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3674950B2 (ja) * 2002-03-07 2005-07-27 ヤマハ株式会社 音楽データのテンポ推定方法および装置

Also Published As

Publication number Publication date
JP2010072595A (ja) 2010-04-02

Similar Documents

Publication Publication Date Title
JP6017687B2 (ja) オーディオ信号分析
JP4465626B2 (ja) 情報処理装置および方法、並びにプログラム
EP2845188B1 (en) Evaluation of downbeats from a musical audio signal
US9093056B2 (en) Audio separation system and method
US9646592B2 (en) Audio signal analysis
EP2854128A1 (en) Audio analysis apparatus
EP2816550A1 (en) Audio signal analysis
US20080072741A1 (en) Methods and Systems for Identifying Similar Songs
Clarisse et al. An Auditory Model Based Transcriber of Singing Sequences.
US9378719B2 (en) Technique for analyzing rhythm structure of music audio data
JP5127982B2 (ja) 音楽検索装置
CN107210029B (zh) 用于处理一连串信号以进行复调音符辨识的方法和装置
Ryynanen et al. Automatic bass line transcription from streaming polyphonic audio
Cogliati et al. Piano music transcription modeling note temporal evolution
CN104143340B (zh) 一种音频测评方法及装置
CN104157296B (zh) 一种音频测评方法及装置
JP5924968B2 (ja) 楽譜位置推定装置、及び楽譜位置推定方法
JP5054646B2 (ja) 拍位置推定装置、拍位置推定方法および拍位置推定プログラム
Thomas et al. Detection of largest possible repeated patterns in indian audio songs using spectral features
Barbancho et al. Transcription of piano recordings
Caetano et al. Automatic segmentation of the temporal evolution of isolated acoustic musical instrument sounds using spectro-temporal cues
Gurunath Reddy et al. Predominant melody extraction from vocal polyphonic music signal by time-domain adaptive filtering-based method
JPH0675562A (ja) 自動採譜装置
Tang et al. Melody Extraction from Polyphonic Audio of Western Opera: A Method based on Detection of the Singer's Formant.
JP4128848B2 (ja) 音高音価決定方法およびその装置と、音高音価決定プログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120727

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees