[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4487958B2 - メタデータ付与方法及び装置 - Google Patents

メタデータ付与方法及び装置 Download PDF

Info

Publication number
JP4487958B2
JP4487958B2 JP2006073185A JP2006073185A JP4487958B2 JP 4487958 B2 JP4487958 B2 JP 4487958B2 JP 2006073185 A JP2006073185 A JP 2006073185A JP 2006073185 A JP2006073185 A JP 2006073185A JP 4487958 B2 JP4487958 B2 JP 4487958B2
Authority
JP
Japan
Prior art keywords
beat
metadata
beats
music
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006073185A
Other languages
English (en)
Other versions
JP2007248895A5 (ja
JP2007248895A (ja
Inventor
靖 宮島
功誠 山下
基行 高井
顕博 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006073185A priority Critical patent/JP4487958B2/ja
Priority to US11/683,119 priority patent/US7584218B2/en
Priority to KR1020070024993A priority patent/KR101292698B1/ko
Priority to EP07104263A priority patent/EP1835503A3/en
Priority to CN2007100885895A priority patent/CN101038739B/zh
Publication of JP2007248895A publication Critical patent/JP2007248895A/ja
Publication of JP2007248895A5 publication Critical patent/JP2007248895A5/ja
Application granted granted Critical
Publication of JP4487958B2 publication Critical patent/JP4487958B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G3/00Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
    • G10G3/04Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/076Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/091Info, i.e. juxtaposition of unrelated auxiliary information or commercial messages with or between music files
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • G10H2250/031Spectrum envelope processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、音楽の時間軸上のメタデータを付与するメタデータ付与方法及び装置に関する。
近年において、半導体メモリやハードディスク等の大容量記録媒体を利用したオーディオ再生装置が普及してきており、またオーディオ再生専用の装置のみならず、パーソナルコンピュータや携帯電話のような情報機器等の内部の記憶装置に大量の音楽データを保存して楽しむユーザも増加している。これは、例えばCD等のディスクやテープ等の交換可能な記録媒体のようなメディア単位でアルバムを管理することに対して、数百曲、数千曲、さらには数万〜数十万曲もの大量の楽曲データを1台の装置で扱うことを可能とするものである。
このような大量の楽曲に対してメディアの入れ替えなくランダムにアクセスすることが可能となったため、ユーザはアルバム間をまたぐ好みのプレイリストを作ることができるようになった。大量の楽曲の中から効率よく検索を行ったりグルーピングをしたりするために、昨今では楽曲データに対して、曲名(タイトル)、アーティスト名、アルバム名等の楽曲メタデータをデータベースから取得して付加するようなメタデータ付加サービスに注目が集まってきている。このメタデータ付加サービスのシステムは、楽曲のタイトルやアーティストだけでなく、細かい曲のジャンルや、ある程度ではあるがテンポ情報等も取得できる。
しかしながら、これらのメタデータシステムは基本的に楽曲の検索とグルーピング目的で作られており、実際にそれらのデータを利用する音楽再生システムも検索とグルーピング目的で使用している。したがって、検索された結果として再生される曲の聴き方は従来と何も変わらない。
これに対して、プロ、セミプロなどの音楽クリエーター向けに、楽曲そのものを作曲したりアレンジしたりするツールが存在する。これらのツールでは楽曲のテンポやビート(拍)位置を時間軸上で管理し、その位置をもとに楽曲データを編集することが可能になっている。また、同様にDJ向けのソフトウェアにおいてもビートの同期を合わせて複数の楽曲を重ねるためにビートの位置情報を保持しているものがある。
しかしながら、これらのビート情報は基本的に1曲を通してテンポが同じだという前提にたっている。市販のさまざまな録音済みの素材はテンポが局所的に揺れているものが多く、それらに正確なビート位置を付与することは非常に困難である。
ところで、機械が音楽の生の音楽波形から、音楽の小節や拍といったタイミングを自動的に認識できれば、膨大な既存のCD等の音楽コンテンツに対してもビート位置のメタデータを得ることができ、新たなエンターテインメントの可能性が広がる。
このようなテンポやビートを自動的に抽出する試みは従来より行われてきている。
例えば、特許文献1には、時系列信号としての音楽波形信号の自己相関を算出し、この算出結果に基いて音楽のビート構造を解析し、さらにこの解析結果に基づいて音楽のテンポを抽出する方法が開示されている。
また、特許文献2には、楽曲データから複数の周波数帯別の音圧データを作成し、その複数の周波数帯の中からリズムを最も顕著に刻む周波数帯を特定し、特定した周波数タイミングの音圧データにおける変化周期に基づいてリズム成分を推定する方法が記載されている。
特開2002−116754公報 特許第3066528号公報
リズム、ビート、テンポ等を自動的に抽出する技術を大きく分類すると、上記特許文献1のように音楽信号を時間領域で分析するものと、上記特許文献2のように周波数領域で分析するものとに分けられる。
しかし、前者の時間領域で分析するものは、ビートと時間波形とが必ずしも一致するわけではないので、本質的に高い抽出精度が得られない。また、後者の周波数分析を用いるものは、前者よりも比較的抽出精度を向上させることができるが、周波数分析により得られたデータの中には、特定の音符におけるビート以外に多くのビートが多く含まれ、全てのビートから特定の音符におけるビートを分離することが極めて困難である。また、音楽のテンポ(時間周期)自体にも大きな揺らぎがあるため、それらの揺れに追従して、特定の音符におけるビートのみを抽出するのは極めて困難である。
本発明は、このような従来の実情に鑑みて提案されたものであり、楽曲データに対してビート(拍)位置や小節等の時間軸上のメタデータを容易かつ正確に付与できるようなメタデータ付与方法及び装置を提供することを目的とする。
本発明に係るメタデータ付与方法は、上述した目的を達成するために、楽曲データの小節の頭の位置を少なくとも2箇所指定する工程と、上記指定された2箇所の位置の間を分割して時間軸上のメタデータを付与する工程と、上記楽曲データに対して信号処理により自動的にビート情報を抽出する自動ビート抽出工程とを有し、上記自動ビート抽出工程により抽出された自動抽出ビートが本来の拍子にタイミングがあっていると判断した第1類ビートと、上記自動抽出ビートが見つからず本来の拍子に従って自動的に補間された第2類ビートと、自動ビート抽出が行われたが本来の拍子の位置ではないと判断した第3類ビートとに分類し、これらの第1類〜第3類ビートのそれぞれの表示色を異ならせて表示部に表示する。
また、本発明に係るメタデータ付与装置は、楽曲データの小節の頭の位置を少なくとも2箇所指定する入力手段と、上記指定された2箇所の位置の間を等間隔で分割して時間軸上のメタデータを付与するメタデータ付与手段と、上記楽曲データに対して信号処理により自動的にビート情報を抽出する自動ビート抽出手段とを有し、上記自動ビート抽出手段により抽出された自動抽出ビートが本来の拍子にタイミングがあっていると判断した第1類ビートと、上記自動抽出ビートが見つからず本来の拍子に従って自動的に補間された第2類ビートと、自動ビート抽出が行われたが本来の拍子の位置ではないと判断した第3類ビートとに分類し、これらの第1類〜第3類ビートのそれぞれの表示色を異ならせて表示部に表示する。
ここで、上記小節の頭として指定する2箇所の内少なくとも1箇所は、楽曲を聴きながら、手作業で指定入力することが好ましい。
また、上記指定された2箇所の位置の間の区間を、小節の長さまたは小節の数で割り算してビート位置や小節を算出することが好ましい。
本発明によれば、楽曲データに対して、音楽のリズムにおけるビート位置や小節の頭位置を高精度に抽出することが可能となる。
本発明は、オーディオ信号(音響信号、音声信号)のビート位置を簡単かつ正確に抽出するための技術であり、オーディオ信号の楽曲データに対して少なくとも2箇所の区切り(小節の頭)を指定し、指定された2箇所の間を等間隔で分割してビート位置(小節の頭の位置を含む)を抽出するものである。上記区切りとして指定される2箇所の内少なくとも1箇所は、楽曲を聴きながら、手作業で指定入力している。
このような本発明を適用した実施の形態としては、例えば図1に示すような構成が挙げられる。この図1において、楽曲データを含む音響(オーディオ)信号供給装置1からの楽曲データは、ビート抽出装置2に送られ、自動ビート抽出部3にて自動的にビート抽出が行われる。自動ビート抽出部3にて自動的に抽出されたビートは、手動オーサリング部4に送られて、人(作業者)の手作業により修正がなされ、時間軸メタデータ5として付与される。また、音響信号供給装置1からの楽曲データに対して、手動オーサリング部4により直接ビート抽出を行って時間軸メタデータ5を付与してもよい。
ここで、例えば楽曲データに正確な時間軸上のメタデータを付与するために、楽曲データのビート位置を抽出するためには、従来より、楽曲データの音声信号を信号処理にかけて周波数分析や音圧分析を施す手法が知られており、楽曲のビートがはっきりしていてなおかつビート間隔が一定であれば、このような自動抽出方法でも高い確率で正確なビート位置を抽出し、ビート位置のメタデータを生成することが可能である。
しかしながら、人間が楽器を演奏して録音した楽曲の場合、図2のようにテンポは局所的に揺れており、各ビート間の間隔は一定ではない。この図2は、ライブ録音された楽曲における時間(拍数)に対する瞬時BPM(Beat Per Minutes)を示すグラフである。また、楽曲によっては数小節以上にわたる範囲で平均BPMが早くなっていたり、だんだん遅くなっているなどのように、局所的な揺れではない場合も多い。
このような楽曲に対しては、その曲のテンポを表すのに平均BPMという指標はあまり意味がなく、そのBPMを用いて均等にビート位置を決定しても実際のビート位置とは大きく異なる位置となる可能性がある。
また、信号処理によってビートの位置が正確に抽出できて揺れをある程度吸収できたとしても、小節の頭や拍子、メロディの種類や開始位置を正確に抽出することは非常に困難である。
楽曲データに正確な時間軸上のメタデータを付与するための方法として、人間が手作業で行うことも考えられるが、1曲あたり数百〜数千個にも及ぶビートの位置を確認しながら打ち込むことは作業量が極めて多く、さらに、数百曲、数千曲もの楽曲についてこれを行うことは現実的ではない。
本発明の実施の形態では、上述した図1の自動ビート抽出部3での信号処理により自動的に抽出したビートを元に、手動オーサリング部4により人間にしか分かりえない抽象度の高いデータを正確かつ簡単に手作業で付与できるシステムを提案している。また、自動ビート抽出部3でのビート自動抽出は原理的に100%の正確性を持つことはできないため、誤抽出した場合にも手動オーサリング部4により簡単に修正できるシステムを提案している。なお、図1の自動ビート抽出部3は必須のものではなく、手動オーサリング部4により、音響信号供給装置1からの楽曲データに対して直接ビート付与を行うようにしてもよい。
図3は、上記ビート抽出システムの手動オーサリング部4による処理を実現するためのグラフィカルな操作入力画面、いわゆるGUI(Graphical User Interface)の一例を示す図である。この図3において、処理対象となるオーディオ信号の楽曲データの波形が、波形表示部301に表示され、この波形表示部301には、後述するビート情報も表示される。図3の例の波形表示部301は、例えばステレオ左右チャンネルに対応して2つ設けられている。また図3の例では、処理対象オーディオ信号の楽曲データをより広範囲に表示するための表示部302が設けられ、時間軸(拍)に対する瞬時BPMが表示されている。
図4は、上記波形表示部301に表示されるビート表示形態の例を示したものである。楽曲の音声波形データが表示される波形表示部301の表示領域において、例えば下半分は、予め抽出されたビート情報が表示されるビート抽出領域303、上半分は、予め抽出されたビートをもとに最終的なビート情報の清書あるいは編集を行うビート編集領域304になっている。下段のビート抽出領域303には、例えば上記自動ビート抽出部3により自動的に抽出されたビート情報として、上記音声波形に重ねてビート位置を示す線(棒)が表示される。ここで表示されるビート情報の種類としては、上記自動ビート抽出部3の機能に応じたものとなる。
例えば図5は、上記ビート抽出領域303及びビート編集領域304に表示されるビート情報のみを取り出して示している。この図5のビート抽出領域303の例においては、信号処理によって自動ビート抽出が行われ、かつ本来の拍子にタイミングがあっていると判断した第1類ビートBa、自動ビート抽出ができなかったが、本来の拍子に従って自動的に補間された第2類ビートBb、及び自動ビート抽出が行われたが、本来の拍子の位置ではない第3類ビート(例えばいわゆる裏拍)Bcを示している。以下の説明では、上記第1類ビートBa及び第2類ビートBbをインビート(In Beat)、上記第3類ビートBcをアウトビート(Out Beat)と称する。これらの各種ビートBa〜Bcについては、それぞれの表示色を異ならせて、例えば、上記第1類ビートBaを水色、第2類ビートBbをピンク、第3類ビートBcをオレンジの線(棒)にて表示させて、視覚的に容易に確認できるようにすることが好ましい。なお、本実施の形態における上記自動ビート抽出部3の具体例については後述する。
このようなビート抽出領域303に表示された既に抽出されたビートをもとに、より正確なビート情報を求めて、ビート編集領域304に表示する。図5のビート編集領域304の例では、小節の頭Bd、通常のビートBeを示している。この場合、楽曲に対しより正確にビート位置及び小節位置を求めるために、次に挙げるような問題点を考慮し、解決することが必要とされる。
すなわち、
(1)自動ビート抽出による結果は100%正確であるとは限らない、
(2)自動ビート抽出は本質的に小節の頭の位置や拍子を認識することが非常に難しく、100%の正答率にすることは不可能である、
(3)上記抽出の誤りを誤りであると機械が認識することができないため、人間が実際に耳で聴いて手作業で修正するしかない、
(4)反対に最初からすべてを手作業で行う場合、1曲あたり数百〜数千ものビートをすべて打ち込むことは非常な労力を必要とする、
(5)手作業で入力する場合、その位置は信号処理によって抽出した位置に比べて不正確な可能性が高い、
(6)楽曲そのもののビート、テンポが非常に大きく揺らいでいることがある、
との問題点が挙げられる。
これらの(1)〜(6)の問題点を考慮し、本発明の実施の形態においては、次の方針に従って解決を図った。すなわち、
(a)小節の頭の位置は人間が聴かなければ分からないので自動抽出に頼らない(人間の音楽認識能力は優れている)、
(b)誤抽出していない限り自動ビート抽出によるビート位置を利用する、
(c)誤抽出があった場合、その箇所が簡単に分かるようにする、
(d)誤抽出があった場合、手作業による修正を極力簡単にできるようにする、
との方針である。
以下、本発明の実施の形態における上記各方針(a)〜(d)に従った解決法の具体例について説明する。
上記(a)の「小節の頭の位置は人間が聴かなければ分からないので自動抽出に頼らない」点については、次のような工夫を施した。
楽曲は小節で構成されており、小節は拍で構成される。2拍子であれば1小節の中に拍は2つ入り、4拍子であれば4つ入る。
したがって、楽曲データの小節の頭を人間が耳で聴いて判断する場合、図6のように、はっきりと小節の頭であると分かる2箇所(Z1,Z2)を指定し、その2点間の中の小節数nを入力することで、その区間のビートと小節を自動的に求める(補間する)ことが可能である。この指定は、楽曲データを再生して人間が耳で聞きながら、小節の頭と認識したタイミングで、例えば図3のGUI画面のタップボタン311をタップする(マウスによりクリックする)ことにより行われる。この指定を少なくとも2箇所行うことが必要であるが、楽曲の開始位置は小節の頭であることが多いことから、1箇所を楽曲の開始位置で代用することも可能であり、この場合に、楽曲を聴きながらの手作業での指定入力は1箇所で済むことになる。
このように小節の頭とされる2箇所(Z1,Z2)が指定され、その間の小節数nが入力されたとき、小節の長さLBarは、LBar=(Z2−Z1)/nで表され、各ビートの長さ(ビート間隔、ビート周期)Lbは、Lb=(LBar/拍子分子)で表される。例えば図7では、指定された2箇所の点Z1,Z2の間の小節数n=142を入力することで、小節の長さLBar及びビート間隔Lbが求められている。
上述した例では、小節の数が分かっているという前提で、指定された2箇所(Z1,Z2)の2点間から小節の長さを求めたが、小節の数を数えることは非常に煩わしい。逆に小節の長さLBarが分かっていればそこから小節数が分かることを考慮し、小節の長さLBarと上記指定点Z1,Z2とから、各小節とビートの位置を求める方法を次に説明する。この際ポイントとなるのは、上記指定点Z1,Z2は小節の頭であることが保証されており、なおかつこの区間における小節の数は整数値しか取りえない。したがって、小節の長さから小節数を求める場合には、正確ではなくとも1小節の概略の長さを指定することで、小節数nが整数となるもっとも近傍の正しい小節の長さが求められる。これは、例えば図8に示すように、上記指定点Z1,Z2は振動における固定端に相当すると考えることができる。
上記2箇所の指定点Z1,Z2は、小節の頭として指定されたものであるから、これらの2点間に入る小節数nは整数にしかならない。そこで、概略(だいたい、おおよそ)の小節長を指定して、自動的に小節数が整数になる小節長に調節すればよい。概略の小節長をLaとし、ちょうど小節数n個がぴったり入る小節長をLBarとすると、次の処理を行うことによりLBarを求めることができる。
nf=((Z2−Z1)/La)+0.5
n=INT(nf)
LBar=(Z2−Z1)/n
ここで、nfを求める式中で0.5を足しているのは、次のnを求める式で四捨五入をするためであり、nを求める式中のINT(x)は、xの小数点以下を切り捨てる(整数部分を求める)関数である。
2つの小節頭の指定点Z1,Z2の間に小節とビートを打つことは、このように小節の数あるいは小節の概略の長さが分かればよいわけであるが、小節の数も概略の長さもわからない場合には、次のような方法が有効である。
前述した例では、自動抽出されたビート(拍)に、インビート(In Beat)とアウトビート(Out Beat)がある。インビート(In Beat)は自動抽出アルゴリズムによって、その楽曲本来のビートを抽出した部分である。小節の頭かどうか、拍子はいくつかということは分からないが、実際の拍子の半分や2倍になっていることが多い。この性質を利用すると、インビート(In Beat)をもとに小節の頭を指定し、ユーザが指定する拍子(4/4拍子や3/4拍子など)毎に仮の小節頭を規則的に設定すれば仮の小節頭が区間内に並ぶことになる。したがって、指定点Z1,Z2の間にある仮の小節数を数えてnとするか、あるいは小節の頭同士の差分をとることによってLBarが簡単に求められる。
ただし、自動抽出したビートは、本来の拍子の2倍や半分などで抽出していることもあるため、その場合には本来の小節の長さのそれぞれ半分、2倍になってしまう。しかしながら、楽曲データの再生音を人間が耳で確認すると、2倍になっているのか半分になっているのかは即座に識別が可能である。そこで本発明の実施の形態では、上記指定点Z1,Z2における小節数nを2倍にしたり半分にしたりして即座に再計算を行うインターフェースを用意した。例えば、上記図3のボタン312、313が、nをそれぞれ2倍にしたり半分にしたりするボタンである。このように小節数nが決定されれば、上述したような処理によってビート位置の再計算は簡単に行える。これにより、わずかなステップ数で正確な小節数及び小節の長さを求めることができる。
さらに、本発明の実施の形態では、小節数nを手動で+1あるいは−1するインターフェース(図3のボタン314、315)も用意している。これは、上記指定点Z1,Z2間の距離が長い場合に、誤差が大きくなり、上記概略の長さLaにより求められる小節数nが実際よりも一つ多くなったり、一つ少なくなったりすることが多々あるからである。この場合も、楽曲データの再生音を耳で確認してビートが聴感上ずれてきたら、小節数nを+1、−1してやれば、自動的にLBarを再計算して小節とビートの位置を打ち直す。これらはすべて上記指定点Z1,Z2間の小節数nが整数値になるという性質を利用している。
次に、上記(b)の「誤抽出していない限り自動ビート抽出によるビート位置を利用する」点に対しては、具体的に次の工夫を行った。
上記小節の頭位置と小節の数及び長さを決める処理を行って、上記指定点Z1,Z2の間に小節とビートを補間していく処理を行うが、均等に補間してしまうと、図2で示したようなビート間隔に揺れのある楽曲に対して実際のビート位置と計算で求めたビート位置がずれてしまうという問題が生じる。
本発明の実施の形態においては、信号処理による自動抽出されたビートの情報を併用することでこの問題を解決している。すなわち、上記図1の自動ビート抽出部3によるビートの自動抽出で得たビート位置情報は、信号処理によってビートの揺れに追従がなされたものであるため、その位置情報を可能な限りそのまま利用する。ただし、自動抽出したビートが間違えている可能性がある場合にはその位置のビート位置情報は使用せずに計算で求めた位置情報を使用する。このような処理の流れを、図9−1、図9−2を参照しながら説明する。
図9は、人が小節の頭に付与した指定点Z1から後方の指定点Z2に向かって順に小節及びビートの位置情報を付与していく処理の動作を説明するためのフローチャートである。
図9のステップS401において、上記小節の長さ(小節長)LBarを求める。これは、上述したように、上記小節頭の指定点Z1,Z2の位置及び小節数nを用いて、
LBar=(Z2−Z1)/n
の式により求めればよく、小節数nについては、上述した概略の小節の長さLaから求めるようにしてもよい。
次のステップS402では、ステップS401で求めた小節長LBarを拍子で割って、
Lb=LBar/拍子
の式により仮のビート長Lbを求める。
次のステップS403では、この処理中に最後にビートを打った(最近にビート位置を付与した)位置を示す変数Paに、初期値としての上記指定点Z1の位置を代入(Pa=Z1)することにより、変数Paを初期化する。また、次のステップS404で、最後に小節の頭を打った(最近に小節頭位置を付与した)位置を示す変数PBarに、初期値としての上記設定点Z1の位置を代入(PBar=Z1)することにより、変数PBarを初期化する。
ステップS405では、次のビート候補の位置を示す変数Pcに、Pa+Lbの値を代入(Pc=Pa+Pa)する。すなわち、最後の(最新の)ビート位置Paから上記仮のビート長Lbだけ進んだ位置を次のビート候補の位置Pcとする。この候補位置Pcを中心として閾値Tiの範囲内(ウィンドウ幅内)に自動抽出ビートが存在するかどうかを調べるわけであるが、先にステップS406で、上記候補位置Pcが上記指定点Z2より小さい(Pc<Z2)か否かを判別する。このステップS406でYes、すなわち上記候補位置Pcが上記指定点Z2より前の位置のとき、ステップS407に進み、Noのとき、処理を終了する。
ステップS407では、上記候補位置Pcを中心として閾値Tiの範囲内に自動抽出したインビート(In Beat)があるか否かを判別し、Yes(In Beatあり)のときはステップS408に進む。ステップS408では、そのインビート(In Beat)の位置Piにビート情報を打ち、次のステップS409で、後の処理のための実際にビートを打った最新位置を示す変数PaにPiを代入(Pa=Pi)することによりPaを更新し、後述するステップS415に進む。
上記ステップS407でNo(自動抽出されたIn Beatなし)と判別されたときは、ステップS410に進み、上記候補位置Pcを中心として閾値Toの範囲内(ウィンドウ幅内、本実施の形態ではTi>To)に自動抽出したアウトビート(Out Beat)が存在するか否かを判別する。ステップS410でYes(Out Beatあり)と判別されたときは、ステップS411でそのアウトビート(Out Beat)の位置Poにビート情報を打つ。次のステップS412では、後の処理のためのビートを打った最新位置を示す変数PaにPcを代入(Pa=Pc)することによりPaを更新し、ステップS415に進む。
上記ステップS410でNo(自動抽出されたOut Beatなし)と判別されたときは、ステップS413に進み、上記候補位置Pcの位置にビート情報を打ち、次のステップS414で、後の処理のためのビートを打った最新位置を示す変数PaにPcを代入(Pa=Pc)することによりPaを更新し、ステップS415に進む。
ステップS415では、最後に打ったビート(上記最新位置を示す変数Paの位置のビート)が小節の頭か否かを判別し、YesのときはステップS416に進み、Noのときは上記ステップS405に戻る。
ステップS416では、上記最後に打ったビート位置Paと最後に打った小節の頭の位置PBarとを用いて、Pa−PBarから直近の小節の長さを求め、ビートの長さ候補Lbを、求めた小節の長さと拍子から更新する。すなわち、
Lb=(Pa−PBar)/拍子
とする。次のステップS417では、小節頭の最新位置を示す変数PBarに上記Paを代入(PBar=Pa)することによりPBarを更新し、その後、上記ステップS405に戻る。
以上のステップS405からステップS417までの処理は、上記ステップS406においてNoと判断されるまで、すなわち上記候補位置Pcが上記指定点Z2に到達するまで繰り返される。
図10は、このようにしてビートや小節の頭が打たれる様子を示す図であり、上記自動抽出されたビートが表示されるビート抽出領域303と、この抽出されたビートに対応してビートや小節の頭が打たれたビート編集領域304の具体例を示している。ただし、この図10には、上記図5と同様に、楽曲データの波形表示を省略して図示している。ここで、上記図5と共に説明した第1類ビートBaは、自動抽出したインビート(In Beat)として図10の位置Piのビートに対応し、第2類ビートBbは、自動抽出したアウトビート(Out Beat)として図10の位置Poのビートに対応する。
この図10において、上記指定点Z1は、上記図9のステップS403、S404に示したように、最後の(最新の)ビート位置Pa、小節頭位置PBarの初期値である。この最後の(最新の)ビート位置Pa(=Z1)に上記仮のビート長Lbを加算した位置を次のビート候補341の位置Pcとし、この候補位置Pcを中心として閾値Tiの範囲内(ウィンドウ幅内)に上記自動抽出したビートが存在するかを調べる。
図10の例では、ビート抽出領域303において、上記ビート候補341の位置Pcを中心とする閾値Tiの範囲内に自動抽出されたインビート(In Beat)342が存在していることから、図9のステップS407でYesと判別されてステップS408に進み、この抽出ビート342の位置Piに対応するビート編集領域304に、ビート343を打ち、ステップS409で、上記最後の(最新の)ビート位置を表す変数Paにビート343の位置Piを代入(Pa=Pi)してPaを更新する。
この更新されたPaから上記仮のビート長Lbだけ進んだ位置を次のビート候補344の位置Pcとし、この位置Pcを中心とする閾値Tiの範囲内の自動抽出ビートを調べると、図10のビート抽出領域303には、アウトビート(Out Beat)345とインビート(In Beat)346が存在している。図9のフローチャートから明らかなように、先にステップS407でインビート(In Beat)が存在するか否かが調べられてYesと判断され、ステップS408に進むことから、閾値Tiの範囲内のインビート(In Beat)346の位置Piに対応するビート編集領域304にビート347が打たれ、この位置Piで上記変数Paが更新され(Pa=Pi)る。
この最後に(最近に)打たれたビート347の位置Paから上記仮のビート長Lbだけ進んだ位置のビート候補348を中心とする閾値Tiの範囲内の自動抽出ビートを調べると、図10のビート抽出領域303には、アウトビート(Out Beat)349が存在するが、インビート(In Beat)は存在しない。例えば、次のインビート(In Beat)250は、閾値Tiの範囲内から外れている。従って、上記図9のステップS407でNoと判断され、ステップS410に進んで、ビート候補348の位置Pcを中心とする閾値Toの範囲内(本実施の形態ではTi>To)に自動抽出されたアウトビート(Out Beat)が存在するか否かを判別する。図10のビート抽出領域303のアウトビート(Out Beat)349は、閾値Toの範囲内に入っているから、ステップS410でYesと判別されてステップS411に進み、このアウトビート(Out Beat)349の位置Poに対応するビート編集領域304にビート351が打たれ、ステップS412で、この位置Poが上記変数Paに代入(Pa=Po)されることによりPaが更新される。
さらにビート351の位置Paから上記仮のビート長Lbだけ進んだ位置のビート候補352については、このビート候補352の位置Pcを中心とする閾値Tiの範囲内にインビート(In Beat)は存在せず、位置Pcを中心とする閾値Toの範囲内にアウトビート(Out Beat)も存在しないため、図9のステップS407でNo、ステップS410でもNoと判別され、ステップS413に進んで、ビート候補352の位置Pcに補間用のビート353を打つ。
このように、次のビートの候補位置Pcから所定の閾値の範囲内に存在する自動抽出ビートをそのまま用いて(自動抽出ビートの位置に吸着させて)処理後のビートを得るようにしており、また、上記所定の閾値の範囲内に自動抽出ビートが存在しないとき、次のビートの候補位置Pcに補間用のビートを付与している。
次に、上記(c)の「誤抽出があった場合、その箇所が簡単に分かるようにする」点については、次のようにしている。
図10で示すビート編集領域304において、上記指定点Z1,Z2の間の区間内にビートを打つときに、ビート抽出領域303に表示される自動抽出ビートが、上記ビート候補位置Pcを中心とする範囲の閾値Ti及びToのウィンドウ幅内に見つかったかどうかによって、ビート編集領域304に表示されるビート343,347,351,353等の色を異ならせている。
例えば、本実施の形態では、自動抽出ビートのインビート(In Beat)位置Piに吸着できたビート343,347等を水色(あるいは青色)で表示し、自動抽出ビートのアウトビート(Out Beat)位置Poに吸着できたビート351等を黄色(あるいはオレンジ色)で表示し、自動抽出ビートが所定の閾値範囲内に見つからなかったため計算による補間を行ったビート353等を赤色(あるいはピンク色)で表示するようにしており、いわゆる信号機の色に関連付けて、水色(青色)、黄色、赤色の順に、そのビートの信頼性を高い方から低い方に表現している。
これにより、自動ビート抽出したビート位置と、上記指定点Z1,Z2の区間における小節位置及びその区間のビート付与位置が、上記候補位置近傍の閾値Tiの範囲内に入っているビートは水色(青色)で表示される。
これに対して自動抽出時に誤抽出が起きている場合、抽出されたビート位置と、上記指定点Z1,Z2の区間におけるビート付与位置に矛盾が生じる。正しく抽出されない場合の多くは、楽曲の中で数〜数十小節にわたってテンポが大きく変化している部分があったり、ビートがはっきりしない曲調の曲において正確なインビート(In Beat)がとれなかった場合である。このような状態では指定点Z1,Z2の区間内に入るビートの数が拍子の数で割り切れなくなる。各指定点Z1,Z2は小節の頭であるため、その区間に入るビートの数は必ず拍子の倍数になっているはずである。しかしながら、上記のような誤抽出が起こると、上記区間に入るビートの数が合わなくなり、図10における閾値Ti及びToの範囲内に入らないビートが出はじめ、ちょうど1ビートずれたビートが閾値に入るまでこの状態が続く。すると結果として編集領域304には赤色のビートが連続して表示されるため、ビートずれが起きた位置を簡単に見つけることができる。
また、上記図3のGUI画面の例えば表示部302に、各ビートの瞬時BPMの誤差、同累積誤差、位相ずれ量をグラフで可視化することによって、信号処理により自動抽出されたビートがどれくらい信頼できるかを予想することが可能となる。ここで、図11は、上記表示部302の表示例を示し、(A)は生演奏あるいはライブ録音された場合などのようにビートが大きく揺らいでいる例を、(B)はコンピュータ打ち込みなどによる再生音の例をそれぞれ示している。これらの図11の(A)、(B)において、曲線Qaが各ビートの瞬時BPMの誤差、曲線Qbが各ビートの瞬時BPMの累積誤差、曲線Qcが位相ずれ量である。
図11の(B)のように楽曲のBPMが安定していて自動抽出がうまくいった場合には、上記3種類の曲線Qa、Qb、Qcが略々横一直線に重なる。しかし、図11の(A)のように大きくビートが揺らいでいる場合、それぞれの曲線Qa、Qb、Qcは大きく乖離する。従って、このような表示を行うことによって、自動抽出ビートの信頼性を一目で確認することができる。
次に、上記(d)の、「誤抽出があった場合、手作業による修正を極力簡単にできるようにする」点については、次のような対策を施した。
誤抽出が起こる原因は、前述したように、楽曲の中で数〜数十小節にわたってテンポが大きく変化している部分があったり、ビートがはっきりしない曲調の曲において正確なインビート(In Beat)がとれなかった場合が多い。またそれに加えて作曲者や演奏者が意図的に部分的に拍子を変えている場合がある。
このような楽曲においてビートが正確に抽出されなかった部分は、上記図10や図11等と共に説明した方法で簡単に検出できるが、さらに、それを容易に修正できることが必要とされる。具体的には、このような楽曲に対して区間を2以上設定可能とし、各区間毎に正確なビート位置や小節頭位置を求めるようにすることが好ましい。すなわち、図12に示すように、3箇所以上の指定点Z1,Z2,Z3,…を指定入力し、これらの指定点Z1,Z2,Z3,…の間の区間毎に、上記図9、図10と共に説明したような処理を行わせる。
この場合、各指定点Z1,Z2,…はそれぞれ小節の頭であり、これらの指定点Z1,Z2,…からそれぞれ次の指定点までの間で構成される各区間の小節の長さ、小節数、拍子は個別に管理されている。従って、自動抽出がうまくいかなかった部分を含む区間と、うまく行いった区間に分離し、それぞれの区間毎に異なる小節長で個別に上述したようなビート付与の計算を行う。
このような区間設定とは別に、上記図1の手動オーサリング部4は、時間軸上のメタデータとして、楽曲のメロディ構造、例えばイントロ、Aメロディ、Bメロディ、サビ、エンディング等に応じた楽曲構造情報を入力することも可能である。具体的には、図13に示すように、上記波形表示部301等の楽曲データの上記ビート位置や小節頭位置の表示と共に、ユーザの入力操作に応じて、上記メロディ構造の各部を区別するための変化位置の位置情報を示すマーク451が付与されて表示される。これらのメロディ構造に応じた変化位置については、上記指定点Z1,Z2,…とは異なるものであるが、小節の頭であることが多く、また、例えばイントロは他の部分より遅めなどのようにメロディ構造の各区間毎にテンポや拍子を変えることもある。
以上説明した本発明の実施の形態により、楽曲の正確なビート位置が必要なアプリケーションのための時間軸上のメタデータを簡単かつ正確に付与することが可能となり、また、そのビート位置を元に、正確なメロディやコード進行、歌詞などの情報も付与することが可能となる。
これにより、正確なメタデータがないと実現が困難であった音楽リミックスアプリケーションや、ビートに同期して正確なタイミングで制御が必要なデバイスやソフトウェアを製作することが可能となる。
次に、上述したような手動によるビート位置や小節頭位置の付与を行う上記図1の手動オーサリング部4を有するビート抽出装置2を含むメタデータ抽出システムの全体構成について、自動ビート抽出部3の具体例も含めて説明する。
図14は、本発明の実施の形態となる上記図1のビート抽出装置2を含む装置のハードウェア構成の一例を概略的に示すブロック図である。この図14に示す装置10は、例えば、パーソナルコンピュータで構成され、図1の自動ビート抽出部3及び手動オーサリング部4の機能を実現するのみならず、音楽コンテンツ供給機能や音楽再生機能をも有するものである。
上述したような図1の手動オーサリング部4での処理の原データ(入力データ)となる自動抽出ビートを得るための自動ビート抽出部3は、本発明を実現するためには必ずしも必要とするものではないが、この自動ビート抽出部3でのビート抽出精度が高ければ高いほど、上述した手動オーサリングの手間が省け、またより高品質のビート抽出や小節頭の抽出が行えるため、高性能の自動ビート抽出部3を用意することは重要である。この点を考慮し、上記図1の自動ビート抽出部3の好ましい具体例についても詳細に説明する。
図14に示す装置において、システムバス100には、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103とが接続されている。ROM102には各種プログラムが記録されており、CPU101は、ワークエリアとしたRAM103上でこれらのプログラムに基づく処理を実行する。
また、システムバス100には、音声データデコード部104と、メディアドライブ105と、通信ネットワークインターフェース(インターフェースは図ではI/Fと記載する。以下同じ。)107と、操作入力部インターフェース109と、ディスプレイインターフェース111と、I/Oポート113及びI/Oポート114と、入力部インターフェース115と、HDD(Hard Disc Drive)121とが接続されている。各機能ブロックで処理される一連のデータは、このシステムバス100を介して他の機能ブロックに供給される。
メディアドライブ105は、CD(Compact Disc)、DVD(Digital Versatile Disc)等のディスク106に記憶されている音楽コンテンツの音楽データを、システムバス100に取り込む。
操作入力部インターフェース109には、キーボード、マウス等の操作入力部110が接続されている。
ディスプレイ112は、手動オーサリング時には、主として上記図3と共に説明したようなGUI画面を表示するものであるが、この他、自動ビート抽出時などに、例えば、抽出したビートに同期した表示をしたり、抽出したビートに同期して踊る人形やロボットを表示したりすることも可能である。
I/Oポート113には、オーディオ再生部117と、ビート抽出部11とが接続されている。また、I/Oポート114には、ビート抽出部11が接続されている。このビート抽出部11が、上記図1の自動ビート抽出部3に略々対応するものである。
入力部インターフェース115には、A/D(Analog to Digital)変換器116Aと、マイクロホン端子116Bと、マイクロホン116Cとを備える入力部116が接続されている。マイクロホン116Cで収音された音声信号や音楽信号は、A/D変換器116Aでデジタルオーディオ信号に変換されて入力部インターフェース115に供給される。入力部インターフェース115は、このデジタルオーディオ信号をシステムバス100に取り込む。システムバス100に取り込まれたデジタルオーディオ信号(時間波形信号に相当)は、HDD121上に.wavファイル等の形式で記録される。この入力部インターフェース115を介して取り込まれたデジタルオーディオ信号は、オーディオ再生部117に直接は供給されない。
音楽データデコード部104は、システムバス100を介してHDD121またはメディアドライブ105から音楽データが供給されると、この音楽データをデコードし、デジタルオーディオ信号を復元する。音楽データデコード部104は、この復元されたデジタルオーディオ信号を、システムバス100を介してI/Oポート113に転送する。I/Oポート113は、システムバス100を介して転送されてくるデジタルオーディオ信号をビート抽出部11及びオーディオ再生部117に供給する。
既存のCD等のメディア106はメディアドライブ105を通して、システムバス100に取り込まれる。リスナーがダウンロード等をすることにより取得されてHDD121に取り込まれている非圧縮音声コンテンツは、直接システムバス100に取り込まれる。一方、圧縮音声コンテンツは、一旦、音声データデコード部104を通してシステムバス100に戻される。入力部116から入力部インターフェース115を介してシステムバス100に取り込まれたデジタルオーディオ信号(デジタルオーディオ信号は、音楽の信号に限らず、例えば、人声信号やその他のオーディオ帯域信号を含むものとする)も一旦、HDD121に取り込まれた後、再びシステムバス100に戻される。
本発明を適用した一実施形態における装置10では、システムバス100に取り込まれたデジタルオーディオ信号(時間波形信号に相当)は、I/Oポート113に転送され、ビート抽出部11に供給される。
本発明の一実施形態に用いられるビート抽出部11は、楽曲におけるリズムのビート位置情報を抽出するビート抽出処理部12と、ビート抽出処理部12により抽出されて得られたビート位置情報を用いてビート周期情報を生成し、このビート周期情報に基づいて、ビート抽出処理部12により抽出されたビート位置情報のビートを整列するビート整列処理部13とを備える。
図15に示すように、ビート抽出処理部12は、.wavファイルに記録されているデジタルオーディオ信号が供給されると、このデジタルオーディオ信号から粗いビート位置情報を抽出し、結果を.mtyファイルに記録されたメタデータとして出力する。また、ビート整列処理部13は、.mtyファイルに記録されたメタデータの全部、又はテンポが同じと想定される楽曲部分に対応するメタデータを用いて、ビート抽出処理部12により抽出されたビート位置情報を整列し、結果を.mayファイルに記録されたメタデータとして出力する。これにより、段階的に精度の高い抽出ビート位置情報を得ることが可能となる。なお、ビート抽出部11についての詳細は、後述する。
オーディオ再生部117は、D/A変換器117Aと、出力アンプ117Bと、スピーカ117Cとを備える。I/Oポート113は、システムバス100を介して転送されてくるデジタルオーディオ信号を、オーディオ再生部117が備えるD/A変換器117Aに供給する。D/A変換器117Aは、I/Oポート113から供給されたデジタルオーディオ信号をアナログオーディオ信号に変換し、出力アンプ117Bを通じてスピーカ117Cに供給する。スピーカ117Cは、この出力アンプ117Bを通じてD/A変換器117Aから供給されたアナログオーディオ信号を音響再生する。
ディスプレイインターフェース111には、例えば、LCD(Liquid Crystal Display)等からなるディスプレイ112が接続されている。ディスプレイ112には、例えば、音楽コンテンツの音楽データから抽出されたビート成分やテンポ値が表示される。また、ディスプレイ112には、音楽に同期して、例えば、アニメーション画像や歌詞が表示される。
通信ネットワークインターフェース107は、インターネット108に接続されている。音楽再生装置10では、音楽コンテンツの属性情報を記憶するサーバに、インターネット108を介してアクセスし、音楽コンテンツの識別情報を検索ワードとしてその属性情報の取得要求を送り、この取得要求に応じてサーバから送られてくる属性情報を、例えば、HDD121が備えるハードディスクに記憶させる。
本発明を適用した一実施形態における装置10が備えるビート抽出部11は、以下に説明するデジタルオーディオ信号の特徴に基づいて、音楽のリズムのビート位置情報を抽出する。
図16(A)は、デジタルオーディオ信号の時間波形の一例を示すものである。この図16(A)に示される時間波形には、所々で瞬間的に大きなピーク値を呈する部分があることがわかる。この大きなピーク値を呈する部分は、例えば、ドラムのビートの一部に相当する部分である。
ところで、図16(A)に示される時間波形を有するデジタルオーディオ信号の時間波形では、隠れていてわからないが、この図16(A)に示される時間波形を有するデジタルオーディオ信号の音楽を実際に聴いてみると、さらに多くのビート成分がほぼ等間隔で含まれていることがわかる。すなわち、図16(A)に示される時間波形の大きなピーク値だけからでは、実際の音楽のリズムのビート成分を抽出することができない。
図16(B)は、図16(A)に示される時間波形を有するデジタルオーディオ信号のスペクトログラムを示すものである。この図16(B)に示されるデジタルオーディオ信号のスペクトログラムでは、図16(A)に示される時間波形において隠れていたビート成分が、パワースペクトルが瞬間的に大きく変化する部分として見えることがわかる。そして、実際に音を聴くと、このスペクトログラムにおけるパワースペクトルが瞬間的に大きく変化する部分が、ビート成分に相当するということがわかる。ビート抽出部11では、このスペクトログラムにおけるパワースペクトルが瞬間的に大きく変化する部分をリズムのビート成分と見なす。
このビート成分を抽出してビート周期を計測することにより、音楽のリズム周期やBPM(Beat Per Minutes)を知ることもできる。
ビート抽出処理部12は、図17に示すように、パワースペクトル算出部12Aと、変化率算出部12Bと、エンベロープフォロア部12Cと、コンパレータ部12Dと、2値化部12Eとを備える。
パワースペクトル算出部12Aには、楽曲の図18(A)に示すような時間波形からなるデジタルオーディオ信号が入力される。
すなわち、音楽データデコード部104から供給されたデジタルオーディオ信号は、ビート抽出処理部12が備えるパワースペクトル算出部12Aに供給される。
パワースペクトル算出部12Aは、時間波形から高精度にビート成分を抽出することができないため、この時間波形に対し、例えば、FFT(Fast Fourier Transform)を用いて図18(B)に示すようなスペクトログラムを算出する。
このFFT演算における分解能は、ビート抽出処理部12へ入力されるデジタルオーディオ信号のサンプリング周波数が48kHzである場合、サンプル数を512サンプル、又は1024サンプルとし、実時間で5〜30msecに設定するのが好ましいが、このFFT演算において設定された各種数値については、これらに限定されない。また、例えば、ハニングやハミング等の窓関数(ウィンドウ関数)をかけながら、且つ、窓(ウィンドウ)をオーバーラップさせながらFFT演算を行うのが一般的に好ましい。
パワースペクトル算出部12Aは、算出したパワースペクトルを変化率算出部12Bに供給する。
変化率算出部12Bは、パワースペクトル算出部12Aから供給されたパワースペクトルの変化率を算出する。すなわち、変化率算出部12Bは、パワースペクトル算出部12Aから供給されたパワースペクトルに対して微分演算を施すことによりパワースペクトルの変化率を算出する。変化率算出部12Bは、時々刻々と変化するパワースペクトルに対して、微分演算を繰り返し施すことにより、図18(C)に示すようなビート抽出波形を示す検出信号を出力する。ここで、図18(C)に示すビート抽出波形の内、正方向に立ち上がるピークをビート成分と見なす。
エンベロープフォロア部12Cは、変化率算出部12Bから検出信号が供給されると、この検出信号に適度な時定数によるヒステリシス特性を加えることにより、この検出信号のチャタリングを除去し、このチャタリングが除去された検出信号をコンパレータ部12Dに供給する。
コンパレータ部12Dは、適度なスレショルドを設け、エンベロープフォロア部12Cから供給された検出信号の低レベルのノイズをカットし、この低レベルのノイズがカットされた検出信号を2値化部12Eに供給する。
2値化部12Eは、コンパレータ部12Dから供給された検出信号の内、閾値以上のレベルを有する検出信号のみを残す2値化処理を行い、P1,P2,及びP3からなるビート成分の時間位置を示すビート位置情報を.mtyファイルに記録されたメタデータとして出力する。
このように、ビート抽出処理部12は、デジタルオーディオ信号の時間波形からビート位置情報を抽出し、.mtyファイルに記録されたメタデータとして出力する。なお、このビート抽出処理部12が備える各構成部には、内部パラメータが存在し、各内部パラメータを変更することで各構成部の動作の効果が変更される。この内部パラメータは、後述するように、自動で最適化されるが、例えば、操作入力部110においてユーザの手動によるマニュアル操作により設定することも可能である。
ビート抽出処理部12により抽出されて.mtyファイルにメタデータとして記録されている楽曲のビート位置情報のビート間隔は、例えば、図19(A)に示すように、非等間隔であることが多い。
ビート整列処理部13は、ビート抽出処理部12により抽出されたビート位置情報の内、楽曲、又はテンポが同じと想定される楽曲部分におけるビート位置情報の整列処理を行う。
ビート整列処理部13は、ビート抽出処理部12により抽出されて.mtyファイルに記録されているビート位置情報のメタデータから例えば図19(A)のA1からA11に示されるような時間間隔が等間隔なビートである等間隔ビートを抽出し、B1からB4で示されるような非等間隔ビートを抽出しないようにする。本実施の形態における等間隔ビートとは4分音符の間隔で等間隔であるものとする。
ビート整列処理部13は、ビート抽出処理部12により抽出されて.mtyファイルに記録されているビート位置情報のメタデータから高精度な平均周期Tを算出し、平均周期Tと時間間隔が等しいビートを等間隔ビートとして抽出する。
ここで、抽出された等間隔ビートのみでは、図19(A)に示すような空白期間が存在してしまう。このため、ビート整列処理部13は、図19(B)に示すように、本来等間隔ビートが存在する位置に、C1からC3で示されるような補間ビートを新たに付加する。これにより、全てのビート間隔が等間隔であるビート位置情報を得ることが可能となる。
ビート整列処理部13は、等間隔ビートと位相がほぼ等しいビートをインビートと定義して抽出する。ここで、インビートは、実際の音楽ビートと同期するビートであり、等間隔ビートも含まれる。一方、ビート整列処理部13は、等間隔ビートと位相が全く異なるビートをアウトビートと定義して、これを除外する。アウトビートは、実際の音楽ビート(4分音符ビート)とは同期しないビートである。このため、ビート整列処理部13は、インビートとアウトビートを判別する必要がある。
具体的に、あるビートがインビートであるかアウトビートであるかを判断する方法として、ビート整列処理部13は、図20に示すように、等間隔ビートを中心とした一定のウィンドウ幅Wを定義する。ビート整列処理部13は、ウィンドウ幅Wに含まれるビートをインビートとし、また、ウィンドウ幅Wに含まれないビートをアウトビートと判断する。
また、ビート整列処理部13は、ウィンドウ幅Wに等間隔ビートが含まれていないとき、等間隔ビートを補間するためのビートである補間ビートを付加する。
すなわち、ビート整列処理部13は、例えば、図21に示すように、A11からA20で示されるような等間隔ビートと、等間隔ビートA11と位相がほぼ等しいビートであるインビートD11とをインビートとして抽出するとともに、C11からC13で示されるような補間ビートを抽出する。また、ビート抽出部13は、B11からB13で示されるようなアウトビートを4分音符ビートとしては抽出しないようにする。
実際、音楽ビートは、時間的に揺らいでいるため、この判断において、揺れが大きい音楽に対しては抽出されるインビート数が少なくなる。この結果、ビートスリップと呼ばれる抽出エラーを引き起こすといった問題が発生する。
そこで、揺れが大きい音楽に対しては、ウィンドウ幅Wの値を大きく設定し直すことで抽出されるインビート数が多くなり、抽出エラーを少なくすることができる。このウィンドウ幅Wは、通常、一定値でよいが、極端に揺れの大きい楽曲に対しては、値を大きくする等、パラメータとして調整を行うことができる。
ビート整列処理部13は、ウィンドウ幅Wに含まれるインビート、一方、ウィンドウ幅Wに含まれないアウトビートというビート属性をメタデータとして与える。また、ビート整列処理部13は、ウィンドウ幅W内に抽出ビートが存在しない場合、自動的に補間ビートを付加し、この補間ビートというビート属性をもメタデータとして与える。これにより、ビート情報を構成するメタデータは、上述したビート位置情報や上記のビート属性といったビート情報が含まれ、メタデータファイル(.may)に記録される。なお、このビート整列処理部13が備える各構成部には、基本ウィンドウ幅W等の内部パラメータが存在し、各内部パラメータを変更することで動作の効果が変更される。
このように、ビート抽出部11は、ビート抽出処理部12及びビート整列処理部13における2段階によるデータ処理により、デジタルオーディオ信号から非常に高精度なビート情報を自動的に抽出することが可能となる。インビート/アウトビート判定のみならず、適切なビート補間処理を加えることにより、1曲全体にわたって、4分音符の等間隔なビート情報を得ることができる。
すなわち、上記図1の自動ビート抽出部4の具体例として説明したビート抽出部11によれば、ビート位置情報といったタイムスタンプ情報を持たないPCM等の音声波形(サンプリング音源)であっても、他のメディアと音楽的に同調させることができる。また、ビート位置情報といったタイムスタンプ情報のデータサイズは、数Kbyteから数十Kbyteであり音声波形のデータサイズの数千分の1と非常に小さいことから、メモリ量や処理工程を削減することができるため、ユーザは、非常に容易に取り扱うことができる。また、テンポが変更する音楽やリズムに揺れがある音楽に対して、1曲全体にわたって正確にビートを抽出することができ、さらには、音楽と他のメディアの同調させることにより、新たなエンターテインメントを創造することが可能となる。
このようなビート抽出部11により抽出したビート情報を、上記図1の手動オーサリング部4に送って、前述したようなより精度の高いビート位置や小節頭位置のメタデータを得ることができる。
ところで、上記図1の手動オーサリング部4は、上記図14に示したようなハードウェア構成を用いて、前述した手動オーサリングの各機能をソフトウェア的に実現することができる。
すなわち図22は、上記図1に示したビート抽出システムの手動オーサリング部4のソフトウェアモジュールの概略構成例を示す機能ブロック図である。
この図22において、オペレーティングシステム200は、上記図14の操作入力部110として用いられる例えばキーボード110Aやマウス110B、ディスプレイ112、スピーカ112、スピーカ117C及び記憶装置201に対してデータ入出力を行う。記憶装置201は、上記楽音データを含む音響データ202やメタデータ203を記憶するものであり、例えば図14のHDD121等が用いられる。
このオペレーティングシステム200上で実現されるソフトウェアモジュールとして、ユーザ入力処理部205、メタデータ管理部206、表示管理部207、ビート自動検出部208、ファイル入出力部209、音響データ管理部210、音響再生部211が挙げられる。
ユーザ入力処理部205は、例えばマウス110B、キーボード110A等の入力装置を通して送られてくるユーザの入力操作を判別し、その操作に対応するモジュールに対し処理指令を出す。例えば、ユーザがマウス110Bを使用して後述する区間マーク入力操作を選ぶと、ユーザ入力処理部205はユーザ入力処理部自身を区間マーク入力状態にし、さらに表示管理部207に対し区間マーク入力状態に入ったことを知らせる。
その後ユーザが入力可能な範囲内においてマウス110Bのクリックを行うと、ユーザ入力処理部205はクリックされた座標を音響データの時間軸上の位置に変換し、メタデータ管理部に対してその時間軸上の位置に対して区間マークを打つよう指示を行う。
メタデータ管理部206は、内部に区間管理部221とメタデータ実体222を包含する。メタデータ実体222は、例えば図23(A)に示される構造を1単位としたデータ列が、図23(B)に示すようにリストとして管理されている。この図23(A)のデータ列には、例えば、小節番号と、ビート、メロディ、アクセントなどのメタデータ種類と、サンプル位置が含まれる。メタデータ実体は時間順に並んで管理される。リスト構造で管理しているため、編集操作などで間に入るデータが新たにできた場合にもリスト構造の参照先、参照元ポインタを変化させるだけで済むようになっている。
区間管理部221は区間を管理しており、図24に示される構造を1単位として保持している。この図24の例には、開始サンプル、終了サンプル、区間BPM、区間拍子、区間小節数、区間小節長が挙げられている。
例えばメタデータ管理部206は、ユーザ入力処理部205から通知された区間情報をもとに区間を形成し、同処理部205から通知された小節の位置をもとに、上記図9と共に説明した処理に従ってビート位置を決定していく。このとき、これらのビート位置算出は区間毎に個別に行われる。
メタデータ管理部206は、この他に、メタデータ実体222や区間データの消去、移動、挿入、検索などの処理を行う。
表示管理部207は、音響データ表示部225及びメタデータ表示部226を有し、現在画面に表示されている時間軸の範囲を算出し、その範囲に含まれるメタデータをメタデータ管理部206を使用して検索する。そして、取得したメタデータの種類に応じて対応する色やアイコンなどとしてディスプレイ112の画面に描画を行う。
表示管理部207は、この他に、音響データの波形表示、統計データ表示、小節番号や現在編集中のサンプル位置の数値表示なども行う。
ビート自動検出部208は、上記図1の自動ビート抽出部3や上記図14のビート抽出部11に略々対応するものであり、音楽データから自動で音楽のビートを抽出し、メタデータ管理部206に対して自動抽出ビート位置を通知する。ビート自動抽出のアルゴリズムは、メタデータ管理部206に通知すべき情報を満たしていれば何を使用してもかまわない。
ファイル入出力部209は、指定した音響データを開き、指定されたポジションから指定されたサンプル数だけデータを読み込んで呼び出し元に返す役割を担う。また、メタデータ実体を記憶装置201等の二次記憶上のファイルに出力したり、二次記憶上のメタデータファイルからメタデータ実体222に読み込むことを行う。
音響データ管理部210は、また、ファイル入出力部209を通して読込んだ音響データを保持し、音響再生部及び表示管理部に渡す。また、音響データに付随する各種情報(量子化ビット数、サンプリングレート、チャンネル数など)も調査し保持する。
音響データ再生部211は、音響データを指定された位置から再生を行い、スピーカ117Cなどの実際の音響出力装置に出力する。
以上説明したような本発明の実施の形態によれば、楽曲の正確なビート位置が必要なアプリケーションのための時間軸上のメタデータを簡単かつ正確に付与することが可能となった。また、そのビート位置を元に、正確なメロディやコード進行、歌詞などの情報も付与することが可能となる。これにより、正確なメタデータがないと実現が困難であった音楽リミックスアプリケーションや、ビートに同期して正確なタイミングで制御が必要なデバイスやソフトウェアを制作することが可能となる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、例えば、本発明に係るビート抽出装置は、上述したパーソナルコンピュータや携帯型の音楽再生機にのみ適用されるものではなく、如何なる態様の装置や電子機器にも適用することが可能である。この他、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
本発明の実施の形態となるビート抽出システムの構成例を概略的に示すブロック図である。 ライブ録音された楽曲における拍数に対する瞬時BPMを示すグラフである。 ビート抽出システムの手動オーサリング部の処理を実現するためのグラフィカルな操作入力画面の一例を示す図である。 波形表示部に表示されるビート表示形態の例を示す図である。 ビート抽出領域及びビート編集領域に表示されるビート情報のみを取り出して示す図である。 小節の頭を指定する指定点Z1,Z2を示す図である。 指定点Z1,Z2の間の小節数を入力して小節の長さ及びビート間隔を求めることを説明するための図である。 指定点と振動における固定端との関係を説明するための図である。 指定点Z1,Z2の間に小節及びビートの位置情報を付与していく処理の動作を説明するためのフローチャートの前半部分である。 指定点Z1,Z2の間に小節及びビートの位置情報を付与していく処理の動作を説明するためのフローチャートの後半部分である。 指定点Z1,Z2の間にビート及び小節の頭が打たれる様子を示す図である。 表示部に表示される各ビートの瞬時BPMの誤差、同累積誤差、位相ずれ量を示すグラフである。 3個以上の指定点を入力した状態を示す図である。 時間軸上のメタデータとして楽曲のメロディ構造を入力した状態を示す図である。 本発明に係るビート抽出装置の一実施形態を含む音楽再生装置の内部構成を示す機能ブロック図である。 ビート抽出部の内部構成を示す機能ブロック図である。 (A)は、デジタルオーディオ信号の時間波形の一例を示す図であり、(B)は、このデジタルオーディオ信号のスペクトログラムを示す図である。 ビート抽出処理部の内部構成を示す機能ブロック図である。 (A)は、デジタルオーディオ信号の時間波形の一例を示す図であり、(B)は、このデジタルオーディオ信号のスペクトログラムを示す図であり、(C)は、このデジタルオーディオ信号のビート抽出波形を示す図である。 (A)は、ビート抽出処理部により抽出されたビート位置情報のビート間隔を示す図であり、(B)は、ビート整列処理部により整列処理されたビート位置情報のビート間隔を示す図である。 特定ビートがインビートか否かを判断するためのウィンドウ幅を示す図である。 ビート位置情報のビート間隔を示す図である。 ビート抽出システムの手動オーサリング部のソフトウェアモジュールの概略構成例を示す機能ブロック図である。 メタデータ実体の担体の構造及びリストの例を示す図である。 区間管理部で区間を管理するための単位構造の一例を示す図である。
符号の説明
2 ビート抽出装置、 3 自動ビート抽出部、 4 手動オーサリング部、 11 ビート抽出部、 12 ビート抽出処理部、 13 ビート整列処理部、 100 システムバス、 101 CPU、 102 ROM、 103 RAM、 200 オペレーティングシステム、 205 ユーザ入力処理部、 206 メタデータ管理部、 207 表示管理部

Claims (12)

  1. 楽曲データの小節の頭の位置を少なくとも2箇所指定する工程と、
    上記指定された2箇所の位置の間を分割して時間軸上のメタデータを付与する工程と
    上記楽曲データに対して信号処理により自動的にビート情報を抽出する自動ビート抽出工程と
    を有し、
    上記自動ビート抽出工程により抽出された自動抽出ビートが本来の拍子にタイミングがあっていると判断した第1類ビートと、上記自動抽出ビートが見つからず本来の拍子に従って自動的に補間された第2類ビートと、自動ビート抽出が行われたが本来の拍子の位置ではないと判断した第3類ビートとに分類し、これらの第1類〜第3類ビートのそれぞれの表示色を異ならせて表示部に表示する
    メタデータ付与方法。
  2. 上記分類された各ビートの信頼度として、上記第1類ビートの信頼度の値を最も高くし、上記第3類ビート、上記第2類ビートの順に信頼度の値を低くして、これらの信頼度の値に応じた表示色で表示を行う請求項1記載のメタデータ付与方法。
  3. 上記小節の頭として指定する2箇所の内少なくとも1箇所は、楽曲を聴きながら、手作業で指定入力す請求項1記載のメタデータ付与方法。
  4. 上記指定された2箇所の位置の間の区間を、小節の長さまたは小節の数で割り算して時間軸上のメタデータを算出す請求項1記載のメタデータ付与方法。
  5. 上記小節の長さLBarは、概略の小節長Lbを仮設定し、この小節長Lbに最も近い値の小節長LBarであって、上記指定された2箇所の位置の間の区間内の小節数が整数値になる小節長LBarを計算により求め請求項記載のメタデータ付与方法。
  6. 上記自動ビート抽出工程により抽出された自動抽出ビートに対し、小節の頭を指示することによって区間内の小節数を自動的に算出して時間軸上のメタデータとす請求項1記載のメタデータ付与方法。
  7. 候補となるビート位置近傍の所定の閾値の範囲内に含まれる自動抽出ビートを検索し、そのビート位置を優先的に用い請求項記載のメタデータ付与方法。
  8. 上記閾値の範囲内に自動抽出ビートが見つからなかった場合、計算値によってビートを補間し、信頼度の値を低くす請求項7記載のメタデータ付与方法。
  9. 一つ前に算出した上記小節の長さLBarに基づいて動的に次に打つビートの間隔を変化させ請求項記載のメタデータ付与方法。
  10. 楽曲データの小節の頭の位置を少なくとも2箇所指定する入力手段と、
    上記指定された2箇所の位置の間を等間隔で分割して時間軸上のメタデータを付与するメタデータ付与手段と
    上記楽曲データに対して信号処理により自動的にビート情報を抽出する自動ビート抽出手段と
    を有し、
    上記自動ビート抽出手段により抽出された自動抽出ビートが本来の拍子にタイミングがあっていると判断した第1類ビートと、上記自動抽出ビートが見つからず本来の拍子に従って自動的に補間された第2類ビートと、自動ビート抽出が行われたが本来の拍子の位置ではないと判断した第3類ビートとに分類し、これらの第1類〜第3類ビートのそれぞれの表示色を異ならせて表示部に表示する
    メタデータ付与装置。
  11. 上記分類された各ビートの信頼度として、上記第1類ビートの信頼度の値を最も高くし、上記第3類ビート、上記第2類ビートの順に信頼度の値を低くして、これらの信頼度の値に応じた表示色で表示を行う請求項10記載のメタデータ付与装置。
  12. 上記小節の頭として指定する2箇所の内少なくとも1箇所は、楽曲を聴きながら、手作業で指定入力す請求項11記載のメタデータ付与装置。
JP2006073185A 2006-03-16 2006-03-16 メタデータ付与方法及び装置 Expired - Fee Related JP4487958B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006073185A JP4487958B2 (ja) 2006-03-16 2006-03-16 メタデータ付与方法及び装置
US11/683,119 US7584218B2 (en) 2006-03-16 2007-03-07 Method and apparatus for attaching metadata
KR1020070024993A KR101292698B1 (ko) 2006-03-16 2007-03-14 메타데이터 부여 방법 및 장치
EP07104263A EP1835503A3 (en) 2006-03-16 2007-03-15 Method and apparatus for attaching metadata
CN2007100885895A CN101038739B (zh) 2006-03-16 2007-03-16 用于附加元数据的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006073185A JP4487958B2 (ja) 2006-03-16 2006-03-16 メタデータ付与方法及び装置

Publications (3)

Publication Number Publication Date
JP2007248895A JP2007248895A (ja) 2007-09-27
JP2007248895A5 JP2007248895A5 (ja) 2008-01-17
JP4487958B2 true JP4487958B2 (ja) 2010-06-23

Family

ID=38230125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006073185A Expired - Fee Related JP4487958B2 (ja) 2006-03-16 2006-03-16 メタデータ付与方法及び装置

Country Status (5)

Country Link
US (1) US7584218B2 (ja)
EP (1) EP1835503A3 (ja)
JP (1) JP4487958B2 (ja)
KR (1) KR101292698B1 (ja)
CN (1) CN101038739B (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4940588B2 (ja) * 2005-07-27 2012-05-30 ソニー株式会社 ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法
JPWO2007066813A1 (ja) * 2005-12-09 2009-05-21 ソニー株式会社 音楽編集装置、音楽編集情報の作成方法、並びに音楽編集情報が記録された記録媒体
US7659471B2 (en) * 2007-03-28 2010-02-09 Nokia Corporation System and method for music data repetition functionality
JP4467601B2 (ja) * 2007-05-08 2010-05-26 ソニー株式会社 ビート強調装置、音声出力装置、電子機器、およびビート出力方法
JP5336522B2 (ja) * 2008-03-10 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
JP5337608B2 (ja) * 2008-07-16 2013-11-06 本田技研工業株式会社 ビートトラッキング装置、ビートトラッキング方法、記録媒体、ビートトラッキング用プログラム、及びロボット
JP4816699B2 (ja) 2008-09-03 2011-11-16 ソニー株式会社 楽曲処理方法、楽曲処理装置、及びプログラム
JP5395399B2 (ja) * 2008-10-17 2014-01-22 Kddi株式会社 携帯端末、拍位置推定方法および拍位置推定プログラム
JP2010114737A (ja) * 2008-11-07 2010-05-20 Kddi Corp 携帯端末、拍位置修正方法および拍位置修正プログラム
JP5771618B2 (ja) * 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
JP2012103603A (ja) 2010-11-12 2012-05-31 Sony Corp 情報処理装置、楽曲区間抽出方法、及びプログラム
JP2014010275A (ja) * 2012-06-29 2014-01-20 Sony Corp 情報処理装置、情報処理方法及びプログラム
CN103916097B (zh) * 2013-01-02 2018-10-19 三星电子株式会社 用于处理音频信号的设备和方法
JP6123995B2 (ja) 2013-03-14 2017-05-10 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6179140B2 (ja) * 2013-03-14 2017-08-16 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6645085B2 (ja) 2015-09-18 2020-02-12 ヤマハ株式会社 自動アレンジ装置及びプログラム
JP6565528B2 (ja) 2015-09-18 2019-08-28 ヤマハ株式会社 自動アレンジ装置及びプログラム
JP6565530B2 (ja) * 2015-09-18 2019-08-28 ヤマハ株式会社 自動伴奏データ生成装置及びプログラム
US9804818B2 (en) 2015-09-30 2017-10-31 Apple Inc. Musical analysis platform
US20170092246A1 (en) * 2015-09-30 2017-03-30 Apple Inc. Automatic music recording and authoring tool
US9824719B2 (en) 2015-09-30 2017-11-21 Apple Inc. Automatic music recording and authoring tool
US9852721B2 (en) 2015-09-30 2017-12-26 Apple Inc. Musical analysis platform
US9502017B1 (en) * 2016-04-14 2016-11-22 Adobe Systems Incorporated Automatic audio remixing with repetition avoidance
CN107967706B (zh) * 2017-11-27 2021-06-11 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据的处理方法、装置及计算机可读存储介质
CN110299049B (zh) * 2019-06-17 2021-12-17 韶关市启之信息技术有限公司 一种电子乐谱的智能展现方法
CN112235631B (zh) * 2019-07-15 2022-05-03 北京字节跳动网络技术有限公司 视频处理方法、装置、电子设备及存储介质
CN112822541B (zh) * 2019-11-18 2022-05-20 北京字节跳动网络技术有限公司 视频生成方法、装置、电子设备和计算机可读介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750838Y2 (ja) 1989-10-30 1995-11-15 株式会社大林組 仮設コード類の配設構造
US6307141B1 (en) 1999-01-25 2001-10-23 Creative Technology Ltd. Method and apparatus for real-time beat modification of audio and music signals
JP3066528B1 (ja) 1999-02-26 2000-07-17 コナミ株式会社 楽曲再生システム、リズム解析方法及び記録媒体
JP3789326B2 (ja) 2000-07-31 2006-06-21 松下電器産業株式会社 テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
US6518492B2 (en) * 2001-04-13 2003-02-11 Magix Entertainment Products, Gmbh System and method of BPM determination
JP4134624B2 (ja) * 2002-07-24 2008-08-20 ヤマハ株式会社 再生制御情報作成装置とプログラム
JP4656822B2 (ja) 2003-01-15 2011-03-23 ローランド株式会社 電子楽器
US7208672B2 (en) 2003-02-19 2007-04-24 Noam Camiel System and method for structuring and mixing audio tracks
US7026536B2 (en) 2004-03-25 2006-04-11 Microsoft Corporation Beat analysis of musical signals
US8180468B2 (en) 2005-07-01 2012-05-15 Pioneer Corporation Computer program, information reproduction device, and method

Also Published As

Publication number Publication date
KR101292698B1 (ko) 2013-08-02
US7584218B2 (en) 2009-09-01
EP1835503A2 (en) 2007-09-19
CN101038739A (zh) 2007-09-19
EP1835503A3 (en) 2008-03-26
CN101038739B (zh) 2012-02-22
JP2007248895A (ja) 2007-09-27
US20070255739A1 (en) 2007-11-01
KR20070094487A (ko) 2007-09-20

Similar Documents

Publication Publication Date Title
JP4487958B2 (ja) メタデータ付与方法及び装置
US11456017B2 (en) Looping audio-visual file generation based on audio and video analysis
JP4949687B2 (ja) ビート抽出装置及びビート抽出方法
CN1941071B (zh) 拍子提取及检测设备和方法、音乐同步显示设备和方法
US6748360B2 (en) System for selling a product utilizing audio content identification
US20110112672A1 (en) Systems and Methods of Constructing a Library of Audio Segments of a Song and an Interface for Generating a User-Defined Rendition of the Song
US8464154B2 (en) System and method for synchronized multi-track editing
JP2006501502A (ja) オーディオトラックのオーディオサムネイルを生成するシステムおよび方法
JP5333517B2 (ja) データ処理装置およびプログラム
JP3886372B2 (ja) 音響変節点抽出装置及びその方法、音響再生装置及びその方法、音響信号編集装置、音響変節点抽出方法プログラム記録媒体、音響再生方法プログラム記録媒体、音響信号編集方法プログラム記録媒体、音響変節点抽出方法プログラム、音響再生方法プログラム、音響信号編集方法プログラム
JP2009063714A (ja) オーディオ再生装置およびオーディオ早送り再生方法
US9014831B2 (en) Server side audio file beat mixing
JP2012018282A (ja) 演奏ファイル管理装置、演奏ファイル再生装置および演奏ファイル再生方法
JP5338312B2 (ja) 自動演奏同期装置、自動演奏鍵盤楽器およびプログラム
JP2007072023A (ja) 情報処理装置及び情報処理方法
KR100678923B1 (ko) 음악 파일 편집 장치 및 방법
JP6168649B2 (ja) コード検出装置及びプログラム
JP2012159717A (ja) 楽曲データの変化点検出装置、楽曲データの変化点検出方法及び楽曲データの変化点検出プログラム
JP2007171772A (ja) 音楽情報処理装置、音楽情報処理方法および制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100322

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4487958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees