JP2010191337A - 楽曲処理装置、およびプログラム - Google Patents
楽曲処理装置、およびプログラム Download PDFInfo
- Publication number
- JP2010191337A JP2010191337A JP2009037564A JP2009037564A JP2010191337A JP 2010191337 A JP2010191337 A JP 2010191337A JP 2009037564 A JP2009037564 A JP 2009037564A JP 2009037564 A JP2009037564 A JP 2009037564A JP 2010191337 A JP2010191337 A JP 2010191337A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- classification
- category
- segment
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
【課題】新たな楽曲の素材となる音声素片を音楽的な特徴で選択することができるようにする。
【解決手段】音声素片の波形データにその音声素片の音楽的な特徴がエッジ的であるか否か、或いはダスト的であるか否かを示すラベルデータを対応付けた学習用データを用いて機械学習を行うことにより見出される分類ルールに従って、新たな音声素片がエッジのカテゴリに属するのか否か、又はダストのカテゴリに属するのか否かを分類しつつデータベース化し、そのデータベースから利用者により指定されたカテゴリに属するものを選択して提示する楽曲処理装置を提供する。
【選択図】図2
Description
本発明は上記課題に鑑みて為されたものであり、新たな楽曲の素材となる音声素片を、音楽的な特徴で選択することができるようにする技術を提供することを目的する。
(A:構成)
図1は、本発明の一実施形態に係る楽曲処理装置100の構成例を示すブロック図である。この楽曲処理装置100は、楽曲の波形を音のオンセットで区切って得られる各区間から抽出される音声素片の各々を音楽的な特徴でカテゴリ分類してデータベース化するとともに、それら音声素片のうちから利用者により指定されたカテゴリに属するもの(すなわち、利用者により指定された音楽的な特徴(聴感など)を有するもの)を選択して提示するコンピュータ装置である。図1に示すように、楽曲処理装置100は、制御部110、インタフェース群120、操作部130、表示部140、記憶部150、およびこれら構成要素間のデータ授受を仲介するバス160を有している。
これら3つの処理の概要は以下の通りである。
以上が楽曲処理装置100の構成である。
楽曲処理装置100の利用者が操作部130を操作して制御プログラムの実行を指示すると、制御部110は、制御プログラムを不揮発性記憶部150bから揮発性記憶部150aに読み出し、その実行を開始する。制御部110は、制御プログラムの実行を開始すると、前述したメニュー画面を表示部140に表示させる。このメニュー画面を視認した利用者は、操作部130を操作してメニュー項目の選択などにより各処理の実行を指示することができる。制御部110は、操作部130を介して与えられる指示に応じて図2に示す3つの処理のうちの該当するものを実行するのである。以下、学習処理SA100、素片分類処理SA200、および素片選択処理SA300の各処理にて制御部110が実行する動作について説明する。
図3は、制御部110が実行する学習処理SA100の流れを示す図である。
前述したように、この学習処理SA100は、複数の学習用データを用いて機械学習を行い、カテゴリ分類されていない新たな音声素片を各種の特徴量に基づいてカテゴリ分類するための分類ルールを見出す処理である。この学習処理SA100の入力データとなる学習用データとしては、種々の態様のものを用いることが考えられる。図3では、波形データトラックとラベルデータトラックとからなる学習用データが例示されている。波形データトラックは、一つの楽曲のオーディオ波形を示すデータトラック(そのオーディオ波形を所定のサンプリング周期でサンプリングしたサンプル列)である。ラベルデータトラックは、波形データトラックと時間軸を共通にするデータトラックである。このラベルデータトラックには、波形データトラックの示す波形にて各音声素片が占める位置(音声素片の開始時刻(図3:t0やt2)および終了時刻(図3:t1やt3))を示すデータに対応付けて、その音声素片のカテゴリ(エッジやダスト)を示すラベルデータが書き込まれている。図3に示す態様の学習用データの他に、音声素片の波形を示す波形データとその音声素片の属するカテゴリを示すラベルデータとを対にした学習用データを用いても勿論良い。
Vector Machine)等の他の機械学習アルゴリズムを用いても勿論良い。カテゴリ分類のためには上記2465種類の特徴量の全てが必要に成る訳ではない。本出願人の行った実験によれば、エッジのカテゴリに属するか否かの分類を行うための分類ルールは、上記2465種類のうちの73種類の特徴量により定まり、ダストのカテゴリに属するか否かを分類するための分類ルールは、同2465種類のうちの37種類の特徴量で定まることが判明した。
前述したように、素片分類処理SA200は、カテゴリ分類されていない音声素片を上記第1または第2の分類ルールデータの示す分類ルールにしたがってカテゴリ分類しつつデータベース化する処理である。上記第1および第2の分類ルールデータにしたがって、この素片分類処理SA200を行うことにより、制御部110は、カテゴリ分類が為されていない新たな音声素片をエッジのカテゴリに属するか否かで分類する第1の識別器、および同音声素片をダストのカテゴリに属するか否かで分類する第2の識別器として機能する。
素片選択処理SA300は、利用者により指定されたカテゴリに属する音声素片を音声素片データベースから選択して提示することにより、それらの音声素片を用いた楽曲生成等を促す処理である。この素片選択処理SA300の実施態様としては種々のものが考えられる。例えば、利用者により指定されたカテゴリに属するもの全てを音声素片データベースから読み出して提示する態様の他に、以下に述べる態様が考えられる。
以上、本発明の一実施形態について説明したが、かかる実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した実施形態では、カテゴリ分類がされていない音声素片をエッジまたはダストの各カテゴリに分類するための分類ルールを機械学習により見出したが、ベンド(音程が変化する音声素片)やボイス(人の声のように聴こえる音声素片)などの他のカテゴリに分類するための分類ルールを見出しても良い。このようなことは、ベンドやボイスなど他のカテゴリに分類される音声素片についての学習用データを用いて機械学習を行わせることで実現される。
Claims (4)
- 楽曲の波形を音のオンセットにおいて区切って得られる各音声素片について複数種の特徴量を算出する特徴量算出手段と、
各々が音声素片の波形を示すとともに当該音声素片のカテゴリを示す複数の学習用データを用いた機械学習により見出される分類ルールであって、音声素片を前記複数種の特徴量に基づいてカテゴリ分類するための分類ルールにしたがって、楽曲の波形を音のオンセットにおいて区切って得られる音声素片の各々をカテゴリ分類する素片分類手段と、
を有することを特徴とする楽曲処理装置。 - 前記学習用データを複数読み込み、当該複数の学習用データの各々が示す音声素片を当該音声素片について前記特徴量算出手段により算出される複数種の特徴量に基づいて当該学習用データの示すカテゴリに分類するための分類ルールを所定の機械学習アルゴリズムにしたがってカテゴリ毎に見出す機械学習手段を備え、
前記素片分類手段は、前記機械学習手段により見出される分類ルールにしたがって音声素片のカテゴリ分類を行うことを特徴とする請求項1に記載の楽曲処理装置。 - 前記素片分類手段は、
楽曲の波形を音のオンセットにおいて区切って得られる音声素片を分類ルールにしたがってカテゴリ分類する際に、その分類の確信度を算出し、当該確信度が所定の閾値を超えている場合に当該音声素片を当該カテゴリに分類することを特徴とする請求項1または2の何れか1に記載の楽曲処理装置。 - コンピュータを、
楽曲の波形を音のオンセットにおいて区切って得られる各音声素片について複数種の特徴量を算出する特徴量算出手段と、
各々が音声素片の波形を示すとともに当該音声素片のカテゴリを示す複数の学習用データを用いた機械学習により見出される分類ルールであって、音声素片を前記複数種の特徴量に基づいてカテゴリ分類するための分類ルールにしたがって、楽曲の波形を音のオンセットにおいて区切って得られる音声素片の各々をカテゴリ分類する素片分類手段
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037564A JP5515317B2 (ja) | 2009-02-20 | 2009-02-20 | 楽曲処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037564A JP5515317B2 (ja) | 2009-02-20 | 2009-02-20 | 楽曲処理装置、およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013008329A Division JP5573975B2 (ja) | 2013-01-21 | 2013-01-21 | 楽曲処理装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010191337A true JP2010191337A (ja) | 2010-09-02 |
JP5515317B2 JP5515317B2 (ja) | 2014-06-11 |
Family
ID=42817416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009037564A Expired - Fee Related JP5515317B2 (ja) | 2009-02-20 | 2009-02-20 | 楽曲処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5515317B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012247957A (ja) * | 2011-05-26 | 2012-12-13 | Yamaha Corp | データ処理装置およびプログラム |
US8921678B2 (en) | 2011-03-02 | 2014-12-30 | Yamaha Corporation | Generating tones by combining sound materials |
JP2019049601A (ja) * | 2017-09-08 | 2019-03-28 | Kddi株式会社 | 音波信号から音波種別を判定するプログラム、システム、装置及び方法 |
JP7607239B2 (ja) | 2020-12-25 | 2024-12-27 | パナソニックIpマネジメント株式会社 | 表示装置および表示方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000066691A (ja) * | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
JP2008122426A (ja) * | 2006-10-20 | 2008-05-29 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP2009020387A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 楽曲を制作するための装置およびプログラム |
-
2009
- 2009-02-20 JP JP2009037564A patent/JP5515317B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000066691A (ja) * | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
JP2008122426A (ja) * | 2006-10-20 | 2008-05-29 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP2009020387A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 楽曲を制作するための装置およびプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8921678B2 (en) | 2011-03-02 | 2014-12-30 | Yamaha Corporation | Generating tones by combining sound materials |
JP2012247957A (ja) * | 2011-05-26 | 2012-12-13 | Yamaha Corp | データ処理装置およびプログラム |
JP2019049601A (ja) * | 2017-09-08 | 2019-03-28 | Kddi株式会社 | 音波信号から音波種別を判定するプログラム、システム、装置及び方法 |
JP7607239B2 (ja) | 2020-12-25 | 2024-12-27 | パナソニックIpマネジメント株式会社 | 表示装置および表示方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5515317B2 (ja) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3047484B1 (en) | Recommending audio sample combinations | |
US8642872B2 (en) | Music steering with automatically detected musical attributes | |
EP3047478B1 (en) | Combining audio samples by automatically adjusting sample characteristics | |
JP4640407B2 (ja) | 信号処理装置、信号処理方法及びプログラム | |
JP4199097B2 (ja) | 楽曲自動分類装置及び方法 | |
EP3047479B1 (en) | Automatically expanding sets of audio samples | |
EP3047480B1 (en) | Automatic audio harmonization based on pitch distributions | |
JP2007322598A (ja) | 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム | |
JP5743976B2 (ja) | 情報処理装置、プログラム、及び情報処理方法 | |
JP2007122442A (ja) | 楽曲分類装置及び楽曲分類プログラム | |
JP5515317B2 (ja) | 楽曲処理装置、およびプログラム | |
JP6151121B2 (ja) | コード進行推定検出装置及びコード進行推定検出プログラム | |
US9502017B1 (en) | Automatic audio remixing with repetition avoidance | |
EP3779814A1 (en) | Method and device for training adaptation level evaluation model, and method and device for evaluating adaptation level | |
US11600251B2 (en) | Musicality information provision method, musicality information provision apparatus, and musicality information provision system | |
JP5573975B2 (ja) | 楽曲処理装置、およびプログラム | |
JP6281211B2 (ja) | 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム | |
KR101807754B1 (ko) | 자작곡 생성 서버 및 그 방법 | |
JP6835247B2 (ja) | データ生成装置およびプログラム | |
JP7230085B2 (ja) | 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN110147463A (zh) | 一种音乐推送方法、系统、装置和存储介质 | |
JP4479735B2 (ja) | 演奏装置およびプログラム | |
JP5515342B2 (ja) | 音波形抽出装置、およびプログラム | |
JP6418179B2 (ja) | 音読練習装置、表示制御方法、及びプログラム | |
JP6232304B2 (ja) | 閲覧者の評価を考慮して表示の優先度を定める歌唱動画の閲覧システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130121 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130828 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130906 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20131101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140317 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5515317 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |