JP6413828B2 - Information processing method, information processing apparatus, and program - Google Patents
Information processing method, information processing apparatus, and program Download PDFInfo
- Publication number
- JP6413828B2 JP6413828B2 JP2015031888A JP2015031888A JP6413828B2 JP 6413828 B2 JP6413828 B2 JP 6413828B2 JP 2015031888 A JP2015031888 A JP 2015031888A JP 2015031888 A JP2015031888 A JP 2015031888A JP 6413828 B2 JP6413828 B2 JP 6413828B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- lyrics
- karaoke
- word
- temporary storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
本発明は、カラオケ用の動画のメタ情報を生成する方法の技術分野に関する。 The present invention relates to a technical field of a method for generating meta information of a moving image for karaoke.
従来、動画データをオンラインで配信する動画サイトが知られている。動画サイトは、例えば動画データに関連付けてメタ情報を記憶しておき、ユーザから指定された条件に基づいてメタ情報を検索することにより、ユーザが所望する動画データを配信する。メタ情報は、例えば動画データの作者により入力された情報に基づいて生成されたり、動画データを解析することにより生成されたりする。例えば、特許文献1には、動画データに含まれるフレーム画像から文字情報や画質に関する情報を抽出することにより、メタ情報を生成する技術が開示されている。
Conventionally, video sites that distribute video data online are known. For example, the moving image site stores meta information in association with moving image data, and searches for meta information based on conditions specified by the user, thereby distributing moving image data desired by the user. The meta information is generated based on, for example, information input by the creator of the moving image data, or is generated by analyzing the moving image data. For example,
一般的に、カラオケの動画データは、映像情報、楽曲の音情報、歌詞情報等の複数の材料情報から生成される。この場合、動画サイトは、生成されたカラオケ動画データ登録して配信する。カラオケ動画データのメタ情報を生成する場合、カラオケ動画データを解析する必要がある。しかしながら、カラオケ動画データからは、元になった材料の情報が有する詳細な情報が失われている。そのため、カラオケ動画データからは元の詳細な情報を正確に抽出することが難しいので、正確性に欠けるメタ情報が生成されてしまうという問題がある。 In general, karaoke video data is generated from a plurality of material information such as video information, music sound information, and lyrics information. In this case, the video site registers and distributes the generated karaoke video data. When generating meta information of karaoke video data, it is necessary to analyze the karaoke video data. However, from the karaoke video data, detailed information included in the original material information is lost. For this reason, since it is difficult to accurately extract the original detailed information from the karaoke video data, there is a problem that meta information lacking accuracy is generated.
本発明は、以上の点に鑑みてなされたものであり、カラオケ動画を検索するためのメタ情報として正確な情報を容易に生成することを可能とする情報処理方法等を提供することを課題とする。 The present invention has been made in view of the above points, and it is an object to provide an information processing method and the like that can easily generate accurate information as meta-information for searching for a karaoke video. To do.
請求項1に記載の発明は、一時記憶手段と、取得手段と、展開手段と、カラオケ動画生成手段と、メタ情報生成手段とを備える情報処理装置のコンピュータにより実行される情報処理方法であって、前記取得手段が、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、前記展開手段が、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、前記カラオケ動画生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、前記メタ情報生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成ステップと、を含むことを特徴とする。
The invention according to
請求項2に記載の発明は、一時記憶手段と、取得手段と、展開手段と、カラオケ動画生成手段と、語抽出手段と、比較手段と、難易度決定手段と、メタ情報生成手段とを備える情報処理装置のコンピュータにより実行される情報処理方法であって、前記取得手段が、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、前記展開手段が、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、前記カラオケ動画生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、前記語抽出手段が、歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出ステップと、前記比較手段が、前記語抽出ステップにより抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較ステップと、前記難易度決定手段が、前記比較ステップによる比較結果に基づいて、前記歌詞の難易度を決定する難易度決定ステップと、前記メタ情報生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定ステップにより決定された前記難易度を含むメタ情報を生成するメタ情報生成ステップと、を含むことを特徴とする。
The invention according to
請求項3に記載の発明は、一時記憶手段と、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得手段と、前記取得手段により取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開手段と、前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成手段と、前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成手段と、を備えることを特徴とする。
請求項4に記載の発明は、一時記憶手段と、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得手段と、前記取得手段により取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開手段と、前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成手段と、歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出手段と、前記語抽出手段により抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較手段と、前記比較手段による比較結果に基づいて、前記歌詞の難易度を決定する難易度決定手段と、前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定手段により決定された前記難易度を含むメタ情報を生成するメタ情報生成手段と、を備えることを特徴とする。
The invention according to
The invention according to
請求項5に記載の発明は、一時記憶手段を備える情報処理装置のコンピュータに、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成ステップと、を実行させることを特徴とする。
請求項6に記載の発明は、一時記憶手段を備える情報処理装置のコンピュータに、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出ステップと、前記語抽出ステップにより抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較ステップと、前記比較ステップによる比較結果に基づいて、前記歌詞の難易度を決定する難易度決定ステップと、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定ステップにより決定された前記難易度を含むメタ情報を生成するメタ情報生成ステップと、を実行させることを特徴とする。
According to a fifth aspect of the present invention, in a computer of an information processing apparatus including temporary storage means, a plurality of material information used as a material for a karaoke video, video information, sound information indicating a performance sound of karaoke music, and Acquiring a plurality of material information including at least lyrics information including lyrics time information indicating lyrics of a karaoke song and an elapsed time from the start of the performance of the karaoke song until the display of the lyrics is started. And a developing step of expanding the plurality of material information acquired in the acquiring step once in the temporary storage means, and a state in which the plurality of material information is expanded once in the temporary storage means by the expanding step The karaoke video generation step for generating the karaoke video based on the plurality of material information in Meta information used for searching for the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is developed once in the storage means, the lyrics information A meta information generating step of generating meta information including the elapsed time included in the singing start time as a singing start time.
According to a sixth aspect of the present invention, in a computer of an information processing apparatus including temporary storage means, a plurality of material information used as materials for a karaoke video, video information, sound information indicating a performance sound of karaoke music, and Acquiring step of acquiring a plurality of material information including at least lyrics information including display time from the start to the end of display of the word, for each word included in the lyrics, the lyrics information indicating the lyrics of the karaoke music In the state where the plurality of material information acquired by the acquisition step is expanded once in the temporary storage means, and the plurality of material information is expanded once in the temporary storage means by the expansion step A karaoke video generation step for generating the karaoke video based on the plurality of material information, and a predetermined high word as a singing difficulty level. Of the plurality of high difficulty words stored in the first storage means that stores the degree words and the reference time of singing the high difficulty words in association with each high difficulty word, the unfolded in the temporary storage means A word extraction step for extracting high difficulty words included in the lyrics information, a reference time for singing the high difficulty words, and a display time of the high difficulty words for each high difficulty word extracted by the word extraction step. The plurality of material information is expanded once in the temporary storage means by the comparing step for comparing, the difficulty determining step for determining the difficulty level of the lyrics based on the comparison result by the comparing step, and the expanding step. Meta information used for searching the karaoke video based on at least one material information among the plurality of material information in a state of being determined by the difficulty determining step Characterized in that to execute, and meta information generation step of generating meta information including the difficulty.
請求項1乃至6に記載の発明によれば、一時記憶手段に展開された材料情報に基づいて、カラオケ動画が生成され、且つメタ情報が生成される。従って、このカラオケ動画を検索するためのメタ情報として、カラオケ動画自体から生成した場合と比較してより正確な情報を容易に生成することができる。 According to the first to sixth aspects of the invention, a karaoke video is generated and meta information is generated based on the material information developed in the temporary storage means. Therefore, more accurate information can be easily generated as meta information for searching for this karaoke video as compared to the case where the karaoke video is generated from the karaoke video itself.
更に請求項1、3又は5に記載の発明によれば、正確な歌唱開始時刻を含むメタ情報を容易に生成することができる。
Furthermore , according to invention of
更に請求項2、4又は6に記載の発明によれば、正確な歌詞に基づいて、歌唱の難易度を含むメタ情報を容易に生成することができる。
Furthermore , according to invention of
以下、本発明の実施形態を図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[1.通信システムの構成]
図1(A)は、本実施形態の通信システムSの概要構成例を示す図である。図1(A)に示すように、通信システムSは、カラオケ動画生成サーバ1、データ送信端末2、ネットワークストレージ3、カラオケ動画配信サーバ4、及び複数の利用者端末5を含んで構成される。カラオケ動画生成サーバ1は、本発明の情報処理装置の一例である。カラオケ動画生成サーバ1、データ送信端末2、カラオケ動画配信サーバ4、及び複数の利用者端末5は、それぞれネットワーク10に接続される。ネットワーク10は、例えば、インターネット等により構成される。カラオケ動画生成サーバ1及びカラオケ動画配信サーバ4と、ネットワークストレージ3とは、例えばLAN(Local Area Network)等のネットワークにより接続される。
[1. Configuration of communication system]
FIG. 1A is a diagram illustrating a schematic configuration example of the communication system S of the present embodiment. As shown in FIG. 1A, the communication system S includes a karaoke
カラオケ動画生成サーバ1は、データ送信端末2から複数の材料データを受信する。そして、カラオケ動画生成サーバ1は、複数の材料データに基づいて、カラオケ動画データを生成する。カラオケ動画データは、カラオケ楽曲の歌詞のテロップが合成された映像のデータと、カラオケ楽曲の演奏音のデータとを含む。カラオケ動画データの形式は、例えばMP4(ISO/IEC 14496-14:2003)等であってもよい。
The karaoke
材料データは、カラオケ動画データを生成するための材料となるデータである。複数の材料データは、少なくとも映像データ、音声データ、及びテロップデータを含む。映像データは、カラオケ動画データに含まれる映像を示すデータである。映像データの形式は、例えばH.264等であってもよい。音声データは、カラオケ楽曲の演奏音を示すデータである。音声データの形式は、例えばMIDI(Musical Instrument Digital Interface)、AAC(Advanced Audio Coding)等であってもよい。テロップデータは、カラオケ楽曲の歌詞と歌詞を表示するタイミングとを示すデータである。図2(A)は、テロップデータの構成例を示す図である。図2(A)に示すように、テロップデータは、歌詞の文字情報を含む。また、テロップデータは、歌詞を構成する文字ごとの表示開始時刻及び表示終了時刻を含む。表示開始時刻は、カラオケ楽曲の演奏が開始されてから、対応する文字を表示させるまでに経過する時間を示す。表示終了時刻は、カラオケ楽曲の演奏が開始されてから、対応する文字の表示を終了させるまでに経過する時間を示す。図2(A)の例では、「生」の表示開始時刻及び終了時刻がそれぞれ500ミリ秒及び1000ミリ秒に設定されている。また、「麦」の表示開始時刻及び終了時刻がそれぞれ1000ミリ秒及び1200ミリ秒に設定されている。 The material data is data serving as a material for generating karaoke video data. The plurality of material data includes at least video data, audio data, and telop data. The video data is data indicating video included in the karaoke video data. The format of the video data is, for example, H.264. H.264 or the like may be used. The audio data is data indicating the performance sound of karaoke music. The format of the audio data may be, for example, MIDI (Musical Instrument Digital Interface), AAC (Advanced Audio Coding), or the like. The telop data is data indicating the lyrics of karaoke music and the timing for displaying the lyrics. FIG. 2A is a diagram illustrating a configuration example of telop data. As shown in FIG. 2A, the telop data includes text information of lyrics. The telop data includes a display start time and a display end time for each character constituting the lyrics. The display start time indicates the time that elapses from when the performance of the karaoke music is started until the corresponding character is displayed. The display end time indicates the time that elapses from when the performance of the karaoke music is started until the display of the corresponding character is ended. In the example of FIG. 2A, the display start time and end time of “raw” are set to 500 milliseconds and 1000 milliseconds, respectively. The display start time and end time of “wheat” are set to 1000 milliseconds and 1200 milliseconds, respectively.
また、カラオケ動画生成サーバ1は、複数の材料データのうち少なくとも1つに基づいて、カラオケ動画データの検索に用いられるメタ情報を生成する。カラオケ動画生成サーバ1は、生成したカラオケ動画データ及びメタ情報をネットワークストレージ3に記憶させる。
Moreover, the karaoke moving image production |
データ送信端末2は、例えばカラオケ動画データの配信サービスの運営者等により利用される。運営者は、例えば材料データをデータ送信端末2に入力し、又はデータ送信端末2を操作して材料データを作成する。データ送信端末2は、入力又は作成された材料データをカラオケ動画生成サーバ1へ送信する。
The
ネットワークストレージ3は、複数のカラオケ動画データを記憶する。ネットワークストレージ3は、カラオケ楽曲を識別可能な識別情報に関連付けて、カラオケ動画データを記憶する。識別情報は、例えば楽曲番号等であってもよい。また、ネットワークストレージ3は、カラオケ動画データごとに、1又は複数のメタ情報を記憶する。ネットワークストレージ3は、例えばハードディスクドライブ等により構成されている。
The
カラオケ動画配信サーバ4は、ネットワークストレージ3から、利用者端末5から送信されてきた検索条件に合致するメタ情報を検索する。カラオケ動画配信サーバ4は、検索されたメタ情報に含まれる楽曲番号に関連付けられたカラオケ動画データをネットワークストレージ3から特定する。これにより、カラオケ動画配信サーバ4は、カラオケ動画データを検索する。そして、カラオケ動画配信サーバ4は、検索されたカラオケ動画データを利用者端末5へストリーミング配信する。
The karaoke
利用者端末5は、カラオケの配信サービスの利用者により利用される。利用者は、利用者端末5を操作して、カラオケ動画データを検索するための検索条件を指定する。利用者端末5は、指定された検索条件をカラオケ動画配信サーバ4へ送信する。また、利用者端末5は、カラオケ動画配信サーバ4から配信されてきたカラオケ動画データを再生する。利用者端末5の種類としては、例えばパーソナルコンピュータ、テレビ、STB、携帯電話機、スマートフォン、タブレット型コンピュータ、カラオケ装置等がある。
The
[2.カラオケ動画生成サーバ1の構成]
次に、図1(B)、図2(B)乃至図2(D)を参照して、カラオケ動画生成サーバ1の構成について説明する。図1(B)は、本実施形態のカラオケ動画生成サーバ1の概要構成例を示す図である。図1(B)に示すように、カラオケ動画生成サーバ1は、CPU(Center Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、記憶部14及び通信部15等を備えて構成される。これらの構成要素は、バス16に接続されている。通信部15は、ネットワーク10に接続される。記憶部14は、例えばハードディスクドライブにより構成される。記憶部14には、OS、及びサーバプログラム等が記憶されている。サーバプログラムは、コンピュータとしてのCPUに、カラオケ動画データの生成及びメタ情報の生成等を実行させるプログラムである。サーバプログラム等は、例えばネットワーク10等を介して他のサーバ等からダウンロードされてもよい。或いは、サーバプログラム等は、例えば光ディスク、磁気テープ、メモリカード等の記録媒体に記録されてドライブ装置を介して記憶部14に読み込まれてもよい。また、記憶部14には、メタ情報を生成するための情報等が記憶されている。具体的に、記憶部14には、難歌詞リスト、キーワードリスト、及び種類リストが記憶されている。これらのリストは、例えばカラオケ動画データの配信サービスの運営者等により作成されてもよい。
[2. Configuration of Karaoke Movie Generation Server 1]
Next, the configuration of the karaoke
図2(B)は、難歌詞リストの構成例を示す図である。難歌詞リストは、カラオケ楽曲の難歌詞のリストである。難歌詞は、歌唱の難度が高い語として予め定められた語である。具体的に、難歌詞リストには、難歌詞ごとに、難歌詞と基準歌唱時間とが対応付けて登録されている。基準歌唱時間は、対応する難歌詞の歌唱が難しく感じる時間の基準値である。図2(B)の例では、難歌詞「生麦」と基準歌唱時間1000ミリ秒とが対応付けて登録されている。この場合、カラオケ楽曲において「生麦」の歌唱時間が1000ミリ秒未満である場合、「生麦」の歌唱が難しいと判定されてもよい。 FIG. 2B is a diagram illustrating a configuration example of the difficult lyrics list. The difficult lyrics list is a list of difficult lyrics of karaoke music. Difficult lyrics are words that are predetermined as words that are difficult to sing. Specifically, in the difficult lyrics list, the difficult lyrics and the standard singing time are registered in association with each difficult lyrics. The reference singing time is a reference value for the time when it is difficult to sing the corresponding difficult lyrics. In the example of FIG. 2B, the difficult lyrics “Namamugi” and the standard singing time of 1000 milliseconds are registered in association with each other. In this case, when the singing time of “Namamugi” is less than 1000 milliseconds in the karaoke music piece, it may be determined that the singing of “Namamugi” is difficult.
図2(C)は、キーワードリストの構成例を示す図である。キーワードリストは、キーワードとそのキーワードに関連する単語と示すリストである。具体的に、キーワードリストには、キーワードごとに、キーワードと、そのキーワードに関連する複数の単語とが対応付けて登録されている。図2(C)の例では、キーワード「春」に対応付けて、単語「桜」、「梅」、「卒業」、「巣立」、「入学」が登録されている。 FIG. 2C is a diagram illustrating a configuration example of the keyword list. The keyword list is a list indicating keywords and words related to the keywords. Specifically, in the keyword list, for each keyword, a keyword and a plurality of words related to the keyword are registered in association with each other. In the example of FIG. 2C, the words “cherry blossom”, “ume”, “graduation”, “nest”, and “enrollment” are registered in association with the keyword “spring”.
図2(D)は、種類リストの構成例を示す図である。種類リストは、楽曲の種類のリストである。具体的に、種類リストには、楽曲の種類ごとに、楽曲種別と、1又は複数の音色情報とが対応付けて登録されている。楽曲種別は、楽曲の種類を識別可能な識別情報である。音色情報は、楽曲種別が示す種類の楽曲の演奏に用いられる音源の音色を示す情報である。音色情報の付与体系は、例えばジェネラルMIDIで定義されている音色の番号の付与体系と同一であってもよい。図2(D)に示す種類リストには、楽曲種別「民謡」に対応付けて音色情報「三味線」が登録されている。 FIG. 2D is a diagram illustrating a configuration example of the type list. The type list is a list of music types. Specifically, in the type list, for each type of music, a music type and one or a plurality of timbre information are registered in association with each other. The music type is identification information that can identify the type of music. The timbre information is information indicating the timbre of the sound source used for the performance of the type of music indicated by the music type. The timbre information assigning system may be the same as the timbre number assigning system defined by General MIDI, for example. In the type list shown in FIG. 2D, tone color information “shamisen” is registered in association with the music type “folk song”.
[3.メタ情報の生成]
例えば、生成されたカラオケ動画データに基づいてメタ情報を生成しようとする場合、カラオケ動画データを解析する必要がある。しかしながら、カラオケ動画データからは、元になった材料データが有する詳細な情報が失われている。そこで、カラオケ動画データの生成に用いられた複数の材料データの少なくとも1つに基づいて運営者がメタ情報を作成することを考える。ところが、完成したカラオケ動画データについて、後でメタ情報を作成しようとした場合、次に述べる問題が生じる。すなわち、メタ情報を作成するまでに、カラオケ動画データの生成に用いられた材料データを、データストレージ3、記憶部14等の記憶手段に保存させておくか、或いはメモリカード、磁気テープ、光ディスク等の記録媒体に保存しておく必要がある。従って、材料データを保存するためにコンピュータリソースを浪費する。また、カラオケ動画データの生成時と、メタ情報の生成時とで、それぞれ材料データを記憶手段又は記録媒体から読み出す必要があるので、二度手間となる。
[3. Meta information generation]
For example, when generating meta information based on generated karaoke video data, it is necessary to analyze karaoke video data. However, the detailed information of the original material data is lost from the karaoke video data. Therefore, consider that the operator creates meta information based on at least one of a plurality of material data used for generating karaoke video data. However, if meta information is to be created later for completed karaoke video data, the following problem arises. That is, the material data used for generating the karaoke video data is stored in the storage means such as the
そこで、カラオケ動画生成サーバ1のCPU11は、データ送信端末2から取得した複数の材料データをRAM13に展開する。CPU11は、例えば1回のみ、複数の材料データをRAM13に展開してもよい。CPU11は、RAM13に複数の材料データが1回展開された状態における複数の材料データに基づいて、カラオケ動画データを生成し、且つRAM13に複数の材料データが1回展開された状態における複数の材料データの少なくとも1つに基づいて、メタ情報を生成する。すなわち、CPU11は、カラオケ動画データの生成に用いられた正にその材料データを用いてメタ情報を生成し、又はメタ情報の生成に用いられた正にその材料データを用いてカラオケ動画データを生成する。RAM13は、データを一時的に記憶する作業用の記憶手段である。RAM13に記憶されたデータは、いつかは消去される。CPU11は、メタ情報がRAM13に記憶されている間に、カラオケ動画データの生成とメタ情報の生成とを行うことで、材料データを保存するためのリソースの浪費を防止することができるとともに、材料データの読み出しの手間を減らすことができる。更に、カラオケ動画データの生成に用いられる材料データに基づいて正確なメタ情報を生成することができる。CPU11は、例えばカラオケ動画データの生成とメタ情報の生成とを同時に又は連続して実行してもよいし、別々のタイミングで生成してもよい。メタ情報がRAM13から消去されるまでの間に、カラオケ動画データとメタ情報が生成されればよい。また、CPU11は、カラオケ動画データを先に生成してもよいし、メタ情報を先に生成してもよい。RAM13は、本発明の一時記憶手段の一例である。一時記憶手段は、RAM13に限定されるものではない。例えば、保存を目的とせずに材料データが一時的に記憶されるのであれば、例えば不揮発性のメモリに対しても本発明の一時記憶手段を適用することができる。
Therefore, the
次に、図3を参照して、メタ情報の生成の具体例について説明する。例えば、CPU11は、歌唱開始時刻を含むメタ情報を生成してもよい。歌唱開始時刻は、カラオケ楽曲の演奏が開始されてから、カラオケ楽曲の最初の歌詞の歌唱が開始されるまでの時間である。具体的に、CPU11は、RAM13にテロップデータから、歌詞の先頭の文字の表示開始時刻を、歌唱開始時刻として取得する。カラオケ動画データの再生時、利用者は、歌詞のテロップの表示のタイミングに合わせて歌唱する。従って、最初の歌詞部分の表示開始時刻を、歌唱開始時刻と考えることができる。図3(A)は、歌唱開始時刻を含むメタ情報の構成例を示す図である。図3(A)に示すメタ情報は、楽曲番号と歌唱開始時刻とを含む。カラオケ動画データの検索時、利用者は、例えば検索条件として歌唱開始時刻の条件を指定することができる。この条件として、例えば10秒、5秒以上、20秒以下等の指定が可能であってもよい。カラオケ動画配信サーバ4は、指定された歌唱開始時刻の条件を満たす歌唱開始時刻を含むメタ情報をネットワークストレージ3から検索する。
Next, a specific example of generation of meta information will be described with reference to FIG. For example, the
また例えば、CPU11は、歌唱難易度を含むメタ情報を生成してもよい。歌唱難易度は、カラオケ楽曲の歌唱の難しさを示す情報である。歌唱難易度が高いほど、歌唱が難しい。具体的に、CPU11は、難歌詞リストに登録されている難歌詞のうち、テロップデータに含まれる難歌詞を抽出する。CPU11は、抽出された難歌詞の歌唱時間をテロップデータから取得する。例えば、CPU11は、難歌詞の最初の文字の表示開始時刻から、難歌詞の最後の文字の表示終了時刻までの時間を、歌唱時間として取得する。CPU11は、テロップデータから取得した歌唱時間と、難歌詞の基準歌唱時間とを比較する。そして、CPU11は、この比較の結果に基づいて、歌唱難易度を決定する。例えば、CPU11は、取得した歌唱時間が基準歌唱時間よりも短い難歌詞が多いほど、高い歌唱難易度を決定してもよい。例えば、図2(A)に示すテロップデータにおいては、「生」と「麦」が連続している。従って、このテロップデータは、図2(B)に示す難歌詞「生麦」を含む。「生」の表示開始時刻は500ミリ秒であり、「麦」の表示終了時刻は1200ミリ秒である。従って、「生麦」の歌唱時間は700ミリ秒である。図2(B)に示す難歌詞「生麦」の基準歌唱時間は1000ミリ秒であるので、CPU11は、例えば歌唱難易度を1増加させてもよい。図3(B)は、歌唱難易度を含むメタ情報の構成例を示す図である。図3(B)に示すメタ情報は、楽曲番号と歌唱難易度とを含む。カラオケ動画データの検索時、利用者は、例えば検索条件として歌唱難易度の条件を指定することができる。この条件として、例えば難易度0、難易度5以上、難易度8以下等の指定が可能であってもよい。カラオケ動画配信サーバ4は、指定された歌唱難易度の条件を満たす歌唱難易度を含むメタ情報をネットワークストレージ3から検索する。
Further, for example, the
また例えば、CPU11は、キーワードを含むメタ情報を生成してもよい。具体的に、CPU11は、キーワードリストに登録されている単語のうち、テロップデータに含まれる単語に対応付けられたキーワードを、キーワードリストから抽出する。CPU11は、抽出されたキーワードの抽出頻度を出現度として、キーワードリストに登録されているキーワードごとに計数する。図3(C)は、キーワードの出現度の例を示す図である。図3(C)の例では、キーワード「春」の出現度が4であり、キーワード「演歌」の出現度が1である。CPU11は、出現度が所定の頻度を超えるキーワードを、カラオケ楽曲のキーワードに決定する。図3(D)は、キーワードを含むメタ情報の構成例を示す図である。図3(D)に示すメタ情報は、楽曲番号と1又は複数のキーワードとを含む。例えば所定の頻度が3である場合、図3(C)に示すキーワードのうち「春」が、カラオケ楽曲のキーワードに決定される。なお、所定の頻度は3以外であってもよい。カラオケ動画データの検索時、利用者は、例えば検索条件としてキーワードを指定することができる。カラオケ動画配信サーバ4は、指定されたキーワードを含むメタ情報をネットワークストレージ3から検索する。
Further, for example, the
仮に、図3(A)、図3(B)、図3(D)に示すメタ情報を、カラオケ動画データに基づいて生成するとする。この場合、カラオケ動画データに含まれる映像データを解析して、歌詞を抽出する必要がある。そのため、CPU11の処理負荷が増大するとともに、歌詞を正確に抽出することができない場合がある。対照的に、本実施形態においては、歌詞を明確に示すテロップデータに基づいてCPU11がメタ情報を生成するので、正確なメタ情報を生成することができる。
Assume that the meta information shown in FIGS. 3A, 3B, and 3D is generated based on karaoke video data. In this case, it is necessary to analyze the video data included in the karaoke video data and extract the lyrics. As a result, the processing load on the
また例えば、CPU11は、楽曲種別を含むメタ情報を生成してもよい。例えば、音声データがMIDIデータである場合、音声データは、1又は複数のトラックを含む。トラックは音色情報を含む場合がある。この音色情報は、カラオケ楽曲の演奏に用いられる音源の音色を示す。CPU11は、種類リストに登録されている音色情報のうち、音声データに含まれる音色情報に対応付けられた楽曲種別を、種類リストから抽出する。そして、CPU11は、抽出した楽曲種別を含むメタ情報を生成する。図3(E)は、楽曲種別を含むメタ情報の構成例を示す図である。図3(E)に示すメタ情報は、楽曲番号と1又は複数の楽曲種別とを含む。カラオケ動画データの検索時、利用者は、例えば検索条件として楽曲種別を指定することができる。カラオケ動画配信サーバ4は、指定された楽曲種別を含むメタ情報をネットワークストレージ3から検索する。なお、1つのカラオケ楽曲について、複数の楽曲種別を抽出する場合がある。この場合、CPU11は、例えば抽出された頻度が最も高い楽曲種別を決定し、決定した楽曲種別のみを含むメタ情報を生成してもよい。抽出された頻度が高い楽曲種別ほど、カラオケ楽曲の種類を示す蓋然性が高いと考えられる。或いは、CPU11は、例えば抽出された頻度が最も高い楽曲種別から順に所定数までの複数の楽曲種別を決定し、決定した複数の楽曲種別を含むメタ情報を生成してもよい。或いは、CPU11は、抽出した楽曲種別ごとに、抽出された頻度を示す情報を生成してもよい。そして、CPU11は、楽曲種別と抽出された頻度を示す情報とを含むメタ情報を生成してもよい。
Further, for example, the
仮に、図3(E)に示すメタ情報を、カラオケ動画データに基づいて生成するとする。この場合、カラオケ動画データに含まれる音声データを解析して、音源や音色を特定する必要がある。しかしながら、この音声データは、例えば、AAC等の、音声をサンプリングして得られるデータである。そのため、CPU11の処理負荷が増大するとともに、音色を正確に特定することができない場合がある。対照的に、本実施形態においては、音色情報を含むMIDI形式の音声データに基づいてCPU11がメタ情報を生成するので、正確なメタ情報を生成することができる。
Suppose that the meta information shown in FIG. 3E is generated based on karaoke video data. In this case, it is necessary to analyze the sound data included in the karaoke video data and specify the sound source and tone color. However, this audio data is data obtained by sampling audio, such as AAC. For this reason, the processing load on the
CPU11は、これまでに説明された4種類のメタ情報の全てを生成してもよいし、一部のメタ情報のみを生成してもよい。また、CPU11は、例えば別の種類のメタ情報を生成してもよい。また、CPU11は、複数の材料データに含まれる映像データに基づいて、メタ情報を生成してもよい。また、CPU11は、例えば2以上の材料データに基づいて、メタ情報を生成してもよい。また、CPU11は、複数種類の情報を含むメタ情報を生成してもよい。例えば、CPU11は、歌唱開始時刻、難易度、キーワード、楽曲種別等を含む1つのメタ情報を生成してもよい。
The
[4.通信システムSの動作]
次に、図4乃至図6を参照して、本実施形態の通信システムSの動作について説明する。図4(A)は、カラオケ動画生成サーバ1におけるサーバ処理の一例を示すフローチャートである。例えば、カラオケ動画生成サーバ1においてサーバプログラムが起動すると、CPU11は、サーバ処理を実行する。図4(A)に示すように、CPU11は、サーバプログラムが終了するか否かを判定する(ステップS1)。このとき、CPU11は、サーバプログラムが終了しないと判定した場合には(ステップS1:NO)、ステップS2に進む。ステップS2において、CPU11は、データ送信端末2から複数の材料データを受信したか否かを判定する。このとき、CPU11は、複数の材料データを受信していないと判定した場合には(ステップS2:NO)、ステップS1に進む。一方、CPU11は、複数の材料データを受信したと判定した場合には(ステップS2:YES)、ステップS3に進む。
[4. Operation of communication system S]
Next, the operation of the communication system S of the present embodiment will be described with reference to FIGS. FIG. 4A is a flowchart illustrating an example of server processing in the karaoke
ステップS3において、CPU11は、受信された複数の材料データをRAM13に展開する。また、CPU11は、生成されるカラオケ動画データの楽曲番号を取得する。例えば、CPU11は、データ送信端末2から楽曲番号を取得してもよいし、CPU11が楽曲番号を生成してもよい。次いで、CPU11は、後述するメタ情報生成処理を実行する(ステップS4)。
In step S <b> 3, the
次いで、CPU11は、RAM13に展開された複数の材料データに基づいて、カラオケ動画データを生成する(ステップS5)。例えば、材料データに含まれる音声データがMIDI形式のデータである場合、CPU11は、音声データを、例えばAAC等の形式の音声データに変換する。また、CPU11は、材料データに含まれる映像データに、材料データに含まれるテロップデータが示す歌詞を合成する。例えば、CPU11は、歌詞を構成する文字ごとに、映像の再生開始から表示開始時刻のタイミングでその文字の表示が開始され、映像の再生開始から表示終了時刻のタイミングでその文字の表示が終了するように、合成を行う。CPU11は、音声データと、歌詞が合成された映像データとを多重化して、カラオケ動画データを生成する。次いで、CPU11は、カラオケ動画データと楽曲番号とを対応付けてネットワークストレージ3に記憶させる。そして、CPU11は、ステップS1に進む。ステップS1において、CPU11は、サーバプログラムが終了すると判定した場合には(ステップS1:YES)、サーバ処理を終了させる。
Next, the
図4(B)は、カラオケ動画生成サーバ1におけるメタ情報生成処理の一例を示すフローチャートである。図4(B)に示すように、CPU11は、後述する歌唱開始時刻メタ情報生成処理(ステップS11)、歌唱難易度メタ情報生成処理(ステップS12)、キーワードメタ情報生成処理(ステップS13)、及び楽曲種別メタ情報生成処理(ステップS14)を実行して、メタ情報生成処理を終了させる。
FIG. 4B is a flowchart illustrating an example of meta information generation processing in the karaoke
図5(A)は、カラオケ動画生成サーバ1における歌唱開始時刻メタ情報生成処理の一例を示すフローチャートである。図5(A)に示すように、CPU11は、RAM13に展開されたテロップデータから、歌詞の先頭の文字の表示開始時刻を、歌唱開始時刻として取得する(ステップS21)。次いで、CPU11は、楽曲番号と、取得した歌唱開始時刻とを含むメタ情報を生成する。そして、CPU11は、メタ情報をネットワークストレージ3に記憶させて(ステップS22)、歌唱開始時刻メタ情報生成処理を終了させる。
FIG. 5A is a flowchart illustrating an example of the singing start time meta information generation process in the karaoke
図5(B)は、カラオケ動画生成サーバ1における歌唱難易度メタ情報生成処理の一例を示すフローチャートである。図5(B)に示すように、CPU11は、記憶部14から難歌詞リストを読み出す(ステップS31)。次いで、CPU11は、歌唱難易度を0に設定するとともに、番号iを1に設定する(ステップS32)。次いで、CPU11は、RAM13に展開されたテロップデータに、難歌詞(i)が含まれているか否かを判定する(ステップS33)。難歌詞(i)は、難歌詞リストに含まれる難歌詞のうち、i番目の難歌詞である。CPU11は、テロップデータに、難歌詞(i)が含まれていないと判定した場合には(ステップS33:NO)、ステップS37に進む。一方、CPU11は、テロップデータに、難歌詞(i)が含まれていると判定した場合には(ステップS33:YES)、ステップS34に進む。
FIG. 5B is a flowchart showing an example of the singing difficulty level meta information generation processing in the karaoke
ステップS34において、CPU11は、テロップデータから、難歌詞(i)の先頭の文字の表示開始時刻と、難歌詞(i)の最後の文字の表示終了時刻とを取得する。そして、CPU11は、取得した表示終了時刻から表示開始時刻を減算することにより、歌唱時間を取得する。次いで、CPU11は、難歌詞(i)に対応付けて難歌詞リストに登録されている基準歌唱時間が、取得された歌唱時間よりも長いか否かを判定する(ステップS35)。このとき、CPU11は、基準歌唱時間が、取得された歌唱時間よりも長くはないと判定した場合には(ステップS35:NO)、ステップS37に進む。一方、CPU11は、基準歌唱時間が、取得された歌唱時間よりも長いと判定した場合には(ステップS35:YES)、ステップS36に進む。ステップS36において、CPU11は、歌唱難易度を1増加させる。
In step S34, the
次いで、CPU11は、番号iが、難歌詞リストに登録されている難歌詞の数未満であるか否かを判定する(ステップS37)。このとき、CPU11は、番号iが難歌詞の数未満であると判定した場合には(ステップS37:YES)、ステップS38に進む。ステップS38において、CPU11は、番号iを1増加させて、ステップS33に進む。一方、CPU11は、番号iが難歌詞の数未満ではないと判定した場合には(ステップS37:NO)、ステップS39に進む。ステップS39において、CPU11は、楽曲番号と歌唱難易度とを含むメタ情報を生成する。そして、CPU11は、メタ情報をネットワークストレージ3に記憶させて、歌唱難易度メタ情報生成処理を終了させる。
Next, the
図6(A)は、カラオケ動画生成サーバ1におけるキーワードメタ情報生成処理の一例を示すフローチャートである。図6(A)に示すように、CPU11は、記憶部14からキーワードリストを読み出す(ステップS41)。次いで、CPU11は、キーワードリストに含まれる各キーワードの出現度を0に設定する。また、CPU11は、番号iを1に設定する(ステップS42)。次いで、CPU11は、RAM13に展開されたテロップデータに、単語(i)が含まれているか否かを判定する(ステップS43)。単語(i)は、キーワードリストに含まれる単語のうち、i番目の単語である。CPU11は、テロップデータに、単語(i)が含まれていないと判定した場合には(ステップS43:NO)、ステップS45に進む。一方、CPU11は、テロップデータに、単語(i)が含まれていると判定した場合には(ステップS43:YES)、ステップS44に進む。ステップS44において、CPU11は、単語(i)に対応付けてキーワードリストに登録されているキーワードの出現度を1増加させて、ステップS45に進む。
FIG. 6A is a flowchart showing an example of keyword meta information generation processing in the karaoke
ステップS45において、CPU11は、番号iが、キーワードリストに登録されている単語の数未満であるか否かを判定する。このとき、CPU11は、番号iが単語の数未満であると判定した場合には(ステップS45:YES)、ステップS46に進む。ステップS46において、CPU11は、番号iを1増加させて、ステップS43に進む。一方、CPU11は、番号iが単語の数未満ではないと判定した場合には(ステップS45:NO)、ステップS47に進む。
In step S45, the
ステップS47において、CPU11は、番号iを1に設定する。次いで、CPU11は、キーワード(i)の出現度が3よりも大きいか否かを判定する(ステップS48)。キーワード(i)は、キーワードリストに登録されているキーワードのうち、i番目のキーワードである。CPU11は、キーワード(i)の出現度が3よりも大きくはないと判定した場合には(ステップS48:NO)、ステップS50に進む。一方、CPU11は、キーワード(i)の出現度が3よりも大きいと判定した場合には(ステップS48:YES)、ステップS49に進む。ステップS49において、CPU11は、キーワード(i)を、カラオケ楽曲のキーワードの1つとして、RAM13に保存する。次いで、CPU11は、ステップS50に進む。
In step S47, the
ステップS50において、CPU11は、番号iが、キーワードリストに登録されているキーワードの数未満であるか否かを判定する。このとき、CPU11は、番号iがキーワードの数未満であると判定した場合には(ステップS50:YES)、ステップS51に進む。ステップS51において、CPU11は、番号iを1増加させて、ステップS48に進む。一方、CPU11は、番号iがキーワードの数未満ではないと判定した場合には(ステップS50:NO)、ステップS52に進む。ステップS52において、CPU11は、楽曲番号と、RAM13に保存しておいたキーワードとを含むメタ情報を生成する。そして、CPU11は、メタ情報をネットワークストレージ3に記憶させて、キーワードメタ情報生成処理を終了させる。
In step S50, the
図6(B)は、カラオケ動画生成サーバ1における楽曲種別メタ情報生成処理の一例を示すフローチャートである。図6(B)に示すように、CPU11は、記憶部14から種類リストを読み出す(ステップS61)。次いで、CPU11は、番号iを1に設定する(ステップS62)。次いで、CPU11は、RAM13に展開された音声データに、音色情報(i)が含まれているか否かを判定する(ステップS63)。音色情報(i)は、種類リストに含まれる音色情報のうち、i番目の音色情報である。CPU11は、テロップデータに、音色情報(i)が含まれていないと判定した場合には(ステップS63:NO)、ステップS65に進む。一方、CPU11は、テロップデータに、音色情報(i)が含まれていると判定した場合には(ステップS63:YES)、ステップS64に進む。ステップS64において、CPU11は、音色情報(i)に対応付けて種類リストに登録されている楽曲種別を、カラオケ楽曲の種類を示す可能性がある楽曲種別としてRAM13に保存する。次いで、CPU11は、ステップS65に進む。
FIG. 6B is a flowchart illustrating an example of music type meta information generation processing in the karaoke
ステップS65において、CPU11は、番号iが、種類リストに登録されている音色情報の数未満であるか否かを判定する。このとき、CPU11は、番号iが音色情報の数未満であると判定した場合には(ステップS65:YES)、ステップS66に進む。ステップS66において、CPU11は、番号iを1増加させて、ステップS63に進む。一方、CPU11は、番号iが音色情報の数未満ではないと判定した場合には(ステップS65:NO)、ステップS67に進む。ステップS67において、CPU11は、楽曲番号と、RAM13に保存しておいた楽曲種別とを含むメタ情報を生成する。そして、CPU11は、メタ情報をネットワークストレージ3に記憶させて、楽曲種別メタ情報生成処理を終了させる。
In step S65, the
以上説明したように、本実施形態によれば、カラオケ動画生成サーバ1が、データ送信端末2から取得された複数の材料情報をRAM13に展開する。また、カラオケ動画生成サーバ1が、RAM13に展開された複数の材料情報に基づいて、カラオケ動画データを生成する。また、カラオケ動画生成サーバ1がRAM13に展開された複数の材料情報のうち少なくとも1つの材料情報に基づいて、メタ情報を生成する。従って、カラオケ動画自体から生成した場合と比較してより正確なメタ情報を容易に生成することができる。
As described above, according to the present embodiment, the karaoke
1 カラオケ動画生成サーバ
2 データ送信端末
3 ネットワークストレージ
4 カラオケ動画配信サーバ
5 利用者端末
10 ネットワーク
11 CPU
12 ROM
13 RAM
14 記憶部
15 通信部
S 通信システム
DESCRIPTION OF
12 ROM
13 RAM
14
Claims (6)
前記取得手段が、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、The acquisition means is a plurality of material information used as a material of a karaoke video, and is video information, sound information indicating a performance sound of karaoke music, and lyrics information indicating lyrics of the karaoke music, An acquisition step of acquiring a plurality of material information including at least lyrics information including an elapsed time from the start of performance until the display of the lyrics is started;
前記展開手段が、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、The unfolding step in which the unfolding means unfolds the plurality of material information acquired in the acquiring step once in the temporary storage unit;
前記カラオケ動画生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、A karaoke video generation step, wherein the karaoke video generation means generates the karaoke video based on the plurality of material information in a state in which the plurality of material information is once expanded in the temporary storage means by the expansion step; ,
前記メタ情報生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成ステップと、The meta information generating unit is configured to generate the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage unit by the expanding step. Meta information generation step for generating meta information that is meta information used for search and includes the elapsed time included in the lyrics information as a singing start time;
を含むことを特徴とする情報処理方法。An information processing method comprising:
前記取得手段が、カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、The acquisition means is a plurality of material information used as a material of a karaoke video, and includes video information, sound information indicating a performance sound of karaoke music, and lyrics information indicating lyrics of the karaoke music, and is included in the lyrics An acquisition step of acquiring a plurality of material information including at least lyrics information including a display time from the start to the end of the display of each word,
前記展開手段が、前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、The unfolding step in which the unfolding means unfolds the plurality of material information acquired in the acquiring step once in the temporary storage unit;
前記カラオケ動画生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、A karaoke video generation step, wherein the karaoke video generation means generates the karaoke video based on the plurality of material information in a state in which the plurality of material information is once expanded in the temporary storage means by the expansion step; ,
前記語抽出手段が、歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出ステップと、The word extraction means is stored in a first storage means for storing a high difficulty word predetermined as a word having a high difficulty in singing and a reference time for singing the high difficulty word in association with each high difficulty word. A word extraction step of extracting a high difficulty word included in the lyrics information developed in the temporary storage means among the plurality of high difficulty words;
前記比較手段が、前記語抽出ステップにより抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較ステップと、A comparison step in which the comparison means compares, for each high difficulty word extracted by the word extraction step, a reference time of singing the high difficulty word and a display time of the high difficulty word;
前記難易度決定手段が、前記比較ステップによる比較結果に基づいて、前記歌詞の難易度を決定する難易度決定ステップと、The difficulty level determination means determines the difficulty level of the lyrics based on the comparison result of the comparison step; and
前記メタ情報生成手段が、前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定ステップにより決定された前記難易度を含むメタ情報を生成するメタ情報生成ステップと、The meta information generating unit is configured to generate the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage unit by the expanding step. Meta information used for the search, and a meta information generation step for generating meta information including the difficulty level determined by the difficulty level determination step;
を含むことを特徴とする情報処理方法。An information processing method comprising:
カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得手段と、A plurality of material information used as a material for the karaoke video, the video information, the sound information indicating the performance sound of the karaoke music, and the lyric information indicating the lyrics of the karaoke music, and the performance of the karaoke music is started. Acquisition means for acquiring a plurality of material information including at least lyrics information including an elapsed time until display of the lyrics is started;
前記取得手段により取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開手段と、Expanding means for expanding the plurality of material information acquired by the acquiring means once in the temporary storage means;
前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成手段と、Karaoke video generation means for generating the karaoke video based on the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expansion means;
前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成手段と、Meta information used for searching the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage unit by the expanding unit. Meta information generating means for generating meta information including the elapsed time included in the lyrics information as a singing start time;
を備えることを特徴とする情報処理装置。An information processing apparatus comprising:
カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得手段と、It is a plurality of material information that becomes the material of the karaoke video, video information, sound information indicating the performance sound of the karaoke music, and lyric information indicating the lyrics of the karaoke music, for each word included in the lyrics, Acquisition means for acquiring a plurality of material information including at least lyrics information including a display time from the start to the end of display of the word;
前記取得手段により取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開手段と、Expanding means for expanding the plurality of material information acquired by the acquiring means once in the temporary storage means;
前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成手段と、Karaoke video generation means for generating the karaoke video based on the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expansion means;
歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出手段と、A plurality of high difficulty words stored in a first storage means for storing a high difficulty word predetermined as a word having a high difficulty of singing and a reference time of singing the high difficulty word in association with each high difficulty word Among them, word extraction means for extracting high difficulty words included in the lyrics information developed in the temporary storage means,
前記語抽出手段により抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較手段と、For each high difficulty word extracted by the word extraction means, a comparison means for comparing a reference time of singing the high difficulty word and a display time of the high difficulty word;
前記比較手段による比較結果に基づいて、前記歌詞の難易度を決定する難易度決定手段と、Difficulty determination means for determining the difficulty level of the lyrics based on the comparison result by the comparison means;
前記展開手段により前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定手段により決定された前記難易度を含むメタ情報を生成するメタ情報生成手段と、Meta information used for searching the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage unit by the expanding unit. Meta information generation means for generating meta information including the difficulty level determined by the difficulty level determination means;
を備えることを特徴とする情報処理装置。An information processing apparatus comprising:
カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記カラオケ楽曲の演奏が開始されてから前記歌詞の表示が開始されるまでの経過時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、A plurality of material information used as a material for the karaoke video, the video information, the sound information indicating the performance sound of the karaoke music, and the lyric information indicating the lyrics of the karaoke music, and the performance of the karaoke music is started. An acquisition step of acquiring a plurality of material information including at least lyrics information including an elapsed time until display of the lyrics is started;
前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、An unfolding step of unfolding the plurality of material information obtained by the obtaining step once in the temporary storage means;
前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、A karaoke video generation step for generating the karaoke video based on the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expansion step;
前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記歌詞情報に含まれる前記経過時間を、歌唱の開始時刻として含むメタ情報を生成するメタ情報生成ステップと、Meta information used for searching the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expanding step. A meta information generating step for generating meta information including the elapsed time included in the lyrics information as a singing start time;
を実行させることを特徴とするプログラム。A program characterized by having executed.
カラオケ動画の材料となる複数の材料情報であって、映像情報、カラオケ楽曲の演奏音を示す音情報、及び前記カラオケ楽曲の歌詞を示す歌詞情報であって、前記歌詞に含まれる語ごとに、前記語の表示の開始から終了までの表示時間を含む歌詞情報を少なくとも含む複数の材料情報を取得する取得ステップと、It is a plurality of material information that becomes the material of the karaoke video, video information, sound information indicating the performance sound of the karaoke music, and lyric information indicating the lyrics of the karaoke music, for each word included in the lyrics, An acquisition step of acquiring a plurality of material information including at least lyrics information including a display time from the start to the end of display of the word;
前記取得ステップにより取得された前記複数の材料情報を前記一時記憶手段に1回展開する展開ステップと、An unfolding step of unfolding the plurality of material information obtained by the obtaining step once in the temporary storage means;
前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報に基づいて、前記カラオケ動画を生成するカラオケ動画生成ステップと、A karaoke video generation step for generating the karaoke video based on the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expansion step;
歌唱の難度が高い語として予め定められた高難度語と、前記高難度語の歌唱の基準時間とを高難度語ごとに対応付けて記憶する第1記憶手段に記憶された複数の高難度語のうち、前記一時記憶手段に展開された前記歌詞情報に含まれる高難度語を抽出する語抽出ステップと、A plurality of high difficulty words stored in a first storage means for storing a high difficulty word predetermined as a word having a high difficulty of singing and a reference time of singing the high difficulty word in association with each high difficulty word A word extraction step of extracting high difficulty words included in the lyrics information developed in the temporary storage means,
前記語抽出ステップにより抽出された高難度語ごとに、前記高難度語の歌唱の基準時間と、前記高難度語の表示時間とを比較する比較ステップと、For each high difficulty word extracted by the word extraction step, a comparison step for comparing a reference time of singing the high difficulty word and a display time of the high difficulty word;
前記比較ステップによる比較結果に基づいて、前記歌詞の難易度を決定する難易度決定ステップと、A difficulty determination step for determining the difficulty level of the lyrics based on the comparison result of the comparison step;
前記展開ステップにより前記一時記憶手段に前記複数の材料情報が1回展開されている状態における前記複数の材料情報のうち少なくとも1つの材料情報に基づいて、前記カラオケ動画の検索に用いられるメタ情報であって、前記難易度決定ステップにより決定された前記難易度を含むメタ情報を生成するメタ情報生成ステップと、Meta information used for searching the karaoke video based on at least one material information among the plurality of material information in a state where the plurality of material information is expanded once in the temporary storage means by the expanding step. A meta information generation step for generating meta information including the difficulty level determined by the difficulty level determination step;
を実行させることを特徴とするプログラム。A program characterized by having executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015031888A JP6413828B2 (en) | 2015-02-20 | 2015-02-20 | Information processing method, information processing apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015031888A JP6413828B2 (en) | 2015-02-20 | 2015-02-20 | Information processing method, information processing apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016153958A JP2016153958A (en) | 2016-08-25 |
JP6413828B2 true JP6413828B2 (en) | 2018-10-31 |
Family
ID=56761378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015031888A Active JP6413828B2 (en) | 2015-02-20 | 2015-02-20 | Information processing method, information processing apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6413828B2 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3428101B2 (en) * | 1993-11-24 | 2003-07-22 | ヤマハ株式会社 | Karaoke equipment |
JPH08202376A (en) * | 1995-01-31 | 1996-08-09 | Matsushita Electric Ind Co Ltd | 'karaoke' singing equipment with video |
JP2006338550A (en) * | 2005-06-03 | 2006-12-14 | Fujitsu Ltd | Device and method for creating meta data |
JP4643735B1 (en) * | 2009-08-31 | 2011-03-02 | 株式会社東芝 | Electronic device and video processing method |
JP5544961B2 (en) * | 2010-03-19 | 2014-07-09 | ヤマハ株式会社 | server |
JP5201204B2 (en) * | 2010-12-24 | 2013-06-05 | ブラザー工業株式会社 | Karaoke apparatus and lyrics telop display method |
-
2015
- 2015-02-20 JP JP2015031888A patent/JP6413828B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016153958A (en) | 2016-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105868397B (en) | Song determination method and device | |
EP2060980A2 (en) | Server and client device, and information processing system and method | |
JP5706718B2 (en) | Movie synthesis system and method, movie synthesis program and storage medium thereof | |
JP2000081892A (en) | Device and method of adding sound effect | |
CN101202864A (en) | Player for movie contents | |
JP2010250023A (en) | Information processing apparatus with text display function, and data acquisition method and data acquisition program | |
JP2010161722A (en) | Data processing apparatus and method, and program | |
WO2023040520A1 (en) | Method and apparatus for performing music matching of video, and computer device and storage medium | |
US20070044643A1 (en) | Method and Apparatus for Automating the Mixing of Multi-Track Digital Audio | |
CN106055659B (en) | Lyric data matching method and equipment thereof | |
JP4848874B2 (en) | Information processing apparatus, playback apparatus, communication method, playback method, and computer program | |
CN103562909A (en) | Methods and systems for identifying content in data stream by client device | |
KR101813704B1 (en) | Analyzing Device and Method for User's Voice Tone | |
KR100916310B1 (en) | System and Method for recommendation of music and moving video based on audio signal processing | |
JP2007012013A (en) | Video data management device and method, and program | |
JP6413828B2 (en) | Information processing method, information processing apparatus, and program | |
JP4873162B2 (en) | Video content playback device | |
JP2010086273A (en) | Apparatus, method, and program for searching for music | |
US8050927B2 (en) | Apparatus and method for outputting voice relating to the preferences of a user | |
JP2009147775A (en) | Program reproduction method, apparatus, program, and medium | |
JP2001075992A (en) | Method and system for sound retrieval and computer- readable recording medium | |
JP5338312B2 (en) | Automatic performance synchronization device, automatic performance keyboard instrument and program | |
JP5088119B2 (en) | DATA GENERATION DEVICE, DATA GENERATION PROGRAM, AND INFORMATION PROCESSING DEVICE | |
JP2005148801A (en) | Relevant information providing method and device, relevant information providing program and recording medium with its program | |
US20240325907A1 (en) | Method For Generating A Sound Effect |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170915 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180320 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6413828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |