CN104599663B - 歌曲伴奏音频数据处理方法和装置 - Google Patents
歌曲伴奏音频数据处理方法和装置 Download PDFInfo
- Publication number
- CN104599663B CN104599663B CN201410856557.5A CN201410856557A CN104599663B CN 104599663 B CN104599663 B CN 104599663B CN 201410856557 A CN201410856557 A CN 201410856557A CN 104599663 B CN104599663 B CN 104599663B
- Authority
- CN
- China
- Prior art keywords
- rhythm
- point
- error
- candidate
- characteristic curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 230000033764 rhythmic process Effects 0.000 claims abstract description 439
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000004907 flux Effects 0.000 claims description 77
- 230000003595 spectral effect Effects 0.000 claims description 77
- 238000004364 calculation method Methods 0.000 claims description 30
- 238000005070 sampling Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 7
- QQODLKZGRKWIFG-UHFFFAOYSA-N cyfluthrin Chemical compound CC1(C)C(C=C(Cl)Cl)C1C(=O)OC(C#N)C1=CC=C(F)C(OC=2C=CC=CC=2)=C1 QQODLKZGRKWIFG-UHFFFAOYSA-N 0.000 claims description 6
- 238000009432 framing Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract 1
- 230000005236 sound signal Effects 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
本发明公开了一种歌曲伴奏音频数据处理方法和装置,属于音频处理技术领域。所述方法包括:读取歌曲伴奏音频数据;实时确定歌曲伴奏音频数据的节奏点;在确定的节奏点对应的时刻输出伴奏提示音。本发明通过读取歌曲伴奏音频数据,然后实时提取歌曲伴奏音频数据的节奏点,并在提取的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。
Description
技术领域
本发明涉及音频处理技术领域,特别涉及一种歌曲伴奏音频数据处理方法和装置。
背景技术
随着人们消费水平的不断提高,卡拉OK也越来越受人们的喜爱。但是对于一些节奏感不好的消费者,在演唱卡拉OK过程中,容易提前于歌曲节奏开始演唱或者跟不上歌曲的节奏,这样往往会降低人们对卡拉OK的消费兴趣。
现有的卡拉OK技术中,通过将歌曲的字幕随着音乐的节奏来变化其颜色,以提示演唱者,使其能保持演唱与歌曲节奏的同步而不跑调。
随音乐节奏变化颜色的字幕需要提前录制,且不同的歌曲需要重新录制字幕,既增加了卡拉OK的成本,又不利用大规模推广应用。同时,演唱者在唱卡拉OK的同时还需要分心关注字幕的颜色变化,更不利于演唱者的发挥了。
发明内容
为了解决现有卡拉OK节奏提示技术中,随音乐节奏变化颜色的字幕需要提前录制,且不同的歌曲需要重新录制,既增加了卡拉OK的成本,又不利用大规模推广应用的问题,本发明实施例提供了一种歌曲伴奏音频数据处理方法和装置。所述技术方案如下:
一方面,提供了一种歌曲伴奏音频数据处理方法,所述方法包括:
读取歌曲伴奏音频数据;
实时确定所述歌曲伴奏音频数据的节奏点;
在确定的所述节奏点对应的时刻输出伴奏提示音。
具体地,所述实时确定歌曲伴奏音频数据的节奏点,包括:
对所述歌曲伴奏音频数据进行分帧处理,得到多帧采样数据;
计算每帧所述采样数据的谱通量,得到谱通量特征曲线,所述谱通量特征曲线上的峰值点为节奏点候选点;
分别确定多个待选节奏的周期和初始相位;
采用所述多个待选节奏的周期和初始相位,分别确定各个所述待选节奏的当前待选节奏点;
对各个所述待选节奏的当前待选节奏点与所述节奏点候选点进行误差分析;
从各个所述待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为所述歌曲伴奏音频数据的节奏点。
进一步地,所述分别确定多个待选节奏的周期和初始相位,包括:
对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线;
从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,所述N为大于1的正整数;
将所述待选节奏的周期中最大的周期Pmax均分成M份,并选取j为所述待选节奏的初始相位,所述M为大于1的正整数,所述j为小于或等于M的正整数。
进一步地,所述从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,包括:
通过预设的门限对所述自相关特征曲线进行过滤,得到过滤后的自相关特征曲线,所述预设的门限如下:
其中,所述A(τ)为所述谱通量进行自相关计算的结果,所述δ为设定的比例因子,所述M为大于1的正整数;
从所述过滤后的自相关特征曲线上选取N个峰值点作为所述待选节奏的周期。
具体地,所述方法还包括:
比较各个所述待选节奏的当前待选节奏点与所述节奏点候选点;
当有待选节奏点与所述节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为所述误差超过设定范围的待选节奏点与所述节奏点候选点之间的误差;或者,
当有待选节奏点未超过所述设定范围时,按照以下公式修正误差未超过设定范围的待选节奏点所属的所述待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为所述误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为所述误差未超过设定范围的待选节奏点与所述节奏点候选点之间的误差。
进一步地,所述方法还包括:
当所述待选节奏满足以下条件中的任一种时,去除所述待选节奏:
所述待选节奏的误差最大,且多个所述待选节奏的总数超出设定总数;
所述待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;和
所述待选节奏与所述节奏点候选点的误差连续设定次数均超过所述设定范围。
具体地,所述计算每帧所述采样数据的谱通量,得到谱通量特征曲线,包括:
对所述谱通量的特征曲线进行低通滤波,得到滤波后的谱通量的特征曲线,则所述节奏点候选点为滤波后的谱通量特征曲线上的峰值点。
具体地,所述在提取的所述节奏点对应的时刻输出伴奏提示音,包括:
在提取的所述节奏点对应的时刻输出特定声音的伴奏提示音;
或者,在提取的所述节奏点对应的时刻输出大音量的伴奏。
另一方面,提供了一种歌曲伴奏音频数据处理装置,所述装置包括:
读取模块,用于读取歌曲伴奏音频数据;
确定模块,用于实时确定所述歌曲伴奏音频数据的节奏点;
输出模块,用于在确定的所述节奏点对应的时刻输出伴奏提示音。
具体地,所述确定模块包括:
处理单元,用于对所述歌曲伴奏音频数据进行分帧处理,得到多帧采样数据;
第一计算单元,用于计算每帧所述采样数据的谱通量,得到谱通量特征曲线,所述谱通量特征曲线上的峰值点为节奏点候选点;
第一确定单元,用于分别确定多个待选节奏的周期和初始相位;
第二确定单元,用于采用所述多个待选节奏的周期和初始相位,分别确定各个所述待选节奏的当前待选节奏点;
第二计算单元,用于对各个所述待选节奏的当前待选节奏点与所述节奏点候选点进行误差分析;
输出单元,用于从各个所述待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为所述歌曲伴奏音频数据的节奏点。
进一步地,所述第一确定单元包括:
计算子单元,用于对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线;
第一选取子单元,用于从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,所述N为大于1的正整数;
第二选取子单元,用于将所述待选节奏的周期中最大的周期Pmax均分成M份,并选取j为所述待选节奏的初始相位,所述M为大于1的正整数,所述j为小于或等于M的正整数。
进一步地,所述第一选取子单元,还用于通过预设的门限对所述自相关特征曲线进行过滤,得到过滤后的自相关特征曲线,所述预设的门限如下:
其中,所述A(τ)为所述谱通量进行自相关计算的结果,所述δ为设定的比例因子,所述M为大于1的正整数;
所述第一选取子单元,还用于从所述过滤后的自相关特征曲线上选取N个峰值点作为待选节奏的周期。
具体地,所述确定模块还包括:
比较单元,用于比较各个所述待选节奏的当前待选节奏点与所述节奏点候选点;
创建单元,用于当有待选节奏点与所述节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为所述误差超过设定范围的待选节奏点与所述节奏点候选点之间的误差;或者,
修正单元,用于当有待选节奏点未超过所述设定范围时,按照以下公式修正误差未超过设定范围的待选节奏点所属的所述待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为所述误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为所述误差未超过设定范围的待选节奏点与所述节奏点候选点之间的误差。
进一步地,所述确定模块还包括:
去除单元,用于当所述待选节奏满足以下条件中的任一种时,去除所述待选节奏:
所述待选节奏的误差最大,且多个所述待选节奏的总数超出设定总数;
所述待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;和
所述待选节奏与所述节奏点候选点的误差连续设定次数均超过所述设定范围。
具体地,所述第一计算单元,还用于对所述谱通量的特征曲线进行低通滤波,得到滤波后的谱通量的特征曲线,则所述节奏点候选点为滤波后的谱通量特征曲线上的峰值点。
具体地,所述输出模块,还用于在提取的所述节奏点对应的时刻输出特定声音的伴奏提示音;或者,
所述输出模块,还用于在提取的所述节奏点对应的时刻输出大音量的伴奏。
另一方面,提供了一种歌曲伴奏音频数据处理装置,所述装置包括:
处理器、存储器、总线和通信接口;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,当所述计算机运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述计算机执行上述所述的歌曲伴奏音频数据处理方法。
本发明实施例提供的技术方案带来的有益效果是:
通过读取歌曲伴奏音频数据,然后确定提取歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种歌曲伴奏音频数据处理方法流程图;
图2是本发明实施例二提供的一种歌曲伴奏音频数据处理方法流程图;
图3是本发明实施例二提供的一种误差分析原理示意图;
图4是本发明实施例三提供的一种歌曲伴奏音频数据处理装置结构示意图;
图5是本发明实施例四提供的一种歌曲伴奏音频数据处理装置结构示意图;
图6是本发明实施例五提供的一种歌曲伴奏音频数据处理装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
本发明实施例提供了一种歌曲伴奏音频数据处理方法,参见图1,该方法包括:
步骤S11,读取歌曲伴奏音频数据。
步骤S12,实时确定歌曲伴奏音频数据的节奏点。
步骤S13,在确定的节奏点对应的时刻输出伴奏提示音。
具体地,在节奏点对应的时刻,可以输出特定的节奏提示音,该提示音包括但不限于鼓声、钢琴、口哨以及响板等声音,此外,还可以选择直接将需要输出提示音的时刻的伴奏音量加大,突出该部分的伴奏,以达到提示的效果。
进一步地,生成的节奏提示音可以单独播放,或者和伴奏混后形成新的伴奏之后再播放或者作为卡拉OK应用的伴奏输入。
在本实施例中,通过确定的节奏点对应的时刻来输出伴奏提示音,可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验。
本发明实施例通过读取歌曲伴奏音频数据,然后确定提取歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。
实施例二
本发明实施例提供了一种歌曲伴奏音频数据处理方法,参见图2,该方法包括:
步骤S21,读取歌曲伴奏音频数据。
步骤S22,对歌曲伴奏音频数据进行分帧处理,得到多帧采样数据。
具体地,针对采样率为48kHz的歌曲,可以采用960个样点(20ms)帧长,480样点帧移。容易知道,该采样数据为时域信号。
以上采样参数仅为举例,可以根据实际情况重新选定,例如,针对采样率为44.1kHz的歌曲,可以采用1024样点(23.2ms)帧长,512点帧移。
步骤S23,计算每帧采样数据的谱通量,并得到谱通量特征曲线,该谱通量特征曲线上的峰值点为节奏点候选点。
具体地,计算每帧采样数据的谱通量,可以包括:
第一步,对多帧采样数据进行快速傅里叶变换,得到其频域信号X(n,k),其中,n表示第n帧采样数据,k表示的是第n帧采样数据的第k个频点。
第二步,对于每帧频域信号,计算其每个频点的能量|X(n,k)|;
具体地,由于频域信号X(n,k)为复数,可以通过求解复数的模的公式来计算每帧频域信号的每个频点的能量。
第三步,根据公式计算每帧采样数据的谱通量SF(n),其中,HWR(x)为半波整流函数,K1快速傅立叶变换的采样点数的一半再加一。
在本实施例中,针对采样率为48kHz的歌曲,其样点数为960个(为了进行快速傅氏变换,需要对样点进行补0,形成1024个样点),在对采样进行快速傅氏变换后,得到1024个频点,故K1的取值为513。
进一步地,在计算得到谱通量后,可以对形成的谱通量的特征曲线通过低通滤波对其进行滤波,得到滤波后的谱通量的特征曲线。在本实施例中,低通滤波可以过滤掉谱通量特征曲线中的高频成分,去掉特征曲线上面的“毛刺”,以减少对后续计算的干扰。
在本实施例中,每帧采样数据对应一个谱通量,每获取一帧采样数据时,都会相应的计算得到一个谱通量SF(n)。即步骤S23中所得的谱通量特征曲线实时更新,节奏点候选点也随之实时更新。
步骤S24,分别确定多个待选节奏的周期和初始相位。
在本实施例中,步骤S24可以通过如下方式实现:
第一步,对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线。
在本实施例中,自相关计算可以反映两变量之间的相似程度,两变量相似度越高,越有可能为歌曲伴奏的节奏点。通过对谱通量进行自相关计算,可以计算歌曲伴奏的节奏的周期。
具体地,可以采用公式进行自相关计算,其中,m的范围与设定时长相关。例如:当采样时长为1至5秒,以10ms为单位时,m的范围为100≤m≤500。
在本实施例中,可以选取过滤后的谱通量SF′(n)来代替上述公式中的SF(n)进行自相关计算,以获取更加准确的自相关特征曲线。
第二步,从自相关特征曲线上选取N个峰值点作为待选节奏的周期,N为大于1的正整数。
具体地,在选取峰值点时,选择峰值从大到小排名前N的峰值点。在本实施例中,选取的周期可以表示为Pi=arg maxi(A(τ)),i=1…N。
在本实施例中,自相关特征曲线还可以选取通过过滤后的谱通量SF′(n)计算得到的。
具体地,在选取待选节奏的周期之前,可以通过预设的门限对上述自相关特征曲线进行过滤,过滤掉特征曲线中较低的峰值点,得到过滤后的自相关特征曲线,其中,该预设门限如下:
其中,A(τ)为谱通量SF(n)进行自相关计算的结果,M为大于1的正整数,δ为比例因子(例如:δ为0.75)。
需要说明的是,A(τ)也可以为过滤后的谱通量SF′(n)进行自相关计算的结果。
第三步,将待选节奏的周期中最大的周期Pmax均分成M份,并选取j为待选节奏的初始相位,M为大于1的正整数,j为小于或等于M的正整数。
需要说明的是,将周期Pmax均分成M份中的M与上述预设的门限中的M为同一个M。
在本实施例中,通过j可以形成M个初始相位,例如:
步骤S25,采用多个待选节奏的周期和初始相位,分别确定各个待选节奏的当前待选节奏点。
具体地,节奏是一种有规律的突变,在确定节奏的初始相位和周期后,可以形成该节奏,并确定该节奏的当前待选节奏点。
在本实施例中,可以通过N个待选节奏的周期和M个待选节奏的初始相位,确定N*M个待选节奏的当前待选节奏点。
步骤S26,对各个待选节奏的当前待选节奏点与节奏点候选点进行误差分析。
需要说明的是,谱通量特征曲线上的峰值点反映的是歌曲伴奏音频数据的频域能量明显增加的位置,歌曲伴奏的节奏点往往就包含在这些峰值点中,本实施例中,通过将待选节奏的节奏点与与之最靠近的节奏点候选点进行误差分析,可以得到更加符合歌曲伴奏实际情况的节奏。
具体地,参见图3,在进行误差分析时,先将节奏点候选点(即谱通量的特征曲线上的峰值点)在时间轴上分布排列,该时间轴的单位为10ms,然后再将各个待选节奏的当前待选节奏点与其最靠近的节奏点候选点进行误差分析。具体的误差分析可通过如下公式进行:
其中,Pi为选择的节奏的周期,Pmax为待选节奏的周期中的最大的周期,Tin的范围为[-4,4],Tout的范围为[-0.4Pi,-4]∪[4,0.2Pi],的范围为[-0.4Pi,-4],error为选取的待选节奏的当前待选节奏点与其最接近的节奏点候选点(即谱通量SF(m)的特征曲线上的峰值点)之间的相位误差。
在本实施例中,Tout为检测外部窗口,Tin为检测内部窗口,故m∈Tin表示待测的待选节奏的当前待选节奏点落在了以谱通量特征曲线上的峰值点为零点的[-4,4]范围内,即落在检测内部窗口中;m∈Tout表示表示待测的待选节奏的当前待选节奏点落在了以谱通量特征曲线上峰值点为零点的[-0.4Pi,-4]∪[4,0.2Pi]范围内。
需要说明的是,人的耳朵可以区分0.1秒的声音,误差在70ms以内的节拍可以认为是准确的。Tin的范围为[-4,4],即80ms的范围,是考虑了人耳的实际情况而设定。
在本实施例中,上述公式中的SF(m)也可以采用SF′(m)代替。同时,节奏点候选点也可以选取低通滤波后的谱通量SF′(n)的特征曲线上的峰值点,使得误差分析的结果更加准确。
步骤S27,从各个待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为歌曲伴奏音频数据的节奏点。
在一种实现方式中,该步骤S27可以包括:
对各个待选节奏的待选节奏点与节奏点候选点的误差(例如采用步骤S26中的公式计算出的误差)进行累计,选择累计误差最小的待选节奏的当前待选节奏点作为歌曲伴奏音频数据的节奏点。
其中,累计误差可以累计从歌曲伴奏开始到当前待选节奏点之间的所有误差,也可以累计设定时间段内的误差。
需要说明的是,由于待选节奏的周期不同,周期小的待选节奏在相同时间内会产生更多次的误差分析结果,因此,在步骤S26中的公式中使用了Pmax对误差分析结果进行了归一化处理,可以消除不同待选节奏之间由于误差分析次数的不同而引起的累计误差不公平的问题。
在另一种实现方式中,该步骤S27可以包括:
分别确定各个待选节奏的当前待选节奏点与节奏点候选点的误差(例如采用步骤S26中的公式计算出的误差),选择误差最小的当前待选节奏点作为歌曲伴奏音频数据的节奏点。
需要说明的是,在上述步骤S22至步骤S27中,对歌曲伴奏音频数据进行分帧处理,得到多帧采样数据,然后计算每帧采样数据的谱通量,并得到谱通量特征曲线,这样能实时更新谱通量特征曲线上的峰值点,即实时更新节奏点候选点。在确定了N*M个待选节奏后,通过创建、修正以及去除等方式来实时更新待选节奏,并将这些待选节奏的当前待选节奏点与实时更新的节奏点候选点进行误差分析,这样能实时得到误差最小的待选节奏点,即能实时更新误差最小的待选节奏点。再通过选取实时更新的误差最小的待选节奏点作为该歌曲伴奏音频数据的节奏点,可以实现实时确定歌曲伴奏音频数据的节奏点。
在本实施例中,由于有些歌曲的节奏可能会出现较大变化,所以在确定出N*M个待选节奏的当前待选节奏点后,本实施例的方法还可以包括:
比较各个待选节奏的当前待选节奏点与节奏点候选点;
当有待选节奏点与节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为误差超过设定范围的待选节奏点与节奏点候选点之间的误差。
参见图3,在比较待选节奏点与节奏点候选点时,先将节奏点候选点按时间轴均匀分布,该时间轴的单位为10ms,然后再将待比较的待选节奏的节奏点与其接近的节奏点候选点进行对比。其中,Tout为检测外部窗口,Tin为检测内部窗口。
具体地,该设定范围可以为Tin(检测内部窗口)。即当有待选节奏的节奏点落在了节奏点候选点为零点的[-4,4]范围外时,创建新的待选节奏。
此外,本实施例的方法还可以包括:
当有待选节奏点未超过设定范围时,按照以下公式修正待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为该误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为该误差未超过设定范围的待选节奏点与节奏点候选点之间的误差。
此外,该方法还可以包括:
当有待选节奏满足以下条件中的任一种时,去除该待选节奏:
条件1,该待选节奏的误差最大,且多个待选节奏的总数超出设定总数(例如30个);
条件2,该待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;
条件3,该待选节奏与节奏点候选点的误差连续设定数次(例如8次)均超过设定范围。
具体地,该设定范围可以为图3中的Tin(检测内部窗口)。
在本实施例中,当有待选节奏满足上述条件中的任一种时,表明该待选节奏已与歌曲的伴奏节奏产生严重的偏差,不适合在作为待选节奏,故需要去除。同时,去除不适用的待选节奏,可以减少运算负担,加快选取合适的待选节奏的速度。
需要说明的是,通过上述方式,实时创建新的待选节奏、修正待选节奏、以及去除不适用的待选节奏,可以有效地更新待选节奏,保障了待选节奏的准确性。此外,还可以通过上述确定待选节奏的周期和初始相位的方法,来实时生成待选节奏,以更新待选节奏。
在具体实现中,可以采用代理Agent来管理待选节奏(包括待选节奏的节奏点、节奏点的准确性评分等),其中,每个Agent对应一个待选节奏。在本实施例中,对待选节奏的节奏点的准确性的评分,可以通过上述误差分析公式来进行。
参见图3,当当前待选节奏点落在检测内部窗口时,表示该待选节奏点是准确的,因此其误差分析的结果为一个正数的分值,该待选节奏的节奏点的准确性评分高;当当前待选节奏点落在检测外部窗口时,表示该待选节奏点不准确,误差分析的结果是一个负数的分值,该待选节奏的节奏点的准确性评分低。
步骤S28,在提取的节奏点对应的时刻输出伴奏提示音。
具体地,在节奏点对应的时刻,可以输出特定的节奏提示音,该提示音包括但不限于鼓声、钢琴、口哨以及响板等声音,此外,还可以选择不输出特定的节奏提示音,而是直接将需要输出提示音的时刻的伴奏音量加大,突出该部分的伴奏,以达到提示的效果。
进一步地,生成的节奏提示音可以单独播放,或者和伴奏混后形成新的伴奏之后再播放或者作为卡拉OK应用的伴奏输入。
在本实施例中,通过确定的节奏点对应的时刻来输出伴奏提示音,可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验。
本发明实施例通过读取歌曲伴奏音频数据,然后实时确定歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。其中,在确定多个待选节奏后,可以通过比较各个待选节奏的当前待选节奏点与节奏点候选点,并根据比较的结果创建新的待选节奏、修正待选节奏以及去除待选节奏,来有效管理并实时更新待选节奏,这样既可以保障待选节奏持续有效,使得实时输出的节奏点准确性高,又可以加快确定节奏点的速度。
实施例三
本发明实施例提供了一种歌曲伴奏音频数据处理装置,参见图4,该装置包括:读取模块301、确定模块302以及输出模块303。
读取模块301,用于读取歌曲伴奏音频数据。
确定模块302,用于实时确定歌曲伴奏音频数据的节奏点。
输出模块303,用于在确定的节奏点对应的时刻输出伴奏提示音。
具体地,在节奏点对应的时刻,可以通过输出模块303输出特定的节奏提示音,该提示音包括但不限于鼓声、钢琴、口哨以及响板等声音,此外,还可以选择直接将需要输出提示音的时刻的伴奏音量加大,突出该部分的伴奏,已达到提示的效果。
进一步地,生成的节奏提示音可以单独播放,或者和伴奏混后形成新的伴奏之后再播放或者作为卡拉OK应用的伴奏输入。
在本实施例中,通过提取的节奏点对应的时刻来输出伴奏提示音,可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验。
本发明实施例通过读取歌曲伴奏音频数据,然后确定提取歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。
实施例四
本发明实施例提供了一种歌曲伴奏音频数据处理方法装置,参见图5,该装置包括:读取模块401、确定模块402以及输出模块403。
读取模块401,用于读取歌曲伴奏音频数据。
确定模块402,用于实时确定歌曲伴奏音频数据的节奏点。
输出模块403,用于在确定的节奏点对应的时刻输出伴奏提示音。
具体地,在节奏点对应的时刻,可以输出特定的节奏提示音,该提示音包括但不限于鼓声、钢琴、口哨以及响板等声音,此外,还可以选择直接将需要输出提示音的时刻的伴奏音量加大,突出该部分的伴奏,以达到提示的效果。
进一步地,生成的节奏提示音可以单独播放,或者和伴奏混后形成新的伴奏之后再播放或者作为卡拉OK应用的伴奏输入。
在本实施例中,通过确定的节奏点对应的时刻来输出伴奏提示音,可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验。
具体地,确定模块402包括:处理单元4012、第一计算单元4022、第一确定单元4032、第二确定单元4042、第二计算单元4052、以及输出单元4062。
处理单元4012,用于对歌曲伴奏音频数据进行分帧处理,得到多帧采样数据。
具体地,针对采样率为48kHz的歌曲,可以采用960个样点(20ms)帧长,480样点帧移。容易知道,该采样数据为时域信号。
以上采样参数仅为举例,可以根据实际情况重新选定,例如,针对采样率为44.1kHz的歌曲,可以采用1024样点(23.2ms)帧长,512点帧移。
第一计算单元4022,用于计算每帧采样数据的谱通量,并得到谱通量特征曲线,该谱通量特征曲线上的峰值点为节奏点候选点。
在本实施例中,具体的计算谱通量的方法前文已作说明,这里不在赘述。
第一计算单元4022,还用于对谱通量的特征曲线进行低通滤波,得到滤波后的谱通量的特征曲线,则节奏点候选点为滤波后的谱通量特征曲线上的峰值点。
在本实施例中,低通滤波可以过滤掉谱通量特征曲线中的高频成分,去掉特征曲线上面的“毛刺”,以减少对后续计算的干扰。
第一确定单元4032,用于分别确定多个待选节奏的周期和初始相位。
具体地,第一确定单元4032包括:计算子单元4321、第一选取子单元4322以及第二选取子单元4323。
计算子单元4321,用于对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线。
在本实施例中,自相关计算可以反映两变量之间的相似程度,两变量相似度越高,越有可能为歌曲伴奏的节奏点。通过对谱通量进行自相关计算,可以计算歌曲伴奏的节奏的周期。
具体地,可以采用公式进行自相关计算,其中,m的范围与设定时长相关。例如:当采样时长为1至5秒,以10ms为单位时,m的范围为100≤m≤500。
在本实施例中,可以选取过滤后的谱通量SF′(n)来代替上述公式中的SF(n)进行自相关计算,以获取更加准确的自相关特征曲线。
第一选取子单元4322,用于从自相关特征曲线上选取N个峰值点作为待选节奏的周期,N为大于1的正整数。
具体地,在选取峰值点时,选择峰值从大到小排名前N的峰值点。在本实施例中,选取的周期可以表示为Pi=arg maxi(A(τ)),i=1…N。
在本实施例中,自相关特征曲线还可以选取通过过滤后的谱通量SF′(n)计算得到的。
进一步地,第一选取子单元4322,还用于通过预设的门限对自相关特征曲线进行过滤,得到过滤后的自相关特征曲线,该预设的门限如下:
其中,A(τ)为谱通量进行自相关计算的结果,δ为设定的比例因子,M为大于1的正整数。
进一步地,第一选取子单元4322,还用于从过滤后的自相关特征曲线上选取N个峰值点作为待选节奏的周期。
第二选取子单元4323,用于将待选节奏的周期中最大的周期Pmax均分成M份,并选取j为待选节奏的初始相位,M为大于1的正整数,j为小于或等于M的正整数。
需要说明的是,将周期Pmax均分成M份中的M与上述预设的门限中的M为同一个M。
在本实施例中,通过j可以形成M个初始相位,例如:
第二确定单元4042,用于采用多个待选节奏的周期和初始相位,分别确定各个待选节奏的当前待选节奏点。
具体地,节奏是一种有规律的突变,在确定节奏的初始相位和周期后,可以形成该节奏,并确定该节奏中所包含的所有节奏点。
在本实施例中,可以通过N个待选节奏的周期和M个待选节奏的初始相位,确定N*M个待选节奏的当前待选节奏点。
第二计算单元4052,用于对各个待选节奏的当前待选节奏点与节奏点候选点进行误差分析。
需要说明的是,谱通量特征曲线上的峰值点反映的是歌曲伴奏音频数据的频域能量明显增加的位置,歌曲伴奏的节奏点往往就包含在这些峰值点中,本实施例中,通过将待选节奏与节奏点候选点进行误差分析,可以得到更加符合歌曲伴奏实际情况的节奏。
具体的误差分析方法前文已作说明,这里不在赘述。
输出单元4062,用于从各个待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为歌曲伴奏音频数据的节奏点。
进一步地,确定模块402,还包括:比较单元4072、创建单元4082、修正单元4092、以及去除单元4102。
比较单元4072,用于比较各个待选节奏的当前待选节奏点与节奏点候选点。
创建单元4082,用于当有待选节奏点与节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为误差超过设定范围的待选节奏点与节奏点候选点之间的误差。
修正单元4092,用于当有待选节奏点未超过设定范围时,按照以下公式修正待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为该误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为该误差未超过设定范围的待选节奏点与节奏点候选点之间的误差。
其中,设定范围在前文已作说明,这里不在赘述。
去除单元4102,用于当有待选节奏满足以下条件中的任一种时,去除该待选节奏:
条件1,当该待选节奏的误差最大,且多个待选节奏的总数超出设定总数(例如30个);
条件2,当该待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;
条件3,当该待选节奏与节奏点候选点的误差连续设定数次(例如8次)均超过设定范围。
在本实施例中,当有待选节奏满足上述条件中的任一种时,表明该待选节奏已与歌曲的伴奏节奏产生严重的偏差,不适合在作为待选节奏,故需要去除。同时,去除不适用的待选节奏,可以减少运算负担,加快选取合适的待选节奏的速度。
具体地,输出模块403,还用于在提取的节奏点对应的时刻输出特定声音的伴奏提示音;或者,输出模块403,还用于在提取的节奏点对应的时刻输出大音量的伴奏。
本发明实施例通过读取歌曲伴奏音频数据,然后实时确定歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。其中,在确定多个待选节奏后,可以通过比较各个待选节奏的当前待选节奏点与节奏点候选点,并根据比较的结果创建新的待选节奏、修正待选节奏以及去除待选节奏,来有效管理并实时更新待选节奏,这样既可以保障待选节奏持续有效,使得实时输出的节奏点准确性高,又可以加快确定节奏点的速度。
实施例五
本发明实施例提供了一种歌曲伴奏音频数据处理装置,参见图6,该装置包括:
处理器501、存储器502、总线503和通信接口504;该存储器502用于存储计算机执行指令,处理器501与存储器502通过总线503连接,当计算机运行时,处理器执501行存储器502存储的计算机执行指令,以使计算机执行实施例1或实施例2所述的方法。
本发明实施例通过读取歌曲伴奏音频数据,然后实时确定歌曲伴奏音频数据的节奏点,并在确定的节奏点对应的时刻输出伴奏提示音,这样既可以增加歌曲的节奏感,让消费者能跟上歌曲节奏,提高卡拉OK的消费体验,又不用重新对歌曲进行重新录制,便于大规模应用。其中,在确定多个待选节奏后,可以通过比较各个待选节奏的当前待选节奏点与节奏点候选点,并根据比较的结果创建新的待选节奏、修正待选节奏以及去除待选节奏,来有效管理并实时更新待选节奏,这样既可以保障待选节奏持续有效,使得实时输出的节奏点准确性高,又可以加快确定节奏点的速度。此外,还可以设置Agent来辅助确定节奏点,这样既能加快确定节奏点的速度,又能提高输出的节奏点的准确性。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是:上述实施例提供的歌曲伴奏音频数据处理装置在实现歌曲伴奏音频数据处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的歌曲伴奏音频数据处理装置与歌曲伴奏音频数据处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种歌曲伴奏音频数据处理方法,其特征在于,所述方法包括:
读取歌曲伴奏音频数据;
实时确定所述歌曲伴奏音频数据的节奏点;
在确定的所述节奏点对应的时刻输出伴奏提示音;
其中,所述实时确定歌曲伴奏音频数据的节奏点,包括:
对所述歌曲伴奏音频数据进行分帧处理,得到多帧采样数据;
计算每帧所述采样数据的谱通量,得到谱通量特征曲线,所述谱通量特征曲线上的峰值点为节奏点候选点;
分别确定多个待选节奏的周期和初始相位;
采用所述多个待选节奏的周期和初始相位,分别确定各个所述待选节奏的当前待选节奏点;
对各个所述待选节奏的当前待选节奏点与所述节奏点候选点进行误差分析;
从各个所述待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为所述歌曲伴奏音频数据的节奏点;
其中,所述分别确定多个待选节奏的周期和初始相位,包括:
对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线;
从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,所述N为大于1的正整数;
将所述待选节奏的周期中最大的周期Pmax均分成M份,并选取为所述待选节奏的初始相位,所述M为大于1的正整数,所述j为小于或等于M的正整数。
2.根据权利要求1所述的方法,其特征在于,所述从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,包括:
通过预设的门限对所述自相关特征曲线进行过滤,得到过滤后的自相关特征曲线,所述预设的门限如下:
<mrow>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>&tau;</mi>
<mo>)</mo>
</mrow>
<mo>></mo>
<mi>&delta;</mi>
<mo>*</mo>
<mfrac>
<mrow>
<mi>r</mi>
<mi>m</mi>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mi>A</mi>
<mo>(</mo>
<mi>&tau;</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mi>M</mi>
</mfrac>
</mrow>
其中,所述A(τ)为所述谱通量进行自相关计算的结果,所述δ为设定的比例因子,所述M为大于1的正整数;
从所述过滤后的自相关特征曲线上选取N个峰值点作为所述待选节奏的周期。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
比较各个所述待选节奏的当前待选节奏点与所述节奏点候选点;
当有待选节奏点与所述节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为所述误差超过设定范围的待选节奏点与所述节奏点候选点之间的误差;或者,
当有待选节奏点未超过所述设定范围时,按照以下公式修正误差未超过设定范围的待选节奏点所属的所述待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为所述误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为所述误差未超过设定范围的待选节奏点与所述节奏点候选点之间的误差。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述待选节奏满足以下条件中的任一种时,去除所述待选节奏:
所述待选节奏的误差最大,且多个所述待选节奏的总数超出设定总数;
所述待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;和
所述待选节奏与所述节奏点候选点的误差连续设定次数均超过所述设定范围。
5.根据权利要求1所述的方法,其特征在于,所述计算每帧所述采样数据的谱通量,得到谱通量特征曲线,包括:
对所述谱通量的特征曲线进行低通滤波,得到滤波后的谱通量的特征曲线,则所述节奏点候选点为滤波后的谱通量特征曲线上的峰值点。
6.根据权利要求1所述的方法,其特征在于,所述在提取的所述节奏点对应的时刻输出伴奏提示音,包括:
在提取的所述节奏点对应的时刻输出特定声音的伴奏提示音;
或者,在提取的所述节奏点对应的时刻输出大音量的伴奏。
7.一种歌曲伴奏音频数据处理装置,其特征在于,所述装置包括:
读取模块,用于读取歌曲伴奏音频数据;
确定模块,用于实时确定所述歌曲伴奏音频数据的节奏点;
输出模块,用于在确定的所述节奏点对应的时刻输出伴奏提示音;其中,
所述确定模块包括:
处理单元,用于对所述歌曲伴奏音频数据进行分帧处理,得到多帧采样数据;
第一计算单元,用于计算每帧所述采样数据的谱通量,得到谱通量特征曲线,所述谱通量特征曲线上的峰值点为节奏点候选点;
第一确定单元,用于分别确定多个待选节奏的周期和初始相位;
第二确定单元,用于采用所述多个待选节奏的周期和初始相位,分别确定各个所述待选节奏的当前待选节奏点;
第二计算单元,用于对各个所述待选节奏的当前待选节奏点与所述节奏点候选点进行误差分析;
输出单元,用于从各个所述待选节奏的当前待选节奏点中,选择误差最小的当前待选节奏点作为所述歌曲伴奏音频数据的节奏点;
其中,所述第一确定单元包括:
计算子单元,用于对设定时长内的采样数据的谱通量进行自相关计算,得到自相关特征曲线;
第一选取子单元,用于从所述自相关特征曲线上选取N个峰值点作为所述待选节奏的周期,所述N为大于1的正整数;
第二选取子单元,用于将所述待选节奏的周期中最大的周期Pmax均分成M份,并选取为所述待选节奏的初始相位,所述M为大于1的正整数,所述j为小于或等于M的正整数。
8.根据权利要求7所述的装置,其特征在于,所述第一选取子单元,还用于通过预设的门限对所述自相关特征曲线进行过滤,得到过滤后的自相关特征曲线,所述预设的门限如下:
<mrow>
<mi>A</mi>
<mrow>
<mo>(</mo>
<mi>&tau;</mi>
<mo>)</mo>
</mrow>
<mo>></mo>
<mi>&delta;</mi>
<mo>*</mo>
<mfrac>
<mrow>
<mi>r</mi>
<mi>m</mi>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mi>A</mi>
<mo>(</mo>
<mi>&tau;</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mi>M</mi>
</mfrac>
</mrow>
其中,所述A(τ)为所述谱通量进行自相关计算的结果,所述δ为设定的比例因子,所述M为大于1的正整数;
所述第一选取子单元,还用于从所述过滤后的自相关特征曲线上选取N个峰值点作为待选节奏的周期。
9.根据权利要求7所述的装置,其特征在于,所述确定模块还包括:
比较单元,用于比较各个所述待选节奏的当前待选节奏点与所述节奏点候选点;
创建单元,用于当有待选节奏点与所述节奏点候选点的误差超过设定范围时,按照以下公式创建新的待选节奏,
待选节奏1:周期:Pi1=Pi,初始相位:φi1=φi+error+Pi1;
待选节奏2:周期:Pi2=Pi+error,初始相位:φi2=φi+error+Pi2;
待选节奏3:周期:初始相位:
其中,Pi和φi为误差超过设定范围的待选节奏点所属的待选节奏的周期和初始相位,error为所述误差超过设定范围的待选节奏点与所述节奏点候选点之间的误差;或者,
修正单元,用于当有待选节奏点未超过所述设定范围时,按照以下公式修正误差未超过设定范围的待选节奏点所属的所述待选节奏,
周期:相位:
其中,Pj和φj为误差未超过设定范围的待选节奏点所属的待选节奏修正前的周期和相位,Pj1和φj1为所述误差未超过设定范围的待选节奏点所属的待选节奏修正后的周期和相位,error为所述误差未超过设定范围的待选节奏点与所述节奏点候选点之间的误差。
10.根据权利要求9所述的装置,其特征在于,所述确定模块还包括:
去除单元,用于当所述待选节奏满足以下条件中的任一种时,去除所述待选节奏:
所述待选节奏的误差最大,且多个所述待选节奏的总数超出设定总数;
所述待选节奏的误差比误差最小的待选节奏的误差大,且所述待选节奏的误差与误差最小的待选节奏的误差的差值为设定值;和
所述待选节奏与所述节奏点候选点的误差连续设定次数均超过所述设定范围。
11.根据权利要求7所述的装置,其特征在于,所述第一计算单元,还用于对所述谱通量的特征曲线进行低通滤波,得到滤波后的谱通量的特征曲线,则所述节奏点候选点为滤波后的谱通量特征曲线上的峰值点。
12.根据权利要求7所述的装置,其特征在于,所述输出模块,还用于在提取的所述节奏点对应的时刻输出特定声音的伴奏提示音;或者,
所述输出模块,还用于在提取的所述节奏点对应的时刻输出大音量的伴奏。
13.一种歌曲伴奏音频数据处理装置,其特征在于,所述装置包括:
处理器、存储器、总线和通信接口;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,当所述计算机运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410856557.5A CN104599663B (zh) | 2014-12-31 | 2014-12-31 | 歌曲伴奏音频数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410856557.5A CN104599663B (zh) | 2014-12-31 | 2014-12-31 | 歌曲伴奏音频数据处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104599663A CN104599663A (zh) | 2015-05-06 |
CN104599663B true CN104599663B (zh) | 2018-05-04 |
Family
ID=53125397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410856557.5A Expired - Fee Related CN104599663B (zh) | 2014-12-31 | 2014-12-31 | 歌曲伴奏音频数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104599663B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106875930B (zh) * | 2017-02-09 | 2020-05-19 | 深圳市韵阳科技有限公司 | 基于歌曲伴音和话筒人声实时检测的灯光控制方法及系统 |
CN108281157B (zh) * | 2017-12-28 | 2021-11-12 | 广州市百果园信息技术有限公司 | 音乐中鼓点节拍的检测方法及计算机存储介质、终端 |
JP6939922B2 (ja) * | 2019-03-25 | 2021-09-22 | カシオ計算機株式会社 | 伴奏制御装置、伴奏制御方法、電子楽器及びプログラム |
CN110111813B (zh) * | 2019-04-29 | 2020-12-22 | 北京小唱科技有限公司 | 节奏检测的方法及装置 |
CN110688518B (zh) * | 2019-10-12 | 2024-05-24 | 广州酷狗计算机科技有限公司 | 节奏点的确定方法、装置、设备及存储介质 |
CN112259123B (zh) * | 2020-10-16 | 2024-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种鼓点检测方法、装置及电子设备 |
CN112489681B (zh) * | 2020-11-23 | 2024-08-16 | 瑞声新能源发展(常州)有限公司科教城分公司 | 节拍识别方法、装置及存储介质 |
CN112435687B (zh) * | 2020-11-25 | 2024-06-25 | 腾讯科技(深圳)有限公司 | 一种音频检测方法、装置、计算机设备和可读存储介质 |
CN113053339B (zh) * | 2021-03-10 | 2024-04-02 | 百果园技术(新加坡)有限公司 | 节奏调整方法、装置、设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123441A (zh) * | 1994-07-26 | 1996-05-29 | 三星电子株式会社 | 具有指示歌曲开始点功能的视频歌曲伴奏装置 |
CN1941071A (zh) * | 2005-07-27 | 2007-04-04 | 索尼株式会社 | 拍子提取及检测设备和方法、音乐同步显示设备和方法 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
CN102024453A (zh) * | 2009-09-09 | 2011-04-20 | 财团法人资讯工业策进会 | 歌声合成系统、方法以及装置 |
CN102479509A (zh) * | 2010-11-29 | 2012-05-30 | 财团法人资讯工业策进会 | 旋律辨识方法与其装置 |
CN103077706A (zh) * | 2013-01-24 | 2013-05-01 | 南京邮电大学 | 对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法 |
CN103258529A (zh) * | 2013-04-16 | 2013-08-21 | 初绍军 | 一种电子乐器、音乐演奏方法 |
CN103839538A (zh) * | 2012-11-22 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 音乐节奏检测方法及检测装置 |
CN104091600A (zh) * | 2014-03-21 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种歌声位置检测方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62271254A (ja) * | 1986-05-20 | 1987-11-25 | Sanyo Electric Co Ltd | 楽曲の再生装置 |
US7271329B2 (en) * | 2004-05-28 | 2007-09-18 | Electronic Learning Products, Inc. | Computer-aided learning system employing a pitch tracking line |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
-
2014
- 2014-12-31 CN CN201410856557.5A patent/CN104599663B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123441A (zh) * | 1994-07-26 | 1996-05-29 | 三星电子株式会社 | 具有指示歌曲开始点功能的视频歌曲伴奏装置 |
CN1941071A (zh) * | 2005-07-27 | 2007-04-04 | 索尼株式会社 | 拍子提取及检测设备和方法、音乐同步显示设备和方法 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
CN102024453A (zh) * | 2009-09-09 | 2011-04-20 | 财团法人资讯工业策进会 | 歌声合成系统、方法以及装置 |
CN102479509A (zh) * | 2010-11-29 | 2012-05-30 | 财团法人资讯工业策进会 | 旋律辨识方法与其装置 |
CN103839538A (zh) * | 2012-11-22 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 音乐节奏检测方法及检测装置 |
CN103077706A (zh) * | 2013-01-24 | 2013-05-01 | 南京邮电大学 | 对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法 |
CN103258529A (zh) * | 2013-04-16 | 2013-08-21 | 初绍军 | 一种电子乐器、音乐演奏方法 |
CN104091600A (zh) * | 2014-03-21 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种歌声位置检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
《基于节奏的鼓声识别》;尹琦卿;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131015(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104599663A (zh) | 2015-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104599663B (zh) | 歌曲伴奏音频数据处理方法和装置 | |
JP6784362B2 (ja) | 歌曲メロディ情報処理方法、サーバ、および記憶媒体 | |
CN104620313B (zh) | 音频信号分析 | |
EP2845188B1 (en) | Evaluation of downbeats from a musical audio signal | |
CN102903357A (zh) | 一种提取歌曲副歌的方法、装置和系统 | |
US9646592B2 (en) | Audio signal analysis | |
JP5008766B2 (ja) | テンポ検出装置及びテンポ検出プログラム | |
JP2007199306A (ja) | ビート抽出装置及びビート抽出方法 | |
CN109712600B (zh) | 一种节拍识别的方法及装置 | |
CN103854644A (zh) | 单声道多音音乐信号的自动转录方法及装置 | |
JP5641326B2 (ja) | コンテンツ再生装置および方法、並びにプログラム | |
WO2022105221A1 (zh) | 人声伴奏对齐方法及装置 | |
CN110516102B (zh) | 一种基于语谱图识别的歌词时间戳生成方法 | |
WO2013187986A1 (en) | Systems, methods, apparatus, and computer-readable media for pitch trajectory analysis | |
JP2005292207A (ja) | 音楽分析の方法 | |
WO2015093668A1 (ko) | 오디오 신호 처리 장치 및 방법 | |
JP6263383B2 (ja) | 音声信号処理装置、音声信号処理装置の制御方法、プログラム | |
CN103531220A (zh) | 歌词校正方法及装置 | |
JP2015125238A (ja) | 音声信号処理装置、音声信号処理装置の制御方法、プログラム | |
CN115472143B (zh) | 一种调性音乐音符起始点检测与音符解码方法及装置 | |
KR101361033B1 (ko) | 사운드 신호를 기반으로 한 반주제공방법 및 이를 이용한 반주제공장치 | |
JP3919359B2 (ja) | 楽音信号のアタック位置検出装置 | |
Maddage et al. | Semantic region detection in acoustic music signals | |
CN114677995A (zh) | 音频处理方法、装置、电子设备及存储介质 | |
KR20150084332A (ko) | 클라이언트 단말기의 음정인식기능 및 이를 이용한 음악컨텐츠제작 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180504 |
|
CF01 | Termination of patent right due to non-payment of annual fee |