CN111933176A - 一种批量定位语音内容的方法及装置 - Google Patents
一种批量定位语音内容的方法及装置 Download PDFInfo
- Publication number
- CN111933176A CN111933176A CN202010999495.9A CN202010999495A CN111933176A CN 111933176 A CN111933176 A CN 111933176A CN 202010999495 A CN202010999495 A CN 202010999495A CN 111933176 A CN111933176 A CN 111933176A
- Authority
- CN
- China
- Prior art keywords
- audio
- prompt tone
- file
- audio file
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000000737 periodic effect Effects 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/16—Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
一种批量定位语音内容的方法,包括如下步骤:S1.录音开始之前进行提示音播放将保存的音频文件的路径记录到路径记录文件中;S2.对路径记录文件内纪录的全部路径进行遍历读取;S3.对音频文件前部分时间的内容进行提示音检测定位S4.对已经检测出提示音并删除部分音频段的音频文件重新进行提示音检测,如果没有再次检测到提示音的音频文件,则对该文件保存;直至检测不出新的提示音;S5.处理完所有检测出的音频文件后结束。本发明还公开了一种批量定位语音内容的装置。本发明音可以通过精确定位提示音位置找出全部音频文件中的语音录制位置,提高了语音语料文件处理速度。
Description
技术领域
本发明属于语音智能识别技术领域,涉及语料识别技术,具体涉及一种批量定位语音内容的方法及装置。
背景技术
在现有的人工智能领域中,语音识别日渐成熟,绝大部分的人工智能开发都是基于语音识别及处理之上。但由于对语音识别的研究和开发,需要建立在大量的语料基础之上,然而在正常的录音过程并不是全程都是有效内容,存在着大量的冗余信息。语料量大,冗余信息繁杂成为了语音识别研究和开发上的挡路石。
目前现有技术对语料冗余处理的方法存在以下缺点:
1、不同频率、不同声道的语料需要分开处理;
2、语料处理需要配置成相同的路径模板,对于目录下存储格式不同的音频无法处理;
3、音频处理速度慢;
4、音频定位容易受底噪影响,导致定位不准确;
5、缺少重复性检测。
发明内容
为克服现有语料处理技术存在的缺陷,本发明公开了一种批量定位语音内容的方法及装置。
本发明所述批量定位语音内容的方法,包括如下步骤:
S1.录音开始之前进行提示音播放,提示音播放完成后再开始录制音频,录制并保存包括提示音的音频文件之后,将保存的音频文件的路径记录到路径记录文件中;
S2.对路径记录文件内纪录的全部路径进行遍历读取;对实际不存在的路径或该路径下找不到音频文件时则报错并记录在生成的错误日志中;
当遍历读取过程中,发现语料音频文件之后,对语料音频文件的特征进行读取处理为单声道音频文件;
S3.对音频文件前部分时间的内容进行提示音检测定位,所述前部分至少包括音频文件的前半部分,检测出提示音的文件,删除最后一个提示音之前的音频段;
若在音频文件的前部分内都没有检测到提示音,则认为该音频文件错误,将错误路径记录写入错误日志;
S4.再次筛选检测,具体包括:
S41.对已经检测出提示音并删除部分音频段的音频文件重新进行提示音检测,如果没有再次检测到提示音的音频文件,则对该文件保存;
S42.对检测到新的提示音的音频文件,进行重新定位并删除新提示音之前的音频段;
重复进行S41-S42,直至检测不出新的提示音;
S5.重复步骤S3-S4,处理完所有检测出的音频文件后结束。
优选的,所述提示音为周期性重复的音频信号。
优选的,对提示音的检测方式为:检测音频文件,发现与提示音音频幅值特征匹配的音频段时,记录该音频段起点;继续判断后续是否周期出现与提示音音频周期特征匹配的音频,周期次数相同则标记为提示音。
优选的,所述步骤S1-S5中的数据处理过程基于python算法编程实现。
优选的,所述步骤S2中处理为单声道音频文件的具体过程为:调用python库函数自动读取音频文件,获得当前音频文件的采样点数、采样频率、声道数;通过判断声道数为1还是2来确定当前音频是单声道音频还是双声道音频,对于双声道音频文件,分离其中一个声道的音频处理为单声道音频文件。
本发明还公开了一种批量定位语音内容的装置,包括依序连接的提示音播报模块、音频录制模块、路径记录模块、路径读取模块、音频文件遍历寻找模块和音频处理模块;所述音频处理模块包括依序连接的音频文件特征提取模块、单声道处理模块、提示音检测模块和音频段删除模块;所述音频文件特征提取模块与所述音频文件遍历寻找模块连接;
所述装置还包括与路径读取模块、音频文件遍历寻找模块和提示音检测模块连接的错误日志生成模块。
优选的,还包括与所述路径读取模块连接的窗口生成模块。
采用本发明所述批量定位语音内容的方法,与现有技术相比,具备如下优越性:
1.实现对不同格式下的音频做统一处理。系统可以自动识别当前wav音频的特征以及格式,对单双声道以及幅值大小做归一化处理,提高了适用性;
2.实现对不同文件目录下的音频处理。系统可以自己对给定的主目录进行遍历,对当前主目录的每一个角落进行wav文件的查找,当遍历到wav文件之后则送入处理模块,没有遍历到则自动跳过,解决了需要将目录进行统一的格式化处理的繁琐问题,提高了便利性;
3.对批量音频的处理相对缩短一半左右,系统可以对当前需要进行对齐处理的音频进行截选处理,仅对矩阵的前半部分进行判断,大幅度提高了运算速度;
本发明在底噪不大的情况下,提示音可以被精确定位,误差不超过0.05s;在提示音重复出现时,可以定位到最后出现的提示音的位置即语音开始正确录制的位置。
附图说明
图1为本发明对音频文件进行处理的一种具体实施方式示意图;
图2为本发明所述批量定位语音内容装置的一种具体实施方式示意图。
具体实施方式
下面对本发明的具体实施方式作进一步的详细说明。
本发明所述批量定位语音内容的方法,包括如下步骤:
S1.录音开始之前进行提示音播放,提示音播放完成后再开始录制音频,录制并保存包括提示音的音频文件之后,将保存的音频文件的路径记录到路径记录文件中;
S2.对路径记录文件内纪录的全部路径进行遍历读取;对实际不存在的路径或该路径下找不到音频文件时则报错并记录在生成的错误日志中;
当遍历读取过程中,发现语料音频文件之后,对语料音频文件的特征进行读取处理为单声道音频文件;
S3.对音频文件前部分时间的内容进行提示音检测定位,所述前部分至少包括音频文件的前半部分,检测出提示音的文件,删除最后一个提示音之前的音频段;
若在音频文件的前部分内都没有检测到提示音,则认为该音频文件错误,将错误路径记录写入错误日志;
S4. 再次筛选检测,具体包括:
S41.对已经检测出提示音并删除部分音频段的音频文件重新进行提示音检测,如果没有再次检测到提示音的音频文件,则对该文件保存;
S42.对检测到新的提示音的音频文件,进行重新定位并删除新提示音之前的音频段;
重复进行S41-S42,直至检测不出新的提示音;
S5.重复步骤S3-S4,处理完所有检测出的音频文件后结束。
录音开始之前进行提示音播放,提示音播放完成后再开始录制音频,录音得到的语料音频文件保存之后,将保存的音频文件夹的路径记录到路径记录文件中,语料音频文件通常为扩展名为WAV的文件,通常是将路径记录文件自身的路径复制到程序生成的窗口内以便读取该文件,从而读取音频文件,可以通过窗口生成模块实现复制路径功能。
程序开始对路径记录文件内的路径进行遍历读取,当某一路径不存在或该路径下找不到音频文件时则报错并记录在生成的错误日志中;
程序在读取到路径记录文件内的路径之后,会基于该路径对路径下的所有文件及文件夹进行遍历即寻找音频文件,通常是扩展名为wav的文件;当某一个路径不存在或者在某路径下找不到音频文件时会记录并生成一个日志文件,一般以log为后缀。
在遍历路径记录文件内所包含的全部路径时,系统自动区分每一路径下的文件和文件夹,对于文件夹,继续进入文件夹内寻找音频文件,路径下全部文件夹内均未发现音频文件则报错并生成错误日志记录该路径;
当遍历到发现扩展名为wav的语料音频文件之后,程序会自动对wav文件的特征进行读取,对单双声道的音频文件分别处理;
python的库函数中有自动读取音频功能的函数,可以直接获得当前音频的采样点数、采样频率、声道数等特征值,通过判断声道数为1还是2来确定当前音频是单声道音频还是双声道音频,并分别做不同的处理流程。双声道音频只用分离其中一个声道的音频做处理即可。
处理成单声道文件后,对音频文件前半部分时间的内容进行提示音检测定位,具体检测手段为:其根据是检测是否符合提示音的特征,例如发现某段音频信号幅值以及其周期均与提示音设置一致,对检测到的该段音频信号的时间起点记录位置,并通过判定提示音对应的幅值周期性出现的次数来确定是提示音还是其他声音。
若判定为提示音则返回时间起点的位置给主程序,然后加上提示音所固有的长度,获得新的点,对该新的点之前的所有内容进行删除。并对没有检测到提示音的音频文件进行记录报错;
提示音的波形是周期且规律的,且是特有的周期性,例如某一个音重复很多次,或者某一个音的波形幅值连续达到某一个值,因此选择该特性作为检测标志;音频在用程序读取之后是以点值的形式存在于内存当中,当检测到某一段音频符合提示音的特性之后,需要将该音频出现的第一个点记录下来;由于检测到的音频都是以幅值的形式存在,有可能出现幅值与提示音相同的点,但是提示音具有周期性的特点,可以通过判断幅值点周期性出现的次数是否与提示音本身的次数相同,如果相同则认为是提示音,如果不同则认为不是提示音。
若在音频的前半部分内都没有检测到提示音,则认为整条音频错误,将错误路径记录写入错误日志中。
随后对通过提示音检测的音频重新进行提示音检测,由于一开始就没有检测到提示音的音频已经被认为报错,所以该步骤内仅针对的是已经经过提示音处理的音频,
对提示音之前的音频段继续检测,如果没有再次检测到提示音的音频文件,则对该文件保存。对检测到新的提示音的音频进行重新定位,所谓定位,即步骤3所述,返回提示音时间起点的位置给主程序,然后加上提示音所固有的长度向后延伸,获得提示音终点,对该点之前的所有内容进行删除,以此流程处理完所有的wav音频后结束。
对检测到多次提示音的音频文件,通常是证明录音过程中出现了录制出错,或者中断,录音人重新开始了录音,由于录音时录音机是在每一个录音人录音过程中全程开启,所以会出现多次提示音的情况,则此时应该以最后一次提示音出现的位置为准,取最后一次提示音后的音频信息。
如图1所示,可以对音频文件的时间中点之前的音频段进行第一次提示音检测,检测出提示音后,将包括提示音在内的在前音频段删除;删除后的音频段继续进行第二次提示音检测,如果再检出提示音,则再次删除新的提示音之前的音频段,直至检测不出新的提示音,保存剩余的音频段。
本发明所述批量定位语音内容的方法可以基于这样一种批量定位语音内容的装置实现,基于python软件编程实现。如图2所示,包括依序连接的提示音播报模块、音频录制模块、路径读取模块、音频文件遍历寻找模块和音频处理模块;所述音频处理模块包括依序连接的音频文件特征提取模块、单声道处理模块、提示音检测模块和音频段删除模块;所述音频文件特征提取模块与所述音频文件遍历寻找模块连接;
所述装置还包括与路径读取模块、音频文件遍历寻找模块和提示音检测模块连接的错误日志生成模块。
通过错误日志生成模块生成的错误日志,用户可以方便的查找无效路径和无效音频文件,对录制过程进行及时纠错。
采用本发明所述批量定位语音内容的方法,与现有技术相比,具备如下优越性:
1.实现对不同格式下的音频做统一处理。系统可以自动识别当前wav音频的特征以及格式,对单双声道以及幅值大小做归一化处理,提高了适用性;
2.实现对不同文件目录下的音频处理。系统可以自己对给定的主目录进行遍历,对当前主目录的每一个角落进行wav文件的查找,当遍历到wav文件之后则送入处理模块,没有遍历到则自动跳过,解决了需要将目录进行统一的格式化处理的繁琐问题,提高了便利性;
3.对批量音频的处理相对缩短一半左右,系统可以对当前需要进行对齐处理的音频进行截选处理,仅对矩阵的前半部分进行判断,大幅度提高了运算速度;
本发明在底噪不大的情况下,提示音可以被精确定位,误差不超过0.05s;在提示音重复出现时,可以定位到最后出现的提示音的位置即语音开始正确录制的位置。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (7)
1.一种批量定位语音内容的方法,其特征在于,包括如下步骤:
S1.录音开始之前进行提示音播放,提示音播放完成后再开始录制音频,录制并保存包括提示音的音频文件之后,将保存的音频文件的路径记录到路径记录文件中;
S2.对路径记录文件内纪录的全部路径进行遍历读取;对实际不存在的路径或该路径下找不到音频文件时则报错并记录在生成的错误日志中;
当遍历读取过程中,发现语料音频文件之后,对语料音频文件的特征进行读取处理为单声道音频文件;
S3.对音频文件前部分时间的内容进行提示音检测定位,所述前部分至少包括音频文件的前半部分,检测出提示音的文件,删除最后一个提示音之前的音频段;
若在音频文件的前部分内都没有检测到提示音,则认为该音频文件错误,将错误路径记录写入错误日志;
S4. 再次筛选检测,具体包括:
S41.对已经检测出提示音并删除部分音频段的音频文件重新进行提示音检测,如果没有再次检测到提示音的音频文件,则对该文件保存;
S42.对检测到新的提示音的音频文件,进行重新定位并删除新提示音之前的音频段;
重复进行S41-S42,直至检测不出新的提示音;
S5.重复步骤S3-S4,处理完所有检测出的音频文件后结束。
2.如权利要求1所述批量定位语音内容的方法,其特征在于,所述提示音为周期性重复的音频信号。
3.如权利要求2所述的批量定位语音内容的方法,其特征在于,对提示音的检测方式为:检测音频文件,发现与提示音音频幅值特征匹配的音频段时,记录该音频段起点;继续判断后续是否周期出现与提示音音频周期特征匹配的音频,周期次数相同则标记为提示音。
4.如权利要求1所述的批量定位语音内容的方法,其特征在于,所述步骤S1-S5中的数据处理过程基于python算法编程实现。
5.如权利要求4所述的批量定位语音内容的方法,其特征在于,所述步骤S2中处理为单声道音频文件的具体过程为:调用python库函数自动读取音频文件,获得当前音频文件的采样点数、采样频率、声道数;通过判断声道数为1还是2来确定当前音频是单声道音频还是双声道音频,对于双声道音频文件,分离其中一个声道的音频处理为单声道音频文件。
6.一种批量定位语音内容的装置,其特征在于,包括依序连接的提示音播报模块、音频录制模块、路径记录模块、路径读取模块、音频文件遍历寻找模块和音频处理模块;所述音频处理模块包括依序连接的音频文件特征提取模块、单声道处理模块、提示音检测模块和音频段删除模块;所述音频文件特征提取模块与所述音频文件遍历寻找模块连接;
所述装置还包括与路径读取模块、音频文件遍历寻找模块和提示音检测模块连接的错误日志生成模块。
7.如权利要求6所述的批量定位语音内容的装置,其特征在于,还包括与所述路径读取模块连接的窗口生成模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010999495.9A CN111933176B (zh) | 2020-09-22 | 2020-09-22 | 一种批量定位语音内容的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010999495.9A CN111933176B (zh) | 2020-09-22 | 2020-09-22 | 一种批量定位语音内容的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111933176A true CN111933176A (zh) | 2020-11-13 |
CN111933176B CN111933176B (zh) | 2020-12-22 |
Family
ID=73334056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010999495.9A Active CN111933176B (zh) | 2020-09-22 | 2020-09-22 | 一种批量定位语音内容的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111933176B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071305A (zh) * | 2020-11-16 | 2020-12-11 | 成都启英泰伦科技有限公司 | 一种本地离线智能语音批量识别模组及方法 |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1522033A (zh) * | 2003-02-12 | 2004-08-18 | 厦门市恒信网元通信技术有限公司 | 采集任意电话号码的实时通信过程及状态数据的方法及装置 |
US20060051069A1 (en) * | 2004-09-02 | 2006-03-09 | Kenichi Iida | Recording and reproducing device and method and program thereof |
CN1949189A (zh) * | 2005-10-14 | 2007-04-18 | 上海乐金广电电子有限公司 | Mp3播放器的录音文件存储/播放方法 |
CN101127045A (zh) * | 2007-09-25 | 2008-02-20 | 中兴通讯股份有限公司 | 数据库可重复读实现方法、装置及数据库管理系统 |
CN101193380A (zh) * | 2006-11-29 | 2008-06-04 | 中兴通讯股份有限公司 | 一种基于手机的语音信箱系统 |
CN101964204A (zh) * | 2010-08-11 | 2011-02-02 | 方正科技集团苏州制造有限公司 | 一种录音和笔记对应的方法 |
CN102215286A (zh) * | 2011-04-06 | 2011-10-12 | 扬州大学 | 一种嵌入式多通道电话录音录时系统 |
KR20130083057A (ko) * | 2011-12-28 | 2013-07-22 | 현대엠엔소프트 주식회사 | 광고기대효과 측정을 위한 경로안내방법 및 장치와, 광고기대효과정보 제공방법 및 장치 |
US20140244582A1 (en) * | 2013-02-26 | 2014-08-28 | Jonathan Grier | Apparatus and Methods for Selective Location and Duplication of Relevant Data |
CN104090922A (zh) * | 2014-06-20 | 2014-10-08 | 北京奇虎科技有限公司 | 一种清理隐私数据的方法和装置 |
CN104202321A (zh) * | 2014-09-02 | 2014-12-10 | 上海天脉聚源文化传媒有限公司 | 一种声音录制的方法及装置 |
CN104732984A (zh) * | 2015-01-30 | 2015-06-24 | 北京云知声信息技术有限公司 | 一种快速检测单频提示音的方法及系统 |
US20150212787A1 (en) * | 2014-01-30 | 2015-07-30 | Yamaha Corporation | Recording device, recording method, and recording medium |
CN104902087A (zh) * | 2015-05-21 | 2015-09-09 | 深圳市万普拉斯科技有限公司 | 通话录音的处理方法及装置 |
CN106294646A (zh) * | 2016-08-02 | 2017-01-04 | 乐视控股(北京)有限公司 | 基于音频的数据处理方法和装置 |
CN106909542A (zh) * | 2015-12-22 | 2017-06-30 | 北京奇虎科技有限公司 | 在终端设备上进行信息擦除的方法及装置 |
CN107481743A (zh) * | 2017-08-07 | 2017-12-15 | 捷开通讯(深圳)有限公司 | 移动终端、存储器及录音文件的编辑方法 |
CN108154733A (zh) * | 2018-02-05 | 2018-06-12 | 无锡科技职业学院 | 外语口语测试装置及使用该装置的外语口语测试方法 |
CN109522272A (zh) * | 2018-11-14 | 2019-03-26 | 泰康保险集团股份有限公司 | 录音文件的存储方法、装置、系统、介质和电子设备 |
CN109788116A (zh) * | 2017-11-10 | 2019-05-21 | 塞舌尔商元鼎音讯股份有限公司 | 检测语音输入模式的方法 |
CN111382297A (zh) * | 2018-12-29 | 2020-07-07 | 杭州海康存储科技有限公司 | 一种用户侧用户数据的上报方法及装置 |
-
2020
- 2020-09-22 CN CN202010999495.9A patent/CN111933176B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1522033A (zh) * | 2003-02-12 | 2004-08-18 | 厦门市恒信网元通信技术有限公司 | 采集任意电话号码的实时通信过程及状态数据的方法及装置 |
US20060051069A1 (en) * | 2004-09-02 | 2006-03-09 | Kenichi Iida | Recording and reproducing device and method and program thereof |
CN1949189A (zh) * | 2005-10-14 | 2007-04-18 | 上海乐金广电电子有限公司 | Mp3播放器的录音文件存储/播放方法 |
CN101193380A (zh) * | 2006-11-29 | 2008-06-04 | 中兴通讯股份有限公司 | 一种基于手机的语音信箱系统 |
CN101127045A (zh) * | 2007-09-25 | 2008-02-20 | 中兴通讯股份有限公司 | 数据库可重复读实现方法、装置及数据库管理系统 |
CN101964204A (zh) * | 2010-08-11 | 2011-02-02 | 方正科技集团苏州制造有限公司 | 一种录音和笔记对应的方法 |
CN102215286A (zh) * | 2011-04-06 | 2011-10-12 | 扬州大学 | 一种嵌入式多通道电话录音录时系统 |
KR20130083057A (ko) * | 2011-12-28 | 2013-07-22 | 현대엠엔소프트 주식회사 | 광고기대효과 측정을 위한 경로안내방법 및 장치와, 광고기대효과정보 제공방법 및 장치 |
US20140244582A1 (en) * | 2013-02-26 | 2014-08-28 | Jonathan Grier | Apparatus and Methods for Selective Location and Duplication of Relevant Data |
US20150212787A1 (en) * | 2014-01-30 | 2015-07-30 | Yamaha Corporation | Recording device, recording method, and recording medium |
CN104090922A (zh) * | 2014-06-20 | 2014-10-08 | 北京奇虎科技有限公司 | 一种清理隐私数据的方法和装置 |
CN104202321A (zh) * | 2014-09-02 | 2014-12-10 | 上海天脉聚源文化传媒有限公司 | 一种声音录制的方法及装置 |
CN104732984A (zh) * | 2015-01-30 | 2015-06-24 | 北京云知声信息技术有限公司 | 一种快速检测单频提示音的方法及系统 |
CN104902087A (zh) * | 2015-05-21 | 2015-09-09 | 深圳市万普拉斯科技有限公司 | 通话录音的处理方法及装置 |
CN106909542A (zh) * | 2015-12-22 | 2017-06-30 | 北京奇虎科技有限公司 | 在终端设备上进行信息擦除的方法及装置 |
CN106294646A (zh) * | 2016-08-02 | 2017-01-04 | 乐视控股(北京)有限公司 | 基于音频的数据处理方法和装置 |
CN107481743A (zh) * | 2017-08-07 | 2017-12-15 | 捷开通讯(深圳)有限公司 | 移动终端、存储器及录音文件的编辑方法 |
CN109788116A (zh) * | 2017-11-10 | 2019-05-21 | 塞舌尔商元鼎音讯股份有限公司 | 检测语音输入模式的方法 |
CN108154733A (zh) * | 2018-02-05 | 2018-06-12 | 无锡科技职业学院 | 外语口语测试装置及使用该装置的外语口语测试方法 |
CN109522272A (zh) * | 2018-11-14 | 2019-03-26 | 泰康保险集团股份有限公司 | 录音文件的存储方法、装置、系统、介质和电子设备 |
CN111382297A (zh) * | 2018-12-29 | 2020-07-07 | 杭州海康存储科技有限公司 | 一种用户侧用户数据的上报方法及装置 |
Non-Patent Citations (2)
Title |
---|
YANG J, SIDHOM S, CHANDRASEKARAN G, ET AL.: "Detecting driver phone use leveraging car speakers", 《PROCEEDINGS OF THE 17TH ANNUAL INTERNATIONAL CONFERENCE ON MOBILE COMPUTING AND NETWORKING》 * |
杜海涛,张峰,高曼颖,胡入祯,杨光华: "基于话音识别的骚扰电话呼叫检测技术分", 《电信工程技术与标准化》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071305A (zh) * | 2020-11-16 | 2020-12-11 | 成都启英泰伦科技有限公司 | 一种本地离线智能语音批量识别模组及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111933176B (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3263392B2 (ja) | テキスト処理装置 | |
US20200151212A1 (en) | Music recommending method, device, terminal, and storage medium | |
US8213285B2 (en) | Recording apparatus | |
EP1821225A1 (en) | Musical piece extraction program, apparatus, and method | |
US8892565B2 (en) | Method and apparatus for accessing an audio file from a collection of audio files using tonal matching | |
CN111798833A (zh) | 一种语音测试方法、装置、设备和存储介质 | |
CN111933176B (zh) | 一种批量定位语音内容的方法及装置 | |
KR20080027165A (ko) | 데이터 기록 장치, 데이터 기록 방법 및 데이터 기록프로그램 | |
JP2009015119A (ja) | サビ位置検出装置 | |
CN107885845B (zh) | 音频分类方法及装置、计算机设备及存储介质 | |
CN110970027B (zh) | 一种语音识别方法、装置、计算机存储介质及系统 | |
US20100222905A1 (en) | Electronic apparatus with an interactive audio file recording function and method thereof | |
CN106971750B (zh) | 歌词文件和音调文件对齐方法及装置 | |
US20200349912A1 (en) | Interactive Music Audition Method, Apparatus and Terminal | |
KR20230133058A (ko) | 음악 저작물의 실연자를 구분하는 음악 식별 방법 및 음악 관리 서버 | |
CN108205550B (zh) | 音频指纹的生成方法及装置 | |
CN116994597B (zh) | 一种音频处理系统、方法及存储介质 | |
JP2010027115A (ja) | 音楽記録再生装置 | |
EP4344225A1 (en) | Audio/video processing method and apparatus, device, and storage medium | |
KR20040050574A (ko) | 디지털 오디오 파일의 하이라이트 정보 기록/재생 장치 및방법 | |
JP2009204872A (ja) | 音声認識用辞書生成システム | |
JP2786937B2 (ja) | デジタル信号記録媒体再生装置 | |
JP2002251825A (ja) | 記録媒体再生装置 | |
KR920004111B1 (ko) | 카 dat용 인트로플레이방식 | |
JP2621433B2 (ja) | テープレコーダの検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |