[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110890102A - 一种基于rnn声纹识别的发动机缺陷检测算法 - Google Patents

一种基于rnn声纹识别的发动机缺陷检测算法 Download PDF

Info

Publication number
CN110890102A
CN110890102A CN201910844907.9A CN201910844907A CN110890102A CN 110890102 A CN110890102 A CN 110890102A CN 201910844907 A CN201910844907 A CN 201910844907A CN 110890102 A CN110890102 A CN 110890102A
Authority
CN
China
Prior art keywords
segments
detection algorithm
rnn
engine
defect detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910844907.9A
Other languages
English (en)
Inventor
张发恩
王忠强
唐永亮
黄家水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Qizhi (chongqing) Technology Co Ltd
Original Assignee
Innovation Qizhi (chongqing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Qizhi (chongqing) Technology Co Ltd filed Critical Innovation Qizhi (chongqing) Technology Co Ltd
Priority to CN201910844907.9A priority Critical patent/CN110890102A/zh
Publication of CN110890102A publication Critical patent/CN110890102A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了智能质检领域的一种基于RNN声纹识别的发动机缺陷检测算法,包括以下具体步骤:S1:对所有录制的音频进行分割,从中提取出发电机加油高速运转时的关键片段;S2:对提取出的关键片段进行标注,以构建训练集;S3:搭建深度学习网络模型并进行训练;S4:使用训练好的网络模型对未知发电机的声音进行检测,结合发动机声音关键片段提取算法极大地减小了需要处理的数据量,提高了整个方法的准确度;深度学习的异常声音检测算法通过大量已知标签的样本即可自动学习出正常及各类异常声音的特点,而无需人工对声音的特点进行分析,可以处理变长序列输入的循环神经网络模型避免了传统使用卷积神经网络对音频进行处理的问题。

Description

一种基于RNN声纹识别的发动机缺陷检测算法
技术领域
本发明涉及智能质检技术领域,具体为一种基于RNN声纹识别的发动机缺陷检测算法。
背景技术
目前,基于深度神经网络的算法在智能质检领域得到越来越多的应用。但是,现有算法大多是对零件的外观进行检测,其处理对象为图像,使用的网络结构为卷积神经网络。然而,对于无法从外观上识别缺陷的产品,如发动机等,则不能使用上述基于图像的方法。在实际生产过程中,工人可以通过识别发动机运转时的异常声音以进行缺陷检测,但是在计算机领域,通过音频检测产品缺陷的技术仍然为空白。
现有的大部分异常声音检测算法,都是通过人工识别出异常声音的特点,并总结出一套算法流程对未知声音进行判断。此类算法并不能自动学习出异常声音的特点,因此适用范围较小,且无法重复用于不同类型的声音检测。另外存在一种基于卷积神经网络的声音分类算法。它首先将每个音频规整为20帧长度相同的窗口;接着为每个窗口中提取出12维的梅尔倒谱系数及其一阶与二阶差分,共计36维的特征向量;之后将每个视频所有窗口的特征向量作为720*1或36*20的图像,分别使用一维与二维卷积神经网络对已知类别的声音进行训练;最后,对于未知类别的声音,使用训练完成的网络对其进行预测,即可得到该声音的类别。但是卷积神经网络对于音频来说并不完全适用,由于音频长度通常不固定,因此需要先对音频进行裁剪等预处理操作。
总的来说,现有技术存在以下缺点:
第一,现有算法使用的声音特征大多为梅尔倒谱系数,该特征根据人耳的感知特点对实际声音进行了处理,因此非常适用于处理语音,但是对于发动机等非语音类声音,该特征无法完全体现声音的特点;
第二,大多异常声音检测算法通常由人工找出异常声音的特点,并设计一系列固定步骤进行判断,而不是自动学习出异常声音的特点,因此这些算法不具有通用性,对于不同的实际问题需要设计不同的算法;
第三,一些算法采用卷积神经网络对音频进行处理,这样虽然可以自行学习出异常声音的特征并进行检测,但是卷积神经网络要求输入具有相同大小,而音频通常却无法达到这一要求;如果通过裁剪等方式对音频进行预处理,则可能丢失部分信息。
基于此,本发明设计了一种基于RNN声纹识别的发动机缺陷检测算法,以针对组装完成的发动机中某些故障无法通过视觉观测进行识别这一问题进行解决。
发明内容
本发明的目的在于提供一种基于RNN声纹识别的发动机缺陷检测算法,结合发动机声音关键片段提取算法、深度学习的异常声音检测算法和可以处理变长序列输入的循环神经网络模型,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于RNN声纹识别的发动机缺陷检测算法,包括以下具体步骤:
S1:对所有录制的音频进行分割,从中提取出发电机加油高速运转时的关键片段;
S2:对提取出的关键片段进行标注,以构建训练集;
S3:搭建深度学习网络模型并进行训练;
S4:使用训练好的网络模型对未知发电机的声音进行检测。
优选的,所述步骤S1的具体步骤如下:
S1.1:将录制的原始音频生成二维声谱图;
S1.2:通过观察声音的二维声谱图,从中找出高频部分,如果某一时间的高频声音含量低于阈值,则将其分割并去除;剩余片段就是含高频声音的片段,即发动机高速运转时的声音关键片段。
优选的,所述步骤S1.1的具体步骤为:通过获取录制的原始音频中的一维振幅信息,使用长度N=2048,滑动距离为512的窗口函数为
Figure BDA0002194914500000031
将其划分为若干帧;并对每个长度为2048的帧执行离散傅立叶变换:
Figure BDA0002194914500000032
为每帧计算出长度为2048维的特征向量,将所有帧的特征向量堆叠,得到大小为2048×n的二维声谱图,其中,n为帧的数。
优选的,所述步骤S1.2的具体步骤为:将2048维的频率特征向量的前800维作为低频信号,其余部分作为高频信号,则每一帧的高频信号能量为:
Figure BDA0002194914500000033
将高频能量高于阈值的连续帧组合,得到若干音频片段,去除其中持续时间较短的片段,剩余的片段被用于进行接下来的操作。
优选的,所述步骤S2中,标注方式采用逐一进行标注。
优选的,所述步骤S3中,深度学习网络模型采用长短期记忆网络LSTM,具体实现步骤如下:
S3.1:以长度不定、高度为2048的声谱图作为输入,寻找并学习出序列在时间上的关系;
S3.2:使用两层LSTM网络提取输入序列的特征,使用两个全连接层DENSE进行分类;
S3.3:输出该音频的分类,为一个长度为M+1的向量,其中M为异常的种类,该向量中的值位于0到1之间,分别表示了该段音频为正常或具有某种异常的概率,即是否存在异常以及异常类型。
优选的,所述步骤S4中,检测后若所有片段均识别为正常,则认为该发动机不存在缺陷;如果其中有片段识别为异常,则认为该发动机存在缺陷。
与现有技术相比,本发明的有益效果是:
1、采用发动机声音关键片段提取算法:利用发动机声音的特点,将高速运转时的关键片段分割出来,不仅极大地减小了需要处理的数据量,同时避免了大量无用片段的干扰,提高了整个方法的准确度;
2、采用基于深度学习的异常声音检测算法:采用了深度学习算法,通过大量已知标签的样本即可自动学习出正常及各类异常声音的特点,而无需人工对声音的特点进行分析,同时,本方法可以方便地用于处理其它类似问题,而无需进行大量修改;
3、采用可以处理变长序列输入的循环神经网络模型:使用了可以接受变长序列作为输入的循环神经网络作为输入层,并在此基础上构建了一个深度神经网络模型,从而成功地避免了传统使用卷积神经网络对音频进行处理,需要所有的输入具有相同的规模,但是音频的长度通常不固定的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明原理框图;
图2为本发明关键片段提取算法原理图;
图3为本发明循环神经网络结构图;
图4为本发明实施例检测算法原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:一种基于RNN声纹识别的发动机缺陷检测算法,包括以下具体步骤:
S1:对所有录制的音频进行分割,从中提取出发电机加油高速运转时的关键片段;
具体步骤如下:
S1.1:将录制的原始音频生成二维声谱图,通过获取录制的原始音频中的一维振幅信息,使用长度N=2048,滑动距离为512的窗口函数为
Figure BDA0002194914500000051
将其划分为若干帧;并对每个长度为2048的帧执行离散傅立叶变换:
Figure BDA0002194914500000052
为每帧计算出长度为2048维的特征向量,将所有帧的特征向量堆叠,得到大小为2048×n的二维声谱图,其中,n为帧的数;
S1.2:通过观察声音的二维声谱图,从中找出高频部分,如果某一时间的高频声音含量低于阈值,则将其分割并去除;剩余片段就是含高频声音的片段,即发动机高速运转时的声音关键片段,在图2的声谱图中,横轴为时间,纵轴为频率,对应点的值为该时间该频率的强度,
具体步骤为:将2048维的频率特征向量的前800维作为低频信号,其余部分作为高频信号,则每一帧的高频信号能量为:
Figure BDA0002194914500000053
将高频能量高于阈值0.05,的连续帧组合,得到若干音频片段,去除其中持续时间较短小于20帧的片段,剩余的片段被用于进行接下来的操作。
S2:对提取出的关键片段进行标注,标注方式采用逐一进行标注,在训练集中需要保证有足够数量的正常与异常声音片段。如果一个音频为正常,则其所有片段可以标注为正常;但是如果一个音频为异常,并不是其中所有片段都为异常,因此需要逐一进行标注,以构建训练集;
S3:搭建深度学习网络模型并进行训练,采用深度学习网络模型采用长短期记忆网络LSTM,为循环神经网络RNN的一种,具体实现步骤如下:
S3.1:接受之前得到的以长度不定、高度为2048的声谱图作为输入,寻找并学习出序列在时间上的关系;
S3.2:使用两层LSTM网络提取输入序列的特征,使用两个全连接层DENSE进行分类;
S3.3:输出该音频的分类,输出该音频的分类,为一个长度为M+1的向量,其中M为异常的种类,该向量中的值位于0到1之间,分别表示了该段音频为正常或具有某种异常的概率,即是否存在异常以及异常类型;
S4:使用训练好的网络模型对未知发电机的声音进行检测,对于一段待检测的音频,同样需要先从中提取出关键片段,之后对这些片段使用训练好的模型进行异常检测,检测后若所有片段均识别为正常,则认为该发动机不存在缺陷;如果其中有片段识别为异常,则认为该发动机存在缺陷。
具体工作原理如下所述:
将所有音频首先通过关键片段提取算法提取出发动机高速运转时的片段;之后,在训练过程中,将训练样本送入神经网络,其估计结果与其真实标签共同用于对网络进行优化;在训练完成后,网络就可以用于预测一个音频是否存在异常,只需将片段输入训练好的网络即可得到预测标签。
1、发动机声音关键片段提取算法的优点
通常只有在发动机高速运转时才会出现明显的异常声音,因此一般仅对这些片段进行异常声音检测,而忽略其它片段。本算法利用发动机声音的特点,将高速运转时的关键片段分割出来,不仅极大地减小了需要处理的数据量,同时避免了大量无用片段的干扰,提高了整个方法的准确度。
2、基于深度学习的异常声音检测算法
在本方法中采用了深度学习算法,通过大量已知标签的样本即可自动学习出正常及各类异常声音的特点,而无需人工对声音的特点进行分析。同时,本方法可以方便地用于处理其它类似问题,而无需进行大量修改。
3、可以处理变长序列输入的循环神经网络模型
虽然使用卷积神经网络也可以对音频进行处理,但是它们需要所有的输入具有相同的规模,但是音频的长度通常不固定,因此使用卷积神经网络十分不便。在本方法中,使用了可以接受变长序列作为输入的循环神经网络作为输入层,并在此基础上构建了一个深度神经网络模型,从而成功地避免了上述问题。
实施例:
如图4中的一段发动机音频,通过关键片段提取步骤可以从中提取出11段关键片段;这些片段经过已经训练好的神经网络进行预测,其中有一个片段判断为正时啸叫异常,其它片段判断为正常;因此最终判断该发动机具有正时啸叫异常。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (7)

1.一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:包括以下具体步骤:
S1:对所有录制的音频进行分割,从中提取出发电机加油高速运转时的关键片段;
S2:对提取出的关键片段进行标注,以构建训练集;
S3:搭建深度学习网络模型并进行训练;
S4:使用训练好的网络模型对未知发电机的声音进行检测。
2.根据权利要求1所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S1的具体步骤如下:
S1.1:将录制的原始音频生成二维声谱图;
S1.2:通过观察声音的二维声谱图,从中找出高频部分,如果某一时间的高频声音含量低于阈值,则将其分割并去除;剩余片段就是含高频声音的片段,即发动机高速运转时的声音关键片段。
3.根据权利要求2所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S1.1的具体步骤为:通过获取录制的原始音频中的一维振幅信息,使用长度N=2048,滑动距离为512的窗口函数为
Figure FDA0002194914490000011
将其划分为若干帧;并对每个长度为2048的帧执行离散傅立叶变换:
Figure FDA0002194914490000012
为每帧计算出长度为2048维的特征向量,将所有帧的特征向量堆叠,得到大小为2048×n的二维声谱图,其中,n为帧的数。
4.根据权利要求3所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S1.2的具体步骤为:将2048维的频率特征向量的前800维作为低频信号,其余部分作为高频信号,则每一帧的高频信号能量为:
Figure FDA0002194914490000021
将高频能量高于阈值的连续帧组合,得到若干音频片段,去除其中持续时间较短的片段,剩余的片段被用于进行接下来的操作。
5.根据权利要求1所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S2中,标注方式采用逐一进行标注。
6.根据权利要求4所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S3中,深度学习网络模型采用长短期记忆网络LSTM,具体实现步骤如下:
S3.1:以长度不定、高度为2048的声谱图作为输入,寻找并学习出序列在时间上的关系;
S3.2:使用两层LSTM网络提取输入序列的特征,使用两个全连接层DENSE进行分类;
S3.3:输出该音频的分类,为一个长度为M+1的向量,其中M为异常的种类,该向量中的值位于0到1之间,分别表示了该段音频为正常或具有某种异常的概率,即是否存在异常以及异常类型。
7.根据权利要求6所述的一种基于RNN声纹识别的发动机缺陷检测算法,其特征在于:所述步骤S4中,检测后若所有片段均识别为正常,则认为该发动机不存在缺陷;如果其中有片段识别为异常,则认为该发动机存在缺陷。
CN201910844907.9A 2019-09-07 2019-09-07 一种基于rnn声纹识别的发动机缺陷检测算法 Pending CN110890102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910844907.9A CN110890102A (zh) 2019-09-07 2019-09-07 一种基于rnn声纹识别的发动机缺陷检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910844907.9A CN110890102A (zh) 2019-09-07 2019-09-07 一种基于rnn声纹识别的发动机缺陷检测算法

Publications (1)

Publication Number Publication Date
CN110890102A true CN110890102A (zh) 2020-03-17

Family

ID=69745924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910844907.9A Pending CN110890102A (zh) 2019-09-07 2019-09-07 一种基于rnn声纹识别的发动机缺陷检测算法

Country Status (1)

Country Link
CN (1) CN110890102A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640437A (zh) * 2020-05-25 2020-09-08 中国科学院空间应用工程与技术中心 一种基于深度学习的声纹识别方法及系统
CN112259078A (zh) * 2020-10-15 2021-01-22 上海依图网络科技有限公司 一种音频识别模型的训练和非正常音频识别的方法和装置
CN112509599A (zh) * 2020-10-21 2021-03-16 中国人民解放军陆军炮兵防空兵学院 一种基于bp神经网络和梅尔倒谱的声谱故障分析诊断方法
CN112836315A (zh) * 2021-02-24 2021-05-25 上海交通大学 一种基于神经网络的限位开关生产流水线异常监控方法
CN112992179A (zh) * 2021-02-05 2021-06-18 安徽绿舟科技有限公司 一种基于声纹信号检测燃机故障的识别方法
CN113571092A (zh) * 2021-07-14 2021-10-29 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN114088405A (zh) * 2021-11-10 2022-02-25 中国人民解放军陆军炮兵防空兵学院 一种基于声谱图的cnn故障诊断模型的发动机故障诊断方法
CN114112401A (zh) * 2021-11-10 2022-03-01 中国人民解放军陆军炮兵防空兵学院 一种基于声谱图的lstm故障诊断模型的发动机故障诊断方法
CN115083395A (zh) * 2022-08-23 2022-09-20 聊城大学 基于卷积神经网络与支持向量机的发动机声音检测系统
CN115134485A (zh) * 2021-03-10 2022-09-30 霍尼韦尔国际公司 具有适于特定环境以有助于识别特定环境中的异常事件的音频分析的视频监控系统
CN115602196A (zh) * 2022-12-12 2023-01-13 杭州兆华电子股份有限公司(Cn) 一种固定转速电机的异响声识别系统及方法
CN117116290A (zh) * 2023-08-03 2023-11-24 中科航迈数控软件(深圳)有限公司 基于多维特征的数控机床部件缺陷定位方法和相关设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140019390A1 (en) * 2012-07-13 2014-01-16 Umami, Co. Apparatus and method for audio fingerprinting
CN104167207A (zh) * 2014-06-20 2014-11-26 国家电网公司 一种基于变电站巡检机器人的设备声音识别方法
CN104819846A (zh) * 2015-04-10 2015-08-05 北京航空航天大学 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法
CN105275833A (zh) * 2015-10-30 2016-01-27 北京航空航天大学 一种基于CEEMD-STFT时频信息熵和multi-SVM的离心泵故障诊断方法
CN106873440A (zh) * 2015-12-14 2017-06-20 富士施乐株式会社 诊断设备、诊断系统、设备、和诊断方法
CN109087655A (zh) * 2018-07-30 2018-12-25 桂林电子科技大学 一种交通道路声音监测与异常声音识别系统
CN109192222A (zh) * 2018-07-23 2019-01-11 浙江大学 一种基于深度学习的声音异常检测系统
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
KR20190018798A (ko) * 2017-08-16 2019-02-26 강병수 차량 소음의 컨벌루션 뉴럴 네트워크에 의한 소음 분류 방법
CN109431507A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 基于深度学习的咳嗽疾病识别方法及装置
CN109616140A (zh) * 2018-12-12 2019-04-12 浩云科技股份有限公司 一种异常声音分析系统
CN109767785A (zh) * 2019-03-06 2019-05-17 河北工业大学 基于卷积神经网络的环境噪声识别分类方法
CN110189769A (zh) * 2019-05-23 2019-08-30 复钧智能科技(苏州)有限公司 基于多个卷积神经网络模型结合的异常声音检测方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140019390A1 (en) * 2012-07-13 2014-01-16 Umami, Co. Apparatus and method for audio fingerprinting
CN104167207A (zh) * 2014-06-20 2014-11-26 国家电网公司 一种基于变电站巡检机器人的设备声音识别方法
CN104819846A (zh) * 2015-04-10 2015-08-05 北京航空航天大学 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法
CN105275833A (zh) * 2015-10-30 2016-01-27 北京航空航天大学 一种基于CEEMD-STFT时频信息熵和multi-SVM的离心泵故障诊断方法
CN106873440A (zh) * 2015-12-14 2017-06-20 富士施乐株式会社 诊断设备、诊断系统、设备、和诊断方法
KR20190018798A (ko) * 2017-08-16 2019-02-26 강병수 차량 소음의 컨벌루션 뉴럴 네트워크에 의한 소음 분류 방법
CN109192222A (zh) * 2018-07-23 2019-01-11 浙江大学 一种基于深度学习的声音异常检测系统
CN109087655A (zh) * 2018-07-30 2018-12-25 桂林电子科技大学 一种交通道路声音监测与异常声音识别系统
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
CN109431507A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 基于深度学习的咳嗽疾病识别方法及装置
CN109616140A (zh) * 2018-12-12 2019-04-12 浩云科技股份有限公司 一种异常声音分析系统
CN109767785A (zh) * 2019-03-06 2019-05-17 河北工业大学 基于卷积神经网络的环境噪声识别分类方法
CN110189769A (zh) * 2019-05-23 2019-08-30 复钧智能科技(苏州)有限公司 基于多个卷积神经网络模型结合的异常声音检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨毫鸽: "《飞机发动机异常声音识别方法研究》", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640437A (zh) * 2020-05-25 2020-09-08 中国科学院空间应用工程与技术中心 一种基于深度学习的声纹识别方法及系统
CN112259078A (zh) * 2020-10-15 2021-01-22 上海依图网络科技有限公司 一种音频识别模型的训练和非正常音频识别的方法和装置
CN112509599A (zh) * 2020-10-21 2021-03-16 中国人民解放军陆军炮兵防空兵学院 一种基于bp神经网络和梅尔倒谱的声谱故障分析诊断方法
CN112992179A (zh) * 2021-02-05 2021-06-18 安徽绿舟科技有限公司 一种基于声纹信号检测燃机故障的识别方法
CN112836315A (zh) * 2021-02-24 2021-05-25 上海交通大学 一种基于神经网络的限位开关生产流水线异常监控方法
CN115134485A (zh) * 2021-03-10 2022-09-30 霍尼韦尔国际公司 具有适于特定环境以有助于识别特定环境中的异常事件的音频分析的视频监控系统
CN113571092A (zh) * 2021-07-14 2021-10-29 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN113571092B (zh) * 2021-07-14 2024-05-17 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN114088405A (zh) * 2021-11-10 2022-02-25 中国人民解放军陆军炮兵防空兵学院 一种基于声谱图的cnn故障诊断模型的发动机故障诊断方法
CN114112401A (zh) * 2021-11-10 2022-03-01 中国人民解放军陆军炮兵防空兵学院 一种基于声谱图的lstm故障诊断模型的发动机故障诊断方法
CN115083395A (zh) * 2022-08-23 2022-09-20 聊城大学 基于卷积神经网络与支持向量机的发动机声音检测系统
CN115602196A (zh) * 2022-12-12 2023-01-13 杭州兆华电子股份有限公司(Cn) 一种固定转速电机的异响声识别系统及方法
CN117116290A (zh) * 2023-08-03 2023-11-24 中科航迈数控软件(深圳)有限公司 基于多维特征的数控机床部件缺陷定位方法和相关设备
CN117116290B (zh) * 2023-08-03 2024-05-24 中科航迈数控软件(深圳)有限公司 基于多维特征的数控机床部件缺陷定位方法和相关设备

Similar Documents

Publication Publication Date Title
CN110890102A (zh) 一种基于rnn声纹识别的发动机缺陷检测算法
CN111784633B (zh) 一种面向电力巡检视频的绝缘子缺损自动检测算法
CN112381788B (zh) 一种基于双分支匹配网络的零部件表面缺陷增量检测方法
CN109615604B (zh) 基于图像重构卷积神经网络的零件外观瑕疵检测方法
US11435719B2 (en) System and method for identifying manufacturing defects
KR102132407B1 (ko) 점진적 딥러닝 학습을 이용한 적응적 영상 인식 기반 감성 추정 방법 및 장치
CN112329438B (zh) 基于域对抗训练的自动谎言检测方法及系统
CN112766218B (zh) 基于非对称联合教学网络的跨域行人重识别方法和装置
CN111901627B (zh) 视频处理方法、装置、存储介质及电子设备
CN110909131A (zh) 模型的生成方法、情绪识别方法、系统、设备和存储介质
CN114782410A (zh) 一种基于轻量化模型的绝缘子缺陷检测方法及其系统
CN114898466A (zh) 一种面向智慧工厂的视频动作识别方法及系统
CN114495983A (zh) 一种基于云边协同的设备故障声纹监测系统
CN117275518A (zh) 一种面向小样本数据的设备故障声纹检测方法
CN110618129A (zh) 一种电网线夹自动检测与缺陷识别方法及装置
KR102564570B1 (ko) 멀티모달 감성 분석 시스템 및 방법
CN112562727B (zh) 应用于音频监控的音频场景分类方法、装置以及设备
CN113450827A (zh) 基于压缩神经网络的设备异常工况声纹分析算法
Gurban et al. Multimodal speaker localization in a probabilistic framework
Jayanthi et al. Fruit quality inspection system using image processing
EP3847646B1 (en) An audio processing apparatus and method for audio scene classification
CN114596242A (zh) 缺陷检测方法、装置、电子设备及计算机可读存储介质
CN118294455A (zh) 钕铁硼电镀毛坯的智能检测系统及方法
CN112419304B (zh) 一种面向一维数据的多阶段目标检测方法及装置
CN112164024B (zh) 一种基于领域自适应的混凝土表面裂缝检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200317