KR102489502B1 - 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 - Google Patents
앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 Download PDFInfo
- Publication number
- KR102489502B1 KR102489502B1 KR1020210127549A KR20210127549A KR102489502B1 KR 102489502 B1 KR102489502 B1 KR 102489502B1 KR 1020210127549 A KR1020210127549 A KR 1020210127549A KR 20210127549 A KR20210127549 A KR 20210127549A KR 102489502 B1 KR102489502 B1 KR 102489502B1
- Authority
- KR
- South Korea
- Prior art keywords
- outlier
- outliers
- value
- data
- sensor
- Prior art date
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 35
- 238000012544 monitoring process Methods 0.000 title claims abstract description 18
- 238000013450 outlier detection Methods 0.000 title abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 45
- 238000012795 verification Methods 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 41
- 230000008859 change Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000002955 isolation Methods 0.000 claims description 8
- 230000001174 ascending effect Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 description 57
- 230000008901 benefit Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000551 statistical hypothesis test Methods 0.000 description 1
- 238000012066 statistical methodology Methods 0.000 description 1
- 238000010971 suitability test Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0221—Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/0227—Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
- G05B23/0235—Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions based on a comparison with predetermined threshold or range, e.g. "classical methods", carried out during normal operation; threshold adaptation or choice; when or how to compare with the threshold
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
본 발명은 건축물의 안전 모니터링을 위해 사용되는 진동, 균열, 기울기 센서 등의 운용에 있어 복수의 탐지 알고리즘을 순차적으로 적용하여 다양한 원인으로 발생하는 감지신호의 이상치를 효과적으로 탐지하고 오류에 대응하도록 하여 모니터링의 정밀도를 향상시킬 수 있는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템에 관한 것이다.
Description
본 발명은 센서 이상치 탐지시스템에 관한 것으로, 자세하게는 건축물의 안전 모니터링을 위해 사용되는 진동, 균열, 기울기 센서 등의 운용에 있어 복수의 탐지 알고리즘을 순차적으로 적용하여 다양한 원인으로 발생하는 감지신호의 이상치를 효과적으로 탐지하고 오류에 대응하도록 하여 모니터링의 정밀도를 향상시킬 수 있는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템에 관한 것이다.
각종 센서에서 발생하며 자료가 관찰될만한 범위 내에 있지 않거나 관찰될 가능성이 매우 희박한 자료, 또는 다른 자료들과는 관찰된 속성값이 이질적인 데이타로 정의되는 이상치(outlier)는 이상 값, 극단 값(extreme value), 특이 값(singular value) 등으로 불리며, 데이터를 모델화함에 있어 수립된 모델의 안정성에 예상치 못했던 영향을 줄 수 있거나, 수집된 자료에서 이상징후 혹은 독특한 특징점을 나타낼 수 있어, 트렌드 변화나 중요 이슈 발생을 감지하는 측면에서 매우 중요한 값이다.
건축물 안전 모니터링 시스템에서 사용하는 진동, 균열, 기울기 센서는 IoT센서 자료의 특성상 시계열 자료 형태로 입력되고, 기온의 영향을 받으며, 우천(雨天)의 영향, 내장 전원 배터리 소진, 건물 공사로 인한 센서 정전, 건물에 실제 급격한 균열이나 기울어짐의 이유로 수집된 자료에 이질적인 이상치로 간주 될 수 있는 요소가 많이 존재한다. 따라서 안전 모니터링 시스템을 위한 자료 모델링 이전의 전처리 단계와 자료의 시각화 부분에서 이상치 탐지와 적절한 조치가 필요한 상황이다.
또한, 이상치 탐지의 오류가 상대적으로 크게 문제되지 않는 다른 분야와 달리 건축물 안전의 특성상 안전 관련 자료에서 이상치의 정확한 탐지는 전체 시스템이 존재하는 가장 큰 이유가 되기 때문에 엄격한 이상치 탐지 모델이 필요한 상황이다.
이러한 이상치가 발생하는 원인은 다양하기 때문에 자료가 이상치인지를 알아내는 것은 여러 요소를 반영하여 연구자의 주관이나 전문성이 개입하는 경우가 많다. 즉 이상치가 발생할 수 있는 정상적인 범위를 벗어나는 비교적 단순한 이유로부터, 측정 오류, 통신 오류, 기록 오류, 일상적인 운영환경에서 벗어나는 다양한 이유에서 발생하는 값 등 여러 원인 때문에 이상치가 발생하기 때문에 이상치를 탐지해내는 것은 자료 수집의 맥락과 모델에 미칠 영향을 고려해서 수행되어야 한다.
건축물 모니터링에 사용되는 진동, 균열, 기울기를 측정하는 센서 또한 트렌트에서 벗어나 짧은 시간 동안 큰 분산(variance)을 가지는 경우(additive outlier), 또는 비교적 장기적인 기간 다른 트렌드를 보이다 다시 원래 대로 복귀하는 경우(transient change outlier), 크게 변화하고 그 변한 상태로 계속 유지되는 경우(level shift), 큰 변화가 되고 이것이 이후의 관측 값에도 계속 영향을 미치는 경우(innovational outlier) 등 다양한 형태로 이상치가 나타나게 된다.
그러나 이상치 탐지 기법은 원인이 다양한 만큼 사용하는 알고리즘이 방대하고 사용되는 기법의 논리적인 근거 또한 다양하여 결과도 제각각인 관계로 어떤 것이 좋거나 좋지 않다라는 명쾌한 결론을 내기 어렵다.
현재 구현중인 일반적 자료의 이상치 탐색은 단변량일 경우와 다변량일 경우로 나누어지고, 또 각 관측값이 정상값인지 이상치인지, 사전 정보를 가지고 이상치 탐지 모델을 구축하는지, 또한 자료들이 특정 확률분포 가정을 따른다고 볼 수 있는지에 따라 다양한 이상치 탐지 기법을 사용할 수 있다. 덧붙여서, 시계열 자료의 특성을 살려서 ARIMA 모델을 적합하면서 동시에 이상치를 탐지하는 방법, 비모수적인 분위수 회귀를 사용해서 이상치 탐색을 하는 방법 등이 존재한다.
이와 같은 이상치 탐지의 심각한 문제는 사실 방법론의 “풍요속의 빈곤”으로, 자료의 형태에 따라서 다양한 알고리즘이 존재하는데 결과적으로 탐지된 이상치가 정확한 이상치라고 확신을 가지고 뒷받침할 수 있는 탐지 데이터의 적합성에 대한 기준이 존재하지 않는다.
보통 통계적 방법론에 대개 GOF(goodness of fit) 검정 방법이 사용되어 실측값과 예측값의 차이를 기준으로 하는데 이상치 탐색에서는 특정 자료가 이상치인지를 미리 알고 있는 지도적 방법론(supervised method)이 아니라면 이런 방법을 사용하기 어렵다.
본 발명은 상기와 같은 문제를 해결하기 위하여 창출된 것으로, 본 발명의 목적은 다양한 센서를 활용하여 건축물의 안전을 모니터링함에 있어 다양한 원인으로 발생하는 감지신호의 이상치를 복수의 알고리즘을 순차적으로 적용하여 탐지하고 오류에 대응하여 정확한 탐지결과를 얻도록 하는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템을 제공하는 것이다.
상기와 같은 목적을 위해 본 발명은 건축물에 설치되어 안전을 모니터링하는 센서의 이상치를 탐지시스템에 있어서, 상기 센서로부터 얻어진 자료값을 오름차순으로 정렬하는 정렬부와, 정렬된 자료값을 설정된 비율로 분할하여 경계구간을 설정하는 구간설정부를 구비하고, 상기 경계구간을 벗어나는 자료값을 제1이상치로 정의하여 저장하는 제1검출모듈; 상기 센서로부터 얻어진 자료값을 정규분포화하고, 표준정규분포를 참고하여 설정된 신뢰수준에서 검정하여 제2이상치를 추출 및 저장하는 제2검출모듈; 상기 제1이상치 및 제2이상치 개수의 상한을 설정하고 검정통계량을 계산하는 검정통계부와, 상기 검정통계량과 비교할 임계값을 설정하는 임계값설정부를 구비하고, 상기 검정통계량이 설정된 임계값보다 클 경우 제3이상치로 정의하여 저장하는 제3검출모듈; isolation forest 알고리즘을 이용하여 이상치 점수를 계산하는 점수계산부와, 이상치의 비율을 설정하고 설정된 비율에 맞는 이상치 점수 자료값을 제4이상치로 정의하여 저장하는 제4검출모듈; 상기 제1이상치, 제2이상치, 제3이상치, 제4이상치를 바탕으로 원본 자료값 및 이상치 자료값을 제거한 데이터셋을 대상으로 엔트로피를 계산하는 엔트로피계산부와, 상기 엔트로피의 변동을 확률변동 관점으로 재해석하는 해석부를 구비하고, 설정된 값과 확률변동을 비교하여 이상치 추출의 양호를 판단하는 검증모듈; 로 이루어지는 것을 특징으로 한다.
이때 상기 센서는 진동, 균열, 기울기를 측정할 수 있는 센서가 될 수 있다.
또한, 상기 구간설정부는, 오름차순으로 정리된 자료값을 4 등분하여 백분위 75% 값과 25% 값과의 차에 1.5를 곱해서 백분위 75% 값에 더해준 것을 최대, 백분위 25% 값에서 빼준 것을 최소로 하는 경계 구간을 설정할 수 있다.
또한, 상기 제2검출모듈은, 95 내지 99% 신뢰수준에서 이상치 여부를 검정할 수 있다.
또한, 상기 검정통계부는, 상기 제1이상치 및 제2이상치의 최대값에 1을 더한 값으로 이상치 개수의 상한을 설정하고, 표본평균과 표본표준편차를 계산하며, 관측치와 표본평균의 편차의 최대치를 구하고 최대치에 해당하는 자료값을 표본에서 제거하고 다시 검정통계량을 계산하여 추정한 최대치의 이상치 개수까지 검정통계량을 계산할 수 있다.
이상치 탐지를 위한 다양한 기존의 방법에서는 사전에 이상치 개수를 추정해야 하거나 자료가 정규 분포를 따라야 한다는 가정, 자료가 중앙값에서 양쪽으로 균형이 잡혀 있어야 한다는 가정 등 여러 제한점이 있어 적용에 어려움이 있다. 또한, 다른 방법론 적용에 따라 결과도 서로 다르게 나와 이상치 탐지 결과가 어떤 방법론을 사용하느냐에 의존하게 된다. 또한, 이상치 탐지 결과가 얼마나 적절하게 되었는지를 객관적으로 설명하는 측정 도구 또한 존재하지 않기 때문에 탐지 결과에 따른 사후 조치도 어렵다.
본 발명은 이처럼 기존에 적용되던 다양한 방법들의 문제점들을 극복하고 정확한 이상치 탐지가 이루어질 수 있도록 여러 기법을 동시에 혼합해서 적용하는 앙상블 기법을 적용함에 따라 수집된 자료가 기법이 요구하는 가정들을 충족, 미충족에 따른 우려를 불식시키고, 방법론들을 순차적으로 적용해서 상호 필요한 가정들을 충족시키고 여러 방법론으로 추출된 이상치들에 대해 엔트로피 정보량을 바탕으로 적절한 이상치 검출이 되었는지를 확인해 볼 수 있기 때문에 안정적인 이상치 탐지를 기대할 수 있는 효과가 있다.
이와 같이 정보량 통계량을 사용하는 방법은 단변량 기법뿐만 아니고 다변량 이상치 탐색 결과에서 적용 가능하여 현재 수십 개의 다른 알고리즘들이 난립해있는 이상치 탐지 알고리즘들을 정보량의 변화라는 척도기준으로 이상치 탐지 결과를 상호 평가를 해볼 수 있는 기초를 제공할 수 있다.
도 1은 본 발명의 개념도,
도 2는 본 발명의 실시예에 따른 구성 및 연결관계를 나타낸 블록도,
도 3은 본 발명의 실시예에 따른 순서를 나타낸 순서도,
도 4 ~ 5는 본 발명의 실험예에 따른 이상치 탐지 예시를 나타낸 시트,
도 6 ~ 9는 본 발명의 실험예에 따른 센서 자료값에 대한 분석결과를 나타낸 시트이다.
도 2는 본 발명의 실시예에 따른 구성 및 연결관계를 나타낸 블록도,
도 3은 본 발명의 실시예에 따른 순서를 나타낸 순서도,
도 4 ~ 5는 본 발명의 실험예에 따른 이상치 탐지 예시를 나타낸 시트,
도 6 ~ 9는 본 발명의 실험예에 따른 센서 자료값에 대한 분석결과를 나타낸 시트이다.
이하, 첨부된 도면을 참조하여 본 발명 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템의 구성을 구체적으로 설명한다.
도 1은 본 발명의 개념도로서, 본 발명은 건축물에 설치되어 안전을 모니터링하는 센서의 이상치를 탐지하는 시스템으로, 상기 센서는 진동, 균열, 기울기를 측정할 수 있는 센서가 될 수 있으며 적용되는 이상치 탐지 알고리즘은 다음과 같은 4가지 알고리즘을 기반으로 한다. 이는 다른 기법을 추가해도 같은 스텝을 밟아서 이상치를 정리하면 되므로 특정방법론에 의존하지 않아도 이상치를 탐지할 수 있는 장점이 있다.
첫 번째로 IQR(Interquatile range)로서 자료들을 크기순으로 배열한 후 1사분위수(25%)와 3사분위수(75%) 사이 간격을 IQR이라고 한다. 이 IQR값에 1.5배 하고 중앙값을 더한 것이나 뺀 것보다 자료값이 더 크거나 작으면 이상치로 본다.
특별한 자료에 대한 분포 가정이 전혀 없고 결과 해석에 주관적인 요인이 들어가지 않지만, 불균형한 자료(중앙값을 중심으로 양쪽의 자료가 나타나는 빈도가 많이 다른 경우)는 이상치 탐색이 다른 방법과는 차이를 보이고 여전히 거리를 바탕으로 이상치 검출을 하기 때문에 두 가지 이질적인 자료의 무리가 섞여있는 경우(Mixed distribution)에 이상치 검출에 문제가 생긴다.
두 번째로 z-score, 표준화 점수라고도 불리는 알고리즘으로 자료가 평균값에서 표준편차를 고려해서 얼마나 멀리 떨어져 있는지를 자료가 정규분포(Normal probability distribution)를 따른다는 가정하에 나타내며 다음과 같이 표현된다.
z-score는 널리 쓰이는 알고리즘이나 자료가 정규분포를 따른다는 가정에 문제가 생기거나 자료에 극단치가 많이 섞이면 평균이 극단치에 민감하게 반응하기 때문에 문제가 생긴다. 여기에 95% 신뢰 계수를 사용할지 혹은 99% 신뢰계수를 사용할지도 사용자의 주관적인 판단 영역에 속한다. 다만, 정규분포 가정을 만족한다면 이상치 검출에 가장 민감한 반응을 보여주고 직관적이라는 장점이 있다.
세 번째로 Generalized ESD test로서 Grubb test와 같은 통계량을 사용하여 검정하지만 grubb 검정의 약점을 보완한 방법으로 이상치의 개수를 미리 결정해야 했던 약점을 완화해서 이상치의 개수 상한만 지정하면 된다.
이상치의 거리에 바탕을 두고 있지만 여러 점에 대한 이상치 판단의 1종 오류 확률이 수리적으로 수정 계산되어 나온다는 이론적 장점을 가지고 있다. ESD 검정은 이상치의 개수의 상한선만 제시하면 되고 여러 개의 이상치를 동시에 검출해내는데 장점을 가지고 있다. 그러나 여전히 정규성에 바탕을 두고 있고 거리 기반 이상치 탐지의 약점도 공유하고 있고 대용량 자료에서는 검정의 수치적 1종 오류 확률에 대한 시뮬레이션 결과가 불안정해진다는 단점이 존재한다.
참고로 Grubb test(Grubb 검정)은 자료값 중에서 가장 평균값과 거리가 먼 자료의 절대 편차를 가지고 자료가 정규분포에서 나왔다는 가정하에 outlier 인지를 검증한다.
이는 자료 중 편차가 가장 큰 1개에 대하여 검증을 수행하며, 이상치가 더 이상 감지되지 않을 때까지 검정을 되풀이하여 샘플 개수가 작아지면 사실 이상치가 아닌데도 이상치라고 결론을 내릴 확률이 높아지기 때문에 샘플 개수가 작아지면 검정을 멈추는 것이 필요하다.
다음 네 번째로 isolation forest로서, 이 기법은 랜덤하게 직선으로 자료값들을 둘로 나누는 직선들을 계속 생성해서 자료가 모두 직선으로 구분될 때까지 나눈 후에 비교적 빨리 다른 자료들과 구분이 지어진 데이터들을 이상치로 간주하는 기법이다.
여러 번 같은 알고리즘을 적용한 평균값을 점수화해서 판단하는 일종의 시뮬레이션 기법인 i-Forest 기법은 최근 기울기가 있는 직선으로 확장 버전이 나온 상황으로, 이 기법은 반복적인 시뮬레이션을 이용하는 방법론으로 다변량 자료와 지도적(supervised) 이상치 검출에 특화된 방법론이다.
비교적 이상치 검출 계산 시간이 빠르고 특별한 가정을 하지 않기 때문에 사용하기 쉽지만 전체 자료 중 얼마나 많은 자료를 이상치로 볼 것인가를 미리 입력해야 하기 때문에 결과를 해석하기가 쉽지 않다.
이러한 Isolation Forest는 Unsupervised Anomaly Detection 중 하나로 현재 갖고 있는 데이터 중 이상치를 탐지할 때 주로 사용되며, 이름에서 볼 수 있듯이 tree 기반으로 구현되는데, 랜덤으로 데이터를 split하여 모든 관측치를 고립시키며 구현된다. 특히, 변수가 많은 데이터에서도 효율적으로 작동할 수 있는 장점이 있다.
Isolation Forest의 컨셉은 각 관측치를 고립(=분리)시키기는 것은 이상치가 정상 데이터보다 쉽다라는 것으로, 학습 방법은, 정상 데이터는 tree의 terminal node와 근접하며 경로 길이가 크고, 이상치는 tree의 root node와 근접하며 경로 길이가 작다는 것을 통해 이루어진다.
랜덤포레스트가 의사결정나무를 여러번 반복하여 앙상블 하듯이, Isolation Forest는 iTree를 여러번 반복하여 앙상블함다. iTree는 ① Sub-sampling: 비복원 추출로 데이터 중 일부를 샘플링, ② 변수 선택: 데이터 X의 변수 중 q를 랜덤 선택, ③ split point 설정: 변수q의 범위(max~min) 중 uniform하게 split point를 선택, ④ ①~③번 과정을 모든 관측치가 split 되거나, 임의의 split 횟수까지 반복(=재귀 나무)하며, 경로 길이를 모두 저장하며, Isolation Forest는 ⑤ 1~4번 과정(iTree)을 여러 번 반복하게 된다.
평가는 다음과 같이 이뤄진다.
여기서 h(x): 해당 관측치의 경로 길이, E(h(x)): 모든 iTree에서 해당 관측치에 대한 평균 경로 길이, c(n): h(x)를 nomalise하기 위한 값으로, iTree의 평균 경로 길이. (iTree는 Binary Search Tree와 동일한 구조이기 때문에,c(n)값을 쉽게 구함)
E(h(x))에 따른 Score 값은 1. 관측치 x가 전체 경로길이의 평균과 유사(= 정상 데이터): E(h(x))→c(n),s→0.5, 2. 관측치 x가 이상치: E(h(x))→0,s→1, 3. 관측치 x의 최대 경로길이: E(h(x))→n-1, s→0로, 즉, Score는 0 ~ 1 사이에 분포되며, 1에 가까울수록 이상치일 가능성이 크고 0.5 이하이면 정상데이터로 판단할 수 있다.
본 발명에서는 이러한 알고리즘을 유기적으로 결합하여 정확한 이상치의 검출과 오류에 대항할 수 있는 이른바 앙상블 알고리즘을 사용하게 된다.
기존의 이상치 탐지 방법론의 문제를 보면 후술되는 내용에서 실제 자료를 사용한 예제에서 보여주듯이, 근거가 되는 이론과 사용하는 상황들이 다르기 때문에 실제 자료에 적용해 보면 이상치 탐지의 결과가 비슷한 케이스도 있지만 결과가 다른 경우가 많다.
특히 건축물 안전 진단 플랫폼의 경우는 이상치가 검출되었느냐가 예측문제를 떠나서 플랫폼 자체의 존재 의미와 관련되기 때문에 정확성을 요구하는데 사용하는 방법론에 따라 결과가 많이 달라지는 것은 바람직한 현상이 아닐뿐더러 방법론들 사이에 어떤 것이 상황에 맞는지 아닌지 판단 기준조차 모호한 현실이다.
이는 서로 다른 근거를 사용해서 이질적인 자료들을 골라내는 고유의 논거를 펼치기 때문에 서로 다른 근거를 이용하는 방법론들은 우열을 이론적으로 가릴 수도 없고 실제 자료에서 어떤 것이 이질적인 이상치라고 알고 있어서 지도적(supervised) 학습 알고리즘을 사용할 수 있는 경우는 드물기 때문에 사후 검증을 할 수도 없기 때문이다.
이에 본 발명에서는 Entropy 정보량을 이용한 이상치 탐지 적합성을 결정하였다.
데이터 사이언스에서 엔트로피(entropy)란 정보량이라는 것을 의미하며, 정보량에 대한 엔트로피는 새넌 엔트로피(Shannon entropy) 혹은 평균 정보량이 쓰이고 있다.
정보량이란 사건이 일어날 확률의 역수의 로그(log)로 정의하고, 이 정보량의 평균을 엔트로피 값이라고 한다. 엔트로피 값은 충분히 일어날 수 있는 일이 일어나는 경우는 값이 작고 일어날 가능성이 작은 사건에 대해서는 큰 값을 제공한다.
이상치의 관점에서 보면 여러 방식을 통해 탐지한 이상치를 제외한 자료의 엔트로피를 상호 비교해서 가장 작은 엔트로피 값을 주는 방법론으로 이상치 탐지 값을 선택해주는 것이 합리적 방식이다. 다시 말해, 이상치(일어날 확률이 작은 값)를 제외하면 이상치를 제외한 나머지 자료들에서 제공하는 평균 정보량은 이상치를 포함한 자료에서 계산된 평균 정보량보다 확연하게 큰 값이어야 하고 서로 다른 방법론을 통해 제시된 각각 다른 이상치들은 추출된 이상치들을 제외한 데이터 셋의 평균 정보량을 서로 비교함으로써 어떤 이상치 추출이 정보량이라는 관점에서 더 적합한 방식인가를 판단할 수 있는 여러 방법론을 통합하는 적합성 검정을 하는데 사용할 수 있다.
여기서 I(X)는 개별 자료의 정보량이라고 정의하고 b는 로그함수의 밑으로 새넌 엔트로피에서는 비트 수인 2를 사용하고 자연수 10 혹은 오일러 상수 e를 사용하기도 한다.
여러 이상치 추출 방법론으로 이상치를 검출한 결과로 이상치를 제외한 자료셋의 평균정보량이 유의미하게 적은 케이스를 선택하는 것이 좋다. 엔트로피는 자료에서 나올 확률이 적은 데이터들을 제외할수록 작은 값이 나오는 특징을 가지고 있다.
다만, 꼭 나올 확률이 매우 작은 이상치가 아니더라도 비교적 작은 확률값을 가지는 데이터를 제외해도 그 값은 작아진다. 매우 큰 확률을 가지는 데이터를 제외하는 경우는 엔트로피 값이 증가하기도 하며 확률값에 로그를 취하여 계산하기 때문에 확률값에 대하여 비선형적인 성격을 가진다.
이상치를 제외한 자료와 원자료의 정보량 값의 차이는 직관적인 해석이 어렵기 때문에 평균 정보량을 자료의 평균 확률값의 변화량으로 변환해서 보면 좀 더 직관적인 정보량의 차이를 체감하기 쉽다.
따라서, 본 발명에서는 평균 정보량의 차이를 다음과 같이 정의한다. 평균 정보량의 정의 H(X)를 사용하면 이상치가 제외되는 경우 확률분포도 달라지기 때문에 이론적인 계산이 어려워진다.
이에 평균정보량을 데이터셋의 대표 정보량I(X)라고 간주하고 평균 정보량 엔트로피를 전체 데이터(full data set)와 이상치를 제외한 데이터(reduced data set)의 대표 정보량으로 간주한다. 두 자료의 대표 정보량의 차이는,
두 데이터 셋의 평균 정보량을 대표 정보량으로 보고 그 차이를 확률의 관점으로 살펴보면 확률의 차이가 클수록 우리는 아웃라이어 추출이 잘되었다고 할 수 있다.
만일 확률값에 별 큰 차이가 없다면 우리는 이상치 추출 결과가 빈약하다고 할 수 있다.
종래 센서의 이상치 탐색을 위한 다양한 알고리즘이 제공되는 만큼 방법론에 따른 장단점이 존재하며, 여러 알고리즘이 이상치 개수를 미리 특정해야 활용 가능하다는 점도 문제였다.
여러 가지 알고리즘들 중 시계열 모델을 적합하고 예측치와의 차이를 이용하는 이상치 탐지 기법들은 최신 기법이고 유효성이 증명되었지만 건축물 관련 자료의 특성상 특별한 모델 적합이 반드시 필요하다고 보이지 않기 때문에 제외하였다.
또한, 다변량 기법은 필요치 않은 상황이고 건축물 관련 센서 자료들이 안정성에 대한 자료들이 축적되 있는 상황이 아니기 때문에 비지도적(unsupervised)기법만 사용 가능하다. 센서 자료는 시계열 자료라는 특성상 시간에 따른 영향을 배제하기 위해 1차 차분한 잔차를 가지고 이상치 탐지를 수행하였다.
도 2는 본 발명의 실시예에 따른 구성 및 연결관계를 나타낸 블록도, 도 3은 본 발명의 실시예에 따른 순서를 나타낸 순서도로서, 본 발명에서는 대표적인 단변량 이상치 검출 방법론 4개를 동시에 적용하고 각 방법론에 따른 이상치로 검출된 결과의 정보량(entropy)를 계산하여 대표 정보량의 확률값의 변동을 기준으로 센서 데이터셋의 이상치로 정의하는 앙상블 알고리즘을 제안한다.
이를 위해 우선 기울기 센서를 예시로 직교 좌표계에서 극좌표계로 전환해준다. 이때 각도에 해당하는 값은 고려하지 않고 이상치 검출에서는 일단 기울기의 크기만 고려한다. 기울기 값의 크기는 다음과 같이 표현된다.
먼저, 첫 번째 단계(S 110)에서는 IQR(Inter quatile range)방식으로 이상치를 검출하며, 이는 상기 센서로부터 얻어진 자료값을 오름차순으로 정렬하는 정렬부(111)와, 정렬된 자료값을 설정된 비율로 분할하여 경계구간을 설정하는 구간설정부(112)를 구비하고, 상기 경계구간을 벗어나는 자료값을 제1이상치로 정의하여 저장하는 제1검출모듈(110)을 통해 수행된다.
즉 자료값을 오름차순으로 읽어들이고 4 등분하여 75% percentile과 25% percentile의 차를 계산한다. 이 값을 IQR 이라 부른다. 이때 상기 구간설정부(112)는 IQR에 1.5를 곱해서 75% percentile 값에 더해준 것을 최대, 25% percentile 값에서 빼준 것을 최소로 하는 경계 구간을 설정한다. 자료들 중 이 범위를 벗어나는 점들을 이상치라고 정의하고, 이상치로 검출된 값들과 이상치 개수를 저장한다.
다음 두 번째 단계(S 120)에서는 Z-Score 방식으로 이상치를 검출하며, 이는 상기 센서로부터 얻어진 자료값을 정규분포화하고, 표준정규분포를 참고하여 설정된 신뢰수준에서 검정하여 제2이상치를 추출 및 저장하는 제2검출모듈(120)을 통해 수해왼다.
즉 자료값을 정규분포라 가정하고 평균과 표준편차를 계산하여 점수를 계산한다. 실제로 건축물 안전 관련 균열과 기울기 센서는 정상적인 상황이라면 백색잡음의 정규분표 형태를 취하고 이상이 생겼다면 평소와는 다른 트렌드가 나타나거나 이상치가 나타나기 때문에 적당한 가정이라 볼 수 있다.
이때 상기 제2검출모듈(120)은 계산된 점수를 표준정규분포를 참조해서 95% 혹은 99%신뢰수준에서 이상치인지 아닌지를 검정한다. 계산된 이상치와 결과를 저장한다.
다음 세 번째 단계(S 130)에서는 Generalized ESD test를 이용해서 이상치를 검출하며, 상기 제1이상치 및 제2이상치 개수의 상한을 설정하고 검정통계량을 계산하는 검정통계부(131)와, 상기 검정통계량과 비교할 임계값을 설정하는 임계값설정부(132)를 구비하고, 상기 검정통계량이 설정된 임계값보다 클 경우 제3이상치로 정의하여 저장하는 제3검출모듈(130)을 통해 수행된다.
즉 상기 검정통계부(131)는 이상치의 개수의 상한을 첫 번째 단계(S 110) 및 두 번째 단계(S 120)의 최대값에 1을 더한값으로 설정한 후 검정통계량을 계산하되, 표본평균과 표본표준편차를 계산하고 관측치와 표본평균의 편차의 최대치를 구하고 최대치에 해당하는 자료값을 표본에서 제거하고 다시 검정통계량을 계산하여 추정한 최대치의 이상치 개수까지 검정 통계량을 계산한다. 이는 다음과 같이 표현된다.
또한, 상기 임계값설정부(132)는 검정통계량과 비교할 임계값을 다음과 같이 계산한다.
여기서 t(p,v)는 자유도 v를 가지는 t분포의 100p 백분율 값을 의미하고 로 정의한다. 계산된 가 임계값 보다 크면 이상치로 간주하고 이 값을 저장한다. 이 검정은 인 경우 상당히 정확하다.
다음 네 번째 단계(S 140)에서는 isolation forest 기법을 이용해서 이상치를 검출하며, 이는 isolation forest 알고리즘을 이용하여 이상치 점수를 계산하는 점수계산부(151)와, 이상치의 비율을 설정하고 설정된 비율에 맞는 이상치 점수 자료값을 제4이상치로 정의하여 저장하는 제4검출모듈(140)을 통해 수행된다.
이는 decision tree를 이용해서 이상치를 탐지하는 기법으로 선제적으로 자료에서 이상치가 차지하는 비중이 얼마 정도 될지 추정한 이후 공간분할 방식의 알고리즘을 사용해서 다른 관측치와 유사점이 없는 이상치를 탐지하는 기법이다.
많은 이상치 탐지 기법이 자료들 사이에 통계적 거리를 사용하는데 자료가 많아지거나 다차원 자료일 경우 계산량이 폭증하는 단점을 가지고 있으나 공간기반 탐지 기법은 거리 계산의 부담이 적고 이상치 탐지에서 어려운 두 가지 문제인 masking(이상치가 무리지어 있을 경우 정상치로 구분되는 문제)과 swamping(정상값이 이상치와 거리가 가까워 잘못 이상치로 구분되는 경우)에서 조금 더 자유롭다.
알고리즘은 전체 데이터를 가진 root node와 추후 분할을 위한 후보 노드를 담은 리스트(C)를 작성한다. 이 리스트에서 하나의 노드(R)를 랜덤하게 추출하고 이 노드는 리스트 C 에서 삭제한다. 뽑힌 R에 대해서 특성치(a)를 랜덤하게 정하고 a보다 작거나 같은 자료는 그 외의 자료는 로 나눈다. 혹은 에 데이터가 2개 이상 포함되 있다면 이것을 후보 리스트 집합인 C에 다시 포함 시키고 그렇지 않다면 이것을 고립된 노드로 간주한다. 모든 자료들이 고립된 노드로 구분될 때까지 같은 작업을 반복하고 자료별로 모두 고립될 때까지 필요한 작업의 수를 저장하고 필요 작업수가 작은 것들을 이상치로 간주한다.
이 알고리즘은 결과로 이상치 점수(anomaly score)를 계산하는데 이상치 점수가 높은 것을 이상치로 선언한다. 본 발명에서는 다른 방법론에서 제시된 이상치 개수의 최대값을 반영하여 이상치 탐지를 수행한다. 다만, iForest는 이상치의 비율을 사전에 정하고 그 비율에 맞는 이상치 점수의 상위 % 자료를 이상치로 선언하는데 이것은 이상치 탐색을 하기 전에 미리 이상치가 대략 어느 정도 비율인지를 미리 결정해야 하는 어려움이 있지만, 일단은 이상치 점수를 계산하는데까지 실행한다.
마지막 다섯 번째 단계(S 150)에서는 이상 4가지 이상치 탐지 기법을 순차적으로 적용한 이후 검출된 이상치 자료를 바탕으로 원래 자료와 이상치로 탐지된 자료를 제거한 데이터 셋을 대상으로 엔트로피를 계산한다.
이는 상기 제1이상치, 제2이상치, 제3이상치, 제4이상치를 바탕으로 원본 자료값 및 이상치 자료값을 제거한 데이터셋을 대상으로 엔트로피를 계산하는 엔트로피계산부(151)와, 상기 엔트로피의 변동을 확률변동 관점으로 재해석하는 해석부(152)를 구비하고, 설정된 값과 확률변동을 비교하여 이상치 추출의 양호를 판단하는 검증모듈(150)을 통해 수행된다.
엔트로피 계산은 적절한 자료의 이산화(discretized)가 필요하다. 자료가 도출되는 통상적인 범위를 적절한 개수로 나누어서 이산확률 도수분포표를 생성하고 각 급간 간에 들어가는 도수들을 파악한다.
이 자료를 기준으로 엔트로피를 계산하고 이상치로 인한 엔트로피의 변동량의 해석을 위해 평균 정보량인 엔트로피의 변동을 데이터의 확률 변동 관점으로 재해석한다. 이 확률의 변동이 크다면 이상치 검출이 잘 이루어진 것이고 그렇지 않다면 그 방법론으로 검출된 이상치 추출에 문제가 있다고 결론 내린다.
도 4 ~ 5는 본 발명의 실험예에 따른 이상치 탐지 예시를 나타낸 시트로서, 서로 다른 방법론이 내보내는 이상치 검출이 일치하고 정보량의 변화도 크다고 볼 수 있다.
대표 확률값 변동량의 기준에서 정보량의 변화가 얼마나 커야 유의미한 정보량의 변화라고 볼 수 있을지는 다른 통계적 가설 검정과 같이 사용자나 자료 해석자의 주관이 개입하게 된다. 통계량의 확률 분포를 정확하게 유도할 수 있다면 솔루션이 존재할 수 있으나 통계량의 확률분포 가정을 두지 않는다면 수학적 대답은 어렵다.
예를 들어 자료값이 정규 분포를 따른다고 가정한다면 다음과 같이 정보량 함수를 유도할 수 있다.
정규분포 가정을 한다면 평균 엔트로피는 분산이 커지면 늘어나고 분산이 작을수록 줄어든다. 그러나 자료값의 확률분포 가정을 두면 여러 가지 방법론 중에 정규성 가정을 하지 않는 방법론을 다루는데 문제가 생긴다.
이를 우회하기 위해, 본 발명에서는 평균 엔트로피 값을 확률값 기준으로 변환해서 관찰했을 때 이상치 자료 1개당 1% 정도의 확률 변화량을 보이면 유의미한 변화라고 가정하기로 한다.
확률값 관점으로 변환이란 평균 정보량을 자료의 정보량의 대푯값으로 보고 정보량값을 다시 확률로 변환해서 관찰하는 것이다. 실제 자료들에 적용해본 이후 해석자가 변환된 확률 관점의 수치들을 바탕으로 개략적인 유의미한 정보 변화량을 이상치 검출 자료를 바탕으로 추산해 낼 수 있다.
도 6 ~ 9는 본 발명의 실험예에 따른 센서 자료값에 대한 분석결과를 나타낸 시트이다.
도 6에서는 서로 다른 방법을 통해 모두 이상치 검출이 안 된 결과를 보여주고 있으며, 도 7에서는 IQR과 z-score에서 동일 이상치 검출하였으나 Generalized ESD test는 이상치 미검출된 상황으로 확률값의 변동이 IQR과 z-score에서 검출된 이상치 자료가 5%를 넘어서기 때문에 추출된 2개의 이상치를 이상치로 받아 들였다.
도 8에서는 z-score방법론 에서만 1개가 검출되었으나 그나마 확률 변화가 1%를 넘지 못해 이상치가 존재하지 않는다는 결론을 내렸으며, 도 9에서는 z-score에서 2개가 이상치로 검출되고 나머지 방법론에서는 z-score 결과를 포함 4개가 이상치로 검출되어 4개를 이상치로 봤을 때 확률값 변화가 15%를 넘겨 4개를 이상치로 보는 것으로 결론을 내렸다.
이처럼 서로 다른 이상치 탐지 알고리즘 결과를 동시에 비교해 보면서 검출된 특정 이상치에 좀 더 정확성을 부여하고 근거로 확률 변화값을 얻을 수 있었으며 개별 방법론마다 다른 결과가 검출되는데 따른 혼란과 불신을 없앨 수 있다.
본 발명의 권리는 위에서 설명된 실시 예에 한정되지 않고 청구범위에 기재된 바에 의해 정의되며, 본 발명의 분야에서 통상의 지식을 가진 자가 청구범위에 기재된 권리범위 내에서 다양한 변형과 개작을 할 수 있다는 것은 자명하다.
110: 제1검출모듈 111: 정렬부
112: 구간설정부 120: 제2검출모듈
130: 제3검출모듈 131: 검정통계부
132: 임계값설정부 140: 제4검출모듈
141: 점수계산부 150: 검증모듈
151: 앤트로피계산부 152: 해석부
112: 구간설정부 120: 제2검출모듈
130: 제3검출모듈 131: 검정통계부
132: 임계값설정부 140: 제4검출모듈
141: 점수계산부 150: 검증모듈
151: 앤트로피계산부 152: 해석부
Claims (5)
- 건축물에 설치되어 안전을 모니터링하는 센서의 이상치를 탐지하는 시스템에 있어서,
상기 센서로부터 얻어진 자료값을 오름차순으로 정렬하는 정렬부(111)와, 정렬된 자료값을 설정된 비율로 분할하여 경계구간을 설정하는 구간설정부(112)를 구비하고, 상기 경계구간을 벗어나는 자료값을 제1이상치로 정의하여 저장하는 제1검출모듈(110);
상기 센서로부터 얻어진 자료값을 정규분포화하고, 표준정규분포를 참고하여 설정된 신뢰수준에서 검정하여 제2이상치를 추출 및 저장하는 제2검출모듈(120);
상기 제1이상치 및 제2이상치 개수의 상한을 설정하고 검정통계량을 계산하되 상기 제1이상치 및 제2이상치의 최대값에 1을 더한 값으로 이상치 개수의 상한을 설정하고 표본평균과 표본표준편차를 계산하며 관측치와 표본평균의 편차의 최대치를 구하고 최대치에 해당하는 자료값을 표본에서 제거하고 다시 검정통계량을 계산하여 추정한 최대치의 이상치 개수까지 검정통계량을 계산하는 검정통계부(131)와, 상기 검정통계량과 비교할 임계값을 설정하는 임계값설정부(132)를 구비하고, 상기 검정통계량이 설정된 임계값보다 클 경우 제3이상치로 정의하여 저장하는 제3검출모듈(130);
isolation forest 알고리즘을 이용하여 이상치 점수를 계산하는 점수계산부(151)와, 이상치의 비율을 설정하고 설정된 비율에 맞는 이상치 점수 자료값을 제4이상치로 정의하여 저장하는 제4검출모듈(140);
상기 제1이상치, 제2이상치, 제3이상치, 제4이상치를 바탕으로 원본 자료값 및 이상치 자료값을 제거한 데이터셋을 대상으로 엔트로피를 계산하는 엔트로피계산부(151)와, 상기 엔트로피의 변동을 확률변동 관점으로 재해석하는 해석부(152)를 구비하고, 설정된 값과 확률변동을 비교하여 이상치 추출의 양호를 판단하는 검증모듈(150); 로 이루어지는 것을 특징으로 하는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템.
- 제1항에 있어서,
상기 센서는 진동, 균열, 기울기를 측정할 수 있는 센서인 것을 특징으로 하는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템.
- 제1항에 있어서,
상기 구간설정부(112)는,
오름차순으로 정리된 자료값을 4 등분하여 백분위 75% 값과 25% 값과의 차에 1.5를 곱해서 백분위 75% 값에 더해준 것을 최대, 백분위 25% 값에서 빼준 것을 최소로 하는 경계 구간을 설정하는 것을 특징으로 하는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템.
- 제1항에 있어서,
상기 제2검출모듈(120)은,
95 내지 99% 신뢰수준에서 이상치 여부를 검정하는 것을 특징으로 하는 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템.
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210127549A KR102489502B1 (ko) | 2021-09-27 | 2021-09-27 | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210127549A KR102489502B1 (ko) | 2021-09-27 | 2021-09-27 | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102489502B1 true KR102489502B1 (ko) | 2023-01-17 |
Family
ID=85111409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210127549A KR102489502B1 (ko) | 2021-09-27 | 2021-09-27 | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102489502B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117411811A (zh) * | 2023-12-15 | 2024-01-16 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
KR102654695B1 (ko) | 2023-10-12 | 2024-04-04 | (주)엘 테크 | 시간 적응적 앙상블 알고리즘을 이용한 센서 이상치 탐지 시스템 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019180943A1 (ja) * | 2018-03-23 | 2019-09-26 | 日本電気株式会社 | 異常診断装置、異常診断方法、及びコンピュータ読み取り可能な記録媒体 |
KR102274389B1 (ko) | 2020-09-18 | 2021-07-06 | (주)위세아이텍 | 센서 데이터를 이용한 이상패턴 탐지 모델 구축 방법 및 이를 이용한 이상 탐지 장치 및 방법 |
-
2021
- 2021-09-27 KR KR1020210127549A patent/KR102489502B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019180943A1 (ja) * | 2018-03-23 | 2019-09-26 | 日本電気株式会社 | 異常診断装置、異常診断方法、及びコンピュータ読み取り可能な記録媒体 |
KR102274389B1 (ko) | 2020-09-18 | 2021-07-06 | (주)위세아이텍 | 센서 데이터를 이용한 이상패턴 탐지 모델 구축 방법 및 이를 이용한 이상 탐지 장치 및 방법 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102654695B1 (ko) | 2023-10-12 | 2024-04-04 | (주)엘 테크 | 시간 적응적 앙상블 알고리즘을 이용한 센서 이상치 탐지 시스템 및 방법 |
CN117411811A (zh) * | 2023-12-15 | 2024-01-16 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
CN117411811B (zh) * | 2023-12-15 | 2024-02-23 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102489502B1 (ko) | 앙상블 알고리즘을 이용한 건축물 모니터링용 센서 이상치 탐지시스템 | |
CN109193650A (zh) | 一种基于高维随机矩阵理论的电网薄弱点评估方法 | |
EP2963552B1 (en) | System analysis device and system analysis method | |
Kirchen et al. | Metrics for the evaluation of data quality of signal data in industrial processes | |
CN111080117A (zh) | 设备风险标签的构建方法、装置、电子设备及存储介质 | |
CN110570544A (zh) | 飞机燃油系统故障识别方法、装置、设备和存储介质 | |
Haridy et al. | An optimisation design of the combined np-CUSUM scheme for attributes | |
KR102470763B1 (ko) | 데이터 이상치 탐색 장치 및 방법 | |
CN108399115B (zh) | 一种运维操作检测方法、装置及电子设备 | |
CN116383645A (zh) | 一种基于异常检测的系统健康度智能监测评估方法 | |
KR102269647B1 (ko) | 서버 성능 모니터링 장치 | |
CN112836094A (zh) | 一种对遥测数据模拟量参数的自动判读方法 | |
CN117574180B (zh) | 燃料生产排放系统数据关联性控制管理系统 | |
CN113360357A (zh) | 数据监控方法、系统、设备及计算机程序产品 | |
CN112039907A (zh) | 一种基于物联网终端评测平台的自动测试方法及系统 | |
Rao et al. | Marshall-Olkin extended Lomax distribution: an economic reliability test plan | |
CN117149565A (zh) | 云平台关键性能指标的状态检测方法、装置、设备及介质 | |
US20230061829A1 (en) | Outlier detection apparatus and method | |
CN116702005A (zh) | 一种基于神经网络的数据异常诊断方法和电子设备 | |
CN116070934A (zh) | 指标故障原因的确定方法和装置 | |
KR20230088583A (ko) | LoRa 및 LwM2M 기술에 적용될 수 있는 하이브리드 게이트웨이 | |
CN114881112A (zh) | 一种系统异常检测方法、装置、设备及介质 | |
CN112651019A (zh) | 基于无监督学习的异常行为检测方法、装置及计算终端 | |
CN115829160B (zh) | 一种时序异常预测方法、装置、设备及存储介质 | |
CN117574362B (zh) | 一种达人账号数据异常分辨方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |