KR20220010171A - 영상 분석 시스템 및 이의 동작 방법 - Google Patents
영상 분석 시스템 및 이의 동작 방법 Download PDFInfo
- Publication number
- KR20220010171A KR20220010171A KR1020200088732A KR20200088732A KR20220010171A KR 20220010171 A KR20220010171 A KR 20220010171A KR 1020200088732 A KR1020200088732 A KR 1020200088732A KR 20200088732 A KR20200088732 A KR 20200088732A KR 20220010171 A KR20220010171 A KR 20220010171A
- Authority
- KR
- South Korea
- Prior art keywords
- features
- analyzer
- model
- images
- analysis system
- Prior art date
Links
- 238000010191 image analysis Methods 0.000 title claims abstract description 48
- 238000011017 operating method Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000003416 augmentation Effects 0.000 claims description 2
- 230000007423 decrease Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 18
- 230000003936 working memory Effects 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 238000004321 preservation Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 도 1의 제1 분석기의 예시적인 도면이다.
도 3은 도 2의 제1 분석기에 의하여, 임베딩 공간에서 특징들이 인접하게 배치되는 사전훈련 과정을 설명하기 위한 도면이다.
도 4는 도 1의 제2 분석기의 예시적인 도면이다.
도 5는 도 4의 제2 분석기에 의하여, 임베딩 공간에서 특징들이 클러스터링되는 과정을 설명하기 위한 도면이다.
도 6은 영상 분석 시스템이 순차적으로 인코딩 및 클러스터링을 수행하는 경우의 결과를 설명하기 위한 도면이다.
도 7은 영상 분석 시스템이 인코딩과 함께 클러스터링을 수행하는 경우의 결과를 설명하기 위한 도면이다.
도 8은 도 1의 영상 분석 시스템에 의한 클러스터링 결과를 설명하기 위한 도면이다.
도 9는 도 1의 영상 분석 시스템의 예시적인 블록도이다.
110: 제1 분석기
120: 제2 분석기
1310: 학습기
1320: 예측기
Claims (17)
- 제1 모델로 이미지들을 인코딩하여 제1 특징들을 생성하고, 상기 제1 특징들에 기초하여 상기 제1 모델의 가중치를 조절하는 제1 분석기; 및
상기 제1 특징들에 기초하여, 제2 모델로 상기 이미지들을 인코딩하여 제2 특징들을 생성하고, 상기 제2 특징들 각각을 클래스들로 분류하고, 상기 제2 특징들 중 원본 이미지 그룹에 대응되는 특징들이 분류된 클래스와 상기 제2 특징들 중 상기 원본 이미지 그룹의 확장(augmentation) 그룹에 대응되는 특징들이 분류된 클래스 사이의 상호 정보(mutual information) 및 상관 관계에 기초하여 상기 제2 모델의 가중치를 조절하는 제2 분석기를 포함하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제1 분석기는,
상기 가중치가 조절된 제1 모델에 기초하여, 상기 제1 특징들 중 타겟 특징과 가장 이웃한 값을 갖는 특징을 그룹화하는 영상 분석 시스템. - 제2 항에 있어서,
상기 제1 분석기는,
상기 타겟 특징과 가장 이웃한 값을 갖는 상기 특징을 임베딩 공간에서 상기 타겟 특징과 가까운 거리를 갖도록 변환하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제1 분석기는,
상기 이미지들로부터 특징들을 추출하고, 상기 특징들의 차원을 기설정된 차원으로 축소하고, 임베딩 공간에 상기 차원 축소된 특징들을 정규화함으로써, 상기 제1 특징들을 생성하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제1 분석기는,
상기 제1 특징들 중 상기 원본 이미지 그룹에 대응되는 특징들 및 상기 제1 특징들 중 상기 확장 그룹에 대응되는 특징들 사이의 유사도에 기초하여, 상기 제1 특징들 중 타겟 특징과 가장 이웃한 특징이 서브 클래스로 그룹화되는 제1 확률 및 상기 타겟 특징이 상기 서브 클래스에 존재하지 않는 제2 확률을 계산하고, 상기 제1 확률 및 상기 제2 확률에 기초하여 상기 제1 모델의 상기 가중치를 조절하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 가중치가 조절된 제2 모델에 기초하여, 상기 제2 특징들 중 타겟 특징과 가장 이웃한 값을 갖는 특징을 임베딩 공간에서 상기 타겟 특징과 가까운 거리를 갖도록 변환하고, 상기 변환된 제2 특징들을 상기 클래스들로 분류하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 제1 특징들에 기초하여, 상기 제2 특징들을 계산하기 위한 초기 값을 결정하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 이미지들로부터 특징들을 추출하고, 상기 특징들의 차원을 기설정된 차원으로 축소하고, 상기 제1 특징들에 기초하여 임베딩 공간에 상기 차원 축소된 특징들을 정규화함으로써, 상기 제2 특징들을 생성하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 원본 이미지 그룹에 대응되는 상기 특징들 각각이 분류되는 클래스의 제1 확률 변수와 상기 확장 그룹에 대응되는 상기 특징들 각각이 분류되는 클래스의 제2 확률 변수를 계산하고, 상기 제1 및 제2 확률 변수들 사이의 결합 확률 분포에 기초하여 클러스터링 손실을 계산하고, 상기 클러스터링 손실에 기초하여, 상기 상호 정보가 증가하도록 상기 제2 모델의 상기 가중치를 조절하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 확장 그룹에 대응되는 상기 특징들 중 타겟 특징이 타겟 클래스로 분류되는 제1 확률 및 상기 원본 이미지 그룹에 대응되는 상기 특징들 중 상기 타겟 특징에 대응되는 특징이 상기 타겟 클래스로 분류되지 않는 제2 확률을 계산하고, 상기 제1 확률 및 상기 제2 확률에 기초하여 상기 제2 모델의 상기 가중치를 조절하는 영상 분석 시스템. - 제1 항에 있어서,
상기 제2 분석기는,
상기 상호 정보에 기초하여 제1 손실을 계산하고, 상기 상관 관계에 기초하여 제2 손실을 계산하고, 상기 제1 손실 및 가중치가 부여된 상기 제2 손실의 합이 감소하도록, 상기 제2 모델의 상기 가중치를 조절하는 영상 분석 시스템. - 제1 항에 있어서,
상기 이미지들에 라벨이 부여되지 않은 영상 분석 시스템. - 영상 분석 시스템의 동작 방법에 있어서,
제1 모델로 원본 이미지들을 인코딩하여 제1 특징들을 생성하는 단계;
상기 제1 모델로 상기 원본 이미지들의 확장 이미지들을 인코딩하여 제2 특징들을 생성하는 단계;
상기 제1 특징들 및 상기 제2 특징들에 기초하여, 상기 제1 모델의 가중치를 조절하는 단계;
상기 제1 특징들에 기초하여 제2 모델로 상기 원본 이미지들을 인코딩하여 제3 특징들을 생성하는 단계;
상기 제2 특징들에 기초하여 상기 제2 모델로 상기 확장 이미지들을 인코딩하여 제4 특징들을 생성하는 단계;
상기 제3 및 제4 특징들을 클러스터링하는 단계; 및
상기 클러스터링된 제3 및 제4 특징들 사이의 상호 정보 및 상관 관계에 기초하여 상기 제2 모델의 가중치를 조절하는 단계를 포함하는 방법. - 제13 항에 있어서,
상기 제1 모델의 가중치를 조절하는 단계는,
상기 제1 특징들 및 상기 제2 특징들에 기초하여, 상기 제3 특징들 및 상기 제4 특징들을 생성하기 위한 초기 값을 결정하는 단계를 포함하는 방법. - 제13 항에 있어서,
상기 제1 특징들을 생성하는 단계 또는 상기 제2 특징들을 생성하는 단계는,
상기 원본 이미지들 또는 상기 확장 이미지들로부터 특징들을 추출하는 단계;
상기 추출된 특징들의 차원을 기설정된 차원으로 축소하는 단계; 및
임베딩 공간에 상기 차원 축소된 특징들을 정규화하는 단계를 포함하는 방법. - 제13 항에 있어서,
상기 제3 특징들을 생성하는 단계 또는 상기 제4 특징들을 생성하는 단계는,
상기 원본 이미지들 또는 상기 확장 이미지들로부터 특징들을 추출하는 단계;
상기 추출된 특징들의 차원을 기설정된 차원으로 축소하는 단계; 및
상기 제1 및 제2 특징들에 기초하여 임베딩 공간에 상기 차원 축소된 특징들을 정규화하는 단계를 포함하는 방법. - 제13 항에 있어서,
상기 제2 모델의 가중치를 조절하는 단계는,
상기 제3 특징들 각각이 분류되는 클래스의 제1 확률 변수와 상기 제4 특징들 각각이 분류되는 클래스의 제2 확률 변수 사이의 결합 확률 분포에 기초하여 제1 손실을 계산하는 단계;
클러스터링된 상기 제3 및 제4 특징들 사이의 상기 상관 관계에 기초하여 상기 제3 특징들과 상기 제4 특징들 중 서로 대응되는 제3 특징 및 제4 특징이 서로 다른 클래스로 분류됨에 따른 제2 손실을 계산하는 단계; 및
상기 제1 손실 및 상기 제2 손실의 가중 합이 감소하도록 상기 제2 모델의 상기 가중치를 조절하는 단계를 포함하는 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200088732A KR20220010171A (ko) | 2020-07-17 | 2020-07-17 | 영상 분석 시스템 및 이의 동작 방법 |
US17/375,650 US12164602B2 (en) | 2020-07-17 | 2021-07-14 | Image analysis system and operating method of the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200088732A KR20220010171A (ko) | 2020-07-17 | 2020-07-17 | 영상 분석 시스템 및 이의 동작 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220010171A true KR20220010171A (ko) | 2022-01-25 |
Family
ID=79292560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200088732A KR20220010171A (ko) | 2020-07-17 | 2020-07-17 | 영상 분석 시스템 및 이의 동작 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US12164602B2 (ko) |
KR (1) | KR20220010171A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102549730B1 (ko) | 2022-11-14 | 2023-06-30 | 주식회사 플랜티넷 | 객체 군집화 기반 문서 분류 방법 및 장치 |
KR102594477B1 (ko) * | 2023-03-03 | 2023-10-26 | 주식회사 인피닉 | 스코어 재조정을 통한 객체 검출 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101901591B1 (ko) | 2011-11-01 | 2018-09-28 | 삼성전자주식회사 | 얼굴 인식 장치 및 그 제어방법 |
KR102481885B1 (ko) | 2017-09-08 | 2022-12-28 | 삼성전자주식회사 | 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스 |
KR102731826B1 (ko) | 2018-12-05 | 2024-11-20 | 중앙대학교 산학협력단 | 차원 축소에 기반한 영상 객체 인식 시스템 및 방법 |
US20210264300A1 (en) * | 2020-02-21 | 2021-08-26 | CACI, Inc.- Federal | Systems and methods for labeling data |
-
2020
- 2020-07-17 KR KR1020200088732A patent/KR20220010171A/ko not_active Application Discontinuation
-
2021
- 2021-07-14 US US17/375,650 patent/US12164602B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102549730B1 (ko) | 2022-11-14 | 2023-06-30 | 주식회사 플랜티넷 | 객체 군집화 기반 문서 분류 방법 및 장치 |
KR102594477B1 (ko) * | 2023-03-03 | 2023-10-26 | 주식회사 인피닉 | 스코어 재조정을 통한 객체 검출 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20220019846A1 (en) | 2022-01-20 |
US12164602B2 (en) | 2024-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Passalis et al. | Training lightweight deep convolutional neural networks using bag-of-features pooling | |
Khan et al. | Reliable facial expression recognition for multi-scale images using weber local binary image based cosine transform features | |
Passalis et al. | Learning bag-of-features pooling for deep convolutional neural networks | |
US9767381B2 (en) | Similarity-based detection of prominent objects using deep CNN pooling layers as features | |
Mohamed et al. | Content-based image retrieval using convolutional neural networks | |
Yang et al. | Unsupervised learning of multi-level descriptors for person re-identification | |
CN110929622A (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
Xu et al. | Unsupervised semantic-based aggregation of deep convolutional features | |
Sawant et al. | A survey of band selection techniques for hyperspectral image classification | |
Bo et al. | Structured output-associative regression | |
Choi et al. | Face video retrieval based on the deep CNN with RBF loss | |
US11989943B2 (en) | Image frame extraction apparatus and image frame extraction method | |
CN112232355A (zh) | 图像分割网络处理、图像分割方法、装置和计算机设备 | |
Benmokhtar | Robust human action recognition scheme based on high-level feature fusion | |
KR20220010171A (ko) | 영상 분석 시스템 및 이의 동작 방법 | |
Feng et al. | Deep image set hashing | |
US20220222934A1 (en) | Neural network construction method and apparatus, and image processing method and apparatus | |
Abdallah et al. | Facial-expression recognition based on a low-dimensional temporal feature space | |
Sumalakshmi et al. | Fused deep learning based Facial Expression Recognition of students in online learning mode | |
Samsani et al. | A real-time automatic human facial expression recognition system using deep neural networks | |
Itano et al. | Human actions recognition in video scenes from multiple camera viewpoints | |
Wozniak et al. | Deep embeddings-based place recognition robust to motion blur | |
Venkata Kranthi et al. | Real-time facial recognition using deep learning and local binary patterns | |
Caroppo et al. | Facial expression recognition in ageing adults: A comparative study | |
Marnissi et al. | On the discriminative power of learned vs. hand-crafted features for crowd density analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200717 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20211112 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20200717 Comment text: Patent Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240726 Patent event code: PE09021S01D |