KR20230059236A - 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 - Google Patents
객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 Download PDFInfo
- Publication number
- KR20230059236A KR20230059236A KR1020210143207A KR20210143207A KR20230059236A KR 20230059236 A KR20230059236 A KR 20230059236A KR 1020210143207 A KR1020210143207 A KR 1020210143207A KR 20210143207 A KR20210143207 A KR 20210143207A KR 20230059236 A KR20230059236 A KR 20230059236A
- Authority
- KR
- South Korea
- Prior art keywords
- depth
- region
- interest
- estimating
- rgb color
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Geometry (AREA)
- Remote Sensing (AREA)
- Automation & Control Theory (AREA)
- Radar, Positioning & Navigation (AREA)
- Aviation & Aerospace Engineering (AREA)
- Image Analysis (AREA)
Abstract
본 발명은 저가형의 센서를 이용하여 최적의 깊이 값을 추정하기 위한 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치에 관한 것이다. 본 발명에 따른 객체 깊이 추정 장치는 RGB 색영상 및 깊이 정보를 획득하는 단계, RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하는 단계, 깊이 정보를 이용하여 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성하는 단계, 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 단계를 포함한다.
Description
본 발명은 객체의 깊이를 추정하기 위한 방법에 관한 것으로, 더욱 상세하게는 저가형의 센서를 이용하여 최적의 깊이 값을 추정하기 위한 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치에 관한 것이다.
로봇 비젼(robot vision), 휴먼 컴퓨터 인터페이스(human computer interface), 지능형 시각 감시(intelligent visual surveillance), 3D 이미지 획득(3D image acquisition), 지능형 운전자 보조 시스템(intelligent driver assistant system) 등과 같은 다양한 분야에서 이용되는 3D 깊이 정보(three-dimensional depth information)의 추정 방법에 대해 활발한 연구가 이루어지고 있다.
3D 깊이 정보 추정에 대한 대부분의 전통적인 방법은 스테레오 비전(stereo vision) 등과 같은 복수의 영상에 의존하는 것이다. 스테레오 매칭(stereo matching)은 두 대의 카메라에서 얻어진 영상에서 생기는 양안 시차(binocular disparity)를 이용하여 깊이를 추정하는 방법이다. 이러한 방법은 많은 장점이 있지만, 동일한 장면(scene)에 대해 두 개의 카메라에서 얻어진 영상의 쌍(pair of image)이 필요한 근본적인 제약이 있다.
이러한 양안 시차(binocular disparity)를 사용한 방법의 대안으로 단안(monocular) 방법도 연구되고 있다. 일례로 DFD(depth from defocus) 방법은 단일 카메라 기반 깊이 추정 방법으로서, 동일한 장면에서 촬영된 다른 초점을 가지는 영상의 쌍을 이용하여 디포커스 블러(defocus blur)의 정도를 추정한다. 그러나 이 방법은 복수의 디포커시드 영상(defocused image)을 촬영하기 위해 고정된 카메라 뷰(fixed camera view)가 필요한 제약이 있다.
따라서 본 발명의 목적은 저가형의 센서를 이용하여 최적의 깊이 값을 추정하기 위한 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치을 제공하는 데 있다.
본 발명에 따른 객체 깊이 추정 방법은 RGB 색영상 및 깊이 정보를 획득하는 단계, 상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하는 단계, 상기 깊이 정보를 이용하여 상기 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성하는 단계, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 방법에 있어서, 상기 관심 영역을 지정하는 단계는, 딥러닝 기반의 객체 인식을 통해 관심 영역을 지정하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 방법에 있어서, 상기 분포도를 생성하는 단계는, 상기 관심 영역 내에 모든 픽셀에 대한 히스토그램을 통해 분포도를 계산하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 방법에 있어서, 상기 추정하는 단계는, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 평균값을 객체의 깊이로 추정하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 방법에 있어서, 상기 획득하는 단계에서 RGB-D 카메라를 통해 RGB 색영상 및 깊이 정보를 획득하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 장치는 RGB 색영상 및 깊이 정보를 획득하는 카메라, 상기 카메라로부터 획득한 상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하고, 상기 깊이 정보를 이용하여 상기 관심 영역 내에 모든 픽셀에 대한 깊이 값의 분포도를 생성하고, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 제어부를 포함하는 것을 특징으로 한다.
본 발명에 따른 이동 장치는 RGB 색영상 및 깊이 정보를 획득하는 카메라, 상기 카메라로부터 획득한 상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하고, 상기 깊이 정보를 이용하여 상기 관심 영역 내에 모든 픽셀에 대한 깊이 값의 분포도를 생성하고, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 제어부를 포함하는 객체 깊이 추정 장치, 상기 객체 깊이 추정 장치에 의해 객체를 탐지하는 로봇 제어부를 포함하는 것을 특징으로 한다.
본 발명에 따른 객체 깊이 추정 방법은 저가의 RGB-D 카메를 통해 RGB 색영상 및 깊이 정보를 획득하여, 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성하고, 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정함으로써, 간단한 방법으로 정확한 깊이 값을 추정할 수 있다.
도 1은 본 발명의 실시예에 따른 이동 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 객체 깊이 추정 장치의 구성을 나타낸 블록도이다.
도 3은 본 발명의 실시예에 따른 객체 깊이 추정 방법을 나타낸 순서도이다.
도 4는 도 3의 S200 단계를 구체적으로 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 객체 깊이 추정 방법을 설명하기 위한 예시도이다.
도 2는 본 발명의 실시예에 따른 객체 깊이 추정 장치의 구성을 나타낸 블록도이다.
도 3은 본 발명의 실시예에 따른 객체 깊이 추정 방법을 나타낸 순서도이다.
도 4는 도 3의 S200 단계를 구체적으로 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 객체 깊이 추정 방법을 설명하기 위한 예시도이다.
본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 명세서에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는, 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.
또한, 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "구성된다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
또한, 본 명세서에서 사용되는 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다.
어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다. 반면에, 어떤 구성 요소가 다른 구성 요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성 요소가 존재하지 않는 것으로 이해되어야 할 것이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다. 본 발명의 사상은 첨부된 도면 외에 모든 변경, 균등물 내지 대체물에 까지도 확장되는 것으로 해석되어야 한다.
도 1은 본 발명의 실시예에 따른 이동 장치의 구성을 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 이동 장치(300)은 객체 깊이 추정 장치(100) 및 이동 제어부(200)를 포함하여 구성될 수 있다.
객체 깊이 추정 장치(100)는 이동 장치(300)에 탑재되어, 이동 장치(300)가 이동하면서 객체를 탐지하거나, 탐지된 객체를 회피할 수 있도록 촬영된 영상에서 객체를 인식하고, 객체의 깊이를 추정할 수 있다.
여기서 이동 장치(300)는 이동 로봇, 자율주행 자동차 등 객체 인식이 필요한 다양한 장치가 될 수 있다.
이러한 객체 깊이 추정 장치(100)는 먼저 객체의 영상을 획득한다. 여기서 객체 깊이 추정 장치(100)는 RGB 색영상 및 깊이 정보를 획득할 수 있다.
여기서 객체 깊이 추정 장치(100)는 RGB 색영상과 깊이 정보를 동시에 획득 가능한 RGB-D 카메라를 이동하여 RGB 색영상 및 깊이 정보를 획득할 수 있다. 하지만 이에 한정된 것은 아니고, 객체 깊이 추정 장치(100)는 RGB 색영상을 획득할 수 있는 RGB 카메라 및 깊이 정보를 획득할 수 있는 뎁스 카메라를 통해 RGB 카메라 및 깊이 정보를 각각 획득할 수도 있다.
또한 객체 깊이 추정 장치(100)는 앞서 획득한 RGB 색영상에서 객체 인식을 통한 관심 영역(Bounding Box)을 지정할 수 있다. 여기서 객체 깊이 추정 장치(100)는 딥러닝 기반의 객체 인식을 통해 관심 영역을 지정할 수 있다. 예를 들어 객체 깊이 추정 장치(100)는 CNN 알고리즘을 이용하여 영상 속의 객체를 인식하여 관심 영역을 지정할 수 있다.
또한 객체 깊이 추정 장치(100)는 획득한 깊이 정보를 이용하여 지정된 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성할 수 있다. 이때 객체 깊이 추정 장치(100)는 관심 영역 내에 모든 픽셀에 대한 히스토그램을 통해 분포도를 계산할 수 있다.
또한 객체 깊이 추정 장치(100)는 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정할 수 있다. 구체적으로 객체 깊이 추정 장치(100)는 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 평균값을 객체의 깊이로 추정할 수 있다. 즉 객체 깊이 추정 장치(100)는 히스토그램 분포도에서 빈도수가 설정된 값 이상의 영역에 대한 깊이 평균값을 객체의 깊이로 추정함으로써 관심 영역 내의 깊이 값에 대한 노이즈를 제거하여 보다 정확한 객체의 깊이 값을 추정할 수 있다.
이동 제어부(200)는 상술한 객체 깊이 추정 장치(100)에 의해 객체를 탐지하여 이동 장치(300)의 이동을 제어할 수 있다.
이하 본 발명의 실시예에 따른 객체 깊이 추정 장치(100)의 구성에 대하여 상세히 설명하도록 한다.
도 2는 본 발명의 실시예에 따른 객체 깊이 추정 장치의 구성을 나타낸 블록도이다.
도 2를 참조하면, 본 발명의 실시예에 따른 객체 깊이 추정 장치(100)는 카메라(110), 저장부(120) 및 제어부(130)를 포함한다.
카메라(110)는 객체의 영상을 획득한다. 여기서 카메라(110)는 RGB 색영상 및 깊이 정보를 획득할 수 있다. 여기서 카메라(110)는 RGB 색영상과 깊이 정보를 동시에 획득 가능한 RGB-D 카메라를 이동하여 RGB 색영상 및 깊이 정보를 획득할 수 있다. 하지만 이에 한정된 것은 아니고, 카메라(110)는 RGB 색영상을 획득할 수 있는 RGB 카메라 및 깊이 정보를 획득할 수 있는 뎁스 카메라를 통해 RGB 카메라 및 깊이 정보를 각각 획득할 수도 있다.
저장부(120)는 데이터를 저장하기 위한 장치로, 객체 깊이 추정 장치(100)의 기능 동작에 필요한 응용 프로그램을 저장한다. 특히 저장부(120)는 관심 영역을 추출하기 위한 알고리즘, 분포도를 생성하기 위한 알고리즘, 객체 깊이를 추정하기 위한 알고리즘 등을 저장할 수 있다. 이러한 저장부(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기메모리, 자기 디스크, 광디스크 중 적어도 하나의 저장매체를 포함할 수 있다.
제어부(130)는 카메라(110)로부터 촬영된 영상을 통해 객체의 깊이를 추정할 수 있다. 이러한 제어부(130)는 관심 영역 추출 모듈(131), 분포도 생성 모듈(132) 및 깊이 추정 모듈(133)을 포함하여 구성될 수 있다.
관심 영역 추출 모듈(131)은 카메라(110)를 통해 획득한 RGB 색영상에서 객체 인식을 통한 관심 영역(Bounding Box)을 지정할 수 있다. 여기서 관심 영역 추출 모듈(131)은 딥러닝 기반의 객체 인식을 통해 관심 영역을 지정할 수 있다. 예를 들어 관심 영역 추출 모듈(131)은 CNN 알고리즘을 이용하여 영상 속의 객체를 인식하여 관심 영역을 지정할 수 있다.
먼저 관심 영역 추출 모듈(131)은 특정 해상도로 이루어진 입력 이미지를 CNN의 입력 데이터에 맞는 해상도로 변환할 수 있다.
예를 들어 관심 영역 추출 모듈(131)은 입력 영상이 고해상도(예를 들어 FHD, QHD 등) 영상이고, CNN의 입력 데이터는 저해상도(예를 들어 SD 등) 영상인 경우, 입력 이미지의 해상도를 다운 스케일링하여 CNN의 입력 데이터에 따른 해상도를 갖도록 변환할 수 있다. 이때, 입력 이미지는 동영상을 구성하는 연속된 프레임들(예를 들면 현재 시점이 t일 때, t-1, t, t+1에 해당하는 시점을 갖는 3개의 프레임)일 수 있다.
다음으로 관심 영역 추출 모듈(131)은 사전에 학습된 CNN에 전처리된 입력 이미지를 통과시킴에 따라 CNN의 출력으로, 여러 픽셀 위치에 대한 바운딩 박스 후보와 바운딩 박스 후보에 관심 객체가 위치할 확률을 나타내는 신뢰도를 획득할 수 있다.
여기서 CNN은 다양한 크기를 갖는 특징 맵(feature map)을 사용하여 바운딩 박스가 될 수 있는 위치와 크기를 추정하고, 추정된 바운딩 박스들로 이루어지는 바운딩 박스 후보들을 출력할 수 있다. 이때, CNN은 바운딩 박스 후보들에 대한 신뢰도를 함께 출력할 수 있다. 또한, CNN을 구성하는 계수 값 등은 빅 데이터를 이용하여 미리 학습됨으로써 결정될 수 있다. 그 밖에 객체 검출을 위한 CNN의 구성과 동작에 대해서는 본 발명이 속하는 기술 분야에서 통상의 기술자가 용이하게 이해할 수 있을 것이므로 구체적인 설명은 생략한다.
그리고 관심 영역 추출 모듈(131)은 비최대화 억제(Non-max suppression) 알고리즘을 수행하여 신뢰도가 미리 설정된 임계값보다 높은 바운딩 박스 후보를 선택함으로써, 관심 영역을 결정할 수 있다.
분포도 생성 모듈(132)은 카메라(110)를 통해 획득한 깊이 정보를 이용하여 지정된 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성할 수 있다. 이때 분포도 생성 모듈(132)은 관심 영역 내에 모든 픽셀에 대한 히스토그램을 통해 분포도를 계산할 수 있다.
또한 깊이 추정 모듈(133)은 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정할 수 있다. 구체적으로 깊이 추정 모듈(133)은 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 평균값을 객체의 깊이로 추정할 수 있다. 즉 깊이 추정 모듈(133)은 히스토그램 분포도에서 빈도수가 설정된 값 이상의 영역에 대한 깊이 평균값을 객체의 깊이로 추정함으로써 관심 영역 내의 깊이 값에 대한 노이즈를 제거하여 보다 정확한 객체의 깊이 값을 추정할 수 있다.
이하 본 발명의 실시예에 따른 객체 깊이 추정 방법에 대하여 상세히 설명하도록 한다.
도 3은 본 발명의 실시예에 따른 객체 깊이 추정 방법을 나타낸 순서도이고, 도 4는 도 3의 S200 단계를 구체적으로 나타낸 순서도이고, 도 5는 본 발명의 실시예에 따른 객체 깊이 추정 방법을 설명하기 위한 예시도이다.
도 3 내지 도 5를 참조하면, 먼저 객체 깊이 추정 장치는 S100 단계에서 RGB 색영상 및 깊이 정보를 획득할 수 있다.
다음으로 S200 단계에서 획득한 RGB 색영상에서 객체 인식을 통한 관심 영역(Bounding Box)을 지정할 수 있다. 여기서 객체 깊이 추정 장치는 딥러닝 기반의 객체 인식을 통해 관심 영역을 지정할 수 있다. 예를 들어 객체 깊이 추정 장치는 CNN 알고리즘을 이용하여 영상 속의 객체를 인식하여 관심 영역을 지정할 수 있다.
구체적으로 S210 단계에서 객체 깊이 추정 장치는 특정 해상도로 이루어진 입력 이미지를 CNN의 입력 데이터에 맞는 해상도로 변환시키는 전처리를 수행할 수 있다.
예를 들어 객체 깊이 추정 장치는 입력 영상이 고해상도(예를 들어 FHD, QHD 등) 영상이고, CNN의 입력 데이터는 저해상도(예를 들어 SD 등) 영상인 경우, 입력 이미지의 해상도를 다운 스케일링하여 CNN의 입력 데이터에 따른 해상도를 갖도록 변환할 수 있다. 이때, 입력 이미지는 동영상을 구성하는 연속된 프레임들(예를 들면 현재 시점이 t일 때, t-1, t, t+1에 해당하는 시점을 갖는 3개의 프레임)일 수 있다.
다음으로 S220 단계에서 객체 깊이 추정 장치는 사전에 학습된 CNN에 전처리된 입력 이미지를 통과시킴에 따라 CNN의 출력으로, 여러 픽셀 위치에 대한 바운딩 박스 후보와 바운딩 박스 후보에 관심 객체가 위치할 확률을 나타내는 신뢰도를 획득할 수 있다.
여기서 CNN은 다양한 크기를 갖는 특징 맵(feature map)을 사용하여 바운딩 박스가 될 수 있는 위치와 크기를 추정하고, 추정된 바운딩 박스들로 이루어지는 바운딩 박스 후보들을 출력할 수 있다. 이때, CNN은 바운딩 박스 후보들에 대한 신뢰도를 함께 출력할 수 있다. 또한, CNN을 구성하는 계수 값 등은 빅 데이터를 이용하여 미리 학습됨으로써 결정될 수 있다. 그 밖에 객체 검출을 위한 CNN의 구성과 동작에 대해서는 본 발명이 속하는 기술 분야에서 통상의 기술자가 용이하게 이해할 수 있을 것이므로 구체적인 설명은 생략한다.
그리고 S230 단계에서 객체 깊이 추정 장치는 비최대화 억제(Non-max suppression) 알고리즘을 수행하여 신뢰도가 미리 설정된 임계값보다 높은 바운딩 박스 후보를 선택함으로써, 관심 영역을 결정할 수 있다.
다음으로 S300 단계에서 객체 깊이 추정 장치는 S100 단계에서 획득한 깊이 정보를 이용하여 지정된 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성할 수 있다. 이때 객체 깊이 추정 장치는 관심 영역 내에 모든 픽셀에 대한 히스토그램을 통해 분포도를 계산할 수 있다.
다음으로 S400 단계에서 객체 깊이 추정 장치는 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정할 수 있다. 구체적으로 객체 깊이 추정 장치는 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 평균값을 객체의 깊이로 추정할 수 있다. 즉 객체 깊이 추정 장치는 히스토그램 분포도에서 빈도수가 설정된 값 이상의 영역에 대한 깊이 평균값을 객체의 깊이로 추정함으로써 관심 영역 내의 깊이 값에 대한 노이즈를 제거하여 보다 정확한 객체의 깊이 값을 추정할 수 있다.
예를 들어 객체 깊이 추정 장치는 도 5에 도시된 바와 같이, 모든 픽셀에 대한 깊이 값의 히스토그램을 생성하고, 기 설정된 깊이값(A)을 초과하는 깊이 값을 갖는 영역에 대한 깊이 값의 평균을 객체의 깊이로 추정할 수 있다.
이와 같이 본 발명의 실시예에 따른 객체 깊이 추정 방법은 저가의 RGB-D 카메를 통해 RGB 색영상 및 깊이 정보를 획득하여, 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성하고, 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정함으로써, 간단한 방법으로 정확한 깊이 값을 추정할 수 있다.
아울러, 본 발명에 따른 실시예를 설명하는데 있어서, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시 형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.
100 : 객체 깊이 추정 장치
110 : 카메라
120 : 저장부 130 : 제어부
131 : 관심 영역 추출 모듈 132 : 분포도 생성 모듈
133 : 깊이 추정 모듈 200 : 로봇 제어부
300 : 이동 장치
120 : 저장부 130 : 제어부
131 : 관심 영역 추출 모듈 132 : 분포도 생성 모듈
133 : 깊이 추정 모듈 200 : 로봇 제어부
300 : 이동 장치
Claims (7)
- RGB 색영상 및 깊이 정보를 획득하는 단계;
상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하는 단계;
상기 깊이 정보를 이용하여 상기 관심 영역 내에 픽셀에 대한 깊이 값의 분포도를 생성하는 단계;
상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 단계;
를 포함하는 것을 특징으로 하는 객체 깊이 추정 방법. - 제1항에 있어서,
상기 관심 영역을 지정하는 단계는,
딥러닝 기반의 객체 인식을 통해 관심 영역을 지정하는 것을 특징으로 하는 객체 깊이 추정 방법. - 제1항에 있어서,
상기 분포도를 생성하는 단계는,
상기 관심 영역 내에 모든 픽셀에 대한 히스토그램을 통해 분포도를 계산하는 것을 특징으로 하는 객체 깊이 추정 방법. - 제1항에 있어서,
상기 추정하는 단계는,
상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 평균값을 객체의 깊이로 추정하는 것을 특징으로 하는 객체 깊이 추정 방법. - 제1항에 있어서,
상기 획득하는 단계에서,
RGB-D 카메라를 통해 RGB 색영상 및 깊이 정보를 획득하는 것을 특징으로 하는 객체 깊이 추정 방법. - RGB 색영상 및 깊이 정보를 획득하는 카메라;
상기 카메라로부터 획득한 상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하고, 상기 깊이 정보를 이용하여 상기 관심 영역 내에 모든 픽셀에 대한 깊이 값의 분포도를 생성하고, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 제어부;
를 포함하는 것을 특징으로 하는 객체 깊이 추정 장치. - RGB 색영상 및 깊이 정보를 획득하는 카메라, 상기 카메라로부터 획득한 상기 RGB 색영상에서 객체 인식을 통한 관심 영역을 지정하고, 상기 깊이 정보를 이용하여 상기 관심 영역 내에 모든 픽셀에 대한 깊이 값의 분포도를 생성하고, 상기 분포도에서 빈도수가 기 설정된 값보다 높은 영역의 깊이 값을 객체의 깊이로 추정하는 제어부를 포함하는 객체 깊이 추정 장치;
상기 객체 깊이 추정 장치에 의해 객체를 탐지하여 이동을 제어하는 이동 제어부;
를 포함하는 것을 특징으로 하는 이동 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210143207A KR102660089B1 (ko) | 2021-10-26 | 2021-10-26 | 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210143207A KR102660089B1 (ko) | 2021-10-26 | 2021-10-26 | 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230059236A true KR20230059236A (ko) | 2023-05-03 |
KR102660089B1 KR102660089B1 (ko) | 2024-04-23 |
Family
ID=86380587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210143207A KR102660089B1 (ko) | 2021-10-26 | 2021-10-26 | 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102660089B1 (ko) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010036293A1 (en) * | 1998-10-23 | 2001-11-01 | Facet Technology Corporation | System for automatically generating database of objects of interest by analysis of images recorded by moving vehicle |
KR20160041441A (ko) | 2014-10-07 | 2016-04-18 | 주식회사 케이티 | 깊이 카메라 기반 사람 객체를 판별하는 방법 및 장치 |
KR20170115757A (ko) * | 2016-04-08 | 2017-10-18 | 한국과학기술원 | 깊이 정보 생성 장치 및 방법 |
KR20190117838A (ko) * | 2018-03-26 | 2019-10-17 | 한국전자통신연구원 | 객체 인식 시스템 및 그 방법 |
US20200380316A1 (en) * | 2017-03-08 | 2020-12-03 | Zoox, Inc. | Object height estimation from monocular images |
KR20210010092A (ko) * | 2019-07-19 | 2021-01-27 | 한국과학기술연구원 | 검색 데이터베이스를 구축하기 위한 관심영상 선별 방법 및 이를 수행하는 영상 관제 시스템 |
-
2021
- 2021-10-26 KR KR1020210143207A patent/KR102660089B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010036293A1 (en) * | 1998-10-23 | 2001-11-01 | Facet Technology Corporation | System for automatically generating database of objects of interest by analysis of images recorded by moving vehicle |
KR20160041441A (ko) | 2014-10-07 | 2016-04-18 | 주식회사 케이티 | 깊이 카메라 기반 사람 객체를 판별하는 방법 및 장치 |
KR20170115757A (ko) * | 2016-04-08 | 2017-10-18 | 한국과학기술원 | 깊이 정보 생성 장치 및 방법 |
US20200380316A1 (en) * | 2017-03-08 | 2020-12-03 | Zoox, Inc. | Object height estimation from monocular images |
KR20190117838A (ko) * | 2018-03-26 | 2019-10-17 | 한국전자통신연구원 | 객체 인식 시스템 및 그 방법 |
KR20210010092A (ko) * | 2019-07-19 | 2021-01-27 | 한국과학기술연구원 | 검색 데이터베이스를 구축하기 위한 관심영상 선별 방법 및 이를 수행하는 영상 관제 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR102660089B1 (ko) | 2024-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12008778B2 (en) | Information processing apparatus, control method for same, non-transitory computer-readable storage medium, and vehicle driving support system | |
US9877012B2 (en) | Image processing apparatus for estimating three-dimensional position of object and method therefor | |
JP4692371B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム、および画像処理プログラムを記録した記録媒体、ならびに移動物体検出システム | |
US9600898B2 (en) | Method and apparatus for separating foreground image, and computer-readable recording medium | |
WO2019042426A1 (zh) | 增强现实场景的处理方法、设备及计算机存储介质 | |
US20100158387A1 (en) | System and method for real-time face detection using stereo vision | |
EP2570993A2 (en) | Egomotion estimation system and method | |
US20160301912A1 (en) | Disparity value deriving device, movable apparatus, robot, disparity value producing method, and computer program | |
EP2610778A1 (en) | Method of detecting an obstacle and driver assist system | |
US9747690B2 (en) | Image processing device, image processing method, and program | |
US10949984B2 (en) | Object tracking system and method thereof | |
US10346709B2 (en) | Object detecting method and object detecting apparatus | |
KR101699014B1 (ko) | 스테레오 카메라를 이용한 객체 검출 방법 및 장치 | |
US9947106B2 (en) | Method and electronic device for object tracking in a light-field capture | |
EP3009983A1 (en) | Obstacle detection apparatus and method | |
US10572753B2 (en) | Outside recognition device for vehicle | |
KR102660089B1 (ko) | 객체 깊이 추정 방법 및 장치, 이를 이용한 이동 장치 | |
KR101696086B1 (ko) | 소나 이미지 내의 물체 부분 추출 방법 및 장치 | |
KR102188164B1 (ko) | 3차원 데이터를 이용한 도로 인식 방법 | |
CN111368883A (zh) | 基于单目摄像头的避障方法、计算装置及存储装置 | |
Yang et al. | Design flow of motion based single camera 3D mapping | |
JP6606340B2 (ja) | 画像検出装置、画像検出方法およびプログラム | |
Stock et al. | Subpixel corner detection for tracking applications using cmos camera technology | |
KR20200079070A (ko) | 동영상에서 근접해오는 차량 검출 시스템 및 그 방법 | |
US12033335B2 (en) | Motion estimation device and motion estimation method using motion estimation device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |