KR102551550B1 - 오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 - Google Patents
오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR102551550B1 KR102551550B1 KR1020180046072A KR20180046072A KR102551550B1 KR 102551550 B1 KR102551550 B1 KR 102551550B1 KR 1020180046072 A KR1020180046072 A KR 1020180046072A KR 20180046072 A KR20180046072 A KR 20180046072A KR 102551550 B1 KR102551550 B1 KR 102551550B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- frame
- electronic device
- video
- voice
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 150
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000004891 communication Methods 0.000 claims description 28
- 230000000977 initiatory effect Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 238000010801 machine learning Methods 0.000 abstract description 8
- 238000013135 deep learning Methods 0.000 abstract description 5
- 239000003795 chemical substances by application Substances 0.000 description 20
- 238000010586 diagram Methods 0.000 description 17
- 238000012549 training Methods 0.000 description 16
- 238000011156 evaluation Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000002583 angiography Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47202—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Acoustics & Sound (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Library & Information Science (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
Abstract
Description
도 2a는 본 개시의 일 실시예에 따른, 전자 장치의 구성을 간략히 도시한 블록도,
도 2b는 본 개시의 일 실시예에 따른, 전자 장치의 구성을 상세히 도시한 블록도,
도 3 내지 도 5는 본 개시의 다양한 실시예에 따른, 동영상을 재생하는 동안 동영상에 포함된 오브젝트에 대한 정보를 제공하는 방법을 설명하기 위한 흐름도들,
도 6 및 도 7은 본 개시의 다양한 실시예에 따른, 동영상을 재생하는 동안 동영상에 포함된 오브젝트에 대한 정보를 제공하는 방법을 설명하기 위한 도면들,
도 8a 및 도 8b는 본 개시의 다양한 실시예에 따른, 동영상을 재생하는 동안 동영상에 포함된 오브젝트에 대한 정보를 제공하는 실시예를 도시한 도면들,
도 9a 및 도 9b는 본 개시의 다양한 실시예에 따른, 오브젝트에 대한 확인 또는 추가 문의를 위한 UI를 도시한 도면들,
도 10은 본 개시의 일 실시예에 따른, 전자 장치의 제어 방법을 설명하기 위한 흐름도,
도 11은 본 개시의 일 실시예에 따른, 인공지능 모델을 학습하고 이용하기 위한 전자 장치의 구성을 나타내는 블록도,
도 12a 및 도 12b는 본 개시의 일 실시예에 따른, 학습부 및 인식부의 구체적인 구성을 나타내는 블록도, 그리고,
도 13 및 도 14는 본 개시의 다양한 실시예에 따른, 인공지능 모델을 이용하는 네트워크 시스템의 흐름도,
도 15는 본 개시의 일 실시예에 따른, 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
130: 마이크 140: 메모리
150: 프로세서 160; 카메라
170: 오디오 출력부 180: 입력부
Claims (20)
- 전자 장치의 제어 방법에 있어서,
동영상을 재생하는 단계;
상기 동영상을 재생하는 동안 제1 시간 동안 재생된 복수의 프레임을 저장하는 단계;
상기 동영상의 제1 프레임이 재생되는 동안 상기 동영상에 디스플레이된 오브젝트에 대한 정보를 문의하는 사용자 음성 명령을 입력받는 단계;
상기 오브젝트에 대한 정보를 문의하는 사용자 음성 명령이 입력되면, 상기 사용자 음성이 수신된 시점에 기초하여 제2 프레임을 선택하는 단계;
상기 제2 프레임에 기초하여 오브젝트를 결정하는 단계;
상기 제2 프레임 및 상기 음성 명령에 기초하여 상기 결정된 오브젝트에 대응되는 키워드를 획득하는 단계; 및
상기 키워드에 기초하여 검색 결과를 제공하는 단계;를 포함하며,
상기 제2 프레임은 상기 저장된 복수의 프레임 중 하나이며, 상기 음성 명령을 수신하기 시작하는 시점 이전에 제2 시간 동안 재생되는 프레임인 제어 방법. - 제1항에 있어서,
상기 제2 프레임을 인공지능 알고리즘을 통해 학습된 인공지능 모델에 입력하여 상기 프레임 내에 포함된 복수의 오브젝트에 대한 정보를 획득하는 단계;를 포함하는 제어 방법. - 제2항에 있어서,
상기 사용자 음성 명령은,
상기 제2 프레임에 포함된 오브젝트에 대한 정보 문의를 개시하기 위한 트리거 음성 및 상기 오브젝트에 대한 정보를 문의하는 문의 음성을 포함하는 제어 방법. - 제2항에 있어서,
상기 복수의 프레임 각각은 영상 프레임 및 오디오 프레임을 포함하며,
상기 저장하는 단계는,
상기 복수의 프레임 각각의 영상 프레임과 오디오 프레임을 매칭하여 저장하고,
상기 복수의 오브젝트에 대한 정보를 획득하는 단계는,
상기 영상 프레임 및 상기 오디오 프레임 중 적어도 하나를 상기 인공지능 모델에 입력하여 상기 제2 프레임 내에 포함된 복수의 오브젝트에 대한 정보를 획득하는 제어 방법. - 제2항에 있어서,
상기 복수의 오브젝트에 대한 정보를 상기 복수의 오브젝트가 나온 영상 프레임과 매칭하여 저장하는 단계;를 포함하는 제어 방법. - 제3항에 있어서,
상기 결정하는 단계는
상기 복수의 오브젝트에 대한 정보 중 상기 문의 음성에 대응되는 오브젝트에 대한 정보를 결정하고,
상기 제공하는 단계는,
상기 결정된 오브젝트에 대한 정보를 외부 검색 서버에 전송하여 획득된 검색 결과를 제공하는 제어 방법. - 제6항에 있어서,
상기 결정하는 단계는,
상기 복수의 오브젝트에 대한 정보 중 상기 문의 음성에 대응되는 오브젝트에 대한 정보가 맞는지 여부를 확인하거나 추가적인 정보를 문의하기 위한 추가 질의가 있는지 여부를 확인하는 UI를 표시하는 단계;를 더 포함하는 제어 방법. - 제1항에 있어서,
상기 제공하는 단계는,
상기 동영상이 재생되는 동안 상기 동영상의 일 영역 상에 상기 검색 결과와 상기 검색 결과에 대응되는 상기 제2 프레임을 제공하는 제어 방법. - 제1항에 있어서,
프레임에 대한 정보를 획득하기 위한 외부 서버에 상기 획득된 프레임을 전송하는 단계; 및
상기 외부 서버로부터 상기 획득된 프레임에 대한 정보를 획득하는 단계;를 포함하는 제어 방법. - 제9항에 있어서,
상기 획득된 프레임에 대한 정보는,
상기 외부 서버가 상기 프레임 속에 포함된 핑거 프린터를 인식하여 획득된 것을 특징으로 하는 제어 방법. - 전자 장치에 있어서,
디스플레이;
통신부;
마이크;
적어도 하나의 명령을 포함하는 메모리; 및
상기 디스플레이, 상기 통신부, 상기 마이크 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 프로세서;를 포함하며,
상기 프로세서는, 상기 적어도 하나의 명령을 실행함으로써,
동영상을 재생하는 동안 제1 시간 동안 재생된 복수의 프레임을 상기 메모리에 저장하고,
상기 동영상의 제1 프레임이 재생되는 동안 상기 동영상에 디스플레이된 오브젝트에 대한 정보를 문의하는 사용자 음성 명령이 수신되면, 상기 사용자 음성이 수신된 시점에 기초하여 제2 프레임을 선택하고,
상기 제2 프레임에 기초하여 오브젝트를 결정하고,
상기 제2 프레임 및 상기 음성 명령에 기초하여 상기 결정된 오브젝트에 대응되는 키워드를 획득하고,
상기 키워드에 기초하여 검색 결과를 제공하며,
상기 제2 프레임은 상기 저장된 복수의 프레임 중 하나이며, 상기 음성 명령을 수신하기 시작하는 시점 이전에 제2 시간 동안 재생되는 프레임인 전자 장치. - 제11항에 있어서,
상기 프로세서는,
상기 제2 프레임을 인공지능 알고리즘을 통해 학습된 인공지능 모델에 입력하여 상기 프레임 내에 포함된 복수의 오브젝트에 대한 정보를 획득하는 전자 장치. - 제12항에 있어서,
상기 사용자 음성 명령은,
상기 제2 프레임에 포함된 오브젝트에 대한 정보 문의를 개시하기 위한 트리거 음성 및 상기 오브젝트에 대한 정보를 문의하는 문의 음성을 포함하는 전자 장치. - 제12항에 있어서,
상기 복수의 프레임 각각은 영상 프레임 및 오디오 프레임을 포함하며,
상기 메모리는,
상기 복수의 프레임 각각의 영상 프레임과 오디오 프레임을 매칭하여 저장하고,
상기 프로세서는,
상기 영상 프레임 및 상기 오디오 프레임 중 적어도 하나를 상기 인공지능 모델에 입력하여 상기 제2 프레임 내에 포함된 복수의 오브젝트에 대한 정보를 획득하는 전자 장치. - 제12항에 있어서,
상기 프로세서는,
상기 복수의 오브젝트에 대한 정보를 상기 복수의 오브젝트가 나온 영상 프레임과 매칭하여 상기 메모리에 저장하는 전자 장치. - 제13항에 있어서,
상기 프로세서는,
상기 복수의 오브젝트에 대한 정보 중 상기 문의 음성에 대응되는 오브젝트에 대한 정보를 결정하고,
상기 통신부를 통해 상기 결정된 오브젝트에 대한 정보를 외부 검색 서버에 전송하여 획득된 검색 결과를 제공하는 전자 장치. - 제16항에 있어서,
상기 프로세서는,
상기 복수의 오브젝트에 대한 정보 중 상기 문의 음성에 대응되는 오브젝트에 대한 정보가 맞는지 여부를 확인하거나 추가적인 정보를 문의하기 위한 추가 질의가 있는지 여부를 확인하는 UI를 표시하도록 상기 디스플레이를 제어하는 전자 장치. - 제11항에 있어서,
상기 프로세서는,
상기 동영상이 재생되는 동안 상기 동영상의 일 영역 상에 상기 검색 결과와 상기 검색 결과에 대응되는 상기 제2 프레임을 제공하는 전자 장치. - 제11항에 있어서,
상기 프로세서는,
프레임에 대한 정보를 획득하기 위한 외부 서버에 상기 획득된 프레임을 전송하도록 상기 통신부를 제어하고,
상기 외부 서버로부터 상기 획득된 프레임에 대한 정보를 획득하는 전자 장치. - 제19항에 있어서,
상기 획득된 프레임에 대한 정보는,
상기 외부 서버가 상기 프레임 속에 포함된 핑거 프린터를 인식하여 획득된 것을 특징으로 하는 전자 장치.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180046072A KR102551550B1 (ko) | 2018-04-20 | 2018-04-20 | 오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 |
US16/369,142 US11954150B2 (en) | 2018-04-20 | 2019-03-29 | Electronic device and method for controlling the electronic device thereof |
PCT/KR2019/004173 WO2019203488A1 (en) | 2018-04-20 | 2019-04-09 | Electronic device and method for controlling the electronic device thereof |
CN201910298649.9A CN110390034A (zh) | 2018-04-20 | 2019-04-15 | 电子设备和用于控制该电子设备的方法 |
EP22168571.2A EP4050497A1 (en) | 2018-04-20 | 2019-04-16 | Electronic device and method for controlling the electronic device thereof |
EP19169593.1A EP3557441A1 (en) | 2018-04-20 | 2019-04-16 | Electronic device and method for controlling the electronic device thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180046072A KR102551550B1 (ko) | 2018-04-20 | 2018-04-20 | 오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190122377A KR20190122377A (ko) | 2019-10-30 |
KR102551550B1 true KR102551550B1 (ko) | 2023-07-06 |
Family
ID=66217809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180046072A KR102551550B1 (ko) | 2018-04-20 | 2018-04-20 | 오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11954150B2 (ko) |
EP (2) | EP3557441A1 (ko) |
KR (1) | KR102551550B1 (ko) |
CN (1) | CN110390034A (ko) |
WO (1) | WO2019203488A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108012173B (zh) * | 2017-11-16 | 2021-01-22 | 百度在线网络技术(北京)有限公司 | 一种内容识别方法、装置、设备和计算机存储介质 |
US11062147B2 (en) * | 2019-10-25 | 2021-07-13 | 7-Eleven, Inc. | Object assignment during image tracking |
US11468071B2 (en) | 2018-11-30 | 2022-10-11 | Rovi Guides, Inc. | Voice query refinement to embed context in a voice query |
US11200892B1 (en) * | 2018-12-10 | 2021-12-14 | Amazon Technologies, Inc. | Speech-enabled augmented reality user interface |
US11227593B2 (en) * | 2019-06-28 | 2022-01-18 | Rovi Guides, Inc. | Systems and methods for disambiguating a voice search query based on gestures |
CN110880323B (zh) * | 2019-12-05 | 2023-02-21 | 广东小天才科技有限公司 | 一种处理方法、家教机、计算机设备和存储介质 |
JP2022110509A (ja) * | 2021-01-18 | 2022-07-29 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
KR102510052B1 (ko) * | 2022-08-19 | 2023-03-14 | (주)페르소나에이아이 | 인공지능 모델이 결합된 자동 호출 서비스를 제공하는 전자 장치 |
WO2024087125A1 (zh) * | 2022-10-27 | 2024-05-02 | 北京小米移动软件有限公司 | 算法更新方法、装置 |
CN116431855B (zh) * | 2023-06-13 | 2023-10-20 | 荣耀终端有限公司 | 图像检索方法和相关设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180005047A1 (en) * | 2016-06-30 | 2018-01-04 | Beijing Kuangshi Technology Co., Ltd. | Video monitoring method and video monitoring device |
WO2018043990A1 (ko) * | 2016-08-29 | 2018-03-08 | 오드컨셉 주식회사 | 영상 검색 정보 제공 방법, 장치 및 컴퓨터 프로그램 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11305983A (ja) * | 1998-04-23 | 1999-11-05 | Victor Co Of Japan Ltd | 音声制御画像スクリーン表示システム |
US7680324B2 (en) | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
KR100719623B1 (ko) | 2005-06-30 | 2007-05-17 | 주식회사 알티캐스트 | 연동형 데이터방송에서의 ppl 광고 데이터의 효율적제공방법 |
US20080295129A1 (en) * | 2007-05-21 | 2008-11-27 | Steven Laut | System and method for interactive video advertising |
KR101022285B1 (ko) | 2008-05-07 | 2011-03-21 | 주식회사 케이티 | 동영상 객체정보 서비스 제공 방법 및 시스템 |
KR100958302B1 (ko) | 2008-06-19 | 2010-05-19 | 주식회사 아론티 | 데이터방송에서 객체정보 제공방법 |
US10070201B2 (en) | 2010-12-23 | 2018-09-04 | DISH Technologies L.L.C. | Recognition of images within a video based on a stored representation |
KR102084630B1 (ko) | 2012-07-26 | 2020-03-05 | 삼성전자주식회사 | 질문 메시지 전송 방법 및 이를 위한 디스플레이 장치, 정보 공유 방법 및 모바일 기기 |
KR102024168B1 (ko) * | 2012-11-27 | 2019-09-23 | 삼성전자주식회사 | 컨텐츠 인식 서버, 단말 장치를 포함하는 컨텐츠 연관 정보 제공 시스템 및 그 제어 방법 |
KR102090269B1 (ko) | 2012-12-14 | 2020-03-17 | 삼성전자주식회사 | 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체 |
US9852511B2 (en) * | 2013-01-22 | 2017-12-26 | Qualcomm Incoporated | Systems and methods for tracking and detecting a target object |
US20140255003A1 (en) * | 2013-03-05 | 2014-09-11 | Google Inc. | Surfacing information about items mentioned or presented in a film in association with viewing the film |
US20150296250A1 (en) * | 2014-04-10 | 2015-10-15 | Google Inc. | Methods, systems, and media for presenting commerce information relating to video content |
KR20150136312A (ko) | 2014-05-27 | 2015-12-07 | 삼성전자주식회사 | 디스플레이 장치 및 이의 정보 제공 방법 |
KR102206184B1 (ko) | 2014-09-12 | 2021-01-22 | 삼성에스디에스 주식회사 | 동영상 내 객체 관련 정보 검색 방법 및 동영상 재생 장치 |
KR101720685B1 (ko) | 2014-11-04 | 2017-04-10 | 한국전자통신연구원 | 웹 데이터 기반 방송 콘텐츠 객체 식별 검증 장치 및 방법 |
US9762934B2 (en) | 2014-11-04 | 2017-09-12 | Electronics And Telecommunications Research Institute | Apparatus and method for verifying broadcast content object identification based on web data |
KR20160071732A (ko) * | 2014-12-12 | 2016-06-22 | 삼성전자주식회사 | 음성 입력을 처리하는 방법 및 장치 |
TWI550421B (zh) | 2015-03-06 | 2016-09-21 | 視頻搜尋方法與系統 | |
CN106162355A (zh) | 2015-04-10 | 2016-11-23 | 北京云创视界科技有限公司 | 视频交互方法及终端 |
WO2017166098A1 (en) | 2016-03-30 | 2017-10-05 | Xiaogang Wang | A method and a system for detecting an object in a video |
CN109690607B (zh) * | 2016-10-25 | 2023-07-21 | 猫头鹰照相机股份有限公司 | 基于视频的数据收集、图像捕获以及分析配置 |
KR20180046072A (ko) | 2016-10-27 | 2018-05-08 | 대우조선해양 주식회사 | 대유량 제어가 가능한 유압 장치 및 이를 이용한 대유량 제어 방법 |
US20190027147A1 (en) * | 2017-07-18 | 2019-01-24 | Microsoft Technology Licensing, Llc | Automatic integration of image capture and recognition in a voice-based query to understand intent |
WO2019030551A1 (en) * | 2017-08-08 | 2019-02-14 | Milstein Mark | METHOD FOR APPLYING METADATA TO IMMERSIVE MULTIMEDIA FILES |
US11869237B2 (en) * | 2017-09-29 | 2024-01-09 | Sony Interactive Entertainment Inc. | Modular hierarchical vision system of an autonomous personal companion |
US10182271B1 (en) * | 2017-12-20 | 2019-01-15 | Rovi Guides, Inc. | Systems and methods for playback of summary media content |
-
2018
- 2018-04-20 KR KR1020180046072A patent/KR102551550B1/ko active IP Right Grant
-
2019
- 2019-03-29 US US16/369,142 patent/US11954150B2/en active Active
- 2019-04-09 WO PCT/KR2019/004173 patent/WO2019203488A1/en active Application Filing
- 2019-04-15 CN CN201910298649.9A patent/CN110390034A/zh active Pending
- 2019-04-16 EP EP19169593.1A patent/EP3557441A1/en not_active Ceased
- 2019-04-16 EP EP22168571.2A patent/EP4050497A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180005047A1 (en) * | 2016-06-30 | 2018-01-04 | Beijing Kuangshi Technology Co., Ltd. | Video monitoring method and video monitoring device |
WO2018043990A1 (ko) * | 2016-08-29 | 2018-03-08 | 오드컨셉 주식회사 | 영상 검색 정보 제공 방법, 장치 및 컴퓨터 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
EP3557441A1 (en) | 2019-10-23 |
EP4050497A1 (en) | 2022-08-31 |
US20190325224A1 (en) | 2019-10-24 |
US11954150B2 (en) | 2024-04-09 |
WO2019203488A1 (en) | 2019-10-24 |
KR20190122377A (ko) | 2019-10-30 |
CN110390034A (zh) | 2019-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102551550B1 (ko) | 오브젝트에 대한 정보를 검색하기 위한 전자 장치 및 이의 제어 방법 | |
US11671386B2 (en) | Electronic device and method for changing chatbot | |
US11574116B2 (en) | Apparatus and method for providing summarized information using an artificial intelligence model | |
KR102718120B1 (ko) | 인공지능을 이용한 음성 대화 분석 방법 및 장치 | |
KR102542049B1 (ko) | 인공지능 학습모델을 이용하여 요약 정보를 제공하기 위한 전자 장치 및 이의 제어 방법 | |
KR102599947B1 (ko) | 관련 이미지를 검색하기 위한 전자 장치 및 이의 제어 방법 | |
KR102473447B1 (ko) | 인공지능 모델을 이용하여 사용자 음성을 변조하기 위한 전자 장치 및 이의 제어 방법 | |
US20190042574A1 (en) | Electronic device and method for controlling the electronic device | |
KR20200048201A (ko) | 전자 장치 및 이의 제어 방법 | |
KR102700003B1 (ko) | 전자 장치 및 그 제어 방법 | |
US11721333B2 (en) | Electronic apparatus and control method thereof | |
KR102469717B1 (ko) | 오브젝트에 대한 검색 결과를 제공하기 위한 전자 장치 및 이의 제어 방법 | |
KR20200046185A (ko) | 전자 장치 및 이의 제어 방법 | |
KR20200010131A (ko) | 전자 장치 및 그의 제어 방법 | |
KR20190118108A (ko) | 전자 장치 및 그의 제어방법 | |
US11763690B2 (en) | Electronic apparatus and controlling method thereof | |
KR102398386B1 (ko) | 복수 개의 메시지들을 필터링하는 방법 및 이를 위한 장치 | |
KR20200115695A (ko) | 전자 장치 및 이의 제어 방법 | |
US20210337274A1 (en) | Artificial intelligence apparatus and method for providing visual information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180420 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210407 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20180420 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220715 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20230121 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230417 |
|
PG1601 | Publication of registration |