[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2024075947A1 - 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법 - Google Patents

객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법 Download PDF

Info

Publication number
WO2024075947A1
WO2024075947A1 PCT/KR2023/010321 KR2023010321W WO2024075947A1 WO 2024075947 A1 WO2024075947 A1 WO 2024075947A1 KR 2023010321 W KR2023010321 W KR 2023010321W WO 2024075947 A1 WO2024075947 A1 WO 2024075947A1
Authority
WO
WIPO (PCT)
Prior art keywords
processor
image
electronic device
main object
information
Prior art date
Application number
PCT/KR2023/010321
Other languages
English (en)
French (fr)
Inventor
김대희
김범수
김성오
염동현
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220160744A external-priority patent/KR20240047275A/ko
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2024075947A1 publication Critical patent/WO2024075947A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays

Definitions

  • Various embodiments disclosed in this document relate to an electronic device that generates an image query for object search and a method of operating the electronic device.
  • AR glass augmented reality glass
  • HMD device similar to glasses
  • AR glasses is a next-generation personal device and is being developed for various functions that can be applied to AR glasses.
  • the query image search method is a technology that searches for a specific object in an image using deep learning.
  • a specific object area can be extracted from a camera or a stored video image, and information about the object can be extracted by transmitting the specific object area and video information to the server.
  • accurate search results may not be obtained depending on the placement of each object. For example, if you want to retrieve information about the "shirt” a model is wearing in an image, the electronic device would isolate an area for "shirt” in the image, send "shirt” to the server, and the server would then retrieve "shirt”. Information about can be transmitted to an electronic device. At this time, if the “shirt” is obscured by other coordination items such as a cardigan or jacket, accurate search results may not be obtained.
  • Electronic devices include a camera, a communication module, and a processor, wherein the processor extracts a part of the image including an object from an image obtained from the camera and searches among objects in the image. determines a main object that is the target of, determines, among other objects in the image, an object associated with the main object as an auxiliary object, and includes a part of the image including the main object and/or the auxiliary object, An image query containing a request for information related to a main object may be generated, and the image query may be transmitted to a server using the communication module.
  • a method of operating an electronic device includes extracting a part of the image including an object from an image obtained from a camera, and determining a main object that is a search target among the objects in the image.
  • the electronic device includes a camera, a communication module, and a processor, and the processor selects an image including an object from an image obtained from the camera. Extract a part of the object, determine the main object that is the target of search among the objects in the image, determine an object associated with the main object among other objects in the image as an auxiliary object, and determine the main object and/or the auxiliary object. Generate an image query including a portion of an image containing an object, transmit the image query to a server using the communication module, and the server retrieves information related to the main object based on the image query, Information related to the main object that is the search result may be transmitted to the electronic device.
  • Electronic devices can expand the scope of the pool for image search and increase the accuracy of results.
  • the electronic device can auxiliary use information about objects related to the object to be searched, thereby increasing the accuracy of the results.
  • an electronic device can auxiliary use the user's location information to increase the accuracy of results for an object to be searched.
  • FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments.
  • FIG. 2A is a diagram illustrating the configuration of an electronic device according to various embodiments.
  • FIG. 2B is a block diagram of an electronic device according to various embodiments.
  • FIG. 3 is a flowchart illustrating a method in which a processor generates an image query for an object and displays information, according to various embodiments.
  • FIG. 4A is a flowchart illustrating a method by which a processor generates an image query for an object according to various embodiments.
  • FIG. 4B is a diagram illustrating an example of a processor determining a main object and an auxiliary object according to various embodiments.
  • FIG. 4C is a diagram illustrating an example of a processor determining a main object and an auxiliary object according to various embodiments.
  • FIG. 4D is a diagram illustrating an example of a processor determining a main object and an auxiliary object according to various embodiments.
  • FIG. 4E is a diagram illustrating an example of a processor determining a main object and an auxiliary object according to various embodiments.
  • FIG. 5 is a flowchart illustrating a method by which a processor confirms information related to an object based on location information, according to various embodiments.
  • Figure 6 is a flowchart illustrating a method by which a server searches for an object according to various embodiments.
  • FIG. 7 is a flowchart illustrating a method for a processor to search for an object of interest according to various embodiments.
  • an electronic device may search information about an object using a query image created by separating the object to be searched from the image.
  • the electronic device can be used for search using not only the object to be searched but also auxiliary objects related to the object to be searched. This is because related items are often matched together, and even data in which related items are simultaneously matched in the database can be used for search, thereby increasing the accuracy of the search as the pool of search targets increases. For example, if A shirt and B jacket are often coordinated together, the accuracy of the search for A shirt can be increased by providing auxiliary information about not only A shirt but also B jacket during image search.
  • an electronic device may add information about an object to be searched by referring to the user's location. For example, when a user is located at “Store A” in a shopping mall, the electronic device can use more information related to “Brand A” for the object to be searched, thereby improving the accuracy of the search.
  • FIG. 1 is a block diagram of an electronic device 101 in a network environment 100, according to various embodiments.
  • the electronic device 101 communicates with the electronic device 102 through a first network 198 (e.g., a short-range wireless communication network) or a second network 199. It is possible to communicate with at least one of the electronic device 104 or the server 108 through (e.g., a long-distance wireless communication network). According to one embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108.
  • a first network 198 e.g., a short-range wireless communication network
  • a second network 199 e.g., a second network 199.
  • the electronic device 101 may communicate with the electronic device 104 through the server 108.
  • the electronic device 101 includes a processor 120, a memory 130, an input module 150, an audio output module 155, a display module 160, an audio module 170, and a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or may include an antenna module 197.
  • at least one of these components eg, the connection terminal 178) may be omitted or one or more other components may be added to the electronic device 101.
  • some of these components e.g., sensor module 176, camera module 180, or antenna module 197) are integrated into one component (e.g., display module 160). It can be.
  • the processor 120 for example, executes software (e.g., program 140) to operate at least one other component (e.g., hardware or software component) of the electronic device 101 connected to the processor 120. It can be controlled and various data processing or calculations can be performed. According to one embodiment, as at least part of data processing or computation, the processor 120 stores instructions or data received from another component (e.g., sensor module 176 or communication module 190) in volatile memory 132. The commands or data stored in the volatile memory 132 can be processed, and the resulting data can be stored in the non-volatile memory 134.
  • software e.g., program 140
  • the processor 120 stores instructions or data received from another component (e.g., sensor module 176 or communication module 190) in volatile memory 132.
  • the commands or data stored in the volatile memory 132 can be processed, and the resulting data can be stored in the non-volatile memory 134.
  • the processor 120 includes the main processor 121 (e.g., a central processing unit or an application processor) or an auxiliary processor 123 that can operate independently or together (e.g., a graphics processing unit, a neural network processing unit ( It may include a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
  • the main processor 121 e.g., a central processing unit or an application processor
  • an auxiliary processor 123 e.g., a graphics processing unit, a neural network processing unit ( It may include a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor.
  • the electronic device 101 includes a main processor 121 and a secondary processor 123
  • the secondary processor 123 may be set to use lower power than the main processor 121 or be specialized for a designated function. You can.
  • the auxiliary processor 123 may be implemented separately from the main processor 121 or as part of it.
  • the auxiliary processor 123 may, for example, act on behalf of the main processor 121 while the main processor 121 is in an inactive (e.g., sleep) state, or while the main processor 121 is in an active (e.g., application execution) state. ), together with the main processor 121, at least one of the components of the electronic device 101 (e.g., the display module 160, the sensor module 176, or the communication module 190) At least some of the functions or states related to can be controlled.
  • coprocessor 123 e.g., image signal processor or communication processor
  • may be implemented as part of another functionally related component e.g., camera module 180 or communication module 190. there is.
  • the auxiliary processor 123 may include a hardware structure specialized for processing artificial intelligence models.
  • Artificial intelligence models can be created through machine learning. For example, such learning may be performed in the electronic device 101 itself on which the artificial intelligence model is performed, or may be performed through a separate server (e.g., server 108).
  • Learning algorithms may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but It is not limited.
  • An artificial intelligence model may include multiple artificial neural network layers.
  • Artificial neural networks include deep neural network (DNN), convolutional neural network (CNN), recurrent neural network (RNN), restricted boltzmann machine (RBM), belief deep network (DBN), bidirectional recurrent deep neural network (BRDNN), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the examples described above.
  • artificial intelligence models may additionally or alternatively include software structures.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176) of the electronic device 101. Data may include, for example, input data or output data for software (e.g., program 140) and instructions related thereto.
  • Memory 130 may include volatile memory 132 or non-volatile memory 134.
  • the program 140 may be stored as software in the memory 130 and may include, for example, an operating system 142, middleware 144, or application 146.
  • the input module 150 may receive commands or data to be used in a component of the electronic device 101 (e.g., the processor 120) from outside the electronic device 101 (e.g., a user).
  • the input module 150 may include, for example, a microphone, mouse, keyboard, keys (eg, buttons), or digital pen (eg, stylus pen).
  • the sound output module 155 may output sound signals to the outside of the electronic device 101.
  • the sound output module 155 may include, for example, a speaker or a receiver. Speakers can be used for general purposes such as multimedia playback or recording playback.
  • the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
  • the display module 160 can visually provide information to the outside of the electronic device 101 (eg, a user).
  • the display module 160 may include, for example, a display, a hologram device, or a projector, and a control circuit for controlling the device.
  • the display module 160 may include a touch sensor configured to detect a touch, or a pressure sensor configured to measure the intensity of force generated by the touch.
  • the audio module 170 can convert sound into an electrical signal or, conversely, convert an electrical signal into sound. According to one embodiment, the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device (e.g., directly or wirelessly connected to the electronic device 101). Sound may be output through the electronic device 102 (e.g., speaker or headphone).
  • the electronic device 102 e.g., speaker or headphone
  • the sensor module 176 detects the operating state (e.g., power or temperature) of the electronic device 101 or the external environmental state (e.g., user state) and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 176 includes, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, humidity sensor, or light sensor.
  • the interface 177 may support one or more designated protocols that can be used to connect the electronic device 101 directly or wirelessly with an external electronic device (eg, the electronic device 102).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 can convert electrical signals into mechanical stimulation (e.g., vibration or movement) or electrical stimulation that the user can perceive through tactile or kinesthetic senses.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 can capture still images and moving images.
  • the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 can manage power supplied to the electronic device 101.
  • the power management module 188 may be implemented as at least a part of, for example, a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101.
  • the battery 189 may include, for example, a non-rechargeable primary battery, a rechargeable secondary battery, or a fuel cell.
  • Communication module 190 is configured to provide a direct (e.g., wired) communication channel or wireless communication channel between electronic device 101 and an external electronic device (e.g., electronic device 102, electronic device 104, or server 108). It can support establishment and communication through established communication channels. Communication module 190 operates independently of processor 120 (e.g., an application processor) and may include one or more communication processors that support direct (e.g., wired) communication or wireless communication.
  • processor 120 e.g., an application processor
  • the communication module 190 may be a wireless communication module 192 (e.g., a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (e.g., : LAN (local area network) communication module, or power line communication module) may be included.
  • a wireless communication module 192 e.g., a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 e.g., : LAN (local area network) communication module, or power line communication module
  • the corresponding communication module is a first network 198 (e.g., a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (e.g., legacy It may communicate with an external electronic device 104 through a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (e.g., LAN or WAN).
  • a telecommunication network such as a cellular network, a 5G network, a next-generation communication network
  • the wireless communication module 192 uses subscriber information (e.g., International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199.
  • subscriber information e.g., International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the wireless communication module 192 may support 5G networks after 4G networks and next-generation communication technologies, for example, NR access technology (new radio access technology).
  • NR access technology provides high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low latency). -latency communications)) can be supported.
  • the wireless communication module 192 may support high frequency bands (eg, mmWave bands), for example, to achieve high data rates.
  • the wireless communication module 192 uses various technologies to secure performance in high frequency bands, for example, beamforming, massive array multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. It can support technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna.
  • the wireless communication module 192 may support various requirements specified in the electronic device 101, an external electronic device (e.g., electronic device 104), or a network system (e.g., second network 199).
  • the wireless communication module 192 supports Peak data rate (e.g., 20 Gbps or more) for realizing eMBB, loss coverage (e.g., 164 dB or less) for realizing mmTC, or U-plane latency (e.g., 164 dB or less) for realizing URLLC.
  • Peak data rate e.g., 20 Gbps or more
  • loss coverage e.g., 164 dB or less
  • U-plane latency e.g., 164 dB or less
  • the antenna module 197 may transmit or receive signals or power to or from the outside (eg, an external electronic device).
  • the antenna module 197 may include an antenna including a radiator made of a conductor or a conductive pattern formed on a substrate (eg, PCB).
  • the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is connected to the plurality of antennas by, for example, the communication module 190. can be selected Signals or power may be transmitted or received between the communication module 190 and an external electronic device through the at least one selected antenna.
  • other components eg, radio frequency integrated circuit (RFIC) may be additionally formed as part of the antenna module 197.
  • RFIC radio frequency integrated circuit
  • a mmWave antenna module includes: a printed circuit board, an RFIC disposed on or adjacent to a first side (e.g., bottom side) of the printed circuit board and capable of supporting a designated high frequency band (e.g., mmWave band); And a plurality of antennas (e.g., array antennas) disposed on or adjacent to the second side (e.g., top or side) of the printed circuit board and capable of transmitting or receiving signals in the designated high frequency band. can do.
  • a first side e.g., bottom side
  • a designated high frequency band e.g., mmWave band
  • a plurality of antennas e.g., array antennas
  • peripheral devices e.g., bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • signal e.g. commands or data
  • commands or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199.
  • Each of the external electronic devices 102 or 104 may be of the same or different type as the electronic device 101.
  • all or part of the operations performed in the electronic device 101 may be executed in one or more of the external electronic devices 102, 104, or 108.
  • the electronic device 101 may perform the function or service instead of executing the function or service on its own.
  • one or more external electronic devices may be requested to perform at least part of the function or service.
  • One or more external electronic devices that have received the request may execute at least part of the requested function or service, or an additional function or service related to the request, and transmit the result of the execution to the electronic device 101.
  • the electronic device 101 may process the result as is or additionally and provide it as at least part of a response to the request.
  • cloud computing distributed computing, mobile edge computing (MEC), or client-server computing technology can be used.
  • the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 104 may include an Internet of Things (IoT) device.
  • Server 108 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 104 or server 108 may be included in the second network 199.
  • the electronic device 101 may be applied to intelligent services (e.g., smart home, smart city, smart car, or healthcare) based on 5G communication technology and IoT-related technology.
  • FIG. 2A shows an electronic device according to various embodiments. This is a diagram showing the configuration of 200 (eg, the electronic device 101 in FIG. 1).
  • the electronic device 200 may be manufactured to be worn on the user's head.
  • the electronic device 200 may be implemented in the form of at least one of glasses, goggles, a helmet, or a hat, but is not limited thereto.
  • the electronic device 200 includes both eyes of the user (e.g., left eye and/or right eye), a plurality of transparent members corresponding to each (e.g., first transparent member 220 and/or second transparent member) (230)).
  • the electronic device 200 may provide images related to an augmented reality (AR) service to the user.
  • AR augmented reality
  • the electronic device 200 projects or displays a virtual object on the first transparent member 220 and/or the second transparent member 230, so that the user can use the first transparent member 220 of the electronic device.
  • at least one virtual object may be visible overlapping the reality perceived through the second transparent member 230.
  • the electronic device 200 includes a main body 223, a support part (e.g., a first support part 221, a second support part 222), and a hinge part (e.g., a first support part 222). It may include a hinge portion 240-1 and a second hinge portion 240-2.
  • the main body portion 223 and the support portions 221 and 222 may be operatively connected through hinge portions 240-1 and 240-2.
  • the main body 223 may include a portion formed to be at least partially placed on the user's nose.
  • the supports 221 and 222 may include a support member that can be worn over the user's ears.
  • the support parts 221 and 222 may include a first support part 221 mounted on the left ear and/or a second support part 222 mounted on the right ear.
  • the first hinge part 240-1 may connect the first support part 221 and the main body 223 so that the first support part 221 can rotate with respect to the main body 223.
  • the second hinge portion 240-2 may connect the second support portion 222 and the main body portion 223 so that the second support portion 222 can rotate with respect to the main body portion 223.
  • the hinge portions 240-1 and 240-2 of the electronic device 200 may be omitted.
  • the main body 223 and the support parts 221 and 222 may be directly connected.
  • the main body 223 includes at least one transparent member (e.g., a first transparent member 220, a second transparent member 230), at least one display module (e.g., a first display module ( 214-1), a second display module 214-2), at least one camera module (e.g., a front camera module 213), a gaze tracking camera module (e.g., a first gaze tracking camera module 212-1) , a second eye tracking camera module 212-2), a recognition camera module (e.g., a first recognition camera module 211-1, a second recognition camera module 211-2), and/or at least one may include a microphone (e.g., a first microphone 241-1 and a second microphone 241-2).
  • a microphone e.g., a first microphone 241-1 and a second microphone 241-2.
  • light generated by the display modules 214-1 and 214-2 may be projected onto the transparent members 220 and 230 to display information.
  • light generated in the first display module 214-1 may be projected on the first transparent member 220
  • light generated in the second display module 214-2 may be projected on the second transparent member ( 230).
  • Light capable of displaying a virtual object is projected onto the transparent members 220 and 230, at least partially formed of a transparent material, so that the user can perceive the reality in which the virtual object overlaps.
  • the display module 160 described in FIG. 1 may be understood as including the display modules 214-1 and 214-2 and transparent members 220 and 230 in the electronic device 200 shown in FIG. 2A. there is.
  • the electronic device 200 described in the present invention is not limited to displaying information through the method described above.
  • a display module that can be included in the electronic device 200 can be changed to a display module that includes various information display methods.
  • a separate display module e.g., a first display module 214-1, a second display module ( Information can be displayed without 214-2)
  • the display module 160 described in FIG. 1 may mean the transparent members 220 and 230 and the display panel included in the transparent members 220 and 230.
  • virtual objects output through the display modules 214-1 and 214-2 include information related to an application program running on the electronic device 200 and/or a user's presence of transparent members 220 and 230. It may contain information related to external objects located in the actual space perceived through the object. External objects may include objects that exist in real space.
  • the actual space perceived by the user through the transparent members 220 and 230 will hereinafter be referred to as the user's field of view (FoV) area.
  • the electronic device 200 may select an area determined to be the user's field of view (FoV) from image information related to the actual space acquired through a camera module (e.g., the shooting camera module 213) of the electronic device 200. At least some of the external objects included can be checked.
  • the electronic device 200 may output a virtual object related to the identified external object through the display modules 214-1 and 214-2.
  • the electronic device 200 may display virtual objects related to the augmented reality service based on image information related to the real space acquired through the photography camera module 213 of the electronic device 200.
  • the electronic device 200 includes a display module disposed corresponding to both eyes of the user (e.g., a first display module 214-1 corresponding to the left eye, and/or a second display module corresponding to the right eye).
  • a virtual object can be displayed based on (214-2)).
  • the electronic device 200 may display a virtual object based on set setting information (eg, resolution, frame rate, brightness, and/or display area).
  • the transparent members 220 and 230 may include a condenser lens (not shown) and/or a waveguide (e.g., the first waveguide 220-1 and/or the second waveguide 230-1). You can.
  • the first waveguide 220-1 may be partially located in the first transparent member 220
  • the second waveguide 230-1 may be partially located in the second transparent member 230.
  • Light emitted from the display modules 214-1 and 214-2 may be incident on one surface of the transparent members 220 and 230.
  • Light incident on one side of the transparent members 220 and 230 may be transmitted to the user through the waveguides 220-1 and 230-1 located within the transparent members 220 and 230.
  • the waveguides 220-1 and 230-1 may be made of glass, plastic, or polymer, and may include a nanopattern formed on one of the inner or outer surfaces.
  • the nanopattern may include a polygonal or curved lattice structure.
  • light incident on one surface of the transparent members 220 and 230 may be propagated or reflected inside the waveguides 220-1 and 230-1 by nano-patterns and transmitted to the user.
  • the waveguides 220-1 and 230-1 include at least one diffractive element (e.g., a diffractive optical element (DOE), a holographic optical element (HOE)) or a reflective element (e.g., a reflective mirror). It can contain one.
  • the waveguides 220-1 and 230-1 guide the light emitted from the display modules 214-1 and 214-2 to the user's eyes using at least one diffractive element or reflective element. You can.
  • the electronic device 200 includes a shooting camera module 213 (e.g., RGB) for capturing an image corresponding to the user's field of view (FoV) and/or measuring the distance to an object.
  • Camera module e.g., RGB
  • Eye tracking camera module 212-1, 212-2
  • recognition camera module to recognize a certain space camera module
  • the photographing camera module 213 may photograph the front direction of the electronic device 200
  • the eye-tracking camera modules 212-1 and 212-2 may film in a direction opposite to the photographing direction of the photographing camera module 213. You can take pictures in any direction.
  • the first eye tracking camera module 212-1 may partially photograph the user's left eye
  • the second eye tracking camera module 212-2 may partially photograph the user's right eye
  • the photographing camera module 213 may include a high resolution camera module such as a high resolution (HR) camera module and/or a photo video (PV) camera module.
  • the gaze tracking camera modules 212-1 and 212-2 may detect the user's pupils and track the gaze direction. The tracked gaze direction can be used to move the center of a virtual image including a virtual object in response to the gaze direction.
  • the recognition camera modules 211-1 and 211-2 may detect a user gesture and/or a certain space within a set distance (eg, a certain space).
  • the recognition camera modules 211-1 and 211-2 may include a camera module including a global shutter (GS).
  • the recognition camera modules 211-1 and 211-2 include GS in which the rolling shutter (RS) phenomenon can be reduced in order to detect and track fast hand movements and/or fine movements such as fingers. It could be a camera module.
  • GS global shutter
  • RS rolling shutter
  • the electronic device 200 uses at least one camera module (211-1, 211-2, 212-1, 212-2, 213) to focus and/or focus on the left eye and/or the right eye.
  • the eye corresponding to the secondary eye can be detected.
  • the electronic device 200 may detect the eye corresponding to the primary eye and/or the secondary eye based on the user's gaze direction with respect to an external object or virtual object.
  • At least one camera module included in the electronic device 200 shown in FIG. 2A may not be limited.
  • at least one camera module e.g., a photographing camera module 213, an eye tracking camera module 212-1, 212-2, and /Or the number and position of the recognition camera modules (211-1, 211-2) can be changed in various ways.
  • the electronic device 200 includes at least one camera module (e.g., a photographing camera module 213, an eye tracking camera module 212-1, 212-2), and/or a recognition camera module 211- 1, 211-2)) may include at least one light emitting device (illumination LED) (eg, the first light emitting device 242-1 and the second light emitting device 242-2) to increase the accuracy.
  • the first light-emitting device 242-1 may be placed in a portion corresponding to the user's left eye
  • the second light-emitting device 242-2 may be disposed in a portion corresponding to the user's right eye.
  • the light-emitting devices 242-1 and 242-2 may be used as an auxiliary means to increase accuracy when photographing the user's eyes with the eye-tracking camera modules 212-1 and 212-2, and may be used as an auxiliary means to increase accuracy by using infrared wavelengths. It may include an IR LED that generates light.
  • the light emitting devices 242-1 and 242-2 detect the subject to be photographed due to a dark environment or mixing and reflected light of various light sources when photographing the user's gesture with the recognition camera modules 211-1 and 211-2. It can be used as an auxiliary method when this is not easy.
  • the electronic device 200 may include a microphone (e.g., a first microphone 241-1 or a second microphone 241-2) for receiving the user's voice and surrounding sounds.
  • a microphone e.g., a first microphone 241-1 or a second microphone 241-2
  • the microphones 241-1 and 241-2 may be components included in the audio module 170 of FIG. 1.
  • the first support portion 221 and/or the second support portion 222 is a printed circuit board (PCB) (e.g., a first printed circuit board 231-1, a second printed circuit Board 231-2), speakers (e.g., first speaker 232-1, second speaker 232-2), and/or batteries (e.g., first battery 233-1, It may include a second battery 233-2).
  • PCB printed circuit board
  • speakers e.g., first speaker 232-1, second speaker 232-2
  • batteries e.g., first battery 233-1, It may include a second battery 233-2.
  • the speakers 232-1 and 232-2 may include a first speaker 232-1 for transmitting an audio signal to the user's left ear and/or a second speaker for transmitting an audio signal to the user's right ear. It may include a speaker 232-2. Speakers 232-1 and 232-2 may be components included in the audio module 170 of FIG. 1.
  • the electronic device 200 may be equipped with a plurality of batteries 233-1 and 233-2, and may perform printing through a power management module (e.g., the power management module 188 of FIG. 1). Power can be supplied to the circuit boards 231-1 and 231-2.
  • the plurality of batteries 233-1 and 233-2 may be electrically connected to a power management module (eg, the power management module 188 of FIG. 1).
  • the electronic device 200 was described as a device that displays augmented reality, but the electronic device 200 may be a device that displays virtual reality (VR).
  • the transparent members 220 and 230 may be made of an opaque material so that the user cannot perceive the actual space through the transparent members 220 and 230.
  • the transparent members 220 and 230 may function as the display module 160.
  • the transparent members 220 and 230 may include a display panel that displays information.
  • the electronic device 200 may include at least one sensor (eg, a wearing sensor, a motion sensor, or a touch sensor, not shown) and a communication module (not shown).
  • at least one sensor may sense whether the electronic device 200 is worn on the user's body and the posture in which it is worn.
  • the at least one sensor may include at least one of a proximity sensor and a grip sensor.
  • at least one sensor may detect the amount of change in posture that occurs due to the user's movement.
  • the at least one sensor may include an acceleration sensor and a gyro sensor. The acceleration sensor can sense acceleration in three axes, and the gyro sensor can sense angular velocity based on three axes.
  • At least one sensor may detect gestures such as a user's finger touch and swipe action.
  • the electronic device 200 may perform control including at least one or a combination of two or more of music play, stop, next music play, and/or previous music play in response to touch data sensed by at least one sensor.
  • the communication module may be a module that communicates wirelessly with the outside.
  • the communication module may include a UWB (ultra wide band) module, BT (bluetooth) network, BLE (Bluetooth low energy) network, Wi-Fi (Wireless Fidelity) network, ANT+ network, LTE (long-term evolution) network, Communication can be established with other devices and/or an Access Point (AP) through at least one or a combination of two or more of a 5th generation (5G) network and a Narrowband Internet of Things (NB-IoT) network.
  • UWB ultra wide band
  • BT bluetooth
  • BLE Bluetooth low energy
  • Wi-Fi Wireless Fidelity
  • ANT+ long-term evolution
  • LTE long-term evolution
  • FIG. 2B is a block diagram of an electronic device 200 (eg, electronic device 101 of FIG. 1 ) according to various embodiments.
  • the electronic device 200 (e.g., the electronic device 101 of FIG. 1) includes a processor 250 (e.g., the processor 120 of FIG. 1) and a memory 280 (e.g., the electronic device 101 of FIG. 1). Memory 130), communication module 290 (e.g., communication module 190 in FIG. 1), camera module 213 for shooting (e.g., camera module 213 for shooting in FIG. 2A), eye tracking camera module 212 ) (e.g., eye tracking cameras 212-1 and 212-2 in FIG. 2A) and/or a location module 270.
  • the components included in FIG. 2B are some of the components included in the electronic device 200, and the electronic device 200 may also include various other components as shown in FIG. 1.
  • the photographing camera module 213 may be a camera that captures an image in front of a user wearing an electronic device.
  • the processor 250 may generate an image query using the image captured by the photographing camera module 213.
  • An image query may refer to a request for a task related to an image captured by the photographing camera module 213.
  • an image query may be a request for information related to at least a portion of an image captured by the photographing camera module 213.
  • the eye tracking camera module 212 may acquire an image including the eyes of a user wearing the electronic device 200.
  • the electronic device 200 may detect the area of the user's pupils from the image acquired by the gaze tracking camera module 212 and track the direction of the user's gaze.
  • the processor 250 detects the user's gaze direction based on the image captured by the gaze tracking camera module 212, and based on the detected gaze direction, at least one object included in the image (e.g. main object, auxiliary object) can be determined.
  • the location module 270 may measure information related to the location of the electronic device 200.
  • the location module 270 may measure the geographic location of the electronic device 200, including GNSS (e.g., global positioning system (GPS) and/or global navigation satellite system (GLONASS)).
  • GNSS may be a system that measures the current location based on radio waves emitted from a plurality of satellites using a GPS sensor and/or a GLONASS sensor.
  • the location module 270 may measure information related to the location of the electronic device 200 in order to create a spatial map.
  • the location module 270 may measure information related to the location of the electronic device based on information related to the distance to an external object and the movement of the electronic device.
  • the location module 270 may include at least one hardware and/or software module used to measure the location of the electronic device 200.
  • the communication module 290 receives various information and/or communicates with an external electronic device through a network (e.g., the first network 198 and/or the second network 199 in FIG. 1). Can be sent.
  • the communication module 290 may include at least some of the configuration and/or functions of the communication module 190 of FIG. 1 .
  • the processor 250 is connected to the communication module 290 and can process various information received by the communication module 290 from an external electronic device. Additionally, the processor 250 may control the communication module 290 to transmit various information to an external electronic device. For example, the communication module 290 may transmit an image query provided from the processor 250 to the server 1000 and receive a search result of a key object from the server 1000.
  • the memory 280 may temporarily or non-transitorily store various data, including at least one volatile memory and a non-volatile memory.
  • Memory 280 may include at least some of the configuration and/or functions of memory 130 of FIG. 1 .
  • the memory 280 may temporarily or non-temporarily store at least one of bookmarks related to the learned deep learning model and/or object information.
  • the processor 250 is a component capable of performing operations or data processing related to control and/or communication of each component of the electronic device 200, and may be composed of one or more processors.
  • the processor 250 may include at least some of the components and/or functions of the processor 120 of FIG. 1 .
  • the processor 250 is a memory 280, a communication module 290, a photographing camera module 213, an eye tracking camera module 212, and/or a location module 270. Can be operatively, functionally and/or electrically connected. Operations of the processor 250 may be performed by loading instructions stored in the memory 280.
  • the processor 250 may display information by generating an image query for an object.
  • the processor 250 may generate an image query.
  • the processor 250 may generate an image query based on the main object that is the target of the search and the auxiliary object, which is an object that is likely to be included in the same image as the main object in the database.
  • an image query may include a request for information related to at least a portion of an acquired image.
  • the processor 250 may create a spatial map based on location-related information and extract information related to the object by comparing the spatial map and the actual map. For example, the processor 250 may determine a space to create a spatial map based on the geographic location of the electronic device 200 measured by the location module 270. For example, the processor 250 may create a spatial map based on the determined space using a simultaneous localization and mapping (SLAM) algorithm.
  • SLAM simultaneous localization and mapping
  • the processor 250 may obtain information related to the main object from the server 1000.
  • the processor 250 may obtain a search result for a main object from the server 1000.
  • the processor 250 may display information related to a main object.
  • the processor 250 displays information related to the main object on a display (not shown) of the electronic device 200 and/or displays the information related to the main object on the external electronic device 200. Can be transmitted.
  • FIG. 2C is a block diagram of an electronic device 200 and a server 1000 according to various embodiments.
  • the electronic device 200 may include an image query acquisition unit 251, a location information acquisition unit 252, and/or a search result management and display unit 253.
  • the image query acquisition unit 251 may generate an image query using an image captured by the photographing camera module 213.
  • An image query may refer to a request for a task related to an image captured by the photographing camera module 213.
  • an image query may be a request for information related to at least a portion of an image captured by the photographing camera module 213.
  • the image query acquisition unit 251 may generate an image query based on the main object that is the target of the search and the auxiliary object, which is an object that is likely to be included in the same image as the main object in the database.
  • the location information acquisition unit 252 may create a spatial map based on location-related information and extract information related to the object by comparing the spatial map and the actual map. For example, the location information acquisition unit 252 may determine a space to create a space map based on the geographic location of the electronic device 200 measured by the location module 270. For example, the processor 250 may create a spatial map based on the determined space using a simultaneous localization and mapping (SLAM) algorithm.
  • SLAM simultaneous localization and mapping
  • the search result management and display unit 253 may obtain information related to the main object from the server 1000.
  • the search result management and display unit 253 may obtain search results for key objects from the server 1000.
  • the search result management and display unit 253 may display information related to key objects.
  • the search result management and display unit 253 displays information related to the main object on the display (not shown) of the electronic device 200 and/or displays information related to the main object on the external electronic device 200. Relevant information may be transmitted to do so.
  • the server 1000 may include an object search unit 1100.
  • the object search unit 1100 may include an Internet object search unit 1111 and/or a database object search unit 1112.
  • the server 1000 may include a database that stores information on various objects (eg, images and descriptions of objects).
  • the object search unit 1100 may check whether an image including a key object exists in a database (eg, a shopping mall and/or store product database).
  • the Internet object search unit 1111 may search for the main object in another external server through a network based on the Internet in response to the fact that information related to the main object does not exist in the database.
  • the database object search unit 1112 may search the main object based on the database in response to the presence of information related to the main object in the database.
  • the object search unit 1100 may search information on main objects included in an image query using an image-based deep learning algorithm.
  • the object search unit 1100 may search an image query containing information related to a main object and an auxiliary object, information about the main object, a secondary object, a part of the main object, degree of association between objects, and/or class information. You can search information on major objects based on .
  • the object search unit 1100 may search for a plurality of images and/or main objects corresponding to the main object in a database and/or the Internet, based on an image query containing information related to the main object and the auxiliary object.
  • Information related to the main object can be searched for images in which objects are mixed.
  • databases and/or the Internet may store complete images of the primary object, or partial images of the primary object, or images containing both primary and secondary objects. There may be.
  • the object search unit 1100 may assign priorities to search results based on an image query containing information related to main objects and auxiliary objects. For example, when only some areas of the main object are included in the image query, the object search unit 1100 increases the importance of some areas of the main object and lowers the importance of the remaining areas to add the image query to the search candidate. can do. For example, the object search unit 1100 may assign priorities to search results based on the degree of correlation between the main object and the auxiliary object. For example, the object search unit 1100 may assign priorities to search results based on class information of main objects and auxiliary objects.
  • the object search unit 1100 may filter search results based on information based on the actual location of the object (eg, brand information of the store where the object is located) among information on the searched main object.
  • the server 1000 may transmit search results to the electronic device 200.
  • the server 1000 may provide a plurality of search results including priorities to the electronic device 200.
  • FIG. 3 is a flowchart illustrating a method by which the processor 250 of the electronic device 200 generates an image query for an object and displays information, according to various embodiments.
  • At least some of the illustrated operations may be performed by other components of the electronic device 200 other than the processor 250.
  • the processor 250 may generate an image query in operation 310.
  • the processor 250 may extract at least one object from an image obtained from the photographing camera module 213.
  • the processor 250 may obtain an image of the front of a user wearing the electronic device 200 from the photographing camera module 213.
  • the processor 250 may classify images by object using a deep learning (eg, CNN, convolutional layers) algorithm.
  • a deep learning eg, CNN, convolutional layers
  • the processor 250 may determine the main object within the divided object.
  • a key object may be an object that is the target of a search.
  • the processor 250 tracks the user's gaze direction using the gaze tracking camera module 212, and selects the user's gaze direction among at least one object extracted from the image obtained from the shooting camera module 213.
  • the located object can be determined as the main object.
  • the processor 250 may determine the auxiliary object by checking the relationship between the main object and the adjacent object located within a specified distance from the main object.
  • the processor 250 may generate an image query based on the presence or absence of an auxiliary object according to the determination of the presence or absence of relevance. For example, if the image query is an image in which the main object is partially occluded, the image query may include information related to the occluded area of the main object. For example, an image query may include degree of association and/or class information of primary and/or secondary objects.
  • the processor 250 may obtain and analyze location information in operation 320.
  • the processor 250 may obtain location-related information from the location module 270.
  • the location module 270 may measure information related to the location of the electronic device 200.
  • the location module 270 may measure the geographic location of the electronic device 200, including GNSS (e.g., global positioning system (GPS) and/or global navigation satellite system (GLONASS)).
  • GNSS may be a system that measures the current location based on radio waves emitted from a plurality of satellites using a GPS sensor and/or a GLONASS sensor.
  • the processor 250 may create a spatial map based on location-related information.
  • the processor 250 performs simultaneous localization and mapping (SLAM) based on information related to the distance to an external object measured by the location module 270 and the movement of the electronic device 200.
  • SLAM simultaneous localization and mapping
  • a spatial map can be created using a mapping) algorithm.
  • the processor 250 may compare a spatial map and an actual map to extract information related to an object. For example, the processor 250 may check the actual location of the object based on the actual location of the electronic device 200. For example, the processor 250 may calculate the actual location of the object based on the actual location of the electronic device 200, the user's gaze direction, and/or the relative distance to the object in the image. For example, the processor 250 may extract information related to the object (eg, brand information of the store where the object is located) based on the actual location of the object.
  • information related to the object eg, brand information of the store where the object is located
  • the processor 250 may transmit an image query and/or location information to the server 1000 and obtain information related to the main object from the server 1000 in operation 330 .
  • the processor 250 may transmit an image query and/or location information to the server 1000.
  • the processor 250 may transmit an image query and/or location information to the server 1000 using the communication module 290.
  • the server 1000 may search for an object based on a database and/or the Internet using the image query and/or location information. For example, the server 1000 may search for information on key objects included in an image query using an image-based deep learning algorithm.
  • the server 1000 may transmit search results to the electronic device 200.
  • the server 1000 may provide a plurality of search results including priorities to the electronic device 200.
  • the processor 250 may display information related to a main object in operation 340.
  • the processor 250 may obtain information related to search results related to the main object transmitted by the server 1000.
  • the processor 250 may display information related to the main object on the display of the electronic device 200 and/or transmit related information to display the information related to the main object to an external electronic device.
  • FIG. 4A is a flowchart illustrating a method by which the processor 250 generates an image query for an object according to various embodiments.
  • the processor 250 may extract and classify at least one object from an image.
  • the photographing camera module 213 can photograph the front of a user wearing the electronic device 200.
  • the processor 250 may acquire images captured by the camera module 213 for photography.
  • the processor 250 may extract and classify objects from an image using a deep learning (eg, CNN, convolutional layers) algorithm.
  • a deep learning algorithm eg, CNN, convolutional layers
  • the processor 250 extracts and extracts objects in an image using a semantic segmentation model that extracts objects from an image and/or an instance segmentation model that classifies objects on a pixel basis in the image. It can be classified, but is not limited to this.
  • the processor 250 may classify objects to which classes have been assigned. For example, the processor 250 may classify objects included in class A in the image as “class A first object,” “class A second object,” or “class A second object.” Objects included in class B can be classified as “class B first object” or “class B second object.”
  • the processor 250 may classify objects to which classes with multiple hierarchies are assigned. For example, the processor 250 classifies the superclass as A class, B class, or C class, and subclasses of each superclass into A class-first class, A class-second class, and B class- It can be classified as 1st class, or B class-2nd class. For example, the processor 250 may use "A class - first class - first object” or "A class - first class - second object" for objects included in class A - first class in the image. ", and for objects included in class A-second class, they are classified as "class A-second class-first object", or "class A-second class-second object". can do.
  • processor 250 may determine a primary object in operation 420.
  • the main object may be an object that is the target of search among at least one object extracted from the acquired image.
  • the processor 250 may track the user's gaze direction using the gaze tracking camera module 212.
  • the gaze tracking camera module 212 may capture the user's eyeballs, and the processor 250 may detect the user's pupils in the image captured by the gaze tracking camera module 212 and track the gaze direction. .
  • the processor 250 may determine, among at least one object classified in operation 410, an object matching the tracked user's gaze direction as the main object. For example, when the user's gaze is directed to “Class A-First Class-First Object” (e.g. Top-Shirt-First Shirt), the processor 250 displays “Class A-First Class- The “first object” may be determined as the main object.
  • Class A-First Class-First Object e.g. Top-Shirt-First Shirt
  • the “first object” may be determined as the main object.
  • the processor 250 may check the relationship of an adjacent object and/or another object to the main object in operation 430.
  • the processor 250 may determine the auxiliary object by checking the relationship between the main object and the adjacent object located within a specified distance from the main object.
  • a secondary object may be an object in the database that is likely to be included in the same image as the primary object.
  • items that are frequently matched and coordinated with main objects in a shopping mall may be examples of auxiliary objects.
  • Auxiliary objects can serve as auxiliary information to main objects in image queries.
  • the processor 250 may determine whether there is a relationship based on whether the upper class of the main object and the adjacent object are the same.
  • the processor 250 may determine that the adjacent object is related to the main object and determine it to be an auxiliary object. For example, if the primary object is "Class A-First Class-First Object" (e.g. Top-Shirt-First Shirt) and the adjacent object is "Class A-Second Class-First Object” (e.g. Top - Jacket - First Jacket), "Class A - Second Class - First Object” can be determined as the auxiliary object.
  • Class A-First Class-First Object e.g. Top-Shirt-First Shirt
  • Class A-Second Class-First Object e.g. Top - Jacket - First Jacket
  • the processor 250 determines that the adjacent object is not related to the main object and does not determine the adjacent object to be an auxiliary object. It may not be possible.
  • the processor 250 may determine the degree of correlation based on the similarity between the classes of the main object and the adjacent object, based on determining that the main object and the adjacent object are related.
  • the processor 250 may determine the relationship between the class of the main object and the class of the auxiliary object according to a specified similarity. For example, if the main object is “shirt” and the auxiliary object is “coat”, the degree of association can be determined according to the specified similarity. For example, if the main object is “shirt” and the auxiliary object is “cardigan”, the degree of correlation can be determined according to the specified similarity.
  • the processor 250 may check the relationship between the main object and an object other than the adjacent object in response to the fact that the adjacent objects are not related.
  • the processor 250 may determine that the other object is related to the main object and determine it to be an auxiliary object. For example, if the superclass of the main object classified in operation 410 is different from the superclass of another object, the processor 250 determines that the other object is not related to the main object and does not determine the other object to be an auxiliary object. It may not be possible.
  • the processor 250 may generate an image query and transmit it to the server 1000 in operation 440 .
  • the processor 250 may generate an image query based on the presence or absence of an auxiliary object according to the determination of relevance.
  • the processor 250 may generate an image query based on the primary object.
  • the processor 250 may generate an image query based on the main object and the auxiliary object.
  • An image query based on a main object and an auxiliary object can increase the accuracy of the search by having the auxiliary object serve as additional information for the main object when searching based on an image query in the server 1000.
  • the processor 250 may generate an image query by adding information related to the hidden area of the main object.
  • the processor 250 may generate an image query by adding the degree of correlation and class information of the main object and/or auxiliary object.
  • An image query may include information related to the main object that is the target of search and auxiliary objects related to the main object. For example, if the image query is an image in which the main object is partially obscured, the image query may include information related to the occluded area of the main object. For example, an image query may include class information and degree of association of primary and/or secondary objects.
  • the processor 250 may transmit the generated image query to the server 1000 using the communication module 290.
  • the processor 250 may receive information corresponding to an image query in operation 450.
  • the processor 250 may receive information corresponding to an image query sent to the server 1000 from the server 1000.
  • the processor 250 may receive information about key objects (e.g., price, size) from the server 1000.
  • FIG. 4B is a diagram illustrating an example of the processor 250 determining a main object and an auxiliary object according to various embodiments.
  • Figure (a) of FIG. 4B is an original image captured by the photographing camera module 213, and figure (b) may be an example of an image extracted by the processor 250 for each object.
  • the processor 250 may extract a part of the image including an object from the image corresponding to figure (a). Alternatively, the processor 250 may extract at least one object from the image corresponding to figure (a).
  • the processor 250 may classify objects to which classes have multiple layers.
  • the processor 250 may use a semantic segmentation and/or instance segmentation model to select "shirt” belonging to the "top-shirt” class and "shirt” belonging to the "top-jacket” class.
  • Jacket “Pants” belonging to the class “Bottoms-Pants”, “Shoes” belonging to the class “Accessories-shoes”, “1st bag” and “2nd bag” belonging to the class “Accessories-bags”, “Person- Objects such as “face” belonging to the “face” class, “head” belonging to the “person-head” class, or “sunglasses” belonging to the “accessory-sunglasses” class can be extracted and classified.
  • the processor 250 may track the user's gaze direction using the gaze tracking camera module 212.
  • Figure 4B may be a state in which the user is looking at “shirt.”
  • the processor 250 may determine “shirt” matching the tracked user's gaze direction as the main object 401-1.
  • the processor 250 may check the association of an adjacent object with “shirt”. For example, the processor 250 may recognize “shirt” and “jacket,” which are objects that exist within a specified distance, as adjacent objects, and check whether the superclasses of “shirt” and “jacket” are the same. Since the superclass of “shirt” is “tops” and the superclass of “jacket” matches “tops”, the processor 250 determines that “jacket” is related to “shirt” and assists “jacket”. It can be determined as object 402-1.
  • the processor 250 may generate an image query with “shirt” as the main object 401-1 and “jacket” as the auxiliary object 402-1 and transmit it to the server 1000. there is.
  • the server 1000 may search for information about “shirt” based on an image query. For example, the server 1000 may search for information using information related to “shirt” and “jacket” to search for “shirt.”
  • the processor 250 may obtain information about “shirt” from the server 1000.
  • FIG. 4C is a diagram illustrating an example of the processor 250 determining a main object and an auxiliary object according to various embodiments.
  • Figure (a) is an original image captured by the shooting camera module 213, and Figure (b) may be an example of an image extracted by the processor 250 for each object.
  • the processor 250 may extract a part of the image including an object from the image corresponding to figure (a). Alternatively, the processor 250 may extract at least one object from the image corresponding to figure (a).
  • the processor 250 may classify objects to which classes have multiple layers.
  • the processor 250 uses a semantic segmentation and/or instance segmentation model to select a “first blouse” belonging to the “top-blouse” class and a “top-blouse” class. a “second blouse” belonging to the “top-blouse” class, a “third blouse” belonging to the “top-blouse” class, a “fourth blouse” belonging to the “top-blouse” class, and/or a “fifth blouse” belonging to the top-blouse” class.
  • Objects can be extracted from images.
  • the processor 250 may track the user's gaze direction using the gaze tracking camera module 212.
  • Figure 4C may be a state in which the user is looking at the “second blouse.”
  • the processor 250 may determine the “second blouse” matching the tracked user's gaze direction as the main object 401-2.
  • the processor 250 may check the relationship between the adjacent object and the “second blouse.” For example, the processor 250 recognizes “the first blouse,” which is an object that exists within a specified distance from the “second blouse,” as an adjacent object, and the superclasses of “the second blouse” and “the first blouse” are the same. You can check whether or not. Since the superclass of “second blouse” is “tops” and the superclass of “first blouse” is “tops”, the processor 250 determines that “first blouse” is related to “second blouse”. Then, the “first blouse” can be determined as the auxiliary object 402-2.
  • the processor 250 generates an image query with “second blouse” as the main object 401-2 and “first blouse” as the auxiliary object 402-2, and sends it to the server 1000. ) can be transmitted to.
  • the server 1000 may search for information about “second blouse” based on an image query. For example, the server 1000 may search for information using information related to “second blouse” and “first blouse” to search for “second blouse.”
  • the processor 250 may obtain information about the “second blouse” from the server 1000.
  • FIG. 4D is a diagram illustrating an example of the processor 250 determining a main object and an auxiliary object according to various embodiments.
  • Figure (a) is an original image captured by the shooting camera module 213, and Figure (b) may be an example of an image extracted by the processor 250 for each object.
  • the processor 250 may extract a part of the image including an object from the image corresponding to figure (a). Alternatively, the processor 250 may extract at least one object from the image corresponding to figure (a).
  • the processor 250 may classify objects to which classes have multiple layers.
  • the processor 250 uses semantic segmentation and/or instance segmentation models to create a “monitor” belonging to the “computer” class, a “computer body” belonging to the “computer” class, Images can be extracted with “desk” belonging to the “furniture” class, and/or “chair” belonging to the “furniture” class.
  • the processor 250 may track the user's gaze direction using the gaze tracking camera module 212.
  • Figure 4D may be a state in which the user is staring at the “monitor.”
  • the processor 250 may determine “monitor” matching the tracked user's gaze direction as the main object 401-2.
  • the processor 250 may check the association of an adjacent object with a “monitor”. For example, the processor 250 may recognize “desk,” which is an object that exists within a specified distance from “monitor,” as an adjacent object, and check whether the superclasses of “monitor” and “desk” are the same. Since the superclass of “monitor” is “computer” and the superclass of “desk” is “furniture,” the processor 250 may determine that “desk” is not related to “monitor.”
  • the processor 250 may check the relationship to the “monitor” of an object other than an adjacent object. For example, the processor 250 may recognize a “body” that is an object that does not exist within a specified distance from the “monitor” and check whether the superclasses of “monitor” and “body” are the same. Since the superclass of “monitor” is “computer” and the superclass of “main body” is “computer”, the processor 250 determines that “main body” and “monitor” are related and supports “main body”. It can be determined as object 402-3.
  • the processor 250 may generate an image query with “monitor” as the main object 401-3 and “main body” as the auxiliary object 402-3 and transmit it to the server 1000. there is.
  • the server 1000 may search for information about “monitor” based on an image query. For example, the server 1000 may search for information using information related to “monitor” and “main body” to search for “monitor.”
  • the processor 250 may obtain information about “monitor” from the server 1000.
  • FIG. 4E is a diagram illustrating an example in which the processor 250 determines a main object and an auxiliary object according to various embodiments.
  • Figure (a) is an original image captured by the shooting camera module 213, and Figure (b) may be an example of an image extracted by the processor 250 for each object.
  • the processor 250 may extract a part of the image including an object from the image corresponding to figure (a). Alternatively, the processor 250 may extract at least one object from the image corresponding to figure (a).
  • the processor 250 may classify objects to which classes have multiple layers.
  • the processor 250 may use a semantic segmentation and/or instance segmentation model to define “laptop” belonging to the “computer” class and “first flower pot” belonging to the “plant” class.
  • objects can be extracted from the image as a “second flower pot” belonging to the “Plant” class, a “third flower pot” belonging to the “Plant” class, and/or a “fourth flower pot” belonging to the “Plant” class.
  • the processor 250 may track the user's gaze direction using the gaze tracking camera module 212.
  • Figure 4E may be a state in which the user is looking at “laptop.”
  • the processor 250 may determine “laptop” matching the tracked user's gaze direction as the main object 401-4.
  • the processor 250 may check the association of an adjacent object with “laptop”. For example, the processor 250 recognizes “laptop” and “first pot”, which are objects that exist within a specified distance, as adjacent objects, and checks whether the superclasses of “laptop” and “first pot” are the same. You can. Since the superclass of “laptop” is “computer” and the superclass of “first pot” is “plant”, which is inconsistent, the processor 250 may determine that “laptop” is not related to “first pot”.
  • the processor 250 may check the association of an object other than an adjacent object to “laptop”. For example, the processor 250 recognizes "the second flowerpot” as an object that does not exist within a specified distance from the "laptop”, the superclass of "laptop” is "computer", and the superclass of "the second pot” is Since “Plant” does not match, the processor 250 may determine that “Laptop” is not related to “Second Flowerpot.”
  • the processor 250 may generate an image query with “laptop” as the main object 401-4 and transmit it to the server 1000.
  • the server 1000 may search for information about “laptop” based on an image query. For example, the server 1000 may search for information using information related to “laptop” in order to search for “laptop.”
  • the processor 250 may obtain information about “laptop” from the server 1000.
  • FIG. 5 is a flowchart illustrating a method by which the processor 250 confirms information related to an object based on location information, according to various embodiments.
  • the processor 250 may create a spatial map based on location-related information in operation 510.
  • the location module 270 may measure information related to the location of the electronic device 200.
  • the location module 270 may measure the geographic location of the electronic device 200, including GNSS (e.g., global positioning system (GPS) and/or global navigation satellite system (GLONASS)).
  • GNSS may be a system that measures the current location based on radio waves emitted from a plurality of satellites using a GPS sensor and/or a GLONASS sensor.
  • the processor 250 may determine a space to create a spatial map based on the geographic location of the electronic device 200 measured by the location module 270.
  • the processor 250 may create a spatial map based on the determined space using a simultaneous localization and mapping (SLAM) algorithm.
  • SLAM simultaneous localization and mapping
  • the location module 270 may measure information related to the location of the electronic device based on information related to the distance to an external object and the movement of the electronic device.
  • the processor 250 may measure the distance to an external object based on images captured by a plurality of cameras (eg, the photography camera module 213) and/or a depth sensor (not shown).
  • the processor 250 is based on images captured by a plurality of cameras (e.g., camera module 213 for photography) and/or a depth sensor (not shown), and external objects measured by the location module 270.
  • a spatial map can be created by fusing information related to the distance and movement of the electronic device 200.
  • processor 250 may create a spatial map using algorithms such as Kalman filtering, Partial filtering, and/or Monte Carlo filtering.
  • the processor 250 may compare the spatial map and the actual map to extract information related to the main object in operation 520.
  • the processor 250 may check the actual location of the electronic device 200 by comparing the spatial map created in operation 510 with the actual map. For example, the processor 250 may match the spatial map and the actual map to confirm the actual location of the electronic device 200 based on the location of the electronic device 200 on the spatial map.
  • the processor 250 may extract information related to an object based on the actual location of the electronic device 200. For example, the processor 250 may check the actual location of the object based on the actual location of the electronic device 200. For example, the processor 250 may calculate the actual location of the object based on the actual location of the electronic device 200, the user's gaze direction, and/or the relative distance to the object in the image. For example, the processor 250 may extract information related to the object (eg, brand information of the store where the object is located) based on the actual location of the object.
  • information related to the object eg, brand information of the store where the object is located
  • the processor 250 may update the map using additional information in operation 530.
  • the processor 250 may update the spatial map using a text recognition function.
  • the OCR algorithm is an optical character recognition algorithm that recognizes text images
  • the processor 250 can recognize the name of a brand based on the OCR algorithm.
  • the processor 250 may update the spatial map so that the spatial map matches the actual map based on the recognized brand name.
  • FIG. 6 is a flowchart illustrating a method by which a server (eg, server 1000 of FIG. 2C) searches for an object according to various embodiments.
  • a server eg, server 1000 of FIG. 2C
  • the server 1000 may obtain an image query from the electronic device 200.
  • An image query may include information related to the main object that is the target of search and auxiliary objects related to the main object. For example, if the image query is an image in which the main object is partially obscured, the image query may include information related to the occluded area of the main object. For example, an image query may include class information or degree of association of primary and/or secondary objects. For example, an image query may include information based on the actual location of a key object (e.g., brand information of the store where the object is located).
  • the server 1000 may check whether information related to the main object exists in the database.
  • the server 1000 may check whether an image including a key object exists in a database (eg, a shopping mall and/or store product database).
  • a database eg, a shopping mall and/or store product database.
  • the server 1000 may search the main object based on the database in response to the presence of information related to the main object in the database (e.g., operation 610 - example). .
  • the server 1000 in operation 630, may search for a key object based on the Internet in response to the fact that information related to the key object does not exist in the database (e.g., operation 620 - No). there is.
  • the server 1000 may search information on key objects included in an image query using an image-based deep learning algorithm. For example, the server 1000 may, in an image query containing information related to the main object and the secondary object, based on information about the main object, the secondary object, a part of the main object, the degree of association between the objects, and/or class information. You can search information on major objects.
  • the server 1000 may generate images corresponding to the main object and/or the main object and a plurality of objects in a database and/or the Internet, based on an image query containing information related to the main object and the auxiliary object.
  • Information related to main objects can be searched for mixed images.
  • databases and/or the Internet may store complete images of the primary object, or partial images of the primary object, or images containing both primary and secondary objects. There may be.
  • the server 1000 may assign priorities to search results based on an image query containing information related to main objects and auxiliary objects. For example, if only some areas of the main object are included in the image query, the server 1000 may add the image query to the search candidates by increasing the importance of some areas of the main object and lowering the importance of the remaining areas. there is. For example, the server 1000 may assign priorities to search results based on the degree of correlation between the main object and the auxiliary object. For example, the server 1000 may assign priorities to search results based on class information of main objects and auxiliary objects.
  • the server 1000 may filter search results based on information based on the actual location of the object (eg, brand information of the store where the object is located) among information on the searched main object.
  • the server 1000 may transmit a search result to the electronic device 200 in operation 640.
  • the server 1000 may provide a plurality of search results including priorities to the electronic device 200.
  • FIG. 7 is a flowchart illustrating a method by which the processor 250 searches for an object of interest according to various embodiments.
  • the processor 250 may receive information about key objects from the server 1000. For example, the processor 250 may obtain information related to the search result transmitted by the server 1000 in operation 640.
  • the processor 250 may determine, in operation 710, whether to store information related to the search result for the main object in a storage space (eg, a bookmark).
  • a storage space eg, a bookmark
  • the processor 250 may determine whether to store information related to the search result for the main object in a storage space (eg, a bookmark) based on the user's input.
  • a storage space eg, a bookmark
  • the processor 250 in operation 720, in response to determining to store information related to the search result for the main object in a storage space (e.g., a bookmark) (e.g., operation 710 - example), the main object Information related to search results can be stored in a storage space (e.g., bookmark).
  • a storage space e.g., a bookmark
  • the processor 250 may determine, in operation 730, whether to compare the main object with the object stored in the bookmark.
  • the processor 250 may determine whether to compare the main object with the object stored in the bookmark based on the user's input.
  • the processor 250 in operation 740, in response to determining to compare the main object and a similar object stored in the storage space (e.g., a bookmark) (e.g., operation 730 - example), the main object and the storage space (e.g., a bookmark) Information on similar objects stored in (e.g. bookmarks) can be displayed.
  • the processor 250 may display the search results and information on similar objects stored in a storage space (eg, bookmark) on the display.
  • the processor 250 may, in response to not determining whether to compare the main object with an object stored in a storage space (e.g., a bookmark) (e.g., operation 730 - No), compare the main object with the object stored in the storage space (e.g., a bookmark). Search results can be displayed.
  • a storage space e.g., a bookmark
  • search results can be displayed.
  • the processor 250 displays information on a main object and/or a similar object stored in a storage space (e.g., a bookmark) on the display of the electronic device 200 and/or displays information on the external electronic device 200. Related information can be transmitted to display information about the main object and/or similar objects stored in bookmarks.
  • a storage space e.g., a bookmark
  • An electronic device includes a camera, a communication module, and a processor, wherein the processor extracts a part of the image including an object from an image obtained from the camera and selects a main object to be searched from among the objects in the image. Determine an object, determine, among other objects in the image, an object associated with the primary object as a secondary object, include a portion of the image including the primary object and/or the secondary object, and provide information related to the primary object.
  • An image query including a request may be generated and the image query may be transmitted to the server using the communication module.
  • the processor may classify objects to which classes are assigned using a segmentation model using an artificial neural network using images obtained from the camera.
  • the processor may determine, among other objects in the image, an object that has the same upper class as the main object as an auxiliary object.
  • the electronic device may further include a gaze tracking camera, and the processor may track the user's gaze using the gaze tracking camera and determine the main object based on the tracked user's gaze. .
  • the processor further includes a location module that measures information related to the location of the electronic device, the processor generates a spatial map based on the information measured by the location module, and Verify the location of the electronic device by comparing a spatial map and a real map, determine the actual location of the main object based on the location information of the electronic device, and further based on information related to the actual location of the main object You can create image queries.
  • the processor may determine the degree of association of the auxiliary object based on a predetermined similarity between the subclass of the main object and the subclass of the auxiliary object.
  • the processor may generate an image query based on information about a partial area of the main object in response to the fact that a part of the main object is not recognized.
  • the processor obtains information related to the main object from the server, and the information related to the main object includes the main object, the auxiliary object, and a partial area of the main object. It may be a search result based on at least one of information about, the degree of association between the main object and the auxiliary object, and class information.
  • the electronic device further includes a memory and a display that stores information about an object, wherein the processor displays information that compares information related to the main object with objects similar to the main object stored in the memory. It can be displayed in .
  • a method of operating an electronic device includes extracting a part of the image including an object from an image obtained from a camera, determining a main object that is a search target among objects in the image, and Among other objects in the object, determining an object associated with the primary object as a secondary object, generating an image query including a portion of an image including the primary object and/or the secondary object, and transmitting the image query to a server. It may include a transmitting operation.
  • a method of operating an electronic device may include classifying an object to which a class is assigned using a segmentation model using an artificial neural network using an image obtained from the camera.
  • a method of operating an electronic device may include determining, among other objects in the image, an object whose upper class is the same as the main object as an auxiliary object.
  • a method of operating an electronic device may include tracking a user's gaze using a gaze tracking camera and determining the main object based on the tracked gaze of the user.
  • an operation of generating a spatial map based on information related to the location of the electronic device may include determining the actual location of the main object based on location information of the electronic device and generating the image query further based on information related to the actual location of the main object.
  • a method of operating an electronic device may include determining a degree of association of the auxiliary object based on a predetermined similarity between the subclass of the main object and the subclass of the auxiliary object.
  • a method of operating an electronic device may include generating an image query based on information about a partial area of the main object in response to an area of a part of the main object not being recognized. there is.
  • a method of operating an electronic device includes obtaining information related to the main object from the server, wherein the information related to the main object includes the main object, the auxiliary object, and the main object. It may be a search result based on at least one of information about a partial area of an object, the degree of association between the main object and the auxiliary object, and class information.
  • a method of operating an electronic device may include displaying information related to the main object and information comparing objects similar to the main object stored in memory on a display.
  • the electronic device includes a camera, a communication module, and a processor, and the processor selects a portion of the image including an object from the image obtained from the camera. Extract, determine a main object that is the target of search among objects in the image, determine an object associated with the main object as an auxiliary object among other objects in the image, and include the main object and/or the auxiliary object. Generate an image query containing a part of an image, transmit the image query to a server using the communication module, and the server searches for information related to the main object based on the image query, and the search result Information related to the main object may be transmitted to the electronic device.
  • the server is configured to configure the main object based on at least one of the main object, the auxiliary object, information about a partial area of the main object, the degree of association between the main object and the auxiliary object, and class information. You can search for information related to major objects.
  • Electronic devices may be of various types.
  • Electronic devices may include, for example, portable communication devices (e.g., smartphones), computer devices, portable multimedia devices, portable medical devices, cameras, wearable devices, or home appliances.
  • Electronic devices according to embodiments of this document are not limited to the above-described devices.
  • first, second, or first or second may be used simply to distinguish one component from another, and to refer to that component in other respects (e.g., importance or order) is not limited.
  • One (e.g., first) component is said to be “coupled” or “connected” to another (e.g., second) component, with or without the terms “functionally” or “communicatively.”
  • any of the components can be connected to the other components directly (e.g. wired), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as logic, logic block, component, or circuit, for example. It can be used as A module may be an integrated part or a minimum unit of the parts or a part thereof that performs one or more functions. For example, according to one embodiment, the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document are one or more instructions stored in a storage medium (e.g., built-in memory 136 or external memory 138) that can be read by a machine (e.g., electronic device 101). It may be implemented as software (e.g., program 140) including these.
  • a processor e.g., processor 120
  • the one or more instructions may include code generated by a compiler or code that can be executed by an interpreter.
  • a storage medium that can be read by a device may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain signals (e.g. electromagnetic waves), and this term refers to cases where data is semi-permanently stored in the storage medium. There is no distinction between temporary storage cases.
  • Computer program products are commodities and can be traded between sellers and buyers.
  • the computer program product may be distributed in the form of a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or through an application store (e.g. Play StoreTM) or on two user devices (e.g. It can be distributed (e.g. downloaded or uploaded) directly between smart phones) or online.
  • a machine-readable storage medium e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play StoreTM
  • two user devices e.g. It can be distributed (e.g. downloaded or uploaded) directly between smart phones) or online.
  • at least a portion of the computer program product may be at least temporarily stored or temporarily created in a machine-readable storage medium, such as the memory of a manufacturer's server, an application store's server, or a relay server.
  • each component (e.g., module or program) of the above-described components may include a single or plural entity, and some of the plurality of entities may be separately placed in other components. there is.
  • one or more of the components or operations described above may be omitted, or one or more other components or operations may be added.
  • multiple components eg, modules or programs
  • the integrated component may perform one or more functions of each component of the plurality of components in the same or similar manner as those performed by the corresponding component of the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component may be executed sequentially, in parallel, iteratively, or heuristically, or one or more of the operations may be executed in a different order, or omitted. Alternatively, one or more other operations may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Remote Sensing (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

다양한 실시예에 따른 전자 장치에서, 전자 장치는 카메라, 통신 모듈 및 프로세서를 포함하고, 상기 프로세서는 상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하고, 상기 주요 객체와 관련된 정보의 요청을 포함하는 이미지 쿼리를 생성하고, 상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송할 수 있다. 이 밖에 다양한 실시예들이 가능하다.

Description

객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법
본 문서에 개시된 다양한 실시예들은, 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법에 관한 것이다.
안경과 유사한 형태의 HMD 장치인 AR 글래스(augmented reality glass)는 차세대 퍼스널 디바이스로, AR 글래스에서 적용될 수 있는 다양한 기능에 대하여 개발되고 있다.
한편, 쿼리 이미지 검색 방법은 이미지 내의 특정 객체를 딥러닝을 이용하여 검색하는 기술이다. 이 때, 카메라 또는 저장된 영상 이미지에서 특정 객체 영역을 추출하고, 특정 객체 영역 및 영상 정보를 서버로 전송하여, 객체에 대한 정보를 추출할 수 있다.
여러 객체가 포함된 이미지를 이용하여 쿼리 이미지 검색을 수행하는 경우, 각 객체의 배치에 따라 정확한 검색 결과를 얻지 못할 수 있다. 예를 들어, 이미지에서 모델이 입고 있는 "셔츠"의 정보를 검색하고자 하는 경우, 전자 장치는 이미지 내의 "셔츠"에 대한 영역을 분리하고, "셔츠"를 서버에 전송하여, 서버가 "셔츠"에 대한 정보를 전자 장치에 전달할 수 있다. 이 때, "셔츠"가 가디건, 자켓과 같은 다른 코디 아이템에 의하여 가려져 있는 경우, 정확한 검색 결과를 얻지 못할 수 있다.
본 문서에서 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 문서에 개시된 다양한 실시예에 따른 전자 장치는, 카메라, 통신 모듈 및 프로세서를 포함하고, 상기 프로세서는 상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하고, 상기 주요 객체와 관련된 정보의 요청을 포함하는 이미지 쿼리를 생성하고, 상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송할 수 있다.
본 문서에 개시된 다양한 실시예에 따른 전자 장치의 동작 방법은, 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하는 동작, 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하는 동작, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하는 동작, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하는 이미지 쿼리를 생성하는 동작 및 상기 이미지 쿼리를 서버에 전송하는 동작을 포함할 수 있다.
본 문서에 개시된 다양한 실시예에 따른 서버와 전자 장치를 포함하는 시스템은, 상기 전자 장치는 카메라, 통신 모듈, 및 프로세서를 포함하고, 상기 프로세서는 상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고, 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하는 이미지 쿼리를 생성하고, 상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송하고, 상기 서버는 상기 이미지 쿼리에 기반하여 상기 주요 객체와 관련된 정보를 검색하고, 상기 검색 결과인 상기 주요 객체와 관련된 정보를 상기 전자 장치에 전송할 수 있다.
본 문서의 다양한 실시예에 따른 전자 장치는 이미지 검색을 위한 풀의 범위를 넓혀, 결과의 정확도를 높일 수 있다.
예를 들어, 전자 장치는 검색하고자 하는 객체와 관련된 객체에 대한 정보를 보조적으로 이용하여, 결과의 정확도를 높일 수 있다.
예를 들어, 전자 장치는 사용자의 위치 정보를 보조적으로 이용하여, 검색하고자하는 객체에 대한 결과의 정확도를 높일 수 있다.
도면의 설명과 관련하여, 동일 또는 유사한 구성 요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블럭도이다.
도 2a는 다양한 실시예들에 따른 전자 장치의 구성도를 도시한 도면이다.
도 2b는 다양한 실시예들에 따른 전자 장치의 블록도이다.
도 3은, 다양한 실시예에 따른 프로세서가 객체에 대한 이미지 쿼리를 생성하여 정보를 표시하는 방법을 도시한 흐름도이다.
도 4a는, 다양한 실시예에 따른 프로세서가 객체에 대한 이미지 쿼리를 생성하는 방법을 도시한 흐름도이다.
도 4b 는 다양한 실시예에 따른 프로세서가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
도 4c 는 다양한 실시예에 따른 프로세서가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
도 4d 는 다양한 실시예에 따른 프로세서가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
도 4e는 다양한 실시예에 따른 프로세서가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
도 5는, 다양한 실시예에 따른 프로세서가 위치 정보에 기반하여 객체와 관련된 정보를 확인하는 방법을 도시한 흐름도이다.
도 6은, 다양한 실시예에 따른 서버가 객체를 검색하는 방법을 도시한 흐름도이다.
도 7은, 다양한 실시예에 따른 프로세서가 관심 객체를 검색하는 방법을 도시한 흐름도이다.
다양한 실시예에 따르면, 전자 장치는 이미지에서 검색하고자 하는 객체를 분리하여 생성한 쿼리 이미지를 이용하여 객체에 대한 정보를 검색할 수 있다. 전자 장치는, 검색하고자 하는 객체뿐만 아니라, 검색하고자 하는 객체와 관련된 보조 객체를 이용하여 검색에 이용할 수 있다. 이는 관련 아이템들은 함께 매치되는 경우가 많기 때문에, 데이터 베이스에 관련 아이템들이 동시에 매치된 데이터까지 검색에 이용될 수 있어, 검색 대상의 풀(Pool)이 늘어남에 따라, 검색의 정확도를 높일 수 있다. 예를 들어, A 셔츠와 B 자켓이 함께 코디되는 경우가 많은 경우, 이미지 검색 시 A 셔츠뿐만 아니라 B 자켓에 대한 정보를 보조적으로 제공함에 따라, A 셔츠에 대한 검색의 정확도를 높일 수 있다.
또한, 다양한 실시예에 따른 전자 장치는, 사용자의 위치를 참조하여, 검색하고자 하는 객체에 대한 정보를 부가할 수 있다. 예를 들어, 쇼핑몰에서 사용자가 "A 매장"에 위치한 경우, 전자 장치는 검색하고자 하는 객체에 대하여 "A 브랜드"와 관련된 정보를 더 사용할 수 있어, 검색의 정확도를 높일 수 있다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일 실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일 실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일 실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일 실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일 실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일 실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.도 2a는 다양한 실시예들에 따른 전자 장치(200)(예: 도 1의 전자 장치(101))의 구성도를 도시한 도면이다.
다양한 실시예에서, 전자 장치(200)는 사용자의 머리 부분에 착용되는 형태로 제작된 전자 장치(200)일 수 있다. 예를 들어, 전자 장치(200)는 안경(glass), 고글(goggles), 헬멧 또는 모자 중 적어도 하나의 형태로 구현될 수 있으나, 이에 한정되지 않는다. 일 실시예에 따르면, 전자 장치(200)는 사용자의 양안(예: 좌안 및/또는 우안), 각각에 대응하는 복수 개의 투명 부재(예: 제 1 투명 부재(220) 및/또는 제 2 투명 부재(230))를 포함할 수 있다.
전자 장치(200)는 사용자에게 증강 현실(augumented reality; AR) 서비스와 관련된 영상을 제공할 수 있다. 일 실시예에 따르면, 전자 장치(200)는 제1 투명 부재(220) 및/또는 제2 투명 부재(230)에 가상 객체를 투영하거나, 표시함으로써, 사용자가 전자 장치의 제1 투명 부재(220) 및/또는 제2 투명 부재(230)를 통해 인지하는 현실에 적어도 하나의 가상 객체가 겹쳐 보이도록 할 수 있다.
도 2a를 참조하면, 일 실시예에 따른 전자 장치(200)는 본체부(223), 지지부(예: 제 1 지지부(221), 제 2 지지부(222)), 및 힌지부(예: 제1 힌지부(240-1), 제2 힌지부(240-2))를 포함할 수 있다.
다양한 실시예에 따르면, 본체부(223)와 지지부(221, 222)는 힌지부(240-1, 240-2)를 통해 작동적으로 연결될 수 있다. 본체부(223)는 사용자의 코에 적어도 부분적으로 거치될 수 있도록 형성된 부분을 포함할 수 있다.
다양한 실시예에 따르면, 지지부(221, 222)는 사용자의 귀에 걸쳐질 수 있는 형태의 지지 부재를 포함할 수 있다. 지지부(221, 222)는 왼쪽 귀에 거치되는 제 1 지지부(221) 및/또는 오른쪽 귀에 거치되는 제 2 지지부(222)를 포함할 수 있다.
다양한 실시예에 따르면, 제1 힌지부(240-1)는 제1 지지부(221)가 본체부(223)에 대해 회전 가능하도록 제1 지지부(221)와 본체부(223)를 연결할 수 있다. 제2 힌지부(240-2)는 제2 지지부(222)가 본체부(223)에 대해 회전 가능하도록 제2 지지부(222)와 본체부(223)를 연결할 수 있다. 다른 실시예에 따르면, 전자 장치(200)의 힌지부(240-1, 240-2)는 생략될 수 있다. 예를 들어, 본체부(223)와 지지부(221, 222)는 바로 연결될 수 있다.
다양한 실시예에 따르면, 본체부(223)는 적어도 하나의 투명 부재(예: 제1 투명 부재(220), 제2 투명 부재(230)), 적어도 하나의 디스플레이 모듈(예: 제1 디스플레이 모듈(214-1), 제2 디스플레이 모듈(214-2)), 적어도 하나의 카메라 모듈(예: 전방 촬영 카메라 모듈(213), 시선 추적 카메라 모듈(예: 제1 시선 추적 카메라 모듈(212-1), 제2 시선 추적 카메라 모듈(212-2)), 인식용 카메라 모듈(예: 제1 인식용 카메라 모듈(211-1), 제2 인식용 카메라 모듈(211-2)) 및/또는 적어도 하나의 마이크(예: 제1 마이크(241-1), 제2 마이크(241-2))를 포함할 수 있다.
도 2a에서 설명되는 전자 장치(200)의 경우, 디스플레이 모듈(214-1, 214-2)에서 생성된 광이 투명 부재(220, 230)에 투영되어 정보를 표시할 수 있다. 예를 들어, 제1 디스플레이 모듈(214-1)에서 생성된 광은 제1 투명 부재(220)에 투영될 수 있고, 제2 디스플레이 모듈(214-2)에서 생성된 광은 제2 투명 부재(230)에 투영될 수 있다. 적어도 일부가 투명한 소재로 형성된 투명 부재(220, 230)에 가상 객체를 표시할 수 있는 광이 투영됨으로써, 사용자는 가상 객체가 중첩된 현실을 인지할 수 있다. 이 경우, 도 1에서 설명한 디스플레이 모듈(160)은 도 2a에 도시된 전자 장치(200)에서 디스플레이 모듈(214-1, 214-2) 및 투명 부재(220, 230)를 포함하는 것으로 이해될 수 있다. 다만, 본 발명에서 설명되는 전자 장치(200)가 앞서 설명한 방식을 통해 정보를 표시하는 것으로 한정되는 것은 아니다. 전자 장치(200)에 포함될 수 있는 디스플레이 모듈은 다양한 방식의 정보 표시 방법을 포함하는 디스플레이 모듈로 변경될 수 있다. 예를 들어, 투명 부재(220, 230) 자체에 투명 소재의 발광 소자를 포함하는 디스플레이 패널이 내장된 경우에는 별도의 디스플레이 모듈(예: 제1 디스플레이 모듈(214-1), 제2 디스플레이 모듈(214-2))없이 정보를 표시할 수 있다. 이 경우, 도 1에서 설명한 디스플레이 모듈(160)은 투명 부재(220, 230)와 투명 부재(220, 230)에 포함되는 디스플레이 패널을 의미할 수 있다.
다양한 실시예에 따르면, 디스플레이 모듈(214-1, 214-2)을 통해 출력되는 가상 객체는 전자 장치(200)에서 실행되는 어플리케이션 프로그램과 관련된 정보 및/또는 사용자가 투명 부재(220, 230)를 통해 인지하는 실제 공간에 위치한 외부 객체와 관련된 정보를 포함할 수 있다. 외부 객체는 실제 공간에 존재하는 사물을 포함할 수 있다. 사용자가 투명 부재(220, 230)를 통해 인지하는 실제 공간을 이하에서는 사용자의 시야각(field of view; FoV) 영역으로 호칭하기로 한다. 예를 들어, 전자 장치(200)는 전자 장치(200)의 카메라 모듈(예: 촬영용 카메라 모듈(213))을 통해 획득한 실제 공간과 관련된 영상 정보에서 사용자의 시야각(FoV)으로 판단되는 영역의 적어도 일부에 포함된 외부 객체를 확인할 수 있다. 전자 장치(200)는 확인한 외부 객체와 관련된 가상 객체를 디스플레이 모듈(214-1, 214-2)을 통해 출력할 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 전자 장치(200)의 촬영용 카메라 모듈(213)을 통해 획득한 실제 공간과 관련된 영상 정보에 기반하여 증강 현실 서비스와 관련된 가상 객체를 함께 표시할 수 있다. 일 실시예에 따르면, 전자 장치(200)는 사용자의 양안에 대응하여 배치된 디스플레이 모듈(예: 좌안에 대응되는 제1 디스플레이 모듈(214-1), 및/또는 우안에 대응되는 제2 디스플레이 모듈(214-2))을 기반으로 가상 객체를 표시할 수 있다. 일 실시예에 따르면, 전자 장치(200)는 설정된 설정 정보(예: 해상도(resolution), 프레임 레이트(frame rate), 밝기, 및/또는 표시 영역)를 기반으로 가상 객체를 표시할 수 있다.
다양한 실시예에 따르면, 투명 부재(220, 230)는 집광 렌즈(미도시) 및/또는 도파관(예: 제1 도파관(220-1) 및/또는 제2 도파관(230-1))을 포함할 수 있다. 예를 들어, 제1 도파관(220-1)은 제1 투명 부재(220)에 부분적으로 위치할 수 있고, 제2 도파관(230-1)은 제2 투명 부재(230)에 부분적으로 위치할 수 있다. 디스플레이 모듈(214-1, 214-2)에서 방출된 광은 투명 부재(220, 230)의 일면으로 입사될 수 있다. 투명 부재(220, 230)의 일면으로 입사된 광은 투명 부재(220, 230) 내에 위치한 도파관(220-1, 230-1)을 통해 사용자에게 전달될 수 있다. 도파관(220-1, 230-1)은 글래스, 플라스틱, 또는 폴리머로 제작될 수 있고, 내부 또는 외부의 일표면에 형성된 나노 패턴을 포함할 수 있다. 예를 들어, 나노 패턴은 다각형 또는 곡면 형상의 격자 구조(grating structure)를 포함할 수 있다. 일 실시예에 따르면, 투명 부재(220, 230)의 일면으로 입사된 광은 나노 패턴에 의해 도파관(220-1, 230-1) 내부에서 전파 또는 반사되어 사용자에게 전달될 수 있다. 일 실시예에 따르면, 도파관(220-1, 230-1)은 적어도 하나의 회절 요소(예: DOE(diffractive optical element), HOE(holographic optical element)) 또는 반사 요소(예: 반사 거울) 중 적어도 하나를 포함할 수 있다. 일 실시예에 따르면, 도파관(220-1, 230-1)은 적어도 하나의 회절 요소 또는 반사 요소를 이용하여 디스플레이 모듈(214-1, 214-2)로부터 방출된 광을 사용자의 눈으로 유도할 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 사용자의 시야각(FoV, field of view)에 대응되는 영상을 촬영하거나 및/또는 객체와의 거리를 측정하기 위한 촬영용 카메라 모듈(213)(예: RGB 카메라 모듈), 사용자가 바라보는 시선의 방향을 확인하기 위한 시선 추적 카메라 모듈(eye tracking camera module)(212-1, 212-2), 및/또는 일정 공간을 인식하기 위한 인식용 카메라 모듈(gesture camera module)(211-1, 211-2)을 포함할 수 있다. 예를 들어, 촬영용 카메라 모듈(213)은 전자 장치(200)의 전면 방향을 촬영할 수 있고, 시선 추적 카메라 모듈(212-1, 212-2)은 상기 촬영용 카메라 모듈(213)의 촬영 방향과 반대되는 방향을 촬영할 수 있다. 예를 들어, 제1 시선 추적 카메라 모듈(212-1)은 사용자의 좌안을 부분적으로 촬영하고, 제2 시선 추적 카메라 모듈(212-2)은 사용자의 우안을 부분적으로 촬영할 수 있다. 일 실시예에 따르면, 촬영용 카메라 모듈(213)은 HR(high resolution) 카메라 모듈 및/또는 PV(photo video) 카메라 모듈과 같은 고해상도의 카메라 모듈을 포함할 수 있다. 일 실시예에 따르면, 시선 추적 카메라 모듈(212-1, 212-2)은 사용자의 눈동자를 검출하여, 시선 방향을 추적할 수 있다. 추적된 시선 방향은 가상 객체를 포함하는 가상 영상의 중심이 상기 시선 방향에 대응하여 이동되는데 활용될 수 있다. 일 실시예에 따르면, 인식용 카메라 모듈(211-1, 211-2)은 설정된 거리 이내(예: 일정 공간)에서의 사용자 제스처 및/또는 일정 공간을 감지할 수 있다. 인식용 카메라 모듈(211-1, 211-2)은 GS(global shutter)를 포함하는 카메라 모듈을 포함할 수 있다. 예를 들어, 인식용 카메라 모듈(211-1, 211-2)은 빠른 손동작 및/또는 손가락과 같은 미세한 움직임을 검출 및 추적하기 위해, RS(rolling shutter) 현상이 감소될 수 있는 GS를 포함하는 카메라 모듈일 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 적어도 하나의 카메라 모듈(211-1, 211-2, 212-1, 212-2, 213)을 사용하여, 좌안 및/또는 우안 중에서 주시안 및/또는 보조시안에 대응되는 눈을 감지할 수 있다. 예를 들어, 전자 장치(200)는 외부 객체 또는 가상 객체에 대한 사용자의 시선 방향에 기반하여, 주시안 및/또는 보조시안에 대응되는 눈을 감지할 수 있다.
도 2a에 도시된 전자 장치(200)에 포함되는 적어도 하나의 카메라 모듈(예: 촬영용 카메라 모듈(213), 시선 추적 카메라 모듈(212-1, 212-2) 및/또는 인식용 카메라 모듈(211-1, 211-2))의 개수 및 위치는 한정되지 않을 수 있다. 예를 들어, 전자 장치(200)의 형태(예: 모양 또는 크기)에 기반하여 적어도 하나의 카메라 모듈(예: 촬영용 카메라 모듈(213), 시선 추적 카메라 모듈(212-1, 212-2) 및/또는 인식용 카메라 모듈(211-1, 211-2))의 개수 및 위치는 다양하게 변경될 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 적어도 하나의 카메라 모듈(예: 촬영용 카메라 모듈(213), 시선 추적 카메라 모듈(212-1, 212-2) 및/또는 인식용 카메라 모듈(211-1, 211-2))의 정확도를 높이기 위한 적어도 하나의 발광 장치(illumination LED)(예: 제1 발광 장치(242-1), 제2 발광 장치(242-2))를 포함할 수 있다. 예를 들어, 제1 발광 장치(242-1)는 사용자의 좌안에 대응하는 부분에 배치될 수 있고, 제2 발광 장치(242-2)는 사용자의 우안에 대응하는 부분에 배치될 수 있다. 일 실시예에서, 발광 장치(242-1, 242-2)는 시선 추적 카메라 모듈(212-1, 212-2)로 사용자의 눈동자를 촬영할 때 정확도를 높이기 위한 보조 수단으로 사용될 수 있고, 적외선 파장의 광을 발생시키는 IR LED를 포함할 수 있다. 또한, 발광 장치(242-1, 242-2)는 인식용 카메라 모듈(211-1, 211-2)로 사용자의 제스처를 촬영할 때 어두운 환경이나 여러 광원의 혼입 및 반사 빛 때문에 촬영하고자 하는 피사체 검출이 용이하지 않을 때 보조 수단으로 사용될 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 사용자의 음성 및 주변 소리를 수신하기 위한 마이크(예: 제1 마이크(241-1), 또는 제2 마이크(241-2))를 포함할 수 있다. 예를 들어, 마이크(241-1, 241-2)는 도 1의 오디오 모듈(170)에 포함된 구성 요소일 수 있다.
다양한 실시예에 따르면, 제 1 지지부(221) 및/또는 제 2 지지부(222)는 인쇄 회로 기판(PCB, printed circuit board)(예: 제1 인쇄 회로 기판(231-1), 제2 인쇄 회로 기판(231-2)), 스피커(speaker)(예: 제1 스피커(232-1), 제2 스피커(232-2)), 및/또는 배터리(예: 제1 배터리(233-1), 제2 배터리(233-2))를 포함할 수 있다.
다양한 실시예에 따르면, 스피커(232-1, 232-2)는 사용자의 좌측 귀에 오디오 신호를 전달하기 위한 제 1 스피커(232-1) 및/또는 사용자의 우측 귀에 오디오 신호를 전달하기 위한 제 2 스피커(232-2)를 포함할 수 있다. 스피커(232-1, 232-2)는 도 1의 오디오 모듈(170)에 포함된 구성 요소일 수 있다.
다양한 실시예에 따르면, 전자 장치(200)는 복수 개의 배터리(233-1, 233-2)가 구비될 수 있고, 전력 관리 모듈(예: 도 1의 전력 관리 모듈(188))을 통해, 인쇄 회로 기판(231-1, 231-2)에 전력을 공급할 수 있다. 예를 들어, 복수 개의 배터리(233-1, 233-2)는 전력 관리 모듈(예: 도 1의 전력 관리 모듈(188))과 전기적으로 연결될 수 있다.
앞에서는, 전자 장치(200)가 증강 현실을 표시하는 장치인 것으로 설명하였으나, 전자 장치(200)는 가상 현실(virtual reality; VR)을 표시하는 장치일 수 있다. 이 경우, 사용자가 투명 부재(220, 230)를 통해 실제 공간을 인식할 수 없도록 투명 부재(220, 230)는 불투명한 소재로 형성될 수 있다. 또한, 투명 부재(220, 230)는 디스플레이 모듈(160)로써 기능할 수 있다. 예를 들어, 투명 부재(220, 230)는 정보를 표시하는 디스플레이 패널을 포함할 수 있다.
다양한 실시예들에 따르면, 전자 장치(200)는 적어도 하나의 센서(예: 착용 감지 센서, 모션 센서, 또는 터치 센서, 미도시) 및 통신 모듈(미도시)을 포함할 수 있다. 일 실시예예 따르면, 적어도 하나의 센서는 전자 장치(200)가 사용자의 신체에 착용여부 및 착용된 자세를 센싱할 수 있다. 예를 들어, 적어도 하나의 센서는 근접 센서 및 그립 센서 중 적어도 하나를 포함할 수 있다. 일 실시예예 따르면, 적어도 하나의 센서는 사용자의 움직임으로 인해 발생하는 자세 변화량을 감지할 수 있다. 예를 들어, 적어도 하나의 센서는 가속도 센서 및 자이로 센서를 포함할 수 있다. 가속도 센서가 3축에 대한 가속도를 센싱하고, 자이로 센서가 3축을 기준으로 하는 각속도를 센싱할 수 있다. 일 실시예예 따르면, 적어도 하나의 센서는 사용자의 손가락 터치 및 스와이프(swipe) 행위와 같은 제스처를 감지할 수 있다. 전자 장치(200)는 적어도 하나의 센서에서 센싱된 터치 데이터에 응답하여, 음악 재생, 중지, 다음 음악 재생, 및/또는 이전 음악 재생 중 적어도 하나 또는 둘 이상의 조합을 포함하는 제어를 수행할 수 있다. 일 실시예예 따르면, 통신 모듈은 무선으로 외부와 통신하는 모듈일 수 있다. 예를 들어, 통신 모듈은 UWB(ultra wide band) 모듈, BT(bluetooth) 네트워크, BLE(Bluetooth low energy) 네트워크, Wi-Fi(Wireless Fidelity) 네트워크, ANT+ 네트워크, LTE(long-term evolution) 네트워크, 5G(5th generation) 네트워크, 및 NB-IoT(Narrowband Internet of Things) 네트워크 중 적어도 하나 또는 둘 이상의 조합을 통해 다른 기기 및/또는 AP(Access Point)와 통신을 수립할 수 있다.
도 2b는 다양한 실시예들에 따른 전자 장치(200)(예: 도 1의 전자 장치(101))의 블록도이다.
도 2b를 참조하면, 전자 장치(200) (예: 도 1의 전자 장치(101))는 프로세서(250)(예: 도 1의 프로세서(120)), 메모리(280)(예: 도 1의 메모리(130)), 통신 모듈(290) (예: 도 1의 통신 모듈(190)), 촬영용 카메라 모듈(213)(예: 도 2a의 촬영용 카메라 모듈(213)), 시선 추적 카메라 모듈(212)(예: 도 2a의 시선 추적 카메라(212-1,212-2)) 및/또는 위치 모듈(270)을 포함할 수 있다. 도 2b에 포함된 구성 요소는 전자 장치(200)에 포함된 구성들의 일부에 대한 것이며 전자 장치(200)는 이 밖에도 도 1에 도시된 것과 같이 다양한 구성요소를 포함할 수 있다.
일 실시예에 따라서, 촬영용 카메라 모듈(213)은 전자 장치를 착용한 사용자의 전방의 영상을 촬영하는 카메라일 수 있다. 프로세서(250)는 촬영용 카메라 모듈(213)이 촬영한 영상을 이용하여 이미지 쿼리를 생성할 수 있다. 이미지 쿼리는, 촬영용 카메라 모듈(213)이 촬영한 영상과 관련한 작업을 요청하는 것을 지칭할 수 있다. 일 예시에 따르면, 이미지 쿼리는, 촬영용 카메라 모듈(213)이 촬영한 영상의 적어도 일부와 관련된 정보를 요청하는 것일 수 있다.
일 실시예에 따라서, 시선 추적 카메라 모듈(212)은 전자 장치(200)를 착용한 사용자의 눈동자를 포함하는 영상을 획득할 수 있다. 전자 장치(200)는 시선 추적 카메라 모듈(212)에서 획득한 영상으로부터 사용자의 눈동자의 영역을 검출하여, 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 프로세서(250)는 시선 추적 카메라 모듈(212)에서 촬영된 영상에 기초하여 사용자의 시선 방향을 검출하고, 검출한 시선 방향에 기반하여, 영상 내에 포함된 적어도 하나의 객체(예: 주요 객체, 보조 객체)를 결정할 수 있다.
일 실시예에 따라서, 위치 모듈(270)은 전자 장치(200)의 위치와 관련된 정보를 측정할 수 있다.
예를 들어, 위치 모듈(270)은 GNSS(예: GPS(global positioning system) 및/또는 GLONASS(global navigation satellite system))를 포함하여 전자 장치(200)의 지리적 위치를 측정할 수 있다. 예를 들어, GNSS는 GPS 센서 및/또는 GLONASS 센서를 이용하여 복수의 위성으로부터 발사되는 전파에 기반하여 현재의 위치를 측정하는 시스템일 수 있다. 예를 들어, 위치 모듈(270)은 공간 지도를 작성하기 위하여, 전자 장치(200)의 위치외 관련된 정보를 측정할 수 있다. 예를 들어, 위치 모듈(270)은 외부 객체와의 거리 및 전자 장치의 움직임과 관련된 정보에 기반하여 전자 장치의 위치와 관련된 정보를 측정할 수 있다. 위치 모듈(270)은 전자 장치(200)의 위치 측정에 사용되는 적어도 하나의 하드웨어 및/또는 소프트웨어 모듈을 포함할 수 있다.
일 실시예에 따라서, 통신 모듈(290)은 네트워크(예: 도 1의 제1네트워크(198) 및/또는 제2네트워크(199))를 통하여 외부 전자 장치와 통신하여 다양한 정보를 수신 및/또는 송신할 수 있다. 통신 모듈(290)은 도 1의 통신 모듈(190)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다. 프로세서(250)는 통신 모듈(290)과 연결되어 통신 모듈(290)이 외부 전자 장치로부터 수신한 다양한 정보를 처리할 수 있다. 또한, 프로세서(250)는 통신 모듈(290)이 다양한 정보를 외부 전자 장치로 송신하도록 제어할 수 있다. 예를 들어, 통신 모듈(290)은 서버(1000)에 프로세서(250)로부터 제공되는 이미지 쿼리를 송신하고, 서버(1000)로부터 주요 객체의 검색 결과를 수신할 수 있다.
일 실시예에 따르면, 메모리(280)는 적어도 하나의 휘발성 메모리 및 비휘발성 메모리를 포함하여 다양한 데이터를 일시적으로 또는 비일시적으로 저장할 수 있다. 메모리(280)는 도 1의 메모리(130)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다. 일 실시예에 따라서, 메모리(280)는 학습된 딥러닝 모델 및/또는 객체 정보와 관련된 북마크 중 적어도 하나를 일시적으로 또는 비일시적으로 저장할 수 있다.
일 실시예에 따르면, 프로세서(250)는 전자 장치(200)의 각 구성 요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 수행할 수 있는 구성으로써, 하나 이상의 프로세서들로 구성될 수 있다. 프로세서(250)는 도 1의 프로세서(120)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다. 프로세서(250)는 메모리(280), 통신 모듈(290), 촬영용 카메라 모듈(213), 시선 추적 카메라 모듈(212) 및/또는 위치 모듈(270)을 포함하는 전자 장치(250)의 각 구성 요소와 작동적으로(operatively), 기능적으로(functionally) 및/또는 전기적으로(electrically) 연결될 수 있다. 프로세서(250)의 동작들은 메모리(280)에 저장된 인스트럭션들(instructions)을 로딩하여 수행될 수 있다.
일 실시예에 따라서, 프로세서(250)는 객체에 대한 이미지 쿼리를 생성하여 정보를 표시할 수 있다.
일 실시예에 따른 프로세서(250)는, 이미지 쿼리를 생성할 수 있다. 예를 들어, 프로세서(250)는, 검색의 대상이 되는 주요 객체 및 데이터 베이스에서 주요 객체와 동일한 이미지에 포함될 가능성이 높은 객체인 보조 객체에 기반하여 이미지 쿼리를 생성할 수 있다. 예를 들어, 이미지 쿼리는 획득한 영상의 적어도 일부와 관련된 정보의 요청을 포함할 수 있다.
일 실시예에 따른 프로세서(250)는, 위치와 관련된 정보에 기반하여 공간 지도를 작성하고, 공간 지도와 실제 지도를 비교하여 객체와 관련된 정보를 추출할 수 있다. 예를 들어, 프로세서(250)는 위치 모듈(270)이 측정한 전자 장치(200)의 지리적 위치에 기반하여, 공간 지도를 작성할 공간을 결정할 수 있다. 예를 들어, 프로세서(250)는 결정된 공간에 기반하여, SLAM(simultaneous localization and mapping, 동시적 위치추정 및/또는 지도작성) 알고리즘을 이용하여 공간 지도를 작성할 수 있다. 공간 지도를 작성하는데 사용되는 알고리즘은 이에 한정되지 않는다.
일 실시예에 따른 프로세서(250)는, 서버(1000)로부터 주요 객체와 관련된 정보를 획득할 수 있다. 예를 들어, 프로세서(250)는 서버(1000)로부터 주요 객체에 대한 검색 결과를 획득할 수 있다.
일 실시예에 따른 프로세서(250)는, 주요 객체와 관련된 정보를 표시할 수 있다. 예를 들어, 프로세서(250)는 전자 장치(200)의 디스플레이(미도시)에 주요 객체와 관련된 정보를 표시하거나 및/또는 외부 전자 장치(200)에 주요 객체와 관련된 정보를 표시하도록 관련 정보를 전송할 수 있다.
도 2c는 다양한 실시예들에 따른 전자 장치(200) 및 서버(1000)의 블록도이다.
다양한 실시예에 따르면, 전자 장치(200)는 이미지 쿼리 취득부(251), 위치 정보 취득부(252) 및/또는 검색 결과 관리 및 표시부(253)를 포함할 수 있다.
일 실시예에 따르면, 이미지 쿼리 취득부(251)는 촬영용 카메라 모듈(213)가 촬영한 영상을 이용하여 이미지 쿼리를 생성할 수 있다. 이미지 쿼리는, 촬영용 카메라 모듈(213)가 촬영한 영상과 관련한 작업을 요청하는 것을 지칭할 수 있다. 예를 들어, 이미지 쿼리는, 촬영용 카메라 모듈(213)가 촬영한 영상의 적어도 일부와 관련된 정보를 요청하는 것일 수 있다.
예를 들어, 이미지 쿼리 취득부(251)는, 검색의 대상이 되는 주요 객체 및 데이터 베이스에서 주요 객체와 동일한 이미지에 포함될 가능성이 높은 객체인 보조 객체에 기반하여 이미지 쿼리를 생성할 수 있다.
일 실시예에 따르면, 위치 정보 취득부(252)는 위치와 관련된 정보에 기반하여 공간 지도를 작성하고, 공간 지도와 실제 지도를 비교하여 객체와 관련된 정보를 추출할 수 있다. 예를 들어, 위치 정보 취득부(252)는 위치 모듈(270)이 측정한 전자 장치(200)의 지리적 위치에 기반하여, 공간 지도를 작성할 공간을 결정할 수 있다. 예를 들어, 프로세서(250)는 결정된 공간에 기반하여, SLAM(simultaneous localization and mapping, 동시적 위치추정 및/또는 지도작성) 알고리즘을 이용하여 공간 지도를 작성할 수 있다.
일 실시예에 따르면, 검색 결과 관리 및 표시부(253)는 서버(1000)로부터 주요 객체와 관련된 정보를 획득할 수 있다. 예를 들어, 검색 결과 관리 및 표시부(253)는 서버(1000)로부터 주요 객체에 대한 검색 결과를 획득할 수 있다.
일 실시예에 따른 검색 결과 관리 및 표시부(253)는, 주요 객체와 관련된 정보를 표시할 수 있다. 예를 들어, 검색 결과 관리 및 표시부(253)는 전자 장치(200)의 디스플레이(미도시)에 주요 객체와 관련된 정보를 표시하거나 및/또는 외부 전자 장치(200)에 주요 객체와 관련된 정보를 표시하도록 관련 정보를 전송할 수 있다.
다양한 실시예에 다르면, 서버(1000)는 객체 검색부(1100)를 포함할 수 있다.
일 실시예에 따르면, 객체 검색부(1100)는 인터넷 객체 검색부(1111) 및/또는 데이터 베이스 객체 검색부(1112)를 포함할 수 있다.
일 실시예에 따르면, 서버(1000)는 다양한 객체의 정보(예: 객체의 이미지, 설명)를 저장하는 데이터 베이스를 포함할 수 있다. 객체 검색부(1100)는 데이터 베이스(예: 쇼핑몰 및/또는 매장 상품 데이터 베이스)에 주요 객체를 포함하는 이미지가 존재하는지 여부를 확인할 수 있다.
일 실시예에 따르면, 인터넷 객체 검색부(1111)는 데이터 베이스에 주요 객체와 관련된 정보가 존재하지 않음에 대응하여, 인터넷에 기반하여 네트워크를 통해 다른 외부 서버에서 주요 객체를 검색할 수 있다.
일 실시예에 따르면, 데이터 베이스 객체 검색부(1112)는 데이터 베이스에 주요 객체와 관련된 정보가 존재함에 대응하여, 데이터 베이스에 기반하여 주요 객체를 검색할 수 있다.
일 실시예에 따른 객체 검색부(1100)는, 이미지 기반 딥러닝 알고리즘을 이용하여 이미지 쿼리에 포함된 주요 객체의 정보를 검색할 수 있다. 예를 들어, 객체 검색부(1100)는 주요 객체와 보조 객체와 관련된 정보가 포함된 이미지 쿼리에서, 주요 객체, 보조 객체, 주요 객체의 일부에 대한 정보, 객체 사이의 연관된 정도 및/또는 클래스 정보에 기반하여 주요 객체의 정보를 검색할 수 있다.
일 실시예에 따른 객체 검색부(1100)는, 주요 객체 및 보조 객체와 관련된 정보가 포함된 이미지 쿼리에 기반하여, 데이터 베이스 및/또는 인터넷에서 주요 객체에 대응되는 이미지 및/또는 주요 객체와 복수의 객체가 혼재하는 이미지에 대하여 주요 객체와 관련된 정보를 검색할 수 있다. 예를 들어, 데이터 베이스 및/또는 인터넷에는 주요 객체의 완전한 이미지가 저장되어 있을 수 있고, 또는 주요 객체의 일부 이미지가 저장되어 있을 수 있고, 또는 주요 객체와 보조 객체가 모두 포함되는 이미지가 저장되어 있을 수 있다.
일 실시예에 따른 객체 검색부(1100)는, 주요 객체와 보조 객체와 관련된 정보가 포함된 이미지 쿼리에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다. 예를 들어, 객체 검색부(1100)는, 주요 객체의 일부 영역만 이미지 쿼리에 포함된 경우, 주요 객체의 일부 영역에 대하여 중요도를 높이고, 나머지 영역에 대하여는 중요도를 낮추어 이미지 쿼리를 검색 후보에 추가할 수 있다. 예를 들어, 객체 검색부(1100)는 주요 객체와 보조 객체의 연관성 정도에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다. 예를 들어, 객체 검색부(1100)는 주요 객체와 보조 객체의 클래스 정보에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다.
일 실시예에 따른 객체 검색부(1100)는, 검색된 주요 객체의 정보 중에서, 객체의 실제 위치에 기반한 정보(예: 객체가 위치한 매장의 브랜드 정보)에 기반하여, 검색 결과를 필터링할 수 있다.
다양한 실시예에 따르면, 서버(1000)는, 검색 결과를 전자 장치(200)에 전송할 수 있다. 예를 들어, 서버(1000)는 우선순위를 포함하는 복수의 검색 결과를 전자 장치(200)에 제공할 수 있다.
도 3은, 다양한 실시예에 따른 전자 장치(200)의 프로세서(250)가 객체에 대한 이미지 쿼리를 생성하여 정보를 표시하는 방법을 도시한 흐름도이다.
도시된 동작 중 적어도 일부는 프로세서(250)가 아닌 전자 장치(200)의 다른 구성에 의해 수행될 수도 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 310에서, 이미지 쿼리를 생성할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 촬영용 카메라 모듈(213)로부터 획득한 영상에서 적어도 하나 이상의 객체를 추출할 수 있다. 예를 들어, 프로세서(250)는 촬영용 카메라 모듈(213)로부터 전자 장치(200)를 착용한 사용자의 전면이 촬영된 영상을 획득할 수 있다. 예를 들어, 프로세서(250)는 딥러닝(예: CNN, convolutional layers) 알고리즘 이용하여 영상을 객체별로 분류할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 분할된 객체 내에서 주요 객체를 결정할 수 있다. 예를 들어, 주요 객체는 검색의 대상이 되는 객체일 수 있다. 예를 들어, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적하고, 촬영용 카메라 모듈(213)로부터 획득한 영상에서 추출된 적어도 하나의 객체 중 사용자의 시선 방향에 위치하는 객체를 주요 객체로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 주요 객체에 지정된 거리 내에 위치한 인접 객체에 대하여, 주요 객체와의 연관성을 확인하여, 보조 객체를 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 일 실시예에 따르면, 프로세서(250)는 연관성 유무 판단에 따른 보조 객체 유무에 기반하여 이미지 쿼리를 생성할 수 있다. 예를 들어, 이미지 쿼리는 주요 객체가 일부 가려진 이미지인 경우, 주요 객체의 가려진 영역과 관련된 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는 주요 객체 및/또는 보조 객체의 연관성의 정도, 및/또는 클래스 정보를 포함할 수 있다.
동작 310과 관련한 자세한 내용은 도 4a와 관련된 설명에서 후술한다.
다양한 실시예에 따른 프로세서(250)는, 동작 320에서, 위치 정보를 획득하여 분석할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 위치 모듈(270)로부터 위치와 관련된 정보를 획득할 수 있다. 예를 들어, 위치 모듈(270)은 전자 장치(200)의 위치와 관련된 정보를 측정할 수 있다. 예를 들어, 위치 모듈(270)은 GNSS(예: GPS(global positioning system) 및/또는 GLONASS(global navigation satellite system))를 포함하여 전자 장치(200)의 지리적 위치를 측정할 수 있다. 예를 들어, GNSS는 GPS 센서 및/또는 GLONASS 센서를 이용하여 복수의 위성으로부터 발사되는 전파에 기반하여 현재의 위치를 측정하는 시스템일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 위치와 관련된 정보에 기반하여 공간 지도를 작성할 수 있다. 예를 들어, 프로세서(250)는 위치 모듈(270)이 측정한 외부 객체와의 거리 및 전자 장치(200)의 움직임과 관련된 정보에 기반하여, SLAM(simultaneous localization and mapping, 동시적 위치추정 및/또는 지도작성) 알고리즘을 이용하여 공간 지도를 작성할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 공간 지도와 실제 지도를 비교하여 객체와 관련된 정보를 추출할 수 있다. 예를 들어, 프로세서(250)는 전자 장치(200)의 실제 위치에 기반하여, 객체의 실제 위치를 확인할 수 있다. 예를 들어, 프로세서(250)는 전자 장치(200)의 실제 위치와, 사용자의 시선 방향 및/또는 영상 내의 객체와의 상대적 거리에 기반하여 객체의 실제 위치를 계산할 수 있다. 예를 들어, 프로세서(250)는 객체의 실제 위치에 기반하여 객체와 관련된 정보(예: 객체가 위치한 매장의 브랜드 정보)를 추출할 수 있다.
동작 320과 관련한 자세한 내용은 도 5와 관련된 설명에서 후술한다.
다양한 실시예에 따른 프로세서(250)는, 동작 330에서, 서버(1000)에 이미지 쿼리 및/또는 위치 정보를 전송하고, 서버(1000)로부터 주요 객체와 관련된 정보를 획득할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)에 이미지 쿼리 및/또는 위치 정보를 전송할 수 있다. 예를 들어, 프로세서(250)는 통신 모듈(290)을 이용하여 서버(1000)에 이미지 쿼리 및/또는 위치 정보를 전송할 수 있다.
일 실시예에 따르면, 서버(1000)는, 상기 이미지 쿼리 및/또는 위치 정보를 이용하여 데이터 베이스 및/또는 인터넷에 기반하여 객체를 검색할 수 있다. 예를 들어, 서버(1000)는 이미지 기반 딥러닝 알고리즘을 이용하여 이미지 쿼리에 포함된 주요 객체의 정보를 검색할 수 있다.
일 실시예에 따르면, 서버(1000)는, 검색 결과를 전자 장치(200)에 전송할 수 있다. 예를 들어, 서버(1000)는 우선순위를 포함하는 복수의 검색 결과를 전자 장치(200)에 제공할 수 있다.
동작 330과 관련한 자세한 내용은 도 6와 관련된 설명에서 후술한다.
다양한 실시예에 따른 프로세서(250)는, 동작 340에서, 주요 객체와 관련된 정보를 표시할 수 있다.
일 실시예에 따른 프로세서(250)는, 서버(1000)가 전송한 주요 객체와 관련된 검색 결과와 관련된 정보를 획득할 수 있다.
일 실시예에 따른 프로세서(250)는, 전자 장치(200)의 디스플레이에 주요 객체와 관련된 정보를 표시하거나 및/또는 외부 전자 장치에 주요 객체와 관련된 정보를 표시하도록 관련 정보를 전송할 수 있다.
동작 340과 관련한 자세한 내용은 도 7와 관련된 설명에서 후술한다.
도 4a는, 다양한 실시예에 따른 프로세서(250)가 객체에 대한 이미지 쿼리를 생성하는 방법을 도시한 흐름도이다.
다양한 실시예에 따르면, 프로세서(250)는, 동작 410에서, 영상에서 적어도 하나 이상의 객체를 추출하여 분류할 수 있다.
일 실시예에 따르면, 촬영용 카메라 모듈(213)는 전자 장치(200)를 착용한 사용자의 전면을 촬영할수 있다. 프로세서(250)는 촬영용 카메라 모듈(213)로부터 촬영된 영상을 획득할 수 있다.
일 실시예에 따르면, 프로세서(250)는 딥러닝(예: CNN, convolutional layers) 알고리즘 이용하여 영상에서 객체를 추출하여 분류할 수 있다. 예를 들어, 프로세서(250)는 영상에서 객체를 추출하는 시멘틱 세그멘테이션(semntic segmentation) 모델 및/또는 영상에서 픽셀 단위로 객체를 분류하는 인스턴스 세그멘테이션(instance segmentation) 모델을 이용하여 영상 내의 객체를 추출 및 분류할 수 있으며, 이에 한정되지는 않는다.
예를 들어, 프로세서(250)는 클래스가 부여된 객체를 분류할 수 있다. 예를 들어, 프로세서(250)는 영상 내에서 A 클래스에 포함되는 객체들에 대하여는 "A 클래스 제 1 객체", "A 클래스 제 2 객체", 또는 "A 클래스 제 2 객체"와 같이 분류할 수 있고, B 클래스에 포함되는 객체들에 대하여는 "B 클래스 제 1 객체", 또는 "B 클래스 제 2 객체"와 같이 분류할 수 있다.
또한, 예를 들어, 프로세서(250)는 복수의 계층을 가지는 클래스가 부여된 객체를 분류할 수 있다. 예를 들어, 프로세서(250)는 상위 클래스를 A 클래스, B 클래스, 또는 C 클래스와 같이 분류하고, 각 상위 클래스의 하위 클래스를 A 클래스-제 1 클래스, A 클래스-제 2 클래스, B 클래스-제 1 클래스, 또는 B 클래스-제 2 클래스와 같이 분류할 수 있다. 예를 들어, 프로세서(250)는 영상 내에서 A 클래스-제 1 클래스에 포함된 객체들에 대하여는 "A 클래스-제 1 클래스-제 1 객체", 또는 "A 클래스-제 1 클래스-제 2 객체"와 같이 분류할 수 있고, A 클래스-제 2 클래스에 포함된 객체들에 대하여는 "A 클래스-제 2 클래스-제 1 객체", 또는 "A 클래스-제 2 클래스-제 2 객체"와 같이 분류할 수 있다.
다양한 실시예에 따르면, 프로세서(250)는, 동작 420에서, 주요 객체를 결정할 수 있다.
예를 들어, 주요 객체는 획득된 영상 내에서 추출된 적어도 하나의 객체 중 검색의 대상이 되는 객체일 수 있다.
일 실시예에 따르면, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 시선 추적 카메라 모듈(212)은 사용자의 안구를 촬영하고, 프로세서(250)는 시선 추적 카메라 모듈(212)이 촬영한 영상에서 사용자의 눈동자를 검출하여, 시선 방향을 추적할 수 있다.
일 실시예에 따르면, 프로세서(250)는 동작 410에서 분류된 적어도 하나의 객체 중에서, 추적된 사용자의 시선 방향과 일치하는 객체를 주요 객체로 결정할 수 있다. 예를 들어, 프로세서(250)는, 사용자의 시선이 "A 클래스-제 1 클래스-제 1 객체"(예: 상의-셔츠-제 1 셔츠)에 향해있는 경우, "A 클래스-제 1 클래스-제 1 객체"를 주요 객체로 결정할 수 있다.
다양한 실시예에 따르면, 프로세서(250)는, 동작 430에서, 인접한 객체 및/또는 다른 객체의 주요 객체에 대한 연관성을 확인할 수 있다.
일 실시예에 따르면, 프로세서(250)는 주요 객체에 지정된 거리 내에 위치한 인접 객체에 대하여, 주요 객체와의 연관성을 확인하여, 보조 객체를 결정할 수 있다.
예를 들어, 보조 객체는 데이터 베이스에서 주요 객체와 동일한 이미지에 포함될 가능성이 높은 객체일 수 있다. 예를 들어, 쇼핑몰에서 주요 객체와 자주 매칭 코디되는 아이템이 보조 객체의 예시일 수 있다. 보조 객체는 이미지 쿼리에서 주요 객체의 보조적 정보 역할을 할 수 있다.
일 실시예에 따르면, 프로세서(250)는 주요 객체와 인접 객체의 상위 클래스가 동일한지 여부에 기반하여 연관성 유무를 판단할 수 있다.
예를 들어, 프로세서(250)는 동작 410에서 분류된 주요 객체의 상위 클래스와 인접 객체의 상위 클래스가 동일한 경우, 인접 객체가 주요 객체와 연관성이 있다고 판단하고, 보조 객체로 결정할 수 있다. 예를 들어, 주요 객체가 "A 클래스-제 1 클래스-제 1 객체" (예: 상의-셔츠-제 1 셔츠)이고, 인접 객체가 "A 클래스-제 2 클래스-제 1 객체" (예: 상의-자켓-제 1 자켓)인 경우, "A 클래스-제 2 클래스-제 1 객체"를 보조 객체로 결정할 수 있다.
예를 들어, 프로세서(250)는 동작 410에서 분류된 주요 객체의 상위 클래스와, 인접 객체의 상위 클래스가 상이한 경우, 인접 객체가 주요 객체와 연관성이 없다고 판단하고, 인접 객체를 보조 객체로 결정하지 않을 수 있다.
일 실시예에 따르면, 프로세서(250)는 주요 객체와 인접 객체가 연관성 있다고 판단함에 기반하여, 주요 객체와 인접 객체의 클래스의 유사성에 기반하여 연관성의 정도를 결정할 수 있다.
예를 들어, 프로세서(250)는 주요 객체의 클래스와 보조 객체의 클래스를 지정된 유사도에 따라 연관성을 결정할 수 있다. 예를 들어, 주요 객체가 "셔츠"이고, 보조 객체가 "코트"인 경우에, 지정된 유사도에 따라 연관성 정도를 결정할 수 있다. 예를 들어, 주요 객체가 "셔츠"이고, 보조 객체가 "가디건"인 경우에, 지정된 유사도에 따라, 연관성 정도를 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는 인접 객체가 연관성이 없음에 대응하여, 인접 객체가 아닌 다른 객체와 주요 객체의 연관성을 확인할 수 있다.
예를 들어, 프로세서(250)는 동작 410에서 분류된 주요 객체의 상위 클래스와, 다른 객체의 상위 클래스가 동일한 경우, 다른 객체가 주요 객체와 연관성이 있다고 판단하고, 보조 객체로 결정할 수 있다. 예를 들어, 프로세서(250)는 동작 410에서 분류된 주요 객체의 상위 클래스와, 다른 객체의 상위 클래스가 상이한 경우, 다른 객체가 주요 객체와 연관성이 없다고 판단하고, 다른 객체를 보조 객체로 결정하지 않을 수 있다.
다양한 실시예에 따르면, 프로세서(250)는, 동작 440에서, 이미지 쿼리를 생성하고 서버(1000)에 전송할 수 있다.
일 실시예에 따르면, 프로세서(250)는 연관성 유무 판단에 따른 보조 객체 유무에 기반하여 이미지 쿼리를 생성할 수 있다.
예를 들어, 프로세서(250)는, 동작 430에서 인접 객체 및/또는 다른 객체를 보조 객체로 결정하지 않은 경우, 주요 객체에 기반하여 이미지 쿼리를 생성할 수 있다.
예를 들어, 프로세서(250)는, 동작 430에서 인접 객체 및/또는 다른 객체를 보조 객체로 결정한 경우, 주요 객체 및 보조 객체에 기반하여 이미지 쿼리를 생성할 수 있다. 주요 객체 및 보조 객체에 기반한 이미지 쿼리는, 서버(1000)에서 이미지 쿼리에 기반한 검색 시에, 보조 객체가 주요 객체의 부가 정보 역할을 하여 검색의 정확도를 높일 수 있다.
일 실시예에 따르면, 프로세서(250)는 주요 객체가 일부 가려진 이미지인 경우, 주요 객체의 가려진 영역과 관련된 정보를 부가하여 이미지 쿼리를 생성할 수 있다.
일 실시예에 따르면, 프로세서(250)는 주요 객체 및/또는 보조 객체의 연관성의 정도, 클래스 정보를 부가하여 이미지 쿼리를 생성할 수 있다.
일 실시예에 따른 이미지 쿼리는, 검색의 대상인 주요 객체 및 주요 객체와 관련된 보조 객체와 관련된 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는, 주요 객체가 일부 가려진 이미지인 경우, 주요 객체의 가려진 영역과 관련된 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는 주요 객체 및/또는 보조 객체의 연관성의 정도, 클래스 정보를 포함할 수 있다.
일 실시예에 따르면, 프로세서(250)는 생성한 이미지 쿼리를 통신 모듈(290)을 이용하여 서버(1000)에 전송할 수 있다.
다양한 실시예에 따르면, 프로세서(250)는, 동작 450에서, 이미지 쿼리에 대응하는 정보를 수신할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)에 송신한 이미지 쿼리에 대응되는 정보를 서버(1000)로부터 수신할 수 있다. 예를 들어, 프로세서(250)는 주요 객체에 대한 정보(예: 가격, 사이즈)를 서버(1000)로부터 수신할 수 있다.
도 4b는 다양한 실시예에 따른 프로세서(250)가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
도 4b의 그림 (a)는 촬영용 카메라 모듈(213)로가 촬영된 영상 원본이고, 그림 (b)는 프로세서(250)가 객체별로 추출한 영상의 예시일 수 있다.
도 4b의 그림 (b)를 참조하면, 프로세서(250)는 그림 (a)에 대응되는 영상에서, 객체를 포함하는 이미지의 일부를 추출할 수 있다. 또는, 프로세서(250)는, 그림 (a)에 대응되는 영상에서 적어도 하나 이상의 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 복수의 계층을 가지는 클래스가 부여된 객체를 분류할 수 있다.
예를 들어, 프로세서(250)는 시멘틱 세그멘테이션(semntic segmentation) 및/또는 인스턴스 세그멘테이션(instance segmentation) 모델을 이용하여, "상의-셔츠"클래스에 속하는 "셔츠", "상의-자켓"클래스에 속하는 "자켓", "하의-바지" 클래스에 속하는 "바지", "악세서리-신발"클래스에 속하는 "신발", "악세서리-가방" 클래스에 속하는 "제 1 가방" 및 "제 2 가방", "사람-얼굴" 클래스에 속하는 "얼굴", "사람-머리" 클래스에 속하는 "머리", 또는 "악세서리-선글라스" 클래스에 속하는 "선글라스"의 객체를 추출하여 분류할 수 있다.
일 실시예에 따르면, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 도 4b는, 사용자가 "셔츠"를 응시하는 상태일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 추적된 사용자의 시선 방향과 일치하는 "셔츠"를 주요 객체(401-1)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체의 "셔츠"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "셔츠"와 지정된 거리 내에 존재하는 객체인 "자켓"을 인접한 객체로 인식하고, "셔츠"와 "자켓"의 상위 클래스가 동일한지 여부를 확인할 수 있다. "셔츠"의 상위 클래스는 "상의"이고, "자켓"의 상위 클래스는 "상의"로 일치하므로, 프로세서(250)는 "자켓"이 "셔츠"와 연관성이 있다고 판단하고, "자켓"을 보조 객체(402-1)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, "셔츠"를 주요 객체(401-1)로, "자켓"을 보조 객체(402-1)로 하는 이미지 쿼리를 생성하여 서버(1000)에 전송할 수 있다.
일 실시예에 따르면, 서버(1000)는 이미지 쿼리에 기반하여, "셔츠"의 정보를 검색할 수 있다. 예를 들어, 서버(1000)는 "셔츠"를 검색하기 위하여 "셔츠" 및 "자켓"과 관련된 정보를 이용하여 정보를 검색할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)로부터 "셔츠"에 대한 정보를 획득할 수 있다.
도 4c는 다양한 실시예에 따른 프로세서(250)가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
그림 (a)는 촬영용 카메라 모듈(213)로가 촬영된 영상 원본이고, 그림 (b)는 프로세서(250)가 객체별로 추출한 영상의 예시일 수 있다.
그림 (b)를 참조하면, 프로세서(250)는 그림 (a)에 대응되는 영상에서, 객체를 포함하는 이미지의 일부를 추출할 수 있다. 또는, 프로세서(250)는, 그림 (a)에 대응되는 영상에서 적어도 하나 이상의 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 복수의 계층을 가지는 클래스가 부여된 객체를 분류할 수 있다.
예를 들어, 프로세서(250)는 시멘틱 세그멘테이션(semntic segmentation) 및/또는 인스턴스 세그멘테이션(instance segmentation) 모델을 이용하여, "상의-블라우스" 클래스에 속하는 "제 1 블라우스", "상의- 블라우스"클래스에 속하는 "제 2 블라우스", "상의-블라우스" 클래스에 속하는 "제 3 블라우스", "상의-블라우스" 클래스에 속하는 "제 4 블라우스" 및/또는 상의-블라우스" 클래스에 속하는 "제 5 블라우스"로 영상에서 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 도 4c는, 사용자가 "제 2 블라우스"를 응시하는 상태일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 추적된 사용자의 시선 방향과 일치하는 "제2 블라우스"를 주요 객체(401-2)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체의 "제 2 블라우스"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "제 2 블라우스"와 지정된 거리 내에 존재하는 객체인 "제 1 블라우스"을 인접한 객체로 인식하고, "제 2 블라우스"와 "제 1 블라우스"의 상위 클래스가 동일한지 여부를 확인할 수 있다. "제 2 블라우스"의 상위 클래스는 "상의"이고, "제 1 블라우스"의 상위 클래스는 "상의"로 일치하므로, 프로세서(250)는 "제 1 블라우스"가 "제 2 블라우스"와 연관성이 있다고 판단하고, "제 1 블라우스"을 보조 객체(402-2)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, "제 2 블라우스"를 주요 객체(401-2)로, "제 1 블라우스"을 보조 객체(402-2)로 하는 이미지 쿼리를 생성하여 서버(1000)에 전송할 수 있다.
일 실시예에 따르면, 서버(1000)는 이미지 쿼리에 기반하여, "제 2 블라우스"의 정보를 검색할 수 있다. 예를 들어, 서버(1000)는 "제 2 블라우스"를 검색하기 위하여 "제 2 블라우스" 및 "제 1 블라우스"과 관련된 정보를 이용하여 정보를 검색할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)로부터 "제 2 블라우스"에 대한 정보를 획득할 수 있다.
도 4d는 다양한 실시예에 따른 프로세서(250)가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
그림 (a)는 촬영용 카메라 모듈(213)로 촬영된 영상 원본이고, 그림 (b)는 프로세서(250)가 객체별로 추출한 영상의 예시일 수 있다.
그림 (b)를 참조하면, 프로세서(250)는 그림 (a)에 대응되는 영상에서, 객체를 포함하는 이미지의 일부를 추출할 수 있다. 또는, 프로세서(250)는, 그림 (a)에 대응되는 영상에서 적어도 하나 이상의 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 복수의 계층을 가지는 클래스가 부여된 객체를 분류할 수 있다.
예를 들어, 프로세서(250)는 시멘틱 세그멘테이션(semntic segmentation) 및/또는 인스턴스 세그멘테이션(instance segmentation) 모델을 이용하여, "컴퓨터" 클래스에 속하는 "모니터", "컴퓨터"클래스에 속하는 "컴퓨터 본체", "가구" 클래스에 속하는 "책상", 및/또는 "가구" 클래스에 속하는 "의자"로 영상을 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 도 4d는, 사용자가 "모니터"를 응시하는 상태일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 추적된 사용자의 시선 방향과 일치하는 "모니터"를 주요 객체(401-2)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체의 "모니터"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "모니터"와 지정된 거리 내에 존재하는 객체인 "책상"을 인접한 객체로 인식하고, "모니터"와 "책상"의 상위 클래스가 동일한지 여부를 확인할 수 있다. "모니터"의 상위 클래스는 "컴퓨터"이고, "책상"의 상위 클래스는 "가구"로 불일치하므로, 프로세서(250)는 "책상"이 "모니터"와 연관성이 없다고 판단할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체가 아닌 다른 객체의 "모니터"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "모니터"와 지정된 거리 내에 존재하지 않는 객체인 "본체"를 인식하고, "모니터"와 "본체"의 상위 클래스가 동일한지 여부를 확인할 수 있다. "모니터"의 상위 클래스는 "컴퓨터"이고, "본체"의 상위 클래스는 "컴퓨터"로 일치하므로, 프로세서(250)는 "본체"와 "모니터"가 연관성이 있다고 판단하고, "본체"를 보조 객체(402-3)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, "모니터"를 주요 객체(401-3)로, "본체"를 보조 객체(402-3)로 하는 이미지 쿼리를 생성하여 서버(1000)에 전송할 수 있다.
일 실시예에 따르면, 서버(1000)는 이미지 쿼리에 기반하여, "모니터"의 정보를 검색할 수 있다. 예를 들어, 서버(1000)는 "모니터"를 검색하기 위하여 "모니터" 및 "본체"와 관련된 정보를 이용하여 정보를 검색할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)로부터 "모니터"에 대한 정보를 획득할 수 있다.
도 4e는 다양한 실시예에 따른 프로세서(250)가 주요 객체 및 보조 객체를 결정하는 예시를 도시한 도면이다.
그림 (a)는 촬영용 카메라 모듈(213)로가 촬영된 영상 원본이고, 그림 (b)는 프로세서(250)가 객체별로 추출한 영상의 예시일 수 있다.
그림 (b)를 참조하면, 프로세서(250)는 그림 (a)에 대응되는 영상에서, 객체를 포함하는 이미지의 일부를 추출할 수 있다. 또는, 프로세서(250)는, 그림 (a)에 대응되는 영상에서 적어도 하나 이상의 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 복수의 계층을 가지는 클래스가 부여된 객체를 분류할 수 있다.
예를 들어, 프로세서(250)는 시멘틱 세그멘테이션(semntic segmentation) 및/또는 인스턴스 세그멘테이션(instance segmentation) 모델을 이용하여, "컴퓨터" 클래스에 속하는 "노트북", "식물" 클래스에 속하는 "제 1 화분", "식물" 클래스에 속하는 "제 2 화분", "식물" 클래스에 속하는 "제 3 화분" 및/또는 "식물" 클래스에 속하는 "제 4 화분"으로 영상에서 객체를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 시선 추적 카메라 모듈(212)을 이용하여 사용자의 시선 방향을 추적할 수 있다. 예를 들어, 도 4e는, 사용자가 "노트북"을 응시하는 상태일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 추적된 사용자의 시선 방향과 일치하는 "노트북"을 주요 객체(401-4)로 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체의 "노트북"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "노트북"과 지정된 거리 내에 존재하는 객체인 "제 1 화분"을 인접한 객체로 인식하고, "노트북"과 "제 1 화분"의 상위 클래스가 동일한지 여부를 확인할 수 있다. "노트북"의 상위 클래스는 "컴퓨터"이고, "제 1 화분"의 상위 클래스는 "식물"로 불일치하므로, 프로세서(250)는 "노트북"이 제 1 화분"과 연관성이 없다고 판단할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 인접한 객체가 아닌 다른 객체의 "노트북"에 대한 연관성을 확인할 수 있다. 예를 들어, 프로세서(250)는 "노트북"과 지정된 거리 내에 존재하지 않는 객체인 "제 2 화분"를 인식하고, "노트북"의 상위 클래스는 "컴퓨터"이고, "제 2 화분"의 상위 클래스는 "식물"로 불일치하므로, 프로세서(250)는 "노트북"이 제 2 화분"과 연관성이 없다고 판단할 수 있다.
일 실시예에 따르면, 프로세서(250)는, "노트북"을 주요 객체(401-4)로 하는 이미지 쿼리를 생성하여 서버(1000)에 전송할 수 있다.
일 실시예에 따르면, 서버(1000)는 이미지 쿼리에 기반하여, "노트북"의 정보를 검색할 수 있다. 예를 들어, 서버(1000)는 "노트북"를 검색하기 위하여 "노트북"과 관련된 정보를 이용하여 정보를 검색할 수 있다.
일 실시예에 따르면, 프로세서(250)는 서버(1000)로부터 "노트북"에 대한 정보를 획득할 수 있다.
도 5는, 다양한 실시예에 따른 프로세서(250)가 위치 정보에 기반하여 객체와 관련된 정보를 확인하는 방법을 도시한 흐름도이다.
다양한 실시예에 따른 프로세서(250)는, 동작 510에서, 위치와 관련된 정보에 기반하여 공간 지도를 작성할 수 있다.
일 실시예에 따르면, 위치 모듈(270)은 전자 장치(200)의 위치와 관련된 정보를 측정할 수 있다. 예를 들어, 위치 모듈(270)은 GNSS(예: GPS(global positioning system) 및/또는 GLONASS(global navigation satellite system))를 포함하여 전자 장치(200)의 지리적 위치를 측정할 수 있다. 예를 들어, GNSS는 GPS 센서 및/또는 GLONASS 센서를 이용하여 복수의 위성으로부터 발사되는 전파에 기반하여 현재의 위치를 측정하는 시스템일 수 있다.
일 실시예에 따르면, 프로세서(250)는, 위치 모듈(270)이 측정한 전자 장치(200)의 지리적 위치에 기반하여, 공간 지도를 작성할 공간을 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는 결정된 공간에 기반하여, SLAM(simultaneous localization and mapping, 동시적 위치추정 및/또는 지도작성) 알고리즘을 이용하여 공간 지도를 작성할 수 있다.
예를 들어, 위치 모듈(270)은 외부 객체와의 거리 및 전자 장치의 움직임과 관련된 정보에 기반하여 전자 장치의 위치와 관련된 정보를 측정할 수 있다.
예를 들어, 프로세서(250)는 복수의 카메라(예: 촬영용 카메라 모듈(213)) 및/또는 뎁스 센서(미도시)가 촬영한 영상에 기반하여 외부 객체와의 거리를 측정할 수 있다. 예를 들어, 프로세서(250)는 복수의 카메라(예: 촬영용 카메라 모듈(213)) 및/또는 뎁스 센서(미도시)가 촬영한 영상에 기반하여, 위치 모듈(270)이 측정한 외부 객체와의 거리 및 전자 장치(200)의 움직임과 관련된 정보를 융합하여, 공간 지도를 생성할 수 있다.
예를 들어, 프로세서(250)는 칼만 필터링, 파티칼 필터, 및/또는 몬테카를로 필터와 같은 알고리즘을 이용하여 공간 지도를 작성할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 520에서, 공간 지도와 실제 지도를 비교하여 주요 객체와 관련된 정보를 추출할 수 있다.
일 실시예에 따르면, 프로세서(250)는 동작 510에서 작성한 공간 지도와 실제 지도를 비교하여, 전자 장치(200)의 실제 위치를 확인할 수 있다. 예를 들어, 프로세서(250)는 공간 지도와 실제 지도를 매칭하여, 공간 지도 상에서의 전자 장치(200)의 위치를 기반으로 전자 장치(200)의 실제 위치를 확인할 수 있다.
일 실시예에 따르면, 프로세서(250)는 전자 장치(200)의 실제 위치에 기반하여 객체와 관련된 정보를 추출할 수 있다. 예를 들어, 프로세서(250)는 전자 장치(200)의 실제 위치에 기반하여, 객체의 실제 위치를 확인할 수 있다. 예를 들어, 프로세서(250)는 전자 장치(200)의 실제 위치와, 사용자의 시선 방향 및/또는 영상 내의 객체와의 상대적 거리에 기반하여 객체의 실제 위치를 계산할 수 있다. 예를 들어, 프로세서(250)는 객체의 실제 위치에 기반하여 객체와 관련된 정보(예: 객체가 위치한 매장의 브랜드 정보)를 추출할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 530에서, 부가 정보를 이용하여 지도를 업데이트할 수 있다.
일 실시예에 따른 프로세서(250)는, 텍스트 인식 기능을 이용하여 공간 지도를 업데이트할 수 있다.
예를 들어, OCR 알고리즘은 텍스트 이미지를 인식하는 광학 문자 인식 알고리즘으로, 프로세서(250)는 OCR 알고리즘에 기반하여 브랜드의 명칭을 인식할 수 있다. 프로세서(250)는 인식한 브랜드 명칭에 기반하여, 공간 지도와 실제 지도가 매칭되도록 공간 지도를 업데이트할 수 있다.
도 6은, 다양한 실시예에 따른 서버(예: 도 2c의 서버(1000))가 객체를 검색하는 방법을 도시한 흐름도이다.
다양한 실시예에 따르면, 서버(1000)는 전자 장치(200)로부터 이미지 쿼리를 획득할 수 있다.
일 실시예에 따른 이미지 쿼리는, 검색의 대상인 주요 객체 및 주요 객체와 관련된 보조 객체와 관련된 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는, 주요 객체가 일부 가려진 이미지인 경우, 주요 객체의 가려진 영역과 관련된 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는 주요 객체 및/또는 보조 객체의 연관성의 정도, 또는 클래스 정보를 포함할 수 있다. 예를 들어, 이미지 쿼리는 주요 객체의 실제 위치에 기반한 정보(예: 객체가 위치한 매장의 브랜드 정보)를 포함할 수 있다.
다양한 실시예에 따르면, 서버(1000)는, 동작 610에서, 데이터 베이스에 주요 객체와 관련된 정보가 존재하는지 여부를 확인할 수 있다.
일 실시예에 따르면, 서버(1000)는 데이터 베이스(예: 쇼핑몰 및/또는 매장 상품 데이터 베이스)에 주요 객체를 포함하는 이미지가 존재하는지 여부를 확인할 수 있다.
다양한 실시예에 따르면, 서버(1000)는, 동작 620에서, 데이터 베이스에 주요 객체와 관련된 정보가 존재함에 대응하여(예: 동작 610 - 예), 데이터 베이스에 기반하여 주요 객체를 검색할 수 있다.
다양한 실시예에 따르면, 서버(1000)는, 동작 630에서, 데이터 베이스에 주요 객체와 관련된 정보가 존재하지 않음에 대응하여(예: 동작 620 - 아니오), 인터넷에 기반하여 주요 객체를 검색할 수 있다.
일 실시예에 따른 서버(1000)는, 이미지 기반 딥러닝 알고리즘을 이용하여 이미지 쿼리에 포함된 주요 객체의 정보를 검색할 수 있다. 예를 들어, 서버(1000)는 주요 객체와 보조 객체와 관련된 정보가 포함된 이미지 쿼리에서, 주요 객체, 보조 객체, 주요 객체의 일부에 대한 정보, 객체 사이의 연관된 정도 및/또는 클래스 정보에 기반하여 주요 객체의 정보를 검색할 수 있다.
일 실시예에 따른 서버(1000)는, 주요 객체 및 보조 객체와 관련된 정보가 포함된 이미지 쿼리에 기반하여, 데이터 베이스 및/또는 인터넷에서 주요 객체에 대응되는 이미지 및/또는 주요 객체와 복수의 객체가 혼재하는 이미지에 대하여 주요 객체와 관련된 정보를 검색할 수 있다. 예를 들어, 데이터 베이스 및/또는 인터넷에는 주요 객체의 완전한 이미지가 저장되어 있을 수 있고, 또는 주요 객체의 일부 이미지가 저장되어 있을 수 있고, 또는 주요 객체와 보조 객체가 모두 포함되는 이미지가 저장되어 있을 수 있다.
일 실시예에 따른 서버(1000)는, 주요 객체와 보조 객체와 관련된 정보가 포함된 이미지 쿼리에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다. 예를 들어, 서버(1000)는, 주요 객체의 일부 영역만 이미지 쿼리에 포함된 경우, 주요 객체의 일부 영역에 대하여 중요도를 높이고, 나머지 영역에 대하여는 중요도를 낮추어 이미지 쿼리를 검색 후보에 추가할 수 있다. 예를 들어, 서버(1000)는 주요 객체와 보조 객체의 연관성 정도에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다. 예를 들어, 서버(1000)는 주요 객체와 보조 객체의 클래스 정보에 기반하여, 검색 결과에 우선 순위를 지정할 수 있다.
일 실시예에 따른 서버(1000)는, 검색된 주요 객체의 정보 중에서, 객체의 실제 위치에 기반한 정보(예: 객체가 위치한 매장의 브랜드 정보)에 기반하여, 검색 결과를 필터링할 수 있다.
다양한 실시예에 따르면, 서버(1000)는, 동작 640에서, 검색 결과를 전자 장치(200)에 전송할 수 있다. 예를 들어, 서버(1000)는 우선순위를 포함하는 복수의 검색 결과를 전자 장치(200)에 제공할 수 있다.
도 7은, 다양한 실시예에 따른 프로세서(250)가 관심 객체를 검색하는 방법을 도시한 흐름도이다.
다양한 실시예에 따른 프로세서(250)는, 서버(1000)로부터 주요 객체에 대한 정보를 수신할 수 있다. 예를 들어, 프로세서(250)는 서버(1000)가 동작 640에서 전송한 검색 결과와 관련된 정보를 획득할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 710에서, 주요 객체에 대한 검색 결과와 관련된 정보를 저장 공간(예: 북마크)에 저장할 것인지 여부를 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는, 사용자의 입력에 기반하여 주요 객체에 대한 검색 결과와 관련된 정보를 저장 공간(예: 북마크)에 저장할 것인지 여부를 결정할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 720에서, 주요 객체에 대한 검색 결과와 관련된 정보를 저장 공간(예: 북마크)에 저장할 것을 결정함에 대응하여(예: 동작 710 - 예), 주요 객체에 대한 검색 결과와 관련된 정보를 저장 공간(예: 북마크)에 저장할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 730에서, 주요 객체와 북마크에 저장된 객체를 비교할 것인지 여부를 결정할 수 있다.
일 실시예에 따르면, 프로세서(250)는 사용자의 입력에 기반하여 주요 객체와 북마크에 저장된 객체를 비교할 것인지 여부를 결정할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 740에서, 주요 객체와 저장 공간(예: 북마크)에 저장된 유사 객체를 비교할 것을 결정함에 대응하여(예: 동작 730 - 예), 주요 객체 및 저장 공간(예: 북마크)에 저장된 유사 객체의 정보를 표시할 수 있다. 예를 들어, 프로세서(250)는 상기 검색 결과와 저장 공간(예: 북마크)에 저장된 유사 객체의 정보를 함께 디스플레이에 표시할 수 있다.
다양한 실시예에 따른 프로세서(250)는, 동작 750에서, 주요 객체와 저장 공간(예: 북마크)에 저장된 객체를 비교할 것을 결정하지 않음에 대응하여(예: 동작 730 - 아니오), 주요 객체의 상기 검색 결과를 표시할 수 있다.
일 실시예에 따른 프로세서(250)는, 전자 장치(200)의 디스플레이에 주요 객체 및/또는 저장 공간(예: 북마크)에 저장된 유사 객체의 정보를 표시하거나 및/또는 외부 전자 장치(200)에 주요 객체 및/또는 북마크에 저장된 유사 객체의 정보를 표시하도록 관련 정보를 전송할 수 있다.
다양한 실시예에 따른 전자 장치는 카메라, 통신 모듈 및 프로세서를 포함하고, 상기 프로세서는 상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하고, 상기 주요 객체와 관련된 정보의 요청을 포함하는 이미지 쿼리를 생성하고, 상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 카메라로부터 획득한 영상을 인공신경망을 이용한 세그멘테이션 모델을 이용하여, 클래스가 부여된 객체를 분류할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 상위 클래스가 동일한 객체를 보조 객체로 결정할 수 있다.
다양한 실시예에 따른 전자 장치에서, 시선 추적 카메라를 더 포함하고, 상기 프로세서는 상기 시선 추적 카메라를 이용하여 사용자의 시선을 추적하고, 상기 추적된 사용자의 시선에 기반하여 상기 주요 객체를 결정할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 전자 장치의 위치와 관련된 정보를 측정하는 위치 모듈을 더 포함하고, 상기 프로세서는 상기 위치 모듈이 측정한 정보에 기반하여 공간 지도를 생성하고, 상기 공간 지도와 실제 지도를 비교하여 상기 전자 장치의 위치를 확인하고, 상기 전자 장치의 위치 정보에 기반하여 상기 주요 객체의 실제 위치를 결정하고, 상기 주요 객체의 실제 위치와 관련된 정보에 더 기반하여 상기 이미지 쿼리를 생성할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 주요 객체의 하위 클래스와 상기 보조 객체의 하위 클래스의 미리 지정된 유사도에 기반하여, 상기 보조 객체의 연관된 정도를 결정할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 주요 객체의 일부가 영역이 인식되지 않음에 대응하여, 상기 주요 객체의 일부 영역에 대한 정보에 더 기반하여 이미지 쿼리를 생성할 수 있다.
다양한 실시예에 따른 전자 장치에서, 상기 프로세서는 상기 서버로부터 상기 주요 객체와 관련된 정보를 획득하고, 상기 주요 객체와 관련된 정보는, 상기 서버가 상기 주요 객체, 상기 보조 객체, 상기 주요 객체의 일부 영역에 대한 정보, 상기 주요 객체와 상기 보조 객체 사이의 연관된 정도 및 클래스 정보 중 적어도 하나에 기반하여 검색한 결과일 수 있다.
다양한 실시예에 따른 전자 장치에서, 객체에 대한 정보를 저장하는 메모리 및 디스플레이를 더 포함하고, 상기 프로세서는 상기 주요 객체와 관련된 정보와 상기 메모리 저장된 상기 주요 객체와 유사한 객체를 비교한 정보를 상기 디스플레이에 표시할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법은, 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하는 동작, 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하는 동작, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하는 동작, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하는 이미지 쿼리를 생성하는 동작 및 상기 이미지 쿼리를 서버에 전송하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 카메라로부터 획득한 영상을 인공신경망을 이용한 세그멘테이션 모델을 이용하여, 클래스가 부여된 객체를 분류하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 상위 클래스가 동일한 객체를 보조 객체로 결정하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 시선 추적 카메라를 이용하여 사용자의 시선을 추적하는 동작 및 상기 추적된 사용자의 시선에 기반하여 상기 주요 객체를 결정하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 전자 장치의 위치와 관련된 정보에 기반하여 공간 지도를 생성하는 동작, 상기 공간 지도와 실제 지도를 비교하여 상기 전자 장치의 위치를 확인하는 동작, 상기 전자 장치의 위치 정보에 기반하여 상기 주요 객체의 실제 위치를 결정하는 동작 및 상기 주요 객체의 실제 위치와 관련된 정보에 더 기반하여 상기 이미지 쿼리를 생성하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 주요 객체의 하위 클래스와 상기 보조 객체의 하위 클래스의 미리 지정된 유사도에 기반하여, 상기 보조 객체의 연관된 정도를 결정하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 주요 객체의 일부가 영역이 인식되지 않음에 대응하여, 상기 주요 객체의 일부 영역에 대한 정보에 더 기반하여 이미지 쿼리를 생성하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 서버로부터 상기 주요 객체와 관련된 정보를 획득하는 동작을 포함하고, 상기 주요 객체와 관련된 정보는, 상기 서버가 상기 주요 객체, 상기 보조 객체, 상기 주요 객체의 일부 영역에 대한 정보, 상기 주요 객체와 상기 보조 객체 사이의 연관된 정도 및 클래스 정보 중 적어도 하나에 기반하여 검색한 결과일 수 있다.
다양한 실시예에 따른 전자 장치의 동작 방법에서, 상기 주요 객체와 관련된 정보와 메모리 저장된 상기 주요 객체와 유사한 객체를 비교한 정보를 디스플레이에 표시하는 동작을 포함할 수 있다.
다양한 실시예에 따른 서버와 전자 장치를 포함하는 시스템에 있어서, 상기 전자 장치는 카메라, 통신 모듈, 및 프로세서를 포함하고, 상기 프로세서는 상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고, 상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고, 상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고, 상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하는 이미지 쿼리를 생성하고, 상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송하고, 상기 서버는 상기 이미지 쿼리에 기반하여 상기 주요 객체와 관련된 정보를 검색하고, 상기 검색 결과인 상기 주요 객체와 관련된 정보를 상기 전자 장치에 전송할 수 있다.
다양한 실시예에 따른 시스템에서, 상기 서버는 상기 주요 객체, 상기 보조 객체, 상기 주요 객체의 일부 영역에 대한 정보, 상기 주요 객체와 상기 보조 객체 사이의 연관된 정도 및 클래스 정보 중 적어도 하나에 기반하여 상기 주요 객체와 관련된 정보를 검색할 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    카메라;
    통신 모듈; 및
    프로세서;를 포함하고,
    상기 프로세서는
    상기 카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하고
    상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하고,
    상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하고,
    상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하고, 상기 주요 객체와 관련된 정보의 요청을 포함하는 이미지 쿼리를 생성하고,
    상기 이미지 쿼리를 상기 통신 모듈을 이용하여 서버에 전송하는
    전자 장치.
  2. 제 1 항에 있어서,
    상기 프로세서는
    상기 카메라로부터 획득한 영상을 인공신경망을 이용한 세그멘테이션 모델을 이용하여, 클래스가 부여된 객체를 분류하는
    전자 장치.
  3. 제 2 항에 있어서,
    상기 프로세서는
    상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 상위 클래스가 동일한 객체를 보조 객체로 결정하는
    전자 장치.
  4. 제 1 항에 있어서,
    시선 추적 카메라;를 더 포함하고,
    상기 프로세서는
    상기 시선 추적 카메라를 이용하여 사용자의 시선을 추적하고,
    상기 추적된 사용자의 시선에 기반하여 상기 주요 객체를 결정하는
    전자 장치.
  5. 제 1 항에 있어서,
    상기 프로세서는
    상기 전자 장치의 위치와 관련된 정보를 측정하는 위치 모듈;을 더 포함하고,
    상기 프로세서는
    상기 위치 모듈이 측정한 정보에 기반하여 공간 지도를 생성하고,
    상기 공간 지도와 실제 지도를 비교하여 상기 전자 장치의 위치를 확인하고,
    상기 전자 장치의 위치 정보에 기반하여 상기 주요 객체의 실제 위치를 결정하고,
    상기 주요 객체의 실제 위치와 관련된 정보에 더 기반하여 상기 이미지 쿼리를 생성하는
    전자 장치.
  6. 제 3 항에 있어서,
    상기 프로세서는
    상기 주요 객체의 하위 클래스와 상기 보조 객체의 하위 클래스의 미리 지정된 유사도에 기반하여, 상기 보조 객체의 연관된 정도를 결정하는
    전자 장치.
  7. 제 6 항에 있어서,
    상기 프로세서는
    상기 주요 객체의 일부가 영역이 인식되지 않음에 대응하여, 상기 주요 객체의 일부 영역에 대한 정보에 더 기반하여 이미지 쿼리를 생성하는
    전자 장치.
  8. 제 6 항에 있어서,
    상기 프로세서는
    상기 서버로부터 상기 주요 객체와 관련된 정보를 획득하고,
    상기 주요 객체와 관련된 정보는, 상기 서버가 상기 주요 객체, 상기 보조 객체, 상기 주요 객체의 일부 영역에 대한 정보, 상기 주요 객체와 상기 보조 객체 사이의 연관된 정도 및 클래스 정보 중 적어도 하나에 기반하여 검색한 결과인
    전자 장치.
  9. 제 8 항에 있어서,
    객체에 대한 정보를 저장하는 메모리; 및
    디스플레이;를 더 포함하고,
    상기 프로세서는
    상기 주요 객체와 관련된 정보와 상기 메모리 저장된 상기 주요 객체와 유사한 객체를 비교한 정보를 상기 디스플레이에 표시하는
    전자 장치.
  10. 전자 장치의 동작 방법에 있어서,
    카메라로부터 획득한 영상에서, 객체를 포함하는 영상의 일부를 추출하는 동작;
    상기 영상 내의 객체 중에서 검색의 대상이 되는 주요 객체를 결정하는 동작;
    상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 연관된 객체를 보조 객체로 결정하는 동작;
    상기 주요 객체 및/또는 상기 보조 객체를 포함하는 이미지의 일부를 포함하는 이미지 쿼리를 생성하는 동작; 및
    상기 이미지 쿼리를 서버에 전송하는 동작;을 포함하는
    전자 장치의 동작 방법.
  11. 제 10 항에 있어서,
    상기 카메라로부터 획득한 영상을 인공신경망을 이용한 세그멘테이션 모델을 이용하여, 클래스가 부여된 객체를 분류하는 동작을 포함하는
    전자 장치의 동작 방법.
  12. 제 10 항에 있어서,
    상기 영상 내의 다른 객체 중에서, 상기 주요 객체와 상위 클래스가 동일한 객체를 보조 객체로 결정하는 동작을 포함하는
    전자 장치의 동작 방법.
  13. 제 10 항에 있어서,
    시선 추적 카메라를 이용하여 사용자의 시선을 추적하는 동작; 및
    상기 추적된 사용자의 시선에 기반하여 상기 주요 객체를 결정하는 동작을 포함하는
    전자 장치의 동작 방법.
  14. 제 10 항에 있어서,
    상기 전자 장치의 위치와 관련된 정보에 기반하여 공간 지도를 생성하는 동작;
    상기 공간 지도와 실제 지도를 비교하여 상기 전자 장치의 위치를 확인하는 동작;
    상기 전자 장치의 위치 정보에 기반하여 상기 주요 객체의 실제 위치를 결정하는 동작; 및
    상기 주요 객체의 실제 위치와 관련된 정보에 더 기반하여 상기 이미지 쿼리를 생성하는 동작을 포함하는
    전자 장치의 동작 방법.
  15. 제 12 항에 있어서,
    상기 주요 객체의 하위 클래스와 상기 보조 객체의 하위 클래스의 미리 지정된 유사도에 기반하여, 상기 보조 객체의 연관된 정도를 결정하는 동작을 포함하는
    전자 장치의 동작 방법.
PCT/KR2023/010321 2022-10-04 2023-07-18 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법 WO2024075947A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2022-0126615 2022-10-04
KR20220126615 2022-10-04
KR1020220160744A KR20240047275A (ko) 2022-10-04 2022-11-25 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법
KR10-2022-0160744 2022-11-25

Publications (1)

Publication Number Publication Date
WO2024075947A1 true WO2024075947A1 (ko) 2024-04-11

Family

ID=90608631

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/010321 WO2024075947A1 (ko) 2022-10-04 2023-07-18 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법

Country Status (1)

Country Link
WO (1) WO2024075947A1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120066233A (ko) * 2010-12-14 2012-06-22 삼성전자주식회사 다층 증강 현실 시스템 및 방법
KR20160071172A (ko) * 2014-12-11 2016-06-21 공간정보기술 주식회사 스테레오 카메라를 이용한 파노라마 3차원 맵 생성시스템
US10515110B2 (en) * 2013-11-12 2019-12-24 Pinterest, Inc. Image based search
KR102128894B1 (ko) * 2019-10-10 2020-07-01 주식회사 메디씽큐 스마트 안경의 시선 트래킹 시스템 및 그 방법
KR102310597B1 (ko) * 2021-03-19 2021-10-13 주식회사 인피닉 질의응답 제공 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
CN114385846A (zh) * 2021-12-23 2022-04-22 北京旷视科技有限公司 一种图像分类方法、电子设备、存储介质及程序产品

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120066233A (ko) * 2010-12-14 2012-06-22 삼성전자주식회사 다층 증강 현실 시스템 및 방법
US10515110B2 (en) * 2013-11-12 2019-12-24 Pinterest, Inc. Image based search
KR20160071172A (ko) * 2014-12-11 2016-06-21 공간정보기술 주식회사 스테레오 카메라를 이용한 파노라마 3차원 맵 생성시스템
KR102128894B1 (ko) * 2019-10-10 2020-07-01 주식회사 메디씽큐 스마트 안경의 시선 트래킹 시스템 및 그 방법
KR102310597B1 (ko) * 2021-03-19 2021-10-13 주식회사 인피닉 질의응답 제공 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
CN114385846A (zh) * 2021-12-23 2022-04-22 北京旷视科技有限公司 一种图像分类方法、电子设备、存储介质及程序产品

Similar Documents

Publication Publication Date Title
WO2022065722A1 (ko) 외부 물체에 대한 알림을 디스플레이하는 전자 장치 및 그 방법
WO2017204498A1 (ko) 이동 단말기
WO2022098204A1 (ko) 가상현실 서비스를 제공하는 전자 장치 및 방법
WO2020130301A1 (en) Electronic device for tracking user activity and method of operating the same
WO2022092517A1 (ko) 디스플레이를 포함하는 웨어러블 전자 장치, 그 디스플레이를 제어하는 방법, 및 그 웨어러블 전자 장치 및 케이스를 포함하는 시스템
WO2022215895A1 (ko) 복수의 카메라를 포함하는 웨어러블 전자 장치
WO2022059968A1 (ko) 증강 현실 콘텐츠를 제공하는 전자 장치 및 그의 동작 방법
WO2024075947A1 (ko) 객체 검색을 위한 이미지 쿼리를 생성하는 전자 장치 및 전자 장치의 동작 방법
WO2022131578A1 (ko) 증강 현실 환경을 제공하기 위한 방법 및 전자 장치
WO2022065827A1 (ko) 무선 통신을 이용한 촬영 방법 및 이를 지원하는 전자 장치
WO2024034825A1 (ko) Ar 장치에게 표시하도록 명령할 컨텐츠를 결정하기 위한 방법 및 장치
WO2024155171A1 (ko) 조작 입력을 전송하는 헤드 마운트 장치 및 그의 동작 방법
WO2024071681A1 (ko) 이미지를 제공하는 방법 및 이를 지원하는 웨어러블 전자 장치
WO2024225612A1 (ko) 복수의 카메라들을 포함하는 전자 장치 및 전자 장치의 동작 방법
WO2024076058A1 (ko) 센서를 포함하는 웨어러블 전자 장치 및 이의 동작 방법
WO2024101747A1 (ko) 카메라를 포함하는 웨어러블 전자 장치 및 이의 동작 방법
WO2024085453A1 (ko) 전자 장치, 전자 장치에서 외부 객체를 이용한 지문 등록 및 인증 방법
WO2022211514A1 (ko) 증강 현실 이미지를 제공하는 방법 및 이를 지원하는 헤드 마운티드 디스플레이 장치
WO2023153611A1 (ko) 객체의 영상을 획득하는 방법 및 장치
WO2024085493A1 (ko) 프리뷰 이미지를 표시하기 위한 전자 장치 및 방법
WO2024039073A1 (ko) 이미지에 효과를 적용하는 전자 장치 및 그 제어 방법
WO2023003330A1 (ko) 외부 전자 장치를 제어하기 위한 전자 장치 및 전자 장치의 동작 방법
WO2023080420A1 (ko) 가변형 그라운드를 포함하는 웨어러블 전자 장치
WO2024029720A1 (ko) 증강 현실에서 사용자를 인증하는 장치 및 방법
WO2023080419A1 (ko) 비전 정보를 이용하여 전자기기를 제어하는 웨어러블 전자 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23875017

Country of ref document: EP

Kind code of ref document: A1