[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR102682639B1 - Server, method and computer program for automatically labelling image using feedback of post including image - Google Patents

Server, method and computer program for automatically labelling image using feedback of post including image Download PDF

Info

Publication number
KR102682639B1
KR102682639B1 KR1020210157419A KR20210157419A KR102682639B1 KR 102682639 B1 KR102682639 B1 KR 102682639B1 KR 1020210157419 A KR1020210157419 A KR 1020210157419A KR 20210157419 A KR20210157419 A KR 20210157419A KR 102682639 B1 KR102682639 B1 KR 102682639B1
Authority
KR
South Korea
Prior art keywords
labeling
post
keyword
image
text
Prior art date
Application number
KR1020210157419A
Other languages
Korean (ko)
Other versions
KR20230071336A (en
Inventor
김현우
Original Assignee
주식회사 초이서
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 초이서 filed Critical 주식회사 초이서
Priority to KR1020210157419A priority Critical patent/KR102682639B1/en
Publication of KR20230071336A publication Critical patent/KR20230071336A/en
Application granted granted Critical
Publication of KR102682639B1 publication Critical patent/KR102682639B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 서버는 제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 게시물 등록부, 복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 피드백 정보 수신부, 상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 텍스트 분석부 및 상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 이미지 분석부를 포함하는 분석부 및 상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 라벨링 수행부를 포함한다. A server that automatically labels images using feedback from posts containing images receives feedback information related to the posts from a post register that registers posts containing images and text from a first user terminal, and a plurality of second user terminals. a feedback information receiving unit that analyzes the text to derive a first key keyword from the text, a text analysis unit that analyzes the feedback information to derive a second key keyword, and a labeling target included in the image by analyzing the image. Based on a match between an analysis unit including an image analysis unit that identifies and derives labeling-related keywords related to the identified labeling target, and at least one of the first core keyword, the second core keyword, and the labeling-related keyword and a labeling performing unit that performs labeling on the labeling object.

Description

이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 서버, 방법 및 컴퓨터 프로그램{SERVER, METHOD AND COMPUTER PROGRAM FOR AUTOMATICALLY LABELLING IMAGE USING FEEDBACK OF POST INCLUDING IMAGE}Server, method, and computer program for automatically labeling images using feedback from posts containing images

본 발명은 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 서버, 방법 및 컴퓨터 프로그램에 관한 것이다. The present invention relates to a server, method, and computer program for automatically labeling images using feedback from posts containing images.

최근, 인공 지능 기술을 이용하여 객체를 식별하는 방법 등에 대한 연구가 활발이 이루어지고 있다. 인공 지능 기술에서 주로 이용되는 딥러닝(Deep Learning) 기술은 높은 객체 판별 능력 및 분석 능력을 갖는다는 특징을 가지고 있다. Recently, research on methods for identifying objects using artificial intelligence technology has been actively conducted. Deep learning technology, which is mainly used in artificial intelligence technology, is characterized by high object discrimination and analysis capabilities.

이러한 딥러닝 기술은 학습을 진행하기 위해 라벨링이라는 작업이 요구되며, 라벨링을 통한 딥러닝 학습 기술과 관련하여, 선행기술인 한국공개특허 제2020-0084411호는 딥러닝 학습 방법 및 서버를 개시하고 있다. This deep learning technology requires a task called labeling to proceed with learning, and in relation to deep learning learning technology through labeling, Korean Patent Publication No. 2020-0084411, a prior art, discloses a deep learning learning method and server.

그러나 종래에는 라벨링을 위해 다량의 학습 데이터가 요구되었으며, 라벨링을 수행하기 위한 인원, 비용 및 시간 또한 많이 소요되었다. 또한, 라벨링이 수작업으로 수행됨에 따라, 많은 작업 비용이 발생하고, 작업자의 실수에 의해 라벨링이 잘못 수행된 경우, 딥러닝 학습 결과가 좋지 않다는 단점을 가지고 있었다. However, in the past, a large amount of learning data was required for labeling, and a lot of people, money, and time were required to perform labeling. In addition, as labeling is performed manually, it incurs a lot of work costs, and if labeling is performed incorrectly due to operator error, deep learning learning results are poor.

최근에는 자동 라벨링 기술을 통해 학습 데이터에 자동으로 라벨링을 수행한 후, 개발자가 이를 확인하여 라벨링을 수정하는 방식이 이용되고 있다. 그러나 자동 라벨링 기술을 이용하더라도 기타 환경 변수(예를 들어, 낮시간/밤시간, 장소, 날씨, 실내/실외 등)에 의해 학습 데이터가 영향을 받게 됨에 따라, 자동 라벨링 기술이 정상적으로 동작하지 않는 경우가 발생되어 수작업으로 다시 라벨링을 수행되어야 한다는 단점을 가지고 있다. Recently, a method has been used in which learning data is automatically labeled using automatic labeling technology, and then the developer checks the labeling and modifies the labeling. However, even if automatic labeling technology is used, the learning data is affected by other environmental variables (e.g., time of day/night, location, weather, indoor/outdoor, etc.), so the automatic labeling technology does not operate properly. It has the disadvantage of requiring manual re-labeling.

제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고, 복수의 제 2 사용자 단말로부터 게시물과 관련된 피드백 정보를 수신하는 서버, 방법 및 컴퓨터 프로그램을 제공하고자 한다. An object is to provide a server, a method, and a computer program for registering posts including images and text from a first user terminal and receiving feedback information related to the posts from a plurality of second user terminals.

텍스트를 분석하여 텍스트로부터 제 1 핵심 키워드를 도출하고, 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하고, 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 서버, 방법 및 컴퓨터 프로그램을 제공하고자 한다. Analyze text to derive first core keywords from the text, analyze feedback information to derive second core keywords, analyze images to identify labeling objects included in the image, and labeling-related keywords related to the identified labeling objects. The goal is to provide a server, method, and computer program that derives .

제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행하는 서버, 방법 및 컴퓨터 프로그램을 제공하고자 한다. The present invention seeks to provide a server, method, and computer program that performs labeling of a labeling object based on a match between at least one of a first core keyword, a second core keyword, and a labeling-related keyword.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. However, the technical challenges that this embodiment aims to achieve are not limited to the technical challenges described above, and other technical challenges may exist.

상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 게시물 등록부, 복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 피드백 정보 수신부, 상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 텍스트 분석부; 및 상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 이미지 분석부를 포함하는 분석부 및 상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 라벨링 수행부를 포함하는 이미지 자동 라벨링 서버를 제공할 수 있다. As a means for achieving the above-described technical problem, an embodiment of the present invention includes a post register that receives posts containing images and text from a first user terminal, and feedback information related to the posts from a plurality of second user terminals. a feedback information receiving unit that receives a text, a text analysis unit that analyzes the text to derive a first key keyword from the text, and analyzes the feedback information to derive a second key keyword; and an image analysis unit that analyzes the image to identify a labeling target included in the image and derives labeling-related keywords related to the identified labeling target, the first key keyword, the second key keyword, and An automatic image labeling server may be provided, including a labeling performing unit that performs labeling on the labeling object based on whether or not there is a match between at least one of the labeling-related keywords.

본 발명의 다른 실시예는, 제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 단계, 복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 단계, 상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하는 단계, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 단계, 상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 단계 및 상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계를 포함하는 이미지 자동 라벨링 방법을 제공할 수 있다. Another embodiment of the present invention includes the steps of registering a post including an image and text from a first user terminal, receiving feedback information related to the post from a plurality of second user terminals, analyzing the text and deriving a first key keyword from, analyzing the feedback information to derive a second key keyword, analyzing the image to identify a labeling object included in the image, and labeling related to the identified labeling object. Providing an automatic image labeling method comprising deriving a keyword and performing labeling on the labeling object based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. can do.

본 발명의 또 다른 실시예는, 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고, 복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하고, 상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하고, 상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하고, 상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하도록 하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다. In another embodiment of the present invention, when executed by a computing device, the computer program registers a post containing an image and text from a first user terminal and receives feedback information related to the post from a plurality of second user terminals. and analyze the text to derive a first key keyword from the text, analyze the feedback information to derive a second key keyword, analyze the image to identify a labeling target included in the image, and identify the labeling object included in the image. A sequence of instructions for deriving labeling-related keywords related to the labeling object and performing labeling on the labeling object based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. A computer program stored on a medium containing can be provided.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described means for solving the problem are merely illustrative and should not be construed as intended to limit the present invention. In addition to the exemplary embodiments described above, there may be additional embodiments described in the drawings and detailed description of the invention.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고, 복수의 제 2 사용자 단말로부터 게시물과 관련된 피드백 정보를 수신함으로써, 텍스트를 분석하여 텍스트로부터 제 1 핵심 키워드를 도출하고, 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하고, 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별하여 라벨링 대상과 관련된 라벨링 관련 키워드를 각각 도출한 후, 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행하는 서버, 방법 및 컴퓨터 프로그램을 제공할 수 있다. According to one of the above-described means for solving the problem of the present invention, a post containing an image and text is registered from a first user terminal, and feedback information related to the post is received from a plurality of second user terminals, thereby analyzing the text. Derive the first core keyword from the text, derive the second core keyword by analyzing the feedback information, analyze the image to identify the labeling object included in the image, and derive labeling-related keywords related to the labeling object, respectively. A server, a method, and a computer program that perform labeling on a labeling object based on a match between a 1 core keyword, a second core keyword, and a labeling-related keyword can be provided.

종래의 딥러닝 기술을 이용한 이미지 식별 기술은 객체명만 도출할 수 있을 뿐, 동물의 품종, 자동차 또는 기계장치의 모델명 등과 같이 상세 정보를 식별할 수 없었으나, 본 발명은 고양이의 품종, 자동차의 모델명과 같이 상세 정보를 이미지 상의 라벨링 대상 영역에 라벨링할 수 있도록 하는 서버, 방법 및 컴퓨터 프로그램을 제공할 수 있다. Conventional image identification technology using deep learning technology can only derive object names and cannot identify detailed information such as the breed of an animal or the model name of a car or machine, but the present invention A server, method, and computer program can be provided that allow detailed information, such as a model name, to be labeled in an area to be labeled on an image.

종래에는 딥러닝 기술을 이용하여 이미지에 포함된 라벨링 대상을 식별하기 위해서는 다량의 학습 데이터가 요구되었으나, 본 발명은 게시물의 이미지로부터 도출된 라벨링 관련 키워드, 게시물의 텍스트로부터 도출된 제 1 핵심 키워드 및 피드백 정보의 댓글로부터 도출된 제 2 핵심 키워드에 기초하여 다양한 커뮤니티, SNS(Social Network Service) 등에서 집단지성을 이용하여 라벨링을 수행할 수 있도록 하는 서버, 방법 및 컴퓨터 프로그램을 제공할 수 있다. Conventionally, a large amount of learning data was required to identify a labeling target included in an image using deep learning technology, but the present invention uses labeling-related keywords derived from the image of the post, the first core keyword derived from the text of the post, and A server, method, and computer program that enable labeling to be performed using collective intelligence in various communities, SNS (Social Network Service), etc. based on second key keywords derived from comments on feedback information can be provided.

게시물에 포함된 이미지의 진위 여부 등을 판단하여 해당 게시물이 인증 게시물인지 여부를 판단할 수 있도록 하는 서버, 방법 및 컴퓨터 프로그램을 제공할 수 있다. A server, method, and computer program can be provided that can determine whether the post is an authenticated post by determining the authenticity of the image included in the post.

도 1은 본 발명의 일 실시예에 따른 이미지 자동 라벨링 시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 이미지 자동 라벨링 서버의 구성도이다.
도 3a 및 도 3b는 본 발명의 일 실시예에 따른 게시물에 포함된 텍스트 및 이미지를 분석하는 과정을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 평서문에 해당하는 경우 라벨링 대상에 대한 추가 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 평서문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다.
도 6a 및 도 6b는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 질문문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다.
도 7a 및 도 7b는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 질문문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 미수행하는 과정을 설명하기 위한 예시적인 도면이다.
도 8은 본 발명의 일 실시예에 따른 이미지 자동 라벨링 서버에서 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법의 순서도이다.
1 is a configuration diagram of an automatic image labeling system according to an embodiment of the present invention.
Figure 2 is a configuration diagram of an automatic image labeling server according to an embodiment of the present invention.
3A and 3B are exemplary diagrams for explaining a process of analyzing text and images included in a post according to an embodiment of the present invention.
Figure 4 is an exemplary diagram illustrating a process of performing additional labeling on a labeling target when the sentence type of a post corresponds to a descriptive sentence according to an embodiment of the present invention.
Figure 5 is an exemplary diagram for explaining a process of labeling a labeling target included in a post when the sentence type of the post corresponds to a descriptive sentence according to an embodiment of the present invention.
FIGS. 6A and 6B are exemplary diagrams for explaining a process of labeling a labeling target included in a posting when the sentence type of the posting corresponds to a question according to an embodiment of the present invention.
FIGS. 7A and 7B are exemplary diagrams for explaining a process of not performing labeling on a labeling target included in a posting when the sentence type of the posting corresponds to a question according to an embodiment of the present invention.
Figure 8 is a flowchart of a method of automatically labeling images using feedback from posts containing images in an image automatic labeling server according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. Below, with reference to the attached drawings, embodiments of the present invention will be described in detail so that those skilled in the art can easily implement the present invention. However, the present invention may be implemented in many different forms and is not limited to the embodiments described herein. In order to clearly explain the present invention in the drawings, parts unrelated to the description are omitted, and similar parts are given similar reference numerals throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case where it is "directly connected," but also the case where it is "electrically connected" with another element in between. . In addition, when a part is said to "include" a certain component, this means that it does not exclude other components, but may further include other components, unless specifically stated to the contrary, and one or more other features. It should be understood that it does not exclude in advance the presence or addition of numbers, steps, operations, components, parts, or combinations thereof.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.In this specification, 'part' includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Additionally, one unit may be realized using two or more pieces of hardware, and two or more units may be realized using one piece of hardware.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.In this specification, some of the operations or functions described as being performed by a terminal or device may instead be performed on a server connected to the terminal or device. Likewise, some of the operations or functions described as being performed by the server may also be performed on a terminal or device connected to the server.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the attached drawings.

도 1은 본 발명의 일 실시예에 따른 이미지 자동 라벨링 시스템의 구성도이다. 도 1을 참조하면, 이미지 자동 라벨링 시스템(1)은 이미지 자동 라벨링 서버(100), 제 1 사용자 단말(110) 및 복수의 제 2 사용자 단말(120)을 포함할 수 있다. 이미지 자동 라벨링 서버(100), 제 1 사용자 단말(110) 및 복수의 제 2 사용자 단말(120)은 이미지 자동 라벨링 시스템(1)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다. 1 is a configuration diagram of an automatic image labeling system according to an embodiment of the present invention. Referring to FIG. 1 , the image automatic labeling system 1 may include an image automatic labeling server 100, a first user terminal 110, and a plurality of second user terminals 120. The automatic image labeling server 100, the first user terminal 110, and the plurality of second user terminals 120 illustrate components that can be controlled by the automatic image labeling system 1.

도 1의 이미지 자동 라벨링 시스템(1)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 이미지 자동 라벨링 서버(100)는 제 1 사용자 단말(110) 또는 복수의 제 2 사용자 단말(120)과 동시에 또는 시간 간격을 두고 연결될 수 있다. Each component of the automatic image labeling system 1 of FIG. 1 is generally connected through a network. For example, as shown in FIG. 1, the automatic image labeling server 100 may be connected to the first user terminal 110 or a plurality of second user terminals 120 simultaneously or at time intervals.

네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다. Network refers to a connection structure that allows information exchange between nodes such as terminals and servers, including Local Area Network (LAN), Wide Area Network (WAN), and World Wide Area Network (WWW). Wide Web), wired and wireless data communication networks, telephone networks, wired and wireless television communication networks, etc. Examples of wireless data communication networks include 3G, 4G, 5G, WIMAX (World Interoperability for Microwave Access), Wi-Fi, Bluetooth communication, infrared communication, ultrasonic communication, Visible Light Communication (VLC), and LiFi. ), etc. are included, but are not limited to this.

이미지 자동 라벨링 서버(100)는 기수집된 라벨링 대상의 이미지 및 레이블 정보를 포함하는 학습 데이터를 이용하여 라벨링 대상을 식별하는 라벨링 대상 식별 모델을 학습할 수 있다. The automatic image labeling server 100 may learn a labeling object identification model that identifies the labeling object using training data including already collected images and label information of the labeling object.

이미지 자동 라벨링 서버(100)는 제 1 사용자 단말(110)로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고, 복수의 제 2 사용자 단말(120)로부터 게시물과 관련된 피드백 정보를 수신할 수 있다. 여기서, 피드백 정보는 게시물에 대한 댓글, 조회수, 선호도수, 신고수 등을 포함할 수 있다. The automatic image labeling server 100 may register a post including an image and text from the first user terminal 110 and receive feedback information related to the post from a plurality of second user terminals 120 . Here, the feedback information may include comments, views, preferences, reports, etc. for the post.

이미지 자동 라벨링 서버(100)는 텍스트 및 피드백 정보 각각을 감정 분석 모델에 입력하여 텍스트 및 피드백 정보 각각을 긍정, 부정 및 중립 중 어느 하나로 분류할 수 있다. The automatic image labeling server 100 may input each text and feedback information into an emotion analysis model and classify each text and feedback information as positive, negative, or neutral.

이미지 자동 라벨링 서버(100)는 텍스트를 분석하여 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류하고, 텍스트로부터 제 1 핵심 키워드를 도출할 수 있다. The automatic image labeling server 100 may analyze the text, classify the sentence type of the post as either a descriptive sentence or a question sentence, and derive the first core keyword from the text.

이미지 자동 라벨링 서버(100)는 피드백 정보를 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 이미지 자동 라벨링 서버(100)는 피드백 정보에 대한 긍정 비율, 부정 비율 및 중립 비율에 기초하여 제 2 핵심 키워드를 결정할 수 있다. The image automatic labeling server 100 may analyze the feedback information and derive the second key keyword. For example, the image automatic labeling server 100 may determine the second core keyword based on the positive rate, negative rate, and neutral rate of the feedback information.

이미지 자동 라벨링 서버(100)는 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하고, 라벨링 대상 식별 모델을 이용하여 게시물의 이미지로부터 라벨링 대상을 식별할 수 있다. The automatic image labeling server 100 may derive labeling-related keywords related to the identified labeling target and identify the labeling target from the image of the post using a labeling target identification model.

이미지 자동 라벨링 서버(100)는 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. 이 때, 이미지 자동 라벨링 서버(100)는 분류된 게시물의 문장 유형에 더 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. The automatic image labeling server 100 may perform labeling of the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. At this time, the automatic image labeling server 100 may perform labeling of the labeling target based on the sentence type of the classified post.

예를 들어, 이미지 자동 라벨링 서버(100)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드, 제 1 핵심 키워드 및 제 2 핵심 키워드가 모두 일치하는 경우, 이미지에 해당하는 라벨링 대상 영역에 제 1 핵심 키워드 및 제 2 핵심 키워드 중 적어도 하나에 기초하여 라벨링 대상에 대한 추가 라벨링을 수행할 수 있다. For example, if the sentence type of the post corresponds to a descriptive sentence and the labeling-related keywords, first core keyword, and second core keyword all match, the image automatic labeling server 100 places the post in the labeling target area corresponding to the image. Additional labeling of the labeling target may be performed based on at least one of the first core keyword and the second core keyword.

다른 예를 들어, 이미지 자동 라벨링 서버(100)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드가 제 1 핵심 키워드와 일치하고 제 2 핵심 키워드와 불일치하는 경우, 제 2 핵심 키워드에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. For another example, if the sentence type of the post corresponds to a descriptive sentence and the labeling-related keyword matches the first core keyword and does not match the second core keyword, the image automatic labeling server 100 uses the second core keyword based on the second core keyword. Labeling can be performed on the labeling target.

또 다른 예를 들어, 이미지 자동 라벨링 서버(100)는 게시물의 문장 유형이 질문문에 해당하고, 피드백 정보에 대한 긍정 비율이 임계치 이상인 경우, 이미지에 해당하는 라벨링 대상 영역에 제 1 핵심 키워드에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. For another example, if the sentence type of the post corresponds to a question sentence and the positive rate for feedback information is more than a threshold, the image automatic labeling server 100 labels the labeling target area corresponding to the image based on the first core keyword. This allows labeling of the labeling object to be performed.

이미지 자동 라벨링 서버(100)는 이미지 자동 라벨링 서버(100)는 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 게시물을 라벨링 대상에 대한 인증 게시물로 판단할 수 있다. 예를 들어, 이미지 자동 라벨링 서버(100)는 라벨링 관련 키워드 및 제 1 핵심 키워드 간의 관련도에 기초하여 제 1 스코어를 산출하고, 라벨링 관련 키워드 및 제 2 핵심 키워드 간의 관련도에 기초하여 제 2 스코어를 산출하고, 조회수 및 선호도수에 대한 비율에 기초하여 제 3 스코어를 산출한 후, 제 1 내지 제 3 스코어에 기초하여 게시물에 대한 인증 스코어를 산출하고, 게시물에 대한 인증 스코어가 임계치 이상인 경우, 게시물을 라벨링 대상에 대한 인증 게시물로 결정할 수 있다. The automatic image labeling server 100 may determine that a post is an authenticated post for a labeling target based on whether or not there is a match between at least one of the related keywords. For example, the image automatic labeling server 100 calculates a first score based on the degree of relationship between the labeling-related keyword and the first core keyword, and calculates the second score based on the degree of relationship between the labeling-related keyword and the second core keyword. After calculating the third score based on the ratio to the number of views and preferences, calculating the authentication score for the post based on the first to third scores, and if the authentication score for the post is above the threshold, A post can be determined as a certified post for the labeling target.

이러한 과정을 거쳐, 종래에는 게시물의 이미지에 포함된 라벨링 대상을 식별하여 객체명만을 도출할 수 있었으나, 본 발명은 SNS, 특정 웹 또는 앱의 게시판에 업로드된 게시물 및 피드백 정보에 포함된 댓글을 통해 이미지에 포함된 라벨링 대상에 대해 추가 라벨링 또는 라벨링을 수정하는 것이 가능하다. 즉, 라벨링 대상이 동물인 경우, 동물의 품종, 라벨링 대상이 자동차/전자기기의 경우, 모델명과 같이 라벨링 대상과 관련된 상세 정보까지 라벨링할 수 있다는 장점을 제공할 수 있다. 또한, 본 발명은 SNS, 특정 웹 또는 앱에 게시된 게시물의 댓글을 이용하여 추가 라벨링 또는 라벨링 수정을 수행함으로써, 다량의 학습 데이터를 요구하지 않고, 집단 지성을 이용하여 라벨링을 수행할 수 있다. Through this process, in the past it was possible to derive only the object name by identifying the labeling target included in the image of the post, but in the present invention, it is possible to derive only the object name through comments included in posts and feedback information uploaded to SNS, a specific web or app bulletin board. It is possible to add labeling or modify labeling for labeling objects included in the image. In other words, if the labeling target is an animal, it can provide the advantage of being able to label detailed information related to the labeling target, such as the breed of the animal and the model name if the labeling target is a car/electronic device. Additionally, the present invention can perform labeling using collective intelligence without requiring a large amount of learning data by performing additional labeling or labeling correction using comments on posts posted on SNS, a specific web, or app.

제 1 사용자 단말(110)은 SNS(Social Network Service), 특정 웹 또는 앱을 통해 텍스트 및 이미지를 포함하는 게시물을 이미지 자동 라벨링 서버(100)로 등록할 수 있다. 예를 들어, 제 1 사용자 단말(110)의 사용자가 어로 활동을 통해 수생 생물을 포획한 경우, 제 1 사용자 단말(110)은 수생 생물 이미지 및 어로 활동과 관련된 내용을 포함하는 게시물을 이미지 자동 라벨링 서버(100)로 등록할 수 있다. 다른 예를 들어, 제 1 사용자 단말(110)의 사용자가 컴퓨터를 구매한 경우, 제 1 사용자 단말(110)은 구매한 컴퓨터의 이미지 및 구매와 관련된 내용을 포함하는 게시물을 이미지 자동 라벨링 서버(100)로 등록할 수 있다. The first user terminal 110 may register a post containing text and images with the automatic image labeling server 100 through SNS (Social Network Service), a specific web, or an app. For example, when the user of the first user terminal 110 captures aquatic life through fishing activities, the first user terminal 110 automatically labels posts containing images of aquatic life and content related to fishing activities. It can be registered as server 100. For another example, when the user of the first user terminal 110 purchases a computer, the first user terminal 110 posts a post containing an image of the purchased computer and content related to the purchase to the image automatic labeling server 100. ) can be registered.

제 1 사용자 단말(110)은 이미지 자동 라벨링 서버(100)를 통해 게시물이 라벨링 대상에 대한 인증 게시물로 결정된 경우, 이미지 자동 라벨링 서버(100)로부터 게시물이 인증 게시물로 결정되었음을 알리는 알림 메시지를 수신할 수 있다. When the first user terminal 110 determines that the post is a certified post for the labeling target through the image automatic labeling server 100, the first user terminal 110 receives a notification message notifying that the post has been determined to be a certified post from the image automatic labeling server 100. You can.

복수의 제 2 사용자 단말(120)은 SNS, 특정 웹 또는 앱을 통해 제 1 사용자 단말(110)이 등록한 게시물과 관련된 댓글, 신고, 선호도 등을 입력받을 수 있다. The plurality of second user terminals 120 may receive comments, reports, preferences, etc. related to posts registered by the first user terminal 110 through SNS, a specific web, or an app.

복수의 제 2 사용자 단말(120)은 제 1 사용자 단말(110)이 등록한 게시물과 관련된 댓글, 조회수, 신고수, 선호도수 등을 포함하는 피드백 정보를 이미지 자동 라벨링 서버(100)로 전송할 수 있다. The plurality of second user terminals 120 may transmit feedback information including comments, views, reports, preferences, etc. related to the post registered by the first user terminal 110 to the automatic image labeling server 100.

도 2는 본 발명의 일 실시예에 따른 이미지 자동 라벨링 서버의 구성도이다. 도 2를 참조하면, 이미지 자동 라벨링 서버(100)는 학습부(210), 게시물 등록부(220), 피드백 정보 수신부(230), 분석부(240), 라벨링 수행부(250) 및 인증 게시물 판단부(260)를 포함할 수 있다. Figure 2 is a configuration diagram of an automatic image labeling server according to an embodiment of the present invention. Referring to FIG. 2, the image automatic labeling server 100 includes a learning unit 210, a post registration unit 220, a feedback information reception unit 230, an analysis unit 240, a labeling performance unit 250, and an authentication post determination unit. It may include (260).

학습부(210)는 기수집된 라벨링 대상의 이미지 및 레이블 정보를 포함하는 학습 데이터를 이용하여 라벨링 대상을 식별하는 라벨링 대상 식별 모델을 학습할 수 있다. 여기서, 라벨링 대상 식별 모델은 합성곱 신경망(CNN, Convolution Neural Network), SSD(Single Shot MultiBox Detector), YOLO(Youn Only Look Once), retinanet, K-최근접 이웃(K-nearest Neighbor), K-평균/K-모드(K-means/K-modes), 가우시안 혼합 모델(Gaussian Mixture Model), SVM(Support Vector Machien), BoW(Bag of Words), Viola-Jones 등을 기반으로 하여 구축될 수 있으며, 이에 한정하지 않는다. The learning unit 210 may learn a labeling object identification model that identifies the labeling object using training data including already collected images and label information of the labeling object. Here, the labeling target identification model is Convolution Neural Network (CNN), Single Shot MultiBox Detector (SSD), Youn Only Look Once (YOLO), retinanet, K-nearest neighbor, K- It can be built based on K-means/K-modes, Gaussian Mixture Model, SVM (Support Vector Machien), BoW (Bag of Words), Viola-Jones, etc. , but is not limited to this.

라벨링 대상 식별 모델은 주성분 분석(Principal Component Analysis), 특이값 분해(Singular Value Decomposition) 알고리즘, 잠재 디리클레 할당(Latent Dirichlet Allocation) 알고리즘, 분류(Classification) 알고리즘 등을 이용하여 라벨링 대상의 식별 정확도를 더 높일 수 있다. The labeling target identification model uses Principal Component Analysis, Singular Value Decomposition algorithm, Latent Dirichlet Allocation algorithm, and Classification algorithm to further increase the identification accuracy of the labeling target. You can.

게시물 등록부(220)는 제 1 사용자 단말(110)로부터 이미지 및 텍스트를 포함하는 게시물을 등록받을 수 있다. 예를 들어, 게시물 등록부(220)는 제 1 사용자 단말(110)로부터 특정 웹 또는 앱을 통해 이미지(또는, 영상) 및 텍스트를 포함하는 게시물을 등록받을 수 있다. 여기서, 게시물은 텍스트로 구성된 제목, 텍스트 및 이미지(또는, 영상)를 포함하는 내용으로 구성될 수 있다.The post registering unit 220 may register a post including an image and text from the first user terminal 110. For example, the post registering unit 220 may receive a post including an image (or video) and text from the first user terminal 110 through a specific web or app. Here, a post may be composed of content including a title composed of text, text, and an image (or video).

피드백 정보 수신부(230)는 복수의 제 2 사용자 단말(120)로부터 게시물과 관련된 피드백 정보를 수신할 수 있다. 여기서, 피드백 정보는 게시물에 대한 댓글, 조회수, 선호도수, 신고수 등을 포함할 수 있다. The feedback information receiver 230 may receive feedback information related to the posting from the plurality of second user terminals 120. Here, the feedback information may include comments, views, preferences, reports, etc. for the post.

분석부(240)는 게시물에 포함된 텍스트 및 이미지, 피드백 정보를 분석하고, 텍스트, 이미지 및 피드백 정보 각각으로부터 키워드를 도출할 수 있다. The analysis unit 240 may analyze the text, image, and feedback information included in the post, and derive keywords from each of the text, image, and feedback information.

이러한 분석부(240)는 텍스트 분석부(241) 및 이미지 분석부(242)를 포함할 수 있다. This analysis unit 240 may include a text analysis unit 241 and an image analysis unit 242.

텍스트 분석부(241)는 텍스트 및 피드백 정보 각각을 감정 분석 모델에 입력하여 텍스트 및 피드백 정보 각각을 긍정, 부정 및 중립 중 어느 하나로 분류할 수 있다. 여기서, 감정 분석 모델은 예를 들어, 복수의 텍스트로 구성된 학습 데이터가 긍정, 부정 및 중립으로 분류되도록 학습시킨 BERT, RNN(Recurrent Neural Network) 기반으로 생성된 모델일 수 있다. The text analysis unit 241 may input each of the text and feedback information into an emotion analysis model and classify each of the text and feedback information as positive, negative, or neutral. Here, the emotion analysis model may be, for example, a model created based on BERT or RNN (Recurrent Neural Network) that is trained to classify training data consisting of a plurality of texts into positive, negative, and neutral.

예를 들어, 텍스트 분석부(241)는 게시물의 제목 및 내용을 감정 분석 모델에 입력하여 게시물을 긍정, 부정 및 중립 중 어느 하나로 분류할 수 있다. 다른 예를 들어, 텍스트 분석부(241)는 피드백 정보에 포함된 적어도 하나의 댓글을 감정 분석 모델에 입력하여 적어도 하나의 댓글 각각을 긍정, 부정 및 중립 중 어느 하나로 분류할 수 있다. For example, the text analysis unit 241 may input the title and content of the post into an emotion analysis model to classify the post as positive, negative, or neutral. For another example, the text analysis unit 241 may input at least one comment included in the feedback information into an emotion analysis model and classify each of the at least one comment as one of positive, negative, and neutral.

텍스트 분석부(241)는 텍스트를 분석하여 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류할 수 있다. The text analysis unit 241 may analyze the text and classify the sentence type of the post as either a descriptive sentence or a question sentence.

텍스트 분석부(241)는 텍스트를 분석하여 텍스트로부터 제 1 핵심 키워드를 도출할 수 있다. 예를 들어, 게시물의 본문 내용에 "시화방조제에서 돌돔을 잡았습니다"라는 문장을 포함하는 경우, 텍스트 분석부(241)는 개체명 인식(Named Entity Recognition) 알고리즘을 통해 '물고기', ' 시화방조제' 등과 같은 적어도 하나의 개체명을 도출할 수 있다. 여기서, 개체명 인식이란 어떤 것을 의미하는 단어를 분석함으로써, 해당 단어가 어떤 유형인지를 인식하는 것을 의미할 수 있다. 이후, 텍스트 분석부(241)는 도출된 적어도 하나의 개체명 중 '돌돔'과 같이 제 1 핵심 키워드를 도출할 수 있다. The text analysis unit 241 may analyze the text and derive the first key keyword from the text. For example, if the main content of the post includes the sentence “I caught a parrot sea bream at Sihwa Seawall,” the text analysis unit 241 uses a Named Entity Recognition algorithm to search for “fish” and “Sihwa Seawall.” At least one entity name such as ' can be derived. Here, entity name recognition may mean recognizing what type of word the word is by analyzing the word that means something. Thereafter, the text analysis unit 241 may derive a first key keyword, such as 'doldom', from among the at least one derived entity name.

텍스트 분석부(241)는 피드백 정보를 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 피드백 정보의 댓글에서 "돌돔 진짜 크네요"라는 문장을 포함하는 경우, 텍스트 분석부(241)는 개체명 인식 알고리즘을 통해 '물고기' 등과 같은 적어도 하나의 개체명을 도출한 후, 도출된 적어도 하나의 개체명 중 '돌돔'과 같이 제 2 핵심 키워드를 도출할 수 있다. 이 때, 텍스트 분석부(241)는 피드백 정보에 포함된 적어도 하나의 댓글이 유행어, 압축어, 의성어 등으로 구성된 경우, 해당 댓글을 유사 키워드로 변환한 후, 제 2 핵심 키워드를 도출할 수 있다. The text analysis unit 241 may analyze the feedback information and derive the second key keyword. For example, when a comment in the feedback information includes the sentence “The parrotfish is really big,” the text analysis unit 241 derives at least one entity name such as ‘fish’ through an entity name recognition algorithm, and then derives Among at least one entity name, a second core keyword such as 'doldom' can be derived. At this time, if at least one comment included in the feedback information consists of a buzzword, compressed word, onomatopoeia, etc., the text analysis unit 241 may convert the comment into a similar keyword and then derive a second core keyword. .

이러한 텍스트 분석부(241)는 TextRank, WordRank 등을 이용하여 제 1 핵심 키워드 및 제 2 핵심 키워드를 각각 도출할 수 있다. 또한, 텍스트 분석부(241)는 토픽 모델링(Topic Modeling)을 이용하여 제 1 핵심 키워드 및 제 2 핵심 키워드를 각각 도출할 수 있다. 여기서, 토픽 모델링은 게시물에 포함된 텍스트 또는 피드백 정보에 포함된 댓글에서 핵심 키워드를 추출하기 위한 텍스트 마이닝 기법을 의미할 수 있다. This text analysis unit 241 can derive the first core keyword and the second core keyword using TextRank, WordRank, etc. Additionally, the text analysis unit 241 may derive first and second core keywords, respectively, using topic modeling. Here, topic modeling may refer to a text mining technique for extracting key keywords from text included in a post or comments included in feedback information.

텍스트 분석부(241)는 피드백 정보에 대한 긍정 비율, 부정 비율 및 중립 비율에 기초하여 제 2 핵심 키워드를 결정할 수 있다. 예를 들어, 텍스트 분석부(241)는 피드백 정보에 대한 긍정 비율, 부정 비율 및 중립 비율에 기초하여 긍정 비율 또는 중립 비율이 임계치 이상인 경우, 제 2 핵심 키워드를 결정하고, 이와 달리, 부정 비율이 임계치 이상인 경우, 제 2 핵심 키워드를 도출하지 않을 수 있다. The text analysis unit 241 may determine the second key keyword based on the positive rate, negative rate, and neutral rate of the feedback information. For example, the text analysis unit 241 determines the second core keyword when the positive rate or neutral rate is greater than or equal to the threshold based on the positive rate, negative rate, and neutral rate for the feedback information. In contrast, the negative rate is If it is above the threshold, the second core keyword may not be derived.

이미지 분석부(242)는 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별할 수 있다. 예를 들어, 이미지 분석부(242)는 라벨링 대상 식별 모델을 이용하여 게시물의 이미지로부터 라벨링 대상을 식별할 수 있다. The image analysis unit 242 may analyze the image to identify a labeling target included in the image. For example, the image analysis unit 242 may identify a labeling target from an image of a post using a labeling target identification model.

이미지 분석부(242)는 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출할 수 있다. 예를 들어, 이미지 분석부(242)는 이미지에 포함된 라벨링 대상과 관련하여 예를 들어, 강아지, 고양이, 자전거, 노트북 등을 라벨링 관련 키워드로 도출할 수 있다. The image analysis unit 242 may derive labeling-related keywords related to the identified labeling target. For example, the image analysis unit 242 may derive, for example, dog, cat, bicycle, laptop, etc., as labeling-related keywords in relation to the labeling target included in the image.

이하에서는, 도 3a 및 도 3b를 통해 게시물의 텍스트를 분석하여 문장 유형을 분류하고, 게시물의 이미지를 분석하여 라벨링 관련 키워드를 도출하는 과정에 대해 설명하도록 한다. Hereinafter, the process of analyzing the text of the post to classify the sentence type and analyzing the image of the post to derive labeling-related keywords will be described through FIGS. 3A and 3B.

도 3a 및 도 3b는 본 발명의 일 실시예에 따른 게시물에 포함된 텍스트 및 이미지를 분석하는 과정을 설명하기 위한 예시적인 도면이다. 3A and 3B are exemplary diagrams for explaining a process of analyzing text and images included in a post according to an embodiment of the present invention.

도 3a를 참조하면, 텍스트 분석부(241)는 게시물의 제목 및 본문 내용에 해당하는 텍스트를 분석하여 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류할 수 있다. 이 때, 텍스트 분석부(241)는 의도 분류(Intent Classification) 알고리즘을 이용하여 텍스트에 포함된 문장의 확인 또는 목적에 기초하여 의도를 분류한 후, 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류할 수 있다. 여기서, 의도 분류 알고리즘은 예를 들어, 판매, 구매, 정보 공유, 광고 등의 클래스로 분류하도록 하는 것일 수 있다. Referring to FIG. 3A, the text analysis unit 241 may analyze the text corresponding to the title and body content of the post and classify the sentence type of the post as either a comment or a question. At this time, the text analysis unit 241 uses an intent classification algorithm to classify the intent based on the purpose or confirmation of the sentences included in the text, and then classifies the sentence type of the post as either a comment sentence or a question sentence. Can be classified. Here, the intention classification algorithm may be to classify, for example, into classes such as sales, purchase, information sharing, and advertising.

예를 들어, 게시물에 포함된 텍스트가 "제주도에서 다금바리 잡았습니다."라는 문장으로 구성된 경우, 텍스트 분석부(241)는 '제주도-목적/에서-행동 및 상태/다금바리-목적/잡았습니다-의도->확인/.-마침표(서술, 명령 청유)'와 같이 문장을 분석한 후, 해당 게시물을 평서문(300)으로 분류할 수 있다. For example, if the text included in the post consists of the sentence “I caught a Dageumbari in Jeju Island,” the text analysis unit 241 will determine ‘Jeju Island-Purpose/In-Action and Status/Dageumbari-Purpose/Caught-Intention. After analyzing sentences such as '->Confirmation/.-Period (statement, request for command)', the post can be classified as a descriptive sentence (300).

다른 예를 들어, 게시물에 포함된 텍스트가 '어떤 물고기 인가요?'라는 문장으로 구성된 경우, 텍스트 분석부(241)는 '어떤-의도->물음/물고기-목적/인가요-의도->질문/?-물음표->질문'과 같이 문장을 분석한 후, 해당 게시물을 질문문(310)으로 분류할 수 있다. For another example, if the text included in the post consists of the sentence 'What kind of fish is it?', the text analysis unit 241 may ask 'What-intention->Question/Fish-Purpose/Is-Intention->Question/? After analyzing the sentence as '-question mark->question', the post can be classified as a question (310).

또 다른 예를 들어, 게시물에 포함된 텍스트가 '아이스크림 케이크 하나 주세요.'라는 문장으로 구성된 경우, 텍스트 분석부(241)는 '아이스크림-목적 조건/케이크-목적/하나-수량/주세요-의도->구매/.-마침표(서술, 명령, 청유)'와 같이 문장을 분석한 후, 해당 게시물의 의도를 구매(320)로 분류할 수 있다. For another example, if the text included in the post consists of the sentence 'Please give me one ice cream cake,' the text analysis unit 241 will analyze 'Ice cream-purpose condition/cake-purpose/one-quantity/please-intention- After analyzing sentences such as '>purchase/.-period (description, command, solicitation)', the intention of the post can be classified as purchase (320).

또 다른 예를 들어, 게시물에 포함된 텍스트가 '두번째 강아지 품종이 어떻게 되나요?'라는 문장으로 구성된 경우, 텍스트 분석부(241)는 '두번째-순서/강아지-목적, 조건/품종이-목적/어떻게 되나요-의도->물음/?-물음표->질문'과 같이 문장을 분석한 후, 해당 게시물을 질문문(330)으로 분류할 수 있다. For another example, if the text included in the post consists of the sentence ‘What is the breed of the second dog?’, the text analysis unit 241 may use the sentence ‘Second-order/puppy-purpose, condition/breed-purpose/ After analyzing the sentence as ‘what happens-intention->question/?-question mark->question’, the post can be classified as a question (330).

도 3b를 참조하면, 이미지 분석부(242)는 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출할 수 있다. 예를 들어, 이미지 분석부(242)는 (a)의 객체 분류(Object Classification) 알고리즘을 통해 게시물에 포함된 이미지를 라벨링 대상 식별 모델에 입력하여 이미지에 포함된 라벨링 대상을 사람(340), 양(341), 늑대(342)로 분류하고, (b)의 유전자 객체 검출(Genetic Object Detection) 과정을 통해 게시물의 이미지를 판별한 후, 이미지에 포함된 라벨링 대상에 바운딩 박스(Bounding Box)를 표시하고, (c)의 의미론적 분할(Semantic Segmentation) 과정을 수행한 후, (d)의 객체 인스턴스 세그먼테이션(Object Instance Segmentation) 과정을 통해 선택된 라벨링 대상을 제외한 나머지 배경을 크롭(crop)할 수 있다. Referring to FIG. 3B, the image analysis unit 242 may analyze the image to identify a labeling target included in the image and derive labeling-related keywords related to the identified labeling target. For example, the image analysis unit 242 inputs the image included in the post into the labeling target identification model through the object classification algorithm of (a) to classify the labeling target included in the image as a person 340, a sheep, etc. (341) and wolf (342), and after determining the image of the post through the Genetic Object Detection process in (b), a bounding box is displayed on the labeling object included in the image. And, after performing the semantic segmentation process of (c), the remaining background except the selected labeling target can be cropped through the object instance segmentation process of (d).

이러한 과정을 통해, 이미지 분석부(242)는 라벨링 대상과 관련된 라벨링 관련 키워드를 예를 들어, '사람', '양', '늑대'와 같이 도출할 수 있다. Through this process, the image analysis unit 242 can derive labeling-related keywords related to the labeling target, such as 'person', 'sheep', and 'wolf'.

다시 도 2로 돌아와서, 라벨링 수행부(250)는 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. 이 때, 라벨링 수행부(250)는 분류된 게시물의 문장 유형에 더 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. 라벨링 대상에 대한 라벨링을 수행하는 과정에 대해서는 도 4 내지 도 7b를 통해 상세히 설명하도록 한다. Returning to FIG. 2 , the labeling unit 250 may perform labeling of the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. At this time, the labeling performing unit 250 may perform labeling of the labeling target based on the sentence type of the classified post. The process of labeling the labeling object will be described in detail with reference to FIGS. 4 to 7B.

도 4는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 평서문에 해당하는 경우 라벨링 대상에 대한 추가 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다. Figure 4 is an exemplary diagram illustrating a process of performing additional labeling on a labeling target when the sentence type of a post corresponds to a descriptive sentence according to an embodiment of the present invention.

도 4를 참조하면, 라벨링 수행부(250)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드, 제 1 핵심 키워드 및 제 2 핵심 키워드가 모두 일치하는 경우, 이미지에 해당하는 라벨링 대상 영역에 제 1 핵심 키워드 및 제 2 핵심 키워드 중 적어도 하나에 기초하여 라벨링 대상에 대한 추가 라벨링을 수행할 수 있다. Referring to FIG. 4, if the sentence type of the post corresponds to a descriptive sentence and the labeling-related keywords, first core keyword, and second core keyword all match, the labeling performing unit 250 applies a label to the labeling target area corresponding to the image. Additional labeling of the labeling target may be performed based on at least one of the first core keyword and the second core keyword.

예를 들어, 제 1 사용자 단말(110)로부터 제목 및 본문 내용을 포함하는 텍스트(401) 및 이미지(402)를 포함하는 게시물(400)을 등록받았다고 가정하자. For example, assume that a post 400 including text 401 including a title and body content and an image 402 is registered from the first user terminal 110.

텍스트 분석부(241)는 게시물(400)의 텍스트(401)를 분석하여 게시물(400)의 문장 유형을 '평서문'으로 분류할 수 있다. 예를 들어, 텍스트 분석부(241)는 게시물(400)의 텍스트(401)를 분석하여 게시물(400)의 문장에 포함된 마침표에 기초하여 문장 유형을 '평서문'으로 분류할 수 있다. The text analysis unit 241 may analyze the text 401 of the post 400 and classify the sentence type of the post 400 as a 'commentary sentence'. For example, the text analysis unit 241 may analyze the text 401 of the post 400 and classify the sentence type as a 'commentary sentence' based on the period included in the sentence of the post 400.

텍스트 분석부(241)는 게시물(400)의 텍스트(401)를 감정 분석 모델에 입력하여 텍스트를 '긍정'으로 분류하고, 텍스트(401)로부터 제 1 핵심 키워드를 '스포티시 폴드, 고양이(고냥이), 사랑'으로 도출할 수 있다. The text analysis unit 241 inputs the text 401 of the post 400 into the sentiment analysis model to classify the text as 'positive', and selects the first key keyword from the text 401 as 'sports fold, cat' ), can be derived as ‘love’.

이미지 분석부(242)는 게시물(400)의 이미지(402)를 라벨링 대상 식별 모델에 입력하여 이미지(402)에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 '고양이'로 도출할 수 있다. 이 때, 이미지 분석부(242)는 이미지(402)에 메타데이터가 포함되었는지 여부에 기초하여 라벨링 대상의 식별을 위한 가중치를 조절할 수 있다. The image analysis unit 242 inputs the image 402 of the post 400 into the labeling object identification model to identify the labeling object included in the image 402, and sets the labeling-related keyword related to the identified labeling object to 'cat'. It can be derived as: At this time, the image analysis unit 242 may adjust the weight for identifying the labeling target based on whether metadata is included in the image 402.

이 때, 게시물(400)에서 이미지(402)로부터 도출된 라벨링 관련 키워드 및 텍스트(401)로부터 도출된 제 1 핵심 키워드 간의 연관된 키워드는 '스코티시 폴드' 및 '고양이'일 수 있다. At this time, in the post 400, the related keywords between the labeling-related keyword derived from the image 402 and the first core keyword derived from the text 401 may be 'Scottish fold' and 'cat'.

텍스트 분석부(241)는 피드백 정보(410)에 포함된 복수의 댓글(411)을 감정 분석 모델에 입력하여 복수의 댓글(411) 각각을 긍정, 부정 및 중립으로 분류한 후, 피드백 정보(410)에 포함된 댓글(411)을 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 텍스트 분석부(241)는 사용자 1의 댓글에 대해 '긍정-스코티시 폴드', 사용자 2의 댓글에 대해 '긍정-인형', 사용자 3의 댓글에 대해 '긍정-X', 사용자 4의 댓글에 대해 '긍정-니양, 스코티시 폴드', 사용자 5의 댓글에 대해 '긍정-X', 사용자 6의 댓글에 대해 '중립-스코티시 폴드, 연골, 관절염' 등과 같이 복수의 댓글(411)을 긍정, 부정 및 중립으로 분류한 후 각각의 댓글로부터 댓글 관련 키워드를 도출할 수 있다. 이 때, 텍스트 분석부(241)는 유사 키워드 변환을 통해 사용자 4의 댓글의 '니양'을 '고양이'로 변환하고, '스코티쉬 폴드'를 '스코티시 폴드'로 변환할 수 있다. The text analysis unit 241 inputs a plurality of comments 411 included in the feedback information 410 into an emotion analysis model, classifies each of the plurality of comments 411 into positive, negative, and neutral, and then classifies the feedback information 410 into positive, negative, and neutral. ), the second key keyword can be derived by analyzing the comments (411) included in the comment (411). For example, the text analysis unit 241 is 'positive-Scottish fold' for user 1's comment, 'positive-doll' for user 2's comment, 'positive-X' for user 3's comment, and user 4 Multiple comments (411) were made, such as 'Positive - Niyang, Scottish Fold' to the comment of ', 'Positive - After classifying comments as positive, negative, and neutral, comment-related keywords can be derived from each comment. At this time, the text analysis unit 241 may convert 'niyang' in user 4's comment to 'cat' and 'Scottish fold' to 'Scottish fold' through similar keyword conversion.

이후, 텍스트 분석부(241)는 전체 '6개'의 댓글 중 긍정 비율 및 중립 비율이 '6'에 해당하므로, 제 2 핵심 키워드를 '스코티시 폴드, 인형, 카리스마, 니양, 스코티쉬 폴드, 연골, 관절염'으로 도출할 수 있다. Afterwards, the text analysis unit 241 determines that the positive and neutral ratios among the total '6' comments are '6', so the second key keywords are 'Scottish fold, doll, charisma, niyang, Scottish fold, cartilage, It can be derived as ‘arthritis’.

라벨링 수행부(250)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드가 '고양이'이고, 제 1 핵심 키워드가 '고양이', '스코티시 폴드', '사랑'이고, 제 2 핵심 키워드가 '스코티시 폴드, 고양이'로 이미지로부터 도출된 라벨링 관련 키워드에 기초하여 '고양이'로 모두 키워드가 일치하는 경우, 자동 라벨링에서 '고양이'를 제외한 후, 이미지에 해당하는 라벨링 대상 영역(이미지상의 라벨링 대상에 대해 지정된 영역)에 제 1 핵심 키워드 및 제 2 핵심 키워드 중 적어도 하나에 기초하여 예를 들어, '스코티시 폴드'와 같이 라벨링 대상에 대한 추가 라벨링을 수행할 수 있다. The labeling execution unit 250 determines that the sentence type of the post corresponds to a descriptive sentence, the labeling-related keyword is 'cat', the first core keyword is 'cat', 'Scottish fold', and 'love', and the second core keyword is 'cat'. If all keywords match 'cat' based on the labeling-related keywords derived from the image as 'Scottish Fold, cat', 'cat' is excluded from automatic labeling, and then the labeling target area corresponding to the image (labeling target on the image) is selected. Additional labeling may be performed on the labeling target, for example, 'Scottish fold', based on at least one of the first core keyword and the second core keyword in the designated area.

종래에는 이미지를 분석하여 라벨링 대상을 식별하고자 하는 경우, 학습 데이터 셋이 충분하지 않아 객체만 판단하는 경우가 대부분이었다. 예를 들어, 이미지를 통해 라벨링 대상을 '고양이', '물고기', '자동차' 등과 같이 식별한 경우, 해당 라벨링 대상과 관련된 품종 및 모델명까지는 식별하기 어렵다는 단점을 가지고 있었다. In the past, when trying to identify a labeling target by analyzing an image, in most cases only the object was judged because the training data set was not sufficient. For example, when labeling objects such as 'cat', 'fish', and 'car' are identified through images, it has the disadvantage that it is difficult to identify the breed and model name related to the labeling object.

그러나 본 발명은 게시물에 포함된 제목 및 본문 내용과 관련된 텍스트로부터 도출된 제 1 핵심 키워드 및 피드백 정보에 포함된 적어도 하나의 댓글로부터 도출된 제 2 핵심 키워드를 이용함으로써, 예를 들어, 게시물에 포함된 '고양이'의 품종이 '스코티시 폴드'인 것과 같이 라벨링 대상에 대해 추가 라벨링을 수행할 수 있다. However, the present invention uses a first key keyword derived from text related to the title and body content included in the post and a second key keyword derived from at least one comment included in the feedback information, for example, included in the post. Additional labeling can be performed on the labeling target, such as the breed of 'cat' being 'Scottish Fold'.

도 5는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 평서문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다. Figure 5 is an exemplary diagram for explaining a process of labeling a labeling target included in a post when the sentence type of the post corresponds to a descriptive sentence according to an embodiment of the present invention.

도 5를 참조하면, 라벨링 수행부(250)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드가 제 1 핵심 키워드와 일치하고 제 2 핵심 키워드와 불일치하는 경우, 제 2 핵심 키워드에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. Referring to FIG. 5, if the sentence type of the post corresponds to a descriptive sentence and the labeling-related keyword matches the first core keyword and does not match the second core keyword, the labeling performing unit 250 performs the labeling function based on the second core keyword. Labeling can be performed on the labeling target.

예를 들어, 제 1 사용자 단말(110)로부터 제목 및 본문 내용을 포함하는 텍스트(501) 및 이미지(502)를 포함하는 게시물(500)을 등록받았다고 가정하자. For example, assume that a post 500 including text 501 including a title and body content and an image 502 is registered from the first user terminal 110.

텍스트 분석부(241)는 게시물(500)의 텍스트(501)를 분석하여 게시물의 문장 유형을 '평서문'으로 분류할 수 있다. 예를 들어, 텍스트 분석부(241)는 게시물(500)의 텍스트(501)를 분석하여 게시물(500)의 문장에 포함된 마침표에 기초하여 문장 유형을 '평서문'으로 분류할 수 있다. The text analysis unit 241 may analyze the text 501 of the post 500 and classify the sentence type of the post as a 'commentary sentence'. For example, the text analysis unit 241 may analyze the text 501 of the post 500 and classify the sentence type as a 'commentary sentence' based on the period included in the sentence of the post 500.

텍스트 분석부(241)는 게시물(500)의 텍스트(501)를 감정 분석 모델에 입력하여 텍스트를 '중립'으로 분류하고, 텍스트(501)로부터 제 1 핵심 키워드를 '서해, 다금바리, 제주도, 서해, 무안, 해제면, 선상낚시'를 도출할 수 있다. The text analysis unit 241 inputs the text 501 of the post 500 into the emotion analysis model to classify the text as 'neutral', and selects the first core keyword from the text 501 as 'Seohae, Dageumbari, Jeju Island, Seohae'. , Muan, Haeseon-myeon, boat fishing’ can be derived.

이미지 분석부(242)는 게시물(500)의 이미지(502)를 라벨링 대상 식별 모델에 입력하여 이미지(502)에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 '물고기'로 도출할 수 있다. The image analysis unit 242 inputs the image 502 of the post 500 into the labeling object identification model to identify the labeling object included in the image 502, and inputs the labeling-related keyword related to the identified labeling object into 'fish'. It can be derived as:

이 때, 게시물(500)에서 이미지(502)로부터 도출된 라벨링 관련 키워드 및 텍스트(501)로부터 도출된 제 1 핵심 키워드 간의 일치하는 키워드는 '다금바리'일 수 있다. At this time, in the post 500, the matching keyword between the labeling-related keyword derived from the image 502 and the first core keyword derived from the text 501 may be 'dageumbari'.

텍스트 분석부(241)는 피드백 정보(510)에 포함된 복수의 댓글(511)을 감정 분석 모델에 입력하여 복수의 댓글(511) 각각을 긍정, 부정 및 중립으로 분류한 후, 피드백 정보(510)에 포함된 댓글(511)을 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 텍스트 분석부(241)는 사용자 1의 댓글에 대해 '부정-다금바리', 사용자 2의 댓글에 대해 '부정-붉바리, 회, 2만원', 사용자 3의 댓글에 대해 '긍정-농어목, 바리과, 붉바리', 사용자 4의 댓글에 대해 '긍정-붉바리', 사용자 5의 댓글에 대해 '중립-자바리, 다금바리' 등과 같이 복수의 댓글(511)을 긍정, 부정 및 중립으로 분류한 후, 제 2 핵심 키워드를 도출할 수 있다. 이 때, 텍스트 분석부(241)는 사용자 1의 댓글이 부정에 해당하므로, 부정 키워드인 '다금바리'는 키워드에서 제외되도록 하고, 사용자 2의 댓글이 부정에 해당하지만, 이미지로부터 식별된 물고기와 관련 단어인 '붉바리'를 포함하므로 해당 댓글의 관련 키워드로 도출하고, 사용자 3 및 사용자 4의 댓글이 긍정에 해당하므로, '붉바리'를 관련 키워드로 도출하고, 사용자 5의 댓글이 중립에 해당하므로, '자바리, 다금바리'를 댓글 관련 키워드로 도출할 수 있다. The text analysis unit 241 inputs a plurality of comments 511 included in the feedback information 510 into an emotion analysis model, classifies each of the plurality of comments 511 into positive, negative, and neutral, and then classifies the feedback information 510 into positive, negative, and neutral. ), the second key keyword can be derived by analyzing the comments (511) included in the comment (511). For example, the text analysis unit 241 responds to User 1's comment with 'Negative - Dageumbari', to User 2's comment with 'Negative - Redbari, raw fish, 20,000 won', and to User 3's comment with 'Positive - Classification of multiple comments (511) into positive, negative, and neutral, such as 'Perciformes, Pteridae, Redbari', 'Positive - Redbari' for user 4's comment, 'Neutral - Jabari, Dageumbari' for user 5's comment, etc. After that, the second core keyword can be derived. At this time, the text analysis unit 241 determines that since User 1's comment is negative, the negative keyword 'Dageumbari' is excluded from the keyword, and although User 2's comment is negative, it is related to the fish identified from the image. Since it contains the word 'redbari', it is derived as a related keyword for the comment. Since the comments of user 3 and user 4 are positive, 'redbari' is derived as a related keyword, and user 5's comment is neutral. Therefore, ‘Jabari, Dageumbari’ can be derived as comment-related keywords.

이후, 텍스트 분석부(241)는 전체 '5개'의 댓글 중 긍정 비율 및 중립 비율이 '3'에 해당하므로, 제 2 핵심 키워드를 '붉바리'로 도출할 수 있다. Afterwards, the text analysis unit 241 can derive the second key keyword as 'red bari' because the positive and neutral ratios among the total '5' comments are '3'.

라벨링 수행부(250)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드가 '물고기'이고, 제 1 핵심 키워드가 '다금바리'이고, 제 2 핵심 키워드가 '붉바리'이므로, 이와 같이, 라벨링 수행부(250)는 게시물의 문장 유형이 평서문에 해당하고, 라벨링 관련 키워드가 제 1 핵심 키워드와 일치하고 제 2 핵심 키워드와 불일치하는 경우, 제 2 핵심 키워드인 '붉바리'에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. The labeling executing unit 250 determines that the sentence type of the post corresponds to a descriptive sentence, the labeling-related keyword is 'fish', the first core keyword is 'dageumbari', and the second core keyword is 'redbari', thus, If the sentence type of the post corresponds to a descriptive sentence and the labeling-related keyword matches the first core keyword and does not match the second core keyword, the labeling performing unit 250 performs labeling based on the second core keyword, 'redbari'. Labeling of objects can be performed.

즉, 게시물에 포함된 제목 및 본문 내용과 관련된 텍스트와 피드백 정보에 포함된 댓글 간의 키워드가 상호간에 상이한 경우, 제 2 핵심 키워드에 기초하여 라벨링 대상에 대한 라벨링을 수행함으로써, 라벨링 대상이 사용자에 의해 잘못 판단된 경우, 댓글을 통한 집단 지성을 이용하여 라벨링 대상에 대한 라벨링을 수정되도록 할 수 있다. In other words, if the keywords between the text related to the title and body content included in the post and the comments included in the feedback information are different from each other, labeling is performed based on the second core keyword, so that the labeling target is determined by the user. In case of a misjudgment, the labeling of the labeling target can be corrected using collective intelligence through comments.

도 6a 및 도 6b는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 질문문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 수행하는 과정을 설명하기 위한 예시적인 도면이다. FIGS. 6A and 6B are exemplary diagrams for explaining a process of labeling a labeling target included in a posting when the sentence type of the posting corresponds to a question according to an embodiment of the present invention.

도 6a를 참조하면, 제 1 사용자 단말(110)로부터 제목 및 본문 내용을 포함하는 텍스트(601) 및 이미지(602)를 포함하는 게시물(600)을 등록받았다고 가정하자. Referring to FIG. 6A, assume that a post 600 including text 601 including a title and body content and an image 602 is registered from the first user terminal 110.

텍스트 분석부(241)는 게시물(600)의 텍스트(601)를 분석하여 게시물(600)의 문장 유형을 '질문문'으로 분류할 수 있다. 예를 들어, 텍스트 분석부(241)는 게시물(600)의 제목을 분석하여 '이 자전거 모델이 무엇인가요?'에 포함된 물음표에 기초하여 문장 유형을 '질문문'으로 분류할 수 있다. The text analysis unit 241 may analyze the text 601 of the post 600 and classify the sentence type of the post 600 as a 'question'. For example, the text analysis unit 241 may analyze the title of the post 600 and classify the sentence type as 'question' based on the question mark included in 'What is this bicycle model?'

텍스트 분석부(241)는 게시물(600)의 텍스트(601)를 감정 분석 모델에 입력하여 텍스트를 '중립'으로 분류하고, 텍스트(601)로부터 제 1 핵심 키워드를 '자전거'로 도출할 수 있다. The text analysis unit 241 may input the text 601 of the post 600 into an emotion analysis model to classify the text as 'neutral' and derive the first key keyword as 'bicycle' from the text 601. .

여기서, 잠시 도 6b를 참조하면, 이미지 분석부(242)는 게시물(600)의 이미지(602)를 라벨링 대상 식별 모델에 입력하여 이미지(602)에 포함된 라벨링 대상을 '자전거(620, bicycle)', '사람1'(621, person1), '사람2'(622, person2)과 같이 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 '자전거'로 도출할 수 있다. Here, briefly referring to FIG. 6B, the image analysis unit 242 inputs the image 602 of the post 600 into the labeling object identification model and labels the labeling object included in the image 602 as 'bicycle 620'. ', 'person 1' (621, person1), 'person 2' (622, person2), and the labeling-related keyword related to the identified labeling target can be derived as 'bicycle'.

이 때, 게시물(600)에서 이미지(602)로부터 도출된 라벨링 관련 키워드 및 텍스트(601)로부터 도출된 제 1 핵심 키워드 간의 연관된 키워드는 '자전거'일 수 있다. At this time, in the post 600, the related keyword between the labeling-related keyword derived from the image 602 and the first core keyword derived from the text 601 may be 'bicycle'.

다시 도 6a로 돌아와서, 텍스트 분석부(241)는 피드백 정보(610)에 포함된 복수의 댓글(611)을 감정 분석 모델에 입력하여 복수의 댓글(611) 각각을 긍정, 부정 및 중립으로 분류한 후, 피드백 정보(610)에 포함된 댓글(611)을 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 텍스트 분석부(241)는 사용자 1의 댓글에 대해 '중립-스캇 스케일 레드', 사용자 2의 댓글에 대해 '긍정-산악자전거/스캇 스케일/최고봉', 사용자 3의 댓글에 대해 '중립-레드 스케일', 사용자 4의 댓글에 대해 '긍정-스케일, 스캇, 하드테일, 산악자전거, 가성비'와 같이 댓글 관련 키워드를 도출할 수 있다. Returning to FIG. 6A, the text analysis unit 241 inputs a plurality of comments 611 included in the feedback information 610 into an emotion analysis model and classifies each of the plurality of comments 611 into positive, negative, and neutral. Afterwards, the second key keyword can be derived by analyzing the comment 611 included in the feedback information 610. For example, the text analysis unit 241 may use 'Neutral-Scott Scale Red' for user 1's comment, 'Positive-mountain bike/Scott scale/highest peak' for user 2's comment, and ' Comment-related keywords such as 'neutral-red scale' and 'positive-scale, scott, hardtail, mountain bike, cost-effectiveness' can be derived from user 4's comment.

이 때, 텍스트 분석부(241)는 사용자 1의 댓글이 중립에 해당하므로, 이미지로부터 식별된 자전거와 연관있는 '스캇 스케일'로 도출하고, 사용자 2의 댓글이 긍정에 해당하고, 이미지로부터 식별된 자전거와 연관있는 '산악자전거, 스캇 스케일'을 도출하고, 사용자 3의 댓글이 중립에 해당하므로, '이미지로부터 식별된 자전거와 관련있는 '레드 스케일'을 도출하고, 사용자 4의 댓글이 긍정에 해당하므로, 이미지로부터 식별된 자전거와 관련있는 '스케일/스캇/산악자전거/스캇 스케일'을 도출할 수 있다. At this time, the text analysis unit 241 derives the 'Scott scale' associated with the bicycle identified from the image because User 1's comment corresponds to neutral, and User 2's comment corresponds to positive, and the bicycle identified from the image is derived. Derive 'Mountain bike, Scott scale' related to bicycles, and since user 3's comment corresponds to neutral, 'red scale' related to bicycle identified from the image is derived, and user 4's comment corresponds to positive. Therefore, 'scale/scott/mountain bike/scott scale' related to the bicycle identified from the image can be derived.

이후, 텍스트 분석부(241)는 전체 '4'개의 댓글 중 긍정 비율 및 중립 비율이 '4'에 해당하므로, 제 2 핵심 키워드를 '스캇 스케일'로 도출할 수 있다. Afterwards, the text analysis unit 241 can derive the second key keyword as 'Scott scale' because the positive and neutral ratios among the total '4' comments correspond to '4'.

라벨링 수행부(250)는 게시물의 문장 유형이 질문문에 해당하고, 라벨링 관련 키워드가 '자전거'이고, 제 1 핵심 키워드가 '자전거'이고, 제 2 핵심 키워드가 '스캇 스케일'로 도출된 경우, 제 2 핵심 키워드인 '스캇 스케일'에 기초하여 이미지에 해당하는 라벨링 대상 영역(이미지상의 자전거 영역)에 '스캇 스케일'을 라벨링 대상에 대해 라벨링을 수행할 수 있다. 이 때, 이미지 상의 자전거 영역에 '자전거/스캇 스케일'이 라벨링됨으로써, 추후에 학습 데이터로 이용될 수 있다. The labeling performing unit 250 operates when the sentence type of the post corresponds to a question, the labeling-related keyword is 'bicycle', the first core keyword is 'bicycle', and the second core keyword is derived as 'Scott scale'. , Based on the second key keyword, 'Scott scale', labeling can be performed on the labeling target area (bicycle area on the image) corresponding to the image with 'Scott scale'. At this time, the bicycle area on the image is labeled with 'bicycle/Scott scale', so it can be used as learning data later.

이와 달리, 라벨링 수행부(250)는 게시물의 문장 유형이 질문문에 해당하고, 피드백 정보에 대한 긍정 비율이 임계치 이상인 경우, 이미지에 해당하는 라벨링 대상 영역에 제 1 핵심 키워드에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. On the other hand, if the sentence type of the post corresponds to a question sentence and the positive rate for the feedback information is more than the threshold, the labeling performing unit 250 applies the labeling target to the labeling target area corresponding to the image based on the first core keyword. Labeling can be performed.

예를 들어, 게시물(600)의 제목에 "이 자전거 모델이 무엇인가요?"를 포함하고, 본문 내용에 "스캇 스케일인가요?"라는 질문 내용을 포함한다고 가정하자. 이 때, 텍스트 분석부(241)는 게시물(600)의 텍스트로부터 제 1 핵심 키워드를 '자전거', '스캇 스케일'로 도출하고, 이미지(602)로부터 라벨링 관련 키워드를 '자전거'로 도출할 수 있다. 이후, 텍스트 분석부(241)는 피드백 정보(610)의 댓글(611)에서 "네", "맞아요", "그렇게 보여요"와 같이 긍정적인 댓글이 임계치 이상인 경우, 라벨링 수행부(250)는 이미지에 해당하는 라벨링 대상 영역에 제 1 핵심 키워드인 '스캇 스케일'에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수도 있다. For example, let's assume that the title of the post 600 includes "What model is this bike?" and the body content includes the question "Is this a Scott scale?" At this time, the text analysis unit 241 can derive the first key keywords as 'bicycle' and 'Scott scale' from the text of the post 600, and the labeling-related keyword as 'bicycle' from the image 602. there is. Afterwards, when the text analysis unit 241 has positive comments such as “yes,” “that’s right,” or “it looks like that” in the comments 611 of the feedback information 610 above the threshold, the labeling unit 250 selects the image. Labeling of the labeling target may be performed based on the first core keyword, 'Scott scale', in the labeling target area corresponding to .

도 7a 및 도 7b는 본 발명의 일 실시예에 따른 게시물의 문장 유형이 질문문에 해당하는 경우 게시물에 포함된 라벨링 대상에 대한 라벨링을 미수행하는 과정을 설명하기 위한 예시적인 도면이다. FIGS. 7A and 7B are exemplary diagrams for explaining a process of not performing labeling on a labeling target included in a posting when the sentence type of the posting corresponds to a question according to an embodiment of the present invention.

도 7a를 참조하면, 제 1 사용자 단말(110)로부터 제목 및 본문 내용을 포함하는 텍스트(701) 및 이미지(702)를 포함하는 게시물(700)을 등록받았다고 가정하자. Referring to FIG. 7A, assume that a post 700 including text 701 including a title and body content and an image 702 is registered from the first user terminal 110.

텍스트 분석부(241)는 게시물(700)의 텍스트를 분석하여 "사무용 노트북 어떤 것이 좋아요?"의 제목에서 물음표가 포함되었으므로, 게시물(700)의 문장 유형을 '질문문'으로 분류할 수 있다. The text analysis unit 241 analyzes the text of the post 700 and, since the title of “Which office laptop do you like?” includes a question mark, the sentence type of the post 700 can be classified as a ‘questionnaire’.

텍스트 분석부(241)는 게시물(700)의 텍스트(701)를 감정 분석 모델에 입력하여 텍스트를 '중립'으로 분류하고, '텍스트(701)로부터 제 1 핵심 키워드를 '노트북/엑셀/파워포인트/넷플릭스/유튜브'로 도출할 수 있다. The text analysis unit 241 inputs the text 701 of the post 700 into an emotion analysis model to classify the text as 'neutral' and selects the first core keyword from the text 701 as 'laptop/excel/powerpoint'. It can be derived as ‘/Netflix/YouTube’.

여기서, 잠시 도 7b를 참조하면, 이미지 분석부(242)는 게시물(700)의 이미지(702)를 라벨링 대상 식별 모델에 입력하여 이미지(702)에 포함된 라벨링 대상을 '강아지1'(720, dog1), '강아지2'(721, dog2), '고양이(722, cat)과 같이 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 '강아지' 및 '고양이'로 도출할 수 있다. Here, briefly referring to FIG. 7B, the image analysis unit 242 inputs the image 702 of the post 700 into the labeling object identification model and selects the labeling object included in the image 702 as 'dog 1' (720, dog1), 'dog2'(721, dog2), and 'cat(722, cat), and labeling-related keywords related to the identified labeling target can be derived as 'dog' and 'cat'.

이 때, 게시물(700)의 이미지(702)로부터 도출된 라벨링 관련 키워드인 '강아지', '고양이' 및 게시물(700)의 텍스트(701)로부터 도출된 제 1 핵심 키워드 간의 일치하는 키워드가 없는 것을 확인할 수 있다. At this time, there is no matching keyword between the labeling-related keywords 'dog' and 'cat' derived from the image 702 of the post 700 and the first core keyword derived from the text 701 of the post 700. You can check it.

다시 도 7a로 돌아와서, 텍스트 분석부(241)는 피드백 정보(710)에 포함된 복수의 댓글(711)을 감정 분석 모델에 입력하여 복수의 댓글(711) 각각을 긍정, 부정 및 중립으로 분류한 후, 피드백 정보(710)에 포함된 댓글(711)을 분석하여 제 2 핵심 키워드를 도출할 수 있다. 예를 들어, 텍스트 분석부(241)는 사용자 1의 댓글에 대해 '긍정-레노버/아이디어패드/라이젠'을 도출하고, 사용자 2의 댓글에 대해 '긍정-LG/그램'을 도출하고, 사용자 3의 댓글에 대해 '중립-X'를 도출하고, 사용자 4의 댓글에 대해 '긍정-한성'을 도출하고, 사용자 5의 댓글에 대해 '중립-애플'을 각각의 댓글로부터 댓글 관련 키워드로 도출할 수 있다. Returning to FIG. 7A, the text analysis unit 241 inputs a plurality of comments 711 included in the feedback information 710 into an emotion analysis model and classifies each of the plurality of comments 711 into positive, negative, and neutral. Afterwards, the second key keyword can be derived by analyzing the comment 711 included in the feedback information 710. For example, the text analysis unit 241 derives ‘Positive-Lenovo/IdeaPad/Ryzen’ for user 1’s comment, ‘positive-LG/gram’ for user 2’s comment, and user 3 'Neutral - You can.

이 때, 텍스트 분석부(241)는 사용자 1, 사용자 2, 사용자 4의 댓글이 긍정에 해당하고, 사용자 3 및 사용자 5의 댓글이 중립에 해당하나, 각각 댓글로부터 추출된 키워드가 이미지와 연관된 키워드가 존재하지 않으므로, 제 2 핵심 키워드를 도출하지 않을 수 있다. At this time, the text analysis unit 241 determines that the comments of User 1, User 2, and User 4 are positive, and the comments of User 3 and User 5 are neutral, but the keywords extracted from each comment are keywords related to the image. Since does not exist, the second core keyword may not be derived.

라벨링 수행부(250)는 게시물의 문장 유형이 질문문에 해당하고, 라벨링 관련 키워드가 '강아지', '고양이'이고, 제 1 핵심 키워드가 '노트북/엑셀/파워포인트/넷플릭스/유튜브'이고, 제 2 핵심 키워드가 존재하지 않은 경우, 게시물(700)의 이미지(702)와 제 1 핵심 키워드 및 제 2 핵심 키워드 간의 연관성이 없으므로 이미지 상의 라벨링 대상에 대해 라벨링을 수행하지 않을 수 있다. The labeling performing unit 250 determines that the sentence type of the post corresponds to a question, the labeling-related keywords are 'dog' and 'cat', and the first key keyword is 'laptop/Excel/Powerpoint/Netflix/YouTube'. If the second core keyword does not exist, there is no relationship between the image 702 of the post 700 and the first core keyword and the second core keyword, so labeling may not be performed on the labeling target on the image.

다시 도 2로 돌아와서, 인증 게시물 판단부(260)는 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 게시물을 라벨링 대상에 대한 인증 게시물로 판단할 수 있다. 여기서, 게시물을 라벨링 대상에 대한 인증 게시물로 판단하는 과정에 대해서는 잠시 도 3a를 통해 설명하도록 한다. Returning to FIG. 2 , the certified post determination unit 260 may determine that the post is a certified post for the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. Here, the process of determining a post as an authentication post for a labeling target will be briefly explained with reference to FIG. 3A.

인증 게시물 판단부(260)는 라벨링 관련 키워드 및 제 1 핵심 키워드 간의 관련도에 기초하여 제 1 스코어를 산출하고, 라벨링 관련 키워드 및 제 2 핵심 키워드 간의 관련도에 기초하여 제 2 스코어를 산출하고, 조회수 및 선호도수에 대한 비율에 기초하여 제 3 스코어를 산출할 수 있다. 여기서, 조회수 및 선호도수에 대한 비율이 232/12012이므로, 1%이상에 해당하며, 만약, 조회수 및 선호도수에 대한 비율이 1/12012인 경우, 0.01%이하에 해당할 수 있다. 또한, 인증 게시물 판단부(260)는 조회수 대비 신고수를 더 고려하여 제 4 스코어를 산출할 수 있다.The authentication post determination unit 260 calculates a first score based on the degree of relationship between the labeling-related keyword and the first core keyword, and calculates a second score based on the degree of relationship between the labeling-related keyword and the second core keyword, A third score can be calculated based on the ratio of the number of views and the number of preferences. Here, since the ratio of the number of views and preferences is 232/12012, it may correspond to 1% or more. If the ratio of the number of views and preferences is 1/12012, it may correspond to 0.01% or less. Additionally, the authentication post determination unit 260 may calculate the fourth score by further considering the number of reports compared to the number of views.

인증 게시물 판단부(260)는 제 1 내지 제 3 스코어에 기초하여 게시물에 대한 인증 스코어를 산출하고, 게시물에 대한 인증 스코어가 임계치 이상인 경우, 게시물을 라벨링 대상에 대한 인증 게시물로 결정할 수 있다. 여기서, 인증 게시물 판단부(260)는 예를 들어, 다음의 수학식 1을 이용하여 게시물에 대한 인증 스코어를 산출할 수 있다. The authenticated post determination unit 260 calculates an authentication score for the post based on the first to third scores, and when the authentication score for the post is greater than or equal to a threshold, it may determine the post to be a certified post for the labeling target. Here, the authentication post determination unit 260 may calculate the authentication score for the post using, for example, Equation 1 below.

수학식 1을 참조하면, W는 게시물 가중치를 의미하고, x는 게시물에 대한 스코어, y는 분할 분석 스코어, w는 컨텐츠 상세 가중치를 의미할 수 있다. Referring to Equation 1, W may mean the post weight, x may mean the score for the post, y may mean the segmentation analysis score, and w may mean the detailed content weight.

예를 들어, 게시물에 대한 가중치(W0=0.3), 댓글에 대한 가중치(W1=0.6), 조회수 대비 선호도수에 대한 가중치(W2=0.1), 조회수 대비 신고수에 대한 가중치(W3=0.2)로 설정되었다고 가정하자. For example, the weight for posts (W0=0.3), the weight for comments (W1=0.6), the weight for likes compared to views (W2=0.1), and the weight for reports compared to views (W3=0.2). Let's assume it's set up.

인증 게시물 판단부(270)는 라벨링 관련 키워드 및 제 1 핵심 키워드 간의 관련도에 기초하여 제 1 스코어를 산출할 수 있다. 예를 들어, 인증 게시물 판단부(270)는 라벨링 관련 키워드 및 제 1 핵심 키워드 간의 관련도에 대한 점수를 0.8374로 산출하고, 이에 대한 상세 가중치(w0=0.7) 및 긍정으로 분류된 게시물에 대한 점수를 0.91로 산출하고, 이에 대한 상세 가중치(1-w0=0.3)를 고려하여 제 1 스코어를 (0.3*0.7*0.8374+0.3*0.3*0.91)을 통해 '0.85918'로 산출할 수 있다. The authentication post determination unit 270 may calculate the first score based on the degree of relevance between the labeling-related keyword and the first core keyword. For example, the certified post judgment unit 270 calculates the score for the degree of relevance between the labeling-related keyword and the first core keyword as 0.8374, and the detailed weight (w0=0.7) for this and the score for the post classified as positive is calculated as 0.91, and considering the detailed weight (1-w0=0.3), the first score can be calculated as '0.85918' through (0.3*0.7*0.8374+0.3*0.3*0.91).

또한, 인증 게시물 판단부(270)는 라벨링 관련 키워드 및 제 2 핵심 키워드 간의 관련도에 기초하여 제 2 스코어를 산출할 수 있다. 예를 들어, 인증 게시물 판단부(270)는 라벨링 관련 키워드 및 제 2 핵심 키워드 간의 관련도에 대한 점수를 0.97로 산출하고, 이에 대한 상세 가중치(w1=0.6) 및 피드백 정보의 긍정 비율에 기초하여 긍정 점수를 0.83으로 산출하고, 이에 대한 상세 가중치(1-w1=0.4)를 고려하여 제 2 스코어를 (0.6*0.6*0.97)+(0.6*0.4*0.83)을 통해 '0.914로 산출할 수 있다. Additionally, the authentication post determination unit 270 may calculate the second score based on the degree of relevance between the labeling-related keyword and the second core keyword. For example, the authentication post judgment unit 270 calculates the score for the degree of relevance between the labeling-related keyword and the second core keyword as 0.97, based on the detailed weight (w1 = 0.6) and the positive rate of the feedback information. The positive score is calculated as 0.83, and considering the detailed weight (1-w1=0.4), the second score can be calculated as '0.914' through (0.6*0.6*0.97)+(0.6*0.4*0.83) .

또한, 인증 게시물 판단부(270)는 조회수 및 선호도수에 대한 비율에 기초하여 제 3 스코어를 산출할 수 있다. 이 때, 상세 가중치(w2)는 0.1일 수 있다. 예를 들어, 인증 게시물 판단부(270)는 조회수 및 선호도수에 대한 비율에 기초하여 제 3 스코어를 '1'로 도출할 수 있다. Additionally, the authentication post determination unit 270 may calculate a third score based on the ratio of the number of views and the number of preferences. At this time, the detailed weight (w2) may be 0.1. For example, the authentication post determination unit 270 may derive the third score as '1' based on the ratio of the number of views and the number of preferences.

인증 게시물 판단부(270)는 조회수 및 신고수에 대한 비율에 기초하여 제 4 스코어를 더 산출할 수 있다. 이 때, 상세 가중치(w3)는 '-0.2'일 수 있다. 예를 들어, 인증 게시물 판단부(270)는 조회수 및 신고수에 대한 비율에 기초하여 제 4 스코어를 '0'으로 산출할 수 있다. The authentication post determination unit 270 may further calculate a fourth score based on the ratio of the number of views and reports. At this time, the detailed weight (w3) may be '-0.2'. For example, the authentication post determination unit 270 may calculate the fourth score as '0' based on the ratio of the number of views and the number of reports.

이러한 과정을 거쳐, 인증 게시물 판단부(270) 제 1 내지 제 3 스코어에 기초하여 게시물에 대한 인증 스코어를 '0.906154'(0.85918*0.3+0.914*0.6+0.1*1+(-0.2)*0)로 도출할 수 있다. 이 때, 인증 게시물 판단부(270)는 게시물에 대한 인증 스코어가 임계치인 0.7이상 이므로, 해당 게시물을 라벨링 대상에 대한 인증 게시물로 결정할 수 있다. Through this process, the authentication post judgment unit 270 sets the authentication score for the post to '0.906154' (0.85918*0.3+0.914*0.6+0.1*1+(-0.2)*0) based on the first to third scores. It can be derived as: At this time, the authentication post determination unit 270 may determine that the post is a certified post for the labeling target because the authentication score for the post is greater than or equal to the threshold of 0.7.

이러한 이미지 자동 라벨링 서버(100)는 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 의해 실행될 수 있다. 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 제 1 사용자 단말(110)로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고, 복수의 제 2 사용자 단말(120)로부터 게시물과 관련된 피드백 정보를 수신하고, 텍스트를 분석하여 텍스트로부터 제 1 핵심 키워드를 도출하고, 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하고, 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하고, 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행하도록 하는 명령어들의 시퀀스를 포함할 수 있다. This automatic image labeling server 100 may be executed by a computer program stored in a medium containing a sequence of instructions for automatically labeling images using feedback from posts containing images. When executed by a computing device, the computer program registers a post containing an image and text from the first user terminal 110, receives feedback information related to the post from a plurality of second user terminals 120, and sends the text. Analysis to derive first key keywords from the text, analysis of feedback information to derive second key keywords, analysis of images to identify labeling objects included in the image, and derivation of labeling-related keywords related to the identified labeling objects. and may include a sequence of commands to perform labeling of the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword.

도 8은 본 발명의 일 실시예에 따른 이미지 자동 라벨링 서버에서 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법의 순서도이다. 도 8을 참조하면, 이미지 자동 라벨링 서버(100)에서 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법은 도 1 내지 도 7b에 도시된 실시예에 따라 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 7b에 도시된 실시예에 따라 이미지 자동 라벨링 서버(100)에서 수행되는 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법에도 적용된다. Figure 8 is a flowchart of a method of automatically labeling images using feedback from posts containing images in an image automatic labeling server according to an embodiment of the present invention. Referring to FIG. 8, the method of automatically labeling images using feedback from posts containing images in the image automatic labeling server 100 includes steps processed in time series according to the embodiments shown in FIGS. 1 to 7B. Includes. Therefore, even if the content is omitted below, it also applies to the method of automatically labeling images using feedback from posts containing images performed by the automatic image labeling server 100 according to the embodiment shown in FIGS. 1 to 7B.

단계 S810에서 이미지 자동 라벨링 서버(100)는 제 1 사용자 단말(110)로부터 이미지 및 텍스트를 포함하는 게시물을 등록받을 수 있다. In step S810, the automatic image labeling server 100 may receive a post including an image and text from the first user terminal 110.

단계 S820에서 이미지 자동 라벨링 서버(100)는 복수의 제 2 사용자 단말(120)로부터 게시물과 관련된 피드백 정보를 수신할 수 있다. In step S820, the automatic image labeling server 100 may receive feedback information related to the posting from the plurality of second user terminals 120.

단계 S830에서 이미지 자동 라벨링 서버(100)는 텍스트를 분석하여 텍스트로부터 제 1 핵심 키워드를 도출할 수 있다. In step S830, the image automatic labeling server 100 may analyze the text and derive a first key keyword from the text.

단계 S840에서 이미지 자동 라벨링 서버(100)는 피드백 정보를 분석하여 제 2 핵심 키워드를 도출할 수 있다. In step S840, the image automatic labeling server 100 may analyze the feedback information and derive a second key keyword.

단계 S850에서 이미지 자동 라벨링 서버(100)는 이미지를 분석하여 이미지에 포함된 라벨링 대상을 식별하고, 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출할 수 있다. In step S850, the image automatic labeling server 100 may analyze the image to identify a labeling target included in the image and derive labeling-related keywords related to the identified labeling target.

단계 S860에서 이미지 자동 라벨링 서버(100)는 제 1 핵심 키워드, 제 2 핵심 키워드 및 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 라벨링 대상에 대한 라벨링을 수행할 수 있다. In step S860, the image automatic labeling server 100 may perform labeling of the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword.

상술한 설명에서, 단계 S810 내지 S860는 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.In the above description, steps S810 to S860 may be further divided into additional steps or combined into fewer steps, depending on the implementation of the present invention. Additionally, some steps may be omitted or the order between steps may be switched as needed.

도 1 내지 도 8을 통해 설명된 이미지 자동 라벨링 서버에서 수행되는 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 8을 통해 설명된 이미지 자동 라벨링 서버에서 수행되는 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다. The method of automatically labeling images using feedback from posts containing images performed in the image automatic labeling server described with reference to FIGS. 1 to 8 includes a computer program stored in a medium executed by a computer or instructions executable by a computer. It can also be implemented in the form of a recording medium containing. In addition, the method of automatically labeling images using feedback from posts containing images performed by the image automatic labeling server described with reference to FIGS. 1 to 8 can also be implemented in the form of a computer program stored in a medium executed by a computer. It can be.

컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. Computer-readable media can be any available media that can be accessed by a computer and includes both volatile and non-volatile media, removable and non-removable media. Additionally, computer-readable media may include computer storage media. Computer storage media includes both volatile and non-volatile, removable and non-removable media implemented in any method or technology for storage of information such as computer-readable instructions, data structures, program modules or other data.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The description of the present invention described above is for illustrative purposes, and those skilled in the art will understand that the present invention can be easily modified into other specific forms without changing the technical idea or essential features of the present invention. will be. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive. For example, each component described as single may be implemented in a distributed manner, and similarly, components described as distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. The scope of the present invention is indicated by the claims described below rather than the detailed description above, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.

100: 이미지 자동 라벨링 서버
110: 학습부
120: 게시물 등록부
130: 피드백 정보 수신부
140: 분석부
141: 텍스트 분석부
142: 이미지 분석부
150: 라벨링 수행부
160: 인증 게시물 판단부
100: Image automatic labeling server
110: Learning Department
120: Post register
130: Feedback information receiving unit
140: analysis department
141: Text analysis unit
142: Image analysis unit
150: Labeling execution unit
160: Verification post judgment unit

Claims (20)

이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 서버에 있어서,
제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 게시물 등록부;
복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 피드백 정보 수신부;
상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 텍스트 분석부; 및
상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 이미지 분석부를 포함하는 분석부; 및
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 라벨링 수행부
를 포함하고,
상기 텍스트 분석부는 상기 텍스트를 분석하여 상기 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류하고,
상기 라벨링 수행부는 상기 분류된 게시물의 문장 유형에 더 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 것인, 이미지 자동 라벨링 서버.
In a server that automatically labels images using feedback from posts containing images,
A post register that receives posts including images and text from the first user terminal;
a feedback information receiving unit that receives feedback information related to the posting from a plurality of second user terminals;
a text analysis unit that analyzes the text to derive first key keywords from the text and analyzes the feedback information to derive second key keywords; and
An analysis unit including an image analysis unit that analyzes the image to identify a labeling target included in the image and derives labeling-related keywords related to the identified labeling target; and
A labeling performing unit that performs labeling on the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword.
Including,
The text analysis unit analyzes the text and classifies the sentence type of the post as either a descriptive sentence or a question sentence,
The labeling performing unit performs labeling on the labeling target based on the sentence type of the classified post.
제 1 항에 있어서,
상기 텍스트 분석부는 상기 텍스트 및 상기 피드백 정보 각각을 감정 분석 모델에 입력하여 상기 텍스트 및 상기 피드백 정보 각각을 긍정, 부정 및 중립 중 어느 하나로 분류하는 것인, 이미지 자동 라벨링 서버.
According to claim 1,
The text analysis unit inputs each of the text and the feedback information into an emotion analysis model to classify each of the text and the feedback information into one of positive, negative, and neutral.
제 2 항에 있어서,
상기 텍스트 분석부는 상기 피드백 정보에 대한 긍정 비율, 부정 비율 및 중립 비율에 기초하여 상기 제 2 핵심 키워드를 결정하는 것인, 이미지 자동 라벨링 서버.
According to claim 2,
The text analysis unit determines the second key keyword based on the positive rate, negative rate, and neutral rate for the feedback information.
제 1 항에 있어서,
상기 피드백 정보는 상기 게시물에 대한 댓글, 조회수, 선호도수, 신고수 중 적어도 하나를 포함하는 것인, 이미지 자동 라벨링 서버.
According to claim 1,
The feedback information includes at least one of comments, views, preferences, and reports for the post.
제 4 항에 있어서,
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 판단하는 인증 게시물 판단부
를 더 포함하는 것인, 이미지 자동 라벨링 서버.
According to claim 4,
A certified post determination unit that determines the post as a certified post for the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword.
Further comprising: an image automatic labeling server.
이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 서버에 있어서,
제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 게시물 등록부;
복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 피드백 정보 수신부;
상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 텍스트 분석부; 및
상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 이미지 분석부를 포함하는 분석부;
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 라벨링 수행부; 및
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 판단하는 인증 게시물 판단부
를 포함하고,
상기 피드백 정보는 상기 게시물에 대한 댓글, 조회수, 선호도수, 신고수 중 적어도 하나를 포함하고,
상기 인증 게시물 판단부는 상기 라벨링 관련 키워드 및 상기 제 1 핵심 키워드 간의 관련도에 기초하여 제 1 스코어를 산출하고, 상기 라벨링 관련 키워드 및 상기 제 2 핵심 키워드 간의 관련도에 기초하여 제 2 스코어를 산출하고, 상기 조회수 및 상기 선호도수에 대한 비율에 기초하여 제 3 스코어를 산출하는 것인, 이미지 자동 라벨링 서버.
In a server that automatically labels images using feedback from posts containing images,
A post register that receives posts including images and text from the first user terminal;
a feedback information receiving unit that receives feedback information related to the posting from a plurality of second user terminals;
a text analysis unit that analyzes the text to derive first key keywords from the text and analyzes the feedback information to derive second key keywords; and
An analysis unit including an image analysis unit that analyzes the image to identify a labeling target included in the image and derives labeling-related keywords related to the identified labeling target;
a labeling performing unit that performs labeling on the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword; and
A certified post determination unit that determines the post as a certified post for the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword.
Including,
The feedback information includes at least one of comments, views, preferences, and reports for the post,
The authentication post determination unit calculates a first score based on the degree of relationship between the labeling-related keyword and the first core keyword, and calculates a second score based on the degree of relationship between the labeling-related keyword and the second core keyword. , An image automatic labeling server that calculates a third score based on the ratio of the number of views and the number of preferences.
제 6 항에 있어서,
상기 인증 게시물 판단부는 상기 제 1 내지 제 3 스코어에 기초하여 상기 게시물에 대한 인증 스코어를 산출하고,
상기 게시물에 대한 인증 스코어가 임계치 이상인 경우, 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 결정하는 것인, 이미지 자동 라벨링 서버.
According to claim 6,
The authentication post determination unit calculates an authentication score for the post based on the first to third scores,
When the authentication score for the post is greater than or equal to a threshold, the automatic image labeling server determines the post as an authenticated post for the labeling target.
삭제delete 제 1 항에 있어서,
상기 라벨링 수행부는 상기 게시물의 문장 유형이 상기 평서문에 해당하고, 상기 라벨링 관련 키워드, 상기 제 1 핵심 키워드 및 상기 제 2 핵심 키워드가 모두 일치하는 경우, 상기 이미지에 해당하는 라벨링 대상 영역에 상기 제 1 핵심 키워드 및 상기 제 2 핵심 키워드 중 적어도 하나에 기초하여 상기 라벨링 대상에 대한 추가 라벨링을 수행하는 것인, 이미지 자동 라벨링 서버.
According to claim 1,
If the sentence type of the post corresponds to the descriptive sentence and the labeling-related keyword, the first core keyword, and the second core keyword all match, the labeling performing unit applies the first keyword to the labeling target area corresponding to the image. An automatic image labeling server that performs additional labeling on the labeling target based on at least one of a core keyword and the second core keyword.
제 1 항에 있어서,
상기 라벨링 수행부는 상기 게시물의 문장 유형이 상기 평서문에 해당하고, 상기 라벨링 관련 키워드가 상기 제 1 핵심 키워드와 일치하고 상기 제 2 핵심 키워드와 불일치하는 경우, 상기 제 2 핵심 키워드에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 것인, 이미지 자동 라벨링 서버.
According to claim 1,
If the sentence type of the post corresponds to the descriptive sentence and the labeling-related keyword matches the first core keyword and does not match the second core keyword, the labeling performing unit selects the labeling target based on the second core keyword. An image automatic labeling server that performs labeling.
제 9 항에 있어서,
상기 라벨링 수행부는 상기 게시물의 문장 유형이 상기 질문문에 해당하고, 상기 피드백 정보에 대한 긍정 비율이 임계치 이상인 경우, 상기 이미지에 해당하는 라벨링 대상 영역에 상기 제 1 핵심 키워드에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 것인, 이미지 자동 라벨링 서버.
According to clause 9,
If the sentence type of the post corresponds to the question and the positive rate for the feedback information is more than a threshold, the labeling performing unit assigns the labeling target to the labeling target area corresponding to the image based on the first key keyword. An image automatic labeling server that performs labeling.
제 1 항에 있어서,
기수집된 라벨링 대상의 이미지 및 레이블 정보를 포함하는 학습 데이터를 이용하여 상기 라벨링 대상을 식별하는 라벨링 대상 식별 모델을 학습하는 학습부를 더 포함하고,
상기 이미지 분석부는 상기 라벨링 대상 식별 모델을 이용하여 상기 게시물의 이미지로부터 상기 라벨링 대상을 식별하는 것인, 이미지 자동 라벨링 서버.
According to claim 1,
It further includes a learning unit that learns a labeling object identification model to identify the labeling object using training data including already collected images and label information of the labeling object,
The image analysis unit identifies the labeling object from the image of the post using the labeling object identification model.
이미지 자동 라벨링 서버에서 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법에 있어서,
제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 단계;
복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 단계;
상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하는 단계;
상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 단계;
상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 단계; 및
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계; 및
상기 텍스트를 분석하여 상기 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류하는 단계
를 포함하고,
상기 라벨링 대상에 대한 라벨링을 수행하는 단계는,
상기 분류된 게시물의 문장 유형에 더 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계를 포함하는 것인, 이미지 자동 라벨링 방법.
In a method of automatically labeling images using feedback from posts containing images in an image automatic labeling server,
Receiving a post including an image and text from a first user terminal;
Receiving feedback information related to the posting from a plurality of second user terminals;
Analyzing the text and deriving a first key keyword from the text;
Analyzing the feedback information to derive second key keywords;
Analyzing the image to identify a labeling target included in the image and deriving labeling-related keywords related to the identified labeling target; and
performing labeling on the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword; and
Analyzing the text and classifying the sentence type of the post as either a descriptive sentence or a question sentence
Including,
The step of performing labeling on the labeling object is,
An image automatic labeling method comprising the step of performing labeling on the labeling target based further on the sentence type of the classified post.
제 13 항에 있어서,
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 판단하는 단계를 더 포함하는 것인, 이미지 자동 라벨링 방법.
According to claim 13,
The automatic image labeling method further comprising determining the post as an authenticated post for the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword. .
이미지 자동 라벨링 서버에서 이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 방법에 있어서,
제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받는 단계;
복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하는 단계;
상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하는 단계;
상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하는 단계;
상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하는 단계; 및
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계를 포함하고,
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 판단하는 단계를 더 포함하고
상기 피드백 정보는 상기 게시물에 대한 댓글, 조회수, 선호도수, 신고수 중 적어도 하나를 포함하고,
상기 인증 게시물로 판단하는 단계는,
상기 라벨링 관련 키워드 및 상기 제 1 핵심 키워드 간의 관련도에 기초하여 제 1 스코어를 산출하는 단계;
상기 라벨링 관련 키워드 및 상기 제 2 핵심 키워드 간의 관련도에 기초하여 제 2 스코어를 산출하는 단계;
상기 조회수 및 상기 선호도수에 대한 비율에 기초하여 제 3 스코어를 산출하는 단계;
상기 제 1 내지 제 3 스코어에 기초하여 상기 게시물에 대한 인증 스코어를 산출하는 단계; 및
상기 게시물에 대한 인증 스코어가 임계치 이상인 경우, 상기 게시물을 상기 라벨링 대상에 대한 인증 게시물로 결정하는 단계를 포함하는 것인, 이미지 자동 라벨링 방법.
In a method of automatically labeling images using feedback from posts containing images in an image automatic labeling server,
Receiving a post including an image and text from a first user terminal;
Receiving feedback information related to the posting from a plurality of second user terminals;
Analyzing the text and deriving a first key keyword from the text;
Analyzing the feedback information to derive second key keywords;
Analyzing the image to identify a labeling target included in the image and deriving labeling-related keywords related to the identified labeling target; and
Comprising the step of performing labeling on the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword,
Further comprising determining the post as an authenticated post for the labeling target based on whether or not there is a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword;
The feedback information includes at least one of comments, views, preferences, and reports for the post,
The step of determining the authentication post is,
calculating a first score based on a degree of relevance between the labeling-related keywords and the first core keyword;
calculating a second score based on a degree of relevance between the labeling-related keyword and the second core keyword;
calculating a third score based on the ratio of the number of views and the number of preferences;
calculating an authentication score for the post based on the first to third scores; and
When the authentication score for the post is greater than or equal to a threshold, determining the post as an authenticated post for the labeling target.
삭제delete 제 13 항에 있어서,
상기 라벨링 대상에 대한 라벨링을 수행하는 단계는,
상기 게시물의 문장 유형이 상기 평서문에 해당하고, 상기 라벨링 관련 키워드, 상기 제 1 핵심 키워드 및 상기 제 2 핵심 키워드가 모두 일치하는 경우, 상기 이미지에 해당하는 라벨링 대상 영역에 상기 제 1 핵심 키워드 및 상기 제 2 핵심 키워드 중 적어도 하나에 기초하여 상기 라벨링 대상에 대한 추가 라벨링을 수행하는 단계를 더 포함하는 것인, 이미지 자동 라벨링 방법.
According to claim 13,
The step of performing labeling on the labeling object is,
If the sentence type of the post corresponds to the descriptive sentence, and the labeling-related keyword, the first core keyword, and the second core keyword all match, the first core keyword and the second core keyword are placed in the labeling target area corresponding to the image. An image automatic labeling method further comprising performing additional labeling on the labeling object based on at least one of the second key keywords.
제 17 항에 있어서,
상기 라벨링 대상에 대한 라벨링을 수행하는 단계는,
상기 게시물의 문장 유형이 상기 평서문에 해당하고, 상기 라벨링 관련 키워드가 상기 제 1 핵심 키워드와 일치하고 상기 제 2 핵심 키워드와 불일치하는 경우, 상기 제 2 핵심 키워드에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계를 더 포함하는 것인, 이미지 자동 라벨링 방법.
According to claim 17,
The step of performing labeling on the labeling object is,
If the sentence type of the post corresponds to the descriptive sentence and the labeling-related keyword matches the first core keyword and does not match the second core keyword, labeling the labeling target is performed based on the second core keyword. A method for automatically labeling images, further comprising the steps of:
제 18 항에 있어서,
상기 라벨링 대상에 대한 라벨링을 수행하는 단계는,
상기 게시물의 문장 유형이 상기 질문문에 해당하고, 상기 피드백 정보에 대한 긍정 비율이 임계치 이상인 경우, 상기 이미지에 해당하는 라벨링 대상 영역에 상기 제 1 핵심 키워드에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하는 단계를 더 포함하는 것인, 이미지 자동 라벨링 방법.
According to claim 18,
The step of performing labeling on the labeling object is,
If the sentence type of the post corresponds to the question and the positive rate for the feedback information is more than a threshold, labeling the labeling target is performed based on the first key keyword in the labeling target area corresponding to the image. An image automatic labeling method further comprising the step of:
이미지를 포함하는 게시물의 피드백을 이용하여 이미지를 자동 라벨링하는 하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
제 1 사용자 단말로부터 이미지 및 텍스트를 포함하는 게시물을 등록받고,
복수의 제 2 사용자 단말로부터 상기 게시물과 관련된 피드백 정보를 수신하고,
상기 텍스트를 분석하여 상기 텍스트로부터 제 1 핵심 키워드를 도출하고, 상기 피드백 정보를 분석하여 제 2 핵심 키워드를 도출하고,
상기 이미지를 분석하여 상기 이미지에 포함된 라벨링 대상을 식별하고, 상기 식별된 라벨링 대상과 관련된 라벨링 관련 키워드를 도출하고,
상기 제 1 핵심 키워드, 상기 제 2 핵심 키워드 및 상기 라벨링 관련 키워드 중 적어도 하나 간의 일치 여부에 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하고,
상기 텍스트를 분석하여 상기 게시물의 문장 유형을 평서문 및 질문문 중 어느 하나로 분류하도록 하는 명령어들의 시퀀스를 포함하고,
상기 라벨링 대상에 대한 라벨링을 수행하도록 하는 명령어는
상기 분류된 게시물의 문장 유형에 더 기초하여 상기 라벨링 대상에 대한 라벨링을 수행하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램.
A computer program stored on a medium comprising a sequence of instructions for automatically labeling images using feedback from posts containing images, comprising:
When the computer program is executed by a computing device,
Register a post containing images and text from the first user terminal,
Receiving feedback information related to the posting from a plurality of second user terminals,
Analyzing the text to derive first key keywords from the text, and deriving second key keywords by analyzing the feedback information,
Analyzing the image to identify a labeling object included in the image, deriving labeling-related keywords related to the identified labeling object,
Perform labeling on the labeling target based on a match between at least one of the first core keyword, the second core keyword, and the labeling-related keyword,
Contains a sequence of commands to analyze the text and classify the sentence type of the post as either a descriptive sentence or a question sentence,
The command to perform labeling on the labeling object is
A computer program stored on a medium, comprising a sequence of instructions for performing labeling of the labeling object further based on the sentence type of the classified post.
KR1020210157419A 2021-11-16 2021-11-16 Server, method and computer program for automatically labelling image using feedback of post including image KR102682639B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210157419A KR102682639B1 (en) 2021-11-16 2021-11-16 Server, method and computer program for automatically labelling image using feedback of post including image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210157419A KR102682639B1 (en) 2021-11-16 2021-11-16 Server, method and computer program for automatically labelling image using feedback of post including image

Publications (2)

Publication Number Publication Date
KR20230071336A KR20230071336A (en) 2023-05-23
KR102682639B1 true KR102682639B1 (en) 2024-07-09

Family

ID=86544300

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210157419A KR102682639B1 (en) 2021-11-16 2021-11-16 Server, method and computer program for automatically labelling image using feedback of post including image

Country Status (1)

Country Link
KR (1) KR102682639B1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170185670A1 (en) * 2015-12-28 2017-06-29 Google Inc. Generating labels for images associated with a user
KR101886738B1 (en) * 2017-08-03 2018-08-09 주식회사 카카오 Apparatus and user device for providing feedback effect to postings in social network services
KR20200127651A (en) * 2019-05-03 2020-11-11 주식회사 자이냅스 A program recording midium for an automatic sentiment information labeling to news articles for providing sentiment information

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
한국 공개특허공보 제10-2018-0041204호(2018.04.23.) 1부.*
한국 공개특허공보 제10-2020-0127651호(2020.11.11.) 1부.*
한국 등록특허공보 제10-1886738호(2018.08.09.) 1부.*

Also Published As

Publication number Publication date
KR20230071336A (en) 2023-05-23

Similar Documents

Publication Publication Date Title
CN110119786B (en) Text topic classification method and device
US10719664B2 (en) Cross-media search method
US10438091B2 (en) Method and apparatus for recognizing image content
CN103299324B (en) Potential son is used to mark the mark learnt for video annotation
Joty et al. Global thread-level inference for comment classification in community question answering
JP6451246B2 (en) Method, system and program for determining social type of person
CN110532379B (en) Electronic information recommendation method based on LSTM (least Square TM) user comment sentiment analysis
CN113158023B (en) Public digital life accurate classification service method based on mixed recommendation algorithm
CN112307351A (en) Model training and recommending method, device and equipment for user behavior
Pong-Inwong et al. Improved sentiment analysis for teaching evaluation using feature selection and voting ensemble learning integration
CN111368075A (en) Article quality prediction method and device, electronic equipment and storage medium
CN111522915A (en) Extraction method, device and equipment of Chinese event and storage medium
CN112016573B (en) Bullet screen generation method and device, electronic equipment and computer storage medium
CN110472057B (en) Topic label generation method and device
US11636677B2 (en) Systems, devices and methods for distributed hierarchical video analysis
CN115187910A (en) Video classification model training method and device, electronic equipment and storage medium
Cinar et al. Inferring user interests on social media from text and images
CN112084788B (en) Automatic labeling method and system for implicit emotion tendencies of image captions
KR102682639B1 (en) Server, method and computer program for automatically labelling image using feedback of post including image
CN113837910A (en) Test question recommendation method and device, electronic equipment and storage medium
CN113378826B (en) Data processing method, device, equipment and storage medium
CN118119935A (en) Training method, device, equipment and storage medium for image text matching model
Sabir et al. Textual visual semantic dataset for text spotting
CN114780757A (en) Short media label extraction method and device, computer equipment and storage medium
Galopoulos et al. Development of content-aware social graphs

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant