KR101856115B1 - System and Method for providing digital information - Google Patents
System and Method for providing digital information Download PDFInfo
- Publication number
- KR101856115B1 KR101856115B1 KR1020170036585A KR20170036585A KR101856115B1 KR 101856115 B1 KR101856115 B1 KR 101856115B1 KR 1020170036585 A KR1020170036585 A KR 1020170036585A KR 20170036585 A KR20170036585 A KR 20170036585A KR 101856115 B1 KR101856115 B1 KR 101856115B1
- Authority
- KR
- South Korea
- Prior art keywords
- digital information
- representative
- user
- community
- cluster
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 디지털 정보를 예측하여 제공하는 디지털 정보 제공 시스템 및 그 방법에 관한 것으로서, 구체적으로는 사용자의 대표 군집을 동적으로 관리하여 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 시스템 및 그 방법에 대한 것이다.The present invention relates to a digital information providing system and method for predicting and providing digital information, and more particularly, to a system and method for predicting predetermined digital information according to a consumption pattern of a user by dynamically managing a representative community of a user, It is about the method.
패턴 인식(pattern recognition)이란, 주어진 데이터의 집합에 대해 입력 값을 바탕으로 특정 기준에 따라 여러 개의 그룹으로 구분하는 것이다. 패턴 인식 문제의 핵심은 다양한 변형을 효과적으로 표현하고 구분하는 것이고, 이러한 패턴의 변형에 따른 문제를 해결하기 위하여 기계학습 분야의 방법론이 적용될 수 있다.Pattern recognition is the process of dividing a given set of data into multiple groups according to specific criteria based on input values. At the core of pattern recognition problem is to effectively express and distinguish various variations, and methodology of machine learning field can be applied to solve the problems caused by such pattern variation.
기계학습(machine learning)이란, 인간이 가지고 있는 고유의 지능적 기능 중 하나인 학습 능력을 기계를 통해 구현하는 방법들에 대한 연구이다. 주어진 정보들을 분석하여 그로부터 일반적인 규칙이나 새로운 지식을 자동적으로 추출해 내는 방법론들을 개발한다.Machine learning is a study of how to implement learning capabilities, one of the unique intelligence functions of human beings, through machines. We develop methodologies that analyze given information and automatically extract general rules or new knowledge from it.
기계학습 기법을 사용하는 패턴 인식에는 크게 두 가지의 처리단계가 존재한다. 먼저 학습단계에서는 주어지는 데이터 집합(학습 데이터)을 이용하여 패턴의 특성을 분석하여 서로 다른 패턴들을 구분하기 위한 핵심정보를 추출한다.There are two processing steps for pattern recognition using machine learning techniques. First, in the learning stage, the characteristic of a pattern is analyzed using a given data set (learning data), and key information for distinguishing different patterns is extracted.
학습이 완료되고 나면 새롭게 주어지는 데이터가 어떤 패턴에 해당하는지 분류하고 인식하는 단계가 수행된다. 학습단계는 주로 인식기를 만드는 첫 과정에서 한 번만 수행되며, 인식단계는 새로운 데이터가 주어질 때마다 수행된다.After the learning is completed, a step of classifying and recognizing which pattern corresponds to newly provided data is performed. The learning phase is usually performed only once in the first step of creating the recognizer, and the recognition step is performed each time new data is given.
패턴 인식 문제에서 데이터를 분석하는 방법은 크게 분류(classification)와 군집화(clustering)의 두 가지로 나눌 수 있다. 분류(classification)란, 주어진 데이터 집합을 이미 정의되어 있는 몇 개의 클래스로 나누는 문제이고, 이와 달리 군집화(clustering)란, 주어지는 클래스 정보 없이 단순히 하나의 덩어리로 이루어진 데이터를 받아서, 그 분포 특성을 분석하여 임의의 복수 개의 그룹으로 나누는 것을 말한다. 즉, 미리 정해진 클래스 레이블이 없으므로 단순히 입력값의 유사성에 따라서 비슷한 입력값을 가진 데이터들끼리 같은 군집(cluster)을 이루도록 한다.There are two ways to analyze data in pattern recognition problem: classification and clustering. Classification is the problem of dividing a given data set into several classes that are already defined. In contrast, clustering is the process of taking data consisting of a single chunk without given class information and analyzing its distribution characteristics Means dividing into a plurality of arbitrary groups. That is, since there is no predetermined class label, data having similar input values are formed into the same cluster according to the similarity of the input values.
분류(classification) 문제와 군집화(clustering) 문제의 가장 큰 차이점은 학습에 사용되는 데이터에 원하는 출력정보(클래스 정보)가 함께 주어지는지의 여부로 볼 수 있다. 따라서 패턴 인식 분야에서의 분류(classification) 문제와 군집화(clustering) 문제는 기계학습에서의 감독학습(supervised learning)과 비감독학습(unsupervised learning) 문제로 연결된다.The biggest difference between the classification problem and the clustering problem is whether or not the output data (class information) is given together with the data used for learning. Therefore, classification and clustering problems in the field of pattern recognition lead to problems of supervised learning and unsupervised learning in machine learning.
감독학습이란, 학습시에 그 인식기가 출력하는 출력정보(클래스 정보)를 미리 알려주는 감독(supervisor)이 존재하는 것을 의미하고, 비감독학습은 출력정보(클래스 정보)를 알려주는 감독이 존재하지 않는다. 결국 감독학습은 분류기를 만들 때 사용되며, 비감독학습은 군집화를 위하여 사용된다고 볼 수 있다. 군집화를 위한 데이터 집합의 경우 클래스 라벨에 대한 정보, 즉 바람직한 출력정보(클래스 정보)가 없으므로 비감독학습을 수행해야 한다.Supervised learning means that there is a supervisor for notifying output information (class information) outputted by the recognizer at the time of learning, supervisory learning means that there is no supervisor informing the output information (class information) Do not. Finally, supervised learning is used to construct a classifier, and non-supervised learning is used for clustering. In the case of a data set for clustering, there is no information on class labels, that is, desirable output information (class information).
패턴 인식의 가장 초기 연구 대상이 되었던 것 중의 하나로 숫자 인식과 문자 인식이 있으며, 나아가 특정 형태의 문서를 분석하고 인식하여 자동 처리하는 문제까지 확장되었다.One of the earliest research subjects of pattern recognition is numerical recognition and character recognition. Furthermore, it has expanded to the problem of automatically analyzing and recognizing specific types of documents.
정보의 홍수 시대를 맞아 새로운 유형의 멀티미디어 콘텐츠, SNS(Social Network Service)의 확장, 그리고 스마트 기기들의 보급과 이용으로 온라인 상에서 취득할 수 있는 정보가 기하급수적으로 늘어나면서 특정 정보를 탐색하고 적절한 정보인지 여부를 확신할 수 없다는 문제 등 정보에 대한 불확실성의 문제가 발생한다. 이러한 문제를 극복하고자, 빅데이터에 대한 분석과 통계에 대한 사회적 수요가 높아지고 있다. 빅데이터란 디지털화된 방대한 양의 정보를 뜻하며 이를 토대로 한 다양한 기계학습 기술은 예측(Prediction)을 목표로 하고 있다.With the flood of information, new types of multimedia contents, expansion of social network service (SNS), and spreading and use of smart devices, exponentially increase the information that can be acquired online, There is a problem of uncertainty about the information. In order to overcome these problems, the social demand for analysis and statistics of big data is increasing. Big data refers to a vast amount of digitized information, and various machine learning techniques based on it are aimed at predicting.
빅데이터의 특징은 3V로 요약되며 Volume(양), Velocity(생성 속도), Variety(다양성)를 의미한다. 최근에는 Value(가치)나 Complexity(복잡성)을 더하고 있으며 단순한 양적 정보의 빅데이터 분석이 아닌 가치 있는 데이터에 대한 수요를 반영한 결과라고 할 수 있다. 또한 디지털 정보에 있어 예측은 인간의 감각 혹은 인지에 의존하지 않고 통계적 알고리즘과 다수의 특징적인 레이어의 구성을 포함하여 그 정확도가 상당 수준에 이르는 것을 말한다.The characteristics of the Big Data are summarized in 3V and mean Volume, Velocity, Variety. Recently, we have added Value or Complexity, which is a result of reflecting the demand for valuable data, not just big data analysis of quantitative information. Prediction in digital information also implies that its accuracy is considerable, including statistical algorithms and the construction of many characteristic layers, without relying on human senses or perceptions.
이러한 사회적 수요에 발맞춰 전문적인 정보를 포함한 온라인 상에서 취득할 수 있는 불규칙적이고 다양한 정보들을 인간이 특정한 주제를 정하여 많은 정보를 세분화하고 있으며, 세분화된 정보에서 해당되는 사람이 속한 정보들 중에서 인기가 많거나 유사한 정보를 추천하는 큐레이션 시스템을 적용하는 것이 최근 추세이다.In response to these social demands, we have to divide many information by specifying specific topics, which are irregular and diverse information that can be acquired online, including professional information, and it is popular among the information belonging to the person in the subdivided information Or a similar information is recommended.
최근에는 이런 큐레이션 시스템이 발전하여 개인정보와 연결시켜 개인 맞춤형 큐레이션 시스템이 적용되고 있으며 이러한 큐레이션 서비스를 제공받기 위해서는 특정인의 개인정보가 입력되거나 장르, 분야 등의 관리자가 임의로 설정해서 나눈 분류가 필수적으로 적용되어 있어야 하는 실정이다. 이러한 서비스들은 실제 사용자들에게 적정한 맞춤정보라 할 수 없으며 정보를 제공하는 서비스 역시 관리를 위한 인력 소모가 높다. 이에 따라 적정하게 분류되지 않은 디지털 정보들을 보다 효율적이고 창의적으로 제공하기 위한 방법이 요구된다.Recently, such a curation system has been developed and personalized curation system has been applied in connection with personal information. In order to provide such curation service, a personal information of a specific person is inputted, And the like. These services can not be tailored to real users, and services that provide information are also expensive to manage. Accordingly, a method for more efficiently and creatively providing digital information not properly classified is required.
이는 기존의 빅데이터에서 기존의 방식대로 단순히 추려내서 보여주는 디지털 정보가 아닌 사용자가 예측하지 못했던 특정 디지털 정보를 필요할 것이라 예측하여 제공하는 방법이 요구된다는 것을 의미한다.This means that it is required to provide a method of predicting and providing specific digital information that is not predicted by the user, rather than digital information which is simply culled and displayed in the conventional method.
본 발명은 상기 문제점을 해결하기 위한 것으로서, 디지털 정보를 사용자에게 효율적으로 제공하기 위하여 사용자의 소비패턴을 지속적으로 탐색, 저장하여 사용자의 대표 군집을 동적으로 관리하여 보다 정교하게 디지털 정보를 추천하는 것을 목적으로 한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems and it is an object of the present invention to continuously search and store consumption patterns of users in order to efficiently provide digital information to users, The purpose.
본 발명이 해결하고자 하는 과제는 상기 목적으로만 제한하지 아니하고, 위에서 명시적으로 나타내지 아니한 다른 기술적 과제는 이하 본 발명의 구성 및 작용을 통하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 쉽게 이해할 수 있을 것이다.It is to be understood that both the foregoing general description and the following detailed description are exemplary and explanatory and are not restrictive of the invention, as claimed, but are not intended to be exhaustive or to limit the invention to the precise forms disclosed. It will be possible.
본 발명에서는, 상기 과제를 해결하기 위하여 이하의 구성을 포함한다.In order to solve the above problems, the present invention includes the following configuration.
본 발명은, 디지털 정보, 상기 디지털 정보의 군집, 상기 디지털 정보의 점수를 측정하여 선정된 상기 디지털 정보의 대표 군집을 저장하는 보관부(108), 임의의 사용자가 상기 디지털 정보를 소비하는 경우 상기 임의의 사용자의 선호 반응을 분석하는 사용자 분석부(110);를 포함하는 디지털 정보 제공 시스템에 관한 것으로서, 상기 사용자 분석부(110)는 상기 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하고, 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 것을 특징으로 한다.A storage unit (108) for storing digital information, a cluster of digital information, a representative cluster of the digital information selected by measuring a score of the digital information, and a storage unit And a user analysis unit (110) for analyzing a preference response of an arbitrary user. The user analysis unit (110) analyzes the preference response of the arbitrary user based on the preference response of the user, Wherein the representative population of the arbitrary user is dynamically set based on the representative population of the current digital information and stored according to the consumption pattern of the preceding user corresponding to the representative population of the arbitrary user set dynamically And predicts and provides predetermined digital information.
또한 본 발명은, 기계학습을 위한 대량의 디지털 정보를 입력받는 입력부(104)와 상기 입력되는 디지털 정보를 분석하는 분석부(106)를 더 포함하는 것을 특징으로 한다.The present invention further includes an
또한 본 발명은, 상기 분석부(106)는 형태소 분석에 의하여 상기 대량의 디지털 정보의 군집화를 수행하고, 상기 입력되는 각각의 디지털 정보의 조회수, 선호 반응을 기반으로 각각의 디지털 정보의 점수를 측정하며, 상기 디지털 정보의 점수를 기반으로 상기 군집화에 의하여 형성된 군집에 대해서 점수를 측정하고, 각각의 디지털 정보가 속하는 군집들 중 어느 하나를 디지털 정보의 대표 군집으로 선정하며, 상기 디지털 정보의 조회 시점 및 선호 반응 시점에 따라 상기 디지털 정보, 상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집을 시계열 순으로 정렬하는 것을 특징으로 한다.The analyzing
또한 본 발명은 상기 사용자 분석부(110)가 예측하여 제공하는 소정의 디지털 정보는 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 속하는 선행 사용자의 소비 패턴과 상기 소비 패턴에 대응하는 디지털 정보의 군집 점수와 디지털 정보의 점수를 고려하여 제공되는 것을 특징으로 한다.The predetermined digital information predicted and provided by the
또한 본 발명은, 상기 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정한 후, 상기 임의의 사용자가 새로운 디지털 정보를 소비하고 선호 반응을 하는 경우 상기 새로운 디지털 정보를 현재 디지털 정보로 새롭게 저장하고, 상기 새롭게 저장되는 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하는 것을 특징으로 한다.Further, the present invention may be configured such that the digital information is stored as current digital information based on the preference response of the arbitrary user, and the representative community of the arbitrary user is dynamically set based on the representative community of the current digital information, When a user consumes new digital information and performs a favored response, the new digital information is newly stored as current digital information, and the representative community of the arbitrary user is dynamically changed based on the representative group of the newly stored current digital information .
또한 본 발명은, 신규 유입자가 발생되는 경우 전환 장치(702)를 통하여 신규 유입자의 소비 패턴을 별도로 분석하고(704), 연결 장치(706)를 통하여 상기 보관부(108)에 적용하는 것을 특징으로 한다.In the present invention, when a new inflow occurs, the consumption pattern of the new inflow is separately analyzed 704 through the
또한 본 발명은, 디지털 정보 제공 방법에 관한 것으로서, 디지털 정보의 군집 및 상기 디지털 정보의 대표 군집을 기반으로 선행 사용자의 군집 및 선행 사용자의 대표 군집으로부터 상기 디지털 정보를 소비하는 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하는 단계; 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 단계;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a digital information providing method comprising: a preliminary user's preference reaction based on a population of digital information and a representative population of the digital information, Storing the digital information as current digital information and dynamically setting representative clusters of the arbitrary user based on the representative clusters of the current digital information; And predicting and providing predetermined digital information according to a consumption pattern of a preceding user corresponding to the representative community of the arbitrary user set dynamically.
또한 본 발명은, 상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집, 상기 선행 사용자의 군집, 상기 선행 사용자의 대표 군집을 형성하기 위하여, 기계학습을 위한 대량의 디지털 정보를 입력 받는 단계; 각 디지털 정보에 대하여 하나 이상의 주제어를 추출하여 하나 이상의 디지털 정보의 군집을 형성하는 단계; 상기 디지털 정보 및 상기 디지털 정보의 군집의 점수를 측정하여 디지털 정보의 대표 군집을 선정하는 단계; 상기 디지털 정보에 대한 사용자의 소비 시점을 분석하여 상기 디지털 정보, 상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집을 시계열 순으로 정렬하는 단계; 상기 디지털 정보의 군집 및 상기 디지털 정보의 대표 군집을 기반으로 사용자의 군집 및 사용자의 대표 군집을 형성하는 단계;를 포함하는 것을 특징으로 한다.In addition, the present invention provides a computer-readable medium storing a program for causing a computer to execute a method comprising: inputting a large amount of digital information for machine learning to form a cluster of digital information, a representative cluster of digital information, a cluster of the preceding user, Extracting one or more keywords for each digital information to form a cluster of one or more digital information; Selecting representative clusters of digital information by measuring scores of the clusters of the digital information and the digital information; Sorting the digital information, the digital information cluster, and the representative populations of the digital information in time series by analyzing the consumption time of the user with respect to the digital information; And forming a representative community of the user and a community of the user based on the community of the digital information and the representative community of the digital information.
또한 본 발명은, 디지털 정보 제공 방법을 실행시키기 위하여 매체에 저장된 컴퓨터프로그램에 관한 것으로서, 디지털 정보의 군집 및 상기 디지털 정보의 대표 군집을 기반으로 선행 사용자의 군집 및 선행 사용자의 대표 군집으로부터 상기 디지털 정보를 소비하는 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하는 단계; 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 단계;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a computer program stored in a medium for executing a digital information providing method, the computer program comprising: Storing the digital information as current digital information based on a preference response of an arbitrary user consuming the digital information and dynamically setting a representative community of the arbitrary user based on the representative population of the current digital information; And predicting and providing predetermined digital information according to a consumption pattern of a preceding user corresponding to the representative community of the arbitrary user set dynamically.
본 발명에 의하면, 온라인 상에서 정보를 제공하는 서비스 제공자가 투입하는 인력과 비용을 줄일 수 있으며 사용자는 이미 구분된 군집 혹은 해당되는 군집 안에서만 큐레이션을 받을 수 있는 기존의 단점이 제거되고 다양한 형태로 실제 필요한 정보와 사용자들이 선호 반응을 하는 디지털 정보에 적합한 디지털 정보를 정교하게 예측하여 제공받을 수 있는 효과가 있다.According to the present invention, it is possible to reduce the manpower and cost of the service provider providing information on-line, and the user can remove the existing disadvantages of being able to receive the curation only within the divided clusters or the corresponding clusters, It is possible to precisely predict and provide necessary information and digital information suitable for digital information in which users prefer to respond.
본 발명에 의한 효과는 상기 효과로만 제한하지 아니하고, 위에서 명시적으로 나타내지 아니한 다른 효과는 이하 본 발명의 구성 및 작용을 통하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 쉽게 이해할 수 있을 것이다.The effects of the present invention are not limited to the above effects, and other effects not explicitly described above can be easily understood by those skilled in the art through the constitution and operation of the present invention.
도 1 도 2는 본 발명의 실시예에 따른 인공지능 큐레이션 시스템의 전체적인 구성도를 도시한다.
도 3은 본 발명의 실시예에 따른 디지털 정보 제공 시스템 분석부의 정보 분석 방법의 흐름도이다.
도 4는 본 발명의 실시예에 따른 디지털 정보 제공 과정에 대한 흐름도이다.
도 5는 본 발명의 실시예에 따른 디지털 정보 제공 시스템의 사용자 행동 패턴 학습 과정에 대한 흐름도이다.
도 6는 본 발명의 실시예에 따른 학습을 통한 큐레이션 시스템 고도화 과정에 대한 흐름도이다.
도 7은 본 발명의 실시예에 따른 사용자 맞춤형 예측 큐레이션 시스템의 흐름도이다.
도 8은 본 발명의 실시예에 따른 신규 유입자 맞춤형 큐레이션 시스템의 흐름도이다.FIG. 1 and FIG. 2 show an overall configuration diagram of an artificial intelligence curation system according to an embodiment of the present invention.
3 is a flowchart of an information analysis method of a digital information providing system analyzing unit according to an embodiment of the present invention.
4 is a flowchart illustrating a digital information providing process according to an embodiment of the present invention.
5 is a flowchart illustrating a user behavior pattern learning process of the digital information providing system according to the embodiment of the present invention.
6 is a flowchart illustrating a process of upgrading a curation system through learning according to an embodiment of the present invention.
FIG. 7 is a flowchart of a user-customized predictive curation system according to an embodiment of the present invention.
8 is a flow diagram of a new entrant customized curation system in accordance with an embodiment of the present invention.
이하 본 발명의 바람직한 실시예에 따른 전체적인 구성 및 작용에 대해 설명하기로 한다. 이러한 실시예는 예시적인 것으로서 본 발명의 구성 및 작용을 제한하지는 아니하고, 실시예에서 명시적으로 나타내지 아니한 다른 구성 및 작용도 이하 본 발명의 실시예를 통하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 쉽게 이해할 수 있는 경우는 본 발명의 기술적 사상으로 볼 수 있을 것이다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the overall structure and operation of the present invention will be described. It is to be understood that both the foregoing general description and the following detailed description are exemplary and explanatory and are not to be construed as limiting the present invention, and do not limit the scope of the present invention. And those skilled in the art can easily understand the present invention.
이하 발명의 구체적인 실시예에 따른 전체적인 구성 및 동작에 대해 설명하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The following will describe the overall structure and operation according to a specific embodiment of the present invention.
도 1 및 도 2는 본 발명의 실시예에 따른 디지털 정보 제공 시스템(인공지능 큐레이션 시스템)의 전체적인 구성도를 도시한다.FIG. 1 and FIG. 2 show an overall configuration diagram of a digital information providing system (artificial intelligence curation system) according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 실시예에 따른 디지털 정보 제공 시스템(인공지능 큐레이션 시스템)은 빅데이터를 입력하여 빅데이터 학습 시스템에 의하여 콘텐츠를 군집화하고, 사용자의 소비 패턴 또는 이동 패턴을 분석하여 사용자를 군집화하며, 사용자의 선호 표현을 수집하여 사용자의 행동 패턴을 학습하고, 사용자의 수요를 예측하여 적합한 디지털 정보를 제공하는 큐레이션을 수행한다.Referring to FIG. 1, a digital information providing system (artificial intelligence curation system) according to an embodiment of the present invention inputs big data, clusters contents by a big data learning system, analyzes consumption patterns or movement patterns of users Collects the user's preference expressions, learns the behavior pattern of the user, and performs the curation of providing the appropriate digital information by predicting the demand of the user.
도 2를 참조하면, 본 발명의 실시예에 따른 디지털 정보 제공 시스템(102)은 입력부(104), 분석부(106), 보관부(108), 사용자 분석부(110)를 포함하고, 상기 시스템 관리자는 상기 입력부(104)를 통하여 보유하고 있는 대량의 디지털 정보인 빅데이터를 입력하며, 입력된 상기 대량의 디지털 정보는 상기 분석부(106)에서 분석 및 군집화되어 상기 보관부(108)에 저장된다.2, the digital
그 후, 임의의 사용자가 상기 보관부(108)에 저장된 특정 디지털 정보에 접근하여 소정의 선호 표현을 하게 되면, 이러한 선호 표현이 사용자 분석부(110)에 전달되어 그에 따른 큐레이션 정보를 상기 임의의 사용자에게 제공하게 된다.Thereafter, when a certain user accesses the specific digital information stored in the
상기 입력부(104)는 소량 및 대량의 디지털 정보와 함께 상기 디지털 정보에 대한 조회수, 제목, 내용, 고유 ID등의 정보와 사용자들의 고유 ID, 특정 반응 등의 정보를 입력 받고, 상기 입력되는 정보는 각 서비스마다 다르게 지정할 수도 있으며, 지속적으로 반영하여 업데이트 할 수도 있다.The
상기 분석부(106)는 상기 입력부(104)를 통하여 입력되는 소량 및 대량의 디지털 정보에 대하여 형태소 분석을 하고 군집화를 수행하고,사용자의 조회수 및 특정 반응을 반영하여 각 디지털 정보의 점수 및 각 군집의 점수도 측정하며, 군집들의 네트워크를 형성한다.The
상기 보관부(108)는 각 디지털 정보의 점수 및 각 군집의 점수와 군집들의 네트워크 형태에 대한 정보를 포함하여 상기 디지털 정보의 군집들을 저장하고, 상기 입력부(104)와 분석부(106)를 거쳐 전달되는 사용자들의 디지털 정보에 대한 조회와 특정 반응에 대해서도 지속적으로 반영하여 저장할 수 있다.The
상기 사용자 분석부(110)는 임의의 사용자가 보관부(108)에 저장되어 있는 특정의 디지털 정보를 소비하는 경우 임의의 사용자들의 정보를 지속적으로 분석하여 업데이트하며 군집화를 갱신한다.When the user consumes the specific digital information stored in the
이하에서는 본 발명의 실시예에 따른 디지털 정보 제공 시스템의 구체적인 작동 방식을 도면을 통해 설명한다.Hereinafter, a specific operation of the digital information providing system according to an embodiment of the present invention will be described with reference to the drawings.
도 3은 본 발명의 실시예에 따른 디지털 정보 제공 시스템의 분석부(106)의 정보 분석 방법의 흐름도이다.3 is a flowchart of an information analysis method of the
상기 입력부(104)를 통하여 소량 및 대량의 디지털 정보와 상기 디지털 정보에 대한 조회수, 제목, 내용, 고유 ID등의 정보와 사용자들의 고유 ID, 특정 반응 등의 정보를 입력 받으면, 상기 분석부(106)는 군집화와 점수 측정을 수행한다.When information such as a small amount and a large amount of digital information and information such as a number of views, a title, a content, a unique ID, a unique ID of users, and a specific reaction are input through the
상기 디지털 정보의 군집화는 형태소 분석을 통하여 수행되며, 각 디지털 정보별로 가장 많이 검출되는 형태소를 관리자가 선별하여 저장하고, 상기 선별된 형태소를 공유하는 디지털 정보들을 하나의 군집으로 묶게 된다. 이때, 형태소의 형태를 ‘두 글자 이상의 명사’로 선택하여 군집의 범위를 제한함으로써 군집화의 효율성을 높이고자 한다.The clustering of the digital information is performed through morphological analysis. An administrator selects and stores the morpheme most frequently detected for each digital information, and the digital information sharing the selected morpheme is bundled into one community. At this time, we want to increase the efficiency of clustering by limiting the range of clusters by choosing the type of morpheme as 'two or more characters'.
각 디지털 정보에 대한 점수 측정은 상기 입력부(104)에서 입력받은 디지털 정보에 대한 조회수 및 사용자들의 특정 반응 정보를 이용하여 수행한다. 예를 들면, 특정 디지털 정보를 소비한 모든 사용자들이 긍정 반응을 보인 경우에 100점을 부여하여 상대적으로 점수를 부여하며, 조회수가 없는 디지털 정보에 대해서는 평균 액티브 사용자의 조회수를 각 디지털 정보에 대한 조회수로 가정하여 사용할 수 있도록 한다.The score measurement for each digital information is performed using the number of views of the digital information input from the
또한 상기 각 디지털 정보의 점수를 이용하여 각 디지털 정보가 속하는 각 군집의 점수를 측정하는데 있어서, 각 군집이 포함하는 각 디지털 정보의 점수들을 평균 내어 각 군집의 점수로 하였다.Also, in order to measure the score of each cluster to which each digital information belongs using the score of each digital information, scores of the respective digital information included in each cluster are averaged to obtain scores of the respective clusters.
다음은, 디지털 정보에 대한 사용자들의 소비 패턴 분석 과정(204)을 통하여 상기 디지털 정보의 군집들의 네트워크를 형성한다. 상기 사용자들의 소비 패턴 분석 과정(204)은 각 사용자의 디지털 정보 소비 과정의 시계열 순 정리, 각 디지털 정보의 대표 군집 선정, 상기 디지털 정보의 대표 군집의 시계열 순 연결을 통하여 수행된다.Next, a network of clusters of digital information is formed through a
상기 각 사용자의 디지털 정보 소비 과정의 시계열 순 정리는 상기 디지털 정보 제공 시스템(102)의 입력부(104)에서 입력받은 사용자들의 각 디지털 정보에 대한 소비 시점 및 반응 시점을 추출하여 시계열 순으로 정리하며, 이러한 정리 방법은 대량의 과거 데이터를 학습시킬 때 아주 효율적으로 활용된다.The time series sequencing of the digital information consumption process of each user extracts consumption time points and reaction time points of each digital information of users input from the
각 디지털 정보의 대표 군집 선정을 위하여 먼저 각 디지털 정보가 속하는 군집을 점수에 따라 관리자가 설정한 임의의 갯수로 선별하여 저장한 후, 그 중 가장 점수가 높은 군집으로 선정하는 방식으로 진행한다.In order to select representative clusters of digital information, first, the clusters to which each digital information belongs are selected and stored in an arbitrary number set by the administrator according to the score, and then the system is selected as the cluster having the highest score among them.
상기 디지털 정보의 대표 군집의 시계열 순 연결은 시계열 순으로 정리된 각 디지털 정보에 상기 디지털 정보의 대표 군집을 대응시켜 디지털 정보의 대표 군집들의 연결을 형성하는 방식으로 수행하고, 이를 각 사용자에 대해 수행하여 특정 사용자의 디지털 정보 소비 패턴으로 정리하도록 한다.The time series connection of the representative clusters of the digital information is performed in such a manner that the representative clusters of the digital information are associated with the respective digital information arranged in a time series order to form connections of representative clusters of the digital information, So that the digital information consumption pattern of a specific user is summarized.
상기의 분석 과정이 완료되면 상기 분석부(106)는 보관부(108)에 분석된 정보들을 저장한 후, 사용자 분석부(110)로 일련의 과정들과 학습된 정보를 전달한다.Upon completion of the analysis process, the
한편 상기 사용자 분석부(110)는 임의의 사용자가 보관부(108)에 저장되어 있는 특정의 디지털 정보를 소비하는 경우 임의의 사용자들의 정보를 지속적으로 분석하여 업데이트하며 군집화를 갱신하는데 있어서, 예측하여 제공 가능한 여러 디지털 정보 중 적정한 디지털 정보를 예측하여 제공하기 위하여 예측 선호 정보 군집 연산부(112)에서 점수 측정 과정을 통하여 사전에 정렬한다. 이러한 과정을 거친 뒤 사용자 분석부(110)는 다시 보관부(108)에 전체 분석 결과를 전달하며 보관부(108)는 이를 바탕으로 군집들의 네트워크를 형성하게 된다.On the other hand, when a certain user consumes specific digital information stored in the
도3의 구체적인 과정을 통하여 입력된 데이터는 디지털 정보 제공 시스템, 예를 들면, 인공지능 큐레이션 시스템(102)의 보관부(108)에 저장되며, 디지털 정보를 소비하는 사용자는 이를 통해 큐레이션을 받을 수 있다.3 is stored in the
도 4는 본 발명의 실시예에 따른 디지털 정보 제공 과정(큐레이션 과정)에 대한 흐름도로서 이 과정을 구체적으로 나타낸다.FIG. 4 is a flow chart of the digital information providing process (curation process) according to the embodiment of the present invention, and this process is concretely shown.
임의의 사용자가 특정 디지털 정보를 소비하면서 특정 반응을 표현하면 보관부(108)는 상기 특정 디지털 정보를 상기 임의의 사용자의 현재 디지털 정보(302)와 현재 디지털 정보의 대표 군집(304)으로 동적으로 저장하고, 상기 현재 디지털 정보의 대표 군집(304)에 속하는 다른 사용자들의 다른 군집들로의 이동 정보 및 상기 다른 군집들의 점수 등의 정보를 모두 고려하여 디지털 정보(312)를 예측하여 제공하는 큐레이션을 수행하게 된다.When a certain user expresses a specific reaction while consuming specific digital information, the
상기의 과정에서 큐레이션은 먼저 현재 디지털 정보의 대표 군집(304)에 대응하는 새로운 디지털 정보의 대표 군집(314)을 책정하고 상기 대표 군집(314)에 속하는 각 디지털 정보들의 점수 및 사용자의 정보에 따라 적정 디지털 정보(312)를 선정하여 사용자에게 제공하게 된다.In the above process, the curation first constructs
상기 현재 디지털 정보(302)와 현재 디지털 정보의 대표 군집(304)으로 동적으로 저장하는 과정에 대해서 좀 더 구체적으로 설명하면, 이러한 과정을 통하여 본 발명의 실시예에 따른 디지털 정보 제공 시스템(102)은 지속적으로 학습이 가능한데, 도 5는 본 발명의 실시예에 따른 디지털 정보 제공 시스템의 사용자 행동 패턴 학습 과정에 대한 흐름도로서 이 과정을 좀 더 구체적으로 나타낸다.The process of dynamically storing the current
도 5를 참조하면, 임의의 사용자가 특정 디지털 정보(402)를 소비하면서 특정 반응을 표현하면 도 4의 과정에서 설명한 바와 같이, 보관부(108)는 상기 디지털 정보(402)를 현재 디지털 정보(402)와 현재 디지털 정보의 대표 군집(404)으로 저장한다. 이 후 사용자가 다음의 디지털 정보(412)를 소비하면서 특정 반응을 표현하면 보관부(108)는 상기 사용자가 새롭게 소비하면서 특정 반응을 표현한 디지털 정보(412)를 현재 디지털 정보(412)와 현재 디지털 정보의 대표 군집(414)으로 변경하여 저장하게 되는바, 결국 현재 디지털 정보와 현재 디지털 정보의 대표 군집이 동적으로 설정된다.Referring to FIG. 5, when a certain user expresses a specific reaction while consuming specific
한편, 사용자가 특정 디지털 정보를 소비하면서 별다른 반응을 보이지 아니하는 경우에는 현재 디지털 정보와 현재 디지털 정보의 대표 군집을 변경하지 않고 그대로 유지함으로써 사용자의 디지털 정보 이동 패턴을 효율적으로 정교하게 학습할 수 있다.On the other hand, when the user does not react significantly while consuming the specific digital information, the representative group of the current digital information and the current digital information are maintained unchanged, thereby efficiently and precisely learning the user's digital information movement pattern .
상기의 과정을 통하여 본 발명의 디지털 정보 제공 시스템(102)은 지속적으로 각 사용자의 디지털 정보 이동 패턴을 업데이트 할 수 있으며, 이러한 정보를 반영하여 진행되는 큐레이션의 성능이 지속적으로 향상되도록 한다.Through the above process, the digital
또한 도 5의 학습과정을 통하여 인공지능 큐레이션 시스템(102)의 보관부(108)에 저장되어 있는 디지털 정보는 지속적으로 발생하는 사용자의 디지털 정보 소비 패턴의 학습을 통하여 실시간으로 고도화될 수 있다. 관리자는 보관부(108)에 저장된 디지털 정보의 군집의 형태소를 조사하여 서비스의 특성에 따라 과도하게 소비되는 군집에 대한 정보를 저장하는 제1 사전(502)과, 함축적 의미를 내포하지만 명확하게 형태소로 구분되지 않는 특정 분야의 전문 용어, 외래어, 고유명사 등의 특정 형태소 군집에 대한 정보를 담고 있는 제2 사전(504)을 구비할 수 있다.Also, the digital information stored in the
상기 인공지능 큐레이션 시스템(102)의 분석부(106)는 상기 제1 사전(502) 및 상기 제2 사전(504)에 저장된 정보를 반영하여 소비가 적거나 의미가 없는 군집은 제거하고, 명확하게 구분되지 않는 형태소는 의미 단위로 분석하여 보관부(108)에 저장한다.The
상기의 과정을 통하여 인공지능 큐레이션 시스템(102)은 지속적으로 각 서비스에 맞추어 디지털 정보의 보관 형태를 업데이트 할 수 있으며, 이는 큐레이션되는 디지털 정보의 질을 지속적으로 향상되도록 하고 이러한 향상된 디지털 정보는 정보 탐색이 빠른 특정 사용자 집단에 의해 더욱더 지속적으로 크게 발전하여 새로운 링크를 만들어 낸다.Through the above process, the artificial
이러한 정보들은 계속하여 보관부(108)에 네트워크(604)의 형태로 보관되며, 인공지능 큐레이션 시스템(102)은 도 7의 예측 과정을 통하여 사용자의 디지털 정보 소비 패턴(602)을 분석하고 저장된 네트워크(604)와 비교한 뒤, 사용자의 수요를 예측(604)하여 적합한 디지털 정보를 제공하게 된다.This information is stored in the
또한 신규 유입자가 발생되는 경우, 도8의 전환 장치(702)를 통하여 신규 유입자의 발생에 따른 전체 학습된 데이터를 재분석하지 아니하고 신규 유입자의 소비 패턴을 별도로 분석하고(704), 연결 장치(706)를 통하여 기존의 보관부(108)와 군집(504)에 적용함으로써 실시간으로 소비되는 전체 시스템의 성능을 지속적으로 유지한다.In addition, when a new inflower is generated, the consumed pattern of the new inflower is analyzed separately (704) without reanalyzing the entire learned data according to the occurrence of the new inflower through the
10 : 디지털 정보 기반 확장형 인공지능 큐레이션 시스템
102: 인공지능 큐레이션 시스템 104: 입력부
106: 분석부 108: 보관부
110: 사용자 분석부 112: 예측 선호 정보 군집 연산부
20: 디지털 정보 분석 시스템
202: 디지털 정보의 군집화 및 점수 측정 과정
204: 디지털 정보 소비 패턴 분석
206: 군집들의 네트워크 형성 과정
30: 인공지능 큐레이션 시스템의 큐레이션 과정
302: 현재 디지털 정보 304: 현재 대표 군집
312: 큐레이션 디지털 정보 314: 새로운 대표 군집
40: 사용자 행동 패턴 학습 과정
402: 이전 디지털 정보 404: 이전 대표 군집
412: 현재 디지털 정보 414: 현재 대표 군집
50: 인공지능 큐레이션 시스템의 학습 과정
502: 제1 사전 504: 제2 사전
60: 인공지능 큐레이션 시스템의 예측 과정
602: 사용자의 디지털 정보 소비 패턴
604: 저장된 네트워크 606: 사용자의 수요 예측
70: 신규 유입자 맞춤형 학습 과정
702: 전환 장치 704: 신규 유입자 패턴 분석
706: 연결 장치10: Digital information based extension artificial intelligence curation system
102: artificial intelligence curation system 104:
106: Analysis section 108: Storage section
110: User analysis unit 112: Predictive preference information cluster operation unit
20: Digital information analysis system
202: Clustering and Scoring of Digital Information
204: Analysis of digital information consumption patterns
206: Network formation of communities
30: Curation of Artificial Intelligence Curation System
302: current digital information 304: current representative community
312: Curation digital information 314: New representative communities
40: User behavior pattern learning process
402: previous digital information 404: previous representative community
412: current digital information 414: current representative community
50: Learning process of artificial intelligence curation system
502: first dictionary 504: second dictionary
60: Prediction Process of Artificial Intelligence Curation System
602: User's digital information consumption pattern
604: Stored Network 606: User Demand Forecast
70: New Entrant Customized Learning Course
702: Transition device 704: Analysis of new entrant patterns
706: connecting device
Claims (9)
상기 사용자 분석부(110)는 상기 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하고, 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 것을 특징으로 하는 디지털 정보 제공 시스템.A storage unit (108) for storing representative clusters of the digital information selected by measuring scores of the digital information, a storage unit (108) for storing the representative clusters of the digital information selected by measuring scores of the digital information, And a user analysis unit (110) for analyzing a preference response, the digital information providing system comprising:
The user analysis unit 110 stores the digital information as current digital information based on the preference response of the arbitrary user and dynamically sets the representative community of the arbitrary user based on the representative population of the current digital information And predicts and provides predetermined digital information according to a consumption pattern of a preceding user corresponding to the representative community of the arbitrary user set dynamically.
기계학습을 위한 대량의 디지털 정보를 입력받는 입력부(104)와 상기 입력되는 디지털 정보를 분석하는 분석부(106)를 더 포함하는 것을 특징으로 하는 디지털 정보 제공 시스템.The method according to claim 1,
Further comprising: an input unit (104) for inputting a large amount of digital information for machine learning; and an analysis unit (106) for analyzing the input digital information.
상기 분석부(106)는 형태소 분석에 의하여 상기 대량의 디지털 정보의 군집화를 수행하고, 상기 입력되는 각각의 디지털 정보의 조회수, 선호 반응을 기반으로 각각의 디지털 정보의 점수를 측정하며, 상기 디지털 정보의 점수를 기반으로 상기 군집화에 의하여 형성된 군집에 대해서 점수를 측정하고, 각각의 디지털 정보가 속하는 군집들 중 어느 하나를 디지털 정보의 대표 군집으로 선정하며, 상기 디지털 정보의 조회 시점 및 선호 반응 시점에 따라 상기 디지털 정보, 상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집을 시계열 순으로 정렬하는 것을 특징으로 하는 디지털 정보 제공 시스템.3. The method of claim 2,
The analysis unit 106 performs clustering of the large amount of digital information by morphological analysis, measures the score of each digital information based on the number of views and the preference response of each digital information inputted, The score is measured for the clusters formed by the clustering based on the score of the digital information, and one of the clusters to which each digital information belongs is selected as representative clusters of the digital information, Wherein the digital information, the digital information cluster, and the representative cluster of the digital information are arranged in a time series order.
상기 사용자 분석부(110)가 예측하여 제공하는 소정의 디지털 정보는 상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 속하는 선행 사용자의 소비 패턴과 상기 소비 패턴에 대응하는 디지털 정보의 군집 점수와 디지털 정보의 점수를 고려하여 제공되는 것을 특징으로 하는 디지털 정보 제공 시스템.3. The method according to claim 1 or 2,
The predetermined digital information predicted and provided by the user analysis unit 110 includes a consumption pattern of the preceding user belonging to the representative community of the arbitrary user set dynamically and a population score of the digital information corresponding to the consumption pattern, Wherein the digital information is provided in consideration of the score of the information.
상기 임의의 사용자가 새로운 디지털 정보를 소비하고 선호 반응을 하는 경우 상기 새로운 디지털 정보를 현재 디지털 정보로 새롭게 저장하고, 상기 새롭게 저장되는 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하는 것을 특징으로 하는 디지털 정보 제공 시스템.4. The method according to any one of claims 1 to 3, further comprising: storing the digital information as current digital information based on the preference response of the arbitrary user, After setting the clusters dynamically,
When the arbitrary user consumes the new digital information and performs a favored response, the new digital information is newly stored as the current digital information, and the representative community of the arbitrary user is stored on the basis of the representative population of the newly stored current digital information Wherein the digital information providing system is dynamically set.
신규 유입자가 발생되는 경우 전환 장치(702)를 통하여 신규 유입자의 소비 패턴을 별도로 분석하고(704), 연결 장치(706)를 통하여 상기 보관부(108)에 적용하는 것을 특징으로 하는 디지털 정보 제공 시스템.3. The method according to claim 1 or 2,
(704) and applies the new consumption pattern to the storage unit (108) through the connection device (706) by using the switching device (702) when a new inflow occurs, .
상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 단계;
를 포함하는 것을 특징으로 하는 디지털 정보 제공 방법.The digital information is stored as current digital information on the basis of a cluster of digital information and a representative cluster of the digital information, based on a cluster of the preceding user and a preference response of any user consuming the digital information from the representative cluster of the preceding user Dynamically setting representative clusters of the arbitrary user based on the representative clusters of the current digital information;
Predicting and providing predetermined digital information according to a consumption pattern of a preceding user corresponding to the representative community of the arbitrary user set dynamically;
The digital information providing method comprising the steps of:
상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집, 상기 선행 사용자의 군집, 상기 선행 사용자의 대표 군집을 형성하기 위하여,
기계학습을 위한 대량의 디지털 정보를 입력 받는 단계;
각 디지털 정보에 대하여 하나 이상의 주제어를 추출하여 하나 이상의 디지털 정보의 군집을 형성하는 단계;
상기 디지털 정보 및 상기 디지털 정보의 군집의 점수를 측정하여 디지털 정보의 대표 군집을 선정하는 단계;
상기 디지털 정보에 대한 사용자의 소비 시점을 분석하여 상기 디지털 정보, 상기 디지털 정보의 군집, 상기 디지털 정보의 대표 군집을 시계열 순으로 정렬하는 단계;
상기 디지털 정보의 군집 및 상기 디지털 정보의 대표 군집을 기반으로 사용자의 군집 및 사용자의 대표 군집을 형성하는 단계;
를 포함하는 것을 특징으로 하는 디지털 정보 제공 방법.8. The method of claim 7,
A representative community of the digital information, a community of the preceding user, and a representative community of the preceding user,
Receiving a large amount of digital information for machine learning;
Extracting one or more keywords for each digital information to form a cluster of one or more digital information;
Selecting representative clusters of digital information by measuring scores of the clusters of the digital information and the digital information;
Sorting the digital information, the digital information cluster, and the representative populations of the digital information in time series by analyzing the consumption time of the user with respect to the digital information;
Forming a community of users and a representative community of users based on the community of digital information and the representative community of digital information;
The digital information providing method comprising the steps of:
디지털 정보의 군집 및 상기 디지털 정보의 대표 군집을 기반으로 선행 사용자의 군집 및 선행 사용자의 대표 군집으로부터 상기 디지털 정보를 소비하는 임의의 사용자의 선호 반응을 기반으로 상기 디지털 정보를 현재 디지털 정보로 저장하고 상기 현재 디지털 정보의 대표 군집을 기반으로 상기 임의의 사용자의 대표 군집을 동적으로 설정하는 단계;
상기 동적으로 설정되는 상기 임의의 사용자의 대표 군집에 대응하는 선행 사용자의 소비 패턴에 따라 소정의 디지털 정보를 예측하여 제공하는 단계;를 포함하는 것을 특징으로 하는 디지털 정보 제공 방법을 실행시키기 위하여 매체에 저장된 컴퓨터프로그램.A computer program stored in a medium for executing a digital information providing method,
The digital information is stored as current digital information on the basis of a cluster of digital information and a representative cluster of the digital information, based on a cluster of the preceding user and a preference response of any user consuming the digital information from the representative cluster of the preceding user Dynamically setting representative clusters of the arbitrary user based on the representative clusters of the current digital information;
And predicting and providing predetermined digital information according to a consumption pattern of a preceding user corresponding to the representative community of the arbitrary user set dynamically. A stored computer program.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170036585A KR101856115B1 (en) | 2017-03-23 | 2017-03-23 | System and Method for providing digital information |
PCT/KR2018/003068 WO2018174469A1 (en) | 2017-03-23 | 2018-03-16 | Digital information providing system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170036585A KR101856115B1 (en) | 2017-03-23 | 2017-03-23 | System and Method for providing digital information |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101856115B1 true KR101856115B1 (en) | 2018-05-09 |
Family
ID=62200624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170036585A KR101856115B1 (en) | 2017-03-23 | 2017-03-23 | System and Method for providing digital information |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101856115B1 (en) |
WO (1) | WO2018174469A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020153525A1 (en) * | 2019-01-23 | 2020-07-30 | ㈜티비스톰 | Method for managing information about artificial intelligence entity by means of blockchain, and platform therefor |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101111121B1 (en) * | 2009-06-29 | 2012-02-13 | 주식회사 모임 | Apparatus and Method for presenting personalized contents information based on artificial intelligence, and Recording medium thereof |
KR101472452B1 (en) * | 2010-11-17 | 2014-12-17 | 한국전자통신연구원 | Method and Apparatus for Multimedia Search and method for pattern recognition |
KR101647364B1 (en) * | 2013-08-26 | 2016-08-23 | 네이버 주식회사 | System and method for recommending contents based on user characteristics and transactions, and recording media thereof |
KR20160043601A (en) * | 2014-10-13 | 2016-04-22 | 고려대학교 산학협력단 | Device and method for recommendationing digital content |
KR102399440B1 (en) * | 2015-03-02 | 2022-05-19 | 삼성전자주식회사 | Content providing method of content providing syetem and electronic apparatus |
-
2017
- 2017-03-23 KR KR1020170036585A patent/KR101856115B1/en active IP Right Grant
-
2018
- 2018-03-16 WO PCT/KR2018/003068 patent/WO2018174469A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020153525A1 (en) * | 2019-01-23 | 2020-07-30 | ㈜티비스톰 | Method for managing information about artificial intelligence entity by means of blockchain, and platform therefor |
Also Published As
Publication number | Publication date |
---|---|
WO2018174469A1 (en) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102092691B1 (en) | Web page training methods and devices, and search intention identification methods and devices | |
WO2020029689A1 (en) | Data processing model construction method and device, server and client | |
Gupta et al. | Prediction of research trends using LDA based topic modeling | |
US8676730B2 (en) | Sentiment classifiers based on feature extraction | |
CA2423033C (en) | A document categorisation system | |
CN108874992A (en) | The analysis of public opinion method, system, computer equipment and storage medium | |
US11580119B2 (en) | System and method for automatic persona generation using small text components | |
CN110413780A (en) | Text emotion analysis method, device, storage medium and electronic equipment | |
US20080104101A1 (en) | Producing a feature in response to a received expression | |
KR20200127020A (en) | Computer-readable storage medium storing method, apparatus and instructions for matching semantic text data with tags | |
EP1687738A2 (en) | Clustering of text for structuring of text documents and training of language models | |
KR102285142B1 (en) | Apparatus and method for recommending learning data for chatbots | |
CN111158641B (en) | Automatic recognition method for transaction function points based on semantic analysis and text mining | |
CN112052356A (en) | Multimedia classification method, apparatus and computer-readable storage medium | |
CN111666766A (en) | Data processing method, device and equipment | |
Çelik et al. | Gender prediction from social media comments with artificial intelligence | |
KR101856115B1 (en) | System and Method for providing digital information | |
US20240086441A1 (en) | System and method for automatic profile segmentation using small text variations | |
CN112287111A (en) | Text processing method and related device | |
KR102609681B1 (en) | Method for determining product planning reflecting user feedback and Apparatus thereof | |
CN110413749A (en) | Determine the method and device of typical problem | |
CN116882414A (en) | Automatic comment generation method and related device based on large-scale language model | |
CN115129890A (en) | Feedback data map generation method and generation device, question answering device and refrigerator | |
WO2022216722A1 (en) | Generating aspects from attributes identified in digital video audio tracks | |
CN113505293A (en) | Information pushing method and device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |