KR20220043314A - Data Pre-Processing System - Google Patents
Data Pre-Processing System Download PDFInfo
- Publication number
- KR20220043314A KR20220043314A KR1020200126566A KR20200126566A KR20220043314A KR 20220043314 A KR20220043314 A KR 20220043314A KR 1020200126566 A KR1020200126566 A KR 1020200126566A KR 20200126566 A KR20200126566 A KR 20200126566A KR 20220043314 A KR20220043314 A KR 20220043314A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- unit
- history data
- processing
- project
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 데이터 전처리 시스템에 관한 것으로, 보다 구체적으로는 데이터 분석을 위한 데이터 전처리 시스템에 관한 것이다.The present invention relates to a data pre-processing system, and more particularly, to a data pre-processing system for data analysis.
데이터 분석은 일반적으로, 데이터 수집, 데이터 탐색, 데이터 전처리, 모델링, 모델링 검증 및 모델 배포 순으로 이루어질 수 있다. 이때, 데이터 전처리 과정은 데이터 분석 과정 중에서 가장 많은 시간과 비용이 소모된다. Data analysis can generally be done in the following order: data collection, data exploration, data preprocessing, modeling, modeling validation, and model deployment. In this case, the data preprocessing process consumes the most time and cost among the data analysis processes.
종래의 데이터 전처리 시스템은 분석가의 지식과 경험을 기초로 직접 코딩한 프로그램을 입력하여야 한다. 이에, 분석가의 지식과 경험 유무에 따라 전처리 결과가 크게 달라질 수 있다. 또한, 분석가가 지식과 경험이 있다고 하더라도, 데이터 분석 목적에 맞게 전처리를 수행하는데 상당한 소요시간이 소모된다.In the conventional data preprocessing system, a program directly coded based on the analyst's knowledge and experience must be input. Accordingly, the preprocessing result may vary greatly depending on the analyst's knowledge and experience. In addition, even if the analyst has knowledge and experience, a considerable amount of time is consumed to perform pre-processing according to the purpose of data analysis.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 밀도 추정을 이용하여 정상 제어데이터 보안 규칙을 생성할 수 있는 비정상 제어데이터 탐지 시스템을 제공하는 것을 그 기술적 특징으로 한다.The present invention is to solve the above-described problem, and is characterized by providing an abnormal control data detection system capable of generating a normal control data security rule using density estimation.
또한, 본 발명은 입력되는 제어데이터를 학습하여 비정상 제어데이터의 탐지를 위한 정상 제어데이터 보안 규칙을 자동으로 생성할 수 있는 비정상 제어데이터 탐지 시스템을 제공하는 것을 그 기술적 특징으로 한다.In addition, the present invention has a technical feature to provide an abnormal control data detection system capable of automatically generating a normal control data security rule for detection of abnormal control data by learning input control data.
본 발명의 일 실시예에 따른 데이터 전처리 시스템은 데이터 수집 장치에 의해서 수집된 수집 데이터를 저장하는 데이터 관리부; 및 전처리 작업 공간인 프로젝트를 생성하고, 상기 수집 데이터의 전처리 과정을 단위 기능으로 모듈화한 복수개의 전처리 모듈을 제공하는 프로젝트 관리부;를 포함하고, 상기 프로젝트 관리부는, 상기 수집 데이터의 전처리 과정을 구성하는 전처리 모듈들에 대응하는 단위 이력데이터들을 저장하고, 상기 단위 이력데이터들에 대응하는 전처리 모듈들에 따라 상기 수집 데이터의 전처리 과정을 수행하는 것을 특징으로 한다.A data pre-processing system according to an embodiment of the present invention includes: a data management unit for storing the collected data collected by the data collecting device; and a project management unit that creates a project that is a pre-processing workspace and provides a plurality of pre-processing modules in which the pre-processing of the collected data is modularized into unit functions, wherein the project management unit configures the pre-processing of the collected data It is characterized in that the unit history data corresponding to the pre-processing modules are stored, and the pre-processing of the collected data is performed according to the pre-processing modules corresponding to the unit history data.
본 발명의 실시예에 따르면, 고급 분석가가 제시한 전처리 이력을 통해, 전처리 시간을 단축하고 초보 분석가 또는 일반인들도 전처리 작업을 수행할 수 있다.According to an embodiment of the present invention, through the pre-processing history presented by the advanced analyst, the pre-processing time can be shortened and even a novice analyst or ordinary person can perform the pre-processing operation.
또한, 본 발명의 실시예에 따르면, 전처리 이력을 이용하여 시행착오 및 반복작업을 줄여 데이터를 전처리하기 위해 소요되는 시간과 비용을 절약할 수 있다.In addition, according to an embodiment of the present invention, it is possible to reduce the time and cost required to preprocess data by reducing trial and error and repetitive work using the preprocessing history.
또한, 본 발명의 실시예에 따르면, 저장된 전처리 이력을 다른 데이터 전처리 작업에 이용하여 전처리된 데이터가 균일한 품질을 가질 수 있다. In addition, according to an embodiment of the present invention, the preprocessed data may have uniform quality by using the stored preprocessing history for other data preprocessing tasks.
도 1은 본 발명의 일 실시예에 따른 데이터 전처리 시스템을 개략적으로 보여주는 블록도이다.
도 2는 본 발명의 일 실시예에 따른 프로젝트 이력 관리부를 개략적으로 보여주는 블록도이다.
도 3은 본 발명의 일 실시예에 따른 단위 이력데이터를 보여주는 도면이다.
도 4는 도 3에 도시된 단위 이력데이터가 연결된 이력데이터를 보여주는 도면이다.
도 5a 내지 도 5f는 본 발명의 일 실시예에 따른 이력데이터 관리 방법을 나타낸 도면이다.1 is a block diagram schematically showing a data pre-processing system according to an embodiment of the present invention.
2 is a block diagram schematically showing a project history management unit according to an embodiment of the present invention.
3 is a view showing unit history data according to an embodiment of the present invention.
4 is a view showing history data to which the unit history data shown in FIG. 3 is connected.
5A to 5F are diagrams illustrating a history data management method according to an embodiment of the present invention.
이하, 첨부되는 도면을 참고하여 본 발명의 실시예들에 대해 상세히 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.The meaning of the terms described in this specification should be understood as follows.
단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 안된다.The singular expression is to be understood as including the plural expression unless the context clearly defines otherwise, and the terms "first", "second", etc. are used to distinguish one element from another, The scope of rights should not be limited by these terms.
"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.It should be understood that terms such as “comprise” or “have” do not preclude the possibility of addition or existence of one or more other features or numbers, steps, operations, components, parts, or combinations thereof.
"적어도 하나"의 용어는 하나 이상의 관련 항목으로부터 제시 가능한 모든 조합을 포함하는 것으로 이해되어야 한다. 예를 들어, "제1 항목, 제2 항목 및 제3 항목 중에서 적어도 하나"의 의미는 제1 항목, 제2 항목 또는 제3 항목 각각 뿐만 아니라 제2 항목, 제2 항목 및 제3 항목 중에서 2개 이상으로부터 제시될 수 있는 모든 항목의 조합을 의미한다.The term “at least one” should be understood to include all possible combinations from one or more related items. For example, the meaning of “at least one of the first, second, and third items” means that each of the first, second, or third items as well as two of the second, second, and third items It means a combination of all items that can be presented from more than one.
도 1은 본 발명에 따른 데이터 전처리 시스템을 보여주는 도면이다.1 is a diagram showing a data pre-processing system according to the present invention.
도 1에 도시된 바와 같이, 본 발명에 따른 데이터 전처리 시스템(1000)은 데이터 관리부(100) 및 프로젝트 관리부(200)를 포함한다. As shown in FIG. 1 , the
데이터 관리부(100)는 전처리 대상 데이터를 저장 및 관리한다. 여기서, 전처리 대상 데이터는 데이터 수집 장치(미도시)에 의하여 수집된 데이터일 수 있다. 일 실시예에 있어서, 데이터 수집 장치는 다양한 공정의 진행 과정에서 발생되는 마이크로 데이터(Micro Data)를 수집할 수 있다. 여기서, 마이크로 데이터는 다양한 센서 등을 통해 수집된 데이터 그 자체로서 원시 데이터(Raw Data)를 의미한다. 이하에서는, 설명의 편의를 위해 마이크로 데이터를 수집 데이터로 표기하기로 한다.The
데이터 수집 장치는 마이크로 데이터를 수집하기 위한 다양한 계측기, 센서, 액츄에이터 등을 포함한다. 데이터 수집 장치는 계측기, 센서, 액츄에이터 등에 의해 수집된 데이터를 통합하거나 제어하는 P/C, PLC(Programmable Logic Controller), DCS(Distributed Control System) 등을 더 포함할 수 있다.The data collection device includes various instruments, sensors, actuators, and the like for collecting micro data. The data collection device may further include a P/C, a programmable logic controller (PLC), a distributed control system (DCS), etc. that integrate or control data collected by a measuring instrument, a sensor, an actuator, and the like.
일 예로, 데이터 수집장치는 연속공정에서 발생되는 데이터를 수집할 수 있다. 연속공정이란 원재료를 이용하여 완제품을 생성하기 위한 복수개의 공정들이 연속적으로 수행되고, 각 공정의 산출물들이 서로 혼합되거나 특정 공정의 산출물의 상태가 변화하여 후속 공정으로 공급되는 방식의 공정을 의미한다. 철강공정이 이러한 연속공정의 대표적인 예에 해당한다. 철강공정은 제선공정, 제강공정, 연주공정, 및 압연공정 등과 같은 다양한 공정으로 구성될 수 있다. 데이터 수집 장치가 철강공정에 적용되는 경우, 제선공정, 제강공정, 연주공정, 및 압연공정 등과 같은 다양한 공정의 진행 과정에서 발생되는 마이크로 데이터(Micro Data)를 수집할 수 있다.For example, the data collection device may collect data generated in a continuous process. The continuous process refers to a process in which a plurality of processes for producing a finished product using raw materials are continuously performed, and the outputs of each process are mixed with each other or the state of the output of a specific process is changed and supplied to a subsequent process. Steel processing is a representative example of such a continuous process. The steel process may include various processes such as a steelmaking process, a steelmaking process, a casting process, and a rolling process. When the data collection device is applied to a steel process, it is possible to collect micro data generated in the course of various processes such as a steelmaking process, a steelmaking process, a casting process, and a rolling process.
데이터 관리부(100)는 데이터 저장부(110), 및 데이터 정보 편집부(120)를 포함한다. The
데이터 저장부(110)는 전처리 대상 데이터, 예컨대, 데이터 수집장치에 의해서 수집된 수집 데이터를 저장한다. The
데이터 정보 편집부(120)는 데이터 저장부(110)에 저장된 수집 데이터의 형식 및 권한 등의 정보를 편집한다. 데이터 정보 편집부(120)는 사용자 입력에 의하여 수집 데이터의 형식 및 권한 등의 정보를 편집할 수 있다.The data
프로젝트 관리부(200)는 전처리 작업 공간인 프로젝트를 생성하고, 생성된 적어도 하나의 프로젝트를 관리한다. 이러한 프로젝트 관리부(200)는 프로젝트 생성부(210), 프로젝트 정보 편집부(220) 및 프로젝트 이력 관리부(230)를 포함한다.The
프로젝트 생성부(210)는 전처리 작업 공간인 프로젝트를 생성한다. 프로젝트 생성부(210)는 사용자의 요청에 의하여 새로운 프로젝트를 생성할 수 있다. 프로젝트 생성부(210)는 생성된 프로젝트에서 사용자가 데이터 전처리 작업을 용이하게 수행할 수 있도록 다양한 기능을 제공할 수 있다.The
일 실시예에 있어서, 프로젝트 생성부(210)는 후술할 프로젝트 이력관리부(230)에서 편집된 이력데이터에 따라 수집 데이터에 대해 데이터 전처리를 수행할 수 있다. 예를 들어, 프로젝트 이력관리부(230)에 의해 제1 프로젝트에서 순차적으로 동작된 전처리 모듈에 대응하는 이력데이터가 제2 프로젝트에 복사되고, 프로젝트 생성부(210)는 제2 프로젝트에 복사된 제1 프로젝트의 이력데이터에 따라 데이터 전처리를 진행하여 그 결과를 계산할 수 있다. 또는, 프로젝트 생성부(210)는 프로젝트 이력관리부(230)에 의해 추가, 수정, 삭제, 비활성, 순서 변경된 이력데이터에 따라 데이터 전처리를 진행하여 그 결과를 재계산할 수 있다. 이에 따라, 숙련된 분석가의 데이터 전처리 이력을 이용하여 시행착오 및 반복작업을 줄여 데이터 전처리에 소요되는 시간과 비용을 줄일 수 있다. 또한, 균일한 품질의 데이터를 생성할 수 있다.In one embodiment, the
프로젝트 정보 편집부(220)는 프로젝트 생성부(210)에 의해 생성된 프로젝트의 이름 및 권한 등의 정보를 편집한다. 프로젝트 정보 편집부(220)는 사용자 입력에 의하여 프로젝트의 이름 및 권한 등의 정보를 편집할 수 있다.The project
프로젝트 이력관리부(230)는 프로젝트에서 전처리 모듈을 순차적으로 동작시킨 이력데이터를 관리한다. The project
프로젝트 이력관리부(230)에 대해서는 도 2 내지 도 5f를 참조하여 상세히 설명한다. 도 2는 본 발명의 일 실시예에 따른 프로젝트 이력 관리부를 개략적으로 보여주는 블록도이다. 도 3은 본 발명의 일 실시예에 따른 단위 이력데이터를 보여주는 도면이고, 도 4는 도 3에 도시된 단위 이력데이터가 연결된 이력데이터를 보여주는 도면이다. 도 5a 내지 도 5f는 본 발명의 일 실시예에 따른 이력데이터 관리 방법을 나타낸 도면이다.The project
도 2에 도시된 바와 같이, 프로젝트 이력관리부(230)는 이력 생성부(231), 이력 추가부(232), 이력 수정부(233), 이력 삭제부(234), 이력 비활성부(235), 이력 복사부(236) 및 이력 순서 변경부(237)를 포함한다.As shown in FIG. 2 , the project
이력 생성부(231)는, 전처리 모듈을 순차적으로 동작시킨 이력데이터를 생성한다. 구체적으로, 이력 생성부(231)는 전처리 모듈이 동작될 때마다, 도 3에 도시된 바와 같이, 해당 전처리 모듈에 대응하는 단위 이력데이터를 생성하고, 전처리 모듈이 순차적으로 동작함에 따라, 도 4 및 도 5a에 도시된 바와 같이, 생성된 단위 이력데이터(301)를 순차적으로 연결하여 이력데이터(300)를 생성한다. 이때, 이력데이터(300)는 적어도 하나의 단위 이력데이터(301)를 포함한다. The
도 3을 참조하면, 단위 이력데이터(301)는 헤드부(H), 데이터부(D) 및 테일부(T)로 구성된다. Referring to FIG. 3 , the
헤드부(H)에는 해당 단위 이력데이터(301)에 선행하는 단위 이력데이터(301)의 정보가 저장된다. 예를 들어, 헤드부에는 해당 단위 이력데이터(301)에 선행하는 단위 이력데이터(301)가 저장된 주소가 저장될 수 있다. 또는, 해당 단위 이력데이터(301)가 첫번째 단위 이력데이터인 경우에는 헤드부에 'Null'이 저장된다.Information of the
데이터부(D)에는 해당 단위 이력데이터(301)의 정보가 저장된다. 구체적으로, 데이터부(D)는 해당 단위 이력데이터(301)의 상태 코드(Status)를 저장하는 제1 데이터부, 해당 단위 이력데이터(301)를 이용하여 데이터 전처리를 진행하기 위한 요청 데이터(Request) 및 응답 데이터(Response)를 저장하는 제2 데이터부 및 해당 단위 이력데이터(301)에 대응하는 전처리 모듈 번호(Function_id)를 저장하는 제3 데이터부를 포함한다. 이때, 제1 데이터부에 저장되는 해당 단위 이력데이터(301)의 상태 코드는 표 1에 표시된 바와 같이 각 단위 이력데이터(301)의 상태를 나타내는 코드일 수 있다. 또한, 제3 데이터부에 저장되는 전처리 모듈 번호(Function_id)는 표 2에 표시된 바와 같이 프로젝트에서 동작되는 각 전처리 모듈에 대응하는 전처리 모듈 번호일 수 있다. 특히, 전처리 모듈 리스트는 프로젝트 정보 편집부(220)에 저장되어 있으며, 제3 데이터부의 전처리 모듈 번호(Function_id)는 프로젝트 정보 편집부(220)에 저장되어 있는 전처리 모듈 리스트 중 어느 한 전처리 모듈 리스트의 전처리 모듈 번호와 일치할 수 있다. Information of the corresponding
테일부(T)에는 해당 단위 이력데이터(301)에 후행하는 단위 이력데이터(301)의 정보가 저장된다. 예를 들어, 테일부(T)에는 해당 단위 이력데이터(301)에 후행하는 단위 이력데이터(301)가 저장된 주소가 저장될 수 있다. 해당 단위 이력데이터(301)가 마지막 단위 이력데이터(301)인 경우에는 테일부(T)에 'Null'이 저장된다. Information of the
일 실시예에 있어서, 복수의 단위 이력데이터(301)들은 각 단위 이력데이터의 헤드부(H) 및 테일부(T)를 통해 순차적으로 연결되는 링크드리스트(Linked List) 구조로 연결되어 이력데이터를 구성한다. In one embodiment, the plurality of
이력 추가부(232)는 도 5b에 도시된 바와 같이, 생성된 이력데이터(300)에 단위 이력데이터(304)를 추가할 수 있다. 구체적으로, 이력 추가부(232)는 생성된 이력데이터(300)에 새로운 단위 이력데이터(304)를 추가할 수 있다. 이력 추가부(232)는 생성된 이력데이터(300)의 마지막 단위 이력데이터(303)에 사용자가 추가하고자 하는 새로운 단위 이력데이터(304)를 연결시킬 수 있다. As shown in FIG. 5B , the
이력 수정부(233)는 도 5c에 도시된 바와 같이, 단위 이력데이터(301, 302, 303, 304)의 데이터부(D)를 수정하여 전처리 모듈의 기능에 대해 편집할 수 있다. 구체적으로, 이력 수정부(233)는 이력데이터(300)를 이루는 단위 이력데이터의 데이터부(D)를 수정하여 해당 단위 이력데이터(303)에 대응하는 전처리 모듈의 세부적인 기능을 수정할 수 있다. As shown in FIG. 5C , the
일 실시예에 있어서, 프로젝트 관리부(200)는 데이터부가 수정된 단위 이력데이터를 포함하는 이력데이터를 기초로 각 단위 이력데이터에 대응하는 전처리모듈을 동작시켜 수집 데이터에 대한 데이터 전처리를 수행할 수 있다.In one embodiment, the
이력 삭제부(234)는 이력데이터를 이루는 단위 이력데이터를 삭제할 수 있다. 구체적으로, 이력 삭제부(234)는 삭제하고자 하는 단위 이력데이터의 제1 데이터부를 삭제(Delete)에 해당하는 상태코드(표 1 참조)로 수정하고, 도 5d에 도시된 바와 같이, 이력 삭제부(234)는 해당 단위 이력데이터(302)와 해당 단위 이력데이터(302)에 선행하는 단위 이력데이터(301) 및 후행하는 단위 이력데이터(303) 사이의 연결을 해제하고, 해당 단위 이력데이터(302)에 선행하는 단위 이력데이터(301)를 해당 단위 이력데이터(302)에 후행하는 단위 이력데이터(303)와 연결한다.The
일 실시예에 있어서, 프로젝트 관리부(200)는 적어도 하나의 단위 이력데이터가 삭제된 이력데이터를 기초로 각 단위 이력데이터에 대응하는 전처리 모듈을 동작시켜 수집 데이터에 대한 데이터 전처리를 진행할 수 있다.In one embodiment, the
이력 비활성부(235)는 이력데이터를 이루는 단위 이력데이터를 비활성화할 수 있다. 예를 들어, 사용자가 현재 이력에 따라 전처리한 결과와 단위 이력데이터를 삭제한 이력에 따라 전처리한 결과의 비교가 필요한 경우, 해당 단위 이력데이터에 대해 비활성화를 수행하여 그 결과를 비교할 수 있다. 구체적으로, 이력 비활성부(235)는 비활성화하고자 하는 단위 이력데이터의 제1 데이터부를 비활성(Disable)에 해당하는 상태코드로 수정하여 도 5e에 도시된 바와 같이, 해당 단위 이력데이터에 대해 비활성화한다. 해당 이력데이터에 따라 데이터 전처리를 수행하는 경우, 비활성화한 단위 이력데이터에 대응하는 전처리 모듈의 기능은 수행되지 않고 후행하는 단위 이력데이터에 대응하는 전처리 모듈의 기능이 수행된다.The
이력 데이터에 따라 전처리를 진행한 후, 비활성된 단위 이력데이터는 제1 데이터부를 완료(Done)에 해당하는 상태코드로 수정하여 다시 복구할 수 있다.After pre-processing according to the history data, the inactive unit history data may be restored by modifying the first data part to a status code corresponding to Done.
이력 복사부(236)는 하나의 프로젝트에서 수행된 전처리 프로세스에 대한 이력데이터를 다른 프로젝트에 복사할 수 있다. 구체적으로, 이력복사부(236)는 제1 프로젝트에서 전처리 모듈들이 순차적으로 동작함에 따라 생성된 제1 이력데이터를 제2 프로젝트에 복사하여 제2 이력데이터를 생성할 수 있다. 이에 따라, 이미 수행된 전처리 이력데이터를 이용하여 시행착오 및 반복작업을 줄여 데이터를 전처리하기 위해 소요되는 시간과 비용을 절약할 수 있다.The
일 실시예에 있어서, 프로젝트 관리부(200)는 복사된 이력데이터를 기초로 각 단위 이력데이터에 대응하는 전처리 모듈을 동작시켜 수집 데이터에 대한 데이터 전처리를 진행할 수 있다.In one embodiment, the
이력 순서 변경부(237)는 이력데이터를 이루는 단위 이력데이터의 순서를 변경할 수 있다. 예를 들어, 도 5f에 도시된 바와 같이, 이력 순서 변경부(237)는 두번째 단위 이력데이터와 세번째 단위 이력데이터의 순서를 변경할 수 있다. 두번째 단위 이력데이터와 세번째 단위 이력데이터의 연결을 해제하고, 두번째 단위 이력데이터를 네번째 단위 이력데이터와 연결하고, 세번째 단위 이력데이터를 첫번째 단위 이력데이터와 연결한 후, 세번째 단위 이력데이터와 두번째 단위 이력데이터를 연결하여 두번째 단위 이력데이터와 세번째 단위 이력데이터의 순서를 변경할 수 있다.The history
일 실시예에 있어서, 프로젝트 관리부(200)는 단위 이력데이터의 순서가 변경된 이력데이터를 기초로 각 단위 이력데이터에 대응하는 전처리 모듈을 동작시켜 수집 데이터에 대한 데이터 전처리를 진행할 수 있다.In one embodiment, the
본 발명의 일 실시예에 따르면, 프로젝트 관리부(200)는 프로젝트 이력 관리부(230)에 의해 편집된 단위 이력데이터를 포함하는 이력데이터에 대해 각 단위 이력데이터에 대응하는 전처리모듈에 따라 수집 데이터를 전처리할 수 있다. 이에 따라, 고급분석가가 제시한 전처리 이력데이터를 이용하여 전처리시간을 단축하고, 초보 분석가 또는 일반인들도 전처리 작업을 수행할 수 있다.According to an embodiment of the present invention, the
또한, 본 발명의 일 실시예에 따르면, 저장된 이력데이터를 다른 프로젝트에서 이용하여 전처리된 데이터가 균일한 품질을 가질 수 있다.In addition, according to an embodiment of the present invention, data preprocessed by using the stored history data in another project may have uniform quality.
본 발명이 속하는 기술분야의 당업자는 상술한 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.Those skilled in the art to which the present invention pertains will understand that the above-described present invention may be embodied in other specific forms without changing the technical spirit or essential characteristics thereof.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The scope of the present invention is indicated by the following claims rather than the above detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.
본 명세서에 설명되어 있는 모든 개시된 방법들 및 절차들은, 적어도 부분적으로, 하나 이상의 컴퓨터 프로그램 또는 구성요소를 사용하여 구현될 수 있다. 이 구성요소는 RAM, ROM, 플래시 메모리, 자기 또는 광학 디스크, 광메모리, 또는 그 밖의 저장매체와 같은 휘발성 및 비휘발성 메모리를 포함하는 임의의 통상적 컴퓨터 판독 가능한 매체 또는 기계 판독 가능한 매체를 통해 일련의 컴퓨터 지시어들로서 제공될 수 있다. 상기 지시어들은 소프트웨어 또는 펌웨어로서 제공될 수 있으며, 전체적 또는 부분적으로, ASICs, FPGAs, DSPs, 또는 그 밖의 다른 임의의 유사 소자와 같은 하드웨어 구성에 구현될 수도 있다. 상기 지시어들은 하나 이상의 프로세서 또는 다른 하드웨어 구성에 의해 실행되도록 구성될 수 있는데, 상기 프로세서 또는 다른 하드웨어 구성은 상기 일련의 컴퓨터 지시어들을 실행할 때 본 명세서에 개시된 상기 방법들 및 절차들의 모두 또는 일부를 수행하거나 수행할 수 있도록 한다.All disclosed methods and procedures described herein may be implemented, at least in part, using one or more computer programs or components. These components may be configured as a series of series via any conventional computer readable medium or machine readable medium including volatile and nonvolatile memory such as RAM, ROM, flash memory, magnetic or optical disks, optical memory, or other storage media. They may be provided as computer instructions. The instructions may be provided as software or firmware, and may be implemented, in whole or in part, in a hardware configuration such as ASICs, FPGAs, DSPs, or any other similar device. The instructions may be configured to be executed by one or more processors or other hardware components, which when executing the series of computer instructions perform all or part of the methods and procedures disclosed herein or make it possible to do
1000: 데이터 전처리 시스템
100: 데이터 관리부
110: 데이터 저장부
120: 데이터 정보 편집부
200: 프로젝트 관리부
210: 프로젝트 저장부
220: 프로젝트 편집부
230: 프로젝트 이력 관리부1000: data pre-processing system 100: data management unit
110: data storage unit 120: data information editing unit
200: project management unit 210: project storage unit
220: project editing unit 230: project history management unit
Claims (9)
전처리 작업 공간인 프로젝트를 생성하고, 상기 수집 데이터의 전처리 과정을 단위 기능으로 모듈화한 복수개의 전처리 모듈을 제공하는 프로젝트 관리부;를 포함하고,
상기 프로젝트 관리부는,
상기 수집 데이터의 전처리 과정을 구성하는 전처리 모듈들에 대응하는 단위 이력데이터들을 저장하고,
상기 단위 이력데이터들에 대응하는 전처리 모듈들에 따라 상기 수집 데이터의 전처리 과정을 수행하는 것을 특징으로 하는 데이터 전처리 시스템.a data management unit for storing the collected data collected by the data collecting device; and
A project management unit that creates a project that is a pre-processing workspace and provides a plurality of pre-processing modules that modularize the pre-processing process of the collected data into a unit function; includes;
The project management unit,
Storing unit history data corresponding to the pre-processing modules constituting the pre-processing of the collected data,
Data pre-processing system, characterized in that the pre-processing of the collected data is performed according to pre-processing modules corresponding to the unit history data.
상기 수집 데이터의 전처리 과정을 구성하는 전처리 모듈들에 대응하는 단위 이력데이터들은 상기 수집 데이터의 전처리 과정에 대한 이력데이터를 구성하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The data pre-processing system, characterized in that the unit history data corresponding to the pre-processing modules constituting the pre-processing of the collected data constitutes the history data of the pre-processing of the collected data.
상기 단위 이력데이터는 해당 단위 이력데이터에 대응하는 전처리 모듈의 상태를 나타내는 상태정보 및 상기 전처리 모듈의 기능을 나타내는 모듈번호를 저장하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The unit history data data pre-processing system, characterized in that for storing the state information indicating the state of the pre-processing module corresponding to the unit history data and the module number indicating the function of the pre-processing module.
상기 프로젝트 관리부는,
상기 이력데이터를 구성하는 단위 이력데이터를 편집하여 해당 단위 이력데이터에 대응하는 전처리 모듈의 기능을 수정하고, 기능이 수정된 전처리 모듈에 따라 상기 수집 데이터를 전처리하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The project management unit,
Data pre-processing system, characterized in that by editing the unit history data constituting the history data to correct the function of the pre-processing module corresponding to the unit history data, and pre-processing the collected data according to the function-modified pre-processing module.
상기 프로젝트 관리부는,
상기 프로젝트에서 상기 수집 데이터에 대해 상기 전처리 모듈이 순차적으로 동작함에 따라, 순차적으로 동작한 전처리 모듈에 대응하는 단위 이력데이터를 생성하고, 생성된 단위 이력데이터를 이용하여 이력데이터를 생성하는 프로젝트 이력 관리부;를 포함하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The project management unit,
As the pre-processing module sequentially operates with respect to the collected data in the project, a project history management unit that generates unit history data corresponding to the sequentially operated pre-processing module, and generates history data using the generated unit history data ; Data pre-processing system comprising a.
상기 프로젝트 관리부는,
제1 프로젝트에서 전처리 모듈들이 순차적으로 동작함에 따라 생성된 제1 이력데이터를 제2 프로젝트에 복사하여 제2 이력데이터를 생성하고, 상기 제2 프로젝트에서 제2 이력데이터를 구성하는 단위 이력데이터에 각각 대응하는 전처리 모듈들에 따라 상기 수집 데이터를 전처리하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The project management unit,
The first history data generated as the preprocessing modules sequentially operate in the first project are copied to the second project to generate second history data, and in the second project, each of the unit history data constituting the second history data is Pre-processing the collected data according to corresponding pre-processing modules.
상기 프로젝트 관리부는,
상기 단위 이력데이터들의 사이의 연결을 이용하여 상기 단위 이력데이터들을 추가, 삭제, 및 순서 변경하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The project management unit,
The data preprocessing system, characterized in that adding, deleting, and changing the order of the unit history data using a connection between the unit history data.
상기 이력데이터는 상기 전처리 모듈에 대응하는 단위 이력데이터로 구성되고,
상기 단위 이력데이터는,
해당 단위 이력데이터에 선행하는 단위 이력데이터가 저장된 정보를 저장하는 헤드부;
해당 단위 이력데이터에 대응하는 전처리 모듈에 대한 정보를 저장하는 데이터부; 및
해당 단위 이력데이터에 후행하는 단위 이력데이터의 정보를 저장하는 테일부;를 포함하는 것을 특징으로 하는 데이터 전처리 시스템.According to claim 1,
The history data is composed of unit history data corresponding to the pre-processing module,
The unit history data is
a head unit for storing information in which unit history data preceding the corresponding unit history data is stored;
a data unit for storing information on a pre-processing module corresponding to the unit history data; and
Data pre-processing system comprising a; a tail unit for storing information on unit history data that follows the unit history data.
상기 이력데이터는 상기 전처리 모듈에 대응하는 단위 이력데이터의 헤드부 및 테일부를 이용하여 링크드리스트(linked list) 구조로 연결되어 상기 이력데이터를 구성하는 것을 특징으로 하는 데이터 전처리 시스템.9. The method of claim 8,
The history data is connected in a linked list structure using a head portion and a tail portion of the unit history data corresponding to the pre-processing module to constitute the history data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126566A KR102530794B1 (en) | 2020-09-29 | 2020-09-29 | Data Pre-Processing System |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126566A KR102530794B1 (en) | 2020-09-29 | 2020-09-29 | Data Pre-Processing System |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220043314A true KR20220043314A (en) | 2022-04-05 |
KR102530794B1 KR102530794B1 (en) | 2023-05-10 |
Family
ID=81182217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126566A KR102530794B1 (en) | 2020-09-29 | 2020-09-29 | Data Pre-Processing System |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102530794B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100237870B1 (en) * | 1997-01-17 | 2000-01-15 | 이계철 | Billing data processing method using packet traffic analyzing apparatus |
KR20060012071A (en) * | 2004-08-02 | 2006-02-07 | 이원석 | Knowledge discovery methods of similar video data |
JP4770901B2 (en) * | 2008-09-26 | 2011-09-14 | カシオ計算機株式会社 | Computer emulation device and computer emulation program |
KR101488815B1 (en) * | 2008-11-19 | 2015-02-04 | (주)링크제니시스 | Device for generating a script for menu test, menu test automatic system having the same, and method thereof |
KR102044205B1 (en) * | 2015-12-30 | 2019-11-13 | 주식회사 솔리드웨어 | Target information prediction system using big data and machine learning and method thereof |
-
2020
- 2020-09-29 KR KR1020200126566A patent/KR102530794B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100237870B1 (en) * | 1997-01-17 | 2000-01-15 | 이계철 | Billing data processing method using packet traffic analyzing apparatus |
KR20060012071A (en) * | 2004-08-02 | 2006-02-07 | 이원석 | Knowledge discovery methods of similar video data |
JP4770901B2 (en) * | 2008-09-26 | 2011-09-14 | カシオ計算機株式会社 | Computer emulation device and computer emulation program |
KR101488815B1 (en) * | 2008-11-19 | 2015-02-04 | (주)링크제니시스 | Device for generating a script for menu test, menu test automatic system having the same, and method thereof |
KR102044205B1 (en) * | 2015-12-30 | 2019-11-13 | 주식회사 솔리드웨어 | Target information prediction system using big data and machine learning and method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR102530794B1 (en) | 2023-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6268853B1 (en) | Data structure for use in enterprise controls | |
CN105992976B (en) | Machining information managing device and tool path generating means | |
US6862553B2 (en) | Diagnostics method and apparatus for use with enterprise controls | |
US20040073404A1 (en) | Mechanical-electrical template based method and apparatus | |
US20020120921A1 (en) | Simulation method and apparatus for use in enterprise controls | |
US9098650B2 (en) | Method and an apparatus for automatically generating a target simulation model for a defined simulation object | |
US10031512B2 (en) | Apparatus for generating and editing NC program | |
Fischer et al. | A qualitative study of variability management of control software for industrial automation systems | |
CN109491334A (en) | System and method for assessing configuration file associated with Process Control System | |
CN108427383B (en) | Engineering device, engineering method, and storage medium | |
CN111078094A (en) | Distributed machine learning visualization device | |
GB2604936A (en) | Automating complex processes | |
KR20220043314A (en) | Data Pre-Processing System | |
US7483757B2 (en) | Control system migration | |
CN108121297B (en) | Trapezoid figure program managing device | |
KR101985871B1 (en) | Method for diagnosing process abnormality based on internet of things by using parallel processing and Apparatus thereof | |
US9342064B2 (en) | Motion SFC program component creation device | |
El Hamlaoui et al. | Heterogeneous models matching for consistency management | |
KR101726120B1 (en) | Program editing device, program editing method and computer readable recoding medium for recording program editing program | |
JP2019095879A (en) | Operation monitoring device and program | |
JP6566151B2 (en) | System design support apparatus and system design support method | |
Kugler et al. | Method for the generation of use case related views for Digital Twins | |
JP3999477B2 (en) | Control program creation system, apparatus, method, recording medium, and program | |
WO2014130424A1 (en) | Method and system for multi-disciplinary engineering with a synchronized documents interface | |
CN116820488B (en) | Method for linkage of research, development and deployment processes under DevOps system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |