KR20210017342A - Time series prediction method and apparatus based on past prediction data - Google Patents
Time series prediction method and apparatus based on past prediction data Download PDFInfo
- Publication number
- KR20210017342A KR20210017342A KR1020190096448A KR20190096448A KR20210017342A KR 20210017342 A KR20210017342 A KR 20210017342A KR 1020190096448 A KR1020190096448 A KR 1020190096448A KR 20190096448 A KR20190096448 A KR 20190096448A KR 20210017342 A KR20210017342 A KR 20210017342A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- prediction
- past
- time series
- obtaining
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 과거 데이터에 기초한 시계열 예측 방법 및 장치에 관한 것으로, 더욱 상세하게는 시계열 예측 모델을 재학습하지 않고, 관련성이 있는 과거 데이터만을 이용하여 시계열 예측 결과를 보정함으로써, 점진적이거나 급격한 데이터 변화가 있더라도 정교한 시계열 예측을 수행하는 기술에 관한 것이다.The present invention relates to a time series prediction method and apparatus based on past data, and more particularly, by correcting a time series prediction result using only relevant past data without retraining a time series prediction model, a gradual or rapid data change If any, it relates to a technique for performing sophisticated time series prediction.
시계열(time serises)은 일정 시간 간격으로 배치된 데이터들의 수열을 말한다. 이때, 시계열 예측(time series prediction)이란 주어진 시계열 데이터를 이용하여 수학적 예측 모델을 만들고, 예측 모델을 이용하여 미래에 발생할 수 있는 데이터를 예측하는 것을 의미한다. 일반적으로, 이러한 시계열 예측은 공학이나 과학계산, 혹은 금융시장에서의 주가 예측 등에서 많이 사용되지만, 그 밖에도 시간에 종속적으로 측정된 모든 데이터들은 시계열로 볼 수 있다.Time series refers to a sequence of data arranged at regular time intervals. At this time, time series prediction means creating a mathematical prediction model using given time series data, and predicting data that may occur in the future using the prediction model. In general, such time series prediction is widely used in engineering, scientific calculation, or stock price prediction in financial markets, but all other data measured dependent on time can be viewed as time series.
시계열 예측을 위한 예측 모델은 알려진 데이터(known data)의 입력과 출력 사이의 상관 관계를 학습하여 생성될 수 있다. 예를 들어 지난 3 시간 동안의 날씨와 전력 생산량 사이의 상관 관계를 학습함으로써 향후 한 시간 동안 특정 날씨에 따른 전력 생산량을 예측하는 예측 모델을 생성할 수 있다.A prediction model for time series prediction may be generated by learning a correlation between input and output of known data. For example, by learning the correlation between the weather for the last three hours and the amount of electricity produced, a predictive model can be generated that predicts the amount of electricity produced according to a specific weather over the next hour.
예측 모델은 학습에 사용된 데이터가 수집된 환경과 유사한 환경에서 사용될 때 예측 정확도가 높다. 예를 들어, 사계절이 뚜렷한 지역에서 수집된 데이터를 이용하여 생성된 전력 생산량 예측 모델은 적도 지방에서 필요한 전력 생산량을 예측하는 데에는 적합하지 않다.The prediction model has high prediction accuracy when it is used in an environment similar to the environment in which the data used for training was collected. For example, a model for predicting power production generated using data collected in regions with distinct four seasons is not suitable for predicting the required power production in the equatorial region.
한편, 예측 모델이 사용되는 환경은 점진적이거나 급격하게 변화되는 경우가 발생할 수 있다. 예를 들어, 전력 생산량을 예측하는 예측 모델이 적용되는 태양광 발전소의 생산 능력이 노후화로 인해 시간이 지남에 따라 점차 감소하거나, 태양광 패널에 일시적인 눈이나 먼지 등이 쌓여 태양광 발전소의 생산 능력이 급격히 감소할 수도 있다. 따라서, 예측 모델이 사용되는 환경의 변화를 고려하여 예측 모델의 실시간 예측 결과를 적절히 보정함으로써 예측 모델의 정확도를 유지시키는 것이 필요하다.Meanwhile, the environment in which the predictive model is used may change gradually or rapidly. For example, the production capacity of a solar power plant to which a predictive model for predicting power production is applied gradually decreases over time due to aging, or the solar power plant's production capacity is caused by temporary snow or dust accumulation on the solar panel. This may decrease rapidly. Therefore, it is necessary to maintain the accuracy of the prediction model by appropriately correcting the real-time prediction result of the prediction model in consideration of changes in the environment in which the prediction model is used.
이러한 문제를 해결하기 위하여 종래에는 실시간으로 생성되는 데이터를 기반으로 예측 모델을 추가 학습(fine-tuning)하는 방법이 제안되었으나, 추가 학습을 위해서는 많은 컴퓨팅 자원이 요구된다. 또한, 짧은 시간 동안 간헐적으로 이벤트가 발생하는 환경에서는 신속하고 정확하게 예측 모델을 추가 학습하기 어렵고, 간헐적 이벤트로 인해 생성된 데이터를 이용하여 급격하게 추가 학습된 예측 모델은 정상적인 환경에서 부정확한 예측 데이터를 도출할 가능성이 높다.In order to solve this problem, conventionally, a method of fine-tuning a prediction model based on data generated in real time has been proposed, but many computing resources are required for further learning. In addition, in an environment where events occur intermittently for a short period of time, it is difficult to quickly and accurately additionally learn a prediction model, and a prediction model that is rapidly additionally learned using data generated by an intermittent event can generate inaccurate prediction data in a normal environment. It is likely to be derived.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 과거 데이터에 기초한 시계열 예측 방법을 제공하는 데 있다.An object of the present invention for solving the above problems is to provide a method for predicting a time series based on past data.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 과거 데이터에 기초한 시계열 예측 장치를 제공하는 데 있다.Another object of the present invention for solving the above problems is to provide an apparatus for predicting time series based on past data.
상기 목적을 달성하기 위한 본 발명의 일 측면은, 과거 데이터에 기초한 시계열 예측 방법을 제공한다.An aspect of the present invention for achieving the above object is to provide a time series prediction method based on past data.
상기 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계, 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계, 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The time series prediction method based on the past data includes: acquiring actual data observed in a prediction target environment, inputting the acquired actual data into a pre-trained time series prediction model, and a first-order prediction predicted by the time series prediction model. It may include obtaining data and correcting the first prediction data using past data extracted from a prediction data database (DB), thereby obtaining final prediction data.
상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The time series prediction method based on past data may further include storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data adjacent to the current prediction time point and belonging to a short time interval may be extracted.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.
상기 목적을 달성하기 위한 본 발명의 다른 측면은, 과거 데이터에 기초한 시계열 예측 장치를 제공한다. Another aspect of the present invention for achieving the above object is to provide a time series prediction apparatus based on past data.
과거 데이터에 기초한 시계열 예측 장치는, 적어도 하나의 프로세서(processor); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.An apparatus for predicting a time series based on past data may include: at least one processor; And a memory for storing instructions instructing the at least one processor to perform at least one step.
상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The at least one step may include obtaining actual data observed in a prediction target environment; Inputting the acquired real data into a pre-trained time series prediction model; Obtaining primary prediction data predicted by the time series prediction model; And acquiring final prediction data by correcting the primary prediction data using past data extracted from a prediction data database (DB).
상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The at least one step may further include storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data adjacent to the current prediction time point and belonging to a short time interval may be extracted.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.
상기와 같은 본 발명에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치를 이용할 경우에는 예측 모델을 추가 학습하지 않더라도 과거 예측 데이터만을 이용하여 실시간으로 예측 데이터를 보정할 수 있다.In the case of using the method and apparatus for predicting time series based on past data according to the present invention as described above, prediction data may be corrected in real time using only past prediction data even without additional learning of a prediction model.
또한, 예기치 못한 간헐적 이벤트가 발생한 환경에서도 신속하게 예측 데이터를 보정하여 도출할 수 있는 장점이 있다.In addition, there is an advantage in that prediction data can be quickly corrected and derived even in an environment in which unexpected intermittent events occur.
또한, 예측 모델에 종속적이지 않으며, 특정 환경에서 학습되어 생성된 예측 모델을 곧바로 유사 환경에 바로 사용할 수 있다.In addition, it is not dependent on the prediction model, and the prediction model generated by learning in a specific environment can be used directly in a similar environment.
도 1은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.
도 2는 본 발명의 일 실시예에 따른 과거 데이터를 추출하는 방법에 대한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다.
도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다.
도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.
도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.
도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.
도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.
도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.1 is a conceptual diagram of a method and apparatus for predicting a time series based on past data according to an embodiment of the present invention.
2 is a conceptual diagram illustrating a method of extracting past data according to an embodiment of the present invention.
3 is a conceptual diagram of a first method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
4 is a conceptual diagram of a second method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
5 is a conceptual diagram of a third method of correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
6 is an exemplary diagram for explaining a process of generating prediction data for
7 is a graph showing the result of applying the time series prediction model learned in the first region to a second region belonging to a climate environment similar to that of the first region but having different power generation performance.
8 is a graph showing a result of applying a time series prediction model learned in a first region where power generation performance gradually decreases to a first region.
9 is a graph showing a result of applying a time series prediction model learned in a first region having a sudden environmental change to a first region.
10 is a representative flowchart of a method for predicting time series based on past data according to an embodiment of the present invention.
11 is a hardware configuration diagram of a time series prediction apparatus based on past data according to an embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다. In the present invention, various modifications may be made and various embodiments may be provided, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to a specific embodiment, it is to be understood to include all changes, equivalents, and substitutes included in the spirit and scope of the present invention. In describing each drawing, similar reference numerals have been used for similar elements.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. Terms such as first, second, A, and B may be used to describe various elements, but the elements should not be limited by the terms. These terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element. The term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present application, terms such as "comprise" or "have" are intended to designate the presence of features, numbers, steps, actions, components, parts, or combinations thereof described in the specification, but one or more other features. It is to be understood that the presence or addition of elements or numbers, steps, actions, components, parts, or combinations thereof, does not preclude in advance.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this application. Does not.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.1 is a conceptual diagram of a method and apparatus for predicting time series based on past prediction data according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치는, 미리 학습되어 생성한 시계열 예측 모델(10), 시계열 예측 모델(10)에서 예측한 예측 데이터들과 실제 데이터들을 저장하는 예측 데이터 DB(20) 및/또는 예측 데이터 DB(20)에서 얻은 과거 데이터를 기반으로 시계열 예측 모델(10)에 의해 출력된 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 출력하는 예측 데이터 조정기(30)로 구성될 수 있다.Referring to FIG. 1, a time series prediction method and apparatus based on past prediction data according to an embodiment of the present invention includes a time
시계열 예측 모델(10)은 시계열 데이터를 학습하여 미래에 발생할 수 있는 결과 데이터를 예측하는 수학적 모델로서, autoregressive(AR) 모델, integrated(I) 모델, moving average(MA) 모델 등이 있을 수 있다. 이러한 시계열 예측 모델(10)은 머신 러닝(machine learning), LSTM(Long short-term memory) 등을 비롯한 다양한 학습 방법을 이용해 LSTM(Long short-term memory) 등과 같은 머신 러닝(machine learning) 알고리즘에 기반하여 각종 실제 데이터(또는 관측되거나 측정된 데이터)들을 학습하여 생성될 수 있다. 이때, 실제 데이터는 예측 대상 환경(05)에서 관측되거나 측정된 데이터들일 수 있다. 예를 들어, 예측 대상 환경(05)이 발전소인 경우, 실제 데이터는 발전소의 전력 생산량, 날씨 등일 수 있다.The time
따라서, 시계열 예측 모델(10)은, 이러한 각종 실제 데이터들을 입력 데이터로서 수신하여 현재 시점에서 미래의 특정 시간이나 시점을 예측한 1차 예측 데이터를 출력할 수 있다. 이때, 입력 데이터는 다양한 데이터 형태를 가질 수 있다. 예를 들어, 시계열 예측 모델(10)에 대한 입력 데이터는 임의의 n차원의 시계열 데이터이거나 지난 K개의 시간 단위(시, 분, 일 등) 동안 측정 또는 수집된 시계열 데이터일 수 있다. 또한, 시계열 예측 모델(10)의 출력 데이터에 해당하는 1차 예측 데이터는, 현재 시점에서 향후 특정 시간 단위 동안의 결과를 예측한 데이터일 수 있다.Accordingly, the time
구체적으로 예를 들면, 시계열 예측 모델(10)은 지난 3시간 동안의 날씨에 따른 발전량을 입력 데이터로 활용하여, 현재 시점부터 향후 한시간 동안 생산할 것으로 예상되는 발전량을 예측할 수 있다.Specifically, for example, the time
본 발명의 일 실시예에서 시계열 예측 모델(10)은 특정 형태나 방식으로 제한하여 해석되지 않으며, 다양한 형식과 알고리즘으로 구현된 임의의 시계열 예측 모델이 모두 포함될 수 있다.In an embodiment of the present invention, the time
또한, 시계열 예측 모델(10)에 의해 예측 대상 환경(05)에 대해 예측된 1차 예측 데이터들과 예측 대상 환경(05)에서 측정 또는 관측하여 획득한 실제 데이터는 별도로 구축된 예측 데이터 DB(20)에 저장되어 관리될 수 있다. 따라서, 예측 데이터 DB(20)는 시계열 예측 모델(10)에 의해 미래 특정 시점이나 기간에 대해 1차적으로 예측된 결과들 및 예측한 시점이나 기간에서의 실제 데이터를 축적하여 저장하고, 예측 데이터 조정기(30)에서 요구하는 과거 데이터를 제공할 수 있다. In addition, the first prediction data predicted for the
예를 들어, 예측 데이터 DB(20)에 저장되고 관리되는 데이터는 다음의 표 1과 같을 수 있다.For example, data stored and managed in the
상기 표 1을 참조하면, 예측 데이터 DB(20)에는, 저장된 데이터의 출처(Source), 관측 또는 예측이 수행된 시간 구간(Time index), 시간 구간에 따른 예측 데이터(Forecast value, 1차 예측 데이터일 수 있고, 과거 예측 데이터로 지칭될 수도 있음), 시간 구간에 따른 실제 데이터(True value, 예측 대상 환경에서 실제로 수집한 데이터 또는 과거 실제 데이터로 지칭될 수 있음), 시간 구간에 대한 각종 추가 데이터(Additional data1, Additional data2)등이 필드(field)로서, 저장될 수 있다. 추가 데이터는 예측 타겟 지표 이외의 데이터들로서 전력 생산량을 예측할 경우 전력 생산량 이외의 날씨, 노후도 등일 수 있다. Referring to Table 1, in the
또한, 출처는 예측 데이터 또는 실제 데이터를 획득한 예측 대상 환경을 나타내는 식별기호일 수 있다. 예를 들어, 시계열 예측 모델을 적용하고자 하는 예측 대상 환경이나 예측 대상 환경과 유사한 환경을 출처로 갖는 데이터가 예측 데이터 DB(20)에 저장될 수 있다.In addition, the source may be an identification symbol indicating the prediction target environment from which the prediction data or actual data is obtained. For example, data having a prediction target environment to which the time series prediction model is to be applied or an environment similar to the prediction target environment as a source may be stored in the
예측 데이터 조정기(30)는, 예측 데이터 DB에서 제공받은 과거 데이터를 기반으로 시계열 예측 모델에 의해 출력된 1차 예측 데이터를 보정하여 최종 예측 데이터를 출력할 수 있다. 여기서 과거 데이터는 시계열 예측 모델(10)이 과거 특정 시점에서 미래의 시점이나 시간에 대해 예측한 과거 예측 데이터이거나, 과거 특정 시점에서 측정 또는 수집하거나 관찰한 과거 실제 데이터일 수 있다. 또한, 과거 데이터는 과거 예측 데이터들 또는 과거 실제 데이터들 중에서 시계열 예측 모델에 의해 예측된 1차 예측 데이터와 관련성이 높은 데이터일 수 있다.The
한편, 시계열 예측 모델(10), 예측 데이터 조정기(30)는 전술한 기능이나 동작을 수행하는 소프트웨어 모듈이나 명령어로서 구현될 수 있다. 또한, 예측 데이터 DB(20)는 전술한 데이터들을 저장하고 관리하는 하드웨어 저장소, 데이터 서버, 클라우드 서버 등으로 구현될 수 있다.Meanwhile, the time
도 2는 본 발명의 일 실시예에 따른 과거 예측 데이터를 추출하는 방법에 대한 개념도이다.2 is a conceptual diagram illustrating a method of extracting past prediction data according to an embodiment of the present invention.
도 1에서 설명한 것과 같이 본 발명의 일 실시예에 따른 예측 데이터 조정기(30)는, 예측 데이터 DB(20)에 저장된 과거 데이터를 추출하고, 추출된 과거 데이터를 이용하여 시계열 예측 모델의 1차 예측 데이터를 보정할 수 있다.As described in FIG. 1, the
여기서, 예측 데이터 DB(20)에서 추출되는 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터와 유사한 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터와 일정한 기준 범위값내에 속하거나 또는 1차 예측 데이터에 대해 일정한 비율 범위내에 내에 속하는 데이터일 수 있다.Here, the past data extracted from the
또한, 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터가 도출된 현재 시점을 기준으로 결정되는 시간 구간에 속하는 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터가 도출된 현재 시점이 속하는 시간 구간 또는 현재 시점부터 일정한 시간 범위 내에 위치한 데이터일 수 있다. 더욱 구체적으로 예를 들면, 오후 12시의 전력 생산량을 예측한 경우라면 과거 오후 12시에 수집하였던 과거 실제 데이터이거나, 과거 오후 12시에 예측하였던 과거 예측 데이터가 과거 데이터로서 추출될 수 있다.In addition, the past data may be data belonging to a time interval determined based on a current time point from which primary prediction data according to a time series prediction model is derived. For example, the past data may be a time section in which the current time point from which the primary prediction data is derived belongs or data located within a certain time range from the current time point. More specifically, for example, in the case of predicting the amount of electricity produced at 12 pm, past actual data collected at 12 pm or past prediction data predicted at 12 pm may be extracted as past data.
또한, 과거 데이터는, 시계열 예측 모델이 현재 적용되는 예측 대상 환경을 기준으로 결정되는 데이터일 수 있다. 예를 들어, 과거 데이터는, 예측 대상 환경과 유사한 환경에서 수집되거나 예측한 적이 있는 데이터일 수 있다. Also, the past data may be data determined based on a prediction target environment to which the time series prediction model is currently applied. For example, the past data may be data that has been collected or predicted in an environment similar to the environment to be predicted.
과거 데이터는, 예측 데이터 DB(20)에 포함된 모든 필드(표 1에 따른 필드 참조) 또는 일부 필드를 포함할 수도 있다. 예를 들어, 과거 데이터는, 시간 구간, 과거 예측 데이터, 과거 실제 데이터를 포함할 수 있다.The past data may include all fields (refer to fields according to Table 1) or some fields included in the
또한, 과거 데이터는, 예측 데이터 DB(20)에 포함된 과거 데이터 중에서 무작위로 선택된 데이터일 수도 있다.Also, the past data may be randomly selected data from past data included in the
예측 데이터 DB(20)에서 추출되는 과거 데이터의 개수는 동적으로 결정될 수 있다. 예를 들어, 최근 예측 결과를 고려하여 과거 데이터의 개수를 동적으로 결정할 수 있다. 구체적으로, 특정한 이벤트가 발생한 것으로 판단되면, 과거 데이터의 개수를 증가 또는 감소시킬 수 있다. 또한, 시계열 예측 모델이 적용되는 예측 대상 환경에 기초하여 과거 데이터의 개수가 결정될 수 있다. 예를 들어, 예측 대상 환경이, 급작스러운 이벤트가 거의 없는 환경에 해당하는 경우, 많은 수의 과거 데이터를 전처리기(40)에 입력할 수 있다. 또한, 예측 대상 환경이 급작스러운 이벤트가 빈번한 환경에 해당하는 경우, 적은 수의 과거 데이터(또는 현재 시점을 기준으로 매우 가까운 시간 간격 내에 속하는 데이터)를 전처리기(40)에 입력할 수 있다. 이처럼, 급작스러운 이벤트가 빈번한 환경에서 예측하는 경우, 매우 짧은 시간 동안의 과거 데이터를 사용함으로써 급작스러운 이벤트로 인한 급격한 변동 사항을 신속하게 예측에 반영할 수 있다.The number of past data extracted from the
한편, 위와 같이 결정된 과거 데이터는 그대로 도 1에 따른 1차 예측 데이터를 예측 데이터 조정기(30)에서 보정하는 데 사용될 수도 있고, 도 2에서와 같이 전처리기(40)를 통해 전처리된 후 예측 데이터 조정기(30)에서 사용될 수 있다. 예를 들어, 전처리기(40)는, 과거 데이터를 일정한 기준에 따라 정렬하고, 정렬된 데이터의 일부를 선정하여 예측 데이터 조정기(30)에 제공할 수 있다. 또한, 전처리기(40)는, 예측 데이터 DB(20)에서 서로 다른 갯수의 시간 구간에 속하는 과거 실제 데이터를 동시에 추출하고, 추출된 과거 실제 데이터들 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 예를 들어, 과거 1000개의 시간 구간에 속하는 과거 실제 데이터를 추출하고, 그와 동시에 과거 10개의 시간 구간에 속하는 과거 실제 데이터를 추출한 후, 추출된 데이터들을 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 여기서 도출된 하나의 과거 실제 데이터가 예측 데이터 조정기(30)에 전달될 수 있다.Meanwhile, the past data determined as described above may be used to correct the primary prediction data according to FIG. 1 as it is in the
상술한 과정을 통해 전처리되거나 결정된 과거 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를 보정하는 데 사용될 수 있다. 이하에서는 과거 데이터를 이용하여 1차 예측 데이터를 보정하는 방법에 대하여 상술한다.Past data preprocessed or determined through the above-described process may be used to correct primary prediction data according to a time series prediction model. Hereinafter, a method of correcting primary prediction data using past data will be described in detail.
도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다. 도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다. 도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.3 is a conceptual diagram of a first method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention. 4 is a conceptual diagram of a second method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention. 5 is a conceptual diagram of a third method of correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
도 1을 다시 참조하면, 본 발명의 일 실시예에 따른 최종 예측 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를, 예측 데이터 DB에서 획득한 과거 데이터를 이용하여 보정함으로써 도출될 수 있다. 이때, 예측 데이터 조정기(30)가 최종 예측 데이터를 도출하는 방법으로는 도 3에 따른 제1 방법, 도 4에 따른 제2 방법, 도 5에 따른 제3 방법을 고려할 수 있다.Referring again to FIG. 1, final prediction data according to an embodiment of the present invention may be derived by correcting primary prediction data according to a time series prediction model using past data obtained from a prediction data DB. In this case, as a method for the
먼저 도 3을 참조하면, 예측 데이터 DB 에서 추출한 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 도출하고, 보정된 과거 실제 데이터로부터 최종 예측 데이터를 도출할 수 있다.First, referring to FIG. 3, corrected past actual data may be derived by correcting the past actual data extracted from the prediction data DB, and final predicted data may be derived from the corrected past actual data.
예를 들어, 보정된 과거 실제 데이터는 다음의 수학식 1과 같이 결정될 수 있다.For example, the corrected past actual data may be determined as in
상기 수학식 1을 참조하면, 보정된 과거 실제 데이터는, 과거 실제 데이터에 보정치(수학식 1의 괄호 부분)를 더함으로써 도출될 수 있다. 여기서 보정치는 1차 예측 데이터와 과거 예측 데이터를 이용한 연산으로 결정될 수 있다. 또한, 수학식 1에서 각 데이터들에 대한 계수들(α,β,γ)은 가중치로서 사용자의 설정에 따라 변경될 수 있다.Referring to
따라서, 수학식 1에 따라 보정된 과거 실제 데이터가 도출되면, 과거 실제 데이터를 이용하여 최종 예측 데이터를 도출할 수 있다. 예를 들어, 보정된 과거 실제 데이터들의 평균값 또는 가중 평균값을 산출하여 최종 예측 데이터로 사용할 수 있다.Accordingly, when the corrected past actual data is derived according to
도 4를 참조하면, 예측 데이터 DB 에서 추출한 과거 데이터에서 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 도출할 수 있다.Referring to FIG. 4, final prediction data may be derived by calculating a past prediction error from past data extracted from a prediction data DB, and correcting primary prediction data using the calculated past prediction error.
먼저, 과거 예측 오차는 다음의 수학식 2와 같이 결정될 수 있다.First, the past prediction error may be determined as in
수학식 2를 참조하면, 과거 예측 오차는 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 의해 결정될 수 있다. 이때, 과거 실제 데이터와 과거 예측 데이터에는 각각 가중치(α,β)가 부여될 수 있다. 수학식 2에 따라 현재 시점과 동일하거나 유사한 시간 구간 등에서 과거 예측 오차들을 산출하고, 산출된 과거 예측 오차들의 평균 또는 가중 평균을 산출하여 최종적으로 과거 예측 오차로 사용할 수 있다. Referring to
다음으로, 과거 예측 오차를 이용하여 1차 예측 데이터는 다음의 수학식 3과 같이 보정될 수 있다.Next, the first prediction data may be corrected by using the past prediction error as shown in Equation 3 below.
수학식 3을 참조하면, 1차 예측 데이터에 과거 예측 오차를 더함으로써 오차 보정 예측 데이터를 도출할 수 있고, 이러한 오차 보정 예측 데이터가 최종 예측 데이터로 사용될 수 있다.Referring to Equation 3, error correction prediction data may be derived by adding past prediction errors to primary prediction data, and such error correction prediction data may be used as final prediction data.
도 5를 참조하면, 수학식 1에 따른 보정된 과거 실제 데이터 및 수학식 3에 따른 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 최종 예측 데이터를 결정할 수도 있다.Referring to FIG. 5, final predicted data may be determined by additionally applying a Kalman filter technique to corrected past actual data according to
이때, 칼만 필터 기법은 두개의 가우시안 함수를 서로 곱하여 하나의 가우시안 함수를 도출하므로, 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차를 산출할 필요가 있다.In this case, since the Kalman filter technique multiplies two Gaussian functions to derive one Gaussian function, it is necessary to calculate a standard deviation for each of the corrected past actual data and the error-corrected predicted data according to Equation 3.
여기서, 수학식 1에 따른 보정된 과거 실제 데이터에 대한 표준 편차는, 시계열 예측 모델로부터 제공받을 수도 있고, 시계열 예측 모델에서 제공하는 예측 구간을 표준 편차로 변형하여 얻을 수도 있으며, 과거 예측 데이터의 분포를 기반으로 직접 산출될 수도 있다.Here, the standard deviation of the corrected past actual data according to
또한, 수학식 3에 따른 오차 보정 예측 데이터에 대한 표준 편차는, 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 대하여 특정 백분위수(percentile)에 해당하는 값일 수도 있고, 과거 예측 데이터와 실제 예측 데이터 사이의 최대 차분값일 수일 수도 있으며, 과거 실제 데이터의 분포를 기반으로 직접 산출될 수도 있다.In addition, the standard deviation of the error correction predicted data according to Equation 3 may be a value corresponding to a specific percentile with respect to the difference between the past actual data and the past predicted data, or the past predicted data and the actual predicted data. It may be the number of maximum difference values, or may be directly calculated based on the distribution of actual data in the past.
수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차가 산출되면, 산출된 표준 편차들 및 수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터를 이용하여 하나의 평균과 표준 편차를 도출할 수 있다. 이때 최종적으로 도출되는 하나의 평균값이 칼만 필터 기법에 따른 최종 예측 데이터로 사용될 수 있다.When the standard deviation is calculated for each of the corrected past actual data according to
도 5를 참조하면, 도 1에 따른 예측 데이터 조정기(30)가 과거 실제 데이터와 과거 예측 데이터를 이용하여 보정된 과거 실제 데이터 및 오차 보정 예측 데이터를 산출하고, 산출된 데이터들 각각에 대한 표준편차까지 산출한 후 칼만 필터(31)에 따른 평균값을 도출하여 최종 예측 데이터로 사용하는 경우를 확인할 수 있다.Referring to FIG. 5, the predicted
도 3 내지 도 5에서 도시하지는 않았으나, 과거 예측 DB(20)에서 추출되는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 기준 및 개수는 도 2에 따른 방법들이 적용될 수 있는 것으로 해석되어야 한다.Although not shown in FIGS. 3 to 5, the criteria and number of extracting past prediction data or past actual data extracted from the
도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.6 is an exemplary diagram for explaining a process of generating prediction data for
도 6에서 예측 데이터 DB(20)는 제1 지역(site 1)에서 수집하고 예측하였던 데이터들로 구성될 수 있고, 시계열 예측 모델(10)도 제1 지역(site 1)에서 학습한 모델일 수 있다. 이러한 전제에서 제2 지역(site)에 대한 시계열 예측을 수행하는 경우를 고려할 수 있다.In FIG. 6, the
예를 들어, 제1 지역은 영암 지역에 설치된 99KWp 용량의 태양광 발전소이고, 제2 지역은 제1 지역과 거리가 인접하고 기후가 유사한 장흥에 설치되고 제1 지역과 동일한 용량(99KWp) 또는 제1 지역과 다른 용량(200KWp)의 태양광 발전소일 수 있다.For example, the first area is a solar power plant with a capacity of 99 KWp installed in the Yeongam area, and the second area is installed in Jangheung, which has a close distance from the first area and has a similar climate, and has the same capacity as the first area (99 KWp) or It may be a solar power plant with a capacity (200 KWp) different from that of 1 area.
이처럼 제1 지역에서 수집하고 예측한 데이터베이스와 모델을 사용하여 제2 지역(site 2)에 대한 예측 데이터를 생성하고자 할 경우, 초기에는 제1 지역에서 수집된 데이터만을 이용하여 예측 데이터 조정기가 1차 예측 데이터를 조정하게 되므로 제2 지역에 따른 특성이 정확하게 반영되지 않을 수 있다. In this way, if you want to generate prediction data for the second area (site 2) by using the database and model collected and predicted in the first area, the predictive data adjuster will initially use only the data collected in the first area. Since the predicted data is adjusted, characteristics according to the second region may not be accurately reflected.
다만, 예측이 지속적으로 진행될수록 예측 데이터 DB에는 제2 지역에서 수집된 과거 데이터가 포함될 수 있다. 즉, 예측 데이터 DB에는 제1 지역에서 수집된 과거 데이터와 제2 지역에서 수집된 과거 데이터를 모두 포함할 수 있다. 따라서, 시간이 지남에 따라 제2 지역에서 수집된 과거 데이터가 많아지므로 제2 지역에 대하여 더욱 예측 정확도가 높아지게 될 수 있다.However, as the prediction continues, the prediction data DB may include past data collected in the second area. That is, the prediction data DB may include both past data collected in the first area and past data collected in the second area. Accordingly, as time passes, the number of historical data collected in the second area increases, and thus the prediction accuracy for the second area may be further increased.
또한, 제2 지역에서 충분한 과거 데이터가 수집되면, 제2 지역에서 수집된 과거 데이터만을 사용하여 1차 예측 데이터를 보정할 수 있다. 즉, 제2 지역에서 수집된 과거 데이터만을 이용함으로써 1차 예측 데이터의 보정을 통한 최종 예측 데이터의 정확도가 향상될 수 있다.In addition, when sufficient past data is collected in the second area, the first prediction data may be corrected using only the past data collected in the second area. That is, by using only past data collected in the second area, accuracy of final prediction data may be improved through correction of the primary prediction data.
전술한 과정과는 달리, 제1 지역에서 수집한 예측 데이터 DB 및 제1 지역에서 학습한 시계열 예측 모델을 사용하지 않고, 제2 지역에서 수집하고 학습한 예측 데이터 DB와 시계열 예측 모델을 사용하는 것도 가능하다.Unlike the above process, the prediction data DB collected in the first area and the time series prediction model learned in the first area are not used, but the prediction data DB collected and learned in the second area and the time series prediction model are also used. It is possible.
도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.7 is a graph showing the result of applying the time series prediction model learned in the first region to a second region belonging to a climate environment similar to that of the first region but having different power generation performance.
도 7을 참조하면, 제1 지역(또는 제1 발전소)에 기반하여 학습된 시계열 예측 모델을, 제1 지역과 유사한 기후 환경에 속하지만 30% 정도 생산 성능이 낮은 제2 지역(또는 제2 발전소)에 적용한 경우의 결과를 확인할 수 있다.Referring to FIG. 7, a time series prediction model learned based on a first region (or a first power plant) is a second region (or a second power plant) that belongs to a climate environment similar to that of the first region, but has a low production performance of about 30%. ), you can check the results.
도 7에서 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 7,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of
제1 지역에서 학습된 시계열 예측 모델을 제2 지역에 그대로 적용하는 경우, not adjusted 결과가 보여주는 것처럼 유사한 기후 환경을 보일지라도 생산 성능의 차이로 인하여 실제 전력 생산량(TURE)과 큰 오차가 발생하는 것을 볼 수 있다.When the time-series prediction model learned in the first region is applied to the second region as it is, it is observed that a large error from the actual power generation (TURE) occurs due to the difference in production performance, even if a similar climate environment is shown as the result of not adjusted can see.
반면, 본 발명의 일 실시예에 따라 제2 지역의 과거 데이터에 기반하여 시계열 예측 모델의 1차 예측 데이터를 보정하는 경우, 데이터가 충분하지 않은 초기(time index 값 5정도 까지)에는 어느 정도 오차가 있지만, 제2 지역의 데이터가 점차 확보되어감에 따라 최종 예측 데이터(Adjusted)가 실제 전력 생산량(TURE)과 큰 오차를 보이지 않는 것을 볼 수 있다.On the other hand, in the case of correcting the primary prediction data of the time series prediction model based on the past data of the second area according to an embodiment of the present invention, there is an error to some extent when the data is insufficient (up to a time index value of about 5). However, it can be seen that as the data of the second area is gradually secured, the final predicted data (Adjusted) does not show a large error with the actual power generation amount (TURE).
도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.8 is a graph showing a result of applying a time series prediction model learned in a first region where power generation performance gradually decreases to a first region.
도 8을 참조하면, 시계열 예측 모델이 학습된 지역과 적용된 지역은 동일하지만 점차 해당 지역의 환경이 변화되는(또는 노후화되어 생산 성능이 최대 30% 감소) 경우에 대하여 예측 결과를 확인할 수 있다. Referring to FIG. 8, a prediction result can be confirmed for a case in which the region from which the time series prediction model is trained and the region to which the time series prediction model is trained and applied is the same, but the environment of the region is gradually changed (or the production performance is reduced by up to 30% due to aging).
도 8에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 8,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of
먼저, 보정되지 않은 1차 예측 데이터의 경우 시간이 지남에 따라 실제 데이터(TRUE)와의 오차가 증가하는 것을 확인할 수 있다.First, it can be seen that in the case of uncorrected primary prediction data, an error with the actual data TRUE increases over time.
반면, 본 발명의 일 실시예에 따른 1차 예측 데이터의 보정을 수행하여 도출한 최종 예측 데이터는 시간이 지남에 따른 노후화까지 반영할 수 있어 예측 오차가 거의 발생하지 않는 것을 확인할 수 있다.On the other hand, the final prediction data derived by performing correction of the primary prediction data according to an embodiment of the present invention can reflect even deterioration over time, and thus it can be seen that a prediction error hardly occurs.
도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.9 is a graph showing a result of applying a time series prediction model learned in a first region having a sudden environmental change to a first region.
도 9에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 9,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of
예를 들어, 도 9에서는 제1 지역에 따른 태양광 발전소에서 눈이나 그림자 등과 같이 갑작스레 발생하여 발전 성능을 저해하는 경우에 대한 예측 성능을 확인할 수 있다.For example, in FIG. 9, prediction performance for a case in which power generation performance is impaired by sudden occurrence such as snow or shadow in a solar power plant according to the first region can be confirmed.
도 9를 참조하면, time index의 11 ~ 40에 해당하는 시점들에서 갑작스런 외부 요인으로 실제 발전량(TURE)이 감소하여, 발전 성능이 30% 정도 저하된 경우를 확인할 수 있다.Referring to FIG. 9, it can be seen that the actual power generation (TURE) decreases due to a sudden external factor at the time points corresponding to 11 to 40 of the time index, and the power generation performance decreases by about 30%.
급작스런 요인으로 성능 저하가 이루어졌을 때, 시계열 예측 결과가 보정되지 않은 경우(Not Adjusted)를 살펴보면, 실제 발전량과의 예측 오차가 크게 유지되다가 발전 성능이 복귀된 후에야 예측 오차가 다시 줄어드는 것을 볼 수 있다.Looking at the case that the time series prediction result is not corrected (Not Adjusted) when the performance deteriorates due to an abrupt factor, it can be seen that the prediction error with the actual power generation is maintained large and the prediction error decreases again only after the power generation performance is restored .
그러나, 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정한 최종 데이터는, 급작스런 성능 저하 초기에는 보정하지 않은 경우와 유사하게 오차가 크지만 점차 오차가 줄어드는 것을 볼 수 있다. 또한, 발전 성능이 복귀된 후에도 큰 오차없이 예측 결과를 도출하는 것을 볼 수 있다. 이처럼, 예측 대상 환경에서 급작스런 변화가 초래되는 경우, 이러한 변화를 빠르고 정확하게 예측 결과로 반영할 수 있도록, 보정에 사용되는 과거 데이터를 최근 단기간의 데이터로 사용하거나 적은 개수로 사용할 수 있다.However, it can be seen that the final data corrected by using the past data according to an embodiment of the present invention has a large error similar to the case not corrected in the early stage of sudden performance degradation, but gradually decreases the error. . In addition, it can be seen that even after the power generation performance is restored, prediction results are derived without significant errors. As described above, when a sudden change occurs in the environment to be predicted, the past data used for correction may be used as data for the recent short term or in a small number so that such change may be quickly and accurately reflected as a prediction result.
도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.10 is a representative flowchart of a method for predicting time series based on past data according to an embodiment of the present invention.
도 10을 참조하면, 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계(S100), 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계(S110), 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계(S120) 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계(S130)를 포함할 수 있다.Referring to FIG. 10, the method of predicting a time series based on past data includes: obtaining actual data observed in a prediction target environment (S100), inputting the obtained actual data into a pre-trained time series prediction model (S110), Acquiring the first prediction data predicted by the time series prediction model (S120) and correcting the first prediction data using past data extracted from a prediction data DB (database), thereby obtaining final prediction data ( S130) may be included.
상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The time series prediction method based on past data may further include storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.Acquiring the final prediction data (S130) may include extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data that is adjacent to the current prediction time and belongs to a short time interval may be extracted.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.Acquiring the final predicted data (S130) may include correcting the past actual data to obtain corrected past actual data.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.In the step of obtaining the final prediction data (S130), obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error It may include.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data (S130) may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data. have.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.
도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.11 is a hardware configuration diagram of a time series prediction apparatus based on past data according to an embodiment of the present invention.
도 11을 참조하면, 과거 데이터에 기초한 시계열 예측 장치(100)는, 적어도 하나의 프로세서(processor, 110); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 120)를 포함할 수 있다.Referring to FIG. 11, the
여기서 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.Here, the at least one
또한, 과거 데이터에 기초한 시계열 예측 장치(100)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver)(130)를 포함할 수 있다. 또한, 과거 데이터에 기초한 시계열 예측 장치(100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150), 저장 장치(160) 등을 더 포함할 수 있다. 과거 데이터에 기초한 시계열 예측 장치(100)에 포함된 각각의 구성 요소들은 버스(bus)(170)에 의해 연결되어 서로 통신을 수행할 수 있다.In addition, the time
상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The at least one step may include obtaining actual data observed in a prediction target environment; Inputting the acquired real data into a pre-trained time series prediction model; Obtaining primary prediction data predicted by the time series prediction model; And obtaining final prediction data by correcting the primary prediction data using past data extracted from a prediction data database (DB).
상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The at least one step may further include storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data that is adjacent to the current prediction time and belongs to a short time interval may be extracted.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.
과거 데이터에 기초한 시계열 예측 장치(100)의 예를 들면, 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.Examples of the time
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.The methods according to the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the computer-readable medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of computer-readable media may include hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions may include high-level language codes that can be executed by a computer using an interpreter as well as machine language codes such as those produced by a compiler. The above-described hardware device may be configured to operate as at least one software module to perform the operation of the present invention, and vice versa.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다. In addition, the above-described method or apparatus may be implemented by combining all or part of its configuration or function, or may be implemented separately.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. Although the above has been described with reference to preferred embodiments of the present invention, those skilled in the art will variously modify and change the present invention within the scope not departing from the spirit and scope of the present invention described in the following claims. You will understand that you can do it.
Claims (20)
예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계;
획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계;
상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및
예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.A time series prediction method based on historical data,
Acquiring actual data observed in the environment to be predicted;
Inputting the acquired real data into a pre-trained time series prediction model;
Obtaining primary prediction data predicted by the time series prediction model; And
Comprising the step of obtaining final predicted data by correcting the primary predicted data using past data extracted from a predicted data database (DB).
상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 1,
The method of predicting a time series based on past data, further comprising storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계는,
상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 1,
Obtaining the final prediction data,
And extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 3,
Extracting the past data,
And extracting, from the prediction data DB, past prediction data or past actual data belonging to a range in which at least one of the first prediction data and numerical values, a current prediction time point, and a source are adjacent to each other.
상기 과거 데이터를 추출하는 단계는,
상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출하는, 과거 데이터에 기초한 시계열 예측 방법. In claim 3,
Extracting the past data,
When the prediction target environment is an environment in which there is a sudden change in environment, past data adjacent to the current prediction time and belonging to a short time interval are extracted.
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 3,
Extracting the past data,
Pre-processing the data extracted from the prediction data DB according to a predetermined criterion, a time series prediction method based on past data.
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 4,
Obtaining the final prediction data,
Comprising the step of obtaining corrected past actual data by correcting the past actual data, a time series prediction method based on past data.
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 7,
Obtaining the final prediction data,
And obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error.
상기 최종 예측 데이터를 획득하는 단계는,
상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.In claim 8,
Obtaining the final prediction data,
And obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
상기 시계열 예측 모델은,
상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습되는, 과거 데이터에 기초한 시계열 예측 방법.In claim 1,
The time series prediction model,
Time series prediction method based on past data, which is learned in advance in the same or similar environment as the prediction target environment.
적어도 하나의 프로세서(processor); 및
상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함하고,
상기 적어도 하나의 단계는,
예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계;
획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계;
상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및
예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.As a time series prediction device based on past data,
At least one processor; And
Including a memory (memory) for storing instructions (instructions) instructing the at least one processor to perform at least one step,
The at least one step,
Acquiring actual data observed in the environment to be predicted;
Inputting the acquired real data into a pre-trained time series prediction model;
Obtaining primary prediction data predicted by the time series prediction model; And
Comprising the step of obtaining final prediction data by correcting the primary prediction data using past data extracted from a prediction data DB (database).
상기 적어도 하나의 단계는,
상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 11,
The at least one step,
The time series prediction apparatus based on past data, further comprising storing the actual data in the prediction data DB.
상기 최종 예측 데이터를 획득하는 단계는,
상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 11,
Obtaining the final prediction data,
And extracting the past data according to a predetermined criterion from the prediction data DB.
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 13,
Extracting the past data,
And extracting, from the prediction data DB, past prediction data or past actual data belonging to a range in which at least one of the first prediction data and numerical values, a current prediction time point, and a source are adjacent to each other.
상기 과거 데이터를 추출하는 단계는,
상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출하는, 과거 데이터에 기초한 시계열 예측 장치. In claim 13,
Extracting the past data,
When the prediction target environment is an environment in which there is a rapid environmental change, the time series prediction apparatus based on past data extracts past data that is adjacent to the current prediction time and belongs to a short time interval.
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 13,
Extracting the past data,
Pre-processing the data extracted from the prediction data DB according to a predetermined criterion, a time series prediction apparatus based on past data.
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 14,
Obtaining the final prediction data,
Comprising the step of obtaining corrected past actual data by correcting the past actual data, a time series prediction apparatus based on past data.
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 17,
Obtaining the final prediction data,
And obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error.
상기 최종 예측 데이터를 획득하는 단계는,
상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.In claim 18,
Obtaining the final prediction data,
And obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
상기 시계열 예측 모델은,
상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습되는, 과거 데이터에 기초한 시계열 예측 장치.In claim 11,
The time series prediction model,
A time series prediction apparatus based on past data that is learned in advance in an environment that is the same as or similar to the prediction target environment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190096448A KR102468316B1 (en) | 2019-08-08 | 2019-08-08 | Time series prediction method and apparatus based on past prediction data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190096448A KR102468316B1 (en) | 2019-08-08 | 2019-08-08 | Time series prediction method and apparatus based on past prediction data |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210017342A true KR20210017342A (en) | 2021-02-17 |
KR102468316B1 KR102468316B1 (en) | 2022-11-17 |
Family
ID=74731561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190096448A KR102468316B1 (en) | 2019-08-08 | 2019-08-08 | Time series prediction method and apparatus based on past prediction data |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102468316B1 (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220076748A (en) * | 2020-12-01 | 2022-06-08 | 주식회사 동녘 | Method for generating weather prediction information and computing device for executing the method |
KR20220159006A (en) * | 2021-05-25 | 2022-12-02 | 인하대학교 산학협력단 | Method and Apparatus for Prediction of Time Series Data Prediction using a Hybrid Model of Combining LSTM and Order-Preserving Pattern Matching |
KR20230022486A (en) * | 2021-08-09 | 2023-02-16 | 배재대학교 산학협력단 | Filtering and performance comparison system and method for correcting error values of time series data |
KR102500534B1 (en) * | 2022-06-02 | 2023-02-16 | 국민대학교산학협력단 | Recurrent neural network based water resource information generating device and method |
KR102612561B1 (en) * | 2022-10-13 | 2023-12-11 | 디아이랩 주식회사 | Apparatus for detecting data error of IoT sensor based on artificial intelligence and method therefor |
KR102623020B1 (en) * | 2023-09-11 | 2024-01-10 | 주식회사 슈파스 | Method, computing device and computer program for early predicting septic shock through bio-data analysis based on artificial intelligence |
CN117992759A (en) * | 2024-04-07 | 2024-05-07 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | Dam monitoring method and system based on remote sensing data |
CN117992810A (en) * | 2024-04-02 | 2024-05-07 | 洛阳鹏飞建设工程有限公司 | Road and bridge intensity detection device |
KR102712065B1 (en) * | 2023-12-21 | 2024-09-30 | 주식회사 알고리고 | AI-based real-time energy management system for high energy efficiency in logistics centers based on the accuracy of forecast data |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109150A (en) * | 2000-09-28 | 2002-04-12 | Fuji Electric Co Ltd | Method for adaptively predicting time series data |
JP2006092106A (en) * | 2004-09-22 | 2006-04-06 | Canon System Solutions Inc | Prediction device, prediction method and program |
KR20140068436A (en) * | 2012-11-28 | 2014-06-09 | 한국지질자원연구원 | Abnormality observation data detection method using time series prediction model and abnormality observation data of ground water level |
-
2019
- 2019-08-08 KR KR1020190096448A patent/KR102468316B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109150A (en) * | 2000-09-28 | 2002-04-12 | Fuji Electric Co Ltd | Method for adaptively predicting time series data |
JP2006092106A (en) * | 2004-09-22 | 2006-04-06 | Canon System Solutions Inc | Prediction device, prediction method and program |
KR20140068436A (en) * | 2012-11-28 | 2014-06-09 | 한국지질자원연구원 | Abnormality observation data detection method using time series prediction model and abnormality observation data of ground water level |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220076748A (en) * | 2020-12-01 | 2022-06-08 | 주식회사 동녘 | Method for generating weather prediction information and computing device for executing the method |
KR20220159006A (en) * | 2021-05-25 | 2022-12-02 | 인하대학교 산학협력단 | Method and Apparatus for Prediction of Time Series Data Prediction using a Hybrid Model of Combining LSTM and Order-Preserving Pattern Matching |
KR20230022486A (en) * | 2021-08-09 | 2023-02-16 | 배재대학교 산학협력단 | Filtering and performance comparison system and method for correcting error values of time series data |
KR102500534B1 (en) * | 2022-06-02 | 2023-02-16 | 국민대학교산학협력단 | Recurrent neural network based water resource information generating device and method |
KR102612561B1 (en) * | 2022-10-13 | 2023-12-11 | 디아이랩 주식회사 | Apparatus for detecting data error of IoT sensor based on artificial intelligence and method therefor |
KR102623020B1 (en) * | 2023-09-11 | 2024-01-10 | 주식회사 슈파스 | Method, computing device and computer program for early predicting septic shock through bio-data analysis based on artificial intelligence |
KR102712065B1 (en) * | 2023-12-21 | 2024-09-30 | 주식회사 알고리고 | AI-based real-time energy management system for high energy efficiency in logistics centers based on the accuracy of forecast data |
CN117992810A (en) * | 2024-04-02 | 2024-05-07 | 洛阳鹏飞建设工程有限公司 | Road and bridge intensity detection device |
CN117992810B (en) * | 2024-04-02 | 2024-06-04 | 洛阳鹏飞建设工程有限公司 | Road and bridge intensity detection device |
CN117992759A (en) * | 2024-04-07 | 2024-05-07 | 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) | Dam monitoring method and system based on remote sensing data |
Also Published As
Publication number | Publication date |
---|---|
KR102468316B1 (en) | 2022-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210017342A (en) | Time series prediction method and apparatus based on past prediction data | |
US20200302540A1 (en) | Applying a trained model to predict a future value using contextualized sentiment data | |
CN109214436A (en) | A kind of prediction model training method and device for target scene | |
CN109816221A (en) | Decision of Project Risk method, apparatus, computer equipment and storage medium | |
CN111091196B (en) | Passenger flow data determination method and device, computer equipment and storage medium | |
CN112232495B (en) | Prediction model training method, device, medium and computing equipment | |
US20120253945A1 (en) | Bid traffic estimation | |
US20220407352A1 (en) | Spatio-temporal probabilistic forecasting of wind power output | |
JP2017142781A (en) | Random quotation and sudden change prediction | |
US20110113009A1 (en) | Outlier data point detection | |
KR102330423B1 (en) | Online default forecasting system using image recognition deep learning algorithm | |
CN108681751B (en) | Method for determining event influence factors and terminal equipment | |
CN115082920A (en) | Deep learning model training method, image processing method and device | |
US20240119265A1 (en) | Koopman Neural Forecaster for Time Series with Temporal Distribution Shifts | |
US11599746B2 (en) | Label shift detection and adjustment in predictive modeling | |
CN112668238B (en) | Rainfall processing method, rainfall processing device, rainfall processing equipment and storage medium | |
CN110929849B (en) | Video detection method and device based on neural network model compression | |
CN113052063A (en) | Confidence threshold selection method, device, equipment and storage medium | |
Dorado-Moreno et al. | Ordinal multi-class architecture for predicting wind power ramp events based on reservoir computing | |
EP3518152A1 (en) | Information processing method and information processing system | |
KR101830090B1 (en) | System and method for optimizing portfolio, and executable digital media storing computational programs implementing the same | |
US20220076060A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
Binter | Applied probabilistic forecasting | |
Muschinski et al. | Predicting power ramps from joint distributions of future wind speeds | |
CN112784165A (en) | Training method of incidence relation estimation model and method for estimating file popularity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |