KR101982159B1 - 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법 - Google Patents
카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법 Download PDFInfo
- Publication number
- KR101982159B1 KR101982159B1 KR1020190051015A KR20190051015A KR101982159B1 KR 101982159 B1 KR101982159 B1 KR 101982159B1 KR 1020190051015 A KR1020190051015 A KR 1020190051015A KR 20190051015 A KR20190051015 A KR 20190051015A KR 101982159 B1 KR101982159 B1 KR 101982159B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- population
- floating population
- floating
- analysis
- Prior art date
Links
- 238000007667 floating Methods 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000004458 analytical method Methods 0.000 claims abstract description 71
- 238000004891 communication Methods 0.000 claims description 21
- 238000000691 measurement method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 238000000611 regression analysis Methods 0.000 abstract description 14
- 230000001419 dependent effect Effects 0.000 abstract description 10
- 238000010219 correlation analysis Methods 0.000 abstract description 8
- 238000005259 measurement Methods 0.000 abstract description 6
- 239000011159 matrix material Substances 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 abstract 1
- 238000010295 mobile communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003442 weekly effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/08—Access point devices
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명은 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법으로서, 더욱 상세하게는 상관분석, 회귀 분석, 피셀 알고리즘의 연동을 통해 실시간 유동 인구 데이터를 쉽고 빠르게 획득할 수 있는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법에 관한 것이다.
본 발명에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은 실시간 유동 인구 측정에 피셀 알고리즘을 적용함으로써 수 Km에 이르는 셀 단위의 위치 정보를 제공하는 기존 셀ID 방식보다 5배 이상 정밀한 정보제공이 가능할 뿐만 아니라 실시간(real time)으로 유동 인구 데이터를 쉽게 획득할 수 있으며, 일단위 활동인구, 일단위 성별/연령별 유입 인구, 일단위 시간대별 유입 인구, 일단위 시도별 유니크 인구, 일단위 시군구별 유니크 인구, 일단위 외국인 데이터, 일단위 시간별 OD(Origin-Destination) 매트릭스를 획득할 수 있고, 기초단위구역을 현행화할 수 있고, 도심 외의 지역은 기본 분석 단위의 그리드로 구축할 수 있으며, 고도화 사업에 부합하는 공간 단위 영역을 구축할 수 있을 뿐만 아니라 입지 유형 분류를 가장 잘 설명 할 수 있는 분석 반경과 상관 분석과 회귀 분석을 통해 유동 인구 산정을 위한 종속변수를 가장 잘 예측할 수 있는 독립변수를 추출할 수 있다.
본 발명에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은 실시간 유동 인구 측정에 피셀 알고리즘을 적용함으로써 수 Km에 이르는 셀 단위의 위치 정보를 제공하는 기존 셀ID 방식보다 5배 이상 정밀한 정보제공이 가능할 뿐만 아니라 실시간(real time)으로 유동 인구 데이터를 쉽게 획득할 수 있으며, 일단위 활동인구, 일단위 성별/연령별 유입 인구, 일단위 시간대별 유입 인구, 일단위 시도별 유니크 인구, 일단위 시군구별 유니크 인구, 일단위 외국인 데이터, 일단위 시간별 OD(Origin-Destination) 매트릭스를 획득할 수 있고, 기초단위구역을 현행화할 수 있고, 도심 외의 지역은 기본 분석 단위의 그리드로 구축할 수 있으며, 고도화 사업에 부합하는 공간 단위 영역을 구축할 수 있을 뿐만 아니라 입지 유형 분류를 가장 잘 설명 할 수 있는 분석 반경과 상관 분석과 회귀 분석을 통해 유동 인구 산정을 위한 종속변수를 가장 잘 예측할 수 있는 독립변수를 추출할 수 있다.
Description
본 발명은 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법으로서, 더욱 상세하게는 상관분석, 회귀 분석, 피셀 알고리즘의 연동을 통해 실시간 유동 인구 데이터를 쉽고 빠르게 획득할 수 있는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법에 관한 것이다.
최근 위치기반 이동통신 기술을 이용하여 상대방 위치파악 서비스, 교통 안내 서비스 및 네비게이션 서비스 등 다양한 서비스가 구현되고 있다. 또한, 상기 다양한 서비스의 일환으로 위치기반 이동통신 기술이 접목된 이동통신 단말을 이용하여 이를 소지하는 서비스 가입자들의 특정지역 유동현황을 파악하기 위한 서비스를 구현함으로써, 특정지역에서의 혼잡도를 측정하여 생성된 데이터를 기반으로 유동인구 현황을 파악하고, 이를 이용하여 해당 지역의 상권을 분석한다든지, 소정의 목적지에 대한 혼잡도를 실시간으로 파악하기 위한 필요성이 대두하고 있다.
유동인구 정보를 조사하기 위해서는 조사원을 투입하여 수작업으로 유동인구를 조사하는 실정이지만, 다수 통행자가 통행을 하는 경우에 정확한 조사가 불가능하며, 유동인구 정보 중 연령 정보가 매우 중요한 요소임에도 불구하고, 조사원이 통행자의 외관만을 파악하여 연령을 추측하므로 정확한 연령정보를 수집하기에는 부족한 점이 많다는 문제점이 있다.
또한, 기존의 입지 및 상권 분석 방법에서는 이러한 정보를 획득하기 위하여 현장을 답사하거나 관공서를 개별 방문하여 정보를 얻었으며 창업을 희망하는 개인 등은 창업 컨설팅업체를 통해 높은 비용을 부담하고 상권 분석 정보를 얻을 수 있었다.
이렇게 생성되는 정보 중 유동 인구 데이터는 중요 입지에서 직접 카운트하는 방식으로 이루어져 시간대별로 유동인구의 총수를 파악하는 것에서는 유용할 수 있으나 다른 정보들을 활용하기에는 미흡한 점이 많았다.
이와 같이, 종래의 유동 인구 계측 방법은 사람이 거주지 등록을 한다 하더라도 실제 거주지에서 생활하지 않고 주변 다른 지역에서 작업하거나 생활하는 등의 사례를 실시간으로 반영하지 못하기 때문에 정확한 정보 수집 방법이 될 수 없다. 이에 따라 종래의 유동 인구 계측 방법으로 계측된 인구 밀도 값의 오차율이 클 뿐만 아니라 정확한 정보 반영이 어렵기 때문에 이를 토대로 하는 다양한 추산이나 예측의 정보들 또한 태생적으로 많은 오차를 가질 수 밖에 없어 정보의 신뢰성이 매우 낮은 문제점이 있다.
이러한 문제점을 해결하기 위해, GPS 인공위성을 이용하는 방법, 이동통신 환경을 이용하는 방법, 무선랜 등 고정된 물체에 대한 근접성을 이용하는 방법 등을 이용하여 실시간 유동인구 측정 기술이 개발되고 있다.
그러나 유동 인구의 위치를 측정하기 위한 GPS 기법(오차율 15m 내외)과 근접성을 활용한 기법은 정확도면에서 이동통신 환경을 이용한 기법보다 정확하지만, GPS 기법은 GPS의 위성신호가 수신되지 않는 곳이나 신호의 감쇠가 큰 경우에는 사용할 수 없는 단점이 있다.
한편, 무선랜의 신호 세기 정보를 활용해 위치정보를 제공하는 측위 기법은 기존의 무선인터넷 인프라를 활용할 수 있는 장점이 있지만 무선랜이 설치되지 않은 지역에서는 사용할 수 없고 위치정보 데이터베이스를 따로 구축해야 한다는 단점이 있다. 반면에, 이동통신 환경(셀 ID)을 이용하는 방법은 생활의 거의 모든 곳을 커버할 수 있고 별도의 추가적인 장비가 필요 없는 장점이 있지만 정확도 면에서 비교적 부정확한 단점을 가지고 있다.
본 발명은 전술한 문제점을 해결하기 위하여, 본 발명의 일 실시예에 상관분석, 회귀 분석, 피셀 알고리즘의 연동을 통해 실시간 유동 인구 데이터를 빠르고 쉽게 획득할 수 있는 유동 인구의 분석 서비스 제공 방법을 제공하는 것에 목적이 있다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은 빅데이터를 이용하여 인구 분석 서비스를 제공하기 위한 인구 분석 서버에 의해 수행되는 유동 인구의 분석 서비스 제공 방법에 있어서, a) 네트워크를 통해 지역 정보, 인구 이동 정보, 상품 거래 정보, 인구통계 정보, 통신기록 정보, 관광 정보를 포함한 사전 집계 데이터를 수집하는 단계; b) 상기 수집된 사전 집계 데이터에 기초하여 표준화 작업을 진행하여 기초단위구역별로 업소수, 주거 인구 정보, 직장 인구 정보에 근거하여 주거유형, 상업 유형, 직장 유형, 복합 유형, 관광 유형, 기타 유형을 포함하는 입지 유형으로 분류하는 단계; c) 유동인구 산정을 위한 실측 지점이 입력되면, 상기 실측 지점의 유동 인구를 종속 변수로 설정하고, 상기 실측지점을 기준으로 기설정된 측정 범위의 기초 분석 영역을 설정하며, 상기 기초 분석 영역을 상기 측정 범위 내에서 기설정된 분석단위로 분석 영역을 확대하면서 상기 종속 변수의 예측에 사용되는 다수의 독립변수를 추출하는 단계; d) 상기 입지 유형, 일/주중/주말의 범주, 상기 종속 변수와 독립 변수 간의 상관분석을 통한 상관관계 결과를 토대로 회귀 분석을 적용하여 회귀계수를 도출하고, 상기 회귀계수를 이용하여 유의미한 독립변수들, 입지 유형, 각 입지유형의 분석 영역을 각각 확정하는 단계; 및 e) 상기 확정된 입지 유형별로 분석 영역을 적용하여 공간 단위 영역을 구축하고, 상기 공간 단위 영역에 피셀(pCELL) 알고리즘을 적용하여 시간대/지역/성/연령/방문자 인구에 대한 유동 인구 데이터를 예측하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, a) 단계에서 하나 이상의 지역에 각각 배치되는 적어도 하나의 기지국에 접속한 다수의 사용자 단말과 관련된 사용자 데이터와, 상기 다수의 사용자 단말의 세션 연결에 따라서 생성되는 통화, 문자를 포함한 트래픽 데이터를 통신 기록 정보로 이동 통신망을 통해 실시간 수집하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, b) 단계에서 통계청의 기초단위구 분류 기준에 기초하여 주거 인구 70% 이상인 경우에 주거 유형, 업소수 50% 이상인 경우에 상업 유형, 직장 인구 70% 이상인 경우에 직장 유형, 주거 인구 30% 이상~70% 미만이고, 직장인구 30% 이상~70% 미만인 경우에 복합 유형, 기타 지역에서 관광명소의 독립 변수를 영역형으로 만들고 포함관계에 따라 설정된 관광 유형, 그 외 지역을 기타 유형으로 분류하는 1차 유형 분류 단계; 및 지역별 표준화된 업소수가 0.1 이하이면서 사업유형과 기타 유형인 경우, 지역별 표준화된 주거인구가 0.05 이하이면서 주거 유형과 기타 유형인 경우, 지역별 표준화된 직장인구가 0.05 이하이면서 직장 유형과 기타 유형인 경우, 지역별 표준화된 업소수와 지역별 전체인구의 총합이 0.05 이하이면서 복합 유형과 기타유형인 경으로 분류하는 2차 유형 분류 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 1차 분류 단계는 주거 인구 비율을 주거인구/(주거인구+직장인구)로 계산하고, 직장인구 비율을 직장인구/(주거인구+직장인구)로 계산하며, 업소수 비율은 표준화된 업소수/(표준화된 업소수 +표준화된 총인구(주거인구+직장인구))로 계산하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, b) 단계에서 표준정규분포를 사용하여 독립변수들을 평균이 '0', 분산이 '1'인 경으로 표준화하고, 음(-)의 값을 배제하여 독립변수들을 모두 0~1사이의 값들로 변환하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 상기 c) 단계에서 버퍼(buffer) 기능을 통한 원형 분석법을 적용하는 것을 특징으로 한다.
또한, 본 발명의 또 다른 일실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, c) 단계에서 상기 분석 단위별 분석 영역에서 입지 유형 및 독립 변수들을 집계하고, 상기 집계된 결과를 상기 회귀 분석시 제공하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, d) 단계에서 상기 확정된 입지유형별로 일평균, 주중평균, 주말 평균에 대한 상기 확정된 독립변수의 회귀 계수를 분석테이블에 기록하여 저장하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, e) 단계는, 기지국 단위별 트래픽 데이터를 기준으로 통신 기록 정보와 피셀 데이터의 조인 키(KEY)를 기지국 ID로 사용하고, 각 피셀별 비율데이터를 생성하여 각 피셀에 가중치를 부여하여 시간대/지역/성/연령/방문자 인구에 대한 유동 인구를 추출하여 상기 실측 지점을 기준으로 분석 영역의 유동인구 추출값을 산출하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 가중치는 회귀분석을 통하여 표준화된 회귀계수를 적용하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 빅데이터를 이용하여 인구 분석 서비스를 제공하기 위한 인구 분석 서버에 의해 수행되는 유동 인구의 분석 서비스 제공 방법에 있어서, a) 하나 이상의 지역에 각각 배치되는 적어도 하나의 기지국에 접속한 다수의 사용자 단말과 관련된 사용자 데이터와, 상기 다수의 사용자 단말의 세션 연결에 따라서 생성되는 트래픽 데이터를 사전 집계 데이터로 이동 통신망을 통해 실시간 수집하는 단계; b) 기설정된 분석 영역을 기준으로 제1분석단위의 그리드(grid) 형태를 가지는 리파인(refine) 데이터를 생성하고, 일단위를 제외한 월 단위로 중복 데이터를 제거하고, 상기 제거된 중복 데이터의 좌표 정보를 이용하여 공간데이터를 생성하는 단계; c) 제2 분석 단위의 그리드 형태를 가지는 인덱스 맵(index map) 데이터를 생성하는 단계; d) 상기 리파인 데이터를 상기 인덱스 맵 데이터에 공간 조인(join)하여 기본 피셀 데이터를 생성하고, 상기 기본 피셀 데이터에 가 시간대/지역/성/연령/방문자 인구에 대한 유동 인구를 추출하기 위한 가중치를 부여하여 피셀 데이터를 생성하는 단계; 및 e) 상기 분석 영역을 적어도 하나 이상의 소지역 블록으로 구분하고, 상기 피셀 데이터를 기준으로 상기 소지역 블록 내의 소지역 코드를 맵핑하여 인구유동데이터를 산출하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 리파인 데이터와 인덱스 맵 데이터는 처리 속도 향상을 위해 YXDB 포맷으로 변환하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, d) 단계에서 공간 조인시 기지국 ID를 조인 키(KEY)로 사용하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, b) 단계에서 TUM-K 좌표계를 기준으로 상기 공간데이터를 생성하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 리파인 데이터가 기지국 ID, 기지국 내 픽셀 ID, X좌표, Y좌표, 공간 정보를 포함하고, 상기 인덱스 맵 데이터는 레코드 ID와 공간 정보를 포함하고, 상기 기본 피셀 데이터는 레코드 ID, 기지국 ID, 기지국 내 픽셀 ID, X좌표, Y좌표, 공간 정보를 포함하고, 상기 피셀 데이터는 포인트 ID, 인구수, X좌표, Y좌표, 공간정보를 포함하고, 상기 소지역 블록은 소지역 코드와 공간 정보를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, e) 단계에서 기준시간, 시간대코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 상기 사전 집계 데이터에서 시간대 컬럼을 제거한 후에 기지국 단위로 성별/연령별 인구를 집계하는 단계; 상기 집계된 성별/연령별 인구에서 시간대 코드를 요일 코드로 구분하고, 월별 일수를 나누어 일평균값을 계산하는 단계; 상기 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출하는 단계; 상기 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 상기 통합 유동인구 데이터에 통신사 보정 비율과 3G 사용자 비율을 적용하는 단계; 및 로우(ROW)의 총값이 '0'인 로우를 삭제하고, 월별/소지역별/피셀별로 그룹화하여 성별/연령별 유동인구 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, e) 단계에서 기준시간, 시간대코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 상기 사전 집계 데이터에서 성별/연령별 컬럼을 제거한 후 시간대별 인구 데이터를 집계하는 단계; 상기 집계된 시간대별 인구 데이터에서 시간대 코드를 요일 코드로 구분하고, 월별 일수를 나누어 일평균값을 계산하는 단계; 상기 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출하는 단계; 상기 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 통합 유동인구 데이터에 통신사 보정 비율과 3G 사용자 비율을 적용한 후 기설정된 한주기의 시간(TMST)으로 시간대별 컬럼을 생성하는 단계; 및 로우(ROW)의 총값이 '0'인 로우를 삭제한 후 월별/소지역별/피셀별로 그룹화하여 시간대별 유동인구 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, e) 단계에서 기준시간, 시간대코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 상기 사전 집계 데이터에서 시간대 컬럼을 제거한 후 성별/연령별 인구총값을 집계하는 단계; 상기 집계된 인구 총값에서 시간대 코드를 요일 코드로 구분하고, 일자별 요일 데이터에서 요일별 일수를 집계하고, 요일별 인구수/월별 요일수로 집계하는 단계; 상기 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출하는 단계; 상기 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 통합 유동인구 데이터에 통신사 보정 비율과 3G 사용자 비율을 적용한 후 요일코드 컬럼으로 요일 컬럼을 생성하는 단계; 및 로우(ROW)의 총값이 '0'인 로우를 삭제한 후 월별/소지역별/피셀별로 그룹화하여 요일별 유동인구 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 한다.
한편 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 함으로써 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다.
전술한 바와 같이, 본 발명에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은 실시간 유동 인구 측정에 피셀 알고리즘을 적용함으로써 수 Km에 이르는 셀 단위의 위치 정보를 제공하는 기존 셀ID 방식보다 5배 이상 정밀한 정보제공이 가능할 뿐만 아니라 실시간(real time)으로 유동 인구 데이터를 쉽게 획득할 수 있다.
또한, 본 발명은 일단위 활동인구, 일단위 성별/연령별 유입 인구, 일단위 시간대별 유입 인구, 일단위 시도별 유니크 인구, 일단위 시군구별 유니크 인구, 일단위 외국인 데이터, 일단위 시간별 OD(Origin-Destination) 매트릭스를 획득할 수 있다.
또한, 본 발명은 기초단위구역을 현행화할 수 있고, 도심 외의 지역은 기본 분석 단위의 그리드로 구축할 수 있으며, 고도화 사업에 부합하는 공간 단위 영역을 구축할 수 있을 뿐만 아니라 입지 유형 분류를 가장 잘 설명 할 수 있는 분석 반경과 상관 분석과 회귀 분석을 통해 유동 인구 산정을 위한 종속변수를 가장 잘 예측할 수 있는 독립변수를 추출할 수 있다.
도 1은 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 수행하기 위한 인구분석 서버의 구성을 나타낸 도면.
도 2는 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도.
도 3은 도 2의 입지유형 분류를 위한 표준화 작업 과정을 설명하는 도면.
도 4는 도 2의 입지 유형 분류 결과를 설명하는 도면.
도 5는 도 2의 분석 영역에 대한 버퍼 작업 현황을 설명하는 도면.
도 6은 도 2의 상관 분석을 통한 상관관계 결과를 설명하는 도면.
도 7은 도 2의 회귀 분석을 통해 도출된 회귀 계수를 설명하는 도면.
도 8은 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도.
도 9는 본 발명의 일 실시예에 따른 사전 집계 데이터를 설명하는 도면.
도 2는 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도.
도 3은 도 2의 입지유형 분류를 위한 표준화 작업 과정을 설명하는 도면.
도 4는 도 2의 입지 유형 분류 결과를 설명하는 도면.
도 5는 도 2의 분석 영역에 대한 버퍼 작업 현황을 설명하는 도면.
도 6은 도 2의 상관 분석을 통한 상관관계 결과를 설명하는 도면.
도 7은 도 2의 회귀 분석을 통해 도출된 회귀 계수를 설명하는 도면.
도 8은 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도.
도 9는 본 발명의 일 실시예에 따른 사전 집계 데이터를 설명하는 도면.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다.
그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하의 실시예는 본 발명의 이해를 돕기 위한 상세한 설명이며, 본 발명의 권리 범위를 제한하는 것이 아니다. 따라서 본 발명과 동일한 기능을 수행하는 동일 범위의 발명 역시 본 발명의 권리 범위에 속할 것이다.
이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 수행하기 위한 인구분석 서버의 구성을 나타낸 도면이다.
도 1을 참조하면, 빅데이터를 이용하여 인구 분석 서비스를 제공하는 인구 분석 서버(100)는 통신 모듈(110), 메모리(120), 프로세서(130) 및 데이터베이스(140)를 포함한다.
상세히, 통신 모듈(110)은 통신망(300)과 연동하여 인구 분석 서버(100)와 사용자 단말 간의 송수신 신호를 패킷 데이터 형태로 제공하는 데 필요한 통신 인터페이스를 제공한다. 나아가, 통신 모듈(110)은 사용자 단말로부터 데이터 요청을 수신하고, 이에 대한 응답으로서 데이터를 송신하는 역할을 수행할 수 있다.
여기서, 통신 모듈(110)은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다.
메모리(120)는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 수행하기 위한 프로그램이 기록된다. 또한, 프로세서(130)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 여기서, 메모리(120)는 휘발성 저장 매체(volatile storage media) 또는 비휘발성 저장 매체(non-volatile storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
프로세서(130)는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 제공하는 전체 과정을 제어한다. 프로세서(130)가 수행하는 각 단계에 대해서는 도 2 및 도 8을 참조하여 후술하기로 한다.
여기서, 프로세서(130)는 프로세서(processor)와 같이 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
데이터베이스(140)는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 수행하면서 누적되는 데이터가 저장된다. 예컨대, 데이터베이스(140)에는 사전 집계 데이터, 유동인구 데이터, 리파인 데이터, 인덱스 맵 데이터, 기본 피셀 데이터, 피셀 데이터 등이 테이블 형태로 저장될 수 있다.
한편, 사용자 단말은 휴대성 및 이동성이 보장된 무선 통신 장치일 수 있으며, 예를 들어 PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 태블릿 PC 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치일 수 있다. 또한, '단말'은 네트워크를 통해 다른 단말 또는 서버 등에 접속할 수 있는 PC 등의 유선 통신 장치인 것도 가능하다.
도 2는 본 발명의 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도이고, 도 3은 도 2의 입지유형 분류를 위한 표준화 작업 과정을 설명하는 도면이며, 도 4는 도 2의 입지 유형 분류 결과를 설명하는 도면이고, 도 5는 도 2의 분석 영역에 대한 버퍼 작업 현황을 설명하는 도면이다.
도 2 내지 도 5를 참조하면, 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 네트워크를 통해 지역 정보, 인구 이동 정보, 상품 거래 정보, 인구통계 정보, 통신기록 정보, 관광 정보를 포함한 사전 집계 데이터를 수집한다(S110). 인구 분석 서버(100)는 통계청, 도청/시청/군청, 카드사, 통신사, 관광공사, 빅데이터 관련 업체 등을 통해 사전 집계 데이터를 수집한다. 특히, 인구 분석 서버(100)는 하나 이상의 지역에 각각 배치되는 적어도 하나의 기지국에 접속한 다수의 사용자 단말과 관련된 사용자 데이터와, 다수의 사용자 단말의 세션 연결에 따라서 생성되는 통화, 문자를 포함한 트래픽 데이터를 통신 기록 데이터로 이동 통신망을 통해 실시간 수집한다.
프로세서(130)는 사전 집계 데이터에 기초하여 표준화 작업을 진행하여 기초단위구역별로 업소수, 주거 인구 정보, 직장 인구 정보에 근거하여 입지 유형을 분류한다(S120).
즉, 프로세서(130)는 통계청의 기초단위구 분류 기준에 기초하여 주거 인구 70% 이상인 경우에 주거 유형, 업소수 50% 이상인 경우에 상업 유형, 직장 인구 70% 이상인 경우에 직장 유형, 주거 인구 30% 이상~70% 미만이고, 직장인구 30% 이상~70% 미만인 경우에 복합 유형, 기타 지역에서 관광명소의 독립 변수를 영역형으로 만들고 포함관계에 따라 설정된 관광 유형, 그 외 지역을 기타 유형으로 1차 유형 분류를 수행한다. 프로세서는 1차 유형 분류시 주거 인구 비율을 주거인구/(주거인구+직장인구)로 계산하고, 직장인구 비율을 직장인구/(주거인구+직장인구)로 계산하며, 업소수 비율은 표준화된 업소수/(표준화된 업소수 +표준화된 총인구(주거인구+직장인구))로 계산한다.
이후, 1차 유형 분류를 바탕으로 프로세스(130)은 다시 지역별 표준화된 업소수의 계산 결과가가 0.1 이하이면서 입지유형(표3)이 사업유형과 기타유형인 경우, 지역별 표준화된 주거인구가 0.05 이하이면서 입지유형(표3)이 주거 유형과 기타 유형인 경우, 지역별 표준화된 직장인구가 0.05 이하이면서 입지 유형이 직장 유형과 기타 유형인 경우, 지역별 표준화된 업소수와 지역별 전체인구의 총합이 0.05 이하이면서 입지유형(표3)이 복합 유형과 기타 유형인 경우로 조건을 세분화 하여 2차 유형 분류를 수행한다.
도 2에 도시된 바와 같이, 프로세서(130)는 총인구, 업소 변수들의 각각 다른 분포와 크기를 동일하게 맞추기 위해 표준화 작업을 진행한다. 표준화 작업은 표준정규분포를 사용하여 독립변수들을 평균이 '0', 분산이 '1'인 경으로 표준화되도록 한다. 이 경우, 음(-)의 값이 발생하게 되는데, 회귀 계수는 실제 양(+)의 값을 영향을 받지만, 음의 영향을 받는 경우가 발생할 수 있어 음(-)의 값을 배제하여 독립변수들을 모두 0~1사이의 값들로 변환한다.
프로세서는 표준화 작업 이후에 표준 정규분포표에 의해 3.09σ99.8%의 데이터를 포함하게 되고, 3.0σ의 경우 99.74%의 데이터를 포함한다. 즉, 3σ이 100%에 가까운 데이터를 포함하고 있다는 것을 감안하여 각 독립변수들의 평균을 기준으로 3σ 값의 지점을 1로 고정하여 모든 데이터를 표준화한다.
독립 변수들의 표준화 작업이 완료되면, 모든 데이터들을 표 1 및 도 3의 (a)와 같은 형태로 변화하게 된다.
[표 1]
표 1에서 평균을 살펴보면 0.5보다 작은 값을 갖는데, 도 3의 (b)에 도시된 바와 같이 3σ보다 큰 이상 값이 많이 분포하고 있음을 알 수 있으며, 이는 상위에 분포되어 있는 값들을 그대로 비율에 맞게 사용하기 위해 최댓값을 사용하지 않고 3σ을 사용한 이유이다.
한편, 유동인구 산정을 위한 실측 지점이 서울시인 경우에, 프로세서는 도 4의 (a)에 도시된 바와 같이, 도심 지역을 기초단위 구역별로 분할하여 입지 유형을 분류하여 표시할 수 있고, 도 4의 (b)에 도시된 바와 같이 도심 지역을 기초단위 구역별로 분할하고 도심 외의 지역을 그리드(Grid)로 분할하여 입지 유형을 분류하여 표시할 수 있다.
다시 도 2를 설명하면, 프로세서(130)는 사용자 단말을 통해 유동인구 산정을 위한 실측 지점이 입력되면, 실측 지점의 유동 인구를 종속 변수로 설정하고, 실측지점을 기준으로 기설정된 측정 범위의 기초 분석 영역을 설정하며, 기초 분석 영역을 측정 범위 내에서 기설정된 분석단위로 분석 영역을 확대하면서 종속 변수의 예측에 사용되는 다수의 독립변수를 추출한다(S130).
이때, 프로세서는, 도 5에 도시된 바와 같이, 버퍼(buffer) 기능을 통한 원형 분석법을 적용하여 분석 영역을 설정하되, 실측 지점을 기준으로 반경 50m~200m의 측정 범위의 기초 분석 영역을 설정하고, 반경을 10m의 분석 단위만큼 증가시키면서 분석 영역을 확대하여 반경별로 예상되는 독립변수를 집계한다. 프로세서는 분석 단위만큼 반경이 확대되는 분석 영역에서 입지 유형 및 독립 변수들을 집계하고, 집계된 결과를 회귀 분석시 회귀식에 대입한다.
프로세서는 입지 유형, 일/주중/주말의 범주, 종속 변수와 독립 변수 간의 상관분석을 통한 상관관계 결과를 토대로 회귀 분석을 적용하여 회귀계수를 도출하고, 회귀계수를 이용하여 유의미한 독립변수들, 입지 유형, 각 입지유형의 분석 영역을 각각 확정한다(S140). 여기서, 회귀 분석은 독립변수가 종속변수에 미치는 인과적 영향(causal effects)을 통계적으로 추정하기 위한 목적으로 사용된다.
도 6은 도 2의 상관 분석을 통한 상관관계 결과를 설명하는 도면이고, 도 7은 도 2의 회귀 분석을 통해 도출된 회귀 계수를 설명하는 도면이다.
도 6 및 도 7에 도시된 바와 같이, 프로세서는 입지유형, 범주, 독립변수들의 상관 분석을 통해 세 개 이상의 변수 사이의 상관관계를 나타내는 다중상관계수(R2)를 비교하여, 하기한 표 2 내지 도 4와 같이 입지 유형분류를 가장 잘 설명할 수 있는 반경, 즉 분석 영역을 확정하고, 종속 변수를 가장 예측할 수 있는 독립 변수를 확정한다.
[표 2] 독립 변수 확정
[표3] 입지 유형 확정
[표 4] 입지 유형별 반경 확정
다시 도 2를 설명하면, 프로세서는 확정된 입지 유형별로 분석 영역을 적용하여 공간 단위 영역을 구축하고, 공간 단위 영역에 피셀(pCELL) 알고리즘을 적용하여 시간대/지역/성/연령/방문자 인구에 대한 유동 인구 데이터를 예측한다(S150, S160). 이때, 프로세서는 기지국 단위별 트래픽 데이터를 기준으로 통신 기록 정보와 피셀 데이터의 조인 키(KEY)를 기지국 ID로 사용하고, 각 피셀별 비율데이터를 생성하여 각 피셀에 가중치를 부여하여 시간대/지역/성/연령/방문자 인구에 대한 유동 인구를 추출한 후 실측 지점을 기준으로 분석 영역의 유동인구 데이터를 산출한다. 여기서, 가중치는 도 7에 도시된 바와 같이 회귀분석을 통하여 표준화된 회귀계수를 적용한다.
도 8은 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법을 설명하는 순서도이고, 도 9는 본 발명의 일 실시예에 따른 사전 집계 데이터를 설명하는 도면이다.
도 8을 참고하면, 본 발명의 다른 일 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은 유동인구 데이터를 생성하기 위하여 가중치를 가지는 피셀데이터를 생성하는 방법을 중심으로 설명한다.
먼저, 인구 분석 서버는 기지국을 기준으로 사전 집계 데이터를 이동 통신망을 통해 실시간 수집한다(S210). 이때, 사전 집계 데이터는 통화 문자 등의 통신기록 정보를 50m×50m 단위로 일단위 집계한 성별, 연령별, 시간대별, 요일별 유동인구 모수 추정자료가 될 수 있다.
인구 분석 서버는 기설정된 분석 영역을 기준으로 제1분석단위(20m×20m) 의 그리드(grid) 형태를 가지는 리파인(refine) 데이터를 생성하고, 일단위를 제외한 월 단위로 중복 데이터를 제거한 후 제거된 중복 데이터의 좌표 정보를 이용하여 TUM-K 좌표계를 기준으로 공간데이터를 생성한다(S220). 인구 분석 서버는 일자별 리파인 데이터를 하기한 표 5와 같이 입력 데이터로 하고, 입력 데이터에서 일자를 제외하고 월 기준으로 중복 데이터를 제거한다.
[표 5] 입력 데이터
인구 분석 서버는 제2 분석 단위(50m×50m)의 그리드 형태를 가지는 인덱스 맵(index map) 데이터를 하기한 표 6과 같이 생성한다(S230). 분석 영역이 전국 단위인 경우, 인구 분석 서버는 리파인 데이터와 인덱스 맵 데이터의 처리 속도를 향상하기 위하여 ALTERYX 지원 확장자인 YXDB의 포맷으로 변환한다.
[표 6]
또한, 인구 분석 서버는 리파인 데이터를 인덱스 맵 데이터에 공간 조인(join)하여 표 7과 같은 기본 피셀 데이터를 생성하고(S240), 기본 피셀 데이터에 시간대/지역/성/연령/방문자 인구에 대한 유동 인구를 추출하기 위한 가중치를 부여하여 표 8과 같은 피셀 데이터를 생성한다(S250). 이때, 공간 조인시 기지국 ID를 조인 키(KEY)로 사용하고, 피셀 데이터는 pCell(50m×50m) 기반의 평균 유동인구를 나타내며, 피셀 좌표는 50m×50m 단위의 점형 데이터이다.
[표 7]
[표 8]
인구 분석 서버는 분석 영역을 표 9와 같이 적어도 하나 이상의 소지역 블록으로 구분하고, 피셀 데이터를 기준으로 소지역 블록 내의 소지역 코드를 맵핑하여 실시간 인구유동데이터를 산출한다(S260).
[표 9]
한편, 인구 분석 서버는 피셀 데이터에 주중 가중치를 공간 조인하고, 가중치가 반영된 데이터를 기준으로 소지역 코드를 공간 조인하여 표 10과 같은 주중_유동인구 데이터를 산출할 수 있다. 또한, 인구 분석 서버는 피셀 데이터에 주말 가중치와 소지역 코드를 순차적으로 공간 조인하여 표 11과 같은 주말_유동인구 데이터를 산출할 수 있다.
[표 10]
인구 분석 서버는 기준시간, 시간대 코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 사전 집계 데이터에서 시간대 컬럼을 제거한 후에 기지국 단위로 성별/연령별 인구를 집계한다. 이렇게 집계된 성별/연령별 인구에서 시간대 코드를 요일 코드로 구분하고, 월별 일수를 나누어 일평균값을 계산한다.
이후, 인구 분석 서버는 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출한 후, 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 통합 유동인구 데이터에 통신사 보정 비율(예를 들어, 0.442)과 3G 사용자 비율(예를 들어, 0.82)을 적용하며, 로우(ROW)의 총값이 '0'인 로우를 삭제하고, 월별/소지역별/피셀별로 그룹화하여 표 11과 같은 성별/연령별 유동인구 데이터를 생성할 수 있다. 한편, 통신사 보정 비율은 타지역을 중복으로 관할하는 경우 시간대별 유동인구를 기준으로 일별, 시간별 분석 영역의 비율 값을 구하여 기지국 데이터 비율로 산정할 수 있다.
[표 11]
한편, 인구 분석 서버는 사전 집계 데이터에서 성별/연령별 컬럼을 제거한 후 시간대 인구 데이터로 집계하고, 집계된 시간대별 인구 데이터에서 요일 코드로 구분하고, 월별 일수를 나누어 일평균값을 계산한다. 그리고 인구 분석 서버는 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출한 후, 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 통합 유동인구 데이터에 통신사 보정 비율(예를 들어, 0.442)과 3G 사용자 비율(예를 들어, 0.82)을 적용하며, 기설정된 한 주기의 시간(TMST)으로 시간대별 컬럼을 생성하고, 로우(ROW)의 총값이 '0'인 로우를 삭제하고, 월별/소지역별/피셀별로 그룹화하여 표 12와 같은 시간대별 유동인구 데이터를 생성할 수 있다.
[표 12]
인구 분석 서버는 기준시간, 시간대 코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 상기 사전 집계 데이터에서 시간대 컬럼을 제거한 후 성별/연령별 인구총값을 집계하고, 집계된 인구 총값에서 시간대 코드를 요일 코드로 구분하고, 일자별 요일 데이터에서 요일별 일수를 집계하고, 요일별 인구수/월별 요일수로 집계한다.
이후, 인구 분석 서버는 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출하고, 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하며, 통합 유동인구 데이터에 통신사 보정 비율과 3G 사용자 비율을 적용한 후 요일 코드 컬럼으로 요일 컬럼을 생성한다. 그리고 인구 분석 서버는 로우(ROW)의 총값이 '0'인 로우를 삭제한 후 월별/소지역별/피셀별로 그룹화하여 표 13과 같은 요일별 유동인구 데이터를 생성할 수 있다.
[표 13]
이상에서 설명한 본 발명의 실시예에 따른 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법은, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 이러한 기록 매체는 컴퓨터 판독 가능 매체를 포함하며, 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함하며, 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
100: 인구분석 서버
110: 통신 모듈 120: 메모리
130: 프로세서 140: 데이터베이스
300: 통신망
110: 통신 모듈 120: 메모리
130: 프로세서 140: 데이터베이스
300: 통신망
Claims (3)
- 빅데이터를 이용하여 인구 분석 서비스를 제공하기 위한 인구 분석 서버에 의해 수행되는 유동 인구의 분석 서비스 제공 방법에 있어서,
a) 하나 이상의 지역에 각각 배치되는 적어도 하나의 기지국에 접속한 다수의 사용자 단말과 관련된 사용자 데이터와, 상기 다수의 사용자 단말의 세션 연결에 따라서 생성되는 트래픽 데이터를 사전 집계 데이터로 이동 통신망을 통해 실시간 수집하는 단계;
b) 기설정된 분석 영역을 기준으로 제1분석단위의 그리드(grid) 형태를 가지는 리파인(refine) 데이터를 생성하고, 일단위를 제외한 월 단위로 중복 데이터를 제거하고, 상기 제거된 중복 데이터의 좌표 정보를 이용하여 공간데이터를 생성하는 단계;
c) 제2 분석 단위의 그리드 형태를 가지는 인덱스 맵(index map) 데이터를 생성하는 단계;
d) 상기 리파인 데이터를 상기 인덱스 맵 데이터에 공간 조인(join)하여 기본 피셀 데이터를 생성하고, 상기 기본 피셀 데이터에 가 시간대/지역/성/연령/방문자 인구에 대한 유동 인구를 추출하기 위한 가중치를 부여하여 피셀 데이터를 생성하는 단계; 및
e) 상기 분석 영역을 적어도 하나 이상의 소지역 블록으로 구분하고, 상기 피셀 데이터를 기준으로 상기 소지역 블록 내의 소지역 코드를 맵핑하여 인구유동데이터를 산출하는 단계를 포함하며,
상기 리파인 데이터와 인덱스 맵 데이터는 처리 속도 향상을 위해 YXDB 포맷으로 변환하는 것을 특징으로 하는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법.
- 제 1 항에 있어서,
상기 b) 단계는 TUM-K 좌표계를 기준으로 상기 공간데이터를 생성하는 것을 특징으로 하는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법.
- 제 1 항에 있어서,
상기 e) 단계는,
기준시간, 시간대코드, 기지국 ID, 섹터, 성별/연령별 인구를 포함하는 테이블 형태의 사전 집계 데이터를 이용하여 상기 사전 집계 데이터에서 성별/연령별 컬럼을 제거한 후 시간대별 인구 데이터를 집계하는 단계;
상기 집계된 시간대별 인구 데이터에서 시간대 코드를 요일 코드로 구분하고, 월별 일수를 나누어 일평균값을 계산하는 단계:
상기 요일 코드 중 주말에 해당하는 주중_유동인구 데이터와 요일 코드 중 주말에 해당하지 않는 주중_유동인구 데이터를 산출하는 단계;
상기 주중_유동인구 데이터와 주말_유동인구 데이터를 조인하여 통합 유동인구 데이터를 생성하고, 상기 통합 유동인구 데이터에 통신사 보정 비율과 3G 사용자 비율을 적용한 후 기설정된 한주기의 시간(TMST)으로 시간대별 컬럼을 생성하는 단계; 및
로우(ROW)의 총값이 '0'인 로우를 삭제한 후 월별/소지역별/피셀별로 그룹화하여 시간대별 유동인구 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20180065364 | 2018-06-07 | ||
KR1020180065364 | 2018-06-07 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180111123A Division KR101976189B1 (ko) | 2018-06-07 | 2018-09-17 | 유동 인구의 분석 서비스 제공 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101982159B1 true KR101982159B1 (ko) | 2019-05-24 |
Family
ID=66580241
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180111123A KR101976189B1 (ko) | 2018-06-07 | 2018-09-17 | 유동 인구의 분석 서비스 제공 방법 |
KR1020190051015A KR101982159B1 (ko) | 2018-06-07 | 2019-04-30 | 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법 |
KR1020190051031A KR102097426B1 (ko) | 2018-06-07 | 2019-04-30 | 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180111123A KR101976189B1 (ko) | 2018-06-07 | 2018-09-17 | 유동 인구의 분석 서비스 제공 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190051031A KR102097426B1 (ko) | 2018-06-07 | 2019-04-30 | 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법 |
Country Status (1)
Country | Link |
---|---|
KR (3) | KR101976189B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102226504B1 (ko) | 2020-10-27 | 2021-03-12 | 주식회사 서경산업 | 특정공간에서의 인구의 밀집도 측정시스템 |
KR102373468B1 (ko) * | 2021-08-26 | 2022-03-11 | 국립공원공단 | 국립공원 탐방객의 실태 조사 장치 및 방법 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102085303B1 (ko) * | 2019-10-16 | 2020-03-05 | 한국교통연구원 | 통신 빅데이터 기반 db 분석맵 구축 방법 |
CN111027202B (zh) * | 2019-12-04 | 2023-12-15 | 北京软通绿城科技有限公司 | 一种数字城市的预测方法、装置、设备及存储介质 |
KR102416686B1 (ko) | 2020-03-04 | 2022-07-05 | 김명락 | 자율주행차량 사용자정보 수집을 통한 유동인구 및 지역 가치 예측 방법 |
CN111598441B (zh) * | 2020-05-14 | 2023-05-12 | 北京软通绿城科技有限公司 | 人口数据分析方法、系统、设备和存储介质 |
CN111833224B (zh) * | 2020-05-26 | 2023-11-28 | 东南大学 | 一种基于人口栅格数据的城市主副中心边界识别方法 |
CN112052280B (zh) * | 2020-09-10 | 2022-04-29 | 厦门市美亚柏科信息股份有限公司 | 一种基于时空数据的实有人口分析方法及系统 |
KR102708175B1 (ko) | 2020-10-13 | 2024-09-19 | 주식회사 케이티 | 유동 인구 분석 장치 및 방법 |
CN112418508B (zh) * | 2020-11-19 | 2021-10-08 | 中国科学院地理科学与资源研究所 | 基于物理空间与社交网络空间交互的人口分布预测方法 |
CN113382402A (zh) * | 2021-05-31 | 2021-09-10 | 中科苏州智能计算技术研究院 | 基于泛基站的人口特征分析方法及其应用 |
KR102583585B1 (ko) | 2021-08-04 | 2023-10-05 | 성균관대학교산학협력단 | 빅데이터와 인공지능을 이용한 감염병 예측 방법 및 시스템 |
CN113641913B (zh) * | 2021-08-20 | 2022-04-12 | 数睿科技(珠海横琴)有限公司 | 数据处理方法、装置和电子设备 |
KR102715238B1 (ko) * | 2022-01-03 | 2024-10-11 | 한국교통연구원 | TCM(Trip Chain Map) 기반 OD(Origin-Destination) 매트릭스 생성 장치 및 그 방법 |
JP7300541B1 (ja) * | 2022-05-19 | 2023-06-29 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
KR102637936B1 (ko) | 2022-06-22 | 2024-02-20 | 주식회사 케이티 | Voc 데이터를 이용하여 중계기를 관리하는 서버, 방법 및 컴퓨터 프로그램 |
WO2024096674A1 (ko) * | 2022-11-04 | 2024-05-10 | 안은희 | 실시간 인구 예측 방법 및 이러한 방법을 수행하는 장치 |
CN117151344B (zh) * | 2023-10-26 | 2024-02-02 | 乘木科技(珠海)有限公司 | 一种数字孪生城市人口管理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110102125A (ko) * | 2010-03-09 | 2011-09-16 | 한국전자통신연구원 | 유동인구 정보 분석 장치 및 그 방법 |
KR20130082635A (ko) * | 2011-12-12 | 2013-07-22 | 현대엠엔소프트 주식회사 | 유동인구 분석 시스템 및 그 방법 |
KR101573190B1 (ko) | 2014-04-21 | 2015-12-01 | (주)대한에이앤씨 | 실시간 유동 인구 측정 시스템 및 방법 |
KR101741942B1 (ko) * | 2015-04-29 | 2017-05-31 | 한국국토정보공사 | 빅데이터 기반 스마트 관광정보 제공 장치 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100951950B1 (ko) * | 2007-10-19 | 2010-04-09 | 에스케이 텔레콤주식회사 | 단말기 위치계산방법 및 그를 위한 위치계산 서버 |
KR100903027B1 (ko) * | 2008-09-26 | 2009-06-18 | (주)오픈메이트 | 상권 분석을 위한 유동인구지수 구축 시스템 및 그 방법 |
-
2018
- 2018-09-17 KR KR1020180111123A patent/KR101976189B1/ko active IP Right Grant
-
2019
- 2019-04-30 KR KR1020190051015A patent/KR101982159B1/ko active IP Right Grant
- 2019-04-30 KR KR1020190051031A patent/KR102097426B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110102125A (ko) * | 2010-03-09 | 2011-09-16 | 한국전자통신연구원 | 유동인구 정보 분석 장치 및 그 방법 |
KR20130082635A (ko) * | 2011-12-12 | 2013-07-22 | 현대엠엔소프트 주식회사 | 유동인구 분석 시스템 및 그 방법 |
KR101573190B1 (ko) | 2014-04-21 | 2015-12-01 | (주)대한에이앤씨 | 실시간 유동 인구 측정 시스템 및 방법 |
KR101741942B1 (ko) * | 2015-04-29 | 2017-05-31 | 한국국토정보공사 | 빅데이터 기반 스마트 관광정보 제공 장치 및 방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102226504B1 (ko) | 2020-10-27 | 2021-03-12 | 주식회사 서경산업 | 특정공간에서의 인구의 밀집도 측정시스템 |
KR102373468B1 (ko) * | 2021-08-26 | 2022-03-11 | 국립공원공단 | 국립공원 탐방객의 실태 조사 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102097426B1 (ko) | 2020-04-06 |
KR20190139130A (ko) | 2019-12-17 |
KR101976189B1 (ko) | 2019-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101982159B1 (ko) | 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법 | |
Zhao et al. | Understanding the bias of call detail records in human mobility research | |
JP5871566B2 (ja) | モバイルネットワーク内のモバイル動作データ及び/又は地理的情報を使用する人口追跡、計数、及び移動推定のためのシステム及び方法 | |
Calabrese et al. | Estimating Origin-Destination flows using opportunistically collected mobile phone location data from one million users in Boston Metropolitan Area | |
Lee et al. | Utilizing mobile phone-based floating population data to measure the spatial accessibility to public transit | |
JP7175783B2 (ja) | 所定圏における滞在圏人口を推定するプログラム、装置及び方法 | |
US8843157B2 (en) | Dynamic travel behavior estimation in mobile network | |
US9674667B2 (en) | Handling location data in a mobile communications network | |
CN110008414B (zh) | 地理信息点的确定方法和装置 | |
Ma et al. | Deriving operational origin-destination matrices from large scale mobile phone data | |
Doyle et al. | Population mobility dynamics estimated from mobile telephony data | |
Olia et al. | Optimizing the number and locations of freeway roadside equipment units for travel time estimation in a connected vehicle environment | |
US20140372172A1 (en) | Method and computer system to forecast economic time series of a region and computer program thereof | |
GB2497774A (en) | Categorizing users based on network usage records | |
Siła-Nowicka et al. | Calibrating spatial interaction models from GPS tracking data: An example of retail behaviour | |
Lenormand et al. | Towards a better understanding of cities using mobility data | |
CN116437291A (zh) | 一种基于手机信令的文化圈规划方法和系统 | |
Finazzi et al. | Quantifying personal exposure to air pollution from smartphone-based location data | |
Wang et al. | Does the returners and explorers dichotomy in urban human mobility depend on the observation duration? An empirical study in Guangzhou, China | |
Liao et al. | Predictability in human mobility based on geographical-boundary-free and long-time social media data | |
CN108600340A (zh) | 一种基于移动大样本数据的历史人群规模推总方法及装置 | |
CN111159583A (zh) | 用户行为分析方法、装置、设备及存储介质 | |
CN116433105B (zh) | 一种定量评估轨道交通与城市空间要素分布耦合度的方法 | |
CN116227929B (zh) | 通信数据的分析方法、装置、设备及存储介质 | |
KR20200061666A (ko) | 인구 안내 서비스 제공방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |