KR101207510B1

KR101207510B1 - 클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법

Info

Publication number: KR101207510B1
Application number: KR1020090024149A
Authority: KR
Inventors: 이훈순; 김병섭; 이미영
Original assignee: 한국전자통신연구원
Priority date: 2008-12-18
Filing date: 2009-03-20
Publication date: 2012-12-03
Also published as: US20100161565A1; KR20100070967A

Abstract

본 발명은 클러스터 데이터 관리 시스템의 데이터 재구축 방법에 관한 것으로서, 오류가 발생한 파티션 서버에서 서비스한 파티션의 서비스 정보를 수집하는 단계; 상기 파티션 서버에서 작성된 재수행 로그 파일을 상기 파티션이 속한 테이블의 열 별로 분할하는 단계; 수집된 상기 서비스 정보와 분할된 상기 재수행 로그 파일의 로그 레코드를 근거로 파티션의 데이터를 재구축하는 단계; 및 상기 데이터가 재구축된 상기 파티션을 서비스할 새로운 파티션 서버를 선정하고, 상기 선정된 파티션 서버에 상기 파티션을 할당하는 단계를 포함하는 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법을 제공한다.

노드 오류, 복구, 파티션, 재수행 로그, 재구축, 분할

Description

클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법{Cluster Data Management System And Method for Data Restoring Using Shared Read-Only Log in Cluster Data Management System}

본 발명은 클러스터 데이터 관리 시스템의 데이터 재구축 방법에 관한 것으로서, 보다 구체적으로는 컴퓨팅 노드에 오류 발생시 해당 컴퓨팅 노드에서 서비스하던 데이터를 공유 재수행 로그를 이용하여 빠르게 재구축하는 클러스터 데이터 관리 시스템의 데이터 복구 방법에 관한 것이다.

본 발명은 지식경제부 및 정보통신연구진흥원의 IT성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호:2007-S-016-02,과제명:저비용 대규모 글로벌 인터넷 서비스 솔루션 개발].

최근 들어 UCC, 개인화 서비스와 같은 사용자 중심의 인터넷 서비스 시장이 급속도로 증가함으로 인해 인터넷 서비스를 제공하기 위해 관리해야 하는 데이터 양이 빠르게 증가하고 있다. 이러한 사용자 중심의 인터넷 서비스를 제공하기 위해서는 대용량의 데이터에 대한 효율적인 관리가 필요하다. 하지만 사용자 중심의 서 비스 제공을 위한 데이터들은 그 양이 방대하여 성능이나 비용 측면에서 기존의 DBMS(Database Management System)로는 효율적으로 관리하기에는 어려움이 있다.

이에 근래에 인터넷 서비스 업체를 중심으로 다수의 보급형 서버(Commodity pc server)들과 인터넷 서비스에 특화된 소프트웨어를 이용하여 고성능 및 고가용성을 향상시키기 위한 연구가 활발히 진행되고 있다. 인터넷 서비스에 특화된 데이터 관리 소프트웨어의 하나로 클러스터 데이터 관리 시스템을 들 수 있다.

이러한 클러스터 데이터 관리 시스템에 대한 연구로는 구글(google)에서 만들어서 구글의 다양한 인터넷 서비스에 적용하고 있는 시스템인 Bigtable과 Apache Software Foundation에서 구글의 Bigtable의 개념을 모방하여 오픈 소스 프로젝트로 활발히 진행 중인 시스템인 HBase가 있다.

도 1은 일반적인 클러스터 데이터 관리 시스템을 설명하기 위한 블럭도이고, 도 2는 도 1에서 사용하는 다차원 맵 구조의 데이터 모델을 나타낸 예시도이고, 도 3 및 도 4는 도 1에서 갱신 버퍼를 사용한 데이터 관리를 설명하기 위한 예시도이고, 도 5는 갱신 버퍼가 디스크에 반영되는 방식을 설명하기 위한 예시도이다.

먼저 도 1을 참조하면, 일반적인 클러스터 데이터 관리 시스템은 하나의 마스터 서버(11)와 n개의 파티션 서버(12-1,12-2,...,12-n)를 포함한다.

마스터 서버(11)는 해당 시스템의 동작에 있어서 전반적인 제어를 담당한다.

각 파티션 서버(12-1,12-2,...,12-n)는 데이터 서비스를 담당한다.

일반적인 클러스터 데이터 관리 시스템(10)은 분산 파일 시스템(20) 상에서 동작하며, 로그와 데이터를 분산 파일 시스템(20)을 통해 영구 저장한다.

도 2를 참조하여 일반적인 클러스터 데이터 관리 시스템에서 사용하는 인터넷 서비스에 특화된 다차원 맵 구조의 데이터 모델을 설명하면, 다차원 맵 구조(30)는 행(row)과 열(column)로 구성된다.

다차원 맵 구조(30)의 테이블 데이터는 행 키(row key)를 기반으로 관리되며, 열의 이름을 통해 특정 열의 데이터에 접근할 수 있다. 열은 테이블 내 유일한 이름을 가지며, 열에 저장 관리되는 모든 데이터는 기본적으로 데이터 타입을 가지지 않는 바이트 스트림(stream) 형태이다. 또한, 열에는 단일 데이터뿐만 아니라 여러 개의 값으로 구성된 데이터 집합도 저장 관리 가능하다. 열에 저장 관리되는 데이터가 집합인 경우에 하나의 데이터를 셀(cell)이라고 하며, 셀은 키 값을 가지고, 셀 키 값은 문자열 타입만 지원한다.

행 기반으로 데이터를 저장(row-oriented storage)하는 대부분의 전통적인 데이터 관리 시스템들과 달리 일반적인 클러스터 데이터 관리 시스템(10)은 열, 즉 열 그룹 기반으로 데이터를 저장(column-oriented storage)한다. 열 그룹(column group)이란 함께 접근될 가능성이 높은 열들을 그룹핑한 것을 의미한다. 이하에서 '열'은 열 그룹'을 포함한다. 또한, 데이터를 열 기반 저장을 위해 세로로 나누는 것뿐 아니라 데이터를 일정 크기를 가지도록 가로로 나눈다. 이하에서는 데이터를 일정 크기를 가지도록 가로로 나눈 것을 파티션(partition)이라 칭한다. 특정 파티션에 대한 서비스 책임을 특정 노드에게 부여하여 동시에 여러 파티션에 대한 서비스가 가능하도록 한다. 하나의 파티션은 하나 이상의 행으로 구성되고, 하나의 파티션은 하나의 노드에 의해 서비스가 되고 하나의 노드는 다수의 파티션에 대한 서 비스를 담당한다.

일반적인 클러스터 데이터 관리 시스템(10)에서는 삽입과 삭제 요청으로 인해 데이터에 대한 변경 발생시 이전 데이터에 대해 변경하는 것이 아닌 새로운 값을 가지는 데이터가 추가되는 형태로 저장을 한다. 이러한 데이터 변경을 메모리상에서 관리하기 위해 열 별로 별도의 갱신 버퍼(update buffer)를 둔다. 이 갱신 버퍼는 일정 크기보다 커진 경우나 일정 시간이 지났음에도 디스크에 반영되지 않았으면 디스크에 기록한다.

도 3 내지 도 4를 참조하여 일반적인 클러스터 데이터 관리 시스템에서 갱신 버퍼를 이용한 데이터 관리를 설명하면, 먼저 도 3은 이름(Name)을 행 키로 하는 테이블에 열 Address에 데이터를 삽입하는 연산을 나타낸다. 도 4는 데이터 삽입시 갱신 버퍼의 모습이다. 갱신 버퍼는 행 키, 열 이름, 셀 키, 타임 스탬프를 기준으로 정렬된 모양을 갖는다.

도 5를 참조하여 도 4의 갱신 버퍼가 디스크에 반영된 모습을 설명하면, 갱신 버퍼의 내용이 디스크에 그대로 저장된다.

일반적인 클러스터 데이터 관리 시스템(10)은 전통적인 데이터 관리 시스템들과 달리 디스크 오류에 대한 별도의 고려를 하지 않는다. 디스크 오류에 대한 대처는 분산 파일 시스템(20)에서 제공되는 파일 복제 저장(file replication) 기능을 이용한다. 다만 노드 오류에 대한 대처를 위해 모든 컴퓨팅 노드에서 접근 가능한 곳에 파티션 서버, 즉 노드별로 변경 관련하여 재수행만을 위한 로그를 기록한다. 로그 정보는 로그 일련 번호(LSN : Log Sequence Number), 테이블, 행 키, 열 이름, 셀 키, 타임 스탬프, 변경 값을 포함한다. 컴퓨팅 노드에 오류가 발생하면 오류가 발생한 노드에서 오류 복구에 활용할 목적으로 기록한 재수행 로그를 이용하여 데이터를 오류가 발생하기 전의 상태로 복구한다. 보급형 PC 서버와 같은 저비용의 컴퓨팅 노드는 하트웨어 이중화와 같은 오류에 대한 대처가 거의 되어 있지 않으므로, 소프트웨어 수준에서 효과적으로 노드 오류에 대처하는 것이 고가용성을 달성하는 데 중요한 요인이 될 수 있다.

도 6은 일반적인 클러스터 데이터 관리 시스템에서 오류를 복구하는 방법을 설명하기 위한 흐름도이다.

도 6을 참조하면, 마스터 서버(11)는 파티션 서버(예컨대, 12-1)의 오류를 탐지하면(S610), 파티션 서버(12-1)에서 작성한 로그의 정보를 테이블, 행 키, 로그 일련 번호를 기준으로 정렬하고(S620), 이 후 회복을 위한 디스크 탐색을 줄이도록 하기 위해 로그 파일을 파티션 별로 분할한다(S630).

마스터 서버(11)는 파티션 서버(12-1)에서 서빙하고 있던 파티션을 새로운 파티션 서버(예컨대, 12-2)에 서빙하도록 할당할 때 재수행 로그 경로 정보를 함께 전달한다(S640).

파티션을 할당받은 파티션 서버(12-2)는 재수행 로그를 순차적으로 읽어서 갱신 사항을 갱신 버퍼에 반영한 후 디스크에 기록하는 과정을 통해 데이터를 복구한다(S650).

복구를 완료한 후 파티션 서버(12-2)는 데이터 서빙을 시작한다(S660).

그러나, 오류 발생한 파티션 서버에서 관리하던 파티션들에 대한 복구를 다 수의 파티션 서버에서 나누어 병렬로 복구하도록 하는 방식은 데이터 저장시 갱신된 내용만을 기록하는 데이터 저장 특성을 잘 활용하지 못하는 단점이 있다.

본 발명은 상기와 같은 문제점을 감안하여 창출한 것으로서, 삽입 또는 삭제에 따른 데이터 변경시 새로운 값만을 추가하는 방식의 데이터 저장 특성을 이용하여 오류가 발생한 파티션 서버에서 서비스하던 파티션의 데이터를 재구축하는 클러스터 데이터 관리 시스템의 재수행 로그를 이용한 데이터 재구축 방법을 제공하는 데 그 목적이 있다.

전술한 목적을 달성하기 위하여, 본 발명의 일면에 따라, 클러스터 데이터 관리 시스템을 이용한 데이터 재구축 방법에 있어서, 오류가 발생한 파티션 서버에서 서비스한 파티션의 서비스 정보를 수집하는 단계; 상기 파티션 서버에서 작성된 재수행 로그 파일을 상기 파티션이 속한 테이블의 열 별로 분할하는 단계; 수집된 상기 서비스 정보와 분할된 상기 재수행 로그 파일의 로그 레코드를 근거로 파티션의 데이터를 재구축하는 단계; 및 상기 데이터가 재구축된 상기 파티션을 서비스할 새로운 파티션 서버를 선정하고, 상기 선정된 파티션 서버에 상기 파티션을 할당하는 단계를 포함하고, 상기 데이터를 재구축하는 단계는, 상기 파티션의 데이터를 재구축하도록 선정된 파티션 서버로 수집된 상기 서비스 정보 및 분할된 상기 재수행 로그 파일의 정보를 전달하는 단계를 포함하는 것인 클러스터 데이터 관리 시스템에서 재수행 로그를 이용한 데이터 재구축 방법을 제공한다.

본 발명의 다른 면에 따라, 재수행 로그를 이용하여 데이터를 재구축하는 클러스터 데이터 관리 시스템에 있어서, 적어도 하나 이상의 파티션에 대해 서비스를 담당하며 상기 파티션의 서비스에 따라 재수행 로그 파일을 작성하는 파티션 서버; 및 상기 파티션 서버에 오류 발생시 상기 파티션의 서비스 정보를 수집하고, 상기 재수행 로그 파일을 상기 파티션이 속한 테이블의 열 별로 분할하며 수집된 상기 파티션의 서비스 정보 및 분할된 상기 재수행 로그 파일의 로그 레코드를 근거로 상기 파티션의 데이터를 재구축할 상기 파티션 서버를 선정하는 마스터 서버를 포함하고, 상기 마스터 서버는, 선정된 상기 파티션 서버로 수집된 상기 서비스 정보 및 분할된 상기 재수행 로그 파일의 정보를 전달하는 것인 클러스터 데이터 관리 시스템을 제공한다.

본 발명에 따르면, 삽입 또는 삭제에 따른 데이터 변경시 새로운 값만을 추가하는 방식의 데이터 저장 특성을 이용하여 노드 오류시 갱신 버퍼를 통하지 않고 열별로 정렬된 로그를 이용하여 직접 데이터를 재구축함으로써, 디스크 입출력 및 CPU와 같은 컴퓨팅 자원의 사용을 줄일 수 있는 효과가 있다.

특히 CPU와 같은 컴퓨팅 자원의 사용을 줄임으로써 여분의 자원을 데이터 복구에 활용하여 데이터 복구 시간을 단축시킬 수 있는 이점이 있다.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명하되, 본 발명에 따른 동작 및 작용을 이해하는 데 필요한 부분을 중심으로 설명한다.

본 발명에서 제안하는 데이터 재구축 방법은 삽입과 삭제 요청으로 인해 데이터에 대한 변경 발생시 이전 데이터에 대해 변경하는 것이 아닌 새로운 값을 갖는 데이터가 추가되는 형태로 저장하는 특성을 이용한다.

이하, 첨부된 도면을 참조하여 본 발명에 대하여 상세하게 설명한다.

도 7은 본 발명에 따른 클러스터 데이터 관리 시스템을 설명하기 위한 블럭도이고, 도 8은 도 7의 데이터 복구를 설명하기 위한 예시도이다.

먼저 도 7를 참조하면, 클러스터 데이터 관리 시스템은 하나의 마스터 서버(100)와 n개의 파티션 서버(200-1,200-2,...,200-n)를 포함한다.

마스터 서버(100)는 각 파티션 서버(200-1,200-2,...,200-n)를 제어하고, 각 파티션 서버(200-1,200-2,...,200-n)에 오류 발생 여부를 탐지한다.

마스터 서버(100)는 오류 탐지시, 오류가 발생한 파티션 서버(예컨대, 200-3)에서 서비스한 파티션의 서비스 정보를 수집하고, 파티션 서버(200-3)에서 작성한 재수행 로그 파일을 파티션 서버(200-3)에서 서비스한 파티션(예컨대, P1,P2,P3)이 속한 테이블(예컨대, T1)의 열 별로 분할한다.

여기서 파티션의 서비스 정보는 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1, P2, P3)의 정보[예컨대, 오류가 발생한 파티션 서버(200-3)에서 테이블(T1)에 포함된 파티션 중 어느 파티션을 서비스하였는지 알 수 있는 정보], 각 파티션(P1, P2, P3)을 구성하는 열의 정보(예컨대, C1,C2,C3), 각 파티션(P1, P2, P3)을 구성하는 각 파티션(P1, P2, P3)이 속한 테이블(T1)의 행 범위 정보(예컨대, R1<=P1<R4, R4<=P2<R7, R7<=P3<R10)를 포함한다.

마스터 서버(100)는 기설정된 기준 정보, 예컨대 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1,P2,P3)이 속한 테이블(T1), 행 키, 셀 키 및 타임 스템프를 근거로 재수행 로그 파일의 로그 정보를 오름 차순으로 정렬하고, 정렬된 재수행 로그 파일의 로그 레코드를 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1,P2,P3)이 속한 테이블(T1)의 열 별로 분류한다.

마스터 서버(100)는 분류된 재수행 로그 파일을 열 별로 분할한다.

마스터 서버(100)는 파티션의 서비스 정보 및 재수행 로그 파일의 로그 정보를 근거로 오류가 발생한 파티션 서버(200-3)에서 서비스한 파티션(P1,P2,P3)의 데이터를 재구축할 새로운 파티션 서버(예컨대, 200-1)를 선정한다.

마스터 서버(100)는 선정된 파티션 서버(200-1)에 수집된 서비스 정보 및 분할된 재수행 로그 파일을 전달한다.

마스터 서버(100)는 선정된 파티션 서버(200-1)에서 파티션(P1,P2,P3)의 데이터 재구축을 완료할 경우, 데이터 재구축이 완료된 파티션을 서비스할 새로운 파티션 서버(예컨대, 200-2)를 선정한다.

마스터 서버(100)는 새롭게 선정된 파티션 서버(200-2)에게 데이터가 재구축된 파티션을 할당한다.

각 파티션 서버(200-1,200-2,...,200-n)는 마스터 서버(100)로부터 서비스 정보 및 재수행 로그 파일을 전달받을 경우, 전달받은 서비스 정보 및 분할된 재수행 로그 파일의 로그 정보를 근거로 파티션의 데이터를 재구축한다.

각 파티션 서버(200-1,200-2,...,200-n)는 전달받은 서비스 정보 및 재수행 로그 파일의 로그 정보를 근거로 파티션의 데이터를 재구축할 데이터 파일을 생성하고, 생성된 데이터 파일에 재수행 로그 파일의 로그 정보를 기록한다.

여기서 로그 정보는 로그 레코드인 것이 바람직하다.

각 파티션 서버(200-1,200-2,...,200-n)는 재수행 로그 파일의 로그 정보를 생성된 파티션의 데이터 파일에 기록할 경우, 재수행 로그 파일의 로그 정보가 현재 데이터를 재구축 중인 파티션에 속하는지 여부를 판단한다.

상기 판단결과, 속할 경우, 각 파티션 서버(200-1,200-2,...,200-n)는 생성된 데이터 파일에 재수행 로그 파일의 로그 정보를 이용하여 데이터 파일에 기록할 정보를 생성하여 기록한다.

그러나 판단결과, 속하지 않을 경우, 각 파티션 서버(200-1,200-2,...,200-n)는 새로운 데이터 파일을 생성하고, 생성된 데이터 파일에 재수행 로그 파일의 로그 정보를 이용하여 데이터 파일에 기록할 정보를 생성하여 기록한다. 로그 레코드를 이용하여 데이터 파일에 기록할 정보 생성시 로그 일련 번호는 제외한다.

여기서 데이터 파일에 기록할 정보는 데이터 파일의 레코드인 것이 바람직하다.

각 파티션 서버(200-1,200-2,...,200-n)는 데이터가 재구축된 파티션을 할당받을 경우, 할당받은 파티션에 대해 서비스를 시작한다.

도 8을 참조하여 본 발명에 따른 데이터 재구축을 설명하면, 파티션 서버(200-3)에 오류가 발생하고, 파티션 서버(200-1)는 마스터 서버에 의해 파티션 서버(200-3)에서 서비스한 파티션(P1,P2,P3)의 데이터를 재구축하도록 선정되며, 테이블 T1은 열 C1,C2,C3로 구성되고, 파티션 서버(200-3)에서 서비스한 파티션(P1,P2,P3)은 테이블(T1)에 속한다.

마스터 서버(100)는 재수행 로그 파일(810)의 로그 정보를 기설정된 기준 정보, 즉 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1,P2,P3)이 속한 테 이블(T1), 행 키, 셀 키 및 타임 스템프를 근거로 오름 차순으로 정렬하고, 테이블(T1)의 열 별로 분류한다.

마스터 서버(100)는 로그 정보가 테이블(T1)의 열 별로 분류된 재수행 로그 파일을 열 별로 분할한다.

즉, 재수행 로그 파일은 821(T1.C1), 822(T1.C2), 823(T1.C3)과 같이 열 별로 분할될 수 있다.

821(T1.C1)은 테이블(T1)의 열(C1)에 대한 로그 정보를 포함하고, 822(T1.C2)는 테이블(T1)의 열(C2)에 대한 로그 정보, 823(T1.C3)은 테이블(T1)의 열(C3)에 대한 로그 정보를 포함한다.

파티션 서버(200-1)는 열 별로 분할된 재수행 로그 파일의 로그 정보가 파티션(P1,P2,P3)의 서비스 정보(830)를 근거로 어느 파티션(P1 또는 P2 또는 P3)에 속하는지를 판단하고, 판단 결과에 따라 파티션의 데이터 파일을 생성한다. 파티션 서버(200-1)는 생성된 데이터 파일에 재수행 로그 파일의 로그 정보를 근거로 기록할 정보를 생성한 후 데이터 파일에 기록하면 841,842,843과 같다. 841은 파티션 P1, 842는 파티션 P2, 843은 파티션 P3에 대한 데이터 파일이다.

본 발명에서는 열 그룹 개념을 적용하는 시스템에 대한 설명은 별도로 하지 않았다. 하지만 본 발명의 핵심 개념은 열 그룹 개념을 적용하는 시스템에도 쉽게 적용할 수 있는 것은 물론이다.

또한 본 발명에서는 파티션 서버에 오류 발생시 오류가 발생한 파티션이 서비스한 파티션의 데이터를 재구축할 경우, 갱신 버퍼를 사용하지 않고 재수행 로그 파일로부터 직접 데이터를 구축할 수 있도록 함으로써 불필요한 디스크 입출력을 줄일 수 있다.

도 9는 본 발명에 따른 클러스터 데이터 관리 시스템을 이용한 데이터 재구축 방법을 설명하기 위한 흐름도이다.

도 9를 참조하면, 마스터 서버(100)는 각 파티션 서버(200-1,200-2,...,200-n)에 오류 발생 여부를 탐지한다(S900).

탐지결과, 오류가 발생한 경우, 마스터 서버(100)는 오류가 발생한 파티션 서버(예컨대, 200-3)가 서비스한 파티션(예컨대, P1,P2,P3)의 서비스 정보를 수집한다(S910).

여기서 파티션의 서비스 정보는 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1, P2, P3)의 정보[예컨대, 오류가 발생한 파티션 서버(200-3)에서 어느 파티션을 서비스하였는지 알 수 있는 정보], 각 파티션(P1, P2, P3)을 구성하는 열의 정보(예컨대, C1,C2,C3), 각 파티션(P1, P2, P3)을 구성하는 각 파티션(P1, P2, P3)이 속한 테이블(T1)의 행 범위 정보(예컨대, R1<=P1<R4, R4<=P2<R7, R7<=P3<R10)를 포함한다.

마스터 서버(100)는 오류가 발생한 파티션 서버(200-3)에서 작성한 재수행 로그 파일을 열 별로 분할한다(920).

마스터 서버(100)는 먼저 재수행 로그 파일의 로그 정보를 기설정된 기준 정보(예컨대, 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1,P2,P3)이 속한 테이블(T1), 행 키, 셀 키 및 타임 스템프)를 근거로 오름 차순으로 정렬한다. 마스터 서버(100)는 정렬된 재수행 로그 파일의 정보를 파티션(P1,P2,P3)이 속한 테이블(T1)의 열 별로 분류하고, 분류된 재수행 로그 파일을 열 별로 분할한다.

마스터 서버(100)는 오류가 발생한 파티션 서버(200-3)가 서비스한 파티션(P1,P2,P3)의 데이터를 재구축할 파티션 서버(예컨대, 200-1)를 선정한다.

예컨대, 마스터 서버(100)는 파티션(P1,P2,P3)의 데이터를 재구축하도록 파티션 서버(200-1)를 선정할 수 있다.

마스터 서버(100)는 선정된 파티션 서버(200-1)로 수집된 서비스 정보 및 분할된 재수행 로그 파일을 전달한다.

파티션 서버(200-1)는 마스터 서버(100)로부터 전달받은 서비스 정보 및 분할된 재수행 로그 파일의 로그 정보를 근거로 파티션(P1,P2,P3)의 데이터를 재구축한다(S930).

마스터 서버(100)는 파티션 서버(200-1)에서 파티션(P1,P2,P3)의 데이터 재구축을 완료한 경우, 파티션(P1,P2,P3)을 서비스할 새로운 파티션 서버(예컨대, 200-2)를 선정하고, 파티션(P1,P2,P3)을 할당한다.

파티션 서버(200-2)는 데이터가 재구축된 파티션(P1,P2,P3)을 할당받아 파티션(P1,P2,P3)에 대한 서비스를 시작한다(S940).

재수행 로그의 열 별로 분할 정렬하는 일과 데이터를 재구축하는 일은 맵/리듀스(map/reduce)와 같은 병렬 처리를 위한 소프트웨어를 이용할 수 있다.

도 10은 본 발명에 따른 서비스 정보와 열 별로 분할된 재수행 로그파일의 로그 정보를 근거로 파티션의 데이터를 재구축하는 방법을 설명하기 위한 흐름도이 다.

파티션 서버(200-1)는 마스터 서버로부터 서비스 정보 및 분할된 재수행 로그 파일을 전달받는다.

파티션 서버(200-1)는 전달받은 서비스 정보 및 분할된 재수행 로그 파일의 정보를 근거로 파티션(P1,P2,P3)의 데이터 재구축을 진행하기에 앞서 파티션의 정보(예컨대, 현재 데이터를 재구축할 파티션의 구별자, 즉 P)를 초기화한다(S1000).

파티션 서버(200-1)는 서비스 정보와 재수행 로그 파일의 로그 정보를 근거로(S1010) 재수행 로그 파일의 로그 정보가 현재 데이터의 재구축을 진행 중인 파티션에 속하는지 여부를 판단한다(S1020).

판단결과, 진행 중인 파티션에 속하지 않을 경우, 파티션 서버(200-1)는 파티션의 데이터 파일을 생성하고(S1030), 현재 데이터의 재구축을 진행 중인 파티션 정보를 재수행 로그 파일의 로그 정보, 즉 로그 레코드가 속한 파티션 정보로 수정한다(S1040).

예를 들어, 현재 데이터 재구축을 진행 중인 파티션 정보(P)가 파티션(P1)일 경우, 파티션 서버(200-1)는 821(T1.C1)의 R4가 현재 재구축을 진행 중인 파티션(P1)에 속하는지 여부를 821(T1.C1)의 R4가 속한 서비스 정보(예컨대, R1<=P1<R4, R4<=P2<R7, R7<=P3<R10)에 근거하여 판단하고, R4가 현재 재구축을 진행 중인 파티션(P1)에 속하지 않으므로, R4가 속한 파티션(P2)의 데이터 파일(842)을 생성하고, 현재 재구축을 진행 중인 파티션 정보(P)를 재수행 로그 파일의 로그 정보, 즉 R4가 속한 파티션(P2)으로 수정한다.

그러나 판단결과, 현재 데이터 재구축을 진행 중인 파티션에 속할 경우, 파티션 서버(200-1)는 재수행 로그 파일의 로그 정보, 즉 로그 레코드를 이용하여 생성된 데이터 파일에 기록할 정보, 즉 데이터 파일의 레코드를 형성한다(S1050).

파티션 서버(200-1)는 형성된 정보, 즉 데이터 파일의 레코드를 데이터 파일에 직접 기록한다(S1060).

예를 들어, 파티션 서버(200-1)는 822(T1.C2)의 R2가 현재 데이터 재구축을 진행 중인 파티션(P1)에 속하므로 R2를 갱신 버퍼를 통하지 않고 파티션(P1)의 데이터 파일(841)에 직접 기록한다.

분할한 모든 열에 대한 재수행 로그가 각 파티션(P1,P2,P3)의 데이터 재구축에 이용될 때까지 단계(1010 내지 1060)를 반복 수행한다.

이상 바람직한 실시예와 첨부도면을 참조하여 본 발명의 구성에 관해 구체적으로 설명하였으나, 이는 예시에 불과한 것으로 본 발명의 기술적 사상을 벗어나지 않는 범주내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

도 1은 일반적인 클러스터 데이터 관리 시스템을 설명한 블럭도.

도 2는 도 1에서 사용하는 다차원 맵 구조의 데이터 모델을 나타낸 예시도.

도 3 및 도 4는 도 1에서 갱신 버터를 사용한 데이터 관리를 설명한 예시도.

도 5는 갱신 버퍼가 디스크에 반영되는 방식을 설명한 예시도.

도 6은 일반적인 클러스터 데이터 관리 시스템에서 오류를 복구하는 방법을 설명한 흐름도.

도 7은 본 발명에 따른 클러스터 데이터 관리 시스템을 설명한 블럭도.

도 8은 도 7의 데이터 복구를 설명한 예시도.

도 9는 본 발명에 따른 클러스터 데이터 관리 시스템을 이용한 데이터 재구축 방법을 설명한 흐름도.

도 10은 본 발명에 따른 서비스 정보와 열 별로 분할된 재수행 로그파일의 로그 정보를 근거로 파티션의 데이터를 재구축하는 방법을 설명한 흐름도.

<도면의 주요 참조부호에 대한 설명>

100 : 마스터 서버 200-1 : 파티션 서버

200-2 : 파티션 서버 200-3 : 파티션 서버

810 : 재수행 로그 파일 821 : 열 별 분할된 로그 파일

822 : 열 별 분할된 로그 파일 823 : 열 별 분할된 로그 파일

830 : 서비스 정보 841 : 파티션

842 : 파티션 843 : 파티션

Claims

클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법에 있어서,

오류가 발생한 파티션 서버에서 서비스한 파티션의 서비스 정보를 수집하는 단계;

상기 파티션 서버에서 작성된 재수행 로그 파일을 상기 파티션이 속한 테이블의 열 별로 분할하는 단계;

수집된 상기 서비스 정보와 분할된 상기 재수행 로그 파일의 로그 레코드를 근거로 파티션의 데이터를 재구축하는 단계; 및

상기 데이터가 재구축된 상기 파티션을 서비스할 새로운 파티션 서버를 선정하고, 상기 선정된 파티션 서버에 상기 파티션을 할당하는 단계를 포함하고,

상기 데이터를 재구축하는 단계는,

상기 파티션의 데이터를 재구축하도록 선정된 파티션 서버로 수집된 상기 서비스 정보 및 분할된 상기 재수행 로그 파일의 정보를 전달하는 단계를 포함하는 것

인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제1항에 있어서, 상기 서비스 정보는,

상기 오류가 발생한 파티션 서버가 서비스한 파티션의 정보, 상기 각 파티션을 구성하는 상기 열의 정보, 상기 각 파티션을 구성하는 상기 각 파티션이 속한 테이블의 행 범위 정보를 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제1항에 있어서, 상기 열 별로 분할하는 단계는,

기설정된 기준 정보를 근거로 상기 재수행 로그 파일의 로그 정보를 정렬하는 단계;

정렬된 상기 재수행 로그 파일의 로그 정보를 상기 열 별로 분류하는 단계; 및

상기 로그 정보가 분류된 상기 재수행 로그 파일을 상기 열 별로 분할하는 단계

를 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제3항에 있어서, 상기 기준 정보는

상기 오류가 발생한 파티션 서버가 서비스한 파티션이 속한 테이블, 행 키, 셀 키 및 타임 스템프를 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제1항에 있어서, 상기 데이터를 재구축하는 단계는,

전달받은 상기 서비스 정보 및 상기 재수행 로그 파일의 로그 정보를 근거로 새로운 데이터 파일을 생성하는 단계; 및

생성된 상기 데이터 파일에 상기 재수행 로그 파일의 로그 레코드를 반영하는 단계를 더 포함하는 것

인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제5항에 있어서, 상기 반영하는 단계는,

상기 재수행 로그 파일의 기록 정보가 현재 데이터 재구축 중인 상기 파티션에 속하는지 여부를 판단하는 단계; 및

상기 판단결과, 속할 경우 생성된 상기 데이터 파일에 상기 재수행 로그 파일의 로그 레코드를 기록하는 단계

를 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제6항에 있어서, 상기 반영하는 단계는,

상기 판단결과, 속하지 않을 경우, 새로운 데이터 파일을 생성하는 단계; 및

생성된 상기 데이터 파일에 상기 재수행 로그 파일의 로그 레코드를 기록하는 단계

를 더 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제6항 또는 제7항에 있어서, 상기 로그 레코드를 기록하는 단계는,

상기 재수행 로그 파일의 로그 정보 중 로그 일련 번호를 제외한 나머지 정보로 데이터 파일에 기록할 정보를 생성하는 단계; 및

생성된 상기 데이터 파일에 기록할 정보를 상기 데이터 파일에 기록하는 단계

를 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
제1항에 있어서,

할당받은 상기 파티션 서버에서 상기 데이터가 재구축된 파티션의 서비스를 시작하는 단계를 더 포함하는 것인 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법.
공유 재수행 로그를 이용하여 데이터를 재구축하는 클러스터 데이터 관리 시스템에 있어서,

적어도 하나 이상의 파티션에 대해 서비스를 담당하며 상기 파티션의 서비스에 따라 재수행 로그 파일을 작성하는 파티션 서버; 및

상기 파티션 서버에 오류 발생시 상기 파티션의 서비스 정보를 수집하고, 상기 재수행 로그 파일을 상기 파티션이 속한 테이블의 열 별로 분할하며 수집된 상기 파티션의 서비스 정보 및 분할된 상기 재수행 로그 파일의 로그 정보를 근거로 상기 파티션의 데이터를 재구축할 상기 파티션 서버를 선정하는 마스터 서버를 포함하고,

상기 마스터 서버는,

선정된 상기 파티션 서버로 수집된 상기 서비스 정보 및 분할된 상기 재수행 로그 파일의 정보를 전달하는 것

인 클러스터 데이터 관리 시스템.
제10항에 있어서, 상기 서비스 정보는,

상기 오류가 발생한 파티션 서버가 서비스한 파티션의 정보, 상기 각 파티션을 구성하는 상기 열의 정보, 상기 각 파티션을 구성하는 상기 각 파티션이 속한 테이블의 행 범위 정보를 포함하는 것인 클러스터 데이터 관리 시스템.
제10항에 있어서, 상기 마스터 서버는,

기설정된 기준 정보를 근거로 상기 재수행 로그 파일의 로그 정보를 정렬하고, 정렬된 상기 재수행 로그 파일의 로그 정보를 상기 열 별로 분류하여 분류된 상기 열 별로 상기 재수행 로그 파일을 분할하는 것인 클러스터 데이터 관리 시스템.
제12항에 있어서, 상기 기준 정보는

상기 오류가 발생한 파티션 서버가 서비스한 파티션이 속한 테이블, 상기 테이블의 행 키, 상기 테이블의 셀 키 및 상기 테이블의 타임 스템프를 포함하는 것인 클러스터 데이터 관리 시스템.
삭제
제10항에 있어서, 상기 파티션 서버는,

전달받은 상기 서비스 정보 및 분할된 상기 재수행 로그 파일의 로그 정보를 근거로 상기 파티션의 데이터를 재구축하는 것인 클러스터 데이터 관리 시스템.
제15항에 있어서, 상기 파티션 서버는,

전달받은 상기 서비스 정보 및 상기 재수행 로그 파일의 로그 정보를 근거로 상기 파티션의 재구축할 데이터 파일을 생성하고, 생성된 상기 파티션의 데이터 파일에 상기 재수행 로그 파일의 로그 정보를 기록하는 것인 클러스터 데이터 관리 시스템.
제16항에 있어서, 상기 파티션 서버는,

상기 재수행 로그 파일의 로그 정보 기록시, 상기 로그 정보가 현재 데이터 재구축 중인 상기 파티션에 속하는지 여부를 판단하고, 상기 판단결과, 속할 경우, 생성된 상기 데이터 파일에 상기 로그 정보를 기록하는 것인 클러스터 데이터 관리 시스템.
제17항에 있어서, 상기 파티션 서버는,

상기 판단결과, 속하지 않을 경우, 새로운 데이터 파일을 생성하고, 생성된 상기 데이터 파일에 상기 로그 정보를 기록하는 것인 클러스터 데이터 관리 시스템.
제17 또는 제18 항에 있어서, 상기 파티션 서버는,

상기 재수행 로그 파일의 로그 정보 중 로그 일련 번호를 제외한 나머지 정보를 이용하여 상기 데이터 파일에 기록할 정보를 생성하고, 생성된 상기 데이터 파일에 기록할 정보를 상기 데이터 파일에 기록하는 것인 클러스터 데이터 관리 시스템.
제15항에 있어서, 상기 마스터 서버는,

상기 데이터가 재구축된 상기 파티션을 서비스할 새로운 파티션 서버를 선정하고, 상기 선정된 파티션 서버에 상기 파티션을 할당하는 것인 클러스터 데이터 관리 시스템.