KR20160101708A

KR20160101708A - 항암제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 항암제 선택 방법

Info

Publication number: KR20160101708A
Application number: KR1020160018788A
Authority: KR
Inventors: 김주한
Original assignee: 싸이퍼롬, 인코퍼레이티드
Priority date: 2015-02-17
Filing date: 2016-02-17
Publication date: 2016-08-25
Also published as: EP3261008A4; US11195594B2; EP3261008B1; WO2016133373A1; EP3261008A1; ES2891903T3; US20180032664A1; KR102482819B1

Abstract

본 발명은 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 항암제 선택 방법 및 시스템에 관한 것으로, 본 발명에 따른 방법 및 시스템은 항암제의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물, 즉 항암제에 대한 부작용 또는 위험성을 예측할 수 있는 기술로서 신뢰도가 높을 뿐 아니라, 적용범위 또한 넓은 범용적 기술이다.

Description

항암제 부작용 방지를 위한 개인별 단백질 손상 정보 기반의 항암제 선택 방법 {Method for personalized prevention of adverse drug reaction of anticancer drug based on information of individual deleterious protein sequence variation}

본 발명은 항암제 부작용 방지를 위한 개인 유전체 염기서열 분석을 이용한, 개인별 단백질 손상 정보 기반의 항암제 선택 방법에 관한 것이다.

생명공학 기술의 발전으로 인해 현재는 인간의 전 유전체 염기서열(whole genome sequence)을 분석하여 개개인의 질병을 예측하고 맞춤형 질병 예방 및 치료를 제공하는 단계까지 도달하였다.

최근에는 개인 유전체 염기서열을 비교한 결과, 염색체의 동일한 위치에 서로 다른 염기가 존재한다는 사실이 밝혀짐에 따라 이러한 염기서열의 차이를 의약품에 대한 개인 간 반응차이를 예측하는 데 이용하게 되었다. 예를 들어, 한 개인이 갖는 특정 유전체 염기서열 정보에 따라 약물대사가 느리거나 빠르기 때문에 약물에 대한 효과 및 부작용이 개인마다 다를 수 있다.

따라서 개인별 유전체 염기서열 차이를 이용하여 환자에 알맞은 약물과 용량을 선택할 수 있는 개인별 맞춤형 약물 선택에 대한 사회적 요구가 증가하고 있으며, 단일염기다형성(Single Nucleotide Polymorphism, SNP) 등의 유전체 정보를 마커로 활용하고, 해당 마커와 약물 반응성/약물 부작용 등의 상관관계에 대한 연구결과를 활용한 약물유전학 혹은 약물유전체학이 부상하고 있다.

약물유전학(pharmacogenetics)에서는 일반 인구집단이나 개인에서 약물이나 화학물질의 대사와 반응 차이를 유전학적으로 분석하여 예측한다. 일부 개인에서 약물에 대해 예상했던 약물반응 이외의 반응이 나타나기도 하는데 이러한 약물 부작용은 치료하는 질환의 중증도, 약물상호작용, 환자의 나이, 영양상태, 간 및 신장 기능, 기후나 음식물과 같은 환경적 요인에 기인하기도 하지만, 약물대사에 관련된 유전적 차이, 예를 들면, 약물 효소 유전자의 다형성(polymorphism)이 영향을 미치기도 하기 때문에 이와 관련된 연구가 진행되고 있다.

한편, 항암제·골수억제제의 일종인 부설판(Busulfan)은 골수이식 전 자신의 골수를 제거하기 위해 주로 사용되는 약물이다. 부설판은 치사량의 골수 독성과 견딜만한 전신 독성 사이의 아주 좁은 치료창을 갖고 있는 약물로, 약물 농도가 치료 범위보다 높으면 약물과 관련된 중증 독성이 나타나고, 약물 농도가 치료 범위보다 낮으면 생착 실패나 재발 위험성이 증가하는 문제를 가지고 있다. 부설판의 독성은 흔히 “Busulfan Lung”으로 불리는 간질성 폐 섬유화, 색소 과침착, 간질, 간성 정맥폐쇄성 질환(veno-occlusive disease, VOD), 구토, 혈소판 감소증 등이 있다. 부설판의 약동학은 개인마다 차이가 커서 위와 같은 문제가 발생할 여지가 크다.

이에 전처치 관련 독성을 감소시키기 위해 시험 용량 또는 첫 투여 후 약동학적 모델을 통해 적정 용량의 부설판을 투여하는 방법론이 제시되었다 (Kletzel M, 2006, Bartelink IH, 2008). 그러나 약동학 모델링을 위해서는 하루 최소 4~5회의 채혈과 투여 당일 농도측정 및 약동학 분석이 가능해야 하며, 고가의 Liquid Chromatography/Tandem Mass Spectrometry가 필요하여 전 세계적으로도 시행기관이 적다. 또한 이러한 방법을 위해서는 필히 치료제가 투여되어야 하기 때문에 이와 같은 방법으로는 투여 전에 적정 용량을 미리 예측하여 합병증을 예방하기 어렵다

이에 약물 투여 전에 약물의 부작용을 예측하기 위한 방법으로 위에서 언급된 약물유전체학이 사용될 수 있다. 부설판에 대해서도 혈중 농도 및 부작용이 약물유전체와 관련되어 있음이 알려져있다. 소아를 대상으로 한 부설판 약물유전체 연구에서 GSTM1 유전형이 부설판의 약동학에 영향을 미친다는 보고가 있었고(Ansari M. et al, 2010), 부설판의 중요한 약물대사 효소인 GSTA1 다형성에 따라 혈중 농도가 달라질 수 있음이 보고되었다(Kusama M. et al, 2006).

한편, 유사한 대사과정을 갖는 치오퓨린(Thiopurine) 계열의 약물은 혈액종양의 치료, 류마티스성 질환의 치료, 장기 이식 시의 면역억제 등 다양한 목적으로 사용되는 유용한 약물이다. 치오퓨린 계열 약물 중 하나인 아자치오프린 (Azathioprine)의 경우, 염증성 장 질환(Inflammatory Bowel Disease)인 궤양성 대장염(Ulcerative Colitis)과 크론병 (Crohn’s Disease) 치료시 면역억제제로 사용된다. 이때 일부 환자들은 골수 억제 및 백혈구 감소증을 겪게 되는데, 이는 thiopurine S-methyltransferase를 코딩하는 TPMT 유전자의 유전적 다형성과 밀접한 연관이 있는 것으로 알려져 있다. thiopurine S-methyltransferase는 치오퓨린 계열 약물을 대사하는 효소이다. TPMT에 대하여 알려진 몇 가지 유전형은 TPMT의 기능을 저해하거나 상실시켜 치오퓨린 계열 약물의 대사를 방해한다. 이와 같이 TPMT의 기능을 저해하는 유전형을 가진 환자에서, 골수억제와 같은 심각한 부작용이 많이 나타나는 것으로 알려져 있다.

치오퓨린계열 약물 중 다른 하나인 머캅토퓨린(Mercaptopurine)은 급성 림프구성 백혈병(Acute Lymphatic Leukemia) 치료시 유지 치료(Maintenance therapy)를 위하여 다른 약물들과 함께 사용된다. 아자치오프린과 마찬가지로, 머캅토퓨린 또한 백혈구 감소증이나 무과립구증과 같은 생명을 위협하는 심각한 부작용을 유발할 수 있다. 머캅토퓨린 또한 치오퓨린계열 약물이므로 TPMT 유전자 변이와 머캅토퓨린 부작용 발생 간의 연관관계가 밝혀져 있다.

한편, TPMT 유전자의 변이는 아시아인들에서는 잘 발견되지 않으나, 치오퓨린 계열 약물에 의한 백혈구 감소증의 빈도는 더 높다. 한 연구(Yang, S. K., Hong, M., Baek, J., Choi, H., Zhao, W., Jung, Y., ... & Park, S. K. (2014). A common missense variant in NUDT15 confers susceptibility to thiopurine-induced leukopenia. Nature genetics, 46(9), 1017-1020.)에 따르면, 치오퓨린 계열 약물로 치료받은 크론병 환자를 대상으로 연구한 결과, NUDT15 유전자의 변이가 치오퓨린 치료시 나타나는 백혈구 감소증과 높은 연관성을 보였다.

현재 약물의 체내 대사에 있어 수십에서 수백 개의 약물 대사 관련 유전자들의 유전 변이가 해당 단백질의 기능에 영향을 주어 약물 대사를 증가 또는 감소시킨다는 것이 알려져 있고, 새로운 유전변이를 규명하는 것 역시 필요하지만 기존의 소수 유전자의 분석만으로는 다양한 약물 대사 관련 유전자들 전체를 파악하기에는 한계가 있다. 따라서 소수 유전자나 단일염기 다형성과 같은 마커를 이용한 인구 집단 관찰 연구 결과에 근거한 방법을 넘어서서, 개인 유전체 염기서열 변이 정보를 직접 활용하여 이에 수반되는 단백질 변이와 그 생물학적 영향에 대한 이론적 추론을 수행함으로써 보다 유용하고 신뢰할 수 있는 개인별 항암제 선택을 위한 정보를 제공하는 방법론 도입의 필요성이 강하게 제기된다.

본 발명은 상기와 같은 점을 감안하여 안출된 것으로, 개인 유전체 염기서열 변이 정보를 분석하고, 항암제, 골수억제제 및 이와 유사한 대사과정을 갖는 면역억제제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보로부터 개인별 단백질 손상 점수를 산출한 후, 이를 약물과 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출함으로써, 항암제 부작용 가능성을 예측하고, 항암제를 선택하기 위한 정보를 제공하는 방법을 제공하고자 한다.

한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 항암제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법을 제공한다.

다른 양태에서 본 발명은 개인에게 적용할 수 있는 항암제에 대하여, 상기 항암제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템을 제공한다.

또 다른 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 항암제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계;를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는, 컴퓨터 판독 가능한 매체를 제공한다.

본 발명의 개인별 유전체 염기서열 변이 정보에 기반을 둔 개인별 항암제 선택 방법 및 시스템은 항암제의 약력학 또는 약동학에 관여하는 다양한 단백질을 코딩하는 유전자의 엑손 영역의 서열 분석을 통하여 개인별로 특정 약물, 즉 항암제에 대한 반응성을 예측할 수 있는 기술로서 신뢰도가 높다.

기존의 약동학 모델링에 기반한 부설판의 투여 용량 조절 방식은 하루 수 차례의 채혈과 혈액 샘플의 즉각적인 분석을 위한 장비 구축의 어려움으로 널리 시행되지 못했던 반면, 또한, 실험방법의 발전으로 유전형을 알아내기 위한 기술(PCR, SNP chip, capillary sequencing, NGS 등)을 임상적으로 사용하는 것이 용이해져 약물 유전체학에 기반을 둔 본 발명이 임상 현장에서 널리 사용될 것을 기대할 수 있다. 특히 차세대염기서열해독법(Next Generation Sequencing, NGS)의 가격이 급속하게 떨어져 환자당 수만원~수십만원 대의 가격에서 유전체 관점에서의 접근이 가능하다.

또한, 기존의 약물유전체 연구 방법은 약물-유전자 관계쌍별로 연구를 수행하여야 하는데, 쌍의 개수는 약물 수와 유전자 마커 수의 곱에 비례하여 증가하므로, 약물-유전자 관계쌍을 모두 연구하는 것은 현실적으로 불가능에 가까워 충분한 근거자료가 생성되지 못하는 실정이고, 연구 대상군 선정과 인구 집단 간의 차이에 따른 통계적 오류도 큰 반면, 본 발명의 방법은 분자 수준의 연구 및 분석 결과를 직접 맞춤약물치료에 적용하므로 거의 모든 약물유전자 관계쌍에 대한 근거를 확보할 수 있는 장점이 있으며, 인구 집단 간의 차이에 큰 영향을 받지 않고 적용할 수 있다는 장점이 있다.

특히, 본 발명에 따른 방법 및 시스템을 이용할 경우, 항암제, 예를 들어 부설판에 대한 부작용 또는 위험성을 사전에 예측함으로써 개인에 적용되는 항암제의 사용 여부 및 사용 방법을 결정하는데 유용하게 사용될 수 있으며, 이는 소아암 환자에서 부설판의 적정 용량 투여를 통한 생존율 향상으로 이어질 수 있다. 또한, 전처치가 어려워 조혈모 세포 이식이 용이하지 않았던 환자군에 대해서도 부설판 전처치의 안전성을 높임으로써 새로운 치료방법을 도입할 수도 있을 것이다.

또 다른 항암제인 머캅토퓨린에 대해서 본 발명이 적용되는 경우 약물에 대한 부작용 또는 위험성을 사전에 예측함으로써 개인에 적용되는 항암제의 사용 여부 및 사용 방법을 결정하는데 유용하게 사용될 수 있으며, 이는 치료 중 백혈구감소증 등의 부작용으로 인해 입원기간이 길어지거나 환자의 건강상태가 악화되는 것을 막아 생존율 향상 및 치료비용 감소로 이어질 수 있다.

나아가 항암제-단백질 상호관계에 대한 새로운 지식이 발견되거나 제공되는 경우, 이는 본 발명의 방법에 용이하게 추가되고 적용될 수 있으므로, 향후 연구 결과 정보의 축적에 따라 보다 향상된 맞춤형 치료방법이 제공될 수 있는 장점이 있다.

도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다.
도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템의 개략적 구성도이다(DB: 데이터베이스).
도 3은 본 발명의 일 실시예에 따른 유전체 염기서열 변이를 이용한 항암제 선택 방법의 검증을 위한 ROC (Receiver Operating Curve) 커브를 보여주는 흐름도이다.

본 발명은 개인 유전체 염기서열 변이 정보의 분석을 통해 개인별로 항암제를 이용한 약물치료에서 개인 맞춤형으로 안전성이 높은 약물과 용량/용법을 선택할 수 있다는 발견에 근거한 것이다.

한 양태에서 본 발명은 개인 유전체 염기서열 정보로부터 항암제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법에 관한 것이다.

본 발명에서 항암제는 하기 표 1에 개시된 약물, 이의 유도체, 및 이의 약학적으로 허용가능한 염 등 동일, 유사한 약리 활성을 나타내는 물질을 모두 포함하며, 예를 들어, 티오구아닌(Thioguanine), 머캅토퓨린(Mercaptopurine), 아자치오프린(Azathioprine)을 포함하는 치오퓨린계열 약물, 클라드리빈(Cladribine), 플루다라빈(Fludarabine), 클로파라빈(Clofarabine), 네라라빈(Nelarabine)을 포함하는 디옥시뉴클레오사이드 유사체, 트레오설판(Treosulfan), 만노설판(Mannosulfan), 부설판(busulfan)을 포함하는 알킬화제, 기타 대사길항제, 항미세소관제, 토포이소머레이즈 차단제, 세포독성 항체 등이며, 바람직하게는 부설판 또는 머캅토퓨린이나 이로 제한되는 것은 아니다.

Temozolomide	Gefitinib	Amsacrine	Ethinyl Estradiol	Fluorouracil	Trastuzumab
Trastuzumab (genetical recombination)	Megestrol	Celecoxib	Flutamide	Ifosfamide	Dasatinib
Procarbazine	Fulvestrant	Temsirolimus	Pemetrexed	Histamine	Tamoxifen
Ciclosporin	Letrozole	Medroxyprogesterone	Capecitabine	Daunorubicin	Sorafenib
Exemestane	Dactinomycin	Nilutamide	Oxaliplatin	Vinorelbine	Imatinib
Thioguanine	Topotecan	Aminoglutethimide	Erlotinib	Vindesine	Cyclosporine
Mitomycin	Hydroxyurea	Mercaptopurine	Gemcitabine	Etoposide	Vincristine
Ixabepilone	Aminolevulinic acid	Mitoxantrone	Teniposide	Diethylstilbestrol	Vinblastine
Busulfan	Azathioprine	Idarubicin	Cyclophosphamide	Epirubicin	Paclitaxel
Lomustine	Bicalutamide	Trabectedin	Cisplatin	Thalidomide	Bortezomib
Streptozocin	Toremifene	Dacarbazine	Cytidine	Cladribine	Tretinoin
Thiotepa	Anastrozole	Bexarotene	Arsenic trioxide	Irinotecan	Methotrexate
Gemtuzumab ozogamicin (genetical recombination)	Clofarabine	Estramustine	Nilotinib	Sunitinib	Nelarabine
Everolimus	Fludarabine	Lapatinib	Sirolimus	Docetaxel	Treosulfan
Afatinib	Cabazitaxel	Tacrolimus	Leflunomide	Ethanol	Mannosulfan

본 발명에서 항암제의 약력학 또는 약동학에 관여하는 유전자 정보는 DrugBank (http://www.drugbank.ca/) 또는 KEGG Drug (http://www.genome.jp/kegg/drug/) 또는 PharmGKB (https://www.pharmgkb.org/)등과 같은 데이터베이스에서 수득할 수 있으며, 바람직하게는 ABCC1, ABCG2, APEX1, CBR3, ATP7A, CBR3, CTH, CUL9, CYP1A1, CYP2C9, CYP2D6, CYP4B1, DPEP1, DPEP2, DPYD, DRD3, EPHX1, FMO2, FMO3, GGT1, GGT5, GGT6, GNB3, GSTA2, GSTM1, MGMT, MLH1, MSH2, NAT1, OPRM1, PDE5A, PTGS1, SERPINA6, SLC15A2, SLC22A1, SLC22A2, SLC22A8, SLC22A16, SLC22A2, SLC28A2, SLC28A3, SPG7, TP53, ABCB1, ABCC2, AOX1, CHRM2, CYP1B1, CYP3A4, CYP3A5, CYP4F2, DBH, ERCC2, GGH, GGT7, GMPS, MTHFR, NUDT15, PDE3A, PDE4C, SLC22A5, SLCO1B1, TLR3, UGT1A1, XDH 등을 포함하나, 이로 제한되는 것은 아니다.

본 발명에서 유전자/단백질은 HGNC(HUGO Gene Nomenclature Committee)의 명명법에 따라 표시하였다(Gray KA, Daugherty LC, Gordon SM, Seal RL, Wright MW, Bruford EA. genenames.org: the HGNC resources in 2013. Nucleic Acids Res. 2013 Jan;41(Database issue):D545-52. doi: 10.1093/nar/gks1066. Epub 2012 Nov 17 PMID:23161694).

본 발명에서 일 정보로 사용되는 유전자 염기서열 변이는 개인의 유전자 염기서열의 변이 또는 다형성을 일컫는 것이다. 본 발명에서 유전자 염기서열 변이 또는 다형성은 항암제의 약력학 또는 약동학과 관련된 단백질을 코딩하는 유전자 부위, 특히 엑손(exon) 부위에서 발생하는 것이나 이로 제한되는 것은 아니다.

본 발명에서 사용된 용어 “염기서열 변이 정보”는 유전자의 엑손을 구성하는 염기의 치환, 부가 또는 결실에 관한 정보를 의미한다. 이러한 염기의 치환, 부가, 또는 결실은 여러 가지 원인에 의해 발생할 수 있으며, 예를 들면 염색체의 돌연변이, 절단, 결실, 중복, 역위 및/또는 전좌를 포함하는 구조적 차이에 의할 수 있다.

다른 측면에서 염기서열의 다형성이란 유전체 상에 존재하는 염기서열의 개인 간 차이를 말하는 것으로, 염기서열 다형성에서 그 수가 가장 많은 것은 단일염기다형성(Single Nucleotide Polymorphism, SNP)이며, A, T, C, G로 이루어진 염기서열 중 하나의 염기에 개인 간 차이가 있는 것이다. 염기서열 다형성은 SNP를 포함하여 SNV(Single Nucleotide Variation), STRP(short tandem repeat polymorphism), 또는 VNTR(various number of tandem repeat) 및 CNV(Copy number variation)를 포함하는 다수체(polyalleic) 변이의 형태로 나타날 수 있다.

본 발명의 방법에서 개인의 유전체에서 발견되는 염기서열 변이 또는 다형성 정보는 항암제의 약력학 또는 약동학과 관련된 단백질과 관련되어 수집된다. 즉, 본 발명의 방법에 사용되는 염기서열 변이 정보는 수득한 개인의 유전체 염기서열 정보 중 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자, 예를 들면, 약물과 관련된 표적(target) 단백질, 약물 대사에 관여하는 효소(enzyme) 단백질, 수송체 단백질(transporter) 또는 운반체(carrier) 단백질을 코딩하는 유전자의 특히 엑손 영역에서 발견되는 변이 정보이나 이로 제한되는 것은 아니다.

본 발명에서 사용되는 개인의 유전체 염기서열 정보는 공지된 염기서열해독법을 이용하여 결정될 수 있으며, 또한 상용화된 서비스를 제공하는 Complete Genomics, BGI (Beijing Genome Institute), Knome, Macrogen, DNALink 등의 서비스를 이용할 수 있으며, 이에 제한되지 않는다.

본 발명에서 개인의 유전체 염기서열에 존재하는 유전자 염기서열 변이 정보는 다양한 방법을 이용하여 추출될 수 있으며, 참조군, 예를 들면 HG19의 유전체 염기서열과의 서열 비교 프로그램, 예를 들어, ANNOVAR(Wang et al., Nucleic Acids Research, 2010; 38(16): e164), SVA(Sequence Variant Analyzer) (Ge et al., Bioinformatics. 2011; 27(14): 19982000), BreakDancer(Chen et al., Nat Methods. 2009 Sep; 6(9):677-81) 등을 이용한 염기서열 비교 분석을 통해 수득될 수 있다.

상기 유전자 염기서열 변이 정보는 컴퓨터 시스템을 통하여 접수/수득될 수 있으며, 이런 측면에서 본 발명의 방법은 유전자 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함할 수 있다. 본 발명에서 사용되는 컴퓨터 시스템은 상기 항암제의 약력학 또는 약동학에 관여하는 유전자, 예를 들면 약물과 관련된 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질 등을 코딩하는 유전자에 관한 정보를 포함하는 하나 이상의 데이터베이스를 포함하거나 데이터베이스에 접근 가능하다. 이러한 데이터베이스는 예를 들면 DrugBank (http://www.drugbank.ca/), KEGG Drug (http://www.genome.jp/kegg/drug/), PharmGKB (http://www.pharmgkb.org/) 등을 포함하는 유전자/단백질/약물-단백질 상호작용 등에 관한 정보를 제공하는 공개 또는 비공개 데이터베이스 또는 지식베이스를 포함할 수 있으나, 이에 제한되지 않는다.

본 발명에서 항암제는 사용자가 입력한 정보, 처방(전)으로부터 입력된 정보, 또는 항암제에 대한 정보를 포함하는 데이터베이스로부터 입력된 정보일 수 있다. 상기 처방전은 전자처방전을 포함하며, 이에 제한되지 않는다.

본 발명에서 사용된 용어 “약동학(pharmaco-kinetics, pk) 또는 약동학적 파라미터”는 일정 시간 동안 약물의 체내에서의 흡수, 이동, 분포, 전환, 배출과 관련된 약물의 특성을 일컫는 것으로, 약물의 분포용적(Vd), 청소율(CL), 생체이용율(F), 흡수속도계수(ka), 최대 혈중 약물 농도(maximum plasma concentration, Cmax), 최대 혈중 약물 농도의 도달시간(time point of maximum plasma concentration, Tmax), 일정 시간 동안의 혈중 약물 농도 변화에 대한 그래프 아래의 면적(AUC, Area Under the Curve) 측정 등을 포함하는 것이다.

본 발명에서 사용된 용어 “약력학(pharmacodynamics) 또는 약력학적 파라미터”는 약물의 생체에 대한 생리학적 및 생화학적 작용과 그 작용기전, 즉 약물이 일으키는 생체의 반응 또는 효과와 관련된 특징을 일컫는 것이다.

본 발명에서 사용된 용어 “유전자 염기서열 변이 점수”란 유전체 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에서 발견되었을 때, 이러한 개별 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열 변이(치환, 부가 또는 결실) 또는 전사 조절 변이를 초래하여, 해당 단백질의 구조 및/또는 기능에 유의한 변화 혹은 손상을 유발하는 정도를 수치화한 점수를 말하며, 상기 유전자 염기서열 변이 점수는 유전체 염기서열 상에서 아미노산의 진화론적 보존 정도, 변형된 아미노산의 물리적 특성에 따른 해당 단백질의 구조나 기능의 변화에 미치는 정도 등을 고려하여 산출할 수 있다.

본 발명에서 개인별 단백질 손상 점수 또는 개인별 약물 점수 산출에 적용하기 위해, 유전자 염기서열 변이 점수를 산출하는 방법은 당업계에 공지된 방법을 이용하여 수행될 수 있다. 예를 들면, SIFT (Sorting Intolerant From Tolerant, Pauline C et al., Genome Res. 2001 May; 11(5): 863874; Pauline C et al., Genome Res. 2002 March; 12(3): 436446; Jing Hul et al., Genome Biol. 2012; 13(2): R9), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping, Ramensky V et al., Nucleic Acids Res. 2002 September 1; 30(17): 38943900; Adzhubei IA et al., Nat Methods 7(4):248-249 (2010)), MAPP (Eric A. et al., Multivariate Analysis of Protein Polymorphism, Genome Research 2005;15:978986), Logre (Log R Pfam E-value, Clifford R.J et al., Bioinformatics 2004;20:1006-1014), Mutation Assessor (Reva B et al., Genome Biol. 2007;8:R232, http://mutationassessor.org/), Condel (Gonzalez-Perez A et al.,The American Journal of Human Genetics 2011;88:440449, http://bg.upf.edu/fannsdb/), GERP (Cooper et al., Genomic Evolutionary Rate Profiling, Genome Res. 2005;15:901-913, http://mendel.stanford.edu/SidowLab/downloads/gerp/), CADD (Combined Annotation-Dependent Depletion, http://cadd.gs.washington.edu/), MutationTaster, MutationTaster2 (Schwarz et al., MutationTaster2: mutation prediction for the deep-sequencing age. Nature Methods 2014;11:361362, http://www.mutationtaster.org/), PROVEAN (Choi et al., PLoS One. 2012;7(10):e46688), PMut (Ferrer-Costa et al., Proteins 2004;57(4):811-819, http://mmb.pcb.ub.es/PMut/), CEO (Combinatorial Entropy Optimization, Reva et al., Genome Biol 2007;8(11):R232), SNPeffect (Reumers et al., Bioinformatics. 2006;22(17):2183-2185, http://snpeffect.vib.be), fathmm (Shihab et al., Functional Analysis through Hidden Markov Models, Hum Mutat 2013;34:57-65, http://fathmm.biocompute.org.uk/) 등과 같은 알고리즘을 이용하여 유전자 염기서열 변이 정보로부터 유전자 염기서열 변이 점수를 산출할 수 있으며, 이에 제한되지 않는다.

상술된 알고리즘들의 목적은 각각의 유전자 염기서열 변이가 단백질 기능에 얼마나 영향을 미치고, 이 영향이 단백질에 얼마나 손상을 주게 되는지, 혹은 별다른 영향이 없는지 가려내기 위함이다. 이들은 기본적으로 개별 유전자 염기서열 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열에 초래할 변화를 고려하여 해당 단백질의 구조 및/또는 기능에 미칠 영향을 판단한다는 점에서 공통점이 있다.

본 발명에 따른 일 구현예에서는 개별 유전자 염기서열 변이 점수를 산출하기 위하여, SIFT (Sorting Intolerant From Tolerant) 알고리즘을 이용하였다. SIFT 알고리즘의 경우, 예를 들면, VCF (Variant Call Format) 형식 파일로 유전자 염기서열 변이 정보를 입력받아, 각각의 유전자 염기서열 변이가 해당 유전자를 손상시키는 정도를 점수화 한다. SIFT 알고리즘의 경우 산출 점수가 0에 가까울수록 해당 유전자가 코딩하는 단백질의 손상이 심해서 해당 기능이 손상됐을 것으로 판단하고, 1에 가까울수록 해당 유전자가 코딩하는 단백질이 정상 기능을 유지하고 있을 것으로 판단한다.

또 다른 알고리즘인 PolyPhen-2의 경우, 산출 점수가 높을수록 해당 유전자가 코딩하는 단백질의 기능적 손상 정도가 큰 것으로 판단한다.

최근에는 SIFT, Polyphen2, MAPP, Logre, Mutation Assessor를 서로 비교하고 종합하여 Condel 알고리즘을 제시한 연구(Gonzalez-Perez, A. & Lopez-Bigas, N. Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score, Condel. The American Journal of Human Genetics, 2011;88(4):440-449.)가 발표되었으며, 상기 연구에서는 단백질에 손상을 주는 유전자 염기서열 변이 및 영향이 적은 유전자 염기서열 변이와 관련하여 공지된 데이터의 집합인 HumVar와 HumDiv(Adzhubei, IAet al., A method and server for predicting damaging missense mutations. Nature methods, 2010;7(4):248-249)를 사용하여 상기 다섯 개의 알고리즘을 비교하였다. 그 결과, HumVar의 97.9%의 단백질 손상을 일으키는 유전자 염기서열 변이와 97.3%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었으며, HumDiv의 99.7%의 단백질 손상을 일으키는 유전자 염기서열 변이와 98.8%의 영향이 적은 유전자 염기서열 변이가 상기 다섯 개의 알고리즘 중 최소 세 개의 알고리즘에서 동일하게 감지되었다. 또한, 상기 HumDiv와 HumVar에 대하여 상기 다섯 개의 알고리즘과 각 알고리즘을 통합하여 계산한 결과들의 정확도를 나타내는 ROC (Receiver Operating Curve) 곡선을 그려본 결과, 상당히 높은 수준(69%~88.2%)에서 AUC(Area Under the Receiver Operating Curve)의 일치도를 보이는 것을 확인하였다. 즉 상술한 다양한 알고리즘들은 그 산출 방법은 달라도 산출된 유전자 염기서열 변이 점수들은 서로 유의하게 상관된 것이다. 따라서 상술한 알고리즘들 또는 알고리즘들을 응용한 방법을 적용하여 산출된 유전자 염기서열 변이 점수를 본원 발명에 의한 개인별 단백질 손상 점수 및 개인별 약물 점수 산출 단계에 적용하는 것은 각 유전자 염기서열 변이 점수를 산출하는 서로 다른 알고리즘의 종류에 상관없이 본 발명의 범위에 속하는 것이다.

유전자 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에 발생할 경우, 이는 단백질의 구조 및/또는 기능에 직접적인 영향을 미칠 수 있다. 따라서 상기 유전자 염기서열 변이 정보를 단백질 기능 손상 정도와 관련시킬 수 있다. 이런 측면에서 본 발명의 방법은 다음의 단계에서, 상술한 유전자 염기서열 변이 점수를 기반으로 개인별 단백질 손상 점수를 산출한다.

본 발명에서 사용된 용어“단백질 손상 점수”란 하나의 단백질을 코딩하는 유전자 부위에 두 개 이상의 유의한 염기서열 변이가 발견되어, 하나의 단백질이 두 개 이상의 유전자 염기서열 변이 점수를 갖게 되는 경우, 상기 유전자 염기서열 변이 점수를 종합하여 계산된 점수를 말하며, 만약 단백질을 코딩하는 유전자 부위에 유의한 염기서열 변이가 한 개인 경우에는 유전자 염기서열 변이 점수와 단백질 손상 점수가 동일하다. 이때, 단백질을 코딩하는 유전자 염기서열 변이가 두 개 이상인 경우, 단백질 손상 점수는 각 변이별로 계산된 유전자 염기서열 변이 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다.

본 발명에 따른 일 구현예에서는 하기 수학식 1에 의해 단백질 손상 점수를 산출하였으며, 하기 수학식 1은 다양한 변형이 가능하고 이에 제한되지 않는다.

[수학식 1]

상기 수학식 1에서 S _g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, v _i 는 i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수이고, p는 0이 아닌 실수이다. 상기 수학식 1에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.

본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 2에 의해 단백질 손상 점수를 산출하였으며, 하기 수학식 2는 다양한 변형이 가능하고 이에 제한되지 않는다.

[수학식 2]

상기 수학식 2에서 S _g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, v _i 는 i 번째 유전자 염기서열 변이의 유전자 염기서열 변이 점수, w _i 는 상기 v _i 에 부여되는 가중치이다. 모든 가중치 w _i 가 같은 값을 갖는 경우 상기 단백질 손상 점수 S _g 는 상기 유전자 염기서열 변이 점수 v _i 의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물대사효소의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다.

본 발명에서 사용된 용어 “약물대사효소의 약동학적 파라미터”는 Vmax, Km, Kcat/Km 등을 포함하는 것이다. Vmax는 기질 농도가 매우 높을 때의 최대 효소 반응 속도이고, Km은 해당 반응이 1/2 Vmax에 도달하게 하는 기질의 농도이다. Km은 해당 효소와 해당 기질 간의 친화도로 볼 수 있으며, Km이 작을수록 해당 효소와 해당 기질 간의 결합이 강하다. 효소의 대사회전수라고도 불리는 Kcat은 해당 효소가 최대 속도로 활동하고 있을 때 각 효소 활성 부위 당 1초의 시간에 대사되는 기질 분자의 개수를 의미하며, 해당 효소 반응이 실제 얼마나 빠르게 일어나는지를 의미한다.

본 발명의 방법은 다음 단계에서 상술한 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출한다.

본 발명에서 사용된 용어“약물 점수”란 소정의 약물, 예를 들어 항암제가 주어졌을 때, 해당 약물의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 또는 운반체 단백질들을 찾아내어, 해당 단백질들의 단백질 손상 점수를 계산한 후, 이를 다시 종합하여 하나의 약물에 대하여 산출된 값을 말한다.

본 발명에서 약물 점수는 항암제의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 상기 단백질 손상 점수들의 평균값으로 계산되며, 이러한 평균값은 예를 들면 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 또는 단순 곱 또는 가중곱, 또는 상기 산출값들의 함수 연산으로 계산될 수 있으나, 이에 제한되지 않는다.

상기 약물 점수는 약물학적 특성을 고려하여 해당 약물, 즉 항암제의 약력학 또는 약동학에 관여하는 표적 단백질, 약물 대사에 관여하는 효소 단백질, 수송체 단백질 및 운반체 단백질의 가중치를 조율하여 산출될 수 있으며, 상기 가중치는 해당 약물 대사 효소 단백질의 약동학적 파라미터, 인구 집단 또는 인종별 분포 등을 고려하여 부여될 수 있다. 또한, 해당 약물과 직접 상호작용하지는 않지만, 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이를 구성하는 단백질들의 단백질 손상 점수도 함께 고려한 약물 점수를 산출할 수 있다. 또한, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질들의 단백질 손상 점수를 함께 고려한 약물 점수를 산출할 수 있다. 상기 해당 약물의 약물학적 패스웨이를 구성하거나, 해당 단백질들과 유의하게 상호작용하거나 그 신호전달경로에 참여하는 단백질에 관한 정보는 PharmGKB (Whirl-Carrillo et al., Clinical Pharmacology & Therapeutics 2012;92(4):414-4171), The MIPS Mammalian Protein-Protein Interaction Database (Pagel etl al., Bioinformatics 2005;21(6):832-834), BIND (Bader et al., Biomolecular Interaction Network Database, Nucleic Acids Res. 2003 Jan 1;31(1):248-50), Reactome (Joshi-Tope et al., Nucleic Acids Res. 2005 Jan 1;33(Database issue):D428-32) 등의 공지된 생물학적 데이터베이스에서 검색할 수 있다.

본 발명에 따른 일 구현예에서는 하기 수학식 3에 의해 약물 점수를 산출하였으며, 하기 수학식 3은 다양한 변형이 가능하므로, 이에 제한되지 않는다.

[수학식 3]

상기 수학식 3에서 S _d 는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이를 구성하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, g _i 는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이를 구성하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, p는 0이 아닌 실수이다. 상기 수학식 3에서 상기 p의 값이 1일 때는 산술평균, 상기 p의 값이 -1일 때는 조화평균이 되며, 상기 p의 값이 0에 가까워지는 극한의 경우에는 기하평균이 된다.

본 발명에 따른 또 다른 일 구현예에서는 하기 수학식 4에 의해 약물 점수를 산출하였으며, 하기 수학식 4는 다양한 변형이 가능하므로, 이에 제한되지 않는다.

[수학식 4]

상기 수학식 4에서 S _d 는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이를 구성하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 수, g _i 는 상기 약물 d의 약력학 또는 약동학에 직접 관여하거나 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 예를 들면, 약물학적 패스웨이를 구성하는 유전자 군에서 선정된 하나 이상의 유전자가 코딩하는 단백질의 단백질 손상 점수이며, w _i 는 상기 g _i 에 부여되는 가중치이다. 모든 가중치 w _i 가 같은 값을 갖는 경우 상기 약물 점수 S _d 는 상기 단백질 손상 점수 g _i 의 기하평균값이 된다. 상기 가중치는 해당 단백질의 종류, 해당 단백질의 약동학적 또는 약력학적 분류, 해당 약물 대사 효소의 약동학적 파라미터, 인구 집단 또는 인종별 분포를 고려하여 부여될 수 있다.

본 발명에 따른 일 구현예의 방법에 사용되는 기하평균 계산법의 경우 약물과 단백질의 연관성이 갖는 특징과 상관없이 가중치를 모두 동일하게 부여하였지만, 약물과 단백질의 연관성이 갖는 각 특징을 고려한 가중치를 부여하여 약물 점수를 산출하는 것이 가능하다. 예를 들어 약물의 표적 단백질과 약물과 관련된 수송체 단백질에는 다른 점수가 부여될 수 있다. 또한, 예를 들어 해당 약물 대사 효소에는 그 약동학적 파라미터인 Km, Vmax, Kcat/Km를 가중치로 부여하여 약물 점수를 산출하는 것이 가능하다. 또한, 예를 들어 표적 단백질은 수송체 단백질과 비교하여 약리작용상 더 중요하다고 판단하여 높은 가중치를 부여할 수 있고, 수송체 단백질이나 운반체 단백질은 농도에 민감한 약물에 대해서 높은 가중치가 부여될 수 있으며, 이에 제한되지 않는다. 가중치는 약물과 약물 관련 단백질 간의 상관관계, 약물과 단백질 상호작용의 특성에 따라 면밀히 조정될 수 있다. 예를 들면 표적 단백질에는 2점을, 수송체 단백질에는 1점을 부여하는 것과 같이 약물과 단백질의 상호작용의 특성에 대한 가중치를 부여한 정교한 알고리즘을 사용할 수 있다.

상기의 서술에서는 약물, 즉 항암제와 직접 상호작용하는 단백질만을 예로 들었지만, 해당 약물의 전구체 또는 해당 약물의 대사산물들과 상호작용하는 단백질, 해당 약물의 약력학 또는 약동학에 관여하는 단백질들과 유의하게 상호작용하는 단백질, 그 신호전달경로에 참여하는 관련 단백질 정보를 활용하여 상기 수식의 예측능력을 향상시킬 수 있다. 즉 단백질-단백질 상호작용 네트워크 혹은 약물학적 패스웨이 정보를 활용하여 이에 관여하는 다양한 단백질의 정보를 사용할 수 있다. 즉 해당 약물과 직접 상호작용하는 단백질에 유의한 변이가 발견되지 않아 해당 단백질 손상 점수 계산값이 없거나 손상 없음(예를 들면, SIFT 알고리즘을 적용한 경우 1.0점)인 경우에도, 해당 단백질과 상호작용하거나 같은 신호전달경로에 참여하는 관련 단백질들의 단백질 손상 점수의 평균값(예를 들면, 기하평균치) 등을 해당 단백질의 단백질 손상 점수로 대신 사용하여, 약물 점수 산출에 사용할 수 있다.

상기의 개인별 약물 점수는 하나 이상의 연관 단백질에 대한 정보가 획득 가능한 모든 약물 또는 그중 선별된 일부 약물에 대해서 산출할 수 있다. 또한, 이러한 개인별 약물 점수는 순위점수(rank)로 환산 가능하다.

본 발명의 방법은 상술한 개인별 약물 점수를 이용하여 상기 개인에 적용되는 약물, 즉 항암제의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.

본 발명의 개인별 약물 점수는 모든 약물에 개별적으로 적용할 수 있지만, 질환별, 임상적 특징, 또는 작용방식 등의 분류별 또는 의학적 비교 대상 약물 간에 적용하면 더 유용하다. 본 발명에서 사용 가능한 약물 분류체계는, 예를 들면 ATC (Anatomical Therapeutic Chemical Classification System) 코드, 약물유전체학적 마커가 알려져 있어서 약물의 표시에 기재되는 약물 작용 정보에 영향을 줄 수 있는 약물, 또는 부작용 등으로 시장에서 퇴출된 약물 목록 등을 포함할 수 있다.

본 발명의 방법은 처방 점수를 계산하는 단계를 추가로 포함할 수 있다.

본 발명에서 사용된 용어 “처방 점수”란 두 개 이상 복수의 약물이 동시에 혹은 서로의 약리작용에 유의한 영향을 미칠 만큼 짧은 시간 간격을 두고 투약되는 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 계산되는 점수를 말한다. 본 발명에서 처방점수는 상기 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 약물 점수를 종합하여 산출될 수 있다. 처방 점수의 계산은, 예를 들어, 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하지 않는 경우에는, 단순히 해당 복수 약물의 약물 점수들을 평균 내거나 합산 혹은 곱함으로써 산출할 수 있다. 해당 복수 약물과 공통으로 상호작용하는 단백질이 존재하는 경우에는, 해당 공통 상호작용 단백질의 단백질 손상 점수에, 예를 들면 2배의 가중치를 부여하여 각각의 약물 점수를 산출한 후, 해당 약물 점수들을 합산함으로써 처방 점수를 산출할 수 있다.

처방 점수는 개별 약물의 효과를 넘어서서, 개인에 대해 적용되는 처방(전) 안에 포함된 복수 약물 처방의 적정성 혹은 위험성을 판단하기 위한 것이다. 이러한 측면에서 본 발명의 방법은 개인에 대해 적용되는 처방(전)의 적정성 혹은 위험성을 판단하는 단계를 추가로 포함할 수 있다.

본 발명의 방법은 항암제 부작용 방지를 목적으로 수행되는 것을 포함하며, 이에 제한되지 않는다.

도 1은 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법의 각 단계를 보여주는 흐름도이다. 본 발명에 따른 일 구현예에서는 (1) 개인 사용자의 유전체 염기서열 정보 입력 또는 수신 (S100), (2) 항암제 관련 정보 입력 또는 수신 (S110), (3) 개인 사용자의 유전자 염기서열 변이 정보 결정 (S120), (4) 항암제에 대한 개인별 단백질 손상 점수 계산 (S130), (5) 항암제에 대한 개인별 약물 점수 계산 (S140), (6) 약물 점수 표기, 약물 점수 순위별 정렬 또는 우선순위 결정 (S150), 및 (7) 약물 점수와 우선순위를 고려한 약항암제 선택 및 처방점수 계산 (S160)의 순서로 항암제 선택을 위한 정보를 제공하는 방법이 진행된다.

본 발명에 따른 방법은 상기 순위별로 정렬된 약물 점수를 선택하면, 해당 약물 점수가 산출된 약물유전체학적 계산과정과 근거를 그림, 도표 및 설명 등의 정보로 제공하여 처방의사의 의사결정을 돕는 단계를 추가로 포함할 수 있다. 즉, 본 발명에 따른 방법은 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출에 사용된 정보 중 하나 이상의 정보를 제공하는 단계를 추가로 포함할 수 있다.

다른 양태에서 본 발명은 개인에게 적용할 수 있는 항암제에 대하여, 상기 항암제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스; 상기 데이터베이스에 접근 가능한 통신부; 상기 정보에 기초하여 상기 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈; 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및 상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템에 관한 것이다.

본 발명에서 모듈이라 함은, 본 발명에 따른 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명 기술분야의 당업자에게 자명한 것이다.

본 발명에서 사용된 용어 “산출모듈”은 본 발명의 방법에 따라 분석대상이 되는 항암제 및 유전자에 대하여, 상기 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보 및 상기 정보를 근거로 각 점수를 계산하는 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아니다.

본 발명에 따른 시스템은 또한 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 항암제의 사용 여부를 결정하는 제4 산출모듈을 추가로 포함할 수 있다.

본 발명에 따른 시스템은 또한 약물 간의 우선순위에 의해 결정된 약물이 두 개 이상이고 동시 투약이 필요한 경우, 상기 각 약물에 대하여 결정된 상기 약물 점수를 종합하여 처방 점수로 산출하는 제5 산출모듈을 추가로 포함할 수 있다.

본 발명에 따른 시스템은 상기 사용자에 의해 항암제 목록을 입력하거나, 또는 항암제에 대한 정보를 포함하는 데이터베이스에 접근하여 관련 정보를 추출하고, 이에 따라 상기 약물의 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함할 수 있다.

본 발명에 따른 시스템은 또한 각 산출모듈에서 산출된 값 또는 약물 간의 우선순위가 결정된 계산과정 및 상기 산출 또는 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함할 수 있다.

본 발명에 따른 시스템에서, 상기 데이터베이스 또는 그 접근 정보를 포함하는 서버, 산출된 정보 및 이와 연결된 사용자 인터페이스 장치는 서로 연계되어 사용될 수 있다.

본 발명에 따른 시스템은 약물-단백질 상호관계에 대한 약물학/생화학적 새로운 정보가 산출되는 경우 즉시 업데이트되어 더 향상된 항암제 선택에 사용될 수 있다. 본 발명에 따른 일 구현예에서는 데이터베이스 또는 지식베이스의 갱신에 따라, 상기 각 산출모듈에 저장된 상기 유전자 염기서열 변이 정보, 유전자 염기서열 변이 점수, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 갱신된다.

도 2는 본 발명의 일 구현예에 따른 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템의 개략적 구성도이다. 본 발명의 시스템(10)은 항암제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스(DB)(100), 통신부(200), 사용자 인터페이스 또는 단말(300), 산출부(400) 및 표시부(500)를 포함하여 구성될 수 있다.

본 발명에 따른 시스템에서 사용자 인터페이스 또는 단말(300)은 서버로부터 개인 유전체 염기서열 변이를 이용한 항암제 선택 처리를 요청, 결과 수신 및/또는 저장할 수 있으며, 스마트 폰, PC(Personal Computer), 태블릿 PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA), 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말기로 구성될 수 있다.

본 발명에 따른 시스템에서 서버는 항암제, 유전자 변이 또는 약물-단백질 상호관계에 대한 데이터베이스(100)에 대한 접근을 제공하는 수단으로, 통신부(200)을 통해 사용자 인터페이스 또는 단말(300)과 연결되어 각종 정보를 교환할 수 있도록 구성된다. 여기서, 통신부(200)는 동일한 하드웨어에서의 통신은 물론, 구내 정보 통신망(local area network, LAN), 도시권 통신망(metropolitan area network, MAN), 광역 통신망(wide area network, WAN), 인터넷, 2G, 3G, 4G 이동 통신망, 와이파이(Wi-Fi), 와이브로(Wibro) 등을 포함할 수 있으며, 통신 방식도 유선, 무선을 가리지 않으며 어떠한 통신 방식이라도 상관없다. 데이터베이스(100) 또한 서버에 직접 설치된 것뿐 아니라 목적에 따라 인터넷 등을 통해 접근 가능한 다양한 생명과학 데이터베이스에 연결될 수 있다.

본 발명에 따른 시스템에서 산출부(400)는 상술한 바와 같이 수집/입력된 정보를 이용하여 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 변이 정보를 산출하는 제1 산출모듈(410), 개인별 단백질 손상 점수를 산출하는 제2 산출모듈(420), 개인별 약물 점수를 산출하는 제3 산출모듈(430)을 포함하여 구성될 수 있다.

본 발명에 따른 방법은 하드웨어, 펌웨어, 또는 소프트웨어 또는 이들의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우 저장매체는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함한다. 예를 들면 컴퓨터 판독 가능한 매체는 ROM(read only memory); RAM(random access memory); 자기디스크 저장 매체; 광저장 매체; 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함한다.

이러한 측면에서 본 발명은 개인 유전체 염기서열 정보로부터 항암제의 약력학 또는 약동학에 관여하는 유전자 염기서열 변이 정보를 입수하는 단계; 상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및 상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계를 포함하는 동작을 수행하는 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체를 제공한다.

상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 항암제의 사용 여부를 결정하는 단계를 추가로 포함할 수 있다.

또 다른 양태에서 본 발명은 항암제 부작용 예측용 바이오 마커 조성물을 제공한다.

본 발명에 따른 바이오 마커 조성물에 포함될 수 있는 유전자에는, ABCC1, ABCG2, APEX1, CBR3, ATP7A, CBR3, CTH, CUL9, CYP1A1, CYP2C9, CYP2D6, CYP4B1, DPEP1, DPEP2, DPYD, DRD3, EPHX1, FMO2, FMO3, GGT1, GGT5, GGT6, GNB3, GSTA2, GSTM1, MGMT, MLH1, MSH2, NAT1, OPRM1, PDE5A, PTGS1, SERPINA6, SLC15A2, SLC22A1, SLC22A2, SLC22A8, SLC22A16, SLC28A2, SLC28A3, SPG7, TP53, ABCB1, ABCC2, AOX1, CHRM2, CYP1B1, CYP3A4, CYP3A5, CYP4F2, DBH, ERCC2, GGH, GGT7, GMPS, MTHFR, NUDT15, PDE3A, PDE4C, SLC22A5, SLCO1B1, TLR3, UGT1A1, XDH 등이 포함되며, 이로 제한되는 것은 아니다. 상기 유전자 또는 이의 단백질의 변이를 분석함으로써 항암제 부작용 발생을 예측할 수 있는바, 이를 검출할 수 있는 제제를 이용하여 마커로 활용할 수 있다.

이하, 하기 실시예를 통하여 본 발명을 보다 상세히 설명한다. 이들 실시예는 본 발명을 상세히 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 의해 제한되는 것은 아니다.

실시예 1. 항암제(Busulfan) 처치에서 심각한 부작용 경고 사인을 보인 소아 백혈병 환아의 개인 유전체 염기서열 변이 정보 분석 및 적용

골수이식(Bone Marrow Transplantation)은 백혈병과 같은 혈액 종양을 치료하기 위한 가장 중요한 치료 방법의 하나이다. 골수이식을 위해서는 먼저 환자 자신의 골수를 제거해야 하는데 전신 방사선 조사 (TBI, Total Body Irradiation) 및 부설판(Busulfan) 등의 약제를 이용한 약물학적 처치의 두 가지 방법이 사용된다. 부설판은 대표적인 알킬화제로 전신 방사선 조사를 대체할 수 있으나, 비교적 좁은 치료범위를 가지고 있어서, 약물 농도가 치료 범위보다 높으면 간정맥폐쇄성질환(hepatic veno-occlusive disease, VOD) 및 중추신경계 독성과 같은 약물과 관련된 중증 독성이 나타나고, 약물 농도가 치료 범위보다 낮으면 생착 실패나 재발 위험성이 증가한다. 특히 소아에서는 부설판의 약동학이 개인마다 차이가 커서 약물농도감시 (TDM, Therapeutic Drug Monitoring) 하에 사용된다. 부설판의 독성은 흔히 “Busulfan Lung”으로 불리는 간질성 폐 섬유화, 색소과침착, 간질, 간성 정맥폐쇄성 질환 (veno-occlusive disease, VOD), 구토, 혈소판 감소증 등이 있다. IARC(International Agency for Research on Cancer)는 부설판을 제1군 발암제로 분류하고 있다.

본 발명의 개인 유전체 염기서열 변이를 이용한 항암제 선택 제공 방법을 이용하여, 항암제의 일종인 부설판 치료 반응 위험군을 구분할 수 있는지를 확인하기 위하여, 하기와 같은 실험을 수행하였다.

먼저 골수이식 치료를 위한 전처치로 골수 제거를 위해 항암제 부설판 (Busulfan, Myleran, GlaxoSmithKline, Busulfex IV, Otsuka America Pharmaceutical, Inc.) 치료를 받은 환아 146례 중 부작용이 나타난 환아군을 분석하였다. 상기 146례 중 124례는 악성 혈액 종양이었으며, 146명이 나타낸 부작용 프로파일은 다음 표 2와 같다.

번호	부작용	환자 수
1	치료독성 관련 사망	22
2	치료중간 독성 Grade 3이상	11
3	치료중간 독성 Grade 4이상	1
4	단기간 독성 Grade 3이상	31
5	단기간 독성 Grade 4이상	2
6	간정맥폐쇄질환	18
7	사망	36
8	AUC 170이상	71

상기 146례의 개인 유전체 염기서열 변이 정보 수득을 위하여 Life Technology사의 Ion Proton을 이용하여 280배수 표적 엑솜 염기서열 해독법 (Targeted Exome Sequencing)을 수행하였다. 이 때 상기 방법 외에 개인의 유전체 전체의 정보를 얻어내는 전장 유전체 염기서열 해독법 (Whole Genome Sequencing) 또는 단백질을 코딩하는 유전자들의 정보를 얻어내는 전장 엑솜 염기서열 해독법 (Whole Exome Sequencing) 을 대안적으로 수행할 수 있다.

분석된 염기서열 절편은 데이터 정비(Data Cleaning)와 품질확인(Quality Check)의 과정을 거쳐 인간 참조군 서열(예, HG19)에 맞추어 정렬된 SAM (Sequence Alignment Map) 및 BAM (Binary Alignment Map) 파일 형식으로 출력되었다. 상기 클린 배열 결과(cleaned alignment result)는 SAMTools:pileup, SAMTools:mpileup, GATK:recalibration, GATK:realignment 등의 소프트웨어 도구를 활용하여 단일염기변이(SNVs, Single Nucleotide Variants), InDels 등의 변이를 검출하여 VCF(Variant Calling Format) 형식의 파일로 출력되었다.

상기 유전자 염기서열 변이 정보를 담은 VCF 파일을 입력받아 전술한 유전자 염기서열 변이 점수 vi값을 SIFT 알고리즘을 활용하여 각 변이별로 계산한 후, 수학식 2를 이용하여 개인별 단백질 손상 점수 Sg를 산출하였다. 이어 상기 부작용 종류 별 환자군의 단백질 손상점수와 대조군의 단백질 손상점수를 비교하여 각 부작용 군별 통계적으로 유의한 차이를 보이는 유전자 48 개를 하기와 같이 선별하였으며, p-값(value)을 기준으로 통계적 유의성이 더 높은 유전자 28개를 제1군으로 선별하였다.하기 유전자들은 부설판 및 그 대사산물의 약력학 또는 약동학에 높은 관련성이 있는 유전자에 해당한다.

(제1군)

ABCC1, ABCG2, ATP7A, CBR3, CTH, CUL9, CYP1A1, CYP2C9, DPEP1, DPEP2, DPYD, DRD3, FMO2, GGT1, GGT5, GGT6, GSTA2, GSTM1, MSH2, NAT1, PDE5A, PTGS1, SLC15A2, SLC22A1, SLC22A16, SLC22A2, SLC28A2, SPG7

(제2군)

ABCB1, ABCC2, AOX1, CHRM2, CYP1B1, CYP2D6, CYP3A4, DBH, EPHX1, GGT7, GMPS, MTHFR, PDE3A, PDE4C, SERPINA6, SLC22A5, SLC22A8, TLR3, TP53, UGT1A1

이와 같이 선별된 유전자군에 대하여 본 발명의 방법을 이용하여 상기 소아 백혈병 환아 146례에 대한 개인별 약물점수를 산출하였다. 보다 구체적으로, 각 개인별 유전자 염기서열 변이 정보로부터 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 수학식 2를 사용하여 상기 48개 유전자에 대한 개인별 단백질 손상 점수를 산출하였고, 수학식 4를 사용하여 부설판에 대한 개인별 약물 점수를 산출한 후, 각 군별로 통계 분석하였다. 부설판 부작용 양성군과 음성군의 단백질 손상점수의 분포를 표 3에 나타내었다.

		부설판 부작용 양성군 (n=90)	부설판 부작용 음성군 (n=56)	p-value
약물점수 평균 (1군 약물)		0.195406408	0.468837374	0.072382486
약물점수 평균 (1,2군 약물)		0.273943475	0.5030009	0.034605505
1군 단백질 손상점수	SLC22A16	0.3236±0.01	0.55±0.33	2.03E-13
	CBR3	0.0829±0.04	0.185±0.16	2.83E-07
	FMO2	1.0E-8±0	0.1556±0.36	1.01E-06
	PTGS1	0.3744±0.01	0.4543±0.21	1.07E-05
	SLC15A2	0.1114±0.04	0.2232±0.32	0.000400521
	DRD3	0.54±0	0.5809±0.15	0.001222641
	SLC22A2	0.1±0	0.1625±0.23	0.001367927
	GGT6	0.0578±0.01	0.0635±0.01	0.001375077
	CUL9	0.8383±0.36	0.962±0.19	0.005778935
	GSTA2	0.458±0.17	0.5249±0.15	0.006675864
	SPG7	0.6653±0.34	0.8593±0.27	0.009214375
	CYP1A1	0.2903±0.43	0.4599±0.48	0.013394813
	GGT1	0.1±0.29	0.2655±0.43	0.014831285
	ABCC1	0.432±0.26	0.5392±0.3	0.020942712
	DPEP1	0.529±0.37	0.6555±0.38	0.0220818
	ATP7A	0.5597±0.46	0.7468±0.41	0.023348076
	GGT5	0.2332±0.3	0.4314±0.41	0.029370818
	GSTM1	0.8037±0.35	0.9016±0.27	0.03104692
	SLC22A1	0.4535±0.3	0.5463±0.29	0.031693911
	DPEP2	0.8528±0.33	0.9597±0.19	0.037121203
	CTH	0.48±0.44	0.6665±0.43	0.0389814
	PDE5A	0.2971±0.03	0.3213±0.11	0.040084719
	DPYD	0.1675±0.04	0.2002±0.16	0.043865116
	ABCG2	0.4891±0.34	0.6836±0.35	0.045862428
	CYP2C9	0.9679±0.16	1±0	0.046448221
	SLC28A2	0.7307±0.39	0.8613±0.31	0.047310042
	MSH2	0.7484±0.43	0.8897±0.3	0.048069264
	NAT1	0.9433±0.13	0.9973±0.03	0.048855771
2군 단백질 손상점수	SERPINA6	0.0822±0.04	0.1017±0.09	0.050821316
	EPHX1	0.1653±0.28	0.3055±0.43	0.05389215
	GMPS	0.6267±0.43	0.8031±0.36	0.055682706
	CYP2D6	0.1833±0.38	0.3415±0.46	0.058740693
	MTHFR	0.1745±0.28	0.2669±0.37	0.066912194
	ABCC2	0.6567±0.4	0.8253±0.33	0.068738095
	TLR3	0.314±0.47	0.5634±0.49	0.069997413
	AOX1	0.6036±0.47	0.8249±0.34	0.076843585
	GGT7	0.9765±0.13	1±0	0.079490244
	CHRM2	0.9763±0.14	1±0	0.07962271
	SLC22A8	0.5261±0.32	0.6255±0.34	0.080067267
	CYP3A4	0.9589±0.17	0.9903±0.08	0.081583332
	DBH	0.7415±0.31	0.8303±0.27	0.081601181
	UGT1A1	0.5425±0.47	0.6935±0.44	0.085536737
	CYP1B1	0.242±0.08	0.2681±0.13	0.088335873
	PDE4C	0.6012±0.48	0.7217±0.44	0.0936022
	TP53	0.2161±0.2	0.2867±0.29	0.095578636
	PDE3A	0.4937±0.18	0.5406±0.15	0.097645758
	SLC22A5	0.9283±0.25	0.9824±0.13	0.107609865
	ABCB1	0.7691±0.38	0.8404±0.35	0.210600695

상기 표 3에 나타낸 바와 같이, 선별된 28개의 제1군 유전자들을 이용하여 유전자 염기서열 변이 정보로부터 단백질 손상 점수 및 개인별 약물 점수를 산출한 결과, 부설판 부작용 양성군(n=90)과 부설판 부작용 음성군(n=56) 사이의 분석 결과 통계적으로 유의하게 차이가 나타남을 확인하였다(p-value <0.05).

또한, 제2군 유전자들을 추가로 포함하여 유전자 염기서열 변이정보로부터 개인별 약물 점수를 산출한 결과에서도 두 군 사이의 개인별 약물점수가 통계적으로 유의하게차이를 보였다(p-value <0.05).

상기 결과를 통하여, 본 발명에 따른 개인 유전체 염기서열 변이 정보 분석을 통한 개인별 약물 점수 산출을 이용하여 부설판 치료 시 심각한 약물 부작용 경고 사인을 겪은 군(부설판 치료 반응 위험군)과 그렇지 않은 군을 유의하게 구분할 수 있으며, 원치 않는 부작용을 사전에 예방할 수 있음을 확인하였다.

상기 결과를 통하여, 본 발명의 방법에 따라 향후 소아 백혈병 환자에서 부설판 투여 시 부작용의 가능성이 높은 군을 예측할 수 있으며, 고 위험군에 대해서는 약물의 농도를 조절하거나 대체 가능한 다른 치료법 혹은 중재요법을 사용하도록 유도할 수 있을 것이다.

실시예 2. 항암제(Mercaptopurine) 처치에서 백혈구 감소증 및 간독성을 보인 백혈병 환아의 개인 유전체 염기서열 변이 정보 분석 및 적용

머캅토퓨린은 급성 림프구성 백혈병 치료시 유지 치료를 위하여 다른 약물들과 함께 사용된다. 머캅토퓨린은 체내에서 대사되어 대사산물인 Thioguanine nucleotides (TGNs)로 변환된다. 이는 DNA 합성을 저해함으로써 항암효과를 나타낸다. 머캅토퓨린은 thiopurine S-methyltransferase에 의해 대사되는데, 환자가 이 단백질을 코딩하는 TPMT 유전자에 변이를 가지고 있는 경우 백혈구 감소증, 무과립구증, 간독성과 같은 생명을 위협하는 심각한 부작용이 나타날 수 있다. 특히 TPMT 유전자의 비기능성 유전형이 양측 대립유전자에 모두 나타나는 경우 생명을 위협하는 수준의 골수억제가 나타날 수 있고, 대립유전자의 일측에만 TPMT 유전자의 비기능성 유전형이 나타나는 경우에도 양측 대립유전자가 모두 정상인 경우에 비하여 독성 및 골수억제 효과가 더 높게 나타난다.

한편 최근에는 아시아인에서 TPMT 유전자가 정상임에도 불구하고 상기 독성 및 골수억제가 나타나는 경우가 많아 해당 환자군을 연구한 결과 NUDT15 유전자와 치오퓨린계열 약물간의 관련성이 밝혀졌다. 한 연구 (Yang, J. J., Landier, W., Yang, W., Liu, C., Hageman, L., Cheng, C., ... & Wong, F. L. (2015). Inherited NUDT15 variant is a genetic determinant of mercaptopurine intolerance in children with acute lymphoblastic leukemia. Journal of Clinical Oncology, JCO-2014.)에서는 전향적 코호트 연구를 수행하며 전장 유전체 연관분석을 실시한 결과 TPMT 유전자의 SNP인 rs1142345와 NUDT15 유전자의 SNP인 rs116855232가 머캅토퓨린 유지치료 용량과 관련이 있음을 밝혔다. 머캅토퓨린 치료용량을 비교함으로써 상기 SNP들이 존재할 경우 치료용량이 낮아짐을 보였는데, 치료 중 독성이 심하게 나타날수록 의료진이 치료용량을 낮추기 때문에 상기 SNP들은 치료 중 독성 발생과 높은 연관이 있음을 알 수 있다.

본 발명의 개인 유전체 염기서열 변이를 이용한 항암제 선택 제공 방법을 이용하여, 항암제의 일종인 머캅토퓨린 치료 반응 위험군을 구분할 수 있는지를 확인하기 위하여, 하기와 같은 실험을 수행하였다.

약 2년간의 머캅토퓨린 치료를 수행한 환자군을 분석하였다. 동 환자군에서 나타난 부작용 프로파일은 아래 표 4와 같다.

번호	부작용
1	Neutropenic fever
2	ANC <500
3	Gr3 이상의 hyperbilirubinemia
4	Gr2 이상의 liver toxicity(GOT)
5	Gr3 이상의 liver toxicity(GPT)
6	Neutropenia군 중 Gr3이상의 liver toxicity

상기 환자군의 개인 유전체 염기서열 변이 정보 수득을 위하여 Life Technology사의 Ion Proton을 이용하여 280배수 표적 엑솜 염기서열 해독법 (Targeted Exome Sequencing)을 수행하였다. 이 때 상기 방법 외에 개인의 유전체 전체의 정보를 얻어내는 전장 유전체 염기서열 해독법 (Whole Genome Sequencing) 또는 단백질을 코딩하는 유전자들의 정보를 얻어내는 전장 엑솜 염기서열 해독법 (Whole Exome Sequencing)을 대안적으로 수행할 수 있다.

상기 유전자 염기서열 변이 정보를 담은 VCF 파일을 입력받아 전술한 유전자 염기서열 변이 점수 vi값을 SIFT 알고리즘을 활용하여 각 변이별로 계산한 후, 수학식 2를 이용하여 개인별 단백질 손상 점수 Sg를 산출하였다. 이어 상기 부작용 환자군의 단백질 손상점수와 대조군의 단백질 손상점수를 비교하여 통계적으로 유의한 차이를 보이는 유전자 32개를 하기와 같이 선별하였으며, p-값(value)을 기준으로 통계적 유의성이 더 높은 유전자를 제1군으로 선별하였다. 하기 유전자들은 머캅토퓨린 및 그 대사산물의 약력학 또는 약동학에 높은 관련성이 있는 유전자에 해당한다.

(제1군)

ABCC1, APEX1, CBR3, CUL9, CYP2D6, CYP4B1, DPEP1, DPYD, EPHX1, FMO3, GNB3, MGMT, MLH1, OPRM1, PDE5A, SERPINA6, SLC15A2, SLC22A2, SLC22A8, SLC28A3, TP53

(제2군)

CHRM2, CYP1B1, CYP3A5, CYP4F2, ERCC2, FMO2, GGH, NUDT15, PDE4C, SLCO1B1, XDH

이와 같이 선별된 유전자군에 대하여 본 발명의 방법을 이용하여 개인별 약물점수를 산출하였다. 보다 구체적으로, 각 개인별 유전자 염기서열 변이 정보로부터 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 수학식 2를 사용하여 상기 32개 유전자에 대한 개인별 단백질 손상 점수를 산출하였고, 수학식 4를 사용하여 6-머캅토퓨린에 대한 개인별 약물 점수를 산출한 후, 각 군별로 통계 분석하였다. 6-머캅토퓨린 부작용 양성군과 음성군의 단백질 손상점수의 분포를 표 5에 나타내었다.

		머캅토퓨린 부작용 양성군 (n=6)	머캅토퓨린 부작용 음성군(n=34)	p-value
약물점수 평균 (1군 약물)		0.1034±0.09	0.1890±0.10	0.024589877
약물점수 평균 (1,2군 약물)		0.0934±0.05	0.1749±0.09	0.021586521
단백질 손상점수 (1군)	DPEP1	0.24±0	0.7741±0.35	2.56E-11
	ABCC1	0.32±0	0.5316±0.32	0.000147391
	MGMT	0.7706±0.36	1±0	0.000382075
	SLC22A8	0.3166±0.01	0.5166±0.32	0.000416193
	CYP2D6	0.018±0	0.2319±0.41	0.00151514
	EPHX1	1.0E-8±0	0.1957±0.39	0.001937214
	APEX1	0.8209±0.36	1±0	0.003093326
	CYP4B1	0.7962±0.41	1±0	0.003093326
	CUL9	0.8047±0.39	1±0	0.003148978
	MLH1	0.8418±0.36	1±0	0.007651081
	TP53	0.17±0	0.2822±0.29	0.011587433
	OPRM1	0.3747±0.49	0.7171±0.46	0.01443295
	PDE5A	0.3±0	0.3043±0.01	0.016470184
	SERPINA6	0.07±0	0.1147±0.12	0.01668446
	FMO3	0.2853±0.35	0.6381±0.38	0.01974977
	DPYD	0.18±0	0.2765±0.27	0.021839396
	SLC15A2	0.1215±0.06	0.2519±0.34	0.029659527
	CBR3	0.0993±0.1	0.1811±0.1	0.039359969
	SLC28A3	0.8103±0.3	0.9569±0.2	0.039421696
	GNB3	0.9126±0.29	1±0	0.041559264
	SLC22A2	0.1±0	0.1794±0.26	0.041559264
단백질 손상점수 (2군)	XDH	0.9471±0.19	1±0	0.057393496
	FMO2	0.125±0.34	0.3333±0.48	0.058959933
	CYP1B1	0.1775±0.09	0.2415±0.1	0.063676645
	SLCO1B1	0.4394±0.36	0.5998±0.3	0.075169523
	CHRM2	0.9482±0.21	1±0	0.080187516
	ERCC2	0.9547±0.18	1±0	0.080187516
	GGH	0.9518±0.2	1±0	0.080187516
	CYP3A5	0.9435±0.23	1±0	0.080374542
	CYP4F2	0.175±0.4	0.4468±0.5	0.0910071
	PDE4C	0.4343±0.53	0.7454±0.44	0.092029759
	NUDT15	0.48±0.49	0.7646±0.41	0.093049258

상기 표 5에 나타낸 바와 같이, 제1군 유전자들을 이용하여 유전자 염기서열 변이 정보로부터 단백질 손상 점수 및 개인별 약물 점수를 산출한 결과, 머캅토퓨린 부작용 양성군(n=6)과 머캅토퓨린부작용 음성군(n=34) 사이의 분석 결과 통계적으로 유의하게 차이가 나타남을 확인하였다(p-value <0.05).

또한, 제2군 유전자들을 추가로 포함하여 유전자 염기서열 변이정보로부터 개인별 약물 점수를 산출한 결과에서도 두 군 사이의 개인별 약물점수가 통계적으로 유의하게 차이를 보였다.

상기 결과를 통하여, 본 발명에 따른 개인 유전체 염기서열 변이 정보 분석을 통한 개인별 약물 점수 산출을 이용하여 머캅토퓨린치료 시 심각한 약물 부작용 경고 사인을 겪은 군(머캅토퓨린 치료 반응 위험군)과 그렇지 않은 군을 유의하게 구분할 수 있으며, 원치 않는 부작용을 사전에 예방할 수 있음을 확인하였다.

상기 결과를 통하여, 본 발명의 방법에 따라 향후 환자에서 머캅토퓨린 투여 시 부작용의 가능성이 높은 군을 예측할 수 있으며, 고 위험군에 대해서는 약물의 농도를 조절하거나 대체 가능한 다른 치료법 혹은 중재요법을 사용하도록 유도할 수 있을 것이다.

실시예 3. 개인 유전체 염기서열 변이 정보를 기반으로 하는 맞춤형 약물 선택 방법의 타당성 검증

아직까지 개인 유전체 염기서열 변이 정보와 약물학적 반응의 개인차에 관한 신뢰할만한 연구결과는 매우 제한적이다. 현재까지의 연구는 특정 변이가 양성인 또는 음성인 군을 약물별로 비교하여 반응성의 개인차를 연구하는 증례-대조군 관찰연구의 패러다임을 따라왔다. 이러한 연구 패러다임에서는 수많은 염기서열 변이와 수많은 약물쌍으로 이루어지는 모든 조합에 대해 각각 고비용의 증례-대조군 연구를 수행해야하지만 현실적으로는 불가능하다. 반면 본 발명에 따른 개인별 맞춤형 약물 선택 방법은 모든 유전자 염기서열 변이를 대상으로 할 뿐만 아니라, 고비용의 증례-대조군 설계의 관찰 연구를 필요로 하지 않고, 유전체 염기서열 변이에 대한 순수 계산만으로 개인별 단백질 손상 점수와 개인별 약물 점수를 산출하고 이를 적용하는 방법을 제안하므로, 모든 유전체 염기서열 변이와 모든 약물 사이의 조합에 대하여 개인별 맞춤형 약물 선택을 위한 추론이 가능하다는 큰 장점을 갖는다.

본 발명의 방법에 따른 개인별 맞춤형 약물 선택 산출 결과의 타당성 평가를 위해 다음과 같은 기준으로 497개의 다빈도 처방 약물을 선택하였다; (1) 미국에서 가장 흔히 처방되는 15가지 약물(top 15 frequently prescribed drug classes during 2005~2008 in the United State (Health, United States, 2011, Centers for Disease Control and Prevention)의 ATC 코드에 포함되는 약물 중 적어도 한 개 이상의 약력학 또는 약동학 관련 유전자가 알려진 약물, (2) 확립된 약물유전체학적 유전체 염기서열 변이 마커의 작용이 미국 식약처의 의약품 라벨 표시에 적용된 약물, (3) 약물 부작용 등으로 시장에서 퇴출된 것으로 DrugBank 데이터베이스에 공지된 약물.

타당성 평가 기준 자료로는 PharmGKB가 제공하는 987개의 유전자 염기서열 변이-약물 상호작용 쌍에 대한 확립된 지식 중 상기 497개의 약물과 적어도 하나 이상의 연결을 갖는 650개(65.9%)를 추출했다. 본 발명이 엑손 영역의 염기서열 변이를 대상으로 한 점을 고려하여, 공정한 평가를 위해서 검증 대상 자료와 평가 기준 자료 사이에 겹치는 부분은 제거하였다. 좀 더 구체적으로는 상기 650쌍 중에서 엑손 영역에 위치한 염기서열 변이 36개를 모두 제거하고 비코딩 영역의 염기서열 변이만을 선택하여 좀 더 공정한 평가를 수행하였다. 결론적으로, 평가를 위한 최종 황금표준으로 614쌍을 선택하였다.

다음으로 The 1000 Genomes Project가 제공하는 1092명의 전장 유전체 염기서열을 분석하여 1092명 각각에 대해 본 발명에 따른 방법을 적용하여, 개인별 약물유전체학적 위험성과 PharmGKB에 등록된 유전자 염기서열 변이별 약물유전체학적 위험성을 각각 계산하였다.

타당도 평가에는 민감도, 특이도 및 ROC 곡선하면적(Area Under the Receiver Operating Curve)를 사용했다. 개인별 약물 점수를 바탕으로 497개의 약물에 순위를 매기고 각 순위 사이의 496개의 분할 위치에 순위별로 역치를 설정한 후, (1) 해당 약물의 약물 점수 순위가 역치보다 상위에 있고 PharmGKB 변이가 개인 유전체 변이에 있을 때는 참양성, (2) 해당 약물의 약물 점수 순위가 역치보다 하위에 있고 PharmGKB 변이가 개인 유전체 변이에 없을 때는 참음성, (3) 해당 약물의 약물 점수 순위가 역치보다 상위에 있으나 PharmGKB 변이가 개인 유전체 변이에는 없을 때는 위양성, (4) 해당 약물의 약물 점수 순위가 역치보다 하위에 있으나 PharmGKB 변이가 개인 유전체 변이에 있을 때는 위음성으로 정했다, 각 개인에서 각 순위역치 L에 대해 참양성, 참음성, 위양성, 위음성의 개수를 산출하여 하기 식과 같이 민감도와 특이도를 계산하였다.

상기 D는 497개의 전체 약물의 집합, GS는 개인별로 개인 유전자 염기서열 변이가 PharmGKB의 위험 대립유전형과 일치하여 개인별 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합, D_L은 순위역치 상위 약물의 집합이며, 수직 막대 괄호는 해당 집합의 원소 개수를 의미한다.

계산 결과, 18명의 경우 PharmGKB의 변이와 일치하는 변이를 한 개도 가지고 있지 않아서 황금표준으로 사용되는 개인화된 PharmGKB 약물의 집합을 정의할 수 없었기에, 이들은 본 타당성 분석에서 제외하였으며, 모든 역치에 대한 민감도와 특이도를 계산하여 ROC 곡선을 그리고, AUC를 계산하였다. 보다 구체적으로, 먼저 1092명의 전체 인구집단을 대상으로 SIFT 알고리즘을 이용하여 유전자 염기서열 변이 점수를 산출한 후, 이에 수학식 2와 수학식 4를 적용하여 단백질 손상 점수 및 약물 점수를 각각 산출하였다. 또한, 인종별 분포에 따른 가중치 적용의 유용성을 판단하기 위해서 인종 특이적 민감도, 특이도 및 이에 기반을 둔 AUC 값 산출을 The 1000 Genomes Project에 명시된 4개의 인종(African (AFR, n=246), American (AMR, n=181), Asian (ASN, n=286), European (EUR, n=379))별로 각각 동일하게 수행한 후, 인종 특이적 민감도, 특이도 및 AUC를 각각 구하였다. 그 결과를 표 6, 표 7 및 도 3에 나타내었다.

단백질 군별 분포 및 평균 단백질 손상 점수 산출

단백질 군	단백질 수	관련 약물 수	단백질-약물 쌍의 수	평균 단백질 손상 점수
표적 단백질	440	486	2357	0.798
운반체 단백질	10	50	65	0.728
대사효소 단백질	74	330	1347	0.733
수송체 단백질	54	176	457	0.733
계	545	497	4201	0.783

The 1000 Genomes Project 데이터를 이용한 단백질 군별 및 인종별 약물 점수 산출 타당도(AUC) 산출

	Total	AFR	AMR	ASN	EUR
약물 점수 산출 타당도(AUC)
표적 단백질	0.617	0.634	0.608	0.614	0.614
운반체 단백질	0.554	0.511	0.599	0.485	0.594
대사효소 단백질	0.587	0.642	0.580	0.558	0.579
수송체 단백질	0.497	0.492	0.488	0.489	0.512
단백질 군별 가중치를 비적용 또는 적용한 약물 점수 산출 타당도(AUC)
단순기하평균	0.666	0.744	0.650	0.634	0.653
가중기하평균	0.667	0.742	0.652	0.633	0.654

상기 표 6은 본 실시예에서 사용한 약물 497개에 대한 단백질 군별 분포를 나타낸 것으로, 각 군별로 단백질-약물 쌍의 수와 평균 단백질 손상 점수를 함께 표시하였다.

상기 표 7은 수학식 4를 이용하여 약물 점수를 산출할 때, 단백질 군별 가중치를 적용하지 않은 경우(단순기하평균)와 적용한 경우(가중기하평균)에 각각 산출된 개인별 약물 점수 산출 타당도(AUC)를 각 단백질 군별, 각 인종별로 구분하여 나타낸 것이다.

보다 구체적으로, 전체 인구 집단을 예로 들면, 약물 점수 산출을 위하여 수학식 4에서 가중치 wi를 부여하지 않고(가중치 wi=1) 표적 단백질, 운반체 단백질, 대사효소 단백질, 수송체 단백질 등 각 단백질 군별로 산출한 AUC 값은 각각 0.617, 0.554, 0.587, 0.497이었으며, 이를 단백질 군별 가중치로 사용하여(수학식 4의 가중치 w_i에 각 값을 대입) 산출한 개인별 가중기하평균 약물 점수 산출 타당도(AUC=0.667)를 구하였다(도 3b 참조). 그 결과, 상기 단백질 군별 가중치를 적용한 개인별 가중기하평균 약물 점수 산출 타당도는 가중치를 부여하지 않고(가중치 wi=1) 단순기하평균 산출식에 적용하여 산출한 개인별 단순기하평균 약물 점수 산출 타당도(AUC=0.666)보다 0.001점 향상됨을 확인하였다(도 3a 참조).

또한, 도 3a에 나타낸 바와 같이, 가중치 적용의 또 다른 예로 각 인종별 인원수에 따른 가중치를 적용하여 개인별 약물 점수 산출 타당도(AUC) 분석을 수행한 결과, 인종 특이성을 고려한 경우(굵은선), 전체 인구 집단(Total)의 AUC 값은 0.666(아프리카인(African) 0.744, 아메리카인(American) 0.650, 아시아인(Asian) 0.631, 유럽인(European) 0.653)이었으며, 인종 특이성을 고려하지 않은 경우(점선), 전체 인구집단 AUC 값은 0.633(아프리카인 0.623, 아메리카인 0.629, 아시아인 0.64, 유럽인 0.636)으로 나타나, 인종 특이성을 고려한 약물 점수 산출 타당도가 그렇지 않은 경우에 비해 더 향상되는 것을 확인하였다.

또한, 도 3b에 나타낸 바와 같이, 인종 특이성을 고려하지 않고 단백질 군별 가중치만을 적용한 경우(점선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.634이고, 인종 특이성과 함께 단백질 군별 가중치도 함께 적용한 경우(굵은선), 본 발명의 개인별 약물 점수 산출 타당도 AUC는 0.667로 나타나, 서로 다른 가중치의 유용성이 있음을 알 수 있다.

이상에서 본원의 예시적인 구현예에 대하여 상세하게 설명하였지만 본원의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본원의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본원의 권리범위에 속하는 것이다.

본 발명에서 사용되는 모든 기술용어는, 달리 정의되지 않는 이상, 본 발명의 관련 분야에서 통상의 당업자가 일반적으로 이해하는 바와 같은 의미로 사용된다. 본 명세서에 참고문헌으로 기재되는 모든 간행물의 내용은 본 발명에 도입된다.

Claims

개인 유전체 염기서열 정보로부터 항암제의 약력학(pharmaco-dynamics) 또는 약동학(pharmaco-kinetics)에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 결정하는 단계;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
상기 개인별 단백질 손상 점수를 항암제와 단백질 사이의 상호 관계와 연관지어 개인별 약물 점수를 산출하는 단계를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 항암제는 치오퓨린계열 약물, 디옥시뉴클레오사이드 유사체, 및 디옥시뉴클레오사이드 유사체로 이루어진 군으로부터 선택된 1종 이상의 계열에 속하는 약물인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 약력학 또는 약동학에 관여하는 유전자는
ABCC1, ABCG2, APEX1, CBR3, ATP7A, CBR3, CTH, CUL9, CYP1A1, CYP2C9, CYP2D6, CYP4B1, DPEP1, DPEP2, DPYD, DRD3, EPHX1, FMO2, FMO3, GGT1, GGT5, GGT6, GNB3, GSTA2, GSTM1, MGMT, MLH1, MSH2, NAT1, OPRM1, PDE5A, PTGS1, SERPINA6, SLC15A2, SLC22A1, SLC22A2, SLC22A8, SLC22A16, SLC22A2, SLC28A2, SLC28A3, SPG7, TP53, ABCB1, ABCC2, AOX1, CHRM2, CYP1B1, CYP3A4, CYP3A5, CYP4F2, DBH, ERCC2, GGH, GGT7, GMPS, MTHFR, NUDT15, PDE3A, PDE4C, SLC22A5, SLCO1B1, TLR3, UGT1A1 및 XDH로 이루어진 군으로부터 선택된 1종 이상인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 유전자 염기서열 변이 정보는 유전자의 엑손(exon)을 구성하는 염기의 치환, 부가 또는 결실인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 유전자 염기서열 변이 정보는 참조군의 유전체 염기서열과의 비교 분석을 통해 수득되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법
제 1 항에 있어서,
상기 단백질 손상 점수 또는 상기 약물 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 이용하여 산출된 하나 이상의 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제1항에 있어서,
상기 단백질 손상 점수 또는 약물 점수는, 유전자 염기서열 변이 점수로부터 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 7 항에 있어서,
상기 유전자 염기서열 변이 점수는 SIFT (Sorting Intolerant From Tolerant), PolyPhen (Polymorphism Phenotyping), PolyPhen-2, MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam E-value), MutationAssessor, MutationTaster, MutationTaster2, PROVEAN (Protein Variation Effect Analyzer), PMut, Condel, GERP (Genomic Evolutionary Rate Profiling), GERP++, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, 및 CADD (Combined Annotation-Dependent Depletion)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 유전자 염기서열 변이에 적용하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 단백질 손상 점수는, 단백질을 코딩하는 유전자에서 발견되는 분석대상 염기서열 변이가 두 개 이상인 경우, 상기 유전자 염기서열 변이 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 9 항에 있어서,
상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 단백질 손상 점수는 하기 수학식 1에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
[수학식 1]

상기 수학식 1에서 S _g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상 염기서열 변이의 수, v _i 는 i 번째 분석대상 염기서열 변이의 상기 염기서열 변이 점수이며, p는 0이 아닌 실수임.
제 1 항에 있어서,
상기 단백질 손상 점수는 하기 수학식 2에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
[수학식 2]

상기 수학식 2에서 S _g 는 유전자 g가 코딩하는 단백질의 단백질 손상 점수, n은 상기 유전자 g의 염기서열 변이 중 분석대상인 염기서열 변이의 수, v _i 는 i 번째 분석대상 염기서열 변이의 상기 유전자 염기서열 변이 점수이며, w _i 는 상기 i 번째 염기서열 변이의 상기 유전자 염기서열 변이 점수 v _i 에 부여되는 가중치임.
제 1 항에 있어서,
상기 약물 점수는, 항암제의 약력학 또는 약동학에 관여하는 단백질의 손상이 두 개 이상인 경우, 단백질 손상 점수들의 평균값으로 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 13항에 있어서,
상기 평균값은 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 헤론 평균, 역조화평균, 평균제곱근편차, 센트로이드 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균, 일반화된 f-평균, 백분위수, 최대값, 최소값, 최빈값, 중앙값, 중앙범위, 중심경향도(measures of central tendency), 단순 곱 및 가중 곱으로 이루어진 군으로부터 선택된 하나 이상에 의해 계산되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 약물 점수는 하기 수학식 3에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
[수학식 3]

상기 수학식 3에서 S _d 는 약물 d의 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, g _i 는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질 손상 점수이며, p는 0이 아닌 실수임.
제 1 항에 있어서,
상기 약물 점수는 하기 수학식 4에 의해 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
[수학식 4]

상기 수학식 4에서 S _d 는 약물 d의 산출된 약물 점수, n은 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 수, g _i 는 상기 약물 d의 약력학 또는 약동학에 관여하는 하나 이상의 유전자가 코딩하는 단백질의 상기 단백질 손상 점수이며, w _i 는 상기 i 번째 유전자가 코딩하는 단백질의 상기 단백질 손상 점수 g _i 에 부여되는 가중치임.
제 1 항에 있어서,
상기 단백질 손상 점수 또는 약물 점수는 해당 단백질의 종류, 해당 단백질의 약력학 또는 약동학적 분류, 해당 약물 대사 효소의 약동학 파라미터, 또는 인구 집단 또는 인종별 분포를 고려하여 결정된 값으로 가중치를 부여하여 산출되는 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 방법은 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 항암제의 사용 여부 또는 사용 방법을 결정하는 단계를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항에 있어서,
상기 방법은 상기 항암제의 약력학 또는 약동학에 관여하는 유전자의 염기서열 변이 정보를 컴퓨터 시스템으로 접수하는 단계를 추가로 포함하며,
상기 컴퓨터 시스템은 상기 항암제의 약력학 또는 약동학에 관여하는 유전자 정보를 포함하는 데이터베이스를 포함하거나 또는 상기 데이터베이스에 접근 가능한 것인, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
제 1 항 내지 제 19 항 중 어느 한 항에 있어서,
상기 방법은 항암제 부작용 방지를 목적으로 수행되는 것을 특징으로 하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택을 위한 정보를 제공하는 방법.
개인에게 적용할 수 있는 항암제에 대하여, 상기 항암제와 관련된 유전자 또는 단백질과 관련된 정보 검색 또는 추출이 가능한 데이터베이스;
상기 데이터베이스에 접근 가능한 통신부;
상기 정보에 기초하여 상기 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 산출하는 제1 산출모듈;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 제2 산출모듈;
상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 제3 산출모듈; 및
상기 산출모듈에서 산출된 산출값을 표시하는 표시부를 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템.
제 21 항에 있어서,
상기 시스템은 상기 제3 산출모듈에서 산출된 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 항암제의 사용 여부를 결정하는 제4 산출모듈을 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템.
제 21 항에 있어서,
상기 시스템은 사용자에 의한 항암제의 입력에 따라 상기 항암제에 대한 개인별 약물 점수를 산출하여 제공하는 사용자 인터페이스를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템.
제 21 항에 있어서,
상기 표시부는 상기 각 산출모듈에서 산출된 값, 계산 과정, 또는 상기 계산의 기초가 된 정보를 추가로 표시하는 표시부를 추가로 포함하는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템.
제 21 항 내지 제 24 항 중 어느 한 항에 있어서,
상기 각 산출모듈은 상기 유전자 염기서열 변이 정보, 단백질 손상 점수, 약물 점수 및 그 산출의 근거가 되는 정보가 저장되며,
상기 데이터베이스의 갱신에 따라 상기 각 산출모듈의 정보가 갱신되는, 개인 유전체 염기서열 변이를 이용한 항암제 선택 시스템.
하기 프로세서를 실행시키는 실행모듈을 포함하는 컴퓨터 판독 가능한 매체:
개인 유전체 염기서열 정보로부터 항암제의 약력학 또는 약동학에 관여하는 하나 이상의 유전자 염기서열 변이 정보를 입수하는 단계;
상기 유전자 염기서열 변이 정보를 이용하여 개인별 단백질 손상 점수를 산출하는 단계; 및
상기 개인별 단백질 손상 점수를 약물과 단백질 사이의 상호 관계와 연관지어, 개인별 약물 점수를 산출하는 단계;를 포함하는 동작을 수행하는 프로세서.
제 26 항에 있어서,
상기 프로세서는 상기 개인별 약물 점수를 이용하여 상기 개인에 적용되는 항암제의 사용 여부를 결정하는 단계;를 추가로 포함하는, 컴퓨터 판독 가능한 매체.