[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR101864855B1 - 내분비 치료 중 유방암 재발 예측 방법 - Google Patents

내분비 치료 중 유방암 재발 예측 방법 Download PDF

Info

Publication number
KR101864855B1
KR101864855B1 KR1020127025899A KR20127025899A KR101864855B1 KR 101864855 B1 KR101864855 B1 KR 101864855B1 KR 1020127025899 A KR1020127025899 A KR 1020127025899A KR 20127025899 A KR20127025899 A KR 20127025899A KR 101864855 B1 KR101864855 B1 KR 101864855B1
Authority
KR
South Korea
Prior art keywords
genes
dna
homo sapiens
gene
expression
Prior art date
Application number
KR1020127025899A
Other languages
English (en)
Other versions
KR20130010048A (ko
Inventor
마라이케 다르트만
인케 자비네 페더
마티아스 게르만
구이도 헤니히
카르스텐 베버
퇴르네 크리스티안 폰
랄프 크로넨베트
크리스토프 페트리
Original Assignee
지피돈 디아그노스틱스 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지피돈 디아그노스틱스 게엠베하 filed Critical 지피돈 디아그노스틱스 게엠베하
Publication of KR20130010048A publication Critical patent/KR20130010048A/ko
Application granted granted Critical
Publication of KR101864855B1 publication Critical patent/KR101864855B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 유방암 질환 결과의 진단을 위한 방법, 키트 및 시스템으로서, (a) 상기 환자의 종양 시료에서 하기 9개의 유전자: UBE2C, BIRC5, RACGAP1, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP 중 2개 이상의 RNA 발현 수준을 결정하는 단계 (b) 상기 종양 시료에서 결정된, 상기 유전자 세트의 유전자에 대한 발현 수준 값을 수학적으로 조합하여, 합계 점수를 산출하고, 상기 합계 점수는 상기 환자의 예후를 나타내는 것인 단계를 포함하는 방법; 및 상기 방법을 수행하기 위한 키트 및 시스템에 관한 것이다.

Description

내분비 치료 중 유방암 재발 예측 방법{Method for breast cancer recurrence prediction under endocrine treatment}
본 발명은 유방암의 질환 결과 (disease outcome)의 예후에 대한 방법, 키트 및 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 유방암 환자의 종양 시료에서 마커 유전자의 발현 수준 측정에 기반한 유방암의 예후에 관한 것이다.
유방암은 서구 국가에서 여성의 암으로 인한 주된 사망 원인 중 하나이다. 보다 구체적으로, 유방암은 미국에서만 해마다 약 40,000명의 여성의 생명을 앗아가고 약 200,000명의 여성에게서 진단된다. 지난 수십 년 동안, 보조 전신 요법 (adjuvant systemic therapy)은 초기 유방암에서 현저하게 개선된 생존률을 가져왔다. 이러한 임상 경험은 대다수의 유방암 환자를 위한 보조 전신 요법을 제공하는 합의 권고 (consensus recommendation)를 초래하였다 (EBCAG). 유방암에서 통상적으로 수행되는 종양의 수술적 제거 및 후속 종양상 (tumor bed)의 방사선 치료 외에 적용될 수 있는 다수의 치료 옵션이 이용가능하다. 세 가지 주요하고 개념상 다른 전략은 내분비 치료, 화학요법 및 표적요법 병행치료 (treatment with targeted therapy)이다. 내분비제에 의한 치료를 위한 전제 조건은 종양 조직에서 호르몬 수용체 즉, 에스트로겐 수용체, 프로게스테론 수용체 또는 둘 모두의 발현이다. 다수의 환자 코호트 (cohort)에서 테스트될 때, 서로 다른 작용 모드 및 질환 결과의 차이를 갖는 수 개의 내분비제가 이용가능하다. 타목시펜은 지난 삼십 년간 내분비 치료의 중심이었다. 대규모 임상 시험은, 타목시펜이 종양 재발의 위험을 유의성 있게 감소시킨다는 것을 보여주었다. 추가의 치료 옵션은 신규 내분비 약물 분류에 속하는 아로마타제 저해제에 기반한다. 에스트로겐 결합의 경쟁적 저해자인 타목시펜과 대조적으로, 아로마타제 저해제는 에스트로겐 자체의 생성을 차단함으로써 에스트로겐 수용체 양성 종양 세포에 대한 성장 자극을 감소시킨다. 아직도, 일부 환자는 내분비 치료에도 불구하고 재발 (relapse)을 경험하고 특히 이들 환자는 추가의 치료용 약물로부터 효과 (benefit)를 얻을 수 있다. 안트라시클린, 탁산 및 기타 제제에 의한 화학요법은 에스트로겐 수용체 양성 및 에스트로겐 수용체 음성 환자에서 질환의 재발을 감소시키는데 효율적인 것으로 나타났다. NSABP-20 연구는 림프절 음성 (node negative) 에스트로겐 수용체 양성 환자에서 타목시펜 + 화학요법과 타목시펜 단독 치료를 비교하였고 병합 치료 (combined treatment)가 타목시펜 단독보다 더 효과적이라는 것을 나타내었다. 그러나, 타목시펜 + 화학요법과 타목시펜 단독을 비교한 IBCSG IX 연구는 세포독성제의 추가에 대한 유의성 있는 효과를 보여주는데 실패했다. 최근에, 종양 세포의 표면상의 HER2/neu 항원에 대한 전신 투여된 항체는 Her2neu 과발현 종양을 갖는 환자에서 재발 위험을 수 배 감소시키는 것으로 확인되었다. 그러나, 전부는 아니나, 대부분의 상이한 약물 치료가 환자의 삶의 질을 심각하게 훼손시킬 수 있는 많은 잠재적 역효과를 갖는다 (Shapiro and Recht, 2001; Ganz et al., 2002). 이는, 개개의 환자가 과잉치료뿐 아니라 불충분치료 (under treatment)를 피하기 위해 세심한 위험 평가에 기초하여 치료 전략을 선택하는 것을 의무적으로 만든다. 화학요법의 효과는 HER2/neu 음성 및 에스트로겐 수용체 양성 종양 (내강 유형)과 비교하여, HER2/neu 및 에스트로겐 수용체 발현의 부재를 특징으로 하는 HER2/neu 양성 및 종양 (기저 유형)에서 상대적으로 크기 때문에, 가장 어려운 치료 결정은 등급, 종양 크기 또는 림프절 관여와 같은 고전적인 임상 요인이 화학요법을 사용할 것인지 말 것인지의 질문에 대한 명쾌한 해답을 제공하지 않는 내강 종양 (luminal tumor)과 관련된다. 21 유전자 검정 (21 gene assay), 게놈 등급 지수 검정 (genomic grade index assay) 등과 같은 신규한 분자적 도구가 이러한 의료 요구 (medical need)를 해결하기 위해 개발되었다.
치료 가이드라인은 대개 해당 분야에서 저명한 전문가에 의해 개발된다. 유럽에서 2009년부터 St Gallen 가이드라인은 HER2 양성 유방암을 갖는 환자뿐 아니라 HER2 음성 및 ER 음성 질환을 갖는 환자에게 화학 요법을 권고한다. 화학요법의 유용성에 대한 불확실성이 HER2 음성 및 ER 양성 질환을 갖는 환자에서 발생한다. 개인에 대한 균형잡힌 치료 결정을 내리기 위해, 암 재발 가능성이 가장 유용한 기준으로 사용된다. 림프절 전이상태 (lymph node status), 종양 등급, 종양 크기 등의 임상적 기준은, 재발 위험에 대한 정보를 제공하기 때문에 도움이 된다. 보다 최근에는, 다유전자 검정이 표준 임상 위험 요인보다 탁월하거나 추가적인 정보를 제공하는 것으로 확인되었다. 일반적으로, 증식 마커 (proliferation marker)는 지배적인 예후 정보 (prognostic information)를 제공하는 것으로 인식된다. 이러한 예측인자 (predictor)의 중요한 예는 Agendia의 Mammaprint 테스트, Veridex의 Relapse Score, 및 institute Jules Bordet에서 개발되고 Isogen에 라이센싱 된 Genomic Grade Index이다. 이들 모든 검정은 70개 이상의 유전자의 발현 수준의 결정에 기초하고, 모두 포르말린 고정 및 파라핀 포매에 의해 심하게 분해되지 않았지만, (RNALaterTM중에 수송된) 신선한 조직으로부터 단리된 RNA에 대해 개발되었다. 다른 중요한 다유전자 검정은 Genomic Health Inc.의 Recurrence Score 검정이다. 이 테스트는 포르말린 고정 및 파라핀 포매 조직 시료로부터 RNA 추출 후 16개의 암 관련 유전자 및 5개의 기준 유전자 (reference gene)의 발현 수준을 결정한다.
그러나, 현재의 도구는 가장 중요한 임상 위험군, 즉 표준 임상 파라미터에 기초한 재발의 중간 위험군의 유방암 환자에서 임상적 타당성 및 유용성의 결여를 겪고 있다. 따라서, 환자 예후에 기초한 치료 결정을 최적화하기 위해 더 우수한 도구가 필요하다. 화학요법을 피하는 임상적 유용성을 위해, 궁극적으로 수술 후 원격 전이 (distant metastasis)가 생기는 환자를 불충분하게 치료하지 않기 위해 높은 민감도 및 높은 음성 예측치를 갖는 테스트가 필요하다. 보조 요법에 대한 임상적 결정을 내리는데 유용한 물질 및 방법에 대한 계속적인 요구에 관해, 본 발명은 즉시 접근 가능한 임상 및 실험 자료에 기초한 유방암의 예후에 대한 고급 방법의 필요성을 충족시킨다.
정의
다르게 정의되지 않는다면, 본 명세서에서 사용되는 기술 및 과학 용어는 본 발명이 속하는 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
용어 "암 (cancer)"은 영향받은 조직 또는 세포 응집의 단계, 등급, 조직형태학적 특징, 공격성, 또는 악성에 한정되지 않는다.
본 명세서에 사용된 용어, 질환의 "결과 예측 (predicting an outcome)"은 주어진 요법을 적용받는 환자의 결과 예측 및 치료받지 않은 환자의 예후 모두를 포함하는 것으로 이해된다. 용어 "결과 예측"은 특히, 환자에게 전이, 국소적 재발 또는 사망이 발생할 위험에 관한 것일 수 있다.
본 명세서에 사용된 용어 "예측 (prediction)"은, 종양이 주어진 요법으로 치료되는 경우, 종양 악성의 개별 평가, 또는 환자의 예상되는 생존율 (전체 생존율 (OAS, overall survival) 또는 무병 생존율 (DFS, disease free survival))에 관한 것이다. 그와 대조적으로, 용어 "예후 (prognosis)"는 종양이 치료되지 않은 채로 남아있는 경우, 종양 악성의 개별 평가 또는 환자의 예상되는 생존률 (OAS, 전체 생존율 또는 DFS, 무병 생존율)에 관한 것이다.
본 발명의 의미 내에서 "결과 (outcome)"는 질환의 과정에서 얻어지는 정의된 상태이다. 이러한 질환 결과는 예를 들면, "질환의 재발 (recurrence of disease)”, “전이의 발생 (development of metastasis)”, “결절 전이의 발생 (development of nodal metastasis)”, "원격 전이의 발생 (development of distant metastasis)”, “생존 (survival)”, “사망 (death)”, “종양 완화율 (tumor remission rate)", 질환의 단계 또는 등급 등과 같은 임상적 상태일 수 있다.
"위험 (risk)"은 개체나 환자가 특정 질병의 결과를 발생시키거나 도달하는 확률에 관련된 수치로 이해된다. 본 발명에서 용어 "위험"은 환자의 안녕 (wellbeing) 측면에서 긍정적이거나 부정적인 함축된 의미를 갖도록 의도되지 않고, 단지 주어진 상태 (condition)의 발생 또는 발병의 확률 또는 가능성을 의미한다.
용어 "임상 자료 (clinical data)"는 연령, 성별, 체중, 폐경기/호르몬 상태, 병인학 (etiopathology) 자료, 병력 자료, 조직병리학과 같은 인 비트로 진단 방법에 의해 얻어진 자료, 혈액 또는 소변 검사, x-선, 컴퓨터 단층촬영, MRI, PET, 스펙트 (spect), 초음파와 같은 이미징 방법에 의해 얻어진 자료, 전기생리적 자료, 유전 분석, 유전자 발현 분석, 생검 평가 (biopsy evaluation), 수술중 발견 (intraoperative finding)을 포함하나 이에 한정되지 않는, 환자의 건강 상태에 대한 이용가능한 자료 및 정보 전체에 관한 것이다.
용어 "절 양성 (node positive)", "절 양성으로 진단된 (diagnosed as node positive)", "절 침범 (node involvement)" 또는 "림프절 침범 (lymph node involvement)"은 사전에 림프절 전이로 진단된 환자를 의미한다. 이 용어는 배액 림프절 (draining lymph node), 근처 림프절 (near lymph node), 및 원격 림프절 전이를 포괄할 것이다. 이와 같은 사전 진단 그 자체는 본 발명 방법의 일부를 형성하지 않을 것이다. 오히려, 사전 진단은 그의 시료가 본 발명의 일 구체예를 위해 사용될 수 있는 환자를 선별하기 위한 전제 조건이다. 이 사전 진단은 림프절 제거 및 병리학적 분석, 생검 분석, 전이를 나타내는 바이오 마커의 인 비트로 분석, 이미징 방법 (예를 들면, 컴퓨터 단층촬영, X-선, 자기 공명 영상, 초음파), 및 수술중 발견을 포함하나 이에 한정되지 않는, 당해 기술 분야에 알려져 있는 적합한 방법에 의해 도달될 수 있다.
본 발명에서 "생물 시료 (biological sample)"은 생물체로부터 유래되거나 생물체와 접촉되었던 시료이다. 생물 시료의 예는: 세포, 조직, 체액, 세척액, 도말 시료, 생검 시료, 혈액, 소변, 타액, 객담, 혈장, 혈청, 세포 배양 상등액, 등이다.
"종양 시료 (tumor sample)"는 온전하거나 또는 분해된, 종양 세포를 포함하는 생물 시료이다. 종양 시료는 생물 조직 또는 생물 유액 (fluid)일 수 있다. 그와 같은 시료는 객담, 혈액, 혈청, 혈장, 혈구 세포 (예를 들면, 백혈구), 조직, 코어 또는 세침 생검 시료 (core or fine needle biopsy sample), 세포 함유 체액, 소변, 복수, 및 흉수, 뇌척수액, 누액, 또는 그로부터 분리된 세포를 포함하나 이에 한정되지 않는다. 시료는 또한, 조직학적 목적으로 채취된 동결 또는 고정된 절편 (section)과 같은 조직의 절편 또는 미세 해부 세포 또는 그의 세포외 부분을 포함할 수 있다. 분석될 종양 시료는 흡인 또는 천공 (punctuation), 절제에 의해 또는 생검을 초래하는 기타 수술 방법에 의해 채취되는 종양 병소 (neoplastic lesion)로부터의 조직 물질 또는 절제된 세포 물질일 수 있다. 그와 같은 세포물질은 환자로부터 수득된 종양 세포 또는 종양 세포 단편을 포함한다. 세포는 예를 들면, 유두 흡인, 도관 세척, 세침 생검에 의해 또는 유발되거나 자발적인 유두 분비물로부터 수집되는 세포 "도말 (smear)"에서 발견될 수 있다. 다른 구체예에서, 시료는 체액이다. 그와 같은 체액은 예를 들면, 혈액, 혈청, 혈장, 림프, 복수, 부인과액 (gynecologic fluid), 또는 소변을 포함하나 이들 유체에 한정되지 않는다.
"유전자 (gene)"는 기능적 RNA 산물을 생성하기 위해 필요한 정보를 포함하는 핵산 부분 (segment)의 집합이다. "유전자 산물 (gene product)"은 유전자의 전사 또는 발현을 통해 생성되는 생물 분자, 예를 들면 mRNA, cDNA 또는 번역된 단백질이다.
"mRNA"는 유전자의 전사된 산물이고 본 발명이 속하는 기술분야에서 통상의 기술자에게 이해되는 일반적인 의미를 갖는다. "mRNA에서 유래된 분자 (molecule derived from an mRNA)"는 mRNA 주형으로부터 화학적으로 또는 효소에 의해 얻어지는, cDNA와 같은 분자이다.
용어 "발현 수준 (expression level)"은 유전자 발현의 결정된 수준을 의미한다. 발현 수준은 절대값으로서 또는 한 개의 기준 유전자 (예를 들면, 하우스키핑 유전자), 두 개 이상의 기준 유전자의 평균, 또는 계산된 평균 발현 값 (예를 들면, DNA 칩 분석에서) 또는 기준 시료를 사용하지 않고 다른 유용한 (informative) 유전자 대비 유전자 발현의 결정된 수준일 수 있다. 유전자의 발현 수준은 직접적으로, 예를 들면, 신호 강도가 상기 유전자의 mRNA 전사체의 양과 상관관계를 갖는 신호를 얻음으로써 측정될 수 있거나, 단백질 수준에서, 예를 들면 면역조직화학, CISH, ELISA 또는 RIA 방법에 의해 간접적으로 수득될 수 있다. 발현 수준은 또한 기준 시료에 대한 경쟁적 반응에 의해 수득될 수 있다. 분석에서 일부 물리적 파라미터, 예를 들면, 형광 발광을 측정하여 결정되는 발현 값은 정보의 추가 가공을 위해 사용될 수 있는 수치가 할당될 수 있다.
본 발명의 의미 내에서, "발현 수준의 기준 패턴 (reference pattern of expression level)"은 발현 수준의 다른 패턴에 대한 비교를 위해 사용될 수 있는 발현 수준의 패턴으로 이해될 것이다. 본 발명의 바람직한 구체예에서, 발현 수준의 기준 패턴은 예를 들면, 건강한 개체, 질환을 갖는 개체, 또는 기준 군으로 작용하는, 특정한 유형의 치료를 받는 질환을 갖는 개체, 또는 좋은 또는 나쁜 결과를 갖는 개체의 군에서 관찰되는 발현 수준의 평균 패턴이다.
본 발명의 의미 내에서, "수학적으로 발현 수준을 합산하는 것 (mathematically combining expression level)"은 유전자의 결정된 발현 수준으로부터 수치를 도출하는 단계 및 알고리즘을 하나 이상의 그와 같은 수치에 적용하여 합계 수치 또는 합계 점수를 얻는 단계로 이해될 것이다.
"알고리즘 (algorithm)"은 정보를 생산하기 위해 특정 순서의 연산을 수행하는 과정이다.
"점수 (score)"는 알고리즘을 이용하여 수학적으로 발현 수준을 합산함으로써 도출된 수치이다. 점수는 또한 발현 수준 및 기타 정보, 예를 들면 임상 자료로부터 도출될 수 있다. 점수는 환자의 질환 결과와 관련될 수 있다.
"식별 함수 (discriminant function)"는 객체 또는 사건을 분류하는데 이용되는 변수 집합의 함수이다. 따라서 식별 함수는 환자, 시료 또는 사건으로부터 이용가능한 자료나 파라미터에 따라 하나의 카테고리 또는 복수 개의 카테고리로 상기 환자, 시료 또는 사건을 분류할 수 있게 한다. 그와 같은 분류는 통상의 기술자에게 잘 알려져 있는 통계 분석의 표준 도구이다. 예를 들면, 환자는 상기 환자, 시료 또는 사건으로부터 얻어진 자료에 따라 "고위험 (high risk)" 또는 "저위험 (low risk)", "전이의 높은 확률 (high probability of metastasis)" 또는 "전이의 낮은 확률 (low probability of metastasis)", "치료를 필요로 하는 (in need of treatment)" 또는 "치료를 필요로 하지 않는 (not in need of treatment)" 환자로 분류될 수 있다. 분류는 "고 (high) vs. 저 (low)"에 제한되지 않으나, 복수 개의 카테고리, 등급 등으로 수행될 수 있다. 분류는 또한 보다 넒은 의미에서, 예를 들면, 더 높은 점수는 원격 전이의 더 높은 가능성, 예를 들면 원격 전이의 (전체) 위험을 나타내는, 식별 점수로서 이해될 것이다. 분류를 가능하게 하는 식별 함수의 예는, SVM (support vector machine), kNN (k-nearest neighbor), (naive) Bayes 모델, 선형 회귀 모델에 의해 정의되는 함수 또는 예를 들면, 서브그룹 디스커버리 (subgroup discovery), 결정 트리 (decision tree), LAD (logical analysis of data) 등과 같은 불연속적으로 정의되는 (piecewise defined) 함수를 포함하나, 이에 한정되지 않는다. 보다 넓은 의미에서, 상관 계수, 영사 (projection), SVM (support vector machine) 점수, 기타 유사성-기반 방법, 이들의 조합 등과 같은 수학적 방법이나 알고리즘의 연속적인 점수 값은 설명의 목적을 위한 예시이다.
용어 “치료 방식 (therapy modality)”, “치료 방법 (therapy mode)”, “치료 계획 (regimen)” 및 “치료 요법 (therapy regimen)은 암 치료를 위한 항-종양, 및/또는 항 혈관, 및/또는 면역 자극, 및/또는 혈액 세포 증식제, 및/또는 방사선 치료, 및/또는 온열요법, 및/또는 저온법의 적시의 순차적 또는 동시 투여를 의미한다. 이 투여는 보조 및/또는 신보조 모드 (neoadjuvant mode)에서 수행될 수 있다. 그와 같은 "프로토콜 (protocol)"의 조성은 정해진 치료가능 시기 (therapy window) 내에서 단일 제제의 투여량, 적용 기간 및 투여 빈도에서 다를 수 있다. 현재 다양한 약 및/또는 물리적 방법의 다양한 조합, 및 다양한 스케줄이 연구 중에 있다.
용어 "세포독성 화학요법 (cytotoxic chemotherapy)"은 세포 증식 및/또는 생존에 영향을 미치는 여러 치료 양식을 의미한다. 세포독성 화학요법 치료는 단일클론항체 및 키나제 (kinase) 저해제를 포함한, 알킬화제, 항대사물질, 안트라시클린, 식물 알칼로이드, 토포이소머라제 (topoisomerase) 저해제, 및 기타 항종양제의 투여를 포함할 수 있다. 특히, 세포독성 치료는 탁산 (taxane) 치료에 관련될 수 있다. 탁산은 미세소관 기능을 방해함으로써 세포 분열을 차단하는 식물 알칼로이드이다. 원형의 (prototype) 탁산은 본래 탁솔로 알려져 있고 Pacific Yew tree의 나무껍질에서 처음 유래된, 천연 산물 파클리탁셀 (paclitaxel)이다. 도세탁셀 (docetaxel)은 파클리탁셀의 반-합성 (semi-synthetic) 유사체이다. 탁산은 후기 (anaphase) 동안 염색체 분리를 방해하면서, 미세소관의 안정성을 향상시킨다.
용어 "내분비 치료 (endocrine treatment)" 또는 "호르몬 치료 (hormonal treatment)" (또한 때때로 "항-호르몬 치료 (anti-hormonal treatment)"로 지칭됨)는 호르몬 신호전달 (signalling)을 표적으로 하는 치료, 예를 들면, 호르몬 저해, 호르몬 수용체 저해, 호르몬 수용체 효능제 또는 길항제의 사용, 스카벤저- (scavenger-) 또는 올판 (orphan) 수용체의 사용, 호르몬 유도체의 사용 및 호르몬 생성의 방해를 의미한다. 특정한 예는 에스트로겐 수용체의 신호전달을 조절하는 타목시펜 치료, 또는 스테로이드 호르몬 생성을 방해하는 아로마타제 치료이다.
타목시펜은 유방암의 치료에 사용되는 경구적으로 활성인 선택적 에스트로겐 수용체 조절자 (selective estrogen receptor modulator, SERM)이고 그 목적을 위해 현재 세계에서 가장 많이 판매되고 있는 약물이다. 타목시펜은 상표명 Nolvadex, Istubal, 및 Valodex 하에서 판매되고 있다. 그러나, 타목시펜은, 그의 특허 만료 전에도, 그의 일반명 "타목시펜 (tamoxifen)"으로 지칭되었고 여전히 널리 지칭되고 있다. 타목시펜 및 타목시펜 유도체는 경쟁적으로 종양 및 다른 조직 표적의 에스트로겐 수용체에 결합하여, RNA 합성을 감소시키고 에스트로겐 효과를 저해하는 핵 복합체 (nuclear complex)를 생성한다.
스테로이드 수용체는 스테로이드 호르몬에 대한 신호 전달을 수행하는 세포내 수용체 (전형적으로 세포질)이다. 예는 타입 I 수용체, 특히 성호르몬 수용체, 예를 들면, 안드로겐 수용체, 에스트로겐 수용체, 프로게스테론 수용체; 글루코코르티코이드 수용체, 미네랄로코르티코이드 수용체; 및 타입 II 수용체, 예를 들면 비타민 A 수용체, 비타민 D 수용체, 레티노이드 수용체, 티로이드 호르몬 수용체를 포함한다.
본 명세서에서 사용된, 용어 "혼성화-기반 방법 (hybridization-based method)"은 상보적인, 단일가닥 핵산 또는 뉴클레오티드 유사체를 단일 이중가닥 분자로 결합시키는 과정을 제공하는 방법을 의미한다. 뉴클레오티드 또는 뉴클레오티드 유사체는 정상 조건 하에서 그의 상보체 (complement)에 결합하여, 두 개의 완벽히 상보적인 가닥은 즉시 서로 결합할 것이다. 바이오분석에서, 매우 자주, 표지된, 단일가닥 프로브가 상보적인 표적 서열을 찾기 위해 사용된다. 그와 같은 서열이 시료 내에 존재하면, 프로브는 그 후 표지로 인해 검출될 수 있는 상기 서열에 혼성화할 것이다. 기타 혼성화 기반 방법은 마이크로어레이 및/또는 바이오칩 방법을 포함한다. 이러한 방법에서, 프로브는 고체상에 고정화되고, 그 후 시료에 노출된다. 만일 시료 내에 상보적인 핵산이 존재한다면, 이들은 프로브에 혼성화되고 따라서 검출될 수 있을 것이다. 이러한 접근법은 "어레이 기반 방법 (array based method)"으로도 알려져 있다. 또 다른 혼성화 기반 방법은 하기 기술되는 PCR이다. 발현 수준의 결정에 있어서, 혼성화 기반 방법은 예를 들면, 주어진 유전자에 대한 mRNA의 양을 결정하는데 사용될 수 있다.
특이적으로 유전자 또는 그의 단편의 서열에 결합할 수 있는 올리고뉴클레오티드는, 그 유전자의 mRNA 또는 cDNA 또는 그의 단편과 같은 유전자 또는 유전자 산물에 특이적으로 혼성화하는 올리고뉴클레오티드와 관련된다. 유전자 또는 유전자 산물을 특이적으로 검출하기 위해, 전체 유전자 서열을 검출하는 것은 필요하지 않다. 약 20 내지 150개 염기의 단편은 특이적 혼성화를 가능하게 하는 충분한 서열 특이적 정보를 포함할 것이다.
본 명세서에서 사용되는 용어 "PCR 기반 방법 (PCR based method)"은 중합효소 연쇄 반응 (PCR)을 포함하는 방법을 의미한다. 이 방법은 시험관 내에서 효소에 의한 복제에 의해 핵산, 예를 들면, DNA를 지수적으로 증폭시키는 방법이다. PCR은 인 비트로 기법이므로, DNA의 형태에 대한 제한 없이 수행될 수 있고, 광범위한 유전자 조작을 수행하도록 널리 변형될 수 있다. 발현 수준의 결정에 있어서, PCR 기반 방법은 예를 들면, (1) 역전사 효소를 이용한 완전한 mRNA 풀 (소위 전사체 (transcriptome))의 cDNA로의 역전사, 및 (2) 개별적인 프라이머를 이용한 주어진 cDNA의 존재의 검출에 의해 주어진 mRNA의 존재를 검출하는데 사용될 수 있다. 이 접근법은 역전사 효소 PCR (reverse transcriptase PCR, rtPCR)로서 일반적으로 알려져 있다.
또한, PCR-기반 방법은 예를 들면, 실시간 PCR 및, 특히 발현 수준의 분석에 적합한, 동적 (kinetic) 또는 정량적 PCR (qPCR)을 포함한다.
용어 "정량적 PCR (Quantitative PCR, qPCR)"은 시료 내 주형의 정량을 가능하게 하는 종류의 PCR 방법을 의미한다. 정량적 실시간 PCR (Quantitative real-time PCR)은 예를 들면, TaqMan 기법 또는 LightCycler 기법과 같이, 상이한 성능 또는 산물 검출 기법을 포함한다. TaqMan 기법은 예를 들면, 이중-표지된 형광발생 프로브 (dual-labelled fluorogenic probe)를 사용한다. TaqMan 실시간 PCR은 종래 PCR에서와 같이 종결점에서가 아닌, PCR의 지수적 단계 동안 형광체를 통해 산물의 축적을 측정한다. 산물의 지수적 증가는 임계 주기 (threshold cycle)인 CT, 즉 형광의 유의성 있는 지수적 증가가 검출되고, 반응에 존재하는 DNA 주형의 카피 수와 직접적으로 연관된 PCR 주기의 수를 결정하는데 사용된다. 이러한 반응의 구성은 종래의 PCR과 매우 유사하지만, PCR 튜브 내의 형광 분자 측정을 가능하게 하는 실시간 열 순환기 (thermal cycler)에서 수행된다. 보통의 PCR과 다르게, TaqMan 실시간 PCR에서 프로브, 즉, DNA 주형 내 및 두 프라이머 사이에 위치한 20 내지 60개의 뉴클레오티드로 이루어진 부분에 상보적인 단일가닥 올리고뉴클레오티드가 반응에 첨가된다. 형광 리포터 또는 형광체 (예를 들면, 6-카르복시플루오레세인, 두문자어: FAM, 또는 테트라클로로플로오레세인, 두문자어: TET) 및 소광제 (quencher) (예를 들면, 테트라메틸로다민, 두문자어: TAMRA, 디히드로시클로피롤로인돌 트리펩티드의 'black hole quencher' 두문자어: BHQ)는 각각 프로브의 5' 및 3' 말단에 공유결합에 의해 부착된다[2]. 프로브에 부착된 형광체와 소광제 사이의 근접성은 형광체로부터 형광을 저해한다. PCR 동안, DNA 합성이 시작됨에 따라, Taq 중합효소의 5' → 3' 엑소뉴클레아제 활성은 주형에 어닐링된 프로브의 부분을 분해한다. 프로브의 분해는 그로부터 형광체를 방출하고 소광제에 대한 근접성을 깨뜨림으로써, 소광 효과를 경감시키고 형광체의 형광을 허용한다. 그러므로, 실시간 PCR 열 순환기에서 검출되는 형광은 PCR에 존재하는 방출된 형광체 및 DNA 주형의 양에 직접적으로 비례한다.
"어레이 (array)" 또는 "매트릭스 (matrix)"는 주소 지정이 가능한 위치의 어레이 또는 장치상의 "주소 (address)"를 의미한다. 위치는 2차원 어레이, 3차원 어레이, 또는 기타 매트릭스 포맷으로 어레이될 수 있다. 위치의 갯수는 수 개 내지 수십 만개 이상일 수 있다. 가장 중요하게, 각 위치는 완전히 독립적인 반응 부위를 나타낸다. 어레이는 핵산 어레이, 단백질 어레이 및 항체 어레이를 포함하나, 이에 한정되지 않는다. "핵산 어레이 (nucleic acid array)"는 올리고뉴클레오티드, 뉴클레오티드 유사체, 폴리뉴클레오티드, 뉴클레오티드 유사체의 중합체, 모르폴리노 또는 유전자의 보다 큰 부분과 같은, 핵산 프로브를 포함하는 어레이를 의미한다. 어레이의 핵산 및/또는 유사체는 바람직하게는 단일 가닥이다. 프로브가 올리고뉴클레오티드인 어레이는 "올리고-뉴클레오티드 어레이 (oligo-nucleotide array)" 또는 "올리고뉴클레오티드 칩 (oligonucleotide chip)"으로 지칭된다. 본 명세서에서 "마이크로어레이 (microarray)"는 또한, 약 100/cm2 이상, 바람직하게는 약 1000/cm2 이상의 구별되는 영역의 밀도를 갖는 영역의 어레이인 "바이오칩 (biochip)" 또는 "생물학적 칩 (biological chip)"을 의미한다.
본 발명의 의미 내에서, "프라이머 쌍 (primer pair)" 및 "프로브 (probe)"는 분자 생물학 분야의 통상의 기술자에게 잘 알려진 이 용어의 일반적인 의미를 가질 것이다. 본 발명의 바람직한 구체예에서, "프라이머 쌍" 및 "프로브"는 검출되거나 정량될 표적 폴리뉴클레오티드 영역의 상보체와 동일한 서열, 상보적인 서열, 상동의, 또는 상동인 서열을 갖는 폴리뉴클레오티드 분자로서 이해될 것이다. 또 다른 구체예에서, 뉴클레오티드 유사체는 또한 프라이머 및/또는 프로브로서의 용도를 위해 포함된다. 동적 또는 실시간 PCR 적용을 위해 사용되는 프로브 기법은 예를 들면, Applied Biosystems에서 얻을 수 있는 TaqMan® 시스템, Scorpion® Primers와 같은 신장 프로브, Dual Hybridisation Probes, Chemicon International, Inc.에서 얻을 수 있는 Amplifluor®, 또는 Minor Groove Binders일 수 있다.
본 발명의 의미 내에서, "개별적으로 표지된 프로브 (individually labeled probe)"는 폴리뉴클레오티드, 올리고뉴클레오티드 또는 뉴클레오티드 유사체, 및 프로브의 검출 또는 정량에 도움을 주는 표지를 포함하는 분자 프로브로서 이해될 것이다. 바람직한 표지는 형광 분자, 발광 분자, 방사성 분자, 효소 분자 및/또는 소광 분자이다.
본 발명의 의미 내에서, "어레이된 프로브 (arrayed probe)"는 바람직하게는 정돈된 어레이 (arrangement)로, 고정화된 프로브의 집단으로서 이해될 것이다. 본 발명의 바람직한 구체예에서, 개별적인 "어레이된 프로브"는 고체 지지체 상의, 예를 들면 "칩" 상의 그의 개별적인 위치로 식별될 수 있다. 단일 가닥 핵산 서열과 관련해서 사용되는 경우, 용어 "실질적으로 상동의 (substantially homologous)"는 전술된 바와 같이 낮은 엄격성 (stringency) 조건하에서 단일 가닥 핵산 서열을 혼성화시킬 수 있는 (즉, 그의 상보체인) 프로브를 지칭한다.
발명의 요약
전반적으로, 본 발명은 절 음성 또는 양성, 에스트로겐 수용체 양성 및 HER2/NEU 음성 유방암 환자, 특히 내분비 치료를 받는 환자 예를 들면, 타목시펜으로 치료를 받는 경우, 환자의 재발 위험을 평가하는 방법을 제공한다. 에스트로겐 수용체 상태는 일반적으로 면역조직화학을 이용하여 결정되고, HER2/NEU (ERBB2) 상태는 일반적으로 면역조직화학 및 형광 인 시투 혼성화를 이용하여 결정된다. 그러나, 에스트로겐 수용체 상태 및 HER2/NEU (ERBB2) 상태는, 본 발명의 목적을 위해, 적합한 방법, 예를 들면, 면역조직화학, 형광 인 시투 혼성화 (FISH), 또는 RNA 발현 분석에 의해 결정될 수 있다.
본 발명은 유방암 환자의 에스트로겐 수용체 양성 및 HER2 음성 종양에서 유방암의 결과를 예측하는 방법으로서:
(a) 상기 환자의 종양 시료에서 하기 9개의 유전자: UBE2C, BIRC5, RACGAP1, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP 중 2개 이상의 RNA 발현 수준을 결정하는 단계,
(b) 상기 종양 시료에서 결정된, 상기 유전자 세트의 유전자에 대한 발현 수준 값을 수학적으로 조합하여, 합계 점수를 산출하고, 상기 합계 점수는 상기 환자의 예후를 나타내는 것인 단계를 포함하는 방법에 관한 것이다. 일 구체예에서, 3개 이상, 4개 이상, 5개 이상 또는 6개 이상의 유전자가 선택된다.
본 발명의 추가의 구체예에서, 상기 방법은:
(a) 상기 환자의 종양 시료에서 하기 8개의 유전자: UBE2C, RACGAP1, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP의 RNA 발현 수준을 결정하는 단계,
(b) 상기 종양 시료에서 결정된, 상기 유전자 세트의 유전자에 대한 발현 수준 값을 수학적으로 조합하여, 합계 점수를 산출하고, 상기 합계 점수는 상기 환자의 예후를 나타내는 것인 단계를 포함한다.
추가의 구체예에서, 본 발명의 방법은:
(a) 상기 환자의 종양 시료에서 하기 8개의 유전자: UBE2C, BIRC5, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP의 RNA 발현 수준을 결정하는 단계,
(b) 상기 종양 시료에서 결정된, 상기 유전자 세트의 유전자에 대한 발현 수준 값을 수학적으로 조합하여, 합계 점수를 산출하고, 상기 합계 점수는 상기 환자의 예후를 나타내는 것인 단계를 포함한다.
본 발명의 또 다른 구체예에서,
BIRC5는 UBE2C 또는 TOP2A 또는 RACGAP1 또는 AURKA 또는 NEK2 또는 E2F8 또는 PCNA 또는 CYBRD1 또는 DCN 또는 ADRA2A 또는 SQLE 또는 CXCL12 또는 EPHX2 또는 ASPH 또는 PRSS16 또는 EGFR 또는 CCND1 또는 TRIM29 또는 DHCR7 또는 PIP 또는 TFAP2B 또는 WNT5A 또는 APOD 또는 PTPRT로 대체될 수 있고, 조건부로 대체 후, 8개의 서로 다른 유전자가 선택되고;
UBE2C는 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 BIRC5 또는 RACGAP1 또는 TOP2A 또는 AURKA 또는 NEK2 또는 E2F8 또는 PCNA 또는 CYBRD1 또는 ADRA2A 또는 DCN 또는 SQLE 또는 CCND1 또는 ASPH 또는 CXCL12 또는 PIP 또는 PRSS16 또는 EGFR 또는 DHCR7 또는 EPHX2 또는 TRIM29로 대체될 수 있고;
DHCR7은 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 AURKA, BIRC5, UBE2C, 또는 BIRC5 또는 UBE2C를 대체할 수 있는 다른 유전자로 대체될 수 있고;
STC2는 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 INPP4B 또는 IL6ST 또는 SEC14L2 또는 MAPT 또는 CHPT1 또는 ABAT 또는 SCUBE2 또는 ESR1 또는 RBBP8 또는 PGR 또는 PTPRT 또는 HSPA2 또는 PTGER3로 대체될 수 있고;
AZGP1은 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 PIP 또는 EPHX2 또는 PLAT 또는 SEC14L2 또는 SCUBE2 또는 PGR로 대체될 수 있고;
RBBP8은 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 CELSR2 또는 PGR 또는 STC2 또는 ABAT 또는 IL6ST로 대체될 수 있고;
IL6ST는 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 INPP4B 또는 STC2 또는 MAPT 또는 SCUBE2 또는 ABAT 또는 PGR 또는 SEC14L2 또는 ESR1 또는 GJA1 또는 MGP 또는 EPHX2 또는 RBBP8 또는 PTPRT 또는 PLAT로 대체될 수 있고; 및
MGP는 대체 후, 8개의 서로 다른 유전자가 선택되는 것인 조건을 만족하며 APOD 또는 IL6ST 또는 EGFR로 대체될 수 있다.
본 발명의 일 측면에 따라, 상기 합계 점수는 세포독성 화학요법으로부터의 효과 (benefit)를 나타내는 것인, 전술된 방법이 제공된다.
환자가 내분비 요법을 받기 전에 본 발명의 방법을 사용하는 것은 내분비 요법의 효능 예측을 가능하게 한다.
하기 표 2는 각각의 전술된 마커 유전자의 과발현이 내분비 치료를 받는 환자에서 좋은 결과 또는 나쁜 결과를 나타내는지를 보여준다. 그러므로 통상의 기술자는 수학적 조합 (mathematical combination), 즉, 주어진 유전자의 효과를 고려한 알고리즘을 구성할 수 있다. 예를 들면, 과발현이 좋은 결과를 나타내는 유전자의 합계 또는 가중 합계는 고위험 점수는 좋은 결과를 나타내는 것인 알고리즘을 야기한다. 알고리즘의 유효성은 임상 기록을 갖는 환자의 종양 시료를 분석함으로써 조사될 수 있고, 예를 들면, 좋은 결과의 환자 및 나쁜 결과의 환자에 대한 점수가 별도로 결정되고 비교된다. 통상의 기술자인 생물통계학자는 최적화된 알고리즘을 얻기 위해 식별 함수와 같은 추가의 수학적 방법을 적용하는 것을 알 것이다. 알고리즘은 예를 들면, 민감도 또는 특이성에 대해 최적화될 수 있다. 알고리즘은 정량적 PCR과 같이, 마커 유전자의 유전자 발현을 측정하는데 사용되는 특정한 분석 플랫폼에 맞춰질 수 있다.
본 발명의 일 측면에 따라, 상기 내분비 요법은 타목시펜 또는 아로마타제 저해제를 포함하는 것인 전술된 바와 같은 방법을 제공한다.
본 발명의 일 측면에 따라, 재발이 발생할 위험이 예측되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 발현 수준은 비-단백질 (non-protein) 발현 수준으로 결정되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 발현 수준은 RNA 발현 수준으로 결정되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 발현 수준은
PCR 기반 방법,
마이크로어레이 기반 방법, 및
혼성화 기반 방법 중 하나 이상에 의해 결정되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 발현 수준의 결정은 포르말린-고정 파라핀 포매 종양 시료에서 또는 신선 동결 종양 시료에서 이루어지는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 하나 이상의 마커 유전자의 발현 수준은 하나 이상의 기준 유전자 또는 계산된 평균 발현 값에 상대적인 발현 패턴으로 결정되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 수학적으로 조합하는 단계는 알고리즘을 주어진 유전자의 발현 수준을 대표하는 값에 적용하는 단계를 포함하는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 알고리즘은 상기 주어진 유전자의 발현 수준을 대표하는 값의 선형 조합 (linear combination)인 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 주어진 유전자의 발현 수준을 대표하는 값에 계수를 곱하는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 합계 점수에 대해, 하나, 둘 또는 그 이상의 임계값 (threshold)이 결정되고, 상기 임계값을 상기 합계 점수에 적용함으로써 고 위험 내지 저 위험군 (high and low risk), 고 위험군, 중간 위험 내지 저 위험군 (intermediate and low risk) 또는 추가적인 (more) 위험군으로 구별하는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 높은 합계 점수는 보다 공격적인 요법, 예를 들면, 세포독성 화학요법으로부터의 효과를 나타내는 것인 전술된 바와 같은 방법이 제공된다. 통상의 기술자는 이러한 관점에서 "높은 점수"가 기준 값 (reference value) 또는 컷오프 값 (cutoff value)에 관련된다는 것을 이해한다. 통상의 기술자는 또한 합계 점수를 얻는데 사용되는 특정 알고리즘에 따라, 또한 컷오프 또는 기준 값 미만의 "낮은" 점수가 보다 공격적인 요법, 예를 들면 세포독성 화학요법으로부터의 효과를 나타낼 수 있다는 것을 이해한다. 고위험의 전이 인자와 양의 상관 (positive correlation)을 갖는 유전자를 양의 계수로 알고리즘에 포함시켜, 전체 높은 점수는 고위험과 양의 상관을 갖는 유전자의 높은 발현을 나타내는 것인 경우이다.
본 발명의 일 측면에 따라, 상기 환자의 림프절 전이상태 (nodal status)에 대한 정보는 상기 유전자의 발현 수준 값을 수학적으로 조합하여 합계 점수를 산출하는 단계에서 처리되는 것인 전술된 바와 같은 방법이 제공된다.
본 발명의 일 측면에 따라, 상기 림프절 전이 상태가 음성인 경우 상기 림프절 전이상태에 관한 정보는 0 이하의 수치 (numerical value)이고, 상기 림프절 전이상태가 양성이거나 알려지지 않은 경우 0보다 큰 수치인 것인 전술된 바와 같은 방법이 제공된다. 본 발명의 예시적 구체예에서, 음성 림프절 전이 상태에는 값 0이 할당되고, 알려지지 않은 림프절 전이 상태에는 값 0.5가 할당되며, 양성 림프절 전이 상태에는 값 1이 할당된다. 다른 값은 알고리즘 내에서 림프절 전이 상태의 상이한 가중치를 반영하도록 선택될 수 있다.
본 발명은 또한, 전술된 방법을 수행하기 위한 키트로서, 상기 키트는 유전자의 조합 중 유전자의 서열 또는 유전자 단편의 서열에 특이적으로 결합할 수 있는 올리고뉴클레오티드의 집합을 포함하고,
(i) 상기 조합은 적어도 8개의 유전자 UBE2C, BIRC5, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP를 포함하거나; 또는
(ii) 상기 조합은 적어도 10개의 유전자 BIRC5, AURKA, PVALB, NMU, STC2, RBBP8, PTGER3, CXCL12, CDH1, 및 PIP를 포함하거나; 또는
(iii) 상기 조합은 적어도 9개의 유전자 BIRC5, DHCR7, RACGAP1, PVALB, STC2, IL6ST, PTGER3, CXCL12, 및 ABAT를 포함하거나; 또는
(iv) 상기 조합은 적어도 9개의 유전자 DHCR7, RACGAP1, NMU, AZGP1, RBBP8, IL6ST, 및 MGP를 포함하는 것인 키트에 관한 것이다.
본 발명은 또한 청구항 1 내지 17 중 어느 한 항의 방법을 수행하기 위한 키트의 용도에 관한 것으로서, 상기 키트는 유전자의 조합 중 유전자의 서열 또는 유전자 단편의 서열에 특이적으로 결합할 수 있는 올리고 뉴클레오티드의 집합을 포함하며,
(i) 상기 조합은 적어도 8개의 유전자 UBE2C, BIRC5, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP를 포함하거나; 또는
(ii) 상기 조합은 적어도 10개의 유전자 BIRC5, AURKA, PVALB, NMU, STC2, RBBP8, PTGER3, CXCL12, CDH1, 및 PIP를 포함하거나; 또는
(iii) 상기 조합은 적어도 9개의 유전자 BIRC5, DHCR7, RACGAP1, PVALB, STC2, IL6ST, PTGER3, CXCL12, 및 ABAT를 포함하거나; 또는
(iv) 상기 조합은 적어도 9개의 유전자 DHCR7, RACGAP1, NMU, AZGP1, RBBP8, IL6ST, 및 MGP를 포함하는 것인 키트의 용도에 관한 것이다.
본 발명은 또한 전술한 방법에 따라, 수학적으로 유전자 조합의 발현 수준을 대표하는 값을 조합하여 합계 점수를 산출하고, 상기 합계 점수는 환자의 내분비 요법으로부터의 효능 또는 효과를 나타내는 것인, 유전자 조합의 발현 수준을 대표하는 값을 가공할 수 있는 컴퓨터 프로그램 제품에 관한 것이다.
상기 컴퓨터 프로그램 제품은 데이터 기억 매체 (data carrier) 상에 저장되거나 실시간 PCR 시스템과 같은, 주어진 유전자의 발현 수준을 대표하는 값을 출력할 수 있는 진단 시스템에서 구현될 수 있다.
상기 컴퓨터 프로그램 제품이 데이터 기억 매체 상에 저장되거나 컴퓨터에서 구동된다면, 작동자가 각 유전자의 발현 수준에 대해 수득된 발현 값을 입력할 수 있다. 그 후 상기 컴퓨터 프로그램 제품은 알고리즘을 적용하여 주어진 환자를 위한 세포독성 화학요법으로부터 효과를 나타내는 합계 점수를 산출할 수 있다.
본 발명의 방법은 단지 소수의 유전자 사용에 기반하여 질환의 결과의 신뢰할 수 있는 예측을 제공하는 잇점을 갖는다. 본 발명의 방법은 ESR1 양성 및 ERBB2 음성으로 분류되는 종양을 갖는 환자의 내분비 치료, 예를 들면 타목시펜에 대한 반응을 분석하기 위해 특히 적합한 것으로 나타났다.
발명의 상세한 설명
본 발명은 예시적인 구체예 및 첨부된 도면과 함께 설명된다.
본 명세서에 개시된 것은 본 명세서에 제시된 신규한 예측 테스트를 위한 알고리즘으로 합해질 수 있는 마커 유전자의 고유한 조합이다. 기술적으로, 본 발명의 방법은 두 개의 기술을 사용하여 실행될 수 있다: 1) 신선한 또는 고정된 종양 조직으로부터 전체 RNA의 분리 및 2) 단리된 핵산의 동적 RT-PCR. 대안적으로, 예를 들면, 마이크로어레이에 의한 또는 단백질 수준에서 측정에 의한 대안적 기술을 사용하여 발현 수준을 측정하는 것이 고려된다.
본 발명의 방법은 발현 값 및 그 후 상기 결정된 발현 값의 생물정보학 분석을 얻기 위해 종양으로부터 단리된 RNA 종의 정량적 결정에 기반한다. RNA 종은 모든 유형의 종양 시료, 예를 들면 생검 시료, 도말 시료, 절제된 종양 물질, 신선 동결된 종양 조직으로부터 또는 파라핀으로 포매되고 포르말린으로 고정된 종양 조직으로부터 분리될 수 있다. 먼저, 표시된 바와 같은, 유전자 UBE2C, BIRC5, DHCR7, RACGAP1, AURKA, PVALB, NMU, STC2, AZGP1, RBBP8, IL6ST, MGP, PTGER3, CXCL12, ABAT, CDH1, 및 PIP의 특정한 조합을 암호화하는 유전자의 RNA 수준이 결정된다. 이 발현 값에 기반하여 예후 점수는 예를 들면, 식 T5 T1, T4, 또는 T5b (하기를 참조함)에 따른 수학적 조합에 의해 계산된다. 높은 점수 값은 원격 전이의 발생에 대한 높은 위험을 나타내고, 낮은 점수 값은 원격 전이의 낮은 위험을 나타낸다. 결과적으로, 높은 점수는 또한, 환자가 보다 공격적인 치료, 예를 들면, 세포독성 화학요법으로부터 효과를 얻을 높은 위험의 환자임을 나타낸다.
도 1은 합쳐진 코호트, 및 원격 전이를 종결점으로 이용하여, ABCSG06 및 08 연구의 개별 치료 그룹에서 T5 점수의 95% 신뢰 구간을 포함한, 조정된 위험 단위 비율 (adjusted hazard unit ratio)의 Forrest Plot을 보여준다.
도 2는 T5 점수 값에 따라 높은 또는 낮은 위험으로 계층화된, 합쳐진 ABCSG06 및 08 코호트로부터 ER+, HER-, N0-3 환자의 Kaplan Meier 분석을 나타낸다.
본 실시예는 타목시펜으로 설정된 보조제로 균일하게 처리된 환자의 종양을 사용한 예후 유전자의 확인에 기반을 두고 있다. 추가로, 관련 유전자의 확인은 RNA 발현 수준에 기반하여 ESR1 양성 및 ERBB2 음성으로 분류된 종양에 제한되었다. 그 외에, 중간 위험, 예를 들면 등급 2 종양의 분리를 가능하게 하는 유전자가 알고리즘 개발을 위해 고려되었다. 마지막으로, Affymetrix HG_U133a 어레이로부터 정량적 실시간 PCR로의 플랫폼 이동뿐 아니라, 신선 동결된 조직으로부터 FFPE 조직으로의 시료 유형의 이동은 플랫폼 및 조직 유형과 무관하게, 강건한 알고리즘 성능을 보장하기 위해 수행되었다. 결과적으로, 원발성 종양으로부터 얻은 RNA 종의 발현 수준의 결정 및 전술된 바와 같은 후속의 복잡한 다변량 분석은 단지 보조제 설정으로 타목시펜에 의해 처리된 경우, 림프절 음성 또는 양성 초기 유방암으로 진단된 환자에서 질환의 재발 가능성의 예측을 위한 우수한 방법을 제공한다. 그러므로, 이 테스트는 경쟁자의 테스트보다 더 적은 유전자에 의존하지만, 특히 표준 임상 요인에 기반한 중간의 재발 위험을 나타내는 것으로 간주되는 종양에 대해 높은 민감성 및 음성의 예측값에 관한 우수한 정보를 제공한다.
전체 RNA를 Hamilton MICROLAB STARlet 액체 취급 로봇 상에서 하나의 10 ㎛ 전체 FFPE 조직 절편으로부터 Siemens의 실리카 비드-기반의 완전히 자동화된 RNA 분리방법으로 추출하였다 (17). 로봇, 완충제 및 화학물질은 Siemens VERSANT® kPCR Molecular System (Siemens Healthcare Diagnostics, Tarrytown, NY; 미국에서 상업적으로 이용가능하지 않음)의 일부였다. 요약하면, 150 ㎕ FFPE 완충제 (Buffer FFPE, research reagent, Siemens Healthcare Diagnostics)를 각 절편에 첨가하고, 파라핀을 녹이기 위해 진탕하면서 80℃에서 30분간 인큐베이션시켰다. 냉각시킨 후, 프로테이나제 K를 첨가하고 65℃에서 30분간 인큐베이션시켰다. 용해 후, 잔여 조직 잔해를 40 ㎕ 실리카-코팅된 산화철 비드와 65℃에서 15분 인큐베이션 단계에 의해 용해액으로부터 제거했다. 표면-결합된 조직 잔해를 갖는 비드를 자석으로 분리하고, 용해물은 표준 2 ml 깊이의 웰-플레이트 (well-plate) (96 wells)에 옮겼다. 전체 RNA 및 DNA를 40 ㎕ 미사용 비드에 결합시키고 실온에서 인큐베이션시켰다. 600 ㎕ 용해 완충액의 첨가에 의해 카오트로픽 (chaotropic) 상태가 생성되었다. 그 후, 비드는 자성에 의해 분리하고 상등액은 제거했다. 그 후에, 표면-결합된 핵산을 3회 세척하고 뒤이어 자화, 흡입 및 상등액 제거를 수행했다. 그 후에, 100 ㎕ 용출 버퍼와 10분간 70℃에서 진탕하면서 비드를 인큐베이션하여 핵산을 용출시켰다. 마지막으로, 비드를 분리하고 상등액을 12 ㎕ DNase I Mix (2 ㎕ DNase I (RNase 불포함); 10 ㎕ 10x DNase I 완충액; Ambion/Applied Biosystems, Darmstadt, Germany)와 인큐베이션시켜 오염된 DNA를 제거하였다. 37℃에서 30분간 인큐베이션 후, DNA 불포함 전체 RNA 용액을 분취하고 -80℃에 저장하거나 직접 역전사 동적 PCR (RTkPCR)에 의한 mRNA 발현 분석을 위해 사용하였다. 모든 시료를 3개의 기준 유전자 (RPL37A, CALM2, OAZ1) 및 최대 16개의 표적 유전자의 유전자 발현에 대해 ABI PRISM® 7900HT (Applied Biosystems, Darmstadt, Germany)에서 단일 단계 RT-kPCR로 분석하였다. ROX (6-카르복시-X-로다민)에 의한 SuperScript® III Platinum® One-Step Quantitative RT-PCR System (Invitrogen, Karlsruhe, Germany)을 제조사의 설명서에 따라 사용하였다. 각각의 프로브 및 프라이머가 표 1에 표시된다. PCR 조건은 하기와 같았다: 50℃에서 30분, 95℃에서 2분후, 95℃에서 15초 및 60℃에서 30초로 이루어진 사이클 40회. 모든 PCR 분석은 3배수로 수행하였다. RNA 수율에 대한 대용 표지로서, 하우스키퍼 (housekeeper) 유전자 RPL37A의 사이클 임계값 (Ct)값을 개시된 바와 같이 이용하였다 (17). 표적 유전자의 상대적인 유전자 발현 수준은 하기 식을 사용하여 델타-Ct 방법으로 계산하였다:
20 - (Ct(표적) - 평균값(Ct(기준 유전자))).
Affymetrix HG_U133a 어레이 (신선 동결 조직)로부터 정량적 실시간 PCR (FFPE 조직)로의 플랫폼 전환 (platform transfer)을 하기와 같이 계산했다. 158명의 환자로부터 얻은 물질을 짝을 지은 시료를 산출하기 위해 두 플랫폼을 사용하여 측정하였다. 델타-Ct 값을 PCR 데이터로부터 계산하였다. Log2-발현은 하한 (lower bound)을 적용하고 (하한 미만의 모든 값은 하한으로 설정함) 밑 2의 로그값으로 계산함으로써 Affymetrix 데이터로부터 계산하였다. 하한의 적용은 낮은 수준으로 발현되는 유전자/시료에 대한 증가된 상대적 측정 노이즈의 효과를 감소시킨다: 20의 하한을 이용했고, 0,1 내지 200의 하한도 또한 잘 작동한다. HG_U133a 프로브 세트를 (PCR 유래) 델타-Ct 값 내지 (Affymetrix 유래) log2-발현간의 Pearson 상관 계수를 최대화하는 것에 의해 각 PCR-측정된 유전자에 대해 선택했다. 다른 상관성 척도 (correlation measure), 예를 들면 Spearman 상관계수도 잘 작동할 것이다. 대부분의 경우에, 가장-상관성 있는 프로브 세트는 의도된 유전자에 속했고, 나머지 경우에 대해서 PCR-유전자는 추가의 가공을 위해 제거했다. 플랫폼 간의 나쁜 상관성을 보이는 유전자도 제거하고, 0.7의 Pearson 상관계수에 대한 임계값을 사용했고, 0.5 내지 0.8의 값도 잘 작동한다. 플랫폼 전환은 두 플랫폼에 대한 자율 (unsupervised) z-변환을 계산하고, 이들을 조합하는 것에 의해 완결했다; 그 후 단일 PCR-델타-Ct 값을 하기 단계에 의해 Affymetrix 스케일로 전환했다: (i) PCR 데이터의 z-변환에 의해 계수가 결정된 것인 아핀 선형 변환 (affine linear transformation)을 적용하는 단계, (ii) Affymetrix 데이터의 z-변환에 의해 계수가 결정된 것인 역 아핀 선형 변환 (inverse affine linear transformation)을 적용하는 단계, (iii) log2의 역수를 구하는 단계 (invert), 즉, 2를 밑으로 하는 지수 함수를 계산하는 단계. 2-배 z-변환 (two-fold z-transformation)에 대한 대안은, 또한 작동이 잘 되는, 선형 또는 고차 회귀, 로버스트 회귀 (robust regression) 또는 주성분 기반 방법 (principal component based method)이다.
프라이머 및 프로브 서열은 하기와 같았다:
각 유전자에 대한 프라이머 및 프로브 서열:
유전자 프로브 서열 ID 정방향 프라이머 서열 ID 역방향 프라이머 서열 ID
ABAT TCGCCCTAAGAGGCTCTTCCTC 1 GGCAACTTGAGGTCTGACTTTTG 2 GGTCAGCTCACAAGTGGTGTGA 3
ADRA2A TTGTCCTTTCCCCCCTCCGTGC 4 CCCCAAGAGCTGTTAGGTATCAA 5 TCAATGACATGATCTCAACCAGAA 6
APOD CATCAGCTCTCAACTCCTGGTTTAACA 7 ACTCACTAATGGAAAACGGAAAGATC 8 TCACCTTCGATTTGATTCACAGTT 9
ASPH TGGGAGGAAGGCAAGGTGCTCATC 10 TGTGCCAACGAGACCAAGAC 11 TCGTGCTCAAAGGAGTCATCA 12
AURKA CCGTCAGCCTGTGCTAGGCAT 13 AATCTGGAGGCAAGGTTCGA 14 TCTGGATTTGCCTCCTGTGAA 15
BIRC5 AGCCAGATGACGACCCCATAGAGGAACA 16 CCCAGTGTTTCTTCTGCTTCAAG 17 CAACCGGACGAATGCTTTTT 18
CELSR2 ACTGACTTTCCTTCTGGAGCAGGTGGC 19 TCCAAGCATGTATTCCAGACTTGT 20 TGCCCACAGCCTCTTTTTCT 21
CHPT1 CCACGGCCACCGAAGAGGCAC 22 CGCTCGTGCTCATCTCCTACT 23 CCCAGTGCACATAAAAGGTATGTC 24
CXCL12 CCACAGCAGGGTTTCAGGTTCC 25 GCCACTACCCCCTCCTGAA 26 TCACCTTGCCAACAGTTCTGAT 27
CYBRD1 AGGGCATCGCCATCATCGTC 28 GTCACCGGCTTCGTCTTCA 29 CAGGTCCACGGCAGTCTGT 30
DCN TCTTTTCAGCAACCCGGTCCA 31 AAGGCTTCTTATTCGGGTGTGA 32 TGGATGGCTGTATCTCCCAGTA 33
DHCR7 TGAGCGCCCACCCTCTCGA 34 GGGCTCTGCTTCCCGATT 35 AGTCATAGGGCAAGCAGAAAATTC 36
E2F8 CAGGATACCTAATCCCTCTCACGCAG 37 AAATGTCTCCGCAACCTTGTTC 38 CTGCCCCCAGGGATGAG 39
EPHX2 TGAAGCGGGAGGACTTTTTGTAAA 40 CGATGAGAGTGTTTTATCCATGCA 41 GCTGAGGCTGGGCTCTTCT 42
ESR1 ATGCCCTTTTGCCGATGCA 43 GCCAAATTGTGTTTGATGGATTAA 44 GACAAAACCGAGTCACATCAGTAATAG 45
GJA1 TGCACAGCCTTTTGATTTCCCCGAT 46 CGGGAAGCACCATCTCTAACTC 47 TTCATGTCCAGCAGCTAGTTTTTT 48
HSPA2 CAAGTCAGCAAACACGCAAAA 49 CATGCACGAACTAATCAAAAATGC 50 ACATTATTCGAGGTTTCTCTTTAATGC 51
IL6ST CAAGCTCCACCTTCCAAAGGACCT 52 CCCTGAATCCATAAAGGCATACC 53 CAGCTTCGTTTTTCCCTACTTTTT 54
INPP4B TCCGAGCGCTGGATTGCATGAG 55 GCACCAGTTACACAAGGACTTCTTT 56 TCTCTATGCGGCATCCTTCTC 57
MAPT AGACTATTTGCACACTGCCGCCT 58 GTGGCTCAAAGGATAATATCAAACAC 59 ACCTTGCTCAGGTCAACTGGTT 60
MGP CCTTCATATCCCCTCAGCAGAGATGG 61 CCTTCATTAACAGGAGAAATGCAA 62 ATTGAGCTCGTGGACAGGCTTA 63
NEK2 TCCTGAACAAATGAATCGCATGTCCTACAA 64 ATTTGTTGGCACACCTTATTACATGT 65 AAGCAGCCCAATGACCAGATa 66
PCNA AAATACTAAAATGCGCCGGCAATGA 67 GGGCGTGAACCTCACCAGTA 68 CTTCGGCCCTTAGTGTAATGATATC 69
PGR TTGATAGAAACGCTGTGAGCTCGA 70 AGCTCATCAAGGCAATTGGTTT 71 ACAAGATCATGCAAGTTATCAAGAAGTT 72
PIP TGCATGGTGGTTAAAACTTACCTCA 73 TGCTTGCAGTTCAAACAGAATTG 74 CACCTTGTAGAGGGATGCTGCTA 75
PLAT CAGAAAGTGGCCATGCCACCCTG 76 TGGGAAGACATGAATGCACACTA 77 GGAGGTTGGGCTTTAGCTGAA 78
PRSS16 CACTGCCGGTCACCCACACCA 79 CTGAGGAGCACAGAACCTCAACT 80 CGAACTCGGTACATGTCTGATACAA 81
PTGER3 TCGGTCTGCTGGTCTCCGCTCC 82 CTGATTGAAGATCATTTTCAACATCA 83 GACGGCCATTCAGCTTATGG 84
PTPRT TTGGCTTCTGGACACCCTCACA 85 GAGTTGTGGCCTCTACCATTGC 86 GAGCGGGAACCTTGGGATAG 87
RACGAP1 ACTGAGAATCTCCACCCGGCGCA 88 TCGCCAACTGGATAAATTGGA 89 GAATGTGCGGAATCTGTTTGAG 90
RBBP8 ACCGATTCCGCTACATTCCACCCAAC 91 AGAAATTGGCTTCCTGCTCAAG 92 AAAACCAACTTCCCAAAAATTCTCT 93
SCUBE2 CTAGAGGGTTCCAGGTCCCATACGTGACATA 94 TGTGGATTCAGTTCAAGTCCAATG 95 CCATCTCGAACTATGTCTTCAATGAGT 96
SEC14L2 TGGGAGGCATGCAACGCGTG 97 AGGTCTTACTAAGCAGTCCCATCTCT 98 CGACCGGCACCTGAACTC 99
SQLE TATGCGTCTCCCAAAAGAAGAACACCTCG 100 GCAAGCTTCCTTCCTCCTTCA 101 CCTTTAGCAGTTTTCTCCATAGTTTTATATC 102
TFAP2B CAACACCACCACTAACAGGCACACGTC 103 GGCATGGACAAGATGTTCTTGA 104 CCTCCTTGTCGCCAGTTTTACT 105
TOP2A CAGATCAGGACCAAGATGGTTCCCACAT 106 CATTGAAGACGCTTCGTTATGG 107 CCAGTTGTGATGGATAAAATTAATCAG 108
TRIM29 TGCTGTCTCACTACCGGCCATTCTACG 109 TGGAAATCTGGCAAGCAGACT 110 CAATCCCGTTGCCTTTGTTG 111
UBE2C TGAACACACATGCTGCCGAGCTCTG 112 CTTCTAGGAGAACCCAACATTGATAGT 113 GTTTCTTGCAGGTACTTCTTAAAAGCT 114
WNT5A TATTCACATCCCCTCAGTTGCAGTGAATTG 115 CTGTGGCTCTTAATTTATTGCATAATG 116 TTAGTGCTTTTTGCTTTCAAGATCTT 117
STC2 TCTCACCTTGACCCTCAGCCAAG 118 ACATTTGACAAATTTCCCTTAGGATT 119 CCAGGACGCAGCTTTACCAA 120
AZGP1 CACCAGCCACCAGGCCCCAG 121 TCCTGGACCGGCAAGATC 122 TAGGCCAGGCACTTCAGTTTC 123
CALM2 TCGCGTCTCGGAAACCGGTAGC 124 GAGCGAGCTGAGTGGTTGTG 125 AGTCAGTTGGTCAGCCATGCT 126
CDH1 CCTGCCAATCCCGATGAAATTGGAAAT 127 TGAGTGTCCCCCGGTATCTTC 128 TCAGCCGCTTTCAGATTTTCA 129
NMU ACCCTGCTGACCTTCTTCCATTCCGT 130 AGAAATTGGCTTCCTGCTCAAG 131 AAAACCAACTTCCCAAAAATTCTCT 132
OAZ1 TGCTTCCACAAGAACCGCGAGGA 133 CGAGCCGACCATGTCTTCAT 134 AAGCCCAAAAAGCTGAAGGTT 135
PVALB AAGTTCTTCCAAATGGTCGGCC 136 CCGACTCCTTCGACCACAA 137 CATCATCCGCACTCTTTTTCTTC 138
RPL37A TGGCTGGCGGTGCCTGGA 139 TGTGGTTCCTGCATGAAGACA 140 GTGACAGCGGAAGTGGTATTGTAC 141
하기 표 2는 본 발명의 방법 및 특정한 구체예 T5, T1, T4, 및 T5b에서 사용된 유전자를 열거한다. 표 2는 또한 타목시펜 치료 중 주어진 유전자의 과발현이 좋은 또는 나쁜 결과를 나타내는지를 보여준다. 표 2는 유전자의 기능, 세포 내에서 구획 국소화 (compartment localization) 및 관련되어 있는 세포 과정 (cellular process)를 열거한다.
알고리즘 T5, T1, T4, 및 T5b의 유전자 목록:
유전자 이름 높은 발현 기능 구성요소 과정
UBE2C ubiquitin-conjugating enzyme 나쁜 결과 ATP 결합 세포질 세포 분열
BIRC5 baculoviral IAP repeat-containing 5 나쁜 결과 Ran GTPase 결합 세포질 세포 주기
DHCR7 7-dehydrocholesterol reductase 나쁜 결과 7-디히드로콜레스테롤 리덕타제 활성 endoplasmatic reticulum membrane 세포 증식의 조절
RACGAP1 Rac GTPase activating protein 1 나쁜 결과 GTPase 활성화 단백질 1 세포질 세포 주기
AURKA aurora kinase A 나쁜 결과 ATP 결합 중심체 체세포 분열 주기
PVALB parvalbumin 나쁜 결과 칼슘 이온 결합
NMU neuromedin U 나쁜 결과 수용체 결합 세포외 영역 신호 전달
STC2 stanniocalcin 2 좋은 결과 호르몬 활성 세포외 영역 세포 표면 수용체 연계 신호 전달
AZGP1 alpha-2-glycoprotein 1 좋은 결과 단백질 막관통 수송체 활성 세포외 영역 세포 증식의 음성 조절
RBBP8 retinoblastoma binding protein 8 좋은 결과 단백질 결합 세포 주기 체크포인트
IL6ST interleukin 6 signal transducer 좋은 결과 수용체 활성 세포외 영역 신호 전달
MGP matrix Gla protein 좋은 결과 세포외 기질 구성요소 세포외 영역 세포 분화
PTGER3 prostaglandin E receptor 3 좋은 결과 리간드-의존적 수용체 활성 원형질막 신호 전달
CXCL12 chemokine (C-XC motif) ligand 12 좋은 결과 케모킨 (chemokine) 활성 세포외 영역 신호 전달
ABAT 4-aminobutyrate aminotransferase 좋은 결과 트랜스퍼라제 활성 미토콘드리아 감마-아미노부티르산 이화 과정
CDH1 cadherin 1 좋은 결과 세포 부착 분자 결합 원형질막 동종친화성 세포 부착
PIP prolactin-induced protein 좋은 결과 액틴 (actin) 결합 세포 외 지역
CALM2 기준 유전자
OAZ1 기준 유전자
RPL37A 기준 유전자
하기 표 3은 각 알고리즘에 대해 사용된 유전자의 조합을 나타낸다.
각 알고리즘에 대한 유전자의 조합:
유전자 Algo_T1 Algo_T4 Algo_T5 Algo_T5b
UBE2C X
BIRC5 X X X
DHCR7 X X X
RACGAP1 X X
AURKA X
PVALB X X
NMU X X
STC2 X X X
AZGP1 X X
RBBP8 X X X
IL6ST X X X
MGP X X
PTGER3 X X
CXCL12 X X
ABAT X
CDH1 X
PIP X
하기 표 4는 본 발명의 마커 유전자의 Affy 프로브세트 ID 및 TaqMan 디자인 ID를 나타낸다.
유전자 디자인 ID 프로브세트 ID
UBE2C R65 202954_at
BIRC5 SC089 202095_s_at
DHCR7 CAGMC334 201791_s_at
RACGAP1 R125-2 222077_s_at
AURKA CAGMC336 204092_s_at
PVALB CAGMC339 205336_at
NMU CAGMC331 206023_at
STC2 R52 203438_at
AZGP1 CAGMC372 209309_at
RBBP8 CAGMC347 203344_s_at
IL6ST CAGMC312 212196_at
MGP CAGMC383 202291_s_at
PTGER3 CAGMC315 213933_at
CXCL12 CAGMC342 209687_at
ABAT CAGMC338 209460_at
CDH1 CAGMC335 201131_s_at
하기 표 5는 본 발명의 마커 유전자의 전체 명칭, Entrez GeneID, 유전자 은행 수탁 번호 (accession number) 및 염색체상의 위치를 나타낸다.
공식 기호 (Official Symbol) 공식 전체 명칭 Entrez GeneID 수탁 번호 위치
UBE2C ubiquitin-conjugating enzyme E2C 11065 U73379 20q13.12
BIRC5 baculoviral IAP repeat-containing 5 332 U75285 17q25
DHCR7 7-dehydrocholesterol reductase 1717 AF034544 11q13.4
STC2 staniocalcin 2 8614 AB012664 5q35.2
RBBP8 retinoblastoma binding protein 8 5932 AF043431 18q11.2
IL6ST interleukin 6 signal transducer 3572 M57230 5q11
MGP matrix Gla protein 4256 M58549 12p12.3
AZGP1 alpha-2-glycoprotein 1, zinc-binding 563 BC005306 11q22.1
RACGAP1 Rac GTPase activating protein 1 29127 NM_013277 12q13
AURKA aurora kinase A 6790 BC001280 20q13
PVALB parvalbumin 5816 NM_002854 22q13.1
NMU neuromedin U 10874 X76029 4q12
PTGER3 prostaglandin E receptor 3 (subtype EP3) 5733 X83863 1p31.2
CXCL12 chemokine (C-X-C motif) ligand 12 (stromal cell-derived factor 1) 6387 L36033 10q11.1
ABAT 4-aminobutyrat aminotransferase 18 18 L32961 16p13.2
CDH1 cadherin 1, type 1, E-cadherin (epithelial) 999 L08599 16q22.1
PIP prolactin-induced protein 5304 NMM_002652 7q32-qter
예시 알고리즘 T5:
알고리즘 T5는 각 구성원이 두 유전자의 선형 조합 (linear combination)인 네 개의 구성원의 커미티 (committee)이다. T5에 대한 수학식이 하기에 표시된다; 표기법은 T1에서와 동일하다. T5는 유전자 발현 데이터 단독으로부터 계산될 수 있다.
riskMember1 = 0.434039 [0.301..0.567] * (0.939 * BIRC5 -3.831)
-0.491845 [-0.714..-0.270] * (0.707 * RBBP8 -0.934)
riskMember2 = 0.488785 [0.302..0.675] * (0.794 * UBE2C -1.416)
-0.374702 [-0.570..-0.179] * (0.814 * IL6ST -5.034)
riskMember3 = -0.39169 [-0.541..-0.242] * (0.674 * AZGP1 -0.777)
+0.44229 [0.256..0.628] * (0.891 * DHCR7 -4.378)
riskMember4 = -0.377752 [-0.543..-0.212] * (0.485 * MGP +4.330)
-0.177669 [-0.267..-0.088] * (0.826 * STC2 -3.630)
risk = riskMember1 + riskMember2 + riskMember3 + riskMember4
각 행 왼쪽의 계수는 COX 비례위험 회귀 (COX proportional hazards regression) 계수로 계산되었고, 꺾쇠 괄호 안의 숫자는 이 계수에 대한 95% 신뢰 극한을 의미한다. 다시 말해, 항(0.939 * BIRC5 -3.831)를 0.434039와 곱하는 대신, 0.301 내지 0.567 사이의 계수와 곱해질 수 있고 여전히 95% 신뢰 극한 내의 예측 결과를 제공한다. 각 행 오른쪽에 있는 둥근 괄호 안의 항은 PCR로부터 Affymetrix로의 플랫폼 전환을 의미한다: 변수 PVALB, CDH1, ... 는 기준 유전자에 의해 정규화된 PCR-기반 발현을 의미하고 (델타-Ct 값), 둥근 괄호 안의 전체 항은 해당하는 프로브 세트의 Affymetrix 마이크로어레이 발현값의 로그 (밑은 2)에 해당한다.
무작위 임상 시험 ABCSG06 (n=332) 또는 ABCSG08(n=1244)에 참여한, 3개 이하의 양성 림프절 및 ER+, HER2- 종양을 갖는 타목시펜 또는 아나스트로졸로 치료된 환자에서 알고리즘 T5의 성능을 테스트하였다. 도 1에 표시된 바와 같이, Cox 회귀 분석은 T5 점수가, 테스트된 모든 코호트 (cohort)에서 원격 전이의 발생과 유의성 있는 관련성을 갖는다는 것을 보여준다.
T5 점수에 대한 미리 정의된 컷오프를 사용하여 조합된 ABCSG 코호트의 환자를 분류한 후, Kaplan Meier 분석을 수행하였다. 원격 전이 발생의 낮은 위험을 갖는 환자는 T5 점수 ≤ -9.3를 가진 반면, 원격 전이 발생의 높은 위험을 갖는 환자는 -9.3을 초과하는 T5 점수를 가졌다. 도 2에 표시된 바와 같이, 두 위험군의 높은 유의성 있는 분리가 관찰된다.
중요하게, T5 점수를 평가하고, 종양 크기, 종양 등급 및 림프절 전이 상태와 같은 임상 파라미터의 입력 (entry)에 기반한 치료 선택을 보조하는 온라인 도구인 "Adjuvant! Online"과 비교하였다. T5 점수를 Adjuvant!Online Relapse Risk 점수 대비 이변수 (bivariate) Cox 회귀에 의해 테스트했을 때, 두 점수는 원격 전이의 발생과 유의성 있는 관련성을 유지하였다. Adjuvant!Online (컷오프 8) 및 T5 (컷오프 -9.3)에 따라 계층화된, 이분법 데이터 (dichotomized data)를 이용한 이변량 Cox 회귀는, 다시 임상 종결점인 전이 발생까지의 시간 (time to metastasis)과 높은 유의성이 있고 독립적인 관련성을 산출하였다.
T5 및 Adjuvant!Online에 대한 이변수 Cox 회귀
변수 위험 비율 95% CI* P
Adjuvant!Online 2.36 1.58-3.54 <0.0001
Gene-expression
signature (위험군)
2.62 1.71-4.01 <0.0001
Adjuvant!Online (점수) 1.04 1.02-1.06 <0.0001
Gene-expression
signature (위험군)
1.35 1.21-1.49 <0.0001
HR = 위험 비율 (hazard ratio), 95%CI = 95% 신뢰 구간 (confidence interval), p = P 값.
미리 정의된 컷오프에 따라 High = 고위험군, Low = 저위험군인 예시적인 Kaplan Meyer 곡선이 도 1에 나타난다,
높은 값의 T5 점수는 주어진 기간에 원격 전이 발생의 증가된 위험을 나타낸다.
타목시펜으로 치료된 환자와 또한 아로마타제 저해제로 치료된 환자의 경우를 나타내었다.
예시 알고리즘 T1:
알고리즘 T1은 각 구성원이 네 개 이하의 변수의 선형 조합인 것인 세 구성원의 커미티이다. 일반적으로 변수는 유전자 발현 또는 임상적 변수일 수 있다. T1에서 유일한 비-유전자 변수는 환자가 림프절 음성이면 0으로 코딩되고, 환자가 림프-절-양성이면 1로 코딩된 림프절 전이 상태이다. T1의 수학식이 하기에 나타난다.
riskMember1 = +0.193935 [0.108..0.280] * (0.792 * PVALB -2.189)
-0.240252 [-0.400..-0.080] * (0.859 * CDH1 -2.900)
-0.270069 [-0.385..-0.155] * (0.821 * STC2 -3.529)
+1.2053 [0.534..1.877] * nodalStatus
riskMember2 = -0.25051 [-0.437..-0.064] * (0.558 * CXCL12 +0.324)
-0.421992 [-0.687..-0.157] * (0.715 * RBBP8 -1.063)
+0.148497 [0.029..0.268] * (1.823 * NMU -12.563)
+0.293563 [0.108..0.479] * (0.989 * BIRC5 -4.536)
riskMember3 = +0.308391 [0.074..0.543] * (0.812 * AURKA -2.656)
-0.225358 [-0.395..-0.055] * (0.637 * PTGER3 + 0.492)
-0.116312 [-0.202..-0.031] * (0.724 * PIP + 0.985)
risk = + riskMember1 + riskMember2 + riskMember3
각 행 왼쪽의 계수는 COX 비례위험 회귀 계수로 계산되었고, 꺾쇠 괄호 안의 숫자는 이 계수에 대한 95% 신뢰 극한을 의미한다. 각 행 오른쪽에 있는 둥근 괄호 안의 항은 PCR로부터 Affymetrix로의 플랫폼 전환을 의미한다: 변수 PVALB, CDH1, ... 는 기준 유전자에 의해 정규화된 PCR-기반 발현을 의미하고, 둥근 괄호 안의 전체 항은 해당하는 프로브 세트의 Affymetrix 마이크로어레이 발현값의 로그 (밑은 2)에 해당한다.
예시 알고리즘 T4:
알고리즘 T4는 모티프의 선형 조합이다. Affymetrix 데이터세트 및 PCR 데이터의 수개의 분석 중 상위 10개의 유전자가 모티프로 클러스터링 되었다. 클러스터에 속하지 않은 유전자는 단일 유전자-모티프로 사용되었다. COX 비례위험 회귀 계수는 다변량 분석에서 확인하였다.
일반적으로, 모티프는 단일 유전자 발현일 수 있거나 상관된 유전자의 평균 유전자 발현일 수 있다. T4의 수학식은 하기에 나타난다.
prolif = ((0.84 [0.697..0.977] * RACGAP1 -2.174) + (0.85 [0.713..0.988] *DHCR7 -3.808)+ (0.94 [0.786..1.089] * BIRC5 -3.734)) / 3
motiv2 = ((0.83 [0.693..0.96] * IL6ST -5.295) + (1.11 [0.930..1.288] * ABAT -7.019) + (0.84 [0.701..0.972] * STC2 -3.857)) / 3
ptger3 = (PTGER3 * 0.57 [0.475..0.659] + 1.436)
cxcl12 = (CXCL12 * 0.53 [0.446..0.618] + 0.847)
pvalb = (PVALB * 0.67 [0.558..0.774] -0.466)
각 유전자에 대한 인자 (factor) 및 오프셋 (offset)은 PCR로부터 Affymetrix로의 플랫폼 전환을 의미한다: 변수 RACGAP1, DHCR7, ... 는 CALM2 및 PPIA에 의해 정규화된 PCR-기반 발현을 의미하고, 둥근 괄호 안의 전체 항은 해당하는 프로브 세트의 Affymetrix 마이크로어레이 발현값의 로그 (밑은 2)에 해당한다. 꺾쇠 괄호 안의 숫자는 이 인자에 대한 95% 신뢰 극한을 의미한다.
이 알고리즘이 임상적 변수와 조합되어 훨씬 더 우수하게 수행되었기 때문에 림프절 전이 상태가 첨가되었다. T4에서 림프절 전이 상태는 환자가 림프절 음성이면 0으로 코딩되고 환자가 림프-절-양성이면 1로 코딩된다. 이와 함께, 알고리즘 T4는 하기와 같다:
risk = -0.32 [-0.510..-0.137] * motiv2
+ 0.65 [0.411..0.886] * prolif
- 0.24 [-0.398..-0.08] * ptger3
- 0.05 [-0.225..0.131] * cxcl12
+ 0.09 [0.019..0.154] * pvalb
+ nodalStatus
위험의 계수는 COX 비례위험 회귀 계수로 계산되었고, 꺾쇠 괄호 안의 숫자는 이 계수에 대한 95% 신뢰 극한을 의미한다.
알고리즘 T5b는 각 구성원이 네 개 유전자의 선형 조합인 두 구성원의 커미티이다. T5b에 대한 수학식은 하기에 표시되고, 표기법은 T1 및 T5에서와 동일하다. T5b에서 비-유전자 변수 (non-gene variable)는, 환자가 림프절 음성이면 0으로 코딩되고, 환자가 림프-절-양성이면 1로 코딩되며, 림프-절 전이 상태가 알려져 있지 않으면 0.5로 코딩되는 것인 림프절 전이 상태이다. T5b는 하기에 의해 정의된다:
riskMember1 = 0.359536 [0.153..0.566] * (0.891 * DHCR7 -4.378)
-0.288119 [-0.463..-0.113] * (0.485 * MGP + 4.330)
+0.257341 [0.112..0.403] * (1.118 * NMU -5.128)
-0.337663 [-0.499..-0.176] * (0.674 * AZGP1 -0.777)
riskMember2 = -0.374940 [-0.611..-0.139] * (0.707 * RBBP8 -0.934)
-0.387371 [-0.597..-0.178] * (0.814 * IL6ST -5.034)
+0.800745 [0.551..1.051] * (0.860 * RACGAP1 -2.518)
+0.770650 [0.323..1.219] * Nodalstatus
risk = riskMember1 + riskMember2
통상의 기술자는, 전술된 알고리즘이 특정한 실시예를 나타내고, 표 2에 주어진 바와 같은 결과와 유전자 발현의 연관성에 대한 정보에 기반하여, 대안 알고리즘이 통상적인 기술을 사용하여 확립될 수 있다는 것을 이해한다.
유전자의 하위세트 (subset) 이용에 의한 알고리즘 단순화
“예시 알고리즘 T5”는 각각 2개의 목적 유전자를 갖는 4개의 구성원으로 구성되는 커미티 예측자 (committee predictor)이다. 각 구성원은 원격 재발의 독립적이고 자립적인 (self-contained) 예측자이고, 각 추가 구성원은 유방암 환자에 대한 전이까지의 시간, 사망까지의 시간 또는 생존 가능성을 예측하는 알고리즘의 견고성 (robustness) 및 예측력에 기여한다. 하기 식은 전술된“예시 알고리즘 T5"를 나타낸다; 판독의 용이를 위해 소수점 뒷자리의 숫자를 둘째 자리까지로 절단하였다; 꺾쇠 괄호 안의 범위는 계수의 추산된 범위를 나열한다 (평균 +/- 3 표준편차).
T5 알고리즘:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
-0.18 [-0.31..-0.06] * MGP -0.13 [-0.25..-0.02] * STC2
c-indices: trainSet=0.724,
알고리즘 내 유전자 명칭은 전술된 바와 같은 하나 이상의 하우스키핑 유전자 대비 해당 유전자의 mRNA 발현의 차이를 의미한다.
소견 코호트 (finding cohort) (234개의 종양 시료)와 다른 코호트를 분석함으로써, "최초의 (original) T5 알고리즘"의 일부 단순화가 여전히 최초 T5 알고리즘보다 유의성 있게 열등하지 않은 진단 성능을 산출한다는 것을 발견한 것은 놀라운 일이었다. 가장 간단한 단순화는 커미티 예측자를 단지 하나의 구성원으로 감소시키는 것이었다. "일 구성원 커미티 (one-memeber committee)"의 성능에 대한 예가 하기에 제시된다:
member 1 only:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
c-indices: trainSet=0.653, independentCohort=0.681
member 2 only:
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
c-indices: trainSet=0.664, independentCohort=0.696
member 3 only:
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
c-indices: trainSet=0.666, independentCohort=0.601
member 4 only:
-0.18 [-0.31..-0.06] * MGP -0.13 [-0.25..-0.02] * STC2
c-indices: trainSet=0.668, independentCohort=0.593
234개 시료의 독립적 코호트에서 나타난 바와 같은 일 구성원 커미티의 성능은 전체 알고리즘의 성능에 비교하여 현저히 감소된다. 그러나, 더 적은 구성원으로 구성되는 커미티를 사용하는 것은, 특정 진단 목적에 대해 허용될 수 있는 유방암 재발 또는 유방암 사망 위험도의 더 간단하고, 비용이 덜 드는 추정을 가능하게 한다,
점진적으로 2개 이상 4개 미만의 구성원을 신규한 예후 커미티 예측자 알고리즘 (prognostic committe predictor algorithm)에 결합하는 것은, 일 구성원 커미티에 비교하여 진단 성능에서 종종 작지만 유의성 있는 증가를 초래한다. 커미티 구성원의 일부 조합에 의해 현저한 개선이 있는 반면, 다른 조합은 거의 개선이 없다는 것을 알게 된 것은 놀라운 것이었다. 초기에 가설은, 이용된 유전자에 의해 반영된 바와 같은 유사한 생물학적 동기 (biological motive)를 나타내는 구성원의 조합이, 뚜렷이 다른 생물학적 동기를 반영하는 구성원을 조합한 것보다 더 작은 개선을 산출했다는 것이었다. 그러나, 이는 사실이 아니었다. 유전자의 다른 조합보다 더 높은 예후력 (prognostic power)을 보이는 알고리즘을 생성하는 일부 유전자의 조합을 예언하는 규칙은 확인되지 않았다. 유망한 조합은 오직 실험 데이터에 기반하여 선별될 수 있었다. 단순화된 그러나 강력한 알고리즘을 산출하는 조합 커미티 구성원의 확인된 조합이 하기에 제시된다.
members 1 and 2 only:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
c-indices: trainSet=0.675, independentCohort=0.712
members 1 and 3 only:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
c-indices: trainSet=0.697, independentCohort=0.688
members 1 and 4 only:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
-0.18 [-0.31..-0.06] * MGP -0.13 [-0.25..-0.02] * STC2
c-indices: trainSet=0.705, independentCohort=0.679
members 2 and 3 only:
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
c-indices: trainSet=0.698, independentCohort=0.670
members 1, 2 and 3 only:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
c-indices: trainSet=0.701, independentCohort=0.715
상이한 커미티 구성원으로부터 단일 유전자 또는 유전자들을 제외한 완전한 커미티 구성원을 생략하지 않는 것은 또한 가능하지만, 전체 알고리즘의 재훈련을 요구한다. 그러나, 그것을 또한 수행하는 것이 이로울 수 있다. 전체 구성원 또는 개별 유전자를 생략함으로써 발생되는 단순화된 알고리즘의 성능은 대체로 동일하다.
유전자 대체 (replacement)에 의한 알고리즘 변수
"예시 알고리즘 T5"와 같은 전술된 알고리즘은, 또한 하나 이상의 유전자를 하나 이상의 다른 유전자로 대체함으로써 변형될 수 있다. 그와 같은 변형의 목적은 특정 플랫폼상에서 측정하기 어려운 유전자를 그 플랫폼에서 분석하는 것이 더 간단한 유전자로 치환하는 것이다. 그와 같은 전환이 출발 알고리즘에 비교하여 개선된 성능을 반드시 산출하지는 않을 수 있는 반면, 예후 알고리즘을 특정 진단 플랫폼에 이식하기 위한 단서를 산출할 수 있다. 일반적으로, 예측 알고리즘의 진단력을 보존하면서, 하나의 유전자를 다른 유전자로 대체하는 것은 하나의 유전자를 높은 상관성 (예를 들면, Pearson 상관계수에 의한 상관성)을 갖는 공-발현되는 (co-expressed) 유전자로 치환함으로써 가장 잘 달성될 수 있다. 그러나, 다른 플랫폼상에서 평가될 경우, 하나의 플랫폼상에서 높은 상관관계가 있는 두 유전자의 mRNA 발현이 상당히 서로 독립적인 것으로 보일 수 있다는 것을 명심해야 한다. 따라서, 실험적으로 실시할 경우, 명백히 용이한 대체가 이용되는 플랫폼의 계측불가능 (imponderabilia)에 항상 의존하여, 실망스러울 정도로 나쁜 결과뿐 아니라 놀랄만한 강력한 결과를 산출할 수 있다. 이 과정을 반복함으로써, 수 개의 유전자를 대체할 수 있다.
그와 같은 접근법의 효율성은 확인 코호트 (validation cohort)에서 T5 알고리즘 점수 및 그의 변이 (variant)의 예측 성능을 평가함으로써 입증될 수 있다. 하기 표는 두 확인 코호트에서 종결점 (endpoint) 원격 재발에 대한 c-index를 나타낸다.
변이 확인 연구 A 확인 연구 B
최초 알고리즘 T5 c-index = 0.718 c-index = 0.686
BIRC5의 생략 (setting expression to some constant) c-index = 0.672 c-index = 0.643
UBE2C에 의한 BIRC5의 대체 (계수의 조정 없음) c-index = 0.707 c-index = 0.678
T5 유전자 중 하나, 예를 들면 본 명세서에 나타난 BIRC5의 생략은 예측 성능을 현저하게 감소시키는 것을 알 수 있다. T5 유전자 중 하나를 다른 유전자로 대체하는 것은 거의 동일한 성능을 산출한다.
유전자를 대체하는 더 좋은 방법은 알고리즘을 재-훈련하는 것이다. T5는 4개의 독립된 커미티 구성원으로 구성되기 때문에, 대체된 유전자를 포함하는 구성원만을 재-훈련해야 한다. 하기 식은 234명의 유방암 환자의 코호트 내에서 훈련된, 앞서 표시된 T5 알고리즘의 유전자 치환을 입증한다. 단지 하나의 구성원이 하기에 나타나고, c-index 계산을 위해, 나머지 구성원은 최초 T5 알고리즘으로부터 변경되지 않고 사용되었다. 꺾쇠 괄호 내의 범위는 계수의 추정 범위를 나열한다: 평균 +/- 3 표준편차.
Member 1 of T5:
Original member 1:
+0.41 [0.21..0.61] * BIRC5 -0.33 [-0.57..-0.09] * RBBP8
c-indices: trainSet=0.724, independentCohort=0.705
replace BIRC5 by TOP2A in member 1:
+0.47 [0.24..0.69] * TOP2A -0.34 [-0.58..-0.10] * RBBP8
c-indices: trainSet=0.734, independentCohort=0.694
replace BIRC5 by RACGAP1 in member 1:
+0.69 [0.37..1.00] * RACGAP1 -0.33 [-0.57..-0.09] * RBBP8
c-indices: trainSet=0.736, independentCohort=0.743
replace RBBP8 by CELSR2 in member 1:
+0.38 [0.19..0.57] * BIRC5 -0.18 [-0.41..0.05] * CELSR2
c-indices: trainSet=0.726, independentCohort=0.680
replace RBBP8 by PGR in member 1:
+0.35 [0.15..0.54] * BIRC5 -0.09 [-0.23..0.05] * PGR
c-indices: trainSet=0.727, independentCohort=0.731
Member 2 of T5:
Original member 2:
+0.38 [0.15..0.61] * UBE2C -0.30 [-0.55..-0.06] * IL6ST
c-indices: trainSet=0.724, independentCohort=0.725
replace UBE2C by RACGAP1 in member 2:
+0.65 [0.33..0.96] * RACGAP1 -0.38 [-0.62..-0.13] * IL6ST
c-indices: trainSet=0.735, independentCohort=0.718
replace UBE2C by TOP2A in member 2:
+0.42 [0.20..0.65] * TOP2A -0.38 [-0.62..-0.13] * IL6ST
c-indices: trainSet=0.734, independentCohort=0.700
replace IL6ST by INPP4B in member 2:
+0.40 [0.17..0.62] * UBE2C -0.25 [-0.55..0.05] * INPP4B
c-indices: trainSet=0.725, independentCohort=0.686
replace IL6ST by MAPT in member 2:
+0.45 [0.22..0.69] * UBE2C -0.14 [-0.28..0.01] * MAPT
c-indices: trainSet=0.727, independentCohort=0.711
Member 3 of T5:
Original member 3:
-0.28 [-0.43..-0.12] * AZGP1 +0.42 [0.16..0.68] * DHCR7
c-indices: trainSet=0.724, independentCohort=0.705
replace AZGP1 by PIP in member 3:
-0.10 [-0.18..-0.02] * PIP +0.43 [0.16..0.70] * DHCR7
c-indices: trainSet=0.725, independentCohort=0.692
replace AZGP1 by EPHX2 in member 3:
-0.23 [-0.43..-0.02] * EPHX2 +0.37 [0.10..0.64] * DHCR7
c-indices: trainSet=0.719, independentCohort=0.698
replace AZGP1 by PLAT in member 3:
-0.23 [-0.40..-0.06] * PLAT +0.43 [0.18..0.68] * DHCR7
c-indices: trainSet=0.712, independentCohort=0.715
replace DHCR7 by AURKA in member 3:
-0.23 [-0.39..-0.06] * AZGP1 +0.34 [0.10..0.58] * AURKA
c-indices: trainSet=0.716, independentCohort=0.733
Member 4 of T5:
Original member 4:
-0.18 [-0.31..-0.06] * MGP -0.13 [-0.25..-0.02] * STC2
c-indices: trainSet=0.724, independentCohort=0.705
replace MGP by APOD in member 4:
-0.16 [-0.30..-0.03] * APOD -0.14 [-0.26..-0.03] * STC2
c-indices: trainSet=0.717, independentCohort=0.679
replace MGP by EGFR in member 4:
-0.21 [-0.37..-0.05] * EGFR -0.14 [-0.26..-0.03] * STC2
c-indices: trainSet=0.715, independentCohort=0.708
replace STC2 by INPP4B in member 4:
-0.18 [-0.30..-0.05] * MGP -0.22 [-0.53..0.08] * INPP4B
c-indices: trainSet=0.719, independentCohort=0.693
replace STC2 by SEC14L2 in member 4:
-0.18 [-0.31..-0.06] * MGP -0.27 [-0.49..-0.06] * SEC14L2
c-indices: trainSet=0.718, independentCohort=0.681
동적 PCR로 정량을 위해 실험적으로 확인된 단일 유전자의 치환이 일반적으로, c-index에 의해 단지 무의미하게 평가된 T5 알고리즘의 예측 성능에 영향을 준다는 것을 알 수 있다.
하기 표 (표 8)는 T5 알고리즘의 유전자를 위한 잠재적인 치환 유전자 후보를 나타낸다. 각 유전자 후보는 하나의 셀에 표시된다: 유전자 명칭 뒤에 괄호로 묶은, T5 알고리즘 중에서 최초 유전자와 치환 후보의 발현의 절대 Pearson 상관 계수, 및 HG-U133A 프로브 세트 ID가 나타난다.
BIRC5 RBBP8 UBE2C IL6ST AZGP1 DHCR7 MGP STC2
UBE2C (0.775), 202954_at CELSR2 (0.548), 204029_at BIRC5 (0.775), 202095_s_at INPP4B (0.477), 205376_at PIP (0.530), 206509_at AURKA (0.345), 204092_s_at APOD (0.368), 201525_at INPP4B (0.500), 205376_at
TOP2A (0.757), 201292_at PGR (0.392), 208305_at RACGAP1 (0.756), 222077_s_at STC2 (0.450), 203438_at EPHX2 (0.369), 209368_at BIRC5 (0.323), 202095_s_at IL6ST (0.327), 212196_at IL6ST (0.450), 212196_at
RACGAP1 (0.704), 222077_s_at STC2 (0.361), 203438_at TOP2A (0.753), 201292_at MAPT (0.440), 206401_s_at PLAT (0.366), 201860_s_at UBE2C (0.315), 202954_at EGFR (0.308), 201983_s_at SEC14L2 (0.417), 204541_at
AURKA (0.681), 204092_s_at ABAT (0.317), 209459_s_at AURKA (0.694), 204092_s_at SCUBE2 (0.418), 219197_s_at SEC14L2 (0.351), 204541_at MAPT (0.414), 206401_s_at
NEK2 (0.680), 204026_s_at IL6ST (0.311), 212196_at NEK2 (0.684), 204026_s_at ABAT (0.389), 209459_s_at SCUBE2 (0.331), 219197_s_at CHPT1 (0.410), 221675_s_at
E2F8 (0.640), 219990_at E2F8 (0.652), 219990_at PGR (0.377), 208305_at PGR (0.302), 208305_at ABAT (0.409), 209459_s_at
PCNA (0.544), 201202_at PCNA (0.589), 201202_at SEC14L2 (0.356), 204541_at SCUBE2 (0.406), 219197_s_at
CYBRD1 (0.462), 217889_s_at CYBRD1 (0.486), 217889_s_at ESR1 (0.353), 205225_at ESR1 (0.394), 205225_at
DCN (0.439), 209335_at ADRA2A (0.391), 209869_at GJA1 (0.335), 201667_at RBBP8 (0.361), 203344_s_at
ADRA2A (0.416), 209869_at DCN (0.384), 209335_at MGP (0.327), 202291_s_at PGR (0.347), 208305_at
SQLE (0.415), 209218_at SQLE (0.369), 209218_at EPHX2 (0.313), 209368_at PTPRT (0.343), 205948_at
CXCL12 (0.388), 209687_at CCND1 (0.347), 208712_at RBBP8 (0.311), 203344_s_at HSPA2 (0.317), 211538_s_at
EPHX2 (0.362), 209368_at ASPH (0.344), 210896_s_at PTPRT (0.303), 205948_at PTGER3 (0.314), 210832_x_at
ASPH (0.352), 210896_s_at CXCL12 (0.342), 209687_at PLAT (0.301), 201860_s_at
PRSS16 (0.352), 208165_s_at PIP (0.328), 206509_at
EGFR (0.346), 201983_s_at PRSS16 (0.326), 208165_s_at
CCND1 (0.331), 208712_at EGFR (0.320), 201983_s_at
TRIM29 (0.325), 202504_at DHCR7 (0.315), 201791_s_at
DHCR7 (0.323), 201791_s_at EPHX2 (0.315), 209368_at
PIP (0.308), 206509_at TRIM29 (0.311), 202504_at
TFAP2B (0.306), 214451_at
WNT5A (0.303), 205990_s_at
APOD (0.301), 201525_at
PTPRT (0.301), 205948_at
하기 표 (표 9)는 상기 표에서 사용된 qRT-PCR 프라이머 및 프로브 서열을 나열한다.
유전자 프로브 정방향 프라이머 역방향 프라이머
ABAT TCGCCCTAAGAGGCTCTTCCTC GGCAACTTGAGGTCTGACTTTTG GGTCAGCTCACAAGTGGTGTGA
ADRA2A TTGTCCTTTCCCCCCTCCGTGC CCCCAAGAGCTGTTAGGTATCAA TCAATGACATGATCTCAACCAGAA
APOD CATCAGCTCTCAACTCCTGGTTTAACA ACTCACTAATGGAAAACGGAAAGATC TCACCTTCGATTTGATTCACAGTT
ASPH TGGGAGGAAGGCAAGGTGCTCATC TGTGCCAACGAGACCAAGAC TCGTGCTCAAAGGAGTCATCA
AURKA CCGTCAGCCTGTGCTAGGCAT AATCTGGAGGCAAGGTTCGA TCTGGATTTGCCTCCTGTGAA
BIRC5 AGCCAGATGACGACCCCATAGAGGAACA CCCAGTGTTTCTTCTGCTTCAAG CAACCGGACGAATGCTTTTT
CCND1
CELSR2 ACTGACTTTCCTTCTGGAGCAGGTGGC TCCAAGCATGTATTCCAGACTTGT TGCCCACAGCCTCTTTTTCT
CHPT1 CCACGGCCACCGAAGAGGCAC CGCTCGTGCTCATCTCCTACT CCCAGTGCACATAAAAGGTATGTC
CXCL12 CCACAGCAGGGTTTCAGGTTCC GCCACTACCCCCTCCTGAA TCACCTTGCCAACAGTTCTGAT
CYBRD1 AGGGCATCGCCATCATCGTC GTCACCGGCTTCGTCTTCA CAGGTCCACGGCAGTCTGT
DCN TCTTTTCAGCAACCCGGTCCA AAGGCTTCTTATTCGGGTGTGA TGGATGGCTGTATCTCCCAGTA
DHCR7 TGAGCGCCCACCCTCTCGA GGGCTCTGCTTCCCGATT AGTCATAGGGCAAGCAGAAAATTC
E2F8 CAGGATACCTAATCCCTCTCACGCAG AAATGTCTCCGCAACCTTGTTC CTGCCCCCAGGGATGAG
EGFR
EPHX2 TGAAGCGGGAGGACTTTTTGTAAA CGATGAGAGTGTTTTATCCATGCA GCTGAGGCTGGGCTCTTCT
ESR1 ATGCCCTTTTGCCGATGCA GCCAAATTGTGTTTGATGGATTAA GACAAAACCGAGTCACATCAGTAATAG
GJA1 TGCACAGCCTTTTGATTTCCCCGAT CGGGAAGCACCATCTCTAACTC TTCATGTCCAGCAGCTAGTTTTTT
HSPA2 CAAGTCAGCAAACACGCAAAA CATGCACGAACTAATCAAAAATGC ACATTATTCGAGGTTTCTCTTTAATGC
IL6ST CAAGCTCCACCTTCCAAAGGACCT CCCTGAATCCATAAAGGCATACC CAGCTTCGTTTTTCCCTACTTTTT
INPP4B TCCGAGCGCTGGATTGCATGAG GCACCAGTTACACAAGGACTTCTTT TCTCTATGCGGCATCCTTCTC
MAPT AGACTATTTGCACACTGCCGCCT GTGGCTCAAAGGATAATATCAAACAC ACCTTGCTCAGGTCAACTGGTT
MGP CCTTCATATCCCCTCAGCAGAGATGG CCTTCATTAACAGGAGAAATGCAA ATTGAGCTCGTGGACAGGCTTA
NEK2 TCCTGAACAAATGAATCGCATGTCCTACAA ATTTGTTGGCACACCTTATTACATGT AAGCAGCCCAATGACCAGATa
PCNA AAATACTAAAATGCGCCGGCAATGA GGGCGTGAACCTCACCAGTA CTTCGGCCCTTAGTGTAATGATATC
PGR TTGATAGAAACGCTGTGAGCTCGA AGCTCATCAAGGCAATTGGTTT ACAAGATCATGCAAGTTATCAAGAAGTT
PIP TGCATGGTGGTTAAAACTTACCTCA TGCTTGCAGTTCAAACAGAATTG CACCTTGTAGAGGGATGCTGCTA
PLAT CAGAAAGTGGCCATGCCACCCTG TGGGAAGACATGAATGCACACTA GGAGGTTGGGCTTTAGCTGAA
PRSS16 CACTGCCGGTCACCCACACCA CTGAGGAGCACAGAACCTCAACT CGAACTCGGTACATGTCTGATACAA
PTGER3 TCGGTCTGCTGGTCTCCGCTCC CTGATTGAAGATCATTTTCAACATCA GACGGCCATTCAGCTTATGG
PTPRT TTGGCTTCTGGACACCCTCACA GAGTTGTGGCCTCTACCATTGC GAGCGGGAACCTTGGGATAG
RACGAP1 ACTGAGAATCTCCACCCGGCGCA TCGCCAACTGGATAAATTGGA GAATGTGCGGAATCTGTTTGAG
RBBP8 ACCGATTCCGCTACATTCCACCCAAC AGAAATTGGCTTCCTGCTCAAG AAAACCAACTTCCCAAAAATTCTCT
SCUBE2 CTAGAGGGTTCCAGGTCCCATACGTGACATA TGTGGATTCAGTTCAAGTCCAATG CCATCTCGAACTATGTCTTCAATGAGT
SEC14L2 TGGGAGGCATGCAACGCGTG AGGTCTTACTAAGCAGTCCCATCTCT CGACCGGCACCTGAACTC
SQLE TATGCGTCTCCCAAAAGAAGAACACCTCG GCAAGCTTCCTTCCTCCTTCA CCTTTAGCAGTTTTCTCCATAGTTTTATATC
STC2 TCTCACCTTGACCCTCAGCCAAG ACATTTGACAAATTTCCCTTAGGATT CCAGGACGCAGCTTTACCAA
TFAP2B CAACACCACCACTAACAGGCACACGTC GGCATGGACAAGATGTTCTTGA CCTCCTTGTCGCCAGTTTTACT
TOP2A CAGATCAGGACCAAGATGGTTCCCACAT CATTGAAGACGCTTCGTTATGG CCAGTTGTGATGGATAAAATTAATCAG
TRIM29 TGCTGTCTCACTACCGGCCATTCTACG TGGAAATCTGGCAAGCAGACT CAATCCCGTTGCCTTTGTTG
UBE2C TGAACACACATGCTGCCGAGCTCTG CTTCTAGGAGAACCCAACATTGATAGT GTTTCTTGCAGGTACTTCTTAAAAGCT
WNT5A TATTCACATCCCCTCAGTTGCAGTGAATTG CTGTGGCTCTTAATTTATTGCATAATG TTAGTGCTTTTTGCTTTCAAGATCTT
가능한 유전자 치환 후보의 자율적인 선택을 위한 두 번째 대안은 Affymetrix 데이터에만 기초한다. 이는 이미 공개된 데이터 (예를 들면, www.ncbi.nlm.nih.gov/geo/로부터)에 기반하여 단독으로 수행될 수 있다는 잇점을 갖는다. 하기 표 (표 10)는 알고리즘 T1 내지 T5에서 사용되는 프로브 세트에 대한 HG-U133a 프로브 세트 치환 후보를 나열한다. 이는 상기 알고리즘의 훈련 (training) 데이터에 기반한다. 열의 표제는 유전자 명칭 및 프로브 세트 ID를 굵은 글씨로 포함한다. 그 후, 10개의 가장 연관성 있는 프로브 세트가 나열되며, 각 표의 셀이 프로브 세트 ID, 괄호 안의 상관 계수 및 유전자 명칭을 포함한다.
UBE2C BIRC5 DHCR7 RACGAP1 AURKA PVALB NMU STC2
202954_at 202095_s_at 201791_s_at 222077_s_at 204092_s_at 205336_at 206023_at 203438_at
210052_s_at(0.82) TPX2 202954_at(0.82) UBE2C 201790_s_at(0.66) DHCR7 218039_at(0.79) NUSAP1 208079_s_at(0.89) STK6 208683_at(-0.33) CAPN2 205347_s_at(0.45) TMSL8 203439_s_at(0.88) STC2
202095_s_at(0.82) BIRC5 218039_at(0.81) NUSAP1 202218_s_at(0.48) FADS2 214710_s_at(0.78) CCNB1 202954_at(0.80) UBE2C 219682_s_at(0.30) TBX3 203764_at(0.45) DLG7 212496_s_at(0.52) JMJD2B
218009_s_at(0.82) PRC1 218009_s_at(0.79) PRC1 202580_x_at(0.47) FOXM1 203764_at(0.77) DLG 210052_s_at(0.77) TPX 218704_at(0.30) FLJ20315 203554_x_at(0.44) PTTG1 219440_at(0.52) RAI2
203554_x_at(0.82) PTTG1 202705_at(0.78) CCNB2 208944_at(-0.46) TGFBR2 204026_s_at(0.77) ZWINT 202095_s_at(0.77) BIRC5 204962_s_at(0.44) CENPA 215867_x_at(0.51) CA12
208079_s_at(0.81) STK6 204962_s_at(0.78) CENPA 202954_at(0.46) UBE2C 218009_s_at(0.76) PRC1 203554_x_at(0.76) PTTG1 204825_at(0.43) MELK 214164_x_at(0.50) CA12
202705_at(0.81) CCNB2 203554_x_at(0.78) PTTG1 209541_at(-0.45) IGF1 204641_at(0.76) NEK2 218009_s_at(0.75) PRC1 209714_s_at(0.41) CDKN3 204541_at(0.50) SEC14L2
218039_at(0.81) NUSAP1 208079_s_at(0.78) STK6 201059_at(0.45) CTTN 204444_at(0.75) KIF11 201292_at(0.73) TOP2A 219918_s_at(0.41) ASPM 203963_at(0.50) CA12
202870_s_at(0.80) CDC20 210052_s_at(0.77) TPX2 200795_at(-0.45) SPARCL1 202705_at(0.75) CCNB2 214710_s_at(0.73) CCNB1 207828_s_at(0.41) CENPF 212495_at(0.50) JMJD2B
204092_s_at(0.80) STK6 202580_x_at(0.77) FOXM1 218009_s_at(0.45) PRC1 203362_s_at(0.75) MAD2L1 204962_s_at(0.73) CENPA 202705_at(0.41) CCNB2 208614_s_at(0.49) FLNB
209408_at(0.80) KIF2C 204092_s_at(0.77) STK6 218542_at(0.45) C10orf3 202954_at(0.75) UBE2C 218039_at(0.73) NUSAP1 219787_s_at(0.40) ECT2 213933_at(0.49) PTGER3
AZGP1 RBBP8 IL6ST MGP PTGER3 CXCL12 ABAT CDH1
209309_at 203344_s_at 212196_at 202291_s_at 213933_at 209687_at 209460_at 201131_s_at
217014_s_at(0.92) AZGP1 36499_at(0.49) CELSR2 212195_at(0.85) IL6ST 201288_at(0.46) ARHGDIB 210375_at(0.74) PTGER3 204955_at(0.81) SRPX 209459_s_at(0.92) ABAT 201130_s_at(0.57) CDH1
206509_at(0.52) PIP 204029_at(0.45) CELSR2 204864_s_at(0.75) IL6ST 219768_at(0.42) VTCN1 210831_s_at(0.74) PTGER3 209335_at(0.81) DCN 206527_at(0.63) ABAT 221597_s_at(0.40) HSPC171
204541_at(0.46) SEC14L2 208305_at(0.45) PGR 211000_s_at(0.68) IL6ST 202849_x_at(-0.41) GRK6 210374_x_at(0.73) PTGER3 211896_s_at(0.81) DCN 213392_at(0.54) MGC35048 203350_at(0.38) AP1G1
200670_at(0.45) XBP1 205380_at(0.43) PDZK1 214077_x_at(0.61) MEIS4 205382_s_at(0.40) DF 210832_x_at(0.73) PTGER3 201893_x_at(0.81) DCN 221666_s_at(0.49) PYCARD 209163_at(0.36) CYB561
209368_at(0.45) EPHX2 203303_at(0.41) TCTE1L 204863_s_at(0.58) IL6ST 200099_s_at(0.39) RPS3A 210834_s_at(0.55) PTGER3 203666_at(0.80) CXCL12 218016_s_at(0.48) POLR3E 210239_at(0.35) IRX5
218627_at(-0.43) FLJ11259 205280_at(0.38) GLRB 202089_s_at(0.57) SLC39A6 221591_s_at(-0.37) FAM64A 210833_at(0.55) PTGER3 211813_x_at(0.80) DCN 214440_at(0.46) NAT1 200942_s_at(0.34) HSBP1
202286_s_at(0.43) TACSTD2 205279_s_at(0.38) GLRB 210735_s_at(0.56) CA12 214629_x_at(0.37) RTN4 203438_at(0.49) STC2 208747_s_at(0.79) C1S 204981_at(0.45) SLC22A18 209157_at(0.34) DNAJA2
213832_at(0.42) --- 203685_at(0.38) BCL2 200648_s_at(0.52) GLUL 200748_s_at(0.37) FTH1 203439_s_at(0.46) STC2 203131_at(0.78) PDGFRA 212195_at(0.45) IL6ST 210715_s_at(0.33) SPINT2
204288_s_at(0.41) SORBS2 203304_at(-0.38) BAMBI 214552_s_at(0.52) RABEP1 209408_at(-0.37) KIF2C 212195_at(0.41) IL6ST 202994_s_at(0.78) FBLN1 204497_at(0.45) ADCY9 203219_s_at(0.33) APRT
202376_at(0.41) SERPINA3 205862_at(0.36) GREB1 219197_s_at(0.51) SCUBE2 218726_at(-0.36) DKFZp762E1312 217764_s_at(0.40) RAB31 208944_at(0.78) TGFBR2 215867_x_at(0.45) CA12 218074_at(0.33) FAM96B
유전자 또는 프로브 세트의 선택 후, 치환될 유전자의 발현 값과 신규 유전자의 발현 값 사이의 수학적 맵핑을 정의해야 한다. 실시예 “BIRC5의 델타-Ct 값의 RACGAP1에 의한 치환 (replace delta-Ct values of BIRC5 by RACGAP1)"에 기반하여 본 명세서에서 논의되는 수 개의 대안이 있다. 훈련 데이터에서 발현의 결합 분포 (joint distribution)는 도 3에 나타낸 바와 같다.
Pearson 상관 계수는 0.73이다.
한 가지 접근법은 회귀에 의해 RACGAP1로부터 BIRC5로의 맵핑 함수를 만드는 것이다. 선형 회귀는 이 첫 번째 선택이고 이 예를 산출한다.
BIRC5 = 1.22 * RACGAP1 - 2.85.
이 식을 사용하여 예를 들면, 알고리즘 T5에서 BIRC5 변수를 우변으로 용이하게 대체할 수 있다. 다른 예에서 로버스트 회귀, 다항 회귀 (polynomial regression) 또는 일원적 비선형 전-변환 (univariate nonlinear pre-transformation)이 적절할 수 있다.
회귀 방법은 BIRC5에 대한 측정 오차 (measurement noise)를 추정하지만, RACGAP1에 대해서는 오차가 없다. 그러므로 이 맵핑은 두 변수의 호환성에 관해서 대칭적이지 않다. 대칭적 맵핑 접근 (symmetric mapping approach)은 두 개의 일원적 z-변환에 기초할 것이다.
z = (BIRC5 - mean(BIRC5)) / std(BIRC5) and
z = (RACGAP1 - mean(RACGAP1)) / std(RACGAP1)
z = (BIRC5 - 8.09) / 1.29 = (RACGAP1 - 8.95) / 0.77
BIRC5 = 1.67 * RACGAP1 + -6.89
다시, 다른 예에서, 기타 변환이 적절할 수 있다: 중간값에 의한 정규화 및/또는 매드 (mad), 비선형 맵핑, 등.
SEQUENCE LISTING <110> Sividon Diagnostics GmbH <120> Method for breast cancer recurrence prediction under endocrine treatment <130> Sividon <160> 141 <170> PatentIn version 3.3 <210> 1 <211> 22 <212> DNA <213> Homo sapiens <400> 1 tcgccctaag aggctcttcc tc 22 <210> 2 <211> 23 <212> DNA <213> Homo sapiens <400> 2 ggcaacttga ggtctgactt ttg 23 <210> 3 <211> 22 <212> DNA <213> Homo sapiens <400> 3 ggtcagctca caagtggtgt ga 22 <210> 4 <211> 22 <212> DNA <213> Homo sapiens <400> 4 ttgtcctttc ccccctccgt gc 22 <210> 5 <211> 23 <212> DNA <213> Homo sapiens <400> 5 ccccaagagc tgttaggtat caa 23 <210> 6 <211> 24 <212> DNA <213> Homo sapiens <400> 6 tcaatgacat gatctcaacc agaa 24 <210> 7 <211> 27 <212> DNA <213> Homo sapiens <400> 7 catcagctct caactcctgg tttaaca 27 <210> 8 <211> 26 <212> DNA <213> Homo sapiens <400> 8 actcactaat ggaaaacgga aagatc 26 <210> 9 <211> 24 <212> DNA <213> Homo sapiens <400> 9 tcaccttcga tttgattcac agtt 24 <210> 10 <211> 24 <212> DNA <213> Homo sapiens <400> 10 tgggaggaag gcaaggtgct catc 24 <210> 11 <211> 20 <212> DNA <213> Homo sapiens <400> 11 tgtgccaacg agaccaagac 20 <210> 12 <211> 21 <212> DNA <213> Homo sapiens <400> 12 tcgtgctcaa aggagtcatc a 21 <210> 13 <211> 21 <212> DNA <213> Homo sapiens <400> 13 ccgtcagcct gtgctaggca t 21 <210> 14 <211> 20 <212> DNA <213> Homo sapiens <400> 14 aatctggagg caaggttcga 20 <210> 15 <211> 21 <212> DNA <213> Homo sapiens <400> 15 tctggatttg cctcctgtga a 21 <210> 16 <211> 28 <212> DNA <213> Homo sapiens <400> 16 agccagatga cgaccccata gaggaaca 28 <210> 17 <211> 23 <212> DNA <213> Homo sapiens <400> 17 cccagtgttt cttctgcttc aag 23 <210> 18 <211> 20 <212> DNA <213> Homo sapiens <400> 18 caaccggacg aatgcttttt 20 <210> 19 <211> 27 <212> DNA <213> Homo sapiens <400> 19 actgactttc cttctggagc aggtggc 27 <210> 20 <211> 24 <212> DNA <213> Homo sapiens <400> 20 tccaagcatg tattccagac ttgt 24 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <400> 21 tgcccacagc ctctttttct 20 <210> 22 <211> 21 <212> DNA <213> Homo sapiens <400> 22 ccacggccac cgaagaggca c 21 <210> 23 <211> 21 <212> DNA <213> Homo sapiens <400> 23 cgctcgtgct catctcctac t 21 <210> 24 <211> 24 <212> DNA <213> Homo sapiens <400> 24 cccagtgcac ataaaaggta tgtc 24 <210> 25 <211> 22 <212> DNA <213> Homo sapiens <400> 25 ccacagcagg gtttcaggtt cc 22 <210> 26 <211> 19 <212> DNA <213> Homo sapiens <400> 26 gccactaccc cctcctgaa 19 <210> 27 <211> 22 <212> DNA <213> Homo sapiens <400> 27 tcaccttgcc aacagttctg at 22 <210> 28 <211> 20 <212> DNA <213> Homo sapiens <400> 28 agggcatcgc catcatcgtc 20 <210> 29 <211> 19 <212> DNA <213> Homo sapiens <400> 29 gtcaccggct tcgtcttca 19 <210> 30 <211> 19 <212> DNA <213> Homo sapiens <400> 30 caggtccacg gcagtctgt 19 <210> 31 <211> 21 <212> DNA <213> Homo sapiens <400> 31 tcttttcagc aacccggtcc a 21 <210> 32 <211> 22 <212> DNA <213> Homo sapiens <400> 32 aaggcttctt attcgggtgt ga 22 <210> 33 <211> 22 <212> DNA <213> Homo sapiens <400> 33 tggatggctg tatctcccag ta 22 <210> 34 <211> 19 <212> DNA <213> Homo sapiens <400> 34 tgagcgccca ccctctcga 19 <210> 35 <211> 18 <212> DNA <213> Homo sapiens <400> 35 gggctctgct tcccgatt 18 <210> 36 <211> 24 <212> DNA <213> Homo sapiens <400> 36 agtcataggg caagcagaaa attc 24 <210> 37 <211> 26 <212> DNA <213> Homo sapiens <400> 37 caggatacct aatccctctc acgcag 26 <210> 38 <211> 22 <212> DNA <213> Homo sapiens <400> 38 aaatgtctcc gcaaccttgt tc 22 <210> 39 <211> 17 <212> DNA <213> Homo sapiens <400> 39 ctgcccccag ggatgag 17 <210> 40 <211> 24 <212> DNA <213> Homo sapiens <400> 40 tgaagcggga ggactttttg taaa 24 <210> 41 <211> 24 <212> DNA <213> Homo sapiens <400> 41 cgatgagagt gttttatcca tgca 24 <210> 42 <211> 19 <212> DNA <213> Homo sapiens <400> 42 gctgaggctg ggctcttct 19 <210> 43 <211> 19 <212> DNA <213> Homo sapiens <400> 43 atgccctttt gccgatgca 19 <210> 44 <211> 24 <212> DNA <213> Homo sapiens <400> 44 gccaaattgt gtttgatgga ttaa 24 <210> 45 <211> 27 <212> DNA <213> Homo sapiens <400> 45 gacaaaaccg agtcacatca gtaatag 27 <210> 46 <211> 25 <212> DNA <213> Homo sapiens <400> 46 tgcacagcct tttgatttcc ccgat 25 <210> 47 <211> 22 <212> DNA <213> Homo sapiens <400> 47 cgggaagcac catctctaac tc 22 <210> 48 <211> 24 <212> DNA <213> Homo sapiens <400> 48 ttcatgtcca gcagctagtt tttt 24 <210> 49 <211> 21 <212> DNA <213> Homo sapiens <400> 49 caagtcagca aacacgcaaa a 21 <210> 50 <211> 24 <212> DNA <213> Homo sapiens <400> 50 catgcacgaa ctaatcaaaa atgc 24 <210> 51 <211> 27 <212> DNA <213> Homo sapiens <400> 51 acattattcg aggtttctct ttaatgc 27 <210> 52 <211> 24 <212> DNA <213> Homo sapiens <400> 52 caagctccac cttccaaagg acct 24 <210> 53 <211> 23 <212> DNA <213> Homo sapiens <400> 53 ccctgaatcc ataaaggcat acc 23 <210> 54 <211> 24 <212> DNA <213> Homo sapiens <400> 54 cagcttcgtt tttccctact tttt 24 <210> 55 <211> 22 <212> DNA <213> Homo sapiens <400> 55 tccgagcgct ggattgcatg ag 22 <210> 56 <211> 25 <212> DNA <213> Homo sapiens <400> 56 gcaccagtta cacaaggact tcttt 25 <210> 57 <211> 21 <212> DNA <213> Homo sapiens <400> 57 tctctatgcg gcatccttct c 21 <210> 58 <211> 23 <212> DNA <213> Homo sapiens <400> 58 agactatttg cacactgccg cct 23 <210> 59 <211> 26 <212> DNA <213> Homo sapiens <400> 59 gtggctcaaa ggataatatc aaacac 26 <210> 60 <211> 22 <212> DNA <213> Homo sapiens <400> 60 accttgctca ggtcaactgg tt 22 <210> 61 <211> 26 <212> DNA <213> Homo sapiens <400> 61 ccttcatatc ccctcagcag agatgg 26 <210> 62 <211> 24 <212> DNA <213> Homo sapiens <400> 62 ccttcattaa caggagaaat gcaa 24 <210> 63 <211> 22 <212> DNA <213> Homo sapiens <400> 63 attgagctcg tggacaggct ta 22 <210> 64 <211> 30 <212> DNA <213> Homo sapiens <400> 64 tcctgaacaa atgaatcgca tgtcctacaa 30 <210> 65 <211> 26 <212> DNA <213> Homo sapiens <400> 65 atttgttggc acaccttatt acatgt 26 <210> 66 <211> 21 <212> DNA <213> Homo sapiens <400> 66 aagcagccca atgaccagat a 21 <210> 67 <211> 25 <212> DNA <213> Homo sapiens <400> 67 aaatactaaa atgcgccggc aatga 25 <210> 68 <211> 20 <212> DNA <213> Homo sapiens <400> 68 gggcgtgaac ctcaccagta 20 <210> 69 <211> 25 <212> DNA <213> Homo sapiens <400> 69 cttcggccct tagtgtaatg atatc 25 <210> 70 <211> 24 <212> DNA <213> Homo sapiens <400> 70 ttgatagaaa cgctgtgagc tcga 24 <210> 71 <211> 22 <212> DNA <213> Homo sapiens <400> 71 agctcatcaa ggcaattggt tt 22 <210> 72 <211> 28 <212> DNA <213> Homo sapiens <400> 72 acaagatcat gcaagttatc aagaagtt 28 <210> 73 <211> 25 <212> DNA <213> Homo sapiens <400> 73 tgcatggtgg ttaaaactta cctca 25 <210> 74 <211> 23 <212> DNA <213> Homo sapiens <400> 74 tgcttgcagt tcaaacagaa ttg 23 <210> 75 <211> 23 <212> DNA <213> Homo sapiens <400> 75 caccttgtag agggatgctg cta 23 <210> 76 <211> 23 <212> DNA <213> Homo sapiens <400> 76 cagaaagtgg ccatgccacc ctg 23 <210> 77 <211> 23 <212> DNA <213> Homo sapiens <400> 77 tgggaagaca tgaatgcaca cta 23 <210> 78 <211> 21 <212> DNA <213> Homo sapiens <400> 78 ggaggttggg ctttagctga a 21 <210> 79 <211> 21 <212> DNA <213> Homo sapiens <400> 79 cactgccggt cacccacacc a 21 <210> 80 <211> 23 <212> DNA <213> Homo sapiens <400> 80 ctgaggagca cagaacctca act 23 <210> 81 <211> 25 <212> DNA <213> Homo sapiens <400> 81 cgaactcggt acatgtctga tacaa 25 <210> 82 <211> 22 <212> DNA <213> Homo sapiens <400> 82 tcggtctgct ggtctccgct cc 22 <210> 83 <211> 26 <212> DNA <213> Homo sapiens <400> 83 ctgattgaag atcattttca acatca 26 <210> 84 <211> 20 <212> DNA <213> Homo sapiens <400> 84 gacggccatt cagcttatgg 20 <210> 85 <211> 22 <212> DNA <213> Homo sapiens <400> 85 ttggcttctg gacaccctca ca 22 <210> 86 <211> 22 <212> DNA <213> Homo sapiens <400> 86 gagttgtggc ctctaccatt gc 22 <210> 87 <211> 20 <212> DNA <213> Homo sapiens <400> 87 gagcgggaac cttgggatag 20 <210> 88 <211> 23 <212> DNA <213> Homo sapiens <400> 88 actgagaatc tccacccggc gca 23 <210> 89 <211> 21 <212> DNA <213> Homo sapiens <400> 89 tcgccaactg gataaattgg a 21 <210> 90 <211> 22 <212> DNA <213> Homo sapiens <400> 90 gaatgtgcgg aatctgtttg ag 22 <210> 91 <211> 26 <212> DNA <213> Homo sapiens <400> 91 accgattccg ctacattcca cccaac 26 <210> 92 <211> 22 <212> DNA <213> Homo sapiens <400> 92 agaaattggc ttcctgctca ag 22 <210> 93 <211> 25 <212> DNA <213> Homo sapiens <400> 93 aaaaccaact tcccaaaaat tctct 25 <210> 94 <211> 31 <212> DNA <213> Homo sapiens <400> 94 ctagagggtt ccaggtccca tacgtgacat a 31 <210> 95 <211> 24 <212> DNA <213> Homo sapiens <400> 95 tgtggattca gttcaagtcc aatg 24 <210> 96 <211> 27 <212> DNA <213> Homo sapiens <400> 96 ccatctcgaa ctatgtcttc aatgagt 27 <210> 97 <211> 20 <212> DNA <213> Homo sapiens <400> 97 tgggaggcat gcaacgcgtg 20 <210> 98 <211> 26 <212> DNA <213> Homo sapiens <400> 98 aggtcttact aagcagtccc atctct 26 <210> 99 <211> 18 <212> DNA <213> Homo sapiens <400> 99 cgaccggcac ctgaactc 18 <210> 100 <211> 29 <212> DNA <213> Homo sapiens <400> 100 tatgcgtctc ccaaaagaag aacacctcg 29 <210> 101 <211> 21 <212> DNA <213> Homo sapiens <400> 101 gcaagcttcc ttcctccttc a 21 <210> 102 <211> 31 <212> DNA <213> Homo sapiens <400> 102 cctttagcag ttttctccat agttttatat c 31 <210> 103 <211> 27 <212> DNA <213> Homo sapiens <400> 103 caacaccacc actaacaggc acacgtc 27 <210> 104 <211> 22 <212> DNA <213> Homo sapiens <400> 104 ggcatggaca agatgttctt ga 22 <210> 105 <211> 22 <212> DNA <213> Homo sapiens <400> 105 cctccttgtc gccagtttta ct 22 <210> 106 <211> 28 <212> DNA <213> Homo sapiens <400> 106 cagatcagga ccaagatggt tcccacat 28 <210> 107 <211> 22 <212> DNA <213> Homo sapiens <400> 107 cattgaagac gcttcgttat gg 22 <210> 108 <211> 27 <212> DNA <213> Homo sapiens <400> 108 ccagttgtga tggataaaat taatcag 27 <210> 109 <211> 27 <212> DNA <213> Homo sapiens <400> 109 tgctgtctca ctaccggcca ttctacg 27 <210> 110 <211> 21 <212> DNA <213> Homo sapiens <400> 110 tggaaatctg gcaagcagac t 21 <210> 111 <211> 20 <212> DNA <213> Homo sapiens <400> 111 caatcccgtt gcctttgttg 20 <210> 112 <211> 25 <212> DNA <213> Homo sapiens <400> 112 tgaacacaca tgctgccgag ctctg 25 <210> 113 <211> 27 <212> DNA <213> Homo sapiens <400> 113 cttctaggag aacccaacat tgatagt 27 <210> 114 <211> 27 <212> DNA <213> Homo sapiens <400> 114 gtttcttgca ggtacttctt aaaagct 27 <210> 115 <211> 30 <212> DNA <213> Homo sapiens <400> 115 tattcacatc ccctcagttg cagtgaattg 30 <210> 116 <211> 27 <212> DNA <213> Homo sapiens <400> 116 ctgtggctct taatttattg cataatg 27 <210> 117 <211> 26 <212> DNA <213> Homo sapiens <400> 117 ttagtgcttt ttgctttcaa gatctt 26 <210> 118 <211> 23 <212> DNA <213> Homo sapiens <400> 118 tctcaccttg accctcagcc aag 23 <210> 119 <211> 26 <212> DNA <213> Homo sapiens <400> 119 acatttgaca aatttccctt aggatt 26 <210> 120 <211> 20 <212> DNA <213> Homo sapiens <400> 120 ccaggacgca gctttaccaa 20 <210> 121 <211> 20 <212> DNA <213> Homo sapiens <400> 121 caccagccac caggccccag 20 <210> 122 <211> 18 <212> DNA <213> Homo sapiens <400> 122 tcctggaccg gcaagatc 18 <210> 123 <211> 21 <212> DNA <213> Homo sapiens <400> 123 taggccaggc acttcagttt c 21 <210> 124 <211> 22 <212> DNA <213> Homo sapiens <400> 124 tcgcgtctcg gaaaccggta gc 22 <210> 125 <211> 20 <212> DNA <213> Homo sapiens <400> 125 gagcgagctg agtggttgtg 20 <210> 126 <211> 21 <212> DNA <213> Homo sapiens <400> 126 agtcagttgg tcagccatgc t 21 <210> 127 <211> 27 <212> DNA <213> Homo sapiens <400> 127 cctgccaatc ccgatgaaat tggaaat 27 <210> 128 <211> 21 <212> DNA <213> Homo sapiens <400> 128 tgagtgtccc ccggtatctt c 21 <210> 129 <211> 21 <212> DNA <213> Homo sapiens <400> 129 tcagccgctt tcagattttc a 21 <210> 130 <211> 26 <212> DNA <213> Homo sapiens <400> 130 accctgctga ccttcttcca ttccgt 26 <210> 131 <211> 22 <212> DNA <213> Homo sapiens <400> 131 agaaattggc ttcctgctca ag 22 <210> 132 <211> 25 <212> DNA <213> Homo sapiens <400> 132 aaaaccaact tcccaaaaat tctct 25 <210> 133 <211> 23 <212> DNA <213> Homo sapiens <400> 133 tgcttccaca agaaccgcga gga 23 <210> 134 <211> 20 <212> DNA <213> Homo sapiens <400> 134 cgagccgacc atgtcttcat 20 <210> 135 <211> 21 <212> DNA <213> Homo sapiens <400> 135 aagcccaaaa agctgaaggt t 21 <210> 136 <211> 22 <212> DNA <213> Homo sapiens <400> 136 aagttcttcc aaatggtcgg cc 22 <210> 137 <211> 19 <212> DNA <213> Homo sapiens <400> 137 ccgactcctt cgaccacaa 19 <210> 138 <211> 23 <212> DNA <213> Homo sapiens <400> 138 catcatccgc actctttttc ttc 23 <210> 139 <211> 18 <212> DNA <213> Homo sapiens <400> 139 tggctggcgg tgcctgga 18 <210> 140 <211> 21 <212> DNA <213> Homo sapiens <400> 140 tgtggttcct gcatgaagac a 21 <210> 141 <211> 24 <212> DNA <213> Homo sapiens <400> 141 gtgacagcgg aagtggtatt gtac 24

Claims (21)

  1. 유방암 환자의 에스트로겐 수용체 양성 및 HER2(human epidermal growth factor receptor 2) 음성 종양에서 유방암의 결과를 예측하는 방법으로서:
    (a) 상기 환자의 종양 시료에서 하기 9개의 유전자: UBE2C(ubiquitin-conjugating enzyme), BIRC5(baculoviral IAP repeat-containing 5), RACGAP1(Rac GTPase activating protein 1), DHCR7(7-dehydrocholesterol reductase), STC2(stanniocalcin 2), AZGP1(alpha-2-glycoprotein 1), RBBP8(retinoblastoma binding protein 8), IL6ST(interleukin 6 signal transducer), 및 MGP(matrix Gla protein) 중 적어도 4개 이상의 유전자에 대한 RNA 발현 수준을 결정하는 단계로서,
    상기 적어도 4개 이상의 유전자는 UBE2C (ubiquitin-conjugating enzyme), BIRC5 (baculoviral IAP repeat-containing 5), RBBP8 (retinoblastoma binding protein 8), 및 IL6ST (interleukin 6 signal transducer)인 단계,
    (b) 상기 종양 시료에서 결정된, 상기 유전자 세트의 유전자에 대한 발현 수준 값을 수학적으로 조합하여, 합계 점수를 산출하고, 상기 합계 점수는 상기 환자의 예후를 나타내는 것인 단계를 포함하는 방법.
  2. 청구항 1에 있어서, 상기 적어도 4개 이상의 유전자는: UBE2C, BIRC5, DHCR7, STC2, AZGP1, RBBP8, IL6ST, 및 MGP 중 4개 이상을 포함하는 것인 방법.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 청구항 1 또는 2에 있어서, 상기 환자는 내분비 요법 (therapy)을 받았거나 내분비 치료 (treatment)를 받을 것이 고려되는 것인 방법.
  7. 청구항 6에 있어서, 상기 내분비 요법은 타목시펜 또는 아로마타제 저해제를 포함하는 것인 방법.
  8. 청구항 1 또는 2에 있어서, 유방암 재발 또는 암 관련 사망이 발생할 위험이 예측되는 것인 방법.
  9. 청구항 1 또는 2에 있어서, 상기 발현 수준은 mRNA (messenger-RNA) 발현 수준으로 결정되는 것인 방법.
  10. 청구항 8에 있어서, 상기 발현 수준은
    PCR 기반 방법,
    마이크로어레이 기반 방법, 및
    혼성화 기반 방법 중 하나 이상에 의해 결정되는 것인 방법.
  11. 청구항 1 또는 2에 있어서, 상기 발현 수준의 결정은 포르말린-고정 파라핀 포매 (formalin-fixed paraffin embedded) 종양 시료에서 또는 신선-동결 (fresh-frozen) 종양 시료에서 이루어지는 것인 방법.
  12. 청구항 1 또는 2에 있어서, 하나 이상의 마커 유전자의 발현 수준은 하나 이상의 기준 유전자 (reference gene) 또는 계산된 평균 발현 값 대비 발현 패턴으로 결정되는 것인 방법.
  13. 청구항 1 또는 2에 있어서, 상기 수학적으로 조합하는 단계는 알고리즘을 주어진 유전자의 발현 수준을 대표하는 값에 적용하는 단계를 포함하는 것인 방법.
  14. 청구항 13에 있어서, 상기 알고리즘은 상기 주어진 유전자의 발현 수준을 대표하는 값의 선형 조합 (linear combination)인 것인 방법.
  15. 청구항 14에 있어서, 주어진 유전자의 발현 수준을 대표하는 값에 계수를 곱하는 것인 방법.
  16. 청구항 1 또는 2에 있어서, 상기 합계 점수에 대해, 하나, 둘 또는 그 이상의 임계값 (threshold)이 결정되고, 상기 임계값을 상기 합계 점수에 적용함으로써 고 위험 내지 저 위험군 (high and low risk), 고 위험군, 중간 위험 내지 저 위험군 (intermediate and low risk) 또는 추가적인 (more) 위험군으로 구별하는 것인 방법.
  17. 청구항 1 또는 2에 있어서, 고 위험군은 세포독성 화학요법으로부터의 효과 (benefit)를 나타내는 것인 방법.
  18. 청구항 1 또는 2에 있어서, 상기 환자의 림프절 전이상태 (nodal status)에 대한 정보는 상기 유전자의 발현 수준 값을 수학적으로 조합하여 합계 점수를 산출하는 단계에서 처리되는 것인 방법.
  19. 청구항 18에 있어서, 상기 림프절 전이 상태가 음성인 경우 상기 림프절 전이 상태에 관한 정보는 수치 (numerical value)이고, 상기 림프절 전이 상태가 양성인 경우 상기 정보는 다른 수치이고, 상기 림프절 전이 상태가 알려지지 않은 경우 다른 또는 동일한 수 (number)인 것인 방법.
  20. 청구항 1 또는 2의 방법을 수행하기 위한 키트로서,
    상기 키트는 유전자의 조합(combination)인 유전자의 서열 또는 서열의 단편에 선택적으로 결합할 수 있는 올리고뉴클레오티드의 집합(set)을 포함하는 것이고,
    상기 조합(combination)은 9개 유전자 UBE2C(ubiquitin-conjugating enzyme), BIRC5(baculoviral IAP repeat-containing 5), RACGAP1(Rac GTPase activating protein 1), DHCR7(7-dehydrocholesterol reductase), STC2(stanniocalcin 2), AZGP1(alpha-2-glycoprotein 1), RBBP8(retinoblastoma binding protein 8), IL6ST(interleukin 6 signal transducer), 및 MGP(matrix Gla protein)를 포함하는 것인 키트.
  21. 청구항 1 또는 2의 방법에 따라, 수학적으로 일련의 유전자의 발현 수준을 대표하는 값을 조합하여 합계 점수를 산출하고, 상기 합계 점수는 환자의 내분비 요법으로부터의 효능을 나타내는, 유전자 조합의 발현 수준을 대표하는 값을 가공할 수 있는 컴퓨터 프로그램이 기록된 컴퓨터 판독 가능한 기록매체.
KR1020127025899A 2010-03-31 2011-03-29 내분비 치료 중 유방암 재발 예측 방법 KR101864855B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10158561.0 2010-03-31
EP10158561 2010-03-31
PCT/EP2011/054855 WO2011120984A1 (en) 2010-03-31 2011-03-29 Method for breast cancer recurrence prediction under endocrine treatment

Publications (2)

Publication Number Publication Date
KR20130010048A KR20130010048A (ko) 2013-01-24
KR101864855B1 true KR101864855B1 (ko) 2018-07-13

Family

ID=43857901

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127025899A KR101864855B1 (ko) 2010-03-31 2011-03-29 내분비 치료 중 유방암 재발 예측 방법

Country Status (17)

Country Link
US (5) US20130065786A1 (ko)
EP (2) EP2845911B1 (ko)
JP (2) JP5940517B2 (ko)
KR (1) KR101864855B1 (ko)
CN (2) CN102971435B (ko)
BR (2) BR122020016370B1 (ko)
CA (1) CA2793133C (ko)
ES (2) ES2525382T3 (ko)
HK (1) HK1181817A1 (ko)
HU (1) HUE030164T2 (ko)
MX (1) MX2012011167A (ko)
PL (2) PL2845911T3 (ko)
PT (2) PT2553118E (ko)
RU (1) RU2654587C2 (ko)
UA (1) UA110790C2 (ko)
WO (1) WO2011120984A1 (ko)
ZA (1) ZA201207229B (ko)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198972A1 (en) 2001-12-21 2003-10-23 Erlander Mark G. Grading of breast cancer
EP2845911B1 (en) 2010-03-31 2016-05-18 Sividon Diagnostics GmbH Method for breast cancer recurrence prediction under endocrine treatment
ES2608322T3 (es) 2011-07-28 2017-04-07 Sividon Diagnostics Gmbh Procedimiento para predecir la respuesta a la quimioterapia en un paciente que padece o está en riesgo de desarrollar cáncer de mama recurrente
US20140296085A1 (en) * 2011-11-08 2014-10-02 Genomic Health, Inc. Method of predicting breast cancer prognosis
EP2852689B1 (en) * 2012-05-22 2019-12-11 Nanostring Technologies, Inc. Nano46 genes and methods to predict breast cancer outcome
WO2013188600A1 (en) * 2012-06-12 2013-12-19 Washington University Copy number aberration driven endocrine response gene signature
WO2013190081A1 (en) * 2012-06-22 2013-12-27 Proyecto De Biomedicina Cima, S.L. Methods and reagents for the prognosis of cancer
DK2951317T3 (en) 2013-02-01 2018-01-15 Sividon Diagnostics Gmbh PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS
JP2014236726A (ja) * 2013-05-07 2014-12-18 独立行政法人国立がん研究センター 胃がんの再発を予測する方法
US20160115551A1 (en) * 2013-05-13 2016-04-28 Nanostring Technologies, Inc. Methods to predict risk of recurrence in node-positive early breast cancer
US20160186270A1 (en) * 2013-08-02 2016-06-30 Université Catholique de Louvain Signature of cycling hypoxia and use thereof for the prognosis of cancer
ES2829912T3 (es) * 2013-09-11 2021-06-02 Bio Theranostics Inc Predecir la reaparición de cáncer de mama
CN105793437B (zh) * 2013-09-23 2020-12-15 芝加哥大学 关于dna损伤制剂用于癌症治疗的方法和组合物
KR101548830B1 (ko) * 2013-12-30 2015-08-31 가천대학교 산학협력단 줄기세포 배양방법을 이용하여 발굴된 유방암 줄기세포 마커를 이용한 유방암 예후 예측용 조성물
WO2015110440A1 (en) * 2014-01-22 2015-07-30 Koninklijke Philips N.V. Improved stratification of patients for assessing the suitability of a therapy
RU2566732C1 (ru) * 2014-07-08 2015-10-27 Федеральное государственное бюджетное учреждение "Научно-исследовательский институт онкологии" Сибирского отделения Российской академии медицинских наук (ФГБУ "НИИ онкологии" СО РАМН) Способ прогнозирования лимфогенного метастазирования при инвазивной карциноме неспецифического типа молочной железы
CN104263815B (zh) * 2014-08-25 2017-01-25 复旦大学附属肿瘤医院 一组用于激素受体阳性乳腺癌预后的基因及其应用
WO2016092299A1 (en) * 2014-12-09 2016-06-16 Medical Research Council Methods and kits for predicting the response to therapy of cancer
JP7144934B2 (ja) 2015-03-25 2022-09-30 ザ ジェネラル ホスピタル コーポレイション 血液試料中の循環腫瘍細胞のデジタル分析
CA3016677A1 (en) 2016-03-09 2017-09-14 Myriad International Gmbh Method for determining the risk of recurrence of an estrogen receptor-positive and her2-negative primary mammary carcinoma under an endocrine therapy
US11066466B2 (en) * 2016-04-14 2021-07-20 Academia Sinica Inhibition of SCUBE2, a novel VEGFR2 co-receptor, suppresses tumor angiogenesis
BR112018072286A2 (pt) * 2016-04-29 2019-02-12 Yale University medida direcionada de atividade transcricional relacionada a receptores de hormônios
CN106480201A (zh) * 2016-10-26 2017-03-08 北京鑫诺美迪基因检测技术有限公司 乳腺癌转移评估试剂盒
CN110050075B (zh) * 2016-10-27 2024-04-02 通用医疗公司 用于确定特定癌症的癌症疗法的功效的血液样品的数字分析
KR101950717B1 (ko) * 2016-11-23 2019-02-21 주식회사 젠큐릭스 유방암 환자의 화학치료 유용성 예측 방법
KR101896545B1 (ko) * 2016-11-25 2018-09-07 주식회사 젠큐릭스 유방암 환자의 예후 예측 방법
RU2671557C1 (ru) * 2017-07-10 2018-11-02 Александр Григорьевич Тоневицкий Набор реагентов для определения риска возникновения рецидива онкологических заболеваний молочной железы
EP3679160A4 (en) 2017-09-08 2021-05-19 Myriad Genetics, Inc. METHOD OF USING BIOMARKERS AND CLINICAL VARIABLES TO PREDICT THE INTEREST OF CHEMOTHERAPY
CN108441559B (zh) * 2018-02-27 2021-01-05 海门善准生物科技有限公司 一种免疫相关基因群作为标志物在制备评估高增殖性乳腺癌远处转移风险的产品中的应用
JP7199045B2 (ja) * 2018-04-13 2023-01-05 国立大学法人大阪大学 乳癌の予後に関する情報の取得方法、乳癌の予後の判定装置及びコンピュータプログラム
CN108715804A (zh) * 2018-05-14 2018-10-30 浙江大学 一种群智能寻优的肺癌癌细胞检测仪
CN108424969B (zh) * 2018-06-06 2022-07-15 深圳市颐康生物科技有限公司 一种生物标志物、诊断或预估死亡风险的方法
JP2020028278A (ja) * 2018-08-24 2020-02-27 国立大学法人九州大学 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法
WO2020118245A1 (en) * 2018-12-06 2020-06-11 Georgia State University Research Foundation, Inc. Quantitative centrosomal amplification score to predict local recurrence of ductal carcinoma in situ
EP3994282A1 (en) * 2019-07-05 2022-05-11 Intellexon GmbH Determining individual hla patterns, use as prognosticators, target genes and therapeutic agents
CA3151330A1 (en) * 2019-09-16 2021-03-25 Christina CURTIS Methods of treatments based upon molecular characterization of breast cancer
KR102325945B1 (ko) * 2020-04-22 2021-11-12 아주대학교산학협력단 두경부암 예후 예측용 바이오마커 조성물
CN112852968A (zh) * 2021-04-08 2021-05-28 杨文琳 基于免疫相关lncRNA构建三阴性乳腺癌风险预测方法
CN114480652A (zh) * 2022-02-21 2022-05-13 深圳市陆为生物技术有限公司 评价乳腺癌患者对于辅助内分泌治疗的响应性的产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006119593A1 (en) * 2005-05-13 2006-11-16 Universite Libre De Bruxelles Gene-based algorithmic cancer prognosis

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6686446B2 (en) 1998-03-19 2004-02-03 The Regents Of The University Of California Methods and compositions for controlled polypeptide synthesis
JP4277452B2 (ja) 2000-02-25 2009-06-10 ソニー株式会社 記録装置、再生装置
EA006512B1 (ru) * 2001-04-27 2005-12-29 Институт молекулярной биологии им. В.А.Энгельгардта РАН Способы анализа последовательностей нуклеиновых кислот с использованием биологического олигонуклеотидного микрочипа и наборы для их осуществления
WO2003001985A2 (en) 2001-06-28 2003-01-09 Dermtech International Method for detection of melanoma
US20040002067A1 (en) 2001-12-21 2004-01-01 Erlander Mark G. Breast cancer progression signatures
US20060024692A1 (en) * 2002-09-30 2006-02-02 Oncotherapy Science, Inc. Method for diagnosing non-small cell lung cancers
FR2863275B1 (fr) * 2003-12-09 2007-08-10 Biomerieux Sa Procede pour le diagnostic/pronostic du cancer du sein
JP5089993B2 (ja) * 2004-02-20 2012-12-05 ベリデックス・エルエルシー 乳癌の予後診断
AU2005289728B2 (en) * 2004-09-22 2011-11-24 Tripath Imaging, Inc. Methods and compositions for evaluating breast cancer prognosis
ES2384107T3 (es) 2004-11-05 2012-06-29 Genomic Health, Inc. Indicadores moleculares de pronóstico de cáncer de mama y predicción de la respuesta al tratamiento
WO2006084272A2 (en) 2005-02-04 2006-08-10 Rosetta Inpharmatics Llc Methods of predicting chemotherapy responsiveness in breast cancer patients
JP2008546387A (ja) 2005-06-13 2008-12-25 ザ リージェンツ オブ ザ ユニバーシティ オブ ミシガン 癌を処置および診断するための組成物および方法
US20070099209A1 (en) * 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
GB0512299D0 (en) 2005-06-16 2005-07-27 Bayer Healthcare Ag Diagnosis prognosis and prediction of recurrence of breast cancer
JP2009507496A (ja) * 2005-09-09 2009-02-26 ボード オブ リージェンツ オブ ザ ユニバーシティ オブ テキサス システム エストロゲン受容体(er)遺伝子およびer関連遺伝子のゲノム発現の算出された指標
WO2008006517A2 (en) * 2006-07-13 2008-01-17 Siemens Healthcare Diagnostics Gmbh Prediction of breast cancer response to taxane-based chemotherapy
WO2008046182A1 (en) * 2006-09-15 2008-04-24 Mcgill University Stroma derived predictor of breast cancer
US20100003336A1 (en) 2006-12-01 2010-01-07 The Regents Of The University Of California Vesicles of self-assembling block copolymers and methods for making and using the same
WO2008079269A2 (en) * 2006-12-19 2008-07-03 Genego, Inc. Novel methods for functional analysis of high-throughput experimental data and gene groups identified therfrom
EP2592156B1 (en) 2007-06-08 2016-04-20 Genentech, Inc. Gene expression markers of tumor resistance to HER2 inhibitor treatment
EP2036988A1 (en) 2007-09-12 2009-03-18 Siemens Healthcare Diagnostics GmbH A method for predicting the response of a tumor in a patient suffering from or at risk of developing recurrent gynecologic cancer towards a chemotherapeutic agent
WO2009095319A1 (en) 2008-01-28 2009-08-06 Siemens Healthcare Diagnostics Gmbh Cancer prognosis by majority voting
WO2009114836A1 (en) 2008-03-14 2009-09-17 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
WO2009132928A2 (en) * 2008-05-02 2009-11-05 Siemens Healthcare Diagnostics Gmbh Molecular markers for cancer prognosis
ES2457534T3 (es) * 2008-05-30 2014-04-28 The University Of North Carolina At Chapel Hill Perfiles de expresión génica para predecir desenlaces en cáncer de mama
RU2011101378A (ru) * 2008-06-16 2012-07-27 Сайвидон Дайагностикс Гмбх (De) Алгоритмы предсказания исхода у пациентов с узловой формой рака молочной железы после химиотерапии
US20120053842A9 (en) 2008-06-16 2012-03-01 Sividon Diagnostics Molecular markers for cancer prognosis
EP2163649A1 (en) * 2008-09-11 2010-03-17 Fédération Nationale des Centres de Lutte Contre le Cancer Molecular classifier for evaluating the risk of metastasic relapse in breast cancer
KR101192297B1 (ko) 2008-12-10 2012-10-17 한국생명공학연구원 간암에 대한 신규 바이오마커 및 그의 용도
WO2010076322A1 (en) * 2008-12-30 2010-07-08 Siemens Healthcare Diagnostics Inc. Prediction of response to taxane/anthracycline-containing chemotherapy in breast cancer
EP2419532A1 (en) 2009-04-17 2012-02-22 Université Libre de Bruxelles Methods and tools for predicting the efficiency of anthracyclines in cancer
CA2762983A1 (en) 2009-05-22 2010-11-25 Sherry X. Yang Akt phosphorylation at ser473 as an indicator for taxane-based chemotherapy
WO2011121028A1 (en) 2010-03-30 2011-10-06 Siemens Healthcare Diagnostics Inc. Algorithm for prediction of benefit from addition of taxane to standard chemotherapy in patients with breast cancer
EP2845911B1 (en) 2010-03-31 2016-05-18 Sividon Diagnostics GmbH Method for breast cancer recurrence prediction under endocrine treatment
CA2835179A1 (en) 2011-05-06 2012-11-15 Xentech Markers for cancer prognosis and therapy and methods of use
ES2608322T3 (es) 2011-07-28 2017-04-07 Sividon Diagnostics Gmbh Procedimiento para predecir la respuesta a la quimioterapia en un paciente que padece o está en riesgo de desarrollar cáncer de mama recurrente
WO2013078537A1 (en) 2011-11-28 2013-06-06 National Research Council Of Canada Paclitaxel response markers for cancer
WO2013188600A1 (en) 2012-06-12 2013-12-19 Washington University Copy number aberration driven endocrine response gene signature
US20160348183A1 (en) 2014-02-12 2016-12-01 Myriad Genetics, Inc. Method for predicting the response and survival from chemotherapy in patients with breast cancer
CN106480201A (zh) 2016-10-26 2017-03-08 北京鑫诺美迪基因检测技术有限公司 乳腺癌转移评估试剂盒

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006119593A1 (en) * 2005-05-13 2006-11-16 Universite Libre De Bruxelles Gene-based algorithmic cancer prognosis

Also Published As

Publication number Publication date
US10851427B2 (en) 2020-12-01
CA2793133A1 (en) 2011-10-06
EP2553118B1 (en) 2014-10-15
PL2845911T3 (pl) 2017-01-31
EP2845911B1 (en) 2016-05-18
US20200224281A1 (en) 2020-07-16
EP2553118A1 (en) 2013-02-06
KR20130010048A (ko) 2013-01-24
US20240229150A1 (en) 2024-07-11
UA110790C2 (uk) 2016-02-25
ES2525382T3 (es) 2014-12-23
HUE030164T2 (en) 2017-05-29
PT2845911T (pt) 2016-08-25
PT2553118E (pt) 2014-12-17
US20130065786A1 (en) 2013-03-14
RU2654587C2 (ru) 2018-05-21
CN105821125A (zh) 2016-08-03
EP2845911A1 (en) 2015-03-11
AU2011234573B2 (en) 2015-10-01
RU2012146343A (ru) 2014-05-10
US20170067118A1 (en) 2017-03-09
CN102971435A (zh) 2013-03-13
PL2553118T3 (pl) 2015-03-31
MX2012011167A (es) 2013-02-07
BR112012024718A2 (pt) 2017-01-10
JP5940517B2 (ja) 2016-06-29
ES2587591T3 (es) 2016-10-25
CN102971435B (zh) 2016-05-11
US11913078B2 (en) 2024-02-27
BR122020016370B1 (pt) 2021-05-11
JP2016189781A (ja) 2016-11-10
HK1181817A1 (en) 2013-11-15
CA2793133C (en) 2019-08-20
WO2011120984A1 (en) 2011-10-06
AU2011234573A1 (en) 2012-09-20
ZA201207229B (en) 2013-06-26
US10577661B2 (en) 2020-03-03
US20210123107A1 (en) 2021-04-29
JP2013523105A (ja) 2013-06-17

Similar Documents

Publication Publication Date Title
US10851427B2 (en) Method for breast cancer recurrence prediction under endocrine treatment
US20220307090A1 (en) Method for predicting the response to chemotherapy in a patient suffering from or at risk of developing recurrent breast cancer
US20210062275A1 (en) Methods to predict clinical outcome of cancer
EP2304631A1 (en) Algorithms for outcome prediction in patients with node-positive chemotherapy-treated breast cancer
SG189505A1 (en) Biomarkers for recurrence prediction of colorectal cancer
AU2015268617A1 (en) Method for breast cancer recurrence prediction under endocrine treatment
AU2011234573B8 (en) Method for breast cancer recurrence prediction under endocrine treatment
EP3426797A1 (en) Method for determining the risk of recurrence of an estrogen receptor-positive and her2-negative primary mammary carcinoma under an endocrine therapy

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right