[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20110084995A - 전립선암에서의 반복적 유전자 융합체 - Google Patents

전립선암에서의 반복적 유전자 융합체 Download PDF

Info

Publication number
KR20110084995A
KR20110084995A KR1020117013985A KR20117013985A KR20110084995A KR 20110084995 A KR20110084995 A KR 20110084995A KR 1020117013985 A KR1020117013985 A KR 1020117013985A KR 20117013985 A KR20117013985 A KR 20117013985A KR 20110084995 A KR20110084995 A KR 20110084995A
Authority
KR
South Korea
Prior art keywords
gene
chimeric
erg
etv1
tmprss2
Prior art date
Application number
KR1020117013985A
Other languages
English (en)
Inventor
아룰 엠. 치나이얀
보 한
칸단 쿠마르
Original Assignee
더 리젠츠 오브 더 유니버시티 오브 미시간
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 리젠츠 오브 더 유니버시티 오브 미시간 filed Critical 더 리젠츠 오브 더 유니버시티 오브 미시간
Publication of KR20110084995A publication Critical patent/KR20110084995A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/08Drugs for disorders of the urinary system of the prostate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57434Specifically defined cancers of prostate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 전립선암에서의 안드로겐 조절된 유전자 또는 하우스키핑 유전자, 및 ETS 부류 구성원 유전자의 반복적 유전자 융합을 기재한다. 또한, 전립선암 진단, 연구 및 요법에 유용성을 갖는 조성물 및 방법을 제공한다.

Description

전립선암에서의 반복적 유전자 융합체 {RECURRENT GENE FUSIONS IN PROSTATE CANCER}
관련 출원에 대한 교차 참조
본원은 2005년 9월 12일 출원된 특허 가출원 60/716,436, 2006년 3월 3일 출원된 특허 가출원 60/779,041, 2005년 10월 27일 출원된 특허 가출원 60/730,358 및 2006년 4월 28일 출원된 특허 가출원 60/795,590을 우선권을 주장하는, 2006년 9월 12일 출원된 11/519,397의 일부 계속 출원인, 2007년 7월 6일 출원된 11/825,552의 일부 계속 출원이고, 이들 출원은 각각 그 전문이 본원에 참고로 포함된다.
연방 정부 지원의 연구 또는 개발에 관한 진술
본 발명은 미국 국립보건원 (National Institutes of Health)에 의해 제공된 CA069568, CA102872 및 CA111275 하의 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 특정 권리를 갖는다.
발명의 분야
본 발명은 암 마커를 비롯한 (이로 제한되지는 않음) 암 진단, 연구 및 요법을 위한 조성물 및 방법에 관한 것이다. 특히, 본 발명은 전립선암에 대한 진단 마커 및 임상 표적으로서의 반복적인 유전자 융합체에 관한 것이다.
암 연구에서 중심 목적은 종양발생에서 원인으로 시사되는 변경된 유전자를 확인하는 것이다. 염기 치환, 삽입, 결실, 전좌 (translocation), 및 염색체 획득 및 소실을 비롯한 몇몇 유형의 체세포 돌연변이가 확인되었고, 이들은 모두 종양유전자 또는 종양 서프레서 (suppressor) 유전자의 활성을 변경시킨다. 암에서의 염색체 재배열에 대한 원인 역할에 대한 증거가 1900년대 초에 처음 가설이 제기되었고 현재 설득력을 갖고 있다 (문헌 [Rowley, Nat Rev Cancer 1:245 (2001)]). 반복적인 염색체 이상은 백혈병, 림프종 및 육종의 주요 특징인 것으로 생각되었다. 훨씬 더 일반적이고 인간 암과 연관된 비교적 큰 비율의 이환율 및 사망률에 기여하는 상피 종양 (암종)은 공지의 질환-특이적 염색체 재배열의 1% 미만을 차지한다 (문헌 [Mitelman, Mutat Res 462: 247 (2000)]). 혈액학적 악성종양은 종종 균형잡힌 질환-특이적 염색체 재배열을 특징으로 하지만, 대부분의 고형 종양은 너무 많은 비-특이적 염색체 이상을 갖는다. 고형 종양의 핵형 (karyotypic) 복잡성은 암 진화 또는 진행을 통해 획득된 2차 변경 때문인 것으로 생각된다.
염색체 재배열의 2가지 주요 메카니즘이 설명되었다. 하나의 메카니즘에서, 하나의 유전자의 프로모터/인핸서 효소가 원-종양유전자에 인접하게 재배열되어, 종양발생 단백질의 변경된 발현을 유발한다. 상기 유형의 전좌는 MYC에 대한 면역글로불린 (IG) 및 T-세포 수용체 (TCR) 유전자의 부착성장 (apposition)에 의해 예시되고, 이는 각각 B- 및 T-세포 악성종양에서 상기 종양유전자의 활성화를 일으킨다 (문헌 [Rabbitts, Nature 372: 143 (1994)]). 제2 메카니즘에서, 재배열은 2개의 유전자의 융합을 일으키고, 이는 새로운 기능 또는 변경된 활성을 가질 수 있는 융합 단백질을 생산한다. 상기 전좌의 원형 예는 만성 골수성 백혈병 (CML)에서의 BCR-ABL 유전자 융합체이다 (문헌 [Rowley, Nature 243: 290 (1973)], [de Klein et al., Nature 300: 765 (1982)]). 중요하게는, 상기 발견은 이마티닙 메실레이트 (글리벡 (Gleevec))의 합리적인 개발을 이끌었고, 이는 BCR-ABL 키나제를 성공적으로 표적화한다 (문헌 [Deininger et al., Blood 105: 2640 (2005)]). 따라서, 일반적인 상피 종양에서 반복적인 유전자 재배열을 확인하는 것은 암 약물 발견 노력 및 환자 치료를 크게 시사할 수 있다.
일부 실시양태에서, 본 발명은 환자로부터의 샘플을 제공하고; 샘플 내에서 SLC45A3 유전자의 전사 조절 영역으로부터의 5' 부분 및 ERG 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는 것 (여기서, 샘플 내에서 유전자 융합체의 존재의 검출은 환자에서 전립선암을 확인함)을 포함하는, 환자에서 전립선암을 확인하는 방법을 제공한다. 일부 실시양태에서, SLC45A3 유전자의 전사 조절 영역은 SLC45A3 유전자의 프로모터 영역을 포함한다. 일부 실시양태에서, 검출 단계는 SLC45A3 유전자의 전사 조절 영역으로부터의 5' DNA 부분 및 ERG 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함한다. 일부 실시양태에서, 검출 단계는 SLC45A3 유전자의 전사 조절 영역으로부터 전사된 5' RNA 부분 및 ERG 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함한다. 일부 실시양태에서, 샘플은 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 또는 전립선 세포이다.
일부 실시양태에서, 본 발명은 환자로부터의 샘플을 제공하고; 샘플 내에서 FLJ35294 유전자의 전사 조절 영역으로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는 것 (여기서, 샘플 내에서 유전자 융합체의 존재의 검출은 환자에서 전립선암을 확인함)을 포함하는, 환자에서 전립선암을 확인하는 방법을 제공한다. 일부 실시양태에서, FLJ35294 유전자의 전사 조절 영역은 FLJ35294 유전자의 프로모터 영역을 포함한다. 일부 실시양태에서, ETS 부류 구성원 유전자는 ETV1이다. 일부 실시양태에서, 검출 단계는 FLJ35294 유전자의 전사 조절 영역으로부터의 5' DNA 부분 및 ETS 부류 구성원 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함한다. 일부 실시양태에서, 검출 단계는 FLJ35294 유전자의 전사 조절 영역으로부터 전사된 5' RNA 부분 및 ETS 부류 구성원 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함한다. 일부 실시양태에서, 샘플은 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 또는 전립선 세포이다.
일부 실시양태에서, 본 발명은 환자로부터의 샘플을 제공하고; 샘플 내에서 DDX5 유전자로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는 것 (여기서, 샘플 내에서 유전자 융합체의 존재의 검출은 환자에서 전립선암을 확인함)을 포함하는, 환자에서 전립선암을 확인하는 방법을 제공한다. 일부 실시양태에서, ETS 부류 구성원 유전자는 ETV4이다. 일부 실시양태에서, 검출 단계는 DDX5 유전자로부터의 5' DNA 부분 및 ETS 부류 구성원 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함한다. 일부 실시양태에서, 검출 단계는 DDX5 유전자로부터 전사된 5' RNA 부분 및 ETS 부류 구성원 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함한다. 일부 실시양태에서, 검출 단계는 DDX5 유전자에 의해 코딩된 아미노-말단 부분 및 ETS 부류 구성원 유전자에 의해 코딩된 카르복시-말단 부분을 갖는 키메라 단백질을 검출하는 것을 포함한다. 일부 실시양태에서, 샘플은 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 또는 전립선 세포이다.
일부 실시양태에서, 본 발명은 진단, 치료 및 연구 목적을 위한 조성물을 제공한다. 일부 실시양태에서, 조성물은 키메라 게놈 DNA 또는 키메라 mRNA의 접합부 (junction)에 혼성화하는 서열을 포함하는 올리고뉴클레오티드 프로브를 포함한다. 일부 실시양태에서, 조성물은 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 올리고뉴클레오티드 프로브, 및 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 올리고뉴클레오티드 프로브를 포함한다. 일부 실시양태에서, 조성물은 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오티드, 및 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오티드를 포함한다. 일부 실시양태에서, 조성물은 5' 유전자에 의해 코딩된 아미노-말단 부분 및 3' 유전자에 의해 코딩된 카르복시-말단 부분을 갖는 키메라 단백질에 대한 항체를 포함한다.
본 발명의 추가의 실시양태는 아래 상세한 설명 및 실시예에 제시된다.
도 1은 마이크로어레이 데이터의 암 이상점 프로파일 분석 (Cancer Outlier Profile Analysis; COPA)을 보여준다. (A) 2가지 대규모 유전자 발현 연구에서 모든 프로파일링된 샘플로부터의 ETV1 (좌측 패널) 및 ERG (중간 패널) 발현 (표준화된 발현 단위)을 보여준다. (B) (A)에서와 같지만, 레이저 포획 미세박리된 샘플로부터의 데이터를 사용하였다. (C) (A)에서와 같지만, 다발 골수종에서 면역글로불린 중쇄 프로모터 (IgH)로의 공지의 전좌를 갖는 종양유전자 (FGFR3 및 CCND1)를 검사하였다.
도 2는 전립선암 (PCA)에서 TMPRSS2:ETV1 및 TMPRSS2:ERG 유전자 융합체의 확인 및 특성 결정을 보여준다. (a) 전립선암 세포주 (DuCaP, LnCaP 및 VCaP) 및 호르몬 불응성 전이 (MET) 전립선암 조직을 정량적 PCR (QPCR)에 의해 ERG (■) 및 ETV1 (□) mRNA 발현에 대해 분석하였다. (b) LNCaP 세포에 비해 MET26에서 ETV1 엑손 2 및 3의 과다발현의 상실. (c) TMPRSS2와의 유전자 융합을 밝히는, MET26-LN에서의 ETV1 및 MET28-LN에서의 ERG에 대한 5' RNA 리가제-매개 cDNA 말단부 급속 증폭 (RLM-RACE) 결과의 개략도. (d) MET26-LN 및 MET26-RP에서 전좌-특이적 QPCR을 이용하는 TMPRSS2:ETV1 발현의 확증. (e) 세포주 및 PCA 시료에서 전좌-특이적 QPCR을 이용하는 TMPRSS2:ERG 발현의 확증.
도 3은 TMPRSS2:ETV1 유전자 융합체 및 ERG 유전자 재배열을 확인하는, 포르말린 고정시키고 파라핀 포매시킨 조직 절편에 대한 간기 (interphase) 형광 계내 혼성화 (FISH)를 보여준다. (A 및 B) TMPRSS2 (녹색 신호) 및 ETV1 (적색 신호)의 융합을 검출하기 위한 2-색상 융합-신호 접근법을 보여준다. (C 및 D) ERG의 5' (녹색 신호) 및 3' (적색 신호) 영역에 걸쳐지는 2개의 프로브를 사용하는, 2-색상 분할 (split)-신호 접근법을 이용한 ERG 유전자 재배열의 검출. (E) 13 사례의 임상적 국소 전립선암 (PCA) 및 16 사례의 전이성 전립선암 (MET)으로부터의 코어 (core)를 포함하는 독립적인 조직 마이크로어레이에 대해 (A-D)에서와 동일한 프로브를 사용한 FISH 결과의 매트릭스 도면.
도 4는 TMPRSS2:ERG 전좌를 보유한 전립선암 세포에서 ERG의 안드로겐 조절을 보여준다.
도 5는 암 이상점 프로파일 분석 (COPA)을 보여준다. 도 5A는 COPA 분석의 개략도를 도시한 것이다. 도 5B는 RUNX1T1 (ETO)가 볼크 (Valk) 등의 급성 골수성 백혈병 데이터세트 (n = 293)에서 제90 백분위에서 최고 점수 이상점 프로파일을 가졌음을 보여준다. 도 5C는 E2A-PBX1의 이상점 발현 프로파일러를 보여준다.
도 6은 TMPRSS2와의 유전자 융합 (TMPRSS2:ERGb 융합체)을 밝히는, MET26-LN에서의 ETV1 및 PCA4에서의 ERG에 대한 RNA 리가제-매개 cDNA 말단부 급속 증폭 (RLM-RACE) 결과의 개략도를 보여준다.
도 7은 전립선암에서의 ETS 부류 구성원의 과다발현을 보여준다. 육안 박리된 조직 (A) 또는 레이저 포획 미세박리에 의해 단리된 조직 (B)로부터 프로파일링된 양성 전립선, 전립선 상피내 신생물 (PIN), 임상적 국소 전립선암 및 전이성 전립선암에서의 모든 모니터링된 ETS 부류 구성원의 발현을 온코민 (Oncomine)을 이용하여 가시화하였다.
도 8은 ETV4를 과다발현하는 전립선암 사례에서 TMPRSS2 및 ETV4 유전자좌의 과다발현을 보여준다. A. 모은 (pooled) 양성 전립선 조직 (CPP), ETV4를 과다발현하지 않고 TMPRSS2:ERG 양성 (PCA1-2) 또는 음성 (PCA3-4)인 전립선암, 및 ETV4 과다발현이 있는 본 발명의 LCM 코호트로부터의 전립선암 사례 (PCA5)에서 ETV4의 지시된 엑손 또는 영역의 발현. B. RLM-RACE는 PCA5에서 TMPRSS2의 상류의 서열과 ETV4와의 융합을 밝힌다. C. QPCR에 의한 PCA5에서 TMPRSS2:ETV4a 및 TMPRSS2:ETV4b의 발현. D. 포르말린 고정시키고 파라핀 포매시킨 조직에 대한 간기 형광 계내 혼성화는 PCA5에서 TMPRSS2 및 ETV4 유전자좌의 융합을 확인한다.
도 9는 예시적인 ETS 부류 유전자의 mRNA 서열을 보여준다.
도 10은 TMPRSS2의 mRNA 서열을 보여준다.
도 11은 FISH에 의한 TMPRSS2:ERG 유전자 융합 분석을 보여준다. 패널 A: TMPRSS2:ERG 융합체의 간접적 검출을 위한 분리 (break apart) 검정을 도시하는 핵형도 (ideogram). 패널 B: 기질 세포 (좌측) 및 전립선암 (우측)의 간기 핵. 패널 C: 끝분절 (telomeric) 프로브의 상실에 의해 표시되는 바와 같이 분리 및 동시 결실을 보여주는 전립선암의 간기 핵 (100x 유침 대물 배율). 패널 D. 끝분절 프로브의 분리 및 상실을 갖는 2개의 핵을 입증하는 C의 네모친 영역의 확대 (60x 유침 대물 배율).
도 12는 ERG 및 TMPRSS2 사이에서 염색체 21 상의 게놈 결실을 보여준다. 패널 a: 6개의 세포주, 13개의 이종이식편 및 11개의 전이 PCA 샘플을 포함한 샘플을 qPCR 및/또는 FISH에 의해 TMPRSS2:ERG 및 TMPRSS2:ETV1 상태에 대해 특징규명하였다 (음성 상태에 대해 회색 막대 및 양성 상태에 대해 청색 막대). 패널 b: A의 녹색 프레임 네모의 확대. 패널 c: A의 흑색 프레임 네모의 확대.
도 13은 임상적 국소 전립선암에서의 TMPRSS2:ERG 재배열 및 병리학적 파라미터와의 연관성을 보여준다. 패널 A. 1차 PCA 샘플의 49.2% 및 호르몬 나이브 (naive) 전이 LN 샘플의 41.2%에서 TMPRSS2:ERG 재배열이 확인되었다. 패널 B. 진행 종양 단계의 PCA 사례의 보다 높은 비율에서 관찰되는 경향이 있는 결실이 있는 TMPRSS2:ERG 재배열된 종양 (p=0.03).
도 14는 ERG (중심절 (centromeric)) 및 TMPRSS2 (끝분절) 사이에서 21q22-23 상에 위치하는 공지의 유전자를 보여준다. 흑색 선 위의 유전자는 5'-중심절에서 3'-끝분절로 배향되고, 흑색 선 아래의 유전자는 5'-끝분절에서 3'-중심절로 배향된다. 영상의 하부 절반에서, ERG 유전자좌의 확대도를 FISH 프로브와 함께 도시한다.
도 15는 주로 결실이 있는 TMPRSS2:ERG 재배열 (우측 상의 핵)을 보이고 단지 작은 영역이 결실이 없는 TMPRSS2:ERG 재배열 (좌측 상의 핵)을 보이는, '이질' 전립선암 사례를 보여준다.
도 16은 8개의 공개된 발현 어레이 데이터세트를 가로질러 TMPRSS2 및 ERG 사이에 위치하는 유전자의 메타-분석을 보여준다.
도 17은 FISH 검정이 질환 진행과 연관되는 TMPRSS2:ERG 유전자 융합체와 연관된 특징적인 결실을 검출함을 보여준다. 패널 A 및 B: 염색체 21q22.2 상의 ERG 재배열을 분석하기 위해, 각각 ERG 유전자좌의 이웃하는 중심절 및 끝분절 영역에 걸쳐지는, 비오틴-14-dCTP 표지된 BAC 클론 RP11-24A11 (궁극적으로 접합되어 적색 신호를 생성함) 및 디곡시게닌-dUTP 표지된 BAC 클론 RP11-137J13 (궁극적으로 접합되어 녹색 신호를 생성함)으로 이루어지는 분리 프로브 시스템을 적용하였다. 상기 분리 프로브 시스템을 사용하면, ERG 재배열이 없는 핵은 2개의 쌍의 병치된 적색 및 녹색 신호를 나타낸다. 병치된 적색-녹색 신호는 황색 융합 신호를 형성한다 (패널 B, 화살표). 패널 C: 누적 발생빈도 회귀 모델에서, 누적 발생빈도 또는 전이 또는 전립선암-특이적 사멸에 대한 결정인자로서 TMPRSS2:ERG를 평가하였다.
도 18은 융합 전사체가 없이 FLI1 과다발현을 보여준다.
도 19는 TMPRSS2-ERG+ 세포에서 안드로겐에 의한 ERG 단백질 발현의 유도를 보여준다.
도 20은 내인성 및 융합 ERG 폴리펩티드의 개략도를 보여준다.
도 21은 ERG2에 대한 핵 상호작용자를 보여준다.
도 22는 ERG1에 대한 펩티드 항체 및 아쿠아 (aqua) 프로브 생성을 위한 서열을 보여준다.
도 23은 ETV1에 대한 펩티드 항체 및 아쿠아 프로브 생성을 위한 서열을 보여준다.
도 24는 FLI1에 대한 펩티드 항체 및 아쿠아 프로브 생성을 위한 서열을 보여준다.
도 25는 ETV4에 대한 펩티드 항체 및 아쿠아 프로브 생성을 위한 서열을 보여준다.
도 26은 LNCaP 전립선암 세포주에서의 ETV1의 과다발현 및 안드로겐 조절을 보여준다. 도 26A는 VCaP 및 LNCaP 전립선암 세포주에서의 안드로겐-조절된 유전자의 발현 시그너쳐 (signature)를 보여준다. 도 26B는 정량적 PCR (QPCR)에 의한, VCaP 및 LNCaP 세포 모두에서의 안드로겐에 의한 PSA 유도의 확인을 보여준다. 도 26C는 LNCaP 세포에서의 안드로겐에 의한 ETV1 유도를 보여준다. 도 26D는 ETV1이 LNCaP 세포에서 현저하게 과다발현됨을 보여준다.
도 27은 LNCaP 세포에서의 ETV1의 재배열을 보여준다. 도 27A는 형광 계내 혼성화 (FISH)를 위한 프로브로서 사용되는 BAC의 개략도를 도시한 것이다. 도 27B는 RP11-124L22 및 RP11-1149J13이 정상 말초 림프구 (NPL)에서 염색체 7에 동시에 국소화됨을 보여준다. 도 27C는 중기 전개 (상부 패널) 및 간기 세포 (하부 패널)에 대한 BAC #1 및 BAC #4의 국소화가 가까운 4배수체 LNCaP 세포주에서 결정됨을 보여준다. 도 27D는 RP11-124L22로부터의 신호가 LNCaP 세포에서 염색체 14에 국소화됨을 보여준다.
도 28은 전체 ETV1 유전자좌가 LNCaP 세포에서 염색체 14 내로 삽입됨을 보여준다. 도 28A는 본 실험에서 사용되는 BAC의 개략도를 도시한 것이다. 도 28B는 중기 전개 (상부 패널) 및 간기 세포 (하부 패널)에 대한 RP11-124L22 (BAC #1) 및 RP11-313C20 (BAC #2)의 국소화가 LNCaP 세포에서 FISH에 의해 결정됨을 보여준다.
도 29는 LnCaP에서 ETV1의 siRNA 녹다운 (knockdown)을 보여준다.
도 30은 VCaP에서 ERG의 siRNA 녹다운을 보여준다.
도 31은 바이러스 과다발현 시스템을 보여준다.
도 32는 트랜스제닉 마우스의 개략도를 도시한 것이다.
도 33은 소변에서의 ERG 및 ETV1 전사체의 검출을 보여준다. 도 33A는 LNCaP (고 ETV1 발현) 또는 VCaP (고 ERG 및 TMPRSS2:ERG 발현) 전립선암 세포에서의 ERG 및 ETV1의 검출을 보여준다. 도 33B는 전립선암이 있는 것으로 의심되는 환자의 소변에서의 ERG 및 ETV1의 검출을 보여준다.
도 34는 전립선암에서 TMPRSS2:ETS 유전자 융합체를 검출하기 위해 사용된 검정을 보여준다. 도 34A는 TMPRSS2 및 ERG에 대한 분리 검정을 보여준다. 한 쌍의 분할 5' 및 3' 신호에 의해 표시되는 ERG 재배열 양성 사례 (결실 없음)는 좌측 패널에 도시된다. 하나의 3' 신호의 상실에 의해 표시되는 TMPRSS2 재배열 양성 사례 (결실 존재)는 우측 패널에 제시한다. 도 34B는 TMPRSS2:ETV1 유전자 융합체에 대한 융합 검정을 보여준다. 도 34C는 ETV4에 대한 분리 검정을 보여준다.
도 35는 FISH에 의해 검출된 TMPRSS2, ERG, ETV1 및 ETV4 재배열을 보여준다. 도 35A는 도 34에 도시된 검정에 의해 검출된 TMPRSS2, ERG, ETV1 및 ETV4에서의 재배열 결과의 표를 보여준다. 도 34B는 4가지 모든 검정이 A에 기재된 바와 같이 평가가능한 38명의 사례로부터의 TMPRSS2, ERG, ETV1 및 ETV4 상태의 열지도 (heat map) 표시를 보여준다. 도 34C는 일치하지 않는 TMPRSS2 및 ETS 재배열 상태가 존재하는 사례의 열지도를 보여준다.
도 36은 본 발명의 유전자 융합체의 서열을 보여준다.
도 37은 FLI-1 발현 분석을 위한 프라이머 및 프로브를 보여준다.
도 38은 이상점 종양 시료에서 ETV1에 융합된, 전립선-특이적 또는 편재해 있는 활성을 보이는 제어 요소의 확인을 보여준다. a. ETV1 이상점 사례의 확인. b. 이상점 사례에서 ETV1에 융합된 신규한 5' 파트너의 구조. c. 지시된 파트너의 5' 및 ETV1의 3'에 위치하는 프로브를 사용한 ETV1 융합체의 FISH 확인. d. 5' 융합 파트너의 조직 특이성. e. 5' 융합 파트너의 안드로겐 조절의 평가.
도 39는 qPCR에 의한 신규한 ETV1 유전자 융합체의 확인을 보여준다.
도 40은 FISH에 의한 신규한 ETV1 유전자 융합체의 확인을 보여준다. a. 간기 FISH를 위한 프로브로서 사용된 ETV1, HNRPA2B1, HERV-K_22q11.23, C15ORF21 및 SLC45A3의 5' 및 3'에 위치하는 BAC의 개략도. b-d. FISH는 b) 5' 융합 파트너의 분할 신호 검정, c) 5' 파트너 및 ETV1의 융합, 및 d) ETV1의 분할 신호 검정을 위해 포르말린 고정시키고 파라핀 포매시킨 조직 절편에 대해 상응하는 형광 표지로 표시된 BAC를 사용하여 수행하였다.
도 41은 전립선 세포에서의 ETV1 과다발현이 침윤성을 야기함을 보여준다. a. ETV1 유전자 융합체 생성물 (엑손 4 내지 보고된 정지 코돈)을 발현하는 아데노바이러스 및 렌티바이러스. b. 양성 불멸화 전립선 세포주 RWPE를 나타낸 ETV1 또는 대조군 (GUS) 렌티바이러스로 감염시키고, 안정한 클론을 생성시켜 변형된 기저막을 통한 침윤에 대해 검정하였다. c. 1차 전립선 상피 세포 (PrEC)를 나타낸 ETV1 또는 LACZ 아데노바이러스로 감염시키고, 침윤에 대해 검정하였다. 평균 (n = 3) + S.E.를 제시한다. 침윤된 세포의 현미경사진을 삽입 사진에 제시한다. d-e. LNCaP 세포에서 ETV1의 siRNA 녹다운은 침윤을 억제한다. LNCaP 세포를 형질감염 시약으로만 처리하거나 (비처리), 또는 나타낸 비-표적화 또는 ETV1 siRNA로 형질감염시켰다. d. ETV1 녹다운을 qPCR로 확인하였다 (평균 (n = 4) + S.E.). e. 세포를 b 및 c에서와 같이 침윤에 대해 평가하였다 (평균 (n = 3) + S.E.). f. RWPE-ETV1 및 RWPE-GUS 세포를 애질런트 전체 게놈 (Agilent Whole Genome) 마이크로어레이 상에서 프로파일링하였다. RWPE-GUS 세포에 비해 RWPE-ETV1에서 과다발현된 유전자의 분자 컨셉 분석의 네트워크 도면이 도시된다. 각각의 접속점은 분자 컨셉, 또는 생물학상 관련 유전자의 세트를 나타낸다. 접속점 크기는 컨셉 내의 유전자의 수에 비례한다 (예로서, "RWPE-ETV1" 및 "세포외 매트릭스" 컨셉은 각각 527 및 186개의 유전자를 포함한다). 컨셉 색상은 범례에 따른 컨셉 유형을 나타낸다. 각각의 에지 (edge)는 유의한 풍부화 (P < 0.005)을 나타낸다. g. RWPE-ETV1 세포에서 과다발현된, 침윤에 관련된 선택 유전자의 qPCR 확인.
도 42는 전립선에서 ETV1 유전자 융합체 생성물을 발현하는 트랜스제닉 마우스에서 마우스 전립선 상피내 신생물 (mPIN)이 발생함을 보여준다. a-f. 형태학적 평가를 위한 ARR2Pb-ETV1 전립선의 헤마톡실린 및 에오신 염색. c. b의 고배율 사진으로서, 삽입 사진은 mPIN 병변 내의 현저한 핵소체를 보여준다. d. ARR2Pb-ETV1 마우스 #3 (33주)의 복부 전립선 (VP)에서 관찰된 mPIN의 정상 선 및 병소. e. d의 고배율 사진. f. 정상 상피 구조 및 mPIN을 보여주는 단일 선. 삽입 사진은 화살촉으로 표시된 mPIN의 병소를 보여준다. g-l. 평활근 액틴 (SMA)을 사용한 면역조직화학은 g) 양성 선 및 h) 모든 mPIN 병변 주위에 연속적인 섬유근육층을 제시하지만, 기저 세포 마커 i-j) 시토케라틴 5 (CK5) 및 k-l) p63은 ARR2Pb-ETV1 마우스 #3의 배측방 전립선 (DLP)에서 정상 선 (i,k)에 비해 mPIN 병소 (j,l)에서 주변 기저 세포의 상실을 보여준다. a, b & d에 대한 원래의 배율은 100x이고, c & e-l의 배율은 400x이다.
도 43은 염색체 재배열의 특수 클래스가 전립선암에서 ETS 종양유전자를 활성화시키는 것을 보여준다.
도 44는 ETV1의 과다발현이 양성 전립선 상피 세포의 증식 또는 형질전환에 영향을 미치지 않음을 보여준다. a. 양성 불멸화 전립선 세포주 RWPE를 나타낸 바와 같이 ETV1 또는 대조군 (GUS) 렌티바이러스로 감염시키고, 안정한 클론이 생성되면 증식에 대해 검정하였다. b. 1차 전립선 상피 세포 (PrEC)를 나타낸 바와 같이 ETV1 또는 LACZ 아데노바이러스로 감염시키고, 증식을 검정하였다. 평균 (n = 3) + S.E.를 나타내었다. 결과는 3회의 독립적인 실험을 나타낸다. c. ETV1 과다발현은 S기의 RWPE 세포의 백분율을 증가시키지 않는다. d. ETV1 과다발현은 RWPE 세포의 앵커링 독립적 성장을 증진시키지 않는다.
도 45는 ETV1의 shRNA 녹다운이 LNCaP 세포에서 침윤을 억제함을 보여준다. a. 대조군 LNCaP 세포, 또는 나타낸 바와 같이 비표적화 또는 ETV1 shRNAmir을 발현하는 렌티바이러스로 감염된 LNCaP 세포를 도 41e에서와 같이 침윤에 대해 평가하였다. 평균 (n = 3) + S.E.를 나타내었다. b. a로부터의 침윤된 세포의 현미경사진.
도 46은 ETV1의 과다발현이 증식 관련 컨셉의 발현 감소를 유발함을 보여준다.
도 47은 RWPE-ETV1 세포에서 과다발현된 침윤 관련 유전자의 확인을 보여준다. a. RWPE-ETV1 및 RWPE-GUS 세포를 애질런트 전체 게놈 마이크로어레이 상에서 프로파일링하였다. b. RWPE-ETV1 컨셉, 및 풍부화 네트워크 내의 14개의 다른 컨셉 (숫자로 나타냄) 중 적어도 5개 내에 존재하는 유전자를 확인하는 오버레이 맵.
도 48은 ARR2Pb-ETV1 마우스 전립선의 mPIN 영역에서의 ARR2Pb-ETV1-FLAG 발현 확인을 보여준다. a. 양성 영역이 있는 ARR2Pb-ETV1 마우스 #4의 복부 전립선 (VP) 저배율 사진, 및 각각 황색 및 흑색 화살표로 나타낸 mPIN 병소. b. ETV1-FLAG 발현의 결핍을 보여주는, a에 나타낸 양성 선의 고배율 사진. c. ETV1-FLAG 발현을 입증하는, a에 나타낸 mPIN 선의 고배율 사진.
도 49는 LNCaP 세포의 안드로겐 고갈이 안드로겐 조절된 유전자의 발현을 조정함을 보여준다.
도 50은 R1881이 안드로겐-반응성 VCaP 세포주에서 ETV1 발현을 유도하지 않음을 보여준다.
도 51은 본 발명의 추가의 유전자 융합체의 서열을 보여준다.
도 52는 본 발명의 추가의 유전자 융합체의 서열을 보여준다.
도 53은 QPCR에 의한 ETV5 이상점 발현을 나타냄으로써 2개의 전립선암 (PCa) 사례의 확인을 보여준다. 패널 b는 RACE에 의해 측정된, 두 사례 모두에 대한 융합 전사체의 구조를 보여준다.
도 54는 전립선암에서의 ETS 이상의 포괄 FISH 스크리닝에 대한 도식적 접근법을 보여준다. a) ETS 중지점에 플랭킹된 약 1 Mb 프로브로 분할 프로브 FISH 접근법을 이용하였고, ETS 부류 유전자를 포함하는 유전자 재배열을 스크리닝하기 위해 전립선암 TMA에 적용시켰다. b) 전립선암의 FISH-기반 스크리닝으로부터 가능한 결과. c) 1Mb 분할 프로브가 이상을 시사하는 경우, 관심의 대상이 되는 유전자에 타이트하게 플랭킹된 프로브 (100-200 Kb)를 조직 절편에 적용하여 초기 스크리닝에 의해 확인된 이상을 확인하였다. d) ETS 유전자 및 공지의 5' 파트너 둘 다의 경우에 재배열된 사례에 대해, 융합 프로브 FISH 검정을 수행하여 잠재적인 유전자 융합체를 확인하였고; ETS 유전자 재배열만이 있는 경우, RLM-RACE를 이용하여 ETS 유전자의 신규 5' 파트너를 확인하였다.
도 55a 및 b는 전립선암에서의 ETS 및 5' 융합 파트너 이상에 대한 요약 매트릭스를 보여준다.
도 56은 ERG에 대한 신규한 5' 융합 파트너로서의 SLC45A3의 확인을 보여준다. a) 간기 FISH를 위한 프로브로서 사용된 SLC45A3 및 ERG의 5' 및 3'에 위치하는 BAC의 개략도. b) FISH는 각각 SLC45A3, ERG의 분할 신호 검정, 및 SLC45A3의 5' 및 ERG의 3'의 융합을 위해 포르말린 고정시키고 파라핀 포매시킨 조직 절편에 대해 상응하는 형광 표지로 표시된 BAC를 사용하여 수행하였다.
도 57은 전립선암에서의 5' 융합 파트너 FLJ35294, CANT1 및 DDX5의 확인을 보여준다. a) 5'RACE 분석에 의해 확인된 FLJ35294-ETV1 (PCa_54), CANT1-ETV4 (PCa_46) 및 DDX5-ETV4 (PCa_85) 융합체의 개략도. 네모 안의 숫자는 엑손을 나타낸다. 네모 위의 숫자는 각각의 엑손의 마지막 염기를 나타낸다. 미번역 영역은 더 밝은 음영으로 표시하였다 (FLJ35294는 특징화되지 않은 유전자 구조를 갖는 예측된 전사체임). b) 온코민 데이터세트에서 얻은 국제 게놈 컨소시엄 엑스포데이터(expOdata) 세트 기반의 28가지의 다른 암 유형과 비교한, 전립선암의 FLJ35294, CANT1 및 DDX5 유전자의 발현 플롯.
도 58은 FISH에 의한 FLJ35294:ETV1, CANT1:ETV4 및 DDX5:ETV4 융합체의 확인을 보여준다. a) 간기 FISH를 위한 프로브로서 사용된 ETV1, ETV4, FLB 5294 및 CANT1의 5' 및 3'에 위치하는 BAC의 개략도. b-d) FISH는, b) ETV1 및 ETV4의 분할 신호 검정, c) 5' 융합 파트너의 분할 신호 검정, 및 d) 5' 파트너 및 ETV1 또는 ETV4의 융합을 위해 포르말린 고정시키고 파라핀 포매시킨 조직 절편에 대해 상응하는 형광 표지로 표시된 BAC를 사용하여 수행하였다. 분할 신호는 화살표로 나타내었고, 융합된 신호는 황색 화살표로 나타내었다.
도 59는 전립선암에서의 DDX5:ETV4 융합 단백질의 특성 결정, 및 FLJ35294 및 CANT1 게놈 유전자좌의 안드로겐-조절을 보여준다. a) 양성 전립선, 및 FLJ35294-ETV1, CANT1-ETV4, DDX5-ETV4 또는 SLC45A3:ERG에 대해 양성인 전립선암 사례에서 ERG, ETV1 및 ETV4의 발현을 QPCR에 의해 측정하였다. b) LNCaP 세포를 48시간 동안 호르몬-결핍시키고, R1881 또는 에탄올 대조군으로 처리하고, Q-PCR에 의해 FLJ35294, CANT1 및 DDX5 전사체 발현에 대해 검정하였다. c) 각각의 유전자좌에서의 AR 풍부화 값을 염색질 면역침전 (ChIP) 분석으로 평가하였다. d) 상부 패널: ETV4의 아미노산 65-484에 융합된 DDX5의 아미노산 1-102로 나타낸 DDX5-ETV4 융합 단백질의 개략도. 중간 패널: pCDNA3.2-DDX5-ETV4 발현 구축물로 일시적으로 형질감염시킨 HEK 293 세포의 면역블롯 분석에 의한, FLAG태그가 부착된 DDX5-ETV4 융합 단백질의 검출. 하부 패널: DDX5-ETV4 유전자 융합체 (PCa_85)를 갖는 환자로부터의 조직 용해물에서의 내인성 DDX5-ETV4 융합 단백질 (57 kDa)의 검출.
정의
본 발명의 이해를 용이하게 하기 위해, 많은 용어 및 어구를 아래에 정의한다.
본원에서 사용되는 바와 같이, 용어 "유전자 융합체"는 제1 유전자의 적어도 일부의 제2 유전자의 적어도 일부에 대한 융합으로부터 생성된, 키메라 게놈 DNA, 키메라 메신저 RNA, 말단절단된 단백질 또는 키메라 단백질을 지칭한다. 유전자 융합체가 전체 유전자 또는 유전자의 엑손을 포함할 필요는 없다.
본원에서 사용되는 바와 같이, 용어 "암에서 상향조절되는 유전자"는 다른 조직에서의 수준에 비해 암 (예를 들어, 전립선암)에서 더 높은 수준으로 발현되는 (예를 들어, mRNA 또는 단백질 발현) 유전자를 지칭한다. 일부 실시양태에서, 암에서 상향조절되는 유전자는 다른 조직에서의 발현 수준보다 적어도 10%, 바람직하게는 적어도 25%, 훨씬 더욱 바람직하게는 적어도 50%, 보다 더욱 바람직하게는 적어도 100%, 보다 더욱 바람직하게는 적어도 200%, 가장 바람직하게는 적어도 300% 더 높은 수준으로 발현된다. 일부 실시양태에서, 전립선암에서 상향조절되는 유전자는 "안드로겐 조절된 유전자"이다.
본원에서 사용되는 바와 같이, 용어 "전립선 조직에서 상향조절되는 유전자"는 다른 조직에서의 수준에 비해 전립선 조직에서 더 높은 수준으로 발현되는 (예를 들어, mRNA 또는 단백질 발현) 유전자를 지칭한다. 일부 실시양태에서, 전립선 조직에서 상향조절되는 유전자는 다른 조직에서의 발현 수준보다 적어도 10%, 바람직하게는 적어도 25%, 훨씬 더욱 바람직하게는 적어도 50%, 보다 더욱 바람직하게는 적어도 100%, 보다 더욱 바람직하게는 적어도 200%, 가장 바람직하게는 적어도 300% 더 높은 수준으로 발현된다. 일부 실시양태에서, 전립선 조직에서 상향조절되는 유전자는 전립선 조직에서 배타적으로 발현된다.
본원에서 사용되는 바와 같이, 용어 "고 발현 프로모터"는 고 발현 프로모터에 융합되지 않은 경우의 유전자의 발현 수준보다 유전자에 융합될 때 유전자가 더 높은 수준 (예를 들어, 적어도 10%, 바람직하게는 적어도 25%, 훨씬 더욱 바람직하게는 적어도 50%, 보다 더욱 바람직하게는 적어도 100%, 보다 더욱 바람직하게는 적어도 200%, 가장 바람직하게는 적어도 300% 더 높은 수준)으로 특정 조직 (예를 들어, 전립선)에서 발현되도록 유도하는 프로모터를 지칭한다. 일부 실시양태에서, 고 발현 프로모터는 안드로겐 조절된 유전자 또는 하우스키핑 유전자 (예를 들어, HNRPA2B1)로부터의 프로모터이다.
본원에서 사용되는 바와 같이, 용어 "전사 조절 영역"은 유전자의 발현을 조정 (예를 들어, 상향조절 또는 하향조절)하는 서열을 포함하는 유전자의 영역을 지칭한다. 일부 실시양태에서, 유전자의 전사 조절 영역은 5' 비번역 영역 (5'UTR)으로도 불리는 유전자의 비-코딩 상류 서열을 포함한다. 다른 실시양태에서, 전사 조절 영역은 유전자의 코딩 영역 내에 또는 인트론 (예를 들어, 인핸서) 내에 위치하는 서열을 함유한다.
본원에서 사용되는 바와 같이, 용어 "안드로겐 조절된 유전자"는 그의 발현이 안드로겐 (예를 들어, 테스토스테론)에 의해 유도되거나 억제되는 유전자 또는 유전자의 일부를 지칭한다. 안드로겐 조절된 유전자의 프로모터 영역은 안드로겐 또는 안드로겐 신호전달 분자 (예를 들어, 하류 신호전달 분자)와 상호작용하는 "안드로겐 반응 요소"를 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "검출하다", "검출하는" 또는 "검출"은 검출가능하게 표지된 조성물의 발견, 식별 또는 특이적 관찰의 일반적 실시를 기재하는 것일 수 있다.
본원에서 사용되는 바와 같이, 용어 "유전자 융합체의 적어도 하나의 생물학적 활성을 억제하다"는, 유전자 융합체 단백질에 직접 접촉하거나, 유전자 융합체 mRNA 또는 게놈 DNA에 접촉하거나, 유전자 융합체 폴리펩티드의 입체형태 변화를 유발하거나, 유전자 융합체 단백질 수준을 감소시키거나, 또는 신호전달 파트너와의 유전자 융합체 상호작용을 간섭하고, 유전자 융합체 표적 유전자의 발현에 영향을 줌으로써 본 발명의 유전자 융합체의 임의의 활성 (예를 들어, 본원에 기재된 활성이 포함되나 이로 제한되지 않음)을 감소시키는 임의의 작용제를 지칭한다. 억제제는 또한 상류의 신호전달 분자를 차단함으로써 유전자 융합체의 생물학적 활성을 간접적으로 조절하는 분자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "siRNA"는 작은 간섭 RNA를 의미한다. 일부 실시양태에서, siRNA는 약 18-25개 뉴클레오티드 길이의 이중나선, 또는 이중 가닥 영역을 포함하고; 종종 siRNA는 각각의 가닥의 3' 말단부에 약 2 내지 4개의 비페어링된 뉴클레오티드를 포함한다. siRNA의 이중나선 또는 이중 가닥 영역의 적어도 하나의 가닥은 표적 RNA 분자에 실질적으로 상동성, 또는 실질적으로 상보성이다. 표적 RNA 분자에 상보적 가닥은 "안티센스 가닥"이고, 표적 RNA 분자에 상동성인 가닥은 "센스 가닥"이고 또한 siRNA 안티센스 가닥에 상보성이다. 또한, siRNA는 추가의 서열을 포함할 수 있고; 이러한 서열의 비-제한적인 예는 연결 서열, 또는 루프, 및 줄기 및 다른 접힌 구조를 포함한다. siRNA는 무척추동물 및 척추동물에서 RNA 간섭을 촉발하고, 식물에서 전사후 유전자 침묵화 (silencing) 동안 서열-특이적 RNA 분해를 촉발할 때 핵심 매개자로서 기능하는 것으로 보인다.
용어 "RNA 간섭" 또는 "RNAi"는 siRNA에 의한 유전자 발현의 침묵화 또는 감소를 지칭한다. 이것은 동물 및 식물에서 침묵화 유전자의 서열에 상동성인 그의 이중나선 영역 내의 siRNA에 의해 개시되는 서열-특이적, 전사후 유전자 침묵화 과정이다. 유전자는 염색체 내에 통합되어 존재하거나 또는 게놈 내로 통합되지 않은 형질감염 벡터에 존재하는, 유기체에 대해 내인성 또는 외인성일 수 있다. 유전자의 발현은 완전히 또는 부분적으로 억제된다. 또한, RNAi는 표적 RNA의 기능을 억제하는 것으로 간주될 수 있고; 표적 RNA의 기능은 완전하거나 부분적일 수 있다.
본원에서 사용되는 바와 같이, 용어 "암의 단계"는 암의 진행 수준에 대한 정성적 또는 정량적 평가를 지칭한다. 암의 단계를 결정하기 위해 사용되는 기준은 종양의 크기 및 전이의 정도 (예를 들어, 국소적 또는 원격)를 포함하지만 이로 제한되지는 않는다.
본원에서 사용되는 바와 같이, 용어 "유전자 전달 시스템"은 핵산 서열을 포함하는 조성물을 세포 또는 조직에 전달하는 임의의 수단을 지칭한다. 예를 들어, 유전자 전달 시스템은 벡터 (예를 들어, 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스, 및 다른 핵산-기재 전달 시스템), 네이키드 (naked) 핵산의 미세주사, 중합체 기재 전달 시스템 (예를 들어, 리포좀-기재 및 금속 입자-기재 시스템), 바이올리스틱 (biolistic) 주사 등을 포함하지만 이로 제한되지는 않는다. 본원에서 사용되는 바와 같이, 용어 "바이러스 유전자 전달 시스템"은 원하는 세포 또는 조직으로의 샘플의 전달을 용이하게 하기 위해 바이러스 요소 (예를 들어, 무손상 바이러스, 변형된 바이러스 및 바이러스 성분, 예를 들어 핵산 또는 단백질)를 포함하는 유전자 전달 시스템을 지칭한다. 본원에서 사용되는 바와 같이, 용어 "아데노바이러스 유전자 전달 시스템"은 아데노비리다에 (Adenoviridae)에 속하는 무손상 또는 변경된 바이러스를 포함하는 유전자 전달 시스템을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "부위-특이적 재조합 표적 서열"은 재조합 인자의 인식 서열 및 재조합이 일어나는 위치를 제공하는 핵산 서열을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "핵산 분자"는 DNA 또는 RNA를 비롯한 (이로 제한되지는 않음) 분자를 포함하는 임의의 핵산을 지칭한다. 이 용어는 4-아세틸시토신, 8-히드록시-N6-메틸아데노신, 아지리디닐시토신, 슈도이소시토신, 5-(카르복시히드록실메틸) 우라실, 5-플루오로우라실, 5-브로모우라실, 5-카르복시메틸아미노메틸-2-티오우라실, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 이노신, N6-이소펜테닐아데닌, 1-메틸아데닌, 1-메틸슈도우라실, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-메틸아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시-아미노메틸-2-티오우라실, 베타-D-만노실쿠에오신, 5'-메톡시카르보닐메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산, 옥시부톡소신, 슈도우라실, 쿠에오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, N-우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산, 슈도우라실, 쿠에오신, 2-티오시토신 및 2,6-디아미노퓨린을 비롯한 (이로 제한되지는 않음) DNA 및 RNA의 임의의 공지의 염기 유사체를 포함하는 서열을 포함한다.
용어 "유전자"는 폴리펩티드, 전구체 또는 RNA (예를 들어, rRNA, tRNA)의 생산에 필수적인 코딩 서열을 포함하는 핵산 (예를 들어, DNA) 서열을 지칭한다. 폴리펩티드는 전장 코딩 서열에 의해, 또는 전장 또는 단편의 원하는 활성 또는 기능적 특성 (예를 들어, 효소 활성, 리간드 결합, 신호 전달, 면역원성 등)을 보유하는 코딩 서열의 임의의 부분에 의해 코딩될 수 있다. 또한, 상기 용어는 구조 유전자의 코딩 영역, 및 유전자가 전장 mRNA의 길이에 대응하도록 어느 한 말단부 상에 약 1 kb 이상의 거리로 5' 및 3' 말단부 상의 코딩 영역에 인접하여 위치하는 서열을 포함한다. 코딩 영역의 5'에 위치하고 mRNA에 존재하는 서열은 5' 비-번역 서열로 지칭된다. 코딩 영역의 3'에 위치하고 mRNA에 존재하는 서열은 3' 비-번역 서열로 지칭된다. 용어 "유전자"는 cDNA 및 유전자의 게놈 형태를 둘 다 포함한다. 유전자의 게놈 형태 또는 클론은 "인트론" 또는 "개재 영역" 또는 "개재 서열"로 불리는 비-코딩 서열이 사이에 존재하는 코딩 영역을 포함한다. 인트론은 핵 RNA (hnRNA)로 전사되는 유전자의 분절이고; 인트론은 인핸서와 같은 제어 요소를 포함할 수 있다. 인트론은 핵 또는 1차 전사체로부터 제거되거나 "스플라이싱"될 수 있고; 따라서 인트론은 메신저 RNA (mRNA) 전사체에 존재하지 않는다. mRNA는 번역 동안 신생 폴리펩티드 내의 아미노산의 서열 또는 순서를 특정하도록 기능한다.
본원에서 사용되는 바와 같이, 용어 "이종성 유전자"는 그의 자연 환경에 존재하지 않는 유전자를 지칭한다. 예를 들어, 이종성 유전자는 또 다른 종 내로 도입된 한 종으로부터의 유전자를 포함한다. 또한, 이종성 유전자는 몇몇 방식으로 변경된 (예를 들어, 돌연변이된, 다수의 카피에 부가된, 비-천연 조절 서열에 연결된 등), 유기체에 천연 존재하는 유전자를 포함한다. 이종성 유전자는, 이종성 유전자 서열이 일반적으로 염색체 내의 유전자 서열과 자연에서 회합하는 것으로 발견되지 않거나 또는 자연에서 발견되지 않는 염색체의 일부와 회합하는 (예를 들어, 유전자가 정상적으로는 발현되지 않는 유전자좌에서 발현되는 유전자) DNA 서열에 연결된다는 점에서 내인성 유전자와 구분된다.
본원에서 사용되는 바와 같이, 용어 "올리고뉴클레오티드"는 짧은 길이의 단일 가닥 폴리뉴클레오티드 사슬을 지칭한다. 올리고뉴클레오티드는 일반적으로 200개 미만의 잔기 길이 (예를 들어, 15 내지 100개)이지만, 본원에서 사용되는 바와 같이, 이 용어는 또한 더 긴 폴리뉴클레오티드 사슬을 포함하도록 의도된다. 올리고뉴클레오티드는 종종 그 길이에 따라 지칭된다. 예를 들어, 24개 잔기의 올리고뉴클레오티드는 "24-mer"로 지칭된다. 올리고뉴클레오티드는 자가-혼성화 또는 다른 폴리뉴클레오티드에 대한 혼성화에 의해 2차 및 3차 구조를 형성할 수 있다. 상기 구조는 이중나선, 헤어핀, 십자형, 굴곡부, 및 삼중체를 포함할 수 있으나 이로 제한되지는 않는다.
본원에서 사용되는 바와 같이, 용어 "상보적" 또는 "상보성"은 염기 페어링 규칙에 의해 관련되는 폴리뉴클레오티드 (즉, 뉴클레오티드의 서열)를 나타내기 위해 사용된다. 예를 들어, 서열 "5'-A-G-T-3'"은 서열 "3'-T-C-A-5'"에 상보성이다. 상보성은 "부분적"일 수 있고, 이때 핵산 염기의 일부만이 염기 페어링 규칙에 따라 매치된다. 또는, 핵산들 사이에 "완전한" 또는 "전체적인" 상보성이 존재할 수 있다. 핵산 가닥 사이의 상보성의 정도는 핵산 가닥 사이의 혼성화의 효율 및 강도에 대해 유의한 효과를 갖는다. 이것은 증폭 반응, 및 핵산 사이의 결합에 의존하는 검출 방법에서 특히 중요하다.
용어 "상동성"은 상보성의 정도를 지칭한다. 부분적인 상동성 또는 완전한 상동성 (즉, 동일성)이 존재할 수 있다. 부분적으로 상보적인 서열은 완전히 상보적인 핵산 분자가 표적 핵산에 혼성화하는 것을 적어도 부분적으로 억제하는 핵산 분자이고, "실질적으로 상동성"이다. 완전히 상보적인 서열의 표적 서열에 대한 혼성화의 억제는 저 엄격성 조건하에서의 혼성화 검정 (서던 (Southern) 또는 노던 (Northern) 블롯, 용액 혼성화 등)을 사용하여 조사될 수 있다. 실질적으로 상동성인 서열 또는 프로브는 저 엄격성 조건하에서 표적에 대한 결합 (즉, 혼성화)을 위해 완전히 상동성인 핵산 분자와 경쟁하고 완전히 상동성인 핵산 분자의 결합을 억제할 것이다. 저 엄격성 조건은 비-특이적 결합이 허용되는 조건은 아니고; 저 엄격성 조건은 2개의 서열의 서로에 대한 결합이 특이적 (즉, 선택적) 상호작용일 것을 필요로 한다. 비-특이적 결합의 부재는 실질적으로 비-상보성 (예를 들어, 약 30% 미만의 동일성)인 제2 표적의 사용에 의해 시험될 수 있고; 비-특이적 결합의 부재 하에 프로브는 제2 비-상보성 표적에 혼성화하지 않을 것이다.
이중 가닥 핵산 서열, 예를 들어 cDNA 또는 게놈 클론에 대해 사용될 때, 용어 "실질적으로 상동성"은 상기 설명된 저 엄격성 조건하에서 이중 가닥 핵산 서열의 어느 한 가닥 또는 두 가닥 모두에 혼성화할 수 있는 임의의 프로브를 지칭한다.
유전자는 1차 RNA 전사체의 차별적인 스플라이싱에 의해 생성되는 다수의 RNA 종을 생산할 수 있다. 동일한 유전자의 스플라이스 변이체인 cDNA는 서열 동일성 또는 완전한 상동성의 영역 (두 cDNA 상에 동일한 엑손 또는 동일한 엑손의 일부의 존재를 나타냄) 및 완전한 비-동일성의 영역 (예를 들어, cDNA 1 상의 엑손 "A"의 존재를 나타내고 cDNA 2는 엑손 "B"를 포함함)을 포함할 것이다. 2개의 cDNA는 서열 동일성 영역을 포함하기 때문에, 이들은 둘 다 두 cDNA 상에서 발견되는 서열을 함유하는 전체 유전자 또는 유전자의 일부로부터 유도된 프로브에 혼성화할 것이고; 따라서, 2개의 스플라이스 변이체는 상기 프로브에, 그리고 서로에 대해 실질적으로 상동성이다.
단일 가닥 핵산 서열에 대해 사용될 때, 용어 "실질적으로 상동성"은 상기한 저 엄격성 조건하에서 단일 가닥 핵산 서열에 혼성화할 수 있는 (즉, 단일 가닥 핵산 서열의 보체인) 임의의 프로브를 지칭한다.
본원에서 사용되는 바와 같이, 용어 "혼성화"는 상보성 핵산의 페어링에 대해 사용된다. 혼성화 및 혼성화의 강도 (즉, 핵산들 사이의 회합의 강도)는 핵산 사이의 상보성 정도, 관련되는 조건의 엄격성, 형성된 하이브리드의 Tm, 및 핵산 내의 G:C 비와 같은 인자에 의해 영향받는다. 그의 구조 내에 상보성 핵산의 페어링을 포함하는 단일 분자는 "자가-혼성화되는" 것으로 말해진다.
본원에서 사용되는 바와 같이, 용어 "엄격성"은 핵산 혼성화가 수행되는 온도, 이온 강도, 및 유기 용매와 같은 다른 화합물의 존재의 조건에 대해 사용된다. "저 엄격성 조건" 하에서, 관심있는 핵산 서열은 그의 정확한 보체, 단일 염기 미스매치가 있는 서열, 밀접하게 관련된 서열 (예를 들어, 90% 이상의 상동성을 갖는 서열), 및 단지 부분적인 상동성만을 갖는 서열 (예를 들어, 50-90% 상동성을 갖는 서열)에 혼성화할 것이다. '중간 엄격성 조건" 하에서, 관심있는 핵산 서열은 그의 정확한 보체, 단일 염기 미스매치가 있는 서열 및 밀접하게 관련된 서열 (예를 들어, 90% 이상의 상동성)에만 혼성화할 것이다. "고 엄격성 조건" 하에서 관심있는 핵산 서열은 그의 정확한 보체, 및 (온도와 같은 조건에 따라) 단일 염기 미스매치가 있는 서열에만 혼성화할 것이다. 바꾸어 말하면, 고 엄격성 조건하에서, 온도는 단일 염기 미스매치가 있는 서열에 대한 혼성화를 배제하기 위해 상승될 수 있다.
핵산 혼성화에 대해 사용될 때 "고 엄격성 조건"은 약 500개 뉴클레오티드 길이의 프로브가 사용될 때, 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 H2O 및 1.85 g/l EDTA, pH는 NaOH로 7.4로 조정), 0.5% SDS, 5X 덴하르트 (Denhardt) 시약 및 100 ㎍/ml 변성 연어 정자 DNA로 구성된 용액 중 42℃에서의 결합 또는 혼성화, 이어서 42℃에서 0.1X SSPE, 1.0% SDS를 포함하는 용액 중에서의 세척에 동등한 조건을 포함한다.
핵산 혼성화에 대해 사용될 때 "중간 엄격성 조건"은 약 500개 뉴클레오티드 길이의 프로브가 사용될 때, 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 H2O 및 1.85 g/l EDTA, pH는 NaOH로 7.4로 조정), 0.5% SDS, 5X 덴하르트 시약 및 100 ㎍/ml 변성 연어 정자 DNA로 구성된 용액 중 42℃에서의 결합 또는 혼성화, 이어서 42℃에서 1.0X SSPE, 1.0% SDS를 포함하는 용액 내에서의 세척에 동등한 조건을 포함한다.
"저 엄격성 조건"은 약 500개 뉴클레오티드 길이의 프로브가 사용될 때, 5X SSPE (43.8 g/l NaCl, 6.9 g/l NaH2PO4 H2O 및 1.85 g/l EDTA, pH는 NaOH로 7.4로 조정), 0.1% SDS, 5X 덴하르트 시약 [50X 덴하르트 시약은 500 ml당 5 g 피콜 (Ficoll) (타입 400, 파마시아 (Pharamcia)), 5 g BSA (분획 V; 시그마 (Sigma))를 함유함] 및 100 ㎍/ml 변성 연어 정자 DNA로 구성된 용액 중 42℃에서의 결합 또는 혼성화, 이어서 42℃에서 5X SSPE, 0.1% SDS를 포함하는 용액 내에서의 세척에 동등한 조건을 포함한다.
당업계에 공지되어 있는 바와 같이, 저 엄격성 조건을 포함하도록 수많은 동등한 조건이 사용될 수 있고; 프로브의 길이 및 특성 (DNA, RNA, 염기 조성) 및 표적의 특성 (DNA, RNA, 염기 조성, 용액 내 존재 또는 고정 등), 및 염 및 다른 성분의 농도 (예를 들어, 포름아미드, 덱스트란 술페이트, 폴리에틸렌 글리콜의 존재 또는 부재)와 같은 요인이 고려되고, 혼성화 용액은 상기 나열한 조건과 상이하지만 그에 대해 동등한 저 엄격성 혼성화 조건을 생성하기 위해 변경될 수 있다. 또한, 고 엄격성 조건하에서의 혼성화를 촉진하는 조건 (예를 들어, 혼성화 및/또는 세척 단계의 온도 상승, 혼성화 용액 내에 포름아미드의 사용 등) ("엄격성"에 대해서는 상기 정의 참조)이 당업계에 공지되어 있다.
본원에서 사용되는 바와 같이, 용어 "증폭 올리고뉴클레오티드"는 표적 핵산, 또는 그의 보체에 혼성화하고, 핵산 증폭 반응에 참여하는 올리고뉴클레오티드를 의미한다. 증폭 올리고뉴클레오티드의 예는 주형 핵산에 혼성화하고 증폭 과정에서 중합효소에 의해 연장되는 3' OH 말단부를 함유하는 "프라이머"이다. 증폭 올리고뉴클레오티드의 또 다른 예는 중합효소에 의해 연장되지 않지만 (예를 들어, 차단된 3' 말단부를 갖기 때문에), 증폭에 참여하거나 증폭을 용이하게 하는 올리고뉴클레오티드이다. 증폭 올리고뉴클레오티드는 변형된 뉴클레오티드 또는 유사체, 또는 증폭 반응에 참여하지만 표적 핵산에 상보성이거나 표적 핵산에 포함되지 않는 추가의 뉴클레오티드를 임의로 포함할 수 있다. 증폭 올리고뉴클레오티드는 표적 또는 주형 서열에 상보성이 아닌 서열을 포함할 수 있다. 예를 들어, 프라이머의 5' 영역은 표적 핵산에 비-상보적 프로모터 서열 ("프로모터-프라이머"로 언급됨)을 포함할 수 있다. 당업자는 프라이머로서 기능하는 증폭 올리고뉴클레오티드가 5' 프로모터 서열을 포함하도록 변형되어 프로모터-프라이머로서 기능할 수 있음을 이해할 것이다. 이와 유사하게, 프로모터-프라이머는 프로모터 서열의 제거 또는 프로모터 서열이 존재하지 않는 합성에 의해 변형될 수 있고, 여전히 프라이머로서 기능할 수 있다. 3' 차단된 증폭 올리고뉴클레오티드는 프로모터 서열을 제공할 수 있고, 중합을 위한 주형으로서 기능할 수 있다 ("프로모터-제공자"로 언급됨).
본원에서 사용되는 바와 같이, 용어 "프라이머"는 정제된 제한 소화에서와 같이 자연 발생되거나 또는 합성 생산되는지 여부에 관계없이 핵산 가닥에 상보적인 프라이머 연장 생성물의 합성을 유도하는 조건 하에 있을 때 (즉, 뉴클레오티드 및 유도제, 예컨대 DNA 중합효소의 존재 하에, 및 적합한 온도 및 pH에서) 합성의 개시점으로서 작용할 수 있는 올리고뉴클레오티드를 지칭한다. 프라이머는 바람직하게는 증폭시 최대 효율로 단일 가닥이 되지만, 다르게는 이중 가닥이 될 수 있다. 이중 가닥이 된다면, 프라이머를 먼저 처리하여 그의 가닥을 분리한 후에 연장 생성물을 제조하는 데 사용한다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 유도제의 존재 하에 연장 생성물의 합성을 프라이밍하기에 충분한 길이이어야 한다. 프라이머의 정확한 길이는 온도, 프라이머의 공급원 및 방법의 사용을 비롯한 많은 인자에 따라 달라질 것이다.
본원에서 사용되는 바와 같이, 용어 "프로브"는 정제된 제한 소화에서와 같이 자연 발생되거나, 또는 합성, 재조합 또는 PCR 증폭에 의해 생산되는지 여부에 관계없이 또 다른 관심 올리고뉴클레오티드의 적어도 일부와 하이브리드될 수 있는 올리고뉴클레오티드 (즉, 뉴클레오티드의 서열)를 지칭한다. 프로브는 단일 가닥 또는 이중 가닥이 될 수 있다. 프로브는 특정 유전자 서열의 검출, 확인 및 단리에 유용하다. 본 발명에서 사용되는 임의의 프로브는 임의의 "리포터 분자"로 표지되어, 이들로 제한되지는 않지만, 효소 (예를 들어, ELISA, 및 또한 효소-기재 조직화학적 분석), 형광, 방사성 및 발광 시스템을 비롯한 임의의 검출 시스템에서 검출가능할 것으로 고려된다. 본 발명은 임의의 특정 검출 시스템 또는 표지로 제한되는 것으로 의도되지 않는다.
"단리된 올리고뉴클레오티드" 또는 "단리된 폴리뉴클레오티드"에서 핵산과 관련하여 사용된 용어 "단리된"은 통상 그의 천연 공급원과 연관된 적어도 하나의 성분 또는 오염물로부터 확인 및 분리된 핵산 서열을 지칭한다. 단리된 핵산은 자연에서 발견되는 것과 상이한 형태 또는 설정으로 존재한다. 반대로, DNA 및 RNA와 같이 핵산으로서 비-단리된 핵산은 자연에서 존재하는 상태로 발견되었다. 예를 들어, 주어진 DNA 서열 (예를 들어, 유전자)은 이웃 유전자와 근접한 숙주 세포 염색체에서 발견되고; RNA 서열, 예컨대 특이적 단백질을 코딩하는 특이적 mRNA 서열은 다수의 단백질을 코딩하는 수많은 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 주어진 단백질을 코딩하는 단리된 핵산은, 예를 들어 통상 주어진 단백질을 발현하는 세포 내에서 천연 세포와 상이한 염색체 위치에 있는 핵산을 포함하거나, 또는 다르게는 자연에서 발견되는 것보다 상이한 핵산 서열에 의해 플랭킹된다. 단리된 핵산, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥 형태로 존재할 수 있다. 단리된 핵산, 올리고뉴클레오티드 또는 폴리뉴클레오티드를 사용하여 단백질을 발현하는 경우, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 최소한의 센스 또는 코딩 가닥을 함유할 것이지만 (즉, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 단일 가닥일 수 있음), 센스 및 안티센스 가닥 둘 다를 함유할 수도 있다 (즉, 올리고뉴클레오티드 또는 폴리뉴클레오티드는 이중 가닥일 수도 있음).
본원에서 사용되는 바와 같이, 용어 "정제된" 또는 "정제하기 위해"는 샘플로부터 성분 (예를 들어, 오염물)의 제거를 지칭한다. 예를 들어, 항체는 오염성 비-면역글로불린 단백질의 제거에 의해 정제되고; 이는 또한 표적 분자와 결합하지 않는 면역글로불린의 제거에 의해 정제된다. 비-면역글로불린 단백질의 제거 및/또는 표적 분자와 결합하지 않는 면역글로불린의 제거는 샘플 내 표적-반응성 면역글로불린의 백분율을 증가시킨다. 또 다른 예에서, 재조합 폴리펩티드는 세균 숙주 세포에서 발현되고, 폴리펩티드는 숙주 세포 단백질의 제거에 의해 정제되며; 이에 의해 재조합 폴리펩티드의 백분율이 샘플 내에서 증가한다.
발명의 상세한 설명
본 발명은 전립선암에서 반복적인 유전자 융합체의 발견에 기초한다. 본 발명은 유전자 융합체를 직접 또는 간접적으로 검출하거나 표적화하는 진단, 연구 및 치료 방법을 제공한다. 본 발명은 또한 진단, 연구 및 치료 목적을 위한 조성물을 제공한다.
I. 유전자 융합체
본 발명은 전립선암을 나타내는 반복적인 유전자 융합체를 확인한다. 유전자 융합체는 안드로겐 조절된 유전자 (ARG) 또는 하우스키핑 유전자 (HG) 및 ETS 부류 구성원 유전자의 염색체 재배열의 결과이다. 그들의 반복성에도 불구하고, ETS 부류 구성원 유전자와 융합한 ARG 또는 HG의 접합부는 다양하다. 유전자 융합체는 일반적으로 ARG 또는 HG의 전사 조절 영역으로부터 5' 부분 및 ETS 부류 구성원 유전자로부터 3' 부분을 포함한다. 반복적인 유전자 융합체는 전립선암의 진단 마커 및 임상적 표적으로서의 용도를 갖는다.
A. 안드로겐 조절된 유전자
안드로겐 호르몬에 의해 조절된 유전자는 인간 전립선의 정상적인 생리학적 기능에 있어서 결정적으로 중요하다. 이들은 또한 전립선 암종의 발생 및 진행에 기여한다. 인식된 ARG로는, 이에 제한되지는 않지만, TMPRSS2; SLC45A3; HER V-K_22q11.23; C15ORF21; FLJ35294; CANT1; PSA; PSMA; KLK2; SNRK; 셀라딘(Seladin)-1; 및 FKBP51 (문헌 [Paoloni-Giacobino et al., Genomics 44: 309 (1997)], [Velasco et al., Endocrinology 145(8): 3913 (2004)])을 들 수 있다.
TMPRSS2 (NM_005656)는 다른 일반적인 인간 조직에 비해 전립선 상피에서 고도로 발현되는 것으로 입증된 바 있다 (문헌 [Lin et al., Cancer Research 59: 4180 (1999)]). TMPRSS2 유전자는 염색체 21 상에 위치한다. 상기 유전자는 pter로부터 41,750,797 - 41,801,948 bp에 위치한다 (총 bp 51,151개; (-) 가닥 방향). 인간 TMPRSS2 단백질 서열은 진뱅크 (GenBank) 기탁 번호 AAC51784 (스위스 (Swiss) 단백질 기탁 번호 O15393)에서 찾아볼 수 있고, 상응하는 cDNA는 진뱅크 기탁 번호 U75329에서 찾아볼 수 있다 (또한, 문헌 [Paoloni-Giacobino, et al., Genomics 44: 309 (1997)] 참조).
프로스테인 또는 P501S로도 공지된 SLC45A3은 전사체 및 단백질 수준 둘 다 정상적인 전립선 및 전립선암에서 독점적으로 발현되는 것으로 밝혀졌다 (문헌 [Kalos et al., Prostate 60, 246-56 (2004)], [Xu et al., Cancer Res 61, 1563-8 (2001)]).
HERV-K_22q11.23은 EST 분석 및 대규모 병렬 서열분석에 의해 인간 내인성 레트로바이러스 요소의 HERV-K 부류의 두번째로 가장 강하게 발현된 구성원인 것으로 밝혀졌으며, 다른 일반적인 조직에 비해 전립선에서 가장 고도로 발현되었다 (문헌 [Stauffer et al., Cancer Immun 4, 2 (2004)]). HERV-K 요소의 안드로겐 조절은 설명되지 않았지만, 내인성 레트로바이러스 요소는 마우스 성-연관 단백질 유전자 C4A에 안드로겐 반응성을 제공하는 것으로 밝혀진 바 있다 (문헌 [Stavenhagen et al., Cell 55, 247-54 (1988)]). 다른 HERV-K 부류 구성원은 유방암 및 유방암 세포주에서 고도로 발현되면서 에스트로겐-조절되는 것으로 밝혀진 바 있으며 (문헌 [Ono et al., J Virol 61, 2059-62 (1987)], [Patience et al., J Virol 70, 2654-7 (1996)], [Wang-Johanning et al., Oncogene 22, 1528-35 (2003)]), 및 염색체 19 상의 HERV-K3 요소로부터의 서열은 줄기 세포 골수증식성 장애의 경우에 FGFR1과 융합한 t(8;19)(p12;q13.3)이었다 (문헌 [Guasch et al., Blood 101, 286-8 (2003)]).
D-PCA-2로도 공지된 C15ORF21은 정상적인 전립선 및 전립선암에서의 그의 독점적인 과다발현에 기초하여 최초로 단리되었다 (문헌 [Weigle et al., Int J Cancer 109, 882-92 (2004)]).
FLJ35294는 서열분석된 인간 cDNA의 "FLJ (full-length long Japan)" 수집의 구성원으로 확인되었다 (문헌 [Nat Genet. 2004 Jan;36(1):40-5. Epub 2003 Dec 21]).
sSCAN1로도 공지된 CANT1은 가용성 칼슘-활성화된 뉴클레오티다제이다 (문헌 [Arch Biochem Biophys. 2002 Oct 1;406(1): 105-15)]. CANT1은 371개의 아미노산 단백질이다. 절단가능한 신호 펩티드는 37,193 Da의 예측된 코어(core) 분자 질량을 갖는 333개 잔기의 분비형 단백질을 생성한다. 노던 분석은 고환, 태반, 전립선 및 폐를 비롯한 인간 조직의 범위에서 전사체를 확인하였다. 전통적인 아피라제-보존된 영역 또는 뉴클레오티드-결합 도메인은 상기 인간 효소에서 확인되지 않았고, 이는 새로운 부류의 세포외 뉴클레오티다제의 구성원임을 나타낸다.
본 발명의 유전자 융합체는 ARG의 전사 조절 영역을 포함할 수 있다. ARG의 전사 조절 영역은 프로모터 영역을 포함한 ARG의 코딩 또는 비-코딩 영역을 함유할 수 있다. ARG의 프로모터 영역은 ARG의 안드로겐 반응 요소 (ARE)를 추가로 포함할 수 있다. TMPRSS2에 대한 프로모터 영역은 특히 진뱅크 관리 번호 AJ276404로 제공된다.
B. 하우스키핑 유전자
하우스키핑 유전자는 구성적으로 발현되며, 일반적으로 모든 조직의 도처에서 발현된다. 이들 유전자는 모든 세포가 생존하는 데 필요한 기본적인 필수 기능을 제공하는 단백질을 코딩한다. 하우스키핑 유전자는 통상 모든 세포 및 조직에서 동일한 수준으로 발현되지만, 특히 세포 성장 및 유기체 발생 중에는 일부 변동된다. 인간 세포가 얼마나 많은 하우스키핑 유전자를 갖는지는 정확히 알려지지 않았지만, 300-500개의 범위로 대체로 추정된다.
수백 개의 하우스키핑 유전자의 대다수는 확인되었다. 가장 일반적으로 알려진 유전자인 GAPDH (글리세르알데히드-3-포스페이트 데히드로게나제)는 당분해 경로에 매우 중요한 효소를 코딩한다. 또 다른 중요한 하우스키핑 유전자는 알부민이며, 이는 전신에 화합물을 수송하는 것을 돕는다. 몇몇의 하우스키핑 유전자는 세포골격을 구성하는 구조적 단백질, 예컨대 베타-액틴 및 튜불린을 코딩한다. 다른 하우스키핑 유전자는 리보솜의 18S 또는 28S rRNA 서브유닛을 코딩한다. HNRPA2B1은 도처에서 발현되는 헤테로핵성 리보핵 단백질의 구성원이다. 그의 프로모터는 비-메틸화된 것으로 밝혀졌고, 트랜스진에서의 CMV 프로모터의 전사 침묵화를 예방한다 (문헌 [Williams et al., BMC Biotechnol 5, 17 (2005)]). 하우스키핑 유전자의 예시적인 목록은, 예를 들어 문헌 [Trends in Genetics, 19, 362-365 (2003)]에서 찾아볼 수 있다.
C. ETS 부류 구성원 유전자
ETS 부류의 전사 인자는 유전자 발현을 제어하는 세포내 신호전달 경로를 조절한다. 하류 효과기로서 이들은 특이적 표적 유전자를 활성화하거나 저해한다. 상류 효과기로서 이들은 수많은 성장 인자 수용체의 공간적 및 시간적 발현을 유발한다. 거의 30종의 상기 부류의 구성원이 확인되었고, 이는 광범위한 범위의 생리학적 및 병리학적 과정에서 관련된다. 이들로는, 이에 제한되지는 않지만, ERG; ETV1 (ER81); FLIl; ETS1; ETS2; ELK1; ETV6 (TEL1); ETV7 (TEL2); GABPα; ELF1; ETV4 (E1AF; PEA3); ETV5 (ERM); ERF; PEA3/E1AF; PU.1; ESE1/ESX; SAP1 (ELK4); ETV3 (METS); EWS/FLI1; ESE1; ESE2 (ELF5); ESE3; PDEF; NET (ELK3; SAP2); NERF (ELF2); 및 FEV를 들 수 있다. 예시적인 ETS 부류 구성원 서열은 도 9에 제시되어 있다.
ERG (NM 004449)는 다른 일반적인 인간 조직에 비해 전립선 상피에서 고도로 발현되는 것으로 입증된 바 있다. ERG 유전자는 염색체 21 상에 위치한다. 상기 유전자는 pter로부터 38,675,671-38,955,488 염기쌍에 위치한다. ERG 유전자는 총 bp 279,817개의 (-) 가닥 방향이다. 상응하는 ERG cDNA 및 단백질 서열은 각각 진뱅크 관리 번호 M17254 및 NP04440 (스위스 단백질 관리 번호 P11308)으로 제공된다.
ETV1 유전자는 염색체 7 상에 위치한다 (진뱅크 관리 번호 NC_000007.11; NC_086703.11; 및 NT_007819.15). 상기 유전자는 pter로부터 13,708,330 - 13,803,555 염기쌍에 위치한다. ETV1 유전자는 총 bp 95,225개의 (-) 가닥 방향이다. 상응하는 ETV1 cDNA 및 단백질 서열은 각각 진뱅크 관리 번호 NM_004956 및 NP_004947 (스위스 단백질 관리 번호 P50549)로 제공된다.
인간 ETV4 유전자는 염색체 14 상에 위치한다 (진뱅크 관리 번호 NC_000017.9; NT_010783.14; 및 NT_086880.1). 상기 유전자는 pter로부터 38,960,740 - 38,979,228 염기쌍에 위치한다. ETV4 유전자는 총 bp 18,488개의 (-) 가닥 방향이다. 상응하는 ETV4 cDNA 및 단백질 서열은 각각 진뱅크 관리 번호 NM_001986 및 NP_01977 (스위스 단백질 관리 번호 P43268)로 제공된다.
인간 ETV5 유전자는 3q28에서 염색체 3 상에 위치한다 (NC_000003.10 (187309570..187246803). 상응하는 ETV5 mRNA 및 단백질 서열은 각각 진뱅크 관리 번호 NM_004454 및 CAG33048로 제공된다.
D. ETS 유전자 융합체
TMPRSS2:ETS 유전자 융합체의 최초 확인을 포함하여, 전립선암에서 5가지 클래스의 ETS 재배열이 확인되었다 (도 43). 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해는 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, ARG 또는 HG와의 융합, 또는 암에서 증가된 발현을 갖는 유전자좌로의 삽입을 통한 ETS 부류 구성원의 상향조절된 발현은 전립선암에 대한 메카니즘을 제공하는 것으로 고려된다. 특정 개체에 존재하는 재배열 클래스에 대한 지식은 주문제작된 암 요법을 가능하게 한다.
1. 유전자 재배열의 클래스
TMPRSS2:ETS 유전자 융합체 (클래스 I)는 전립선암에서의 ETS 재배열의 주요 클래스를 나타낸다. 다른 전립선-특이적 안드로겐-유도 유전자 (클래스 IIa) 및 내인성 레트로바이러스 요소 (클래스 IIb) (예컨대, 각각 SLC45A3 및 HERV-K_22q11.23)로부터의 비번역 영역과의 융합을 포함한 재배열은 ETS 재배열에서의 TMRPSS2와 유사하게 기능한다. 클래스 I 및 II 재배열에서 5' 파트너와 유사하게, C15ORF21은 전립선암에서 현저하게 과다발현된다. 그러나, 클래스 I 및 II 재배열에서의 융합 파트너와 달리, C15ORF21은 안드로겐에 의해 저해되고, 이는 전립선-특이적 안드로겐-저해된 5' 융합 파트너를 포함한 ETS 재배열의 신규한 클래스 (클래스 III)를 나타낸다. 대조적으로, HNRPA2B1은 전립선-특이적 발현 또는 안드로겐-반응성을 나타내지 않았다. 따라서, HNRPA2B1:ETV1은 비-조직 특이적 프로모터 요소를 포함한 융합체가 ETS 발현을 유발하는 ETS 재배열의 신규한 클래스 (클래스 IV)를 나타낸다. 클래스 V 재배열에서, 전체 ETS 유전자는 전립선-특이적 영역에 대해 재배열된다.
진행성 전립선암을 가진 남성은 통상 안드로겐-고갈 요법으로 치료되어, 대체로 종양 퇴행이 일어난다. 그러나, 상기 암은 거의 변함없이 호르몬-불응성 표현형과 함께 진행된다. 클래스 IV 재배열 (예를 들어, HNRPA2B1:ETV1)이 안드로겐 비-감수성 프로모터 요소에 의해 구동되므로, 이들 유전자 융합체는 안드로겐-고갈에 대해 반응성이 아닐 것이며, 따라서 이들 환자는 항-안드로겐 치료에 반응하지 않을 수 있다는 결과가 나타났다. 클래스 III 재배열을 갖는 환자의 항-안드로겐 치료는 ETS 융합 발현을 증가시킬 수 있다. 예를 들어, C15ORF21:ETV1은 항-안드로겐 치료가 C15ORF21:ETV1 발현을 증가시키는 호르몬-불응성 전이성 전립선암을 가진 환자로부터 단리되었다. 이러한 가설을 지지하는 것으로서, LNCaP의 안드로겐 고갈은 내인성 PSA 및 TMPRSS2의 발현을 유의하게 감소시켰고, HNRPA2B1에 영향을 미치지 않았으며, C15ORF21의 발현을 증가시켰다 (도 49). 이는 존재하는 융합의 클래스에 기초하여 전립선암을 가진 남성의 주문제작된 치료 (예를 들어, 안드로겐 차단 요법 또는 다른 대안적인 요법의 선택)를 가능하게 한다.
전립선암에서의 유전자 배열의 여러 클래스는 일반적인 상피암에서의 염색체 재배열에 대해 보다 일반화된 역할을 나타낸다. 예를 들어, 조직 특이적 프로모터 요소는 다른 호르몬 유발된 암에서의 종양유전자와 융합될 수 있고, 예를 들어 에스트로겐 반응 요소는 유방암에서의 종양유전자와 융합될 수 있다. 추가로, 전립선 특이적 융합체 (클래스 I-III, V)는 다른 상피암에서 성장 이점을 제공하거나 선택될 수는 없지만, 도처에서 발현되는 유전자 (예컨대, HNRPA2B1)의 강력한 프로모터를 포함한 융합체는 모든 종양 유형에 걸쳐 종양유전자의 이상 발현을 유발한다. 요약하면, 상기 연구는 혈액학적 악성종양과 유사한, 다양한 메카니즘을 통해 일반적인 상피 종양 발생에서의 염색체 재배열에 대한 역할을 지지한다.
2. ARG / ETS 유전자 융합체
상기한 바와 같이, 본 발명은 ARG와 ETS 부류 구성원 유전자의 융합체를 제공한다. 예시적인 유전자 융합체 서열은 도 36, 51 및 52에 제시되어 있다. TMPRSS2, ERG, ETV1 및 ETV4의 경우, 진뱅크 참조 서열 ID가 제공되며, 엑손은 UCSC 인간 게놈의 2004년 5월 어셈블리를 이용하여 정렬된다. 모든 확인된 융합체의 경우, 도 36이 TMPRSS2 유전자의 시작에서 융합체를 통해 ETS 부류 구성원 유전자의 정지 코돈까지의 완전한 서열을 제공한다. 공개된 변이체 각각에 대해 기탁된 진뱅크 서열이 또한 제공된다. 일부 TMPRSS2:ERG 및 TMPRSS2:ETV1 융합체는 TMPRSS2 및 ETS 부류 구성원 유전자의 중지점 엑손으로 기재된다. 예를 들어, TMPRSS2의 엑손 1을 ERG의 11을 통해 엑손 4에 융합한 TMPRSS2:ERGa는 TMPRSS2:ERG(1,4)로 식별된다.
특정 유전자 융합체는 전립선암에서 다른 것들보다 일반적이다. 본 발명은 전립선암의 50-80%가 TMPRSS2와 ERG, ETV1, ETV4 또는 FLI1의 반복적인 유전자 융합체를 갖는 것으로 확인한다. 이들 중 50-70%는 TMPRSS2-ERG이고 (이의 50%-60%는 염색체 21 상에서 TMPRSS2 및 ERG 유전자좌 사이의 유전 정보의 결실로 인한 것임 (아래에 보다 상세하게 기재됨)), 5-10%는 TMPRSS2-ETV1이고, 1-2%는 TMPRSS2-ETV4이며, 1-2%는 TMPRSS2-FLI1이다.
본 발명의 개발 과정 중에 수행된 실험은, 특정 융합 유전자가 융합 전사체를 발현하지만 나머지는 기능적 전사체를 발현하지 못한다는 것을 나타내었다 (문헌 [Tomlins et al., Science, 310: 644-648 (2005)], [Tomlins et al., Cancer Research 66: 3396-3400 (2006)]).
a. ERG 유전자 융합체
상기한 바와 같이, ERG를 포함한 유전자 융합체는 전립선암에서 가장 보편적인 유전자 융합체인 것으로 밝혀졌다. 본 발명의 개발 중에 수행된 실험은 염색체 21q22.2-3 상에서 TMPRSS2ERG 사이에 위치한 유의한 게놈 결실을 확인하였다. 결실은 TMPRSS2 : ERG 융합체 양성 PCA 샘플에서 나타났다. 상기 결실은 컨세서스 구역에서 나타나지만, 이 영역 내에서 가변성을 보인다. 패리스 (Paris) 등에 의해 먼저 공개된 연구 (문헌 [Hum. Mol. Genet. 13:1303-13 (2004)])에서, CGH 분석은 TMPRSS2로부터 6 kb 중심절인 CTD-210307 BAC에서의 결실을 검출하였다. 이들 결실은 임상적 국소 PCA 샘플의 12.5% (9/72) 및 전이성 PCA 샘플의 33% (5/15)에서 관찰되었다. 이들 결과는 현재 연구의 SNP 어레이 데이터를 지지하고, PCA 결실이 진행과 함께 보다 일반적인 것이 되거나 또는 상기 결실이 보다 급속하게 진행하는 경향이 있는 PCA에서 보다 자주 확인된다는 것을 나타낸다. TMPRSS2:ERG 재배열의 현저한 종양내 균질성을 고려하면, 이들 분자 하위-유형이 다양한 질환 진행 특징과 연관될 가능성이 높다.
ERG의 49.2% 잠복 (harboring) 재배열을 갖는 118개의 임상적 국소 PCA 사례를 평가하였다. 인트론 결실이 이들 TMPRSS2:ERG 융합체 양성 사례의 60.3%에서 관찰되었다. ERG의 현저한 과다발현을 갖는 거의 모든 PCA 샘플은 재배열을 갖고, 상기 과다발현은 재배열과 대략 동일한 수의 사례에서 일어난다. 온코민, 즉 공개적으로 이용가능한 유전자 발현 데이터의 일람표를 이용하여, 공통의 결실 부위의 구역에 위치한 유의하게 하향 조절된 4개의 유전자를 확인하였다 (도 16).
본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해는 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, 상기 결과는 전체 PCA의 거의 절반이 TMPRSS2:ERG 재배열에 의해 규정될 수 있음을 시사한다. 이들 종양의 대부분은 인트론 결실을 입증하며, 올리고뉴클레오티드 SNP 어레이 게놈 분석에 따라 그 크기는 가변적이다. 그러나, 약 30-40%는 결실을 입증하지 못하였고, 따라서 TMRPSS2 및 ERG의 균형잡힌 전좌를 잠복시킬 수 있다. 결실의 정도에 있어서의 상기 가변성은 CML에서 관찰되는 바와 같이 질환 진행과 연관될 수 있다. 현재 연구는 종양 단계 및 림프절 상태와의 유의한 임상적 연관성을 확인하였다. 결실이 있는 TMPRSS2:ERG 재배열된 종양은 또한 PSA 생화학적 실패의 보다 높은 비율로의 경향을 나타내었다.
본 발명의 개발 과정 중에 수행된 추가의 실험은, 장기간의 추적 치료를 갖는 초기 전립선암의 주의 깊은 대기 코호트에서의 TMPRSS2:ERG 유전자 융합체의 존재에 기초하여 전이 또는 전립선암 특이적 사멸의 발생 위험성을 조사하였다. TMPRSS2:ERG 유전자 융합체의 빈도는 92가지의 사례를 이용하여 평가하였다. 상기 집단-기재 코호트 내 TMPRSS2:ERG 유전자 융합체의 빈도는 15.2% (14/92)였고, 이는 2개의 병원-기재 코호트에서 관찰된 50% 빈도보다 낮았다. 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해는 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, TMPRSS2:ERG 유전자 융합체 전립선암에서의 상기 차이는 민족 및 인종 유전차 차이에 기인할 수 있다. 이들 차이는 또한 다른 비-집단 기재 연구와 비교하여 상기 주의 깊은 대기 코호트에서의 고 악성도 사례의 보다 낮은 백분율에 의해 설명될 수 있다.
TMPRSS2:ERG 유전자 융합체와 원격 전이 및 전립선암 특이적 사멸의 발생 사이의 유의한 연관성은 3.6의 누적 발생빈도 비 (P = .004, 95% 신뢰 구간 = 1.5 내지 8.9)로 관찰되었다. 이들 데이터는 TMPRSS2:ERG 유전자 융합체 전립선암이 보다 공격적인 표현형을 갖는다는 것을 시사한다. 추가 실험은 TMPRSS2:ERG 유전자 융합체에서의 게놈 결실이 진행성 및/또는 전이성 전립선암과 상관관계가 있다는 것을 나타내었다 (예를 들어, 실시예 5 참조).
본 발명은 또한 안드로겐이 TMPRSS2-ERG-양성 세포주에서 예상컨대 ARE를 통해 ERG의 과다발현을 유도할 수 있다는 것을 입증한다. 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해는 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, 집합적으로, 상기 결과는 TMPRSS2의 ARE 상류를 통한 ETS 부류 활성의 조절이상이 전립선암 발생을 일으킬 수 있다는 것을 시사한다.
b. ETV1 유전자 융합체
본 발명의 일부 실시양태의 개발 과정 중에 수행된 추가 연구는 ETV1 이상점 발현의 빈도와 TMPRSS2:ETV1 양성 전립선암 사이의 불일치를 조사하였다. 그 결과는, 전립선암에서 ERG 과다발현을 유발하는 주요 메카니즘으로서 TMPRSS2:ERG 유전자 융합체를 확인한 선행 연구를 확실히 하였다. 그러나, ETV1을 과다발현하는 3개의 전립선암에서, 신규한 5' 융합 파트너가 확인되었다. 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해가 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, ERG 및 ETV1을 포함한 융합체에 대한 5' 파트너에서의 상기 불일치의 이유는 명확하지 않지만, TMPRSS2 및 ERG가 염색체 21 상에서 대략 3 MB 떨어져 위치하므로, 이들의 근접성은 ERG에 대한 5' 파트너로서 TMPRSS2를 장려할 수 있다.
트랜스제닉 마우스에서 안드로겐 조절 하의 ETV1의 과다발현은 마우스 전립선에서 고도로 침투한 mPIN (9/12, 75%)을 유발한다. 암종의 발생은 관찰되지 않았다. 이들 결과는 ETV1 과다발현이 양성 전립선 상피 세포에서의 침윤을 증가시키지만, 형질전환에 대해서는 충분하지 않았다는 시험관내 연구, 및 인간에서 ETS 융합체가 PIN의 암종 전이 동안 또는 전립선암 진행 초기에 발생할 가능성이 있다는 것을 나타내는 선행 연구 (문헌 [Tomlins et al., Nat Genet 39, 41-51 (2007)])를 지지한다. 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 메카니즘의 이해는 본 발명을 실시하는 데 필수적이지 않다. 그럼에도 불구하고, 인간 전립선암 발병에서, ETS 유전자 융합체가 보다 초기의 병변, 예컨대 단일 NKX3-1 및/또는 PTEN 대립유전자의 상실과 관련하여 발생한다는 것이 고려된다 (문헌 [Tomlins et al., Annual Review of Pathology: Mechanisms of Disease 1, 243-271 (2006)]). 또한, 암종으로의 초기 진행이 없는 ETV1 트랜스제닉 마우스에서의 mPIN의 발생은 인간 전립선암에서의 이러한 다른 초기 사건의 마우스 모델, 예컨대 NKX3-1+/- 및 PTEN+/- 마우스와 유사하다 (문헌 [Kim et al., Proc Natl Acad Sci U S A 99, 2884-9 (2002)], [Abdulkadir et al., Mol Cell Biol 22, 1495-503 (2002)], [Di Cristofano et al., Nat Genet 27, 222-4 (2001)]). 따라서, ARR2Pb-ETV1 마우스와 상기 마우스 사이의 이종 교배는 인간 전립선암 발생에서의 초기 사건을 모방한 종양유전자/종양 서프레서 모델을 생산할 것으로 고려된다.
RWPE-ETV1에서 ETV1에 의해 조절된 전사 프로그램을 확인하기 위해서, 발현 시그너쳐를 분자 컨셉 맵 (Molecular Concepts Map), 즉 분자 컨셉의 성장 수집 중 상호관계의 네트워크를 조사하기 위한 분석 프레임워크, 또는 생물학상 관련 유전자 세트에 로딩하였다. MCM은 연관성 분석을 위한 유전자 세트 중 가장 큰 수집일 뿐만 아니라, 데이터베이스 내 모든 유전자 세트 중 쌍별 (pair-wise) 연관성을 계산하여 연결된 컨셉의 "풍부화 네트워크"의 확인 및 시각화를 가능하게 하는 데 있어서 유일하다.
상기 분석은, ETV1 이상점-발현을 갖는 전립선암 대 ETS 유전자의 이상점 발현이 없는 암에서 과다발현된 유전자의 생체내 시그너쳐가 RWPE-ETV1 세포에서 과다발현된 유전자의 시험관내 시그너쳐에서 풍부화되었음 (P = 0.003)을 나타내었고 (도 41f), 이는 시험관내 모델의 생물학적 관련성을 지지한다. 보다 일반적으로, MCM 분석은, 상기 보고서에 기재된 표현형 효과와 일치하는, ETV1 과다발현된 시그너쳐에서 풍부화된 세포 침윤과 관련된 분자 컨셉의 네트워크를 확인하였다. 예를 들어, 상기 시그너쳐는 침윤성 대 표재성 이행 세포 방광암에서 과다발현된 유전자 (문헌 [Modlich et al]. P = 2.9E-14, [Dyrskjot et al.] P = 1.2E-8) 및 침윤성 유방 유관 암종 대 유관 상피내암종에서 과다발현된 유전자 (문헌 [Schuetz et al.] P = 3.8E-13)를 나타내는 컨셉을 이용하여 풍부화를 공유하였다. 보다 직접적으로, 상기 시그너쳐는 "펩티다제 M10A 및 M12B, 매트릭신 또는 아다말리신 도메인"을 함유한 단백질의 인터프로(InterPro) 컨셉을 이용하여 풍부화 (P = 8.5E-5)를 공유하였고, 이는 매트릭스 메탈로프로테이나제 (MMP) 및 디스인테그린 및 메탈로프로테이나제 도메인 (ADAM)을 포함한다.
유로키나제 플라스미노겐 활성자 경로의 몇몇 MMP 및 구성원 (이들 둘 다 침윤을 매개하는 것으로 공지되어 있고, ETS 전사 인자의 직접적인 표적인 것으로 보고됨)은 RWPE-ETV1 세포에서 과다발현되었다 (도 41g). 또한, 'RWPE-ETV1에서 과다발현된' 시그너쳐는 STAT3-C 종양유전자를 과다발현하는 MCF-10A 세포에서 과다발현된 유전자의 시그너쳐와의 오버래핑을 공유하였다 (P = 8.9E-14). 상기 모델에서, STAT3-C 과다발현은 증식에 영향을 미치지 않았지만, MMP9 의존적 방식에서 침윤을 증가시켰다. 상기 결과는 또한 유잉 육종에서의 EWSR1:ETS 유전자 융합체의 연구와 유사하며, 이는 EWS:FLI1의 녹다운 또는 과다발현이 침윤에는 영향을 미치지만, 증식에는 영향을 미치지 않았음을 입증하였다 (문헌 [Smith et al., Cancer Cell 9, 405-16 (2006)]). RWPE-ETV1에서 하향발현된 시그너쳐의 MCM 분석은 증식 관련 컨셉을 이용하여 풍부화를 나타내었고 (도 50), 이는 FACS 또는 증식 검정에서 명백하지 않은 세포성 증식에 대해 미세한 효과를 나타낸다.
본 연구는 또한 세포유전자 연구를 설명하는 데 있어서 이상점 유전자 발현의 사용의 유용성을 입증한다. 예를 들어, 수많은 핵형결정, SKY 및 고해상 어레이 CGH 연구에도 불구하고, 애매한 ETV1 재배열이 LNCaP에서 보고된 바 있고 (문헌 [Beheshti et al., Mol Diagn 5, 23-32 (2000)], [Beheshti et al., Neoplasia 3, 62-9 (2001)], [Gibas et al., Cancer Genet Cytogenet 11, 399-404 (1984)], [Watson et al., Hum Genet 120, 795-805 (2007)], [Pang et al., Prostate 66, 157-72 (2006)], [Murillo et al., Genes Chromosomes Cancer 45, 702-16 (2006)], [Shi et al., Prostate 60, 257-71 (2004)], [Takaha et al., Cancer Res 62, 647-51 (2002)], [Strefford et al., Cancer Genet Cytogenet 124, 112-21 (2001)], [Thalmann et al., Cancer Res 54, 2577-81 (1994)]), 가장 일반적으로는 전립선암의 시험관내 모델이 사용된다. 유사하게, TMPRSS2:ERG 융합체는 21q 상에서 TMPRSS2 및 ERG 사이의 염색체내 결실에 의해 종종 유발되고, 이는 핵형결정에 의해 검출될 수 없다. 마찬가지로, 여기에서 확인된 HNRPA2B1:ETV1 융합체는 또한 약 15 MB에 걸치는 염색체내 결실을 통해 일어난다. 이들 결과는 종양유전자를 활성화하는 미세한 재배열 및 염색체내 결실이 다른 일반적인 상피 암종에서 일어날 수 있음을 나타낸다.
c. ETV4 유전자 융합체
온코민 데이터베이스로부터의 전립선암 프로파일링 연구에서 모니터링된 모든 ETS 부류 구성원의 발현을 조사하는 실험을 수행하였다 (상기 [Rhodes et al.] 참조). 2개의 연구, 즉 육안 박리된 조직을 프로파일링하는 한 연구 (상기 [Lapointe et al.] 참조) (도 7A) 및 레이저 포획 미세박리된 (LCM) 조직 1을 프로파일링하는 다른 연구 (도 7B) 각각으로부터의 단일 전립선암 사례에서 ETS 부류 구성원 ETV4의 마크된 과다발현을 확인하였다. ETV4는 암성 조직에서 TMPRSS2에 융합되는 것으로 밝혀졌다.
d. ETV5 유전자 융합체
추가의 실험으로 TMPRSS2:ETV5 및 SLC45A3:ETV5 유전자 융합체를 확인하였다 (실시예 20). ETV5는 전립선암 샘플에서 이상점 발현을 갖는 것으로 밝혀졌고, 이후 유전자 융합체에 존재하는 것으로 밝혀졌다.
3. HG / ETS 유전자 융합체
추가의 실험으로 전립선암에서 HNRPA2B1:ETV1 유전자 융합체를 확인하였다. HNRPA2B1은 전립선-특이적 발현 또는 안드로겐 조절을 나타내지 않았으며, 대신에 모든 종양 유형에 걸쳐 강하게 발현된다. HNRPA2B1은 도처에서 발현된 헤테로핵 리보핵 단백질의 구성원을 코딩하고, 그의 프로모터는 다른 하우스키핑 유전자와 구조적 유사성을 공유한다 (문헌 [Antoniou et al., Genomics 82, 269-79 (2003)] 참조). 또한, HNRPA2B1 프로모터는 비메틸화되어 이식유전자(transgene)에서 CMV 프로모터의 전사 침묵화를 방지하는 것으로 나타났다 (문헌 [Williams et al., BMC Biotechnol 5, 17 (2005)] 참조). 따라서, HNRPA2B1:ETV1은 비-조직 특이적 프로모터 요소가 종양유전자의 발현을 조종하는 통상적인 상피 암종에서의 신규 부류의 유전자 융합체를 나타낸다. TMPRSS2:ETS 융합체는 B 세포 악성종양에서 IGH-MYC 재배열에 기능적으로 유사한 반면, HNRPA2B1:ETV1은 급성 골수성 백혈병에서 inv(3)(q21q26) 및 t(3;3)(q21;q26)에 보다 유사하여, 구성적으로 발현된 RPN1 유전자의 인핸서 요소의 제어하에 EVI를 배치하는 것으로 생각된다 (문헌 [Suzukawa et al., Blood 84, 2681-8 (1994)], [Wieser et al., Leuk Lymphoma 43, 59-65 (2002)] 참조).
다른 통상적인 상피암은 조직 특이적 프로모터 요소, 예를 들어 유방암에서 종양유전자에 융합된 에스트로겐 반응 요소에 의해 조종되는 것으로 생각된다. 또한, 본원에서 확인된 전립선 특이적 융합체 (예를 들어, SLC45A3:ETV1)는 다른 상피암에서 성장 이점을 제공하지 않을 것이지만, 도처에서 발현된 유전자의 강력한 프로모터를 포함하는 융합체, 예를 들어 HNRPA2B1은 종양 유형에 걸쳐 종양유전자의 이상 발현을 초래할 수 있다. 본원에서 확인된 HNRPA2B1:ETV1 융합체는 약 15 MB에 걸치는 염색체내 결실을 통해 발생한다. 이들 결과는 종양유전자를 활성화시키는 숨은 재배열 및 염색체내 결실이 다른 통상적인 상피 암종에서 발생할 수 있음을 나타낸다.
II . 항체
본 발명의 유전자 융합체 단백질 (그의 단편, 유도체 및 유사체 포함)은 하기 기재된 진단, 연구 및 치료 방법에서의 용도를 갖는 항체를 생성하기 위한 면역원으로서 사용될 수 있다. 항체는 폴리클로날 또는 모노클로날, 키메라, 인간화, 단일 사슬 또는 Fab 단편일 수 있다. 당업자에게 공지된 다양한 절차가 상기 항체 및 단편의 생산 및 표지에 사용될 수 있다. 예를 들어, 문헌 [Burns, ed., Immunochemical Protocols, 3rd ed., Humana Press (2005)], [Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory (1988)], [Kozbor et al., Immunology Today 4: 72 (1983)], [Koehler and Milstein, Nature 256: 495 (1975)] 참조. 말단절단된 ETS 부류 구성원 단백질 또는 키메라 단백질과 그의 각각의 천연 단백질 사이의 차이를 이용하는 항체 또는 단편이 특히 바람직하다.
III . 진단 용도
ETS 부류 구성원 유전자에 대한 ARG 또는 HG의 융합은 DNA, RNA 또는 단백질로서 검출가능하다. 먼저, 유전자 융합체는 ARG 또는 HG의 전사 조절 영역으로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 게놈 DNA의 염색체 재배열로서 검출가능하다. 전사되면, 유전자 융합체는 ARG 또는 HG의 전사 조절 영역으로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 키메라 mRNA로서 검출가능하다. 번역되면, 유전자 융합체는 ETS 부류 구성원 유전자에 대한 ARG 또는 HG의 전사 조절 영역의 융합으로부터 생성된 아미노-말단 절단된 ETS 부류 구성원 단백질; ARG 또는 HG의 전사 조절 영역으로부터의 아미노-말단 부분 및 ETS 부류 구성원 유전자로부터의 카르복시-말단 부분을 갖는 키메라 단백질; 또는 상향조절되지만 구별불가능한 천연 ETS 부류 구성원 단백질로서 검출가능하다. 말단절단된 ETS 부류 구성원 단백질 및 키메라 단백질은 그의 각각의 천연 단백질과 아미노산 서열, 번역후 처리 및/또는 2차, 3차 또는 4차 구조에 있어서 상이할 수 있다. 이러한 차이(존재한다면)는 유전자 융합체의 존재를 확인하는데 사용될 수 있다. 특이적인 검출 방법은 하기에 보다 상세하게 기재된다.
본 발명은 유전자 융합체를 직접 또는 간접적으로 검출하는 DNA, RNA 및 단백질 기재 진단 방법을 제공한다. 본 발명은 또한 진단 목적을 위한 조성물 및 키트를 제공한다.
본 발명의 진단 방법은 정성적 또는 정량적일 수 있다. 정량적 진단 방법은 예를 들어, 컷오프(cutoff) 또는 역치 수준을 통해 무통성 암과 공격적 암 사이를 구별하는데 사용될 수 있다. 적용가능한 경우, 정성적 또는 정량적 진단 방법은 또한 표적, 신호 또는 매개물 (예를 들어, 보편적인 프라이머)의 증폭을 포함할 수 있다.
초기 검정은 유전자 융합체의 존재를 확인할 수 있지만 특이적 융합체를 확인할 수 없다. 이어서, 2차 검정은 원하는 경우 특정 융합체의 동일성을 결정하기 위해 수행된다. 2차 검정은 초기 검정과 상이한 검출 기술을 사용할 수 있다.
본 발명의 유전자 융합체는 다중 또는 패널 포맷으로 다른 마커와 함께 검출될 수 있다. 마커는 단독으로 또는 유전자 융합체와 조합되어 그의 예상값에 대해 선택된다. 예시적인 전립선암 마커에는 AMACR/P504S (미국 특허 6,262,245); PCA3 (미국 특허 7,008,765); PCGEM1 (미국 특허 6,828,429); 프로스테인/P501S, P503S, P504S, P509S, P510S, 프로스타제/P703P, P710P (미국 특허 출원 공개 20030185830); 및 미국 특허 5,854,206 및 6,034,218, 및 미국 특허 출원 공개 20030175736에 개시된 것 (이들 문헌 각각은 그 전문이 본원에 참고로 포함됨)이 포함되나 이에 제한되지 않는다. 다른 암, 질환, 감염, 및 대사 상태에 대한 마커 또한 다중 패널 포맷에의 포함이 고려된다.
본 발명의 진단 방법은 또한 특정 유전자 융합체를 질환의 단계, 공격성 또는 진행이나 전이의 존재 또는 위험과 연관시키는 데이터를 참조하여 변형될 수 있다. 궁극적으로, 본 발명의 방법에 의해 제공되는 정보는 특정 환자에 대한 최상의 치료 과정을 선택하는데 있어서 의사를 보조할 것이다.
A. 샘플
유전자 융합체를 함유하는 것으로 의심되는 임의의 환자 샘플을 본 발명의 방법에 따라 시험할 수 있다. 비제한적인 예로서, 샘플은 조직 (예를 들어, 전립선 생검 샘플 또는 전립선절제술에 의해 얻은 조직 샘플), 혈액, 소변, 정액, 전립선 분비물 또는 이의 분획물 (예를 들어, 혈장, 혈청, 소변 상청액, 소변 세포 펠릿 또는 전립선 세포)일 수 있다. 소변 샘플은 바람직하게는, 전립선으로부터의 전립선 세포를 요로에 침투시키는 주의깊은 수지 직장 검사 (DRE) 직후에 수집한다.
환자 샘플은 일반적으로 유전자 융합체 또는 유전자 융합체를 함유하는 세포를 위해 샘플을 단리하거나 농축시키도록 디자인된 예비 프로세싱을 필요로 한다. 당업자에게 공지된 다양한 기술 (원심분리; 면역포획; 세포 용해; 및 핵산 표적 포획을 포함하나 이에 제한되지 않음)이 이러한 목적을 위해 사용될 수 있다 (예를 들어, 유럽 특허 1 409 727 (그 전문이 본원에 참고로 포함됨) 참조).
B. DNA RNA 검출
본 발명의 유전자 융합체는 당업자에게 공지된 다양한 핵산 기술 (핵산 서열결정; 핵산 혼성화; 및 핵산 증폭을 포함하나 이에 제한되지 않음)을 사용하여 게놈 DNA 또는 키메라 mRNA의 염색체 재배열로서 검출될 수 있다.
1. 서열결정
핵산 서열결정 기술의 예시적인 비제한적 예에는 사슬 종결자 (상거(Sanger)) 서열결정 및 염료 종결자 서열결정이 포함되나 이에 제한되지 않는다. 당업자는, RNA가 세포에서 덜 안정하며 뉴클레아제 공격에 보다 취약하기 때문에 실험적으로 RNA가 통상 서열결정 전 DNA로 역전사된다는 것을 인식할 것이다.
사슬 종결자 서열결정은 변형된 뉴클레오티드 기재를 사용하는 DNA 합성 반응의 서열-특이적 종결을 이용한다. 연장은 주형 DNA 위의 특정 부위에서, 상기 여역에서의 주형에 상보적인 짧은 방사성 표지 또는 다른 표지된 올리고뉴클레오티드를 사용하여 개시된다. 올리고뉴클레오티드 프라이머는 DNA 중합효소, 4개의 표준 데옥시뉴클레오티드 염기, 및 저농도의 한 사슬 종결 뉴클레오티드, 가장 통상적으로는 디-데옥시뉴클레오테드를 사용하여 연장된다. 상기 반응은 각각의 염기가 디-데옥시뉴클레오티드와 교대하는 4개의 별개 튜브에서 반복된다. DNA 중합 효소에 의한 사슬 종결 뉴클레오티드의 제한된 혼입은 특정 디-데옥시뉴클레오티드가 사용되는 위치에서만 종결되는 일련의 관련 DNA 단편을 생성한다. 각각의 반응 튜브의 경우, 단편은 슬랩 폴리아크릴아미드 겔 또는 점성 중합체로 충전된 모세관에서의 전기영동에 의해 크기-분리된다. 서열은, 겔의 상부에서 하부로 스캔할 때 레인이 표지된 프라이머로부터 시각화된 마크를 생성하는지를 판독함으로써 결정된다.
별법으로 염료 종결자 서열결정은 종결자를 표지한다. 각각의 디-데옥시뉴클레오티드 사슬-종결자를 상이한 파장에서 형광을 내는 별개의 형광 염료로 표지함으로써 완전한 서열결정이 단일 반응으로 수행될 수 있다.
2. 혼성화
핵산 혼성화 기술의 예시적인 비제한적 예에는 계내 혼성화 (ISH), 마이크로어레이, 및 서던 또는 노던 블롯이 포함되나 이에 제한되지 않는다.
계내 혼성화 (ISH)는 조직의 일부 또는 절편에 (계내), 또는 조직이 충분히 작다면 전체 조직에 (전체 탑재(whole mount) ISH) 특이적 DNA 또는 RNA 서열을 국지화시키는 프로브로서 표지된 상보적 DNA 또는 RNA 가닥을 사용하는 혼성화 유형이다. DNA ISH는 염색체의 구조를 결정하는데 사용될 수 있다. RNA ISH는 조직 절편 또는 전체 탑재물 내에 mRNA 및 다른 전사체를 측정하고 국지화시키는데 사용된다. 샘플 세포 및 조직은 대체로 표적 전사체를 제자리에 고정시켜 프로브의 접근성을 증가시키도록 처리된다. 프로브는 승온에서 표적 서열에 혼성화된 다음, 과량의 프로브는 세척 제거된다. 방사성-, 형광- 또는 항원-표지된 염기로 표지된 프로브는 자가방사법, 형광 현미경 또는 면역조직화학 각각을 사용하여 조직에 국지화되고 정량화된다. ISH는 또한 방사성 표지 또는 다른 비-방사성 표지로 표지된 2개 이상의 프로브를 사용하여 동시에 2개 이상의 전사체를 검출할 수 있다.
a. FISH
일부 실시양태에서, 융합체 서열은 형광 계내 혼성화 (FISH)를 사용하여 검출된다. 본 발명에 바람직한 FISH 검정은 세균 인공 염색체 (BAC)를 이용한다. 이들은 인간 게놈 서열결정 프로젝트에 광범위하게 사용되어 왔고 (문헌 [Nature 409: 953-958 (2001)] 참조), 특이적 BAC를 함유하는 클론은 많은 공급자, 예를 들어 NCBI에 위치할 수 있는 분배자를 통해 이용가능하다. 인간 게놈으로부터의 각각의 BAC 클론은 그를 명백하게 확인시켜주는 참조 명칭이 제공된다. 이들 명칭은 상응하는 진뱅크 서열을 발견하고 분배자로부터 클론의 카피를 주문하는데 사용될 수 있다.
일부 실시양태에서, 검출 검정은 ETV1에 대한 프로브 (예를 들어, bac RP11-692L4), c-ERG:t-ERG 분리에 대한 프로브 세트 (예를 들어, bac RP11-24A11 및 t-ERG에 대한 프로브로서 RP11-372O17 또는 RP11-137J13)를 이용하는 FISH 검정이다. 다른 실시양태에서, FISH 검정은 하나의 프로브 (예를 들어, bac RP11-692L4)가 ETV1 좌위에 걸쳐지고 다른 프로브 (예를 들어, 염색체의 동원체 상의 프로브)가 염색체 7에 혼성화되는 프로브 세트를 이용하여 ETV1 결실 또는 증폭을 시험함으로써 수행된다. 또다른 추가의 실시양태에서, 상기 방법은 ERG 좌위에 걸쳐지는 하나의 프로브 (예를 들어, bac RP11-476D17) 및 염색체 21 상의 하나의 참조 프로브 (예를 들어, PR11-32L6; RP11-752M23; RP11-1107H21; RP11-639A7 또는 RP11-1077M21)인 프로브 세트를 이용하여 ERG 결실 또는 증폭을 시험함으로써 수행된다. 또다른 실시양태에서, 상기 방법은 TMPRSS2 좌위에 걸쳐지는 하나의 프로브 (예를 들어, RP11-121A5; RP11-120C17; PR11-814F13; 또는 RR11-535H11) 및 염색체 21 상의 하나의 참조 프로브 (예를 들어, PR11-32L6; RP11-752M23; RP11-1107H21; RP11-639A7 또는 RP11-1077M21)인 프로브 세트를 이용하여 TMPRSS2 결실/증폭을 시험함으로써 수행된다. 일부 실시양태에서, 상기 방법은 추가로 RP11-121A5; RP11-120C17; PR11-814F13; 및 RR11-535H11을 포함하는 (그러나 이에 제한되지 않음) 군으로부터 선택된 프로브를 사용하는 혼성화를 포함한다.
본 발명은 추가로 인간 전립선 세포, 인간 전립선 조직 또는 상기 인간 전립선 세포 또는 인간 전립선 조직 주위의 유체에 대한 FISH 검정을 수행하는 방법을 제공한다. 일부 실시양태에서, 상기 검정은 RP11-372O17; RP11-137J13; RP11-692L4; RP11-476D17; PR11-32L6; RP11-752M23; RP11-1107H21; RP11-639A7; RP11-1077M21; RP11-121A5; RP11-120C17; PR11-814F13; 및 RR11-535H11을 포함하는 (그러나 이에 제한되지 않음) 군으로부터 선택된 프로브를 이용하는 혼성화 단계를 포함한다.
본 발명과 관련된 재배열을 검출하기 위한 FISH 프로토콜에 사용될 수 있는 특이적 BAC 클론은 다음과 같다:
● ETV1-TMPRSS2 융합체를 시험하기 위해, ETV1에 걸쳐지는 하나의 프로브 및 TMPRSS2 좌위에 걸쳐지는 하나의 프로가 사용될 수 있음:
ETV1에 대한 BAC: RP11-692L4
TMPRSS2에 대한 BAC: RP11-121A5, (RP11-120C17, PR11-814F13, RR11-535H11)
● c-ERG:t-ERG 분리에 대한 프로브 세트를 이용하여 ERG 전좌를 시험함:
c-ERG에 대한 BAC: RP11-24A11
t-ERG에 대한 BAC: RP11-372O17, RP11-137J13
● ETV1 좌위에 걸쳐지는 하나의 프로브 및 염색체 7 상의 하나의 참조 프로브인 프로브 세트를 이용하여 ETV1 결실/증폭을 시험함:
ETV1에 대한 BAC: RP11-692L4
● ERG 좌위에 걸쳐지는 하나의 프로브 및 염색체 21 상의 하나의 참조 프로브인 프로브 세트를 이용하여 ERG 결실/증폭을 시험함:
ERG에 대한 BAC: RP11-476D17
염색체 21 상의 참조 프로브에 대한 BAC: *
● TMPRSS2 좌위에 걸쳐지는 하나의 프로브 및 염색체 21 상의 하나의 참조 프로브인 프로브 세트를 이용하여 TMPRSS2 결실/증폭을 시험함:
TMPRSS2에 대한 BAC: RP11-121A5, (RP11-120C17, PR11-814F13, RR11-535H11)
염색체 21 상의 참조 프로브에 대한 BAC: PR11-32L6, RP11-752M23, RP11-1107H21, RP11-639A7, (RP11-1077M21).
TMPRSS2와 ERG 사이의 융합을 초래하는 결실 돌연변이를 검출하기 위한 가장 바람직한 프로브는 RP11-24A11 및 RP11-137J13이다. 이들 프로브 또는 상기 기재된 프로브는 적절한 형광 마커 또는 다른 마커로 표지된 다음 혼성화에 사용된다. 본원에 제공된 실시예 섹션은 결실을 측정하는데 효과적인 하나의 특정 프로토콜을 설명하지만, 당업자는 상기 검정의 다양한 변형이 동등하게 사용될 수 있음을 인식할 것이다. 특정 프로토콜은 당업계에 널리 공지되어 있으며 본 발명에 용이하게 적용될 수 있다. 방법에 관한 지침은 [In situ Hybridization : Medical Applications (eds. G. R. Coulton and J. de Belleroche), Kluwer Academic Publishers, Boston (1992)], [In situ Hybridization : In Neurobiology; Advances in Methodology (eds. J. H. Eberwine, K. L. Valentino, and J. D. Barchas), Oxford University Press Inc., England (1994)], [In situ Hybridization: A Practical Approach (ed. D. G. Wilkinson), Oxford University Press Inc., England (1992)], [Kuo, et al, Am. J. Hum. Genet. 49:112-119 (1991)], [Klinger, et al., Am. J. Hum. Genet. 51:55-65 (1992)], 및 [Ward, et al, Am. J. Hum. Genet. 52:854-865 (1993)]을 포함하는 다수의 참조문헌으로부터 얻을 수 있다. 또한, 시판되며 FISH 검정을 수행하기 위한 프로토콜을 제공하는 키트 (예를 들어, 메릴랜드주 게이스버그 소재의 옹코, 인크.(Oncor, Inc.)로부터 이용가능함)가 존재한다. 방법에 관한 지침을 제공하는 특허에는 미국 특허 5,225,326; 5,545,524; 6,121,489 및 6,573,043이 포함된다. 이들 참조문헌 모두는 그 전문이 본원에 참고로 포함되고, 당업계의 유사한 참조문헌 및 특정 실험실에 편리한 절차적 단계를 확립하기 위해 본원의 실시예 섹션에 제공된 정보와 함께 사용될 수 있다.
하기 표 13은 FISH 프로브로서의 용도를 발견한 추가의 BAC 클론을 제시한다.
Figure pct00001
본 발명의 방법에 유용한 추가의 FISH 프로브는 표 16 (도 46)에 제시한다.
b. 마이크로어레이
여러 종류의 생물학적 검정은 DNA 마이크로어레이 (예를 들어, cDNA 마이크로어레이 및 올리고뉴클레오티드 마이크로어레이); 단백질 마이크로어레이; 조직 마이크로어레이; 형질감염 또는 세포 마이크로어레이; 화학 화합물 마이크로어레이; 및 항체 마이크로어레이를 포함하는 (그러나 이에 제한되지 않음) 마이크로어레이라 칭해진다. 통상적으로 유전자 칩, DNA 칩, 또는 바이오칩으로서 알려진 DNA 마이크로어레이는, 동시에 수천개의 유전자에 대한 발현 프로파일링 또는 발현 수준 모니터링을 목적으로 어레이를 형성하는 고체 표면 (예를 들어, 유리, 플라스틱 또는 실리콘 칩)에 부착된 미시적 DNA 점의 수집물이다. 부착된 DNA 분절은 단일 DNA 마이크로어레이에 수천개가 사용될 수 있는 프로브로서 알려져 있다. 마이크로어레이는 질환 세포와 정상 세포에서 유전자 발현을 비교함으로써 질환 유전자를 확인하는데 사용될 수 있다. 마이크로어레이는 유리 슬라이드 상에 파인-포인티드 핀(fine-pointed pin)을 사용한 인쇄; 사전-제조된 마스크를 사용한 포토리소그래피(photolithography); 동적 미세거울 장치를 사용한 포토리소그래피; 잉크젯 인쇄; 또는 미세전극 어레이 상의 전기화학을 포함하는 (그러나 이에 제한되지 않음) 다양한 기술을 사용하여 제작될 수 있다.
서던 및 노던 블로팅은 각각 특이적 DNA 또는 RNA 서열을 검출하기 위해 사용된다. 샘플로부터 추출된 DNA 또는 RNA는 단편화되고, 매트릭스 겔 상에서 전기영동으로 분리되고, 멤브레인 필터로 옮겨진다. 필터 결합된 DNA 또는 RNA는 관심 서열에 상보적인 표지된 프로브와 혼성화된다. 필터에 결합된 혼성화된 프로브는 검출된다. 상기 절차의 변형은, 멤브레인에 부착된 기재 핵산이 단리된 DNA 단편의 수집물이고 프로브가 조직으로부터 추출된 RNA이며 표지된 것인 역 노던 블롯이다.
3. 증폭
게놈 DNA 및 키메라 mRNA의 염색체 재배열은 검출 전에 또는 검출과 동시에 증폭될 수 있다. 핵산 증폭 기술의 예시적인 비제한적 예에는 중합효소 연쇄 반응 (PCR), 역전사 중합효소 연쇄 반응 (RT-PCR), 전사-매개 증폭 (TMA), 리가제 연쇄 반응 (LCR), 가닥 치환 증폭 (SDA), 및 핵산 서열 기재 증폭 (NASBA)이 포함되나 이에 제한되지 않는다. 당업자는 특정 증폭 기술 (예를 들어, PCR)에서 RNA가 증폭 전에 DNA로 역전사되는 반면 (예를 들어, RT-PCR), 다른 증폭 기술은 RNA를 직접 증폭시키는 것 (예를 들어, TMA 및 NASBA)을 필요로 함을 인식할 것이다.
통상적으로 PCR로 지칭되는 중합효소 연쇄 반응 (미국 특허 4,683,195, 4,683,202, 4,800,159 및 4,965,188 (각각 그 전문이 본원에 참고로 포함됨))은 다수 사이클의 변성, 프라이머 쌍의 반대 가닥에 대한 어닐링, 및 프라이머 연장을 사용하여 표적 핵산 서열의 카피 수를 기하급수적으로 증가시킨다. RT-PCR로 칭해지는 변형에서, 역전사효소 (RT)를 사용하여 mRNA로부터 상보적 DNA (cDNA)를 제조한 다음, cDNA를 PCR에 의해 증폭시켜 다수 카피의 DNA를 생성한다. PCR의 다른 다양한 변형에 대해서 예를 들어 미국 특허 4,683,195, 4,683,202 및 4,800,159, 문헌 [Mullis et al., Meth. Enzymol. 155: 335 (1987)] 및 [Murakawa et al., DNA 7: 287 (1988)] (각각 그 전문이 본원에 참고로 포함됨)을 참조한다.
통상적으로 TMA로 지칭되는 전사 매개 증폭 (미국 특허 5,480,784 및 5,399,491 (각각 그 전문이 본원에 참고로 포함됨))은 실질적으로 일정한 온도, 이온 농도, 및 pH의 조건 하에 자가촉매반응으로 표적 핵산 서열의 다수 카피를 합성하며, 여기서 표적 서열의 다수 RNA 카피는 자가촉매반응으로 추가의 카피를 생성한다. 예를 들어, 미국 특허 5,399,491 및 5,824,518 (각각 그 전문이 본원에 참고로 포함됨)을 참조한다. 미국 특허 출원 공개 20060046265 (그 전문이 본원에 참고로 포함됨)에 기재된 변형에서, TMA는 임의로 블로킹 모이어티, 종결 모이어티, 및 TMA 공정 감수성 및 정확성을 개선시키기 위한 다른 변형 모이어티의 사용을 포함한다.
통상적으로 LCR로 지칭되는 리가제 연쇄 반응 (문헌 [Weiss, R., Science 254: 1292 (1991)] (그 전문이 본원에 참고로 포함됨))은 표적 핵산의 인접 영역에 혼성화되는 두 세트의 상보적 DNA 올리고뉴클레오티드를 사용한다. DNA 올리고뉴클레오티드는 열 변성, 혼성화 및 라이게이션의 반복 사이클에서 DNA 리가제에 의해 공유적으로 연결되어 검출가능한 이중-가닥 라이게이션된 올리고뉴클레오티으 생성물을 생산한다.
통상적으로 SDA로 지칭되는 표준 치환 증폭 (문헌 [Walker, G. et al., Proc. Natl. Acad. Sci. USA 89: 392-396 (1992)], 미국 특허 5,270,184 및 5,455,166 (각각 그 전문이 본원에 참고로 포함됨))은 표적 서열의 반대 가닥에 프라이머 서열 쌍의 어닐링, 헤미포스포로티오화된 이중나선의 프라이머 연장 생성물을 생산하기 위한 dNTPαS의 존재 하의 프라이머 연장, 반변형된(hemimodified) 제한 엔도뉴클레아제 인식 부위의 엔도뉴클레아제-매개된 닉킹(nicking), 및 존재하는 가닥을 치환하고 다음 회의 프라이머 어닐링, 닉킹 및 가닥 치환용 가닥을 생성하기 위한 닉의 3'말단부로부터의 중합효소-매개된 프라이머 연장의 사이클을 사용하여 생성물의 기하학적 증폭을 일으킨다. 호열성 SDA (tSDA)는 본질적으로 동일한 방법으로 보다 높은 온도에서 호열성 엔도뉴클레아제 및 중합효소를 사용한다 (유럽 특허 0 684 315).
다른 증폭 방법에는 예를 들어, 통상적으로 NASBA로 지칭되는 핵산 서열 기재 증폭 (미국 특허 5,130,238 (그 전문이 본원에 참고로 포함됨)); 프로브 분자 자체를 증폭시키기 위해 통상적으로 Qβ 레플리카제로 지칭되는 RNA 레플리카제를 사용하는 방법 (문헌 [Lizardi et al., BioTechnol. 6: 1197 (1988)] (그 전문이 본원에 참고로 포함됨)); 전사 기재 증폭 방법 (문헌 [Kwoh et al., Proc. Natl. Acad. Sci. USA 86:1173 (1989)]); 및 자가-지속 서열 복제 (문헌 [Guatelli et al., Proc. Natl. Acad. Sci. USA 87: 1874 (1990)] (각각 그 전문이 본원에 참고로 포함됨))가 포함된다. 공지된 증폭 방법의 추가 논의에 대해서는 문헌 [Persing, David H., "In Vitro Nucleic Acid Amplification Techniques" in Diagnostic Medical Microbiology: Principles and Applications (Persing et al., Eds.), pp. 51-87 (American Society for Microbiology, Washington, DC (1993)]을 참조한다.
4. 검출 방법
비-증폭된 또는 증폭된 유전자 융합체 핵산은 임의의 통상적인 수단에 의해 검출될 수 있다. 예를 들어, 유전자 융합체는 검출가능하게 표지된 프로브를 이용한 혼성화 및 생성된 하이브리드의 측정에 의해 검출될 수 있다. 검출 방법의 예시적인 비제한적 예는 하기에 기재된다.
하나의 예시적인 검출 방법인 혼성화 보호 분석 (HPA)은 표적 서열에 화학발광 올리고뉴클레오티드 프로브 (예를 들어, 아크리디늄 에스테르-표지된 (AE) 프로브)를 혼성화하고, 비혼성화 프로브 상에 존재하는 화학발광 표지를 선택적으로 가수분해하고, 남아있는 프로브로부터 생산된 화학발광을 발광분석기로 측정하는 것을 포함한다. 예를 들어, 미국 특허 5,283,174 및 문헌 [Norman C. Nelson et al., Nonisotopic Probing, Blotting, and Sequencing, ch. 17 (Larry J. Kricka ed., 2d ed. 1995)] (각각 그 전문이 본원에 참고로 포함됨)을 참조한다.
또다른 예시적인 검출 방법은 실시간 증폭 과정의 정량적 평가를 제공한다. "실시간" 증폭 과정의 평가는 증폭 반응 동안 연속적으로 또는 주기적으로 반응 혼합물 중 증폭물의 양을 결정하고, 결정된 값을 사용하여 샘플에 최초로 존재하는 표적 서열의 양을 계산하는 것을 포함한다. 실시간 증폭을 기준으로 샘플에 존재하는 최초 표적 서열의 양을 결정하는 다양한 방법이 당업계에 널리 공지되어 있다. 이들에는 미국 특허 6,303,305 및 6,541,205 (각각 그 전문이 본원에 참고로 포함됨)에 개시된 방법이 포함된다. 샘플에 최초로 존재하는 표적 서열의 양을 결정하기 위한 것이지만 실시간 증폭을 기준으로 하지 않는 또다른 방법은 미국 특허 5,710,029 (그 전문이 본원에 참고로 포함됨)에 개시되어 있다.
증폭 생성물은 다양한 자가-혼성화 프로브 (대부분이 스템-루프(stem-loop) 구조임)를 사용하여 실시간으로 검출될 수 있다. 이러한 자가-혼성화 프로브는, 프로브가 자가-혼성화 상태인지 또는 표적 서열에 대한 혼성화를 통해 변경된 상태인지에 따라 상이하게 검출가능한 신호를 방출하도록 표지된다. 비제한적인 예로서, "분자 토치(torch)"는 연결 영역 (예를 들어, 비-뉴클레오티드 링커)에 의해 연결되며 예정된 혼성화 검정 조건 하에 서로 혼성화되는 별개의 자가-상보성 영역 ("표적 결합 도메인" 및 "표적 폐쇄 도메인"으로 지칭됨)을 포함하는 자가-혼성화 프로브의 한 유형이다. 바람직한 실시양태에서, 분자 토치는 표적 결합 도메인에 단일-가닥 염기 영역을 함유하며, 상기 영역은 길이가 1 내지 약 20개 염기이고 가닥 치환 조건 하에서 증폭 반응에 존재하는 표적 서열에 대한 혼성화에 이용할 수 있다. 가닥 치환 조건 하에서, 분자 토치 중 완전히 또는 부분적으로 상보적일 수 있는 2개의 상보적 영역의 혼성화는, 표적 서열이 존재하는 경우를 제외하고 바람직하며, 표적 결합 도메인에 존재하는 단일 가닥 영역에 결합하고 표적 폐쇄 도메인의 모두 또는 일부를 대체할 것이다. 분자 토치의 표적 결합 도메인 및 표적 폐쇄 도메인은, 분자 토치가 표적 서열에 혼성화될 때보다 분자 토치가 자가-혼성화될 때 상이한 신호를 생성하도록 위치하는 검출가능한 표지 또는 상호작용성 표지의 쌍 (예를 들어, 발광제/켄처)을 포함하며, 이에 의해 시험 샘플에서 비혼성화 분자 토치의 존재 하에 프로프:표적 이중나선의 검출이 가능해진다. 분자 토치 및 다양한 유형의 상호작용성 표지 쌍은 미국 특허 6,534,274 (그 전문이 본원에 참고로 포함됨)에 개시되어 있다.
자가-상보성을 갖는 검출 프로브의 또다른 예는 "분자 비콘(beacon)"이다. 분자 비콘은 표적 상보적 서열을 갖는 핵산 분자, 증폭 반응에 존재하는 표적 서열의 부재 하에 폐쇄 입체형태로 프로브를 유지하는 친화성 쌍 (또는 핵산 암(arm)), 및 프로브가 폐쇄 입체형태로 존재할 때 상호작용하는 표지 쌍을 포함한다. 표적 서열 및 표적 상보적 서열의 혼성화는 친화성 쌍의 구성원을 분리시켜 프로브를 개방 입체형태로 전환시킨다. 개방 입체형태로의 전환은 예를 들어 형광단 및 켄처 (예를 들어, DABCYL 및 EDANS)일 수 있는 표지 쌍의 감소된 상호작용으로 인해 검출가능하다. 분자 비콘은 미국 특허 5,925,517 및 6,150,097 (그 전문이 본원에 참고로 포함됨)에 개시되어 있다.
다른 자가-혼성화 프로브는 당업자에게 널리 공지되어 있다. 비제한적인 예로서, 상호작용성 표지, 예를 들어 미국 특허 5,928,862 (그 전문이 본원에 참고로 포함됨)에 개시된 것을 갖는 프로브 결합 쌍은 본 발명에 사용하기에 적합할 수 있다. 단일 뉴클레오티드 다형성 (SNP)을 검출하는데 사용되는 프로브 시스템이 또한 본 발명에 이용될 수 있다. 추가의 검출 시스템은 미국 특허 출원 공개 20050042638 (그 전문이 본원에 참고로 포함됨)에 개시된 바와 같은 "분자 스위치(switch)"를 포함한다. 다른 프로브, 예를 들어 삽입 염료 및/또는 형광색소를 포함하는 것이 또한 본 발명에서 증폭 생성물의 검출에 유용하다. 예를 들어, 미국 특허 5,814,447 (그 전문이 본원에 참고로 포함됨)을 참조한다.
C. 단백질 검출
본 발명의 유전자 융합체는 당업자에게 공지된 다양한 단백질 기술, 즉 단백질 서열결정 및 면역검정 (이에 제한되지 않음)을 사용하여 말단절단된 ETS 부류 구성원 단백질 또는 키메라 단백질로서 검출될 수 있다.
1. 서열결정
단백질 서열결정 기술의 예시적인 비제한적 예에는 질량 분광법 및 에드만(Edman) 분해가 포함되나 이에 제한되지 않는다.
질량 분광법은 원칙적으로 임의의 크기의 단백질을 서열결정할 수 있지만 크기가 증가함에 따라 계산하기가 보다 어려워진다. 단백질은 엔도프로테아제에 의해 소화되고, 생성된 용액은 고압 액체 크로마토그래피 컬럼을 통과한다. 이 컬럼의 말단에서, 용액은 높은 양전위로 하전된 좁은 노즐 밖으로 분사되어 질량 분광계 내로 들어간다. 액적 상의 전하는 오직 단일 이온이 남을 때까지 그를 단편으로 만든다. 이어서, 펩티드는 단편화되고, 단편의 질량-전하 비율이 측정된다. 질량 스펙트럼은 컴퓨터에 의해 분석되고, 종종 미리 서열결정된 단백질의 데이터베이스와 비교되어 단편의 서열을 결정한다. 이어서, 상기 과정은 상이한 소화 효소로 반복되고, 서열 중 중복부분은 단백질에 대한 서열을 구축하는데 사용된다.
에드만 분해 반응에서, 서열결정될 펩티드는 고체 표면 (예를 들어, 폴리브렌으로 코팅된 유리 섬유) 상에 흡착된다. 에드만 시약인 페닐이소티오시아네이트 (PTC)는 12% 트리메틸아민의 중간 염기성 완충 용액과 함께 상기 흡착된 펩티드에 첨가되고, N-말단 아미노산의 아민기와 반응한다. 이어서, 말단 아미노산 유도체는 무수산의 첨가에 의해 선택적으로 분리될 수 있다. 유도체는 이성질체화되어 치환된 페닐티오히단토인을 제공하며, 이는 크로마토그래피에 의해 세척 제거 및 확인될 수 있고, 사이클은 반복될 수 있다. 각각의 단계의 효율은 약 98%이며, 이는 약 50개의 아미노산이 신뢰성있게 결정되도록 한다.
2. 면역검정
면역검정의 예시적인 비제한적 예에는 면역침전; 웨스턴 블롯; ELISA; 면역조직화학; 면역세포화학; 유동 세포측정; 및 면역-PCR이 포함되나 이에 제한되지 않는다. 당업자에게 공지된 다양한 기술 (예를 들어, 측색, 형광, 화학발광 또는 방사성)을 사용하여 검출가능하게 표지된 폴리클로날 또는 모노클로날 항체는 면역검정에 사용하기에 적합하다.
면역침전은 항원에 특이적인 항체를 사용하여 용액 밖으로 그 항원을 침전시키는 기술이다. 상기 과정은 복합체에 존재할 것으로 생각되는 단백질을 표적화함으로써 세포 추출물에 존재하는 단백질 복합체를 확인하는데 사용될 수 있다. 복합체는 세균으로부터 최초로 단리된 불용성 항체-결합 단백질, 예를 들어 단백질 A 및 단백질 G에 의해 용액 밖으로 꺼내진다. 항체는 또한 용액 밖으로 용이하게 단리될 수 있는 세파로스 비드에 커플링될 수 있다. 세척 후, 침전물은 질량 분광법, 웨스턴 블로팅, 또는 복합체 내 구성물을 확인하기 위한 임의수의 다른 방법을 사용하여 분석될 수 있다.
웨스턴 블롯, 또는 면역불롯은 소정의 조직 균질액 또는 추출액 샘플에서 단백질을 검출하기 위한 방법이다. 상기 방법은 겔 전기영동을 사용하여 질량에 따라 변성 단백질을 분리한다. 이어서, 단백질을 겔 밖으로 옮기고, 멤브레인, 일반적으로 폴리비닐디플루오라이드 또는 니트로셀룰로스 상에 옮기며, 여기서 관심 단백질에 특이적인 항체를 사용하여 탐침한다. 그 결과, 연구자는 소정의 샘플에서 단백질의 양을 검사하고 여러 군 사이의 수준을 비교할 수 있다.
효소-연계 면역흡수 검정의 축약어인 ELISA는 샘플 내 항체 또는 항원의 존재를 검출하기 위한 생화학적 기술이다. 이는 최소 2개의 항체를 이용하는데, 그 중 하나는 항원에 특이적이며 다른 하나는 효소에 커플링된다. 제2 항체는 발색성 또는 형광성 기재가 신호를 생성하도록 할 것이다. ELISA의 변형은 샌드위치 ELISA, 경쟁적 ELISA, 및 ELISPOT을 포함한다. ELISA는 샘플 내 항원의 존재 또는 항체의 존재를 평가하기 위해 수행될 수 있기 때문에, 혈청 항체 농도를 결정하고 또한 항원의 존재를 검출하는데 유용한 도구이다.
면역조직화학 및 면역세포화학은 조직 또는 세포 내 항원이 그의 각각의 항체에 결합하는 원리를 통해 조직 절편 또는 세포 각각에서 단백질을 국지화하는 방법을 지칭한다. 시각화는 항체를 색상 생성 태그 또는 형광 태그로 태그함으로써 가능해진다. 색상 태그의 전형적인 예에는 양고추냉이 퍼옥시다제 및 알칼리성 포스파타제가 포함되나 이에 제한되지 않는다. 형광단 태그의 전형적인 예에는 플루오레세인 이소티오시아네이트 (FITC) 또는 피코에리트린 (PE)이 포함되나 이에 제한되지 않는다.
유동 세포측정은 유체 스트림에 현탁된 미시적 입자를 계수하고, 검사하고, 분류하는 기술이다. 상기 기술은 광학/전자 검출 장치를 통해 단일 세포 유동의 물리적 및/또는 화학적 특징을 동시 다수파라미터 분석하도록 한다. 단일 주파수 또는 색상의 광선 (예를 들어, 레이저)가 수력학적으로 초점이 맞춰진 유체 스트림 상에 조사된다. 많은 검출자는 스트림이 광선을 통과하는 지점을 목표로 한다; 광선과 일치하는 것 (전방 산란 (Forward Scatter) 또는 FSC) 및 광선에 수직인 여러 것 (측방 산란 (Side Scatter) (SSC) 및 하나 이상의 형광 검출자). 광선을 통과하는 각각의 현탁된 입자는 여러 방식으로 광을 산란시키고, 입자 내 형광 화학물질은 여기되어 광원보다 낮은 주파수로 광을 방출할 수 있다. 산란 광과 형광 광의 조합은 검출자에 의해 선택되고, 각각의 검출자에서 각각의 형광 방출 피크에 대한 것인 밝기의 변동을 분석함으로써, 각각의 개별 입자의 물리적 및 화학적 구조에 관해 다양한 사실을 추론하는 것이 가능하다. FSC는 세포 부피와 관련되며, SSC는 입자의 밀도 또는 내부 복잡성 (예를 들어, 핵의 형태, 세포질 과립의 양 및 유형 또는 멤브레인 거침도(roughness))와 관련된다.
면역-중합효소 연쇄 반응 (IPCR)은 항체-기재 면역검정에서 신호 생성을 증가시키는 핵산 증폭 기술을 이용한다. PCR의 단백질 동등성이 존재하지 않기 때문에, 즉 단백질이 PCR 동안 핵산이 복제되는 것과 동일한 방식으로 복제될 수 없기 때문에, 검출 감수성을 증가시키는 유일한 방법은 신호 증폭에 의한 것이다. 표적 단백질은 올리고뉴클레오티드에 직접 또는 간접적으로 접합된 항체에 결합된다. 비결합 합체는 세척 제거되고, 남아있는 결합 항체는 그들의 올리고뉴클레오티드를 증폭시킨다. 단백질 검출은 실시간 방법을 비롯한 표준 핵산 검출 방법을 사용하여 증폭된 올리고뉴클레오티드의 검출을 통해 일어난다.
D. 데이터 분석
일부 실시양태에서, 컴퓨터-기반 분석 프로그램은 검출 검정에 의해 생성된 원시 데이터 (예를 들어, 소정의 유전자 융합체 또는 다른 마커의 존재, 부재, 또는 양)를 임상의를 위한 예상값의 데이터로 번역하는데 사용된다. 임상의는 임의의 적합한 수단을 사용하여 예상 데이터에 접근할 수 있다. 따라서, 일부 바람직한 실시양태에서, 본 발명은 유전학 또는 분자 생물학에 대해 교육받았을 것 같지 않은 임상의가 원시 데이터를 이해할 필요가 없다는 추가의 이점을 제공한다. 데이터는 그의 가장 유용한 형태로 임상의에게 직접 제공된다. 이어서, 임상의는 대상체의 관리를 최적화하기 위해 즉시 정보를 이용할 수 있다.
본 발명은 검정을 수행하고 정보를 제공하는 실험실, 의료 인력, 및 대상체에, 그리고 이들로부터 정보를 수용하고, 처리하고, 전달할 수 있는 임의의 방법을 고려한다. 예를 들어, 본 발명의 일부 실시양태에서, 샘플 (예를 들어, 생검 또는 혈청 또는 소변 샘플)은 대상체로부터 수득되고, 프로파일링 서비스 (예를 들어, 의료 시설에 있는 임상 실험실, 게놈 프로파일링 사업 등)에 제출되고, 세계 임의의 지역 (예를 들어, 대상체가 거주하거나 궁극적으로 정보가 사용되는 국가와 상이한 국가)에 위치되어 원시 데이터를 생성한다. 샘플이 조직 또는 다른 생물학적 샘플을 포함하는 경우, 대상체는 의료 센터를 방문하여 샘플을 수득하고 이를 프로파일링 센터에 송부할 수 있거나, 또는 대상체는 샘플을 스스로 (예를 들어, 소변 샘플)을 수집하고 이를 직접 프로파일링 센터에 송부할 수 있다. 샘플이 미리 경정된 생물학적 정보를 포함하는 경우, 정보는 대상체에 의해 직접 프로파일링 서비스에 송부될 수 있다 (예를 들어, 정보를 함유하는 정보 카드가 컴퓨터에 의해 스캔되고 데이터가 전자 통신 시스템을 사용하여 프로파일링 센터의 컴퓨터에 전달될 수 있다). 프로파일링 서비스에 수용되면, 샘플이 처리되고, 대상체에 필요한 진단 또는 예후 정보에 특이적인 프로파일 (즉, 발현 데이터)가 생성된다.
이어서, 프로파일 데이터는 치료 임상의에 의한 해석을 위해 적합한 포맷으로 제조된다. 예를 들어, 원시 발현 데이터를 제공하기 보다는, 제조된 포맷은 특정 치료 선택에 대한 추천과 함께 대상체에 대한 진단 또는 위험 평가 (예를 들어, 암이 존재할 가능성)를 나타낼 수 있다. 데이터는 임의의 적합한 방법에 의해 임상의에게 보여질 수 있다. 예를 들어, 일부 실시양태에서, 프로파일링 서비스는 임상의를 위해 (예를 들어, 관리 지점에서) 인쇄될 수 있거나 임상의에게 컴퓨터 모니터 상에 보여질 수 있는 보고서를 생성한다.
일부 실시양태에서, 정보는 먼저 관리 지점에서 또는 지방 시설에서 분석된다. 이어서, 원시 데이터는 추가의 분석을 위해 및/또는 원시 데이터를 임상의 또는 환자를 위해 유용한 정보로 전환시키기 위해 중앙 처리 시설로 송부된다. 중앙 처리 시설은 프라이버시 (모든 데이터가 균일한 안전 프로토콜을 갖는 중앙 시설에 저장됨), 데이터 분석의 속도 및 균일성의 이점을 제공한다. 이어서, 중앙 처리 시설은 대상체의 치료 후 데이터의 운명을 조절할 수 있다. 예를 들어, 전자 통신 시스템을 사용하여, 중앙 시설은 임상의, 대상체, 또는 연구자에게 데이터를 제공할 수 있다.
일부 실시양태에서, 대상체는 전자 통신 시스템을 사용하여 데이터에 직접 접근할 수 있다. 대상체는 결과를 기준으로 추가의 개입 또는 카운셀링을 선택할 수 있다. 일부 실시양태에서, 데이터는 연구 용도로 사용된다. 예를 들어, 데이터는 특정 상태 또는 질환 단계의 유용한 지시자로서 마커의 포함 또는 배제를 추가로 최적화하는데 사용될 수 있다.
E. 생체내 영상화
본 발명의 유전자 융합체는 또한 방사성핵종 영상화; 양전자 방출 단층촬영 (PET); 전산화 축 단층촬영, X-선 또는 자기 공명 영상화 방법, 형광 검출, 및 화학발광 검출을 포함하지만 이에 제한되지 않는 생체내 영상화 기술을 사용하여 검출될 수 있다. 일부 실시양태에서, 생체내 영상화 기술은 동물 (예를 들어, 인간 또는 비-인간 포유동물)에서 암 마커의 존재 또는 발현을 시각화하기 위해 사용된다. 예를 들어, 일부 실시양태에서, 암 마커 mRNA 또는 단백질은 암 마커에 특이적인 표지된 항체를 사용하여 표지된다. 특이적으로 결합되고 표지된 항체는 방사성핵종 영상화, 양전자 방출 단층촬영, 전산화 축 단층촬영, X-선 또는 자기 공명 영상화 방법, 형광 검출, 및 화학발광 검출을 포함하지만 이에 제한되지 않는 생체내 영상화 방법을 사용하여 개체에서 검출될 수 있다. 본 발명의 암 마커에 대한 항체를 생성하는 방법은 아래 설명된다.
본 발명의 생체내 영상화 방법은 본 발명의 암 마커를 발현하는 암 (예를 들어, 전립선암)의 진단에 유용하다. 생체내 영상화는 암을 지시하는 마커의 존재를 시각화하기 위해 사용된다. 이러한 기술은 불쾌한 생검을 사용하지 않고 진단할 수 있게 해준다. 본 발명의 생체내 영상화 방법은 또한 암 환자의 예후를 제공하는 데 유용하다. 예를 들어, 전이 가능성이 있는 암을 지시하는 마커의 존재가 검출될 수 있다. 본 발명의 생체내 영상화 방법은 추가로 신체의 다른 부분에서 전이성 암을 검출하기 위해 사용될 수 있다.
일부 실시양태에서, 본 발명의 암 마커에 특이적인 시약 (예를 들어, 항체)은 형광 표지된다. 표지된 항체는 대상체에 (예를 들어, 경구 또는 비경구적으로) 도입된다. 형광 표지된 항체는 임의의 적합한 방법을 사용하여 (예를 들어, 본원에 참고로 포함되는 미국 특허 6,198,107에 기재된 장치를 사용하여) 검출된다.
다른 실시양태에서, 항체는 방사성으로 표지된다. 생체내 진단을 위한 항체의 용도는 당업계에 익히 공지되어 있다. 문헌 [Sumerdon et al., (Nucl. Med. Biol 17:247-254 [1990])]에는 표지로서 인듐-111을 사용하는 종양의 방사면역신티그래피 영상화에 최적화된 항체-킬레이터가 기재되어 있다. 문헌 [Griffin et al., (J Clin One 9:631-640 [1991])]에는 반복적인 결장직장암을 앓고 있을 것으로 의심되는 환자에서 종양을 검출하는 데 있어서 상기 작용제의 용도가 기재되어 있다. 자기 공명 영상화를 위한 표지로서 상자성 이온을 갖는 유사한 작용제의 용도가 당업계에 공지되어 있다 (문헌 [Lauffer, Magnetic Resonance in Medicine 22:339-342 [1991]]). 사용되는 표지는 선택된 영상화 양식에 좌우될 것이다. 방사성 표지, 예컨대 인듐-111, 테크네튬-99m, 또는 요오드-131은 평면 스캔 또는 단일 광자 방출 전산화 단층촬영 (SPECT)에 사용될 수 있다. 불소-19와 같은 양전자 방출 표지는 또한 양전자 방출 단층촬영 (PET)에 사용될 수 있다. MRI에 대해서는, 가돌리늄 (III) 또는 망간 (II)과 같은 상자성 이온이 사용될 수 있다.
스칸듐-47 (3.5일) 갈륨-67 (2.8일), 갈륨-68 (68분), 테크네튬-99m (6시간), 및 인듐-111 (3.2일)과 같은 1시간 내지 3.5일 범위의 반감기를 갖는 방사성 금속은 항체에 대한 접합에 이용가능하며, 이 중 갈륨-67, 테크네튬-99m, 및 인듐-111은 감마 카메라 영상화에 바람직하고, 갈륨-68은 양전자 방출 단층촬영에 바람직하다.
항체를 이러한 방사성 금속으로 표지하는 유용한 방법은, 예를 들어 In-111 및 Tc-99m에 대한 문헌 [Khaw et al (Science 209:295 [1980])], 및 문헌 [Scheinberg et al. (Science 215:1511 [1982])]에 기재된 바와 같은 2관능성 킬레이팅제, 예컨대 디에틸렌트리아민펜타아세트산 (DTPA)에 의해 수행된다. 다른 킬레이팅제도 사용될 수 있지만, 1-(p-카르복시메톡시벤질)EDTA 및 DTPA의 카르복시탄산 무수물의 사용이 항체의 면역반응성에 실질적으로 영향을 주지 않으면서 접합을 허용하기 때문에 유리하다.
DPTA를 단백질에 커플링시키는 또 다른 방법은, In-111로 알부민을 표지하기 위한 것이지만 항체를 표지하는 데 적합시킬 수 있는, 문헌 [Hnatowich et al. (Int. J. Appl. Radiat. Isot. 33:327 [1982])]에 기재된 바와 같은 DTPA의 시클릭 무수물에 의해 수행된다. DPTA에 의한 킬레이션을 사용하지 않고, Tc-99m으로 항체를 표지하기에 적합한 방법은 크록포드(Crockford) 등 (본원에 참고로 포함되는 미국 특허 4,323,546)의 예비 주석도금 방법이다.
Tc-99m으로 면역글로불린을 표지하는 바람직한 방법은 혈장 단백질에 대한 문헌 [Wong et al. (Int. J. Appl. Radiat. Isot, 29:251 [1978])]에 기재되고, 항체 표지에 대한 문헌 [Wong et al. (J. Nucl. Med., 23:229 [1981])]에 의해 최근 성공적으로 적용된 방법이다.
특이적 항체에 접합된 방사성 금속의 경우, 가능한 한 높은 비율의 방사성 표지를 항체 분자에 이의 면역특이성을 파괴하지 않으면서 도입하는 것이 마찬가지로 바람직하다. 본 발명의 특이적 암 마커의 존재 하에 방사성 표지를 수행하여 항체 상의 항원 결합 부위가 확실하게 보호되도록 함으로써 추가의 개선점이 달성될 수 있다. 항원은 표지 후 분리된다.
또 추가의 실시양태에서, 생체내 생체광학 영상화 (미국 캘리포니아주 알메다 소재의 제노젠(Xenogen))가 생체내 영상화에 이용된다. 상기 실시간 생체내 영상화는 루시퍼라제를 이용한다. 루시퍼라제 유전자는 세포, 미생물, 및 동물에 (예를 들어, 본 발명의 암 마커와의 융합 단백질로서) 혼입된다. 활성화 시, 이것은 빛을 방출하는 반응을 유발한다. CCD 카메라 및 소프트웨어를 사용하여 영상을 포획하고 이를 분석한다.
F. 조성물 & 키트
본 발명의 진단 방법에서 사용하기 위한 조성물은 프로브, 증폭 올리고뉴클레오티드, 및 항체를 포함하지만 이에 제한되지 않는다. 특히 바람직한 조성물은 ARG 또는 HG가 ETS 부류 구성원 유전자에 융합한 경우에만 생성물을 검출한다. 이들 조성물은 ARG 또는 HG의 전사 조절 영역으로부터의 5' 부분이 ETS 부류 구성원 유전자로부터의 3' 부분에 융합한 접합부에 혼성화되는 (즉, 유전자 융합체 접합부에 걸쳐지는) 서열을 포함하는 단일 표지된 프로브; 제1 증폭 올리고뉴클레오티드는 ARG 또는 HG의 전사 조절 영역에 혼성화되는 서열을 포함하고 제2 증폭 올리고뉴클레오티드는 ETS 부류 구성원 유전자에 혼성화되는 서열을 포함하는 것인 한 쌍의 증폭 올리고뉴클레오티드; ETS 부류 구성원 유전자에 대한 ARG 또는 HG의 전사 조절 영역의 융합체로부터 생성된 아미노-말단에서 말단절단된 ETS 부류 구성원 단백질에 대한 항체; 또는 ARG 또는 HG의 전사 조절 영역으로부터의 아미노-말단 부분 및 ETS 부류 구성원 유전자로부터의 카르복시-말단 부분을 갖는 키메라 단백질에 대한 항체를 포함한다. 그러나, 다른 유용한 조성물은, 제1 표지된 프로브는 ARG 또는 HG의 전사 조절 영역에 혼성화되는 서열을 포함하고 제2 표지된 프로브는 ETS 부류 구성원 유전자에 혼성화되는 서열을 포함하는 것인 한 쌍의 표지된 프로브를 포함한다.
이들 조성물 중 임의의 것은 단독으로 또는 본 발명의 다른 조성물과 조합하여 키트의 형태로 제공될 수 있다. 예를 들어, 단일 표지된 프로브 및 한 쌍의 증폭 올리고뉴클레오티드가 본 발명의 유전자 융합체의 증폭 및 검출을 위한 키트에 제공될 수 있다. 키트는 적절한 대조군 및/또는 검출 시약을 추가로 포함할 수 있다. 본 발명의 프로브 및 항체 조성물은 또한 어레이의 형태로 제공될 수도 있다.
IV . 예후 적용
본 발명의 개발 과정 동안 수행된 실험은 본 발명의 유전자 융합체와 전립선암 환자의 예후 사이의 밀접한 상관관계를 입증하였다 (예를 들어, 아래 실시예 5 참조). 특히 융합체가 TMPRSS2와 ERG 사이에 위치한 게놈 DNA의 결실로부터 생성된 경우에는, 암세포가 보다 공격적인 표현형을 취하는 것으로 밝혀졌다. 따라서, 일부 실시양태에서, 예후를 제공하고 의사가 적절한 치료 전략을 결정하는 것을 돕기 위해 개재 DNA의 결실이 존재하는 TMPRSS2와 ERG 사이의 유전자 융합체를 검출할 수 있는 검정이 사용된다. 예를 들어, 일부 실시양태에서, 상기 특정 재배열을 갖는 종양이 있는 환자는 이러한 재배열이 없는 환자보다 그들의 예후가 유의하게 나쁘기 때문에 보다 집중적으로 치료된다.
임의의 검정을 사용하여 앞서 논의된 유형의 재배열 (예를 들어, 앞서 기재된 것들)을 갖는 세포가 존재하는지를 결정할 수 있다.
본 발명은 가장 바람직하게는 전립선암 환자에 대한 예후를 얻는 것과 관련하여 사용될 것이지만, 다른 상피 세포 종양도 검사될 수 있는데, 본원에 기재된 검정 및 프로브를 사용하여 이들 종양으로부터의 암성 세포가 그들을 특히 공격적으로 만들 가능성이 있는, 즉 침윤성 및 전이성이게 할 가능성이 있는 재배열을 갖고 있는지를 결정할 수 있다. 상기 절차를 사용하는 것을 특징으로 할 수 있는 종양의 예에는 유방, 폐, 결장, 난소, 자궁, 식도, 위, 간, 신장, 뇌, 피부 및 근육의 종양이 포함된다. 상기 검정은 또한 세포주 및 동물 모델에서 이들 암을 연구하는 연구자들에게 가치가 있을 것이다.
본 발명의 개발 과정 동안 수행된 추가 실험은 샘플을 검정하여 결실된 영역에 위치한 하나 이상의 유전자의 발현 상실이 존재하는지를 결정함으로써 염색체 결실을 검출할 수 있음을 입증하였다. 예를 들어, TMPRSS2와 ERG 사이의 융합체를 형성하는 데 약 280만 염기의 게놈 DNA가 일반적으로 결실되고, 이러한 결실이 발생하는 경우 이 영역에 위치한 적어도 4개의 유전자가 상실된다. 이들은 ETS2 유전자, WRB 유전자, PCP4 유전자 및 MX1 유전자이다. 암성 전립선 세포에서 이들 중 하나 이상의 감소는 불량한 예후를 시사한다.
따라서, 일부 실시양태에서, 본 발명은 적어도 제1 및 제2 프로브를 사용하여 FISH 검정을 수행하는 것을 포함하며, 여기서 제1 프로브는 적어도 15개 뉴클레오티드 길이이고 (예를 들어, 적어도 15, 20, 35개 등); 제1 형광 표지에 결합하며; 엄격한 조건 하에서 인간 게놈 내 제1 서열에 혼성화되는데, 여기서 제1 서열은 안드로겐 반응성 유전자 (예를 들어, TMPRSS2 유전자) 또는 ETS 부류 유전자 (예를 들어, ERG 유전자, ETV1 유전자, 또는 ETV4 유전자)의 적어도 일부를 포함하며; 제2 프로브는 적어도 15개 뉴클레오티드 길이이고; 제1 형광 표지와는 상이한 제2 형광 표지에 결합하며; 엄격한 조건 하에서 제1 서열과는 상이한 인간 게놈 내 제2 서열에 혼성화되는데, 이는 안드로겐 반응성 유전자 (예를 들어, TMPRSS2 유전자) 또는 ETS 부류 유전자 (예를 들어, ERG 유전자, ETV1 유전자, 또는 ETV4 유전자)의 적어도 일부를 포함하는 것인, 암-관련 재배열을 지시하는 염색체 DNA의 결실에 대해 상피 세포를 검정하는 방법을 제공한다.
추가의 실시양태에서, 본 발명은 상피 세포의 시험 샘플을 수득하고; 상피 세포의 샘플을 검정하여 ETS2; WRB; PCP4; 및 MX1을 포함하지만 이에 제한되지 않는 군으로부터 선택되는 하나 이상의 유전자의 발현 수준을 측정하고; 단계 b)에서 측정된 발현 수준을 대조 샘플에서의 수준과 비교하고; 시험 샘플 내 유전자에 대해 측정된 발현 수준이 대조 샘플에 대한 것보다 낮은 경우에 결실이 발생한 것으로 결론을 내리는 것을 포함하는, 암-관련 재배열을 지시하는 게놈 DNA의 결실에 대해 상피 세포 (예를 들어, 전립선 세포)를 검정하는 방법을 제공한다.
V. 약물 스크리닝 적용
일부 실시양태에서, 본 발명은 (예를 들어, 항암 약물을 스크리닝하기 위한) 약물 스크리닝 검정을 제공한다. 본 발명의 스크리닝 방법은 본 발명의 방법을 사용하여 확인된 암 마커 (예를 들어, 본 발명의 유전자 융합체를 포함하지만 이에 제한되지 않음)를 이용한다. 예를 들어, 일부 실시양태에서, 본 발명은 유전자 융합체의 발현을 변경시키는 (예를 들어, 감소시키는) 화합물의 스크리닝 방법을 제공한다. 화합물 또는 작용제는, 예를 들어 프로모터 영역과 상호작용함으로써 전사를 방해할 수 있다. 화합물 또는 작용제는 융합체로부터 생성된 mRNA를 (예를 들어, RNA 간섭, 안티센스 기술 등에 의해) 방해할 수 있다. 화합물 또는 작용제는 융합체의 생물학적 활성의 상류 또는 하류인 경로를 방해할 수 있다. 일부 실시양태에서, 후보 화합물은 암 마커에 대한 안티센스 또는 간섭 RNA 작용제 (예를 들어, 올리고뉴클레오티드)이다. 다른 실시양태에서, 후보 화합물은 본 발명의 암 마커 조절제 또는 발현 생성물에 특이적으로 결합하여 그의 생물학적 기능을 억제하는 항체 또는 소분자이다.
한 스크리닝 방법에서, 후보 화합물은 암 마커를 발현하는 세포와 화합물을 접촉시킨 다음, 발현에 대한 후보 화합물의 효과를 검정함으로써, 암 마커 발현을 변경시키는 그들의 능력에 대해 평가된다. 일부 실시양태에서, 암 마커 유전자의 발현에 대한 후보 화합물의 효과는 세포에 의해 발현된 암 마커 mRNA의 수준을 검출함으로써 검정된다. mRNA 발현은 임의의 적합한 방법에 의해 검출될 수 있다.
다른 실시양태에서, 암 마커 유전자의 발현에 대한 후보 화합물의 효과는 암 마커에 의해 암호화된 폴리펩티드의 수준을 측정함으로써 검정된다. 발현된 폴리펩티드의 수준은 본원에 개시된 것들을 포함하지만 이에 제한되지 않는 임의의 적합한 방법을 사용하여 측정될 수 있다.
구체적으로, 본 발명은 본 발명의 암 마커에 결합하여, 예를 들어 암 마커 발현 또는 암 마커 활성에 대한 억제 (또는 자극) 효과를 갖거나, 또는 예를 들어 암 마커 기질의 발현 또는 활성에 대한 자극 또는 억제 효과를 갖는 조절제, 즉 후보 또는 시험 화합물 또는 작용제 (예를 들어, 단백질, 펩티드, 펩티드 모방체, 펩토이드, 소분자 또는 다른 약물)를 확인하기 위한 스크리닝 방법을 제공한다. 이로써 확인된 화합물은 치료 프로토콜에서 직접적 또는 간접적으로 표적 유전자 생성물 (예를 들어, 암 마커 유전자)의 활성을 조정하거나, 표적 유전자 생성물의 생물학적 기능을 정교하게 하거나, 또는 정상 표적 유전자 상호작용을 파괴하는 화합물을 확인하기 위해 사용될 수 있다. 암 마커의 활성 또는 발현을 억제하는 화합물은 증식성 질환, 예를 들어 암, 특히 전립선암의 치료에서 유용하다.
한 실시양태에서, 본 발명은 암 마커 단백질 또는 폴리펩티드 또는 그의 생물학적 활성 부분의 기질인 후보 또는 시험 화합물을 스크리닝하기 위한 검정을 제공한다. 또 다른 실시양태에서, 본 발명은 암 마커 단백질 또는 폴리펩티드 또는 그의 생물학적 활성 부분에 결합하거나, 또는 이들의 활성을 조정하는 후보 또는 시험 화합물을 스크리닝하기 위한 검정을 제공한다.
본 발명의 시험 화합물은 생물학적 라이브러리; 펩토이드 라이브러리 (펩티드의 관능기를 갖지만, 신규한 비-펩티드 주쇄도 갖고, 효소적 파괴에 내성이 있지만, 그럼에도 불구하고 생리활성을 유지하는 분자의 라이브러리; 예를 들어, 문헌 [Zuckennann et al., J. Med. Chem. 37: 2678-85 [1994]] 참조); 공간적 주소지정 평행 고상 또는 액상 라이브러리; 얽힘풀기(deconvolution)를 필요로 하는 합성 라이브러리 방법; '한 비드 당 한 화합물(one-bead one-compound)' 라이브러리 방법; 및 친화도 크로마토그래피 선택을 사용하는 합성 라이브러리 방법을 포함하는 당업계에 공지된 조합적 라이브러리 방법에서의 수많은 접근법 중 임의의 것을 사용하여 수득할 수 있다. 생물학적 라이브러리 및 펩토이드 라이브러리 접근법은 펩티드 라이브러리와 함께 사용하기에 바람직한 반면, 다른 4가지 접근법은 화합물의 펩티드, 비-펩티드 올리고머 또는 소분자 라이브러리에 적용가능하다 (문헌 [Lam (1997) Anticancer Drug Des. 12:145]).
분자 라이브러리의 합성 방법에 대한 예는 당업계에서 찾을 수 있고, 예를 들어 하기 문헌에 기재되어 있다: [DeWitt et al., Proc. Natl. Acad. Sci. U.S.A. 90:6909 [1993]], [Erb et al., Proc. Nad. Acad. Sci. USA 91:11422 [1994]], [Zuckermann et al., J. Med. Chem. 37:2678 [1994]], [Cho et al., Science 261:1303 [1993]], [Carrell et al., Angew. Chem. Int. Ed. Engl. 33.2059 [1994]], [Carell et al., Angew. Chem. Int. Ed. Engl. 33:2061 [1994]]; 및 [Gallop et al., J. Med. Chem. 37:1233 [1994]].
화합물의 라이브러리는 용액 (예를 들어, 문헌 [Houghten, Biotechniques 13:412-421 [1992]]) 내에, 또는 비드 (문헌 [Lam, Nature 354:82-84 [1991]]), 칩 (문헌 [Fodor, Nature 364:555-556 [1993]]), 박테리아 또는 포자 (본원에 참고로 포함되는 미국 특허 5,223,409), 플라스미드 (문헌 [Cull et al., Proc. Nad. Acad. Sci. USA 89:18651869 [1992]]) 위에, 또는 파지 (문헌 [Scott and Smith, Science 249:386-390 [1990]], [Devlin Science 249:404-406 [1990]], [Cwirla et al., Proc. Natl. Acad. Sci. 87:6378-6382 [1990]], [Felici, J. Mol. Biol. 222:301 [1991]]) 위에 제공될 수 있다.
한 실시양태에서, 검정은 암 마커 mRNA 또는 단백질 또는 그의 생물학적 활성 부분을 발현하는 세포를 시험 화합물과 접촉시켜, 암 마커의 활성을 조정하는 시험 화합물의 능력을 측정하는 세포 기재 검정이다. 암 마커 활성을 조정하는 시험 화합물의 능력을 측정하는 것은, 예를 들어 효소적 활성, 파괴 또는 mRNA 등에서의 변화를 모니터링함으로써 달성될 수 있다.
화합물, 예를 들어 암 마커 기질 또는 조절제에 결합하는 암 마커를 조정하는 시험 화합물의 능력 또한 평가될 수 있다. 이는 예를 들어, 화합물, 예를 들어 기질을 방사선동위원소 또는 효소적 표지와 커플링시켜, 복합체 내에서 표지된 화합물, 예를 들어 기질을 검출하여 화합물, 예를 들어 기질의 암 마커에 대한 결합을 측정함으로써 달성될 수 있다.
별법으로는, 암 마커를 방사선동위원소 또는 효소적 표지와 커플링시켜, 복합체 내에서 암 마커 기재에 결합하는 암 마커를 조절하는 시험 화합물의 능력을 모니터링한다. 예를 들어, 화합물 (예를 들어, 기질)은 직접적 또는 간접적으로 125I, 35S, 14C 또는 3H에 의해, 또한 전파방출의 직접 계수 또는 섬광 계수에 의해 검출되는 방사선동위원소에 의해 표지될 수 있다. 별법으로, 화합물은 예를 들어, 양고추냉이 퍼옥시다제, 알칼리성 포스파타제 또는 루시퍼라제, 및 적절한 기질의 생성물로의 전환을 측정함으로써 검출되는 효소적 표지에 의해 효소적으로 표지될 수 있다.
임의의 상호작용물의 표지에 의해 또는 이것 없이 암 마커와 상호작용하는 화합물 (예를 들어, 암 마커 기질)의 능력을 평가할 수 있다. 예를 들어, 마이크로피지오미터(microphysiometer)를 사용하여 화합물 또는 암 마커의 표지 없이 암 마커와 화합물의 상호작용을 측정할 수 있다 (문헌 [McConnell et αl. Science 257:1906-1912 [1992]]). 본원에서 사용되는 바와 같은 "마이크로피지오미터" (예를 들어, 시토센서(Cytosensor))는 광-주소지정 전위차 센서 (LAPS)를 사용하여 세포가 그의 환경을 산성화하는 속도를 측정하는 분석 도구이다. 상기 산성화 속도에서의 변화는 화합물과 암 마커 사이의 상호작용에 대한 지표로 사용될 수 있다.
또 다른 실시양태에서, 암 마커 단백질 또는 그의 생물학적 활성 부분을 시험 화합물과 접촉시켜, 암 마커 단백질, mRNA, 또는 그의 생물학적 활성 부분에 결합하는 시험 화합물의 능력을 평가하는 세포-무함유 검정이 제공된다. 본 발명의 검정에 사용되는 암 마커 단백질 또는 mRNA의 바람직한 생물학적 활성 부분은 기질 또는 다른 단백질과의 상호작용에 관여하는 단편, 예를 들어 높은 표면 확률 점수를 갖는 단편을 포함한다.
세포-무함유 검정은 2종의 성분들이 상호작용하고 결합하는 것을 허용하기에 충분한 조건하에 충분한 시간 동안 표적 유전자 단백질 및 시험 화합물의 반응 혼합물을 제조하여 제거 및/또는 검출될 수 있는 복합체를 형성하게 하는 것을 수반한다.
2종의 분자들 사이의 상호작용은 또한 예를 들어 형광 에너지 전달 (FRET) (예를 들어, 미국 특허 5,631,169 (Lakowicz et al.), 미국 특허 4,968,103 (Stavrianopoulos et al.) 참조 (이들 문헌 각각은 본원에 참고로 포함됨))를 이용하여 검출될 수 있다. 형광단 표지는, 제1 공여 분자의 방출된 형광 에너지가 제2의 '수용' 분자상의 형광 표지에 의해 흡수되고 이후에 이것이 상기 흡수된 에너지로 인해 형광을 발할 수 있도록 선택된다.
별법으로, '공여' 단백질 분자는 단순히 트립토판 잔기의 천연 형광 에너지를 이용할 수 있다. 표지는 상이한 파장의 광을 방출하여 '수용' 분자 표지가 '공여자'의 것과는 차별화될 수 있는 것으로 선택된다. 표지들 사이의 에너지 전달 효율은 분자들 사이의 거리와 관련이 있기 때문에, 분자들 사이의 공간적 관계를 평가할 수 있다. 분자들 사이에 결합이 일어나는 상황에서는 '수용' 분자 표지의 형광 방출이 최대가 된다. FRET 결합 사건은 당업계 공지의 표준 형광측정 검출 수단을 통해 (예를 들어, 형광측정기를 사용함) 편리하게 결정될 수 있다.
또 다른 실시양태에서, 암 마커 단백질 또는 mRNA가 표적 분자에 결합하는 능력의 결정은 실시간 생체분자 상호작용 분석(Biomolecular Interaction Analysis) (BIA)을 이용하여 달성될 수 있다 (예를 들어, 문헌 [Sjolander and Urbaniczky, Anal. Chem. 63:2338-2345 [1991]] 및 [Szabo et al., Curr. Opin. Struct. Biol. 5:699-705 [1995]] 참조). "표면 플라스몬 공명" 또는 "BIA"는 임의의 상호작용물들의 표지 없이 생체특이적 상호작용을 실시간으로 검출한다 (예를 들어, BIAcore). 결합 표면에서의 질량 변화 (결합 사건의 지표)는 표면 근처에서의 광 굴절 지수를 변경시켜서 (표면 플라스몬 공명 (SPR)의 광학적 현상) 생물학적 분자들 사이의 실시간 반응의 지표로 이용될 수 있는 검출가능한 신호를 생성한다.
한 실시양태에서, 표적 유전자 생성물 또는 시험 물질을 고체 상에 앵커링시킨다. 고체 상에 앵커링된 표적 유전자 생성물/시험 화합물 복합체는 반응 종료시에 검출될 수 있다. 바람직하게는, 표적 유전자 생성물은 고체 표면에 앵커링될 수 있고, 시험 화합물 (고정되지 않음)은 본원에서 논의된 검출가능한 표지로 직접 또는 간접적으로 표지될 수 있다.
암 마커, 항암 마커 항체 또는 그의 표적 분자를 고정시켜서 복합체화된 형태를 단백질들 중 1종 또는 2종 모두의 복합체화되지 않은 형태로부터 분리하는 것을 용이하게 하고 또한 검정의 자동화를 수용하는 것이 바람직할 수 있다. 후보 화합물의 존재 및 부재하의 암 마커 단백질에 대한 시험 화합물의 결합 또는 암 마커 단백질과 표적 분자의 상호작용은 반응물질들을 함유하기에 적합한 임의의 용기에서 달성될 수 있다. 이러한 용기의 예는 미량역가 플레이트, 시험관 및 마이크로원심분리 튜브를 포함한다. 한 실시양태에서, 단백질들 중 1종 또는 2종 모두가 매트릭스에 결합되도록 하는 도메인이 추가된 융합 단백질이 제공될 수 있다. 예를 들어, 글루타티온-S-트랜스퍼라제-암 마커 융합 단백질 또는 글루타티온-S-트랜스퍼라제/표적 융합 단백질은 글루타티온 세파로스 비드 (시그마 케미컬(Sigma Chemical), 미국 미주리주 세인트루이스) 또는 글루타티온-유도체화된 미량역가 플레이트에 흡착될 수 있고, 이것을 이후에 시험 화합물과 조합하거나 시험 화합물 및 흡착되지 않은 표적 단백질 또는 암 마커 단백질과 조합하고, 상기 혼합물을 복합체 형성에 유리한 조건하에 (예를 들어, 염 및 pH에 대한 생리적 조건하에) 인큐베이션한다. 인큐베이션 후에, 비드 또는 미량역가 플레이트 웰을 세척하여 임의의 미결합 성분을 제거하고, 비드의 경우에는 매트릭스 고정된 복합체를 예를 들어 상기된 바와 같이 직접 또는 간접적으로 결정한다.
별법으로, 복합체를 매트릭스로부터 해리시킬 수 있고, 암 마커 결합 또는 활성의 수준을 표준 기술로 결정할 수 있다. 암 마커 단백질 또는 표적 분자를 매트릭스에 고정시키는 다른 기술은 비오틴 및 스트렙타비딘의 접합을 이용하는 것을 포함한다. 비오티닐화 암 마커 단백질 또는 표적 분자를 당업계 공지의 기술 (예를 들어, 비오티닐화 키트, 피어스 케미칼즈(Pierce Chemicals), 미국 일리노이주 록포드)을 이용하여 비오틴-NHS (N-히드록시-숙신이미드)로부터 제조하여 스트렙타비딘-코팅된 96웰 플레이트 (피어스 케미칼)의 웰에 고정시킬 수 있다.
검정을 수행하기 위해서, 고정되지 않은 성분을 앵커링된 성분을 함유하는 코팅된 표면에 첨가한다. 반응 완료 후, 형성된 임의의 복합체는 고체 표면에 고정된 채로 유지되도록 하는 조건하에 미반응 성분을 제거 (예를 들어, 세척에 의해 제거함)한다. 고체 표면에 앵커링된 복합체의 검출은 여러가지 방법으로 달성될 수 있다. 미리 고정시키지 않은 성분이 사전 표지된 경우, 표면에 고정된 표지의 검출은 복합체가 형성되었음을 나타낸다. 미리 고정시키지 않은 성분이 사전 표지되지 않은 경우, 표면에 앵커링된 복합체의 검출을 위해 예를 들어 고정된 성분에 특이적인 표지된 항체를 사용한 간접 표지 (이후, 상기 항체는 직접 표지될 수도 있고, 또는 예를 들어 표지된 항-IgG 항체로 간접적으로 표지될 수도 있음)가 사용될 수 있다.
이러한 검정은 암 마커 단백질 또는 표적 분자에는 반응성이지만 암 마커 단백질이 그의 표적 분자에 결합하는 것은 간섭하지 않는 항체를 이용하여 수행된다. 이러한 항체는 플레이트의 웰로 유도체화될 수 있고, 미결합 표적 또는 암 마커 단백질은 항체 접합에 의해 상기 웰에 포획된다. GST-고정된 복합체에 대해 상기된 것에 추가하여, 이러한 복합체를 검출하는 방법은 암 마커 단백질 또는 표적 분자에 반응성인 항체를 사용한 복합체의 면역검출, 및 또한 암 마커 단백질 또는 표적 분자와 관련이 있는 효소 활성을 검출하는 것에 의존하는 효소-결합 검정을 포함한다.
별법으로, 세포-무함유 검정은 액체 상에서 수행될 수 있다. 이러한 검정에서, 반응 생성물은 임의의 많은 표준 기술, 예를 들어 (이에 제한되지 않음) 차등 원심분리 (예를 들어, 문헌 [Rivas and Minton, Trends Biochem Sci 18:284-7 [1993]] 참조), 크로마토그래피 (겔 여과 크로마토그래피, 이온-교환 크로마토그래피), 전기영동 (예를 들어, 문헌 [Ausubel et al., eds. Current Protocols in Molecular Biology 1999, J. Wiley: New York] 참조) 및 면역침전 (예를 들어, 문헌 [Ausubel et al., eds. Current Protocols in Molecular Biology 1999, J. Wiley: New York] 참조)을 이용하여 미반응 성분으로부터 분리된다. 이러한 수지 및 크로마토그래피 기술은 당업자에게 공지되어 있다 (예를 들어, 문헌 [Heegaard J. Mol. Recognit 11:141-8 [1998]], [Hageand Tweed J. Chromatogr. Biomed. Sci. Appl 699:499-525 [1997]] 참조). 추가로, 본원에 기재된 바와 같이, 형광 에너지 전달이 또한 용액으로부터 복합체를 추가로 정제하지 않고 결합을 검출하는데 편리하게 이용될 수 있다.
이러한 검정은 암 마커 단백질, mRNA 또는 그의 생물학적 활성 부분을 암 마커와 결합하는 공지의 화합물과 접촉시켜서 검정 혼합물을 형성하고, 상기 검정 혼합물을 시험 화합물과 접촉시키며, 암 마커 단백질 또는 mRNA와 상호작용하는 시험 화합물의 능력을 결정하는 것을 포함할 수 있고, 여기서 암 마커 단백질 또는 mRNA와 상호작용하는 시험 화합물의 능력을 결정하는 것은 공지의 화합물과 비교하여 암 마커 또는 그의 생물학적 활성 부분에 우선적으로 결합하거나 표적 분자의 활성을 조정하는 시험 화합물의 능력을 결정하는 것을 포함한다.
암 마커가 생체내에서 1종 이상의 세포성 또는 세포외 거대분자, 예를 들어 단백질과 상호작용할 수 있는 정도까지는 이러한 상호작용의 억제제가 유용하다. 균질 검정을 이용하여 억제제를 확인할 수 있다.
예를 들어, 표적 유전자 생성물 및 상호작용하는 세포성 또는 세포외 결합 파트너 생성물의 사전 형성된 복합체를 제조하여 표적 유전자 생성물 또는 이것들의 결합 파트너는 표지되지만 상기 표지에 의해 생성된 신호는 복합체 형성으로 인해 켄칭(quenching)되도록 한다 (예를 들어, 면역검정을 위해 이러한 접근법을 이용하는 미국 특허 4,109,496 (본원에 참고로 포함됨) 참조). 사전 형성된 복합체로부터의 종 중 하나와 경쟁하거나 이것을 대체하는 시험 물질의 첨가는 백그라운드보다 강한 신호를 생성할 것이다. 이러한 방법으로, 표적 유전자 생성물-결합 파트너 상호작용을 파괴하는 시험 물질이 확인될 수 있다. 별법으로, 암 마커 단백질이 2-하이브리드 검정 또는 3-하이브리드 검정 (예를 들어, 미국 특허 5,283,317, [Zervos et al., Cell 72:223-232 [1993]], [Madura et al., J. Biol. Chem. 268. 12046-12054 [1993]], [Bartel et al., Biotechniques 14:920-924 [1993]], [Iwabuchi et al., Oncogene 8:1693-1696 [1993]] 및 WO 94/10300 (Brent) 참조 (이들 문헌 각각은 본원에 참고로 포함됨))에서의 "미끼(bait) 단백질"로 사용되어 암 마커 ("암 마커-결합 단백질" 또는 "암 마커-bp")와 결합하거나 상호작용하고 암 마커 활성에 관여하는 다른 단백질을 확인할 수 있다. 이러한 암 마커-bp는 암 마커 단백질 또는 표적에 의한 신호의 활성자 또는 억제제, 예를 들어 암 마커-매개 신호전달 경로의 하류 요소일 수 있다.
암 마커 발현의 조절제 또한 확인될 수 있다. 예를 들어, 세포 또는 세포-무함유 혼합물을 후보 화합물과 접촉시키고, 암 마커 mRNA 또는 단백질의 발현을 후보 화합물 부재하의 암 마커 mRNA 또는 단백질의 발현 수준과 비교하여 평가한다. 암 마커 mRNA 또는 단백질의 발현이 후보 화합물의 존재하에서 그의 부재시보다 더 높은 경우, 상기 후보 화합물은 암 마커 mRNA 또는 단백질 발현의 자극자로 확인된다. 별법으로, 암 마커 mRNA 또는 단백질의 발현이 후보 화합물의 존재하에서 그의 부재시보다 더 낮은 (즉, 통계적으로 유의하게 더 적은) 경우, 상기 후보 화합물은 암 마커 mRNA 또는 단백질 발현의 억제제로 확인된다. 암 마커 mRNA 또는 단백질 발현의 수준은 암 마커 mRNA 또는 단백질 검출과 관련하여 본원에 기재된 방법으로 결정될 수 있다.
세포 기재 또는 세포-무함유 검정을 이용하여 조절제가 확인될 수 있고, 상기 작용제가 암 마커 단백질의 활성을 조정하는 능력은 생체내에서, 예를 들어 질환에 관한 동물 모델과 같은 동물 (예를 들어, 전립선암 또는 전이성 전립선암을 갖는 동물, 또는 동물 (예를 들어, 인간)로부터의 전립선암의 이종이식편, 또는 전립선암의 전이 (예를 들어, 림프절, 뼈 또는 간으로의 전이)로 인한 암으로부터의 세포, 또는 전립선암 세포주로부터의 세포를 갖는 동물)에서 확인될 수 있다.
추가로, 본 발명은 상기 기재된 스크리닝 검정 (예를 들어, 암 요법에 관한 하기 기재 참조)으로 확인되는 신규 작용제에 관한 것이다. 따라서, 본원에 기재된 바와 같이 확인된 작용제 (예를 들어, 암 마커 조절제, 안티센스 암 마커 핵산 분자, siRNA 분자, 암 마커 특이적 항체, 또는 암 마커-결합 파트너)를 적절한 동물 모델 (예를 들어, 본원에 기재된 것)에서 추가로 사용하여 이러한 작용제 처치의 효능, 독성, 부작용 또는 작용 메카니즘을 결정하는 것은 본 발명의 범위 내이다. 또한, 상기 기재된 스크리닝 검정으로 확인된 신규 작용제는 예를 들어 본원에 기재된 바와 같은 치료를 위해 사용될 수 있다.
VI . 치료 용도
일부 실시양태에서, 본 발명은 암 (예를 들어, 전립선암)을 위한 요법을 제공한다. 일부 실시양태에서, 상기 요법은 본 발명의 유전자 융합체를 직접 또는 간접적으로 표적으로 한다.
A. RNA 간섭 및 안티센스 요법
일부 실시양태에서, 본 발명은 유전자 융합체의 발현을 표적으로 한다. 예를 들어, 일부 실시양태에서, 본 발명은 올리고머 안티센스 또는 RNAi 화합물, 특히 올리고뉴클레오티드 (예를 들어, 상기된 약물 스크리닝 방법에서 확인된 것들)를 포함하는 조성물을 사용하여, 본 발명의 암 마커를 코딩하는 핵산 분자의 기능을 조정하고, 궁극적으로는 발현되는 암 마커의 양을 조정한다.
1. RNA 간섭 ( RNAi )
일부 실시양태에서, RNAi가 융합 단백질 기능을 억제하는데 이용된다. RNAi는 인간을 포함하는 대부분의 진핵생물에서 외래 유전자의 발현을 제어하기 위한 진화적으로 보존된 세포 방어를 대표한다. RNAi는 전형적으로 이중 가닥 RNA (dsRNA)에 의해 촉발되고, dsRNA에 대한 반응에서 단일 가닥 표적 RNA 상동체의 서열-특이적 mRNA 분해를 야기한다. mRNA 분해의 매개자는 작은 간섭 RNA 이중나선 (siRNA)으로, 이것은 통상적으로 세포 내에서 긴 dsRNA로부터 효소에 의한 절단으로 생성된다. siRNA는 일반적으로 대략 21개 뉴클레오티드 길이 (예를 들어 21개 내지 23개 뉴클레오티드 길이)이고, 2개의 뉴클레오티드 3'-오버행(overhang)을 특징으로 하는 염기 쌍 형성 구조를 갖는다. 작은 RNA 또는 RNAi가 세포로 도입된 후, 서열이 RISC (RNA-유도된 침묵화 복합체(RNA-induced silencing complex))라고 불리는 효소 복합체로 전달된다고 여겨진다. RISC는 표적을 인식하여 이것을 엔도뉴클레아제로 절단한다. 보다 큰 RNA 서열이 세포에 전달되는 경우에는 RNase III 효소 (다이서(Dicer))가 보다 긴 dsRNA를 21개 내지 23개 nt의 ds siRNA 단편으로 전환시킨다는 것에 주목한다. 일부 실시양태에서, RNAi 올리고뉴클레오티드는 융합 단백질의 접합부 영역을 표적으로 하도록 디자인된다.
화학적으로 합성된 siRNA는 배양된 체세포 내 포유동물 유전자 기능의 게놈-와이드(genome-wide) 분석에 매우 효과적인 시약이 되었다. 유전자 기능의 입증에 있어서의 가치에 더하여, siRNA는 또한 유전자-특이적 치료제로서 대단한 잠재력을 지닌다 ([Tuschl and Borkhardt, Molecular Intervent. 2002; 2(3): 158-67] (본원에 참고로 포함됨)).
siRNA를 동물 세포로 형질감염시키면, 특정 유전자의 강력하고 오래 지속되는 전사후 침묵화가 유도된다 ([Caplen et al., Proc Natl Acad Sci U.S.A. 2001; 98: 9742-7], [Elbashir et al., Nature. 2001; 411:494-8], [Elbashir et al., Genes Dev. 2001;15: 188-200] 및 [Elbashir et al., EMBO J. 2001; 20: 6877-88] (이들 문헌 모두가 본원에 참고로 포함됨)). siRNA로 RNAi를 수행하기 위한 방법 및 조성물은 예를 들어 미국 특허 6,506,559 (본원에 참고로 포함됨)에 기재되어 있다.
siRNA는 표적화된 RNA의 양을 저하시키는데 매우 효과적이며, 연장 단백질에 의해 흔히 검출가능하지 않은 수준까지 저하시킨다. 침묵화 효과는 수개월 동안 지속될 수 있고, 흔히 표적 RNA와 siRNA 중앙 영역 사이의 1개의 뉴클레오티드 미스매치가 침묵화를 저해하는데 충분하기 때문에 매우 특이적이다 ([Brummelkamp et al., Science 2002; 296:550-3] 및 [Holen et al., Nucleic Acids Res. 2002; 30:1757-66] (이들 문헌 둘다 본원에 참고로 포함됨)).
siRNA의 디자인에 중요한 인자는 siRNA 결합에 접근가능한 부위의 존재이다. 문헌 [Bahoia et al., J. Biol. Chem., 2003; 278: 15991-15997] (본원에 참고로 포함됨)에는 효과적인 siRNA의 디자인시에 mRNA 내 접근가능한 부위를 찾기 위한, 스캐닝 어레이라 불리는 유형의 DNA 어레이의 사용이 기재되어 있다. 이러한 어레이는 단량체 내지 서열 내 각 염기의 단계별 부가에 의해 물리적 장벽 (마스크)을 사용하여 합성된 특정 최대치 (통상적으로는 코머(Comer)) 크기 범위의 올리고뉴클레오티드를 포함한다. 따라서, 상기 어레이는 표적 유전자 영역의 전체 올리고뉴클레오티드 상보체를 대표한다. 표적 mRNA를 이들 어레이에 혼성화하는 것은, 표적 mRNA의 상기 영역에 대한 철저한 접근성 프로파일을 제공하는 것이다. 이러한 데이터는 안티센스 올리고뉴클레오티드 (7 mer 내지 25 mer 범위)의 디자인에 유용하고, 이때 효능 및 표적 특이성을 보유하기 위해서는 올리고뉴클레오티드 길이와 결합 친화도 사이를 절충시키는 것이 중요하다 ([Sohail et al., Nucleic Acids Res., 2001; 29(10): 2041-2045]). siRNA의 선택에 관한 추가의 방법 및 관심사는 예를 들어 WO 05054270, WO 05038054A1, WO 03070966A2, [J Mol Biol. 2005 May 13;348(4):883-93], [J Mol Biol. 2005 May 13;348(4):871-81] 및 [Nucleic Acids Res. 2003 Aug 1;31(15):4417-24] (이들 문헌 각각은 그 전문이 본원에 참고로 포함됨)에 기재되어 있다. 또한, siRNA의 선택에 사용하기 위한 소프트웨어 (예를 들어, MWG 온라인 siMAX siRNA 디자인 도구)가 시판되고 있거나 공개적으로 이용가능하다.
2. 안티센스
다른 실시양태에서, 융합 단백질 발현은 본 발명의 암 마커를 코딩하는 1종 이상의 핵산과 특이적으로 혼성화하는 안티센스 화합물을 사용하여 조정된다. 올리고머 화합물과 그의 표적 핵산의 특이적 혼성화는 핵산의 정상적인 기능을 간섭한다. 일반적으로, 표적 핵산에 특이적으로 혼성화하는 화합물로 이러한 표적 핵산의 기능을 이와 같이 조정하는 것을 "안티센스"라고 지칭한다. 간섭될 DNA의 기능은 복제 및 전사를 포함한다. 간섭될 RNA의 기능은 모든 필수 기능, 예를 들어 RNA의 단백질 번역 부위로의 전좌, RNA로부터의 단백질 번역, 1종 이상의 mRNA 종 생성을 위한 RNA 스플라이싱, 및 RNA에 의하거나 RNA에 의해 용이해질 수 있는 촉매 활성을 포함한다. 표적 핵산 기능에 대한 이러한 간섭의 전반적인 효과는 본 발명의 암 마커 발현의 조정이다. 본 발명의 내용에서, "조정"은 유전자 발현의 증가 (자극) 또는 감소 (억제)를 의미한다. 예를 들어, 발현이 억제되어 종양 증식이 잠재적으로 예방될 수 있다.
안티센스를 위한 특정 핵산을 표적화하는 것이 바람직하다. 본 발명의 내용에서, 안티센스 화합물을 특정 핵산에 "표적화"하는 것은 다단계 과정이다. 상기과정은 일반적으로 조절될 기능의 핵산 서열을 확인하는 것으로 시작된다. 이것은 예를 들어 발현이 특정 장애 또는 질환 상태와 관련이 있는 세포의 유전자 (또는 이러한 유전자로부터 전사된 mRNA) 또는 감염원으로부터의 핵산 분자일 수 있다. 본 발명에서, 표적은 본 발명의 유전자 융합체를 코딩하는 핵산 분자이다. 표적화 과정은 또한 이 유전자 내에서 안티센스 상호작용이 일어나서 원하는 효과, 예를 들어 단백질 발현의 검출 또는 조정이 유도되는 부위(들)의 결정을 포함한다. 본 발명의 내용에서, 바람직한 유전자내 부위는 유전자 오픈 리딩 프레임 (ORF)의 번역 개시 또는 종료 코돈을 포함하는 영역이다. 번역 개시 코돈은 전형적으로 5'-AUG (전사된 mRNA 분자의 경우. 상응하는 DNA 분자에서는 5'-ATG)이기 때문에, 번역 개시 코돈은 또한 "AUG 코돈", "출발 코돈" 또는 "AUG 출발 코돈"이라 지칭된다. 소수의 유전자가 RNA 서열 5'-GUG, 5'-UUG 또는 5'-CUG의 번역 개시 코돈을 갖고, 5'-AUA, 5'-ACG 및 5'-CUG는 생체내에서 기능하는 것으로 나타났다. 따라서, 용어 "번역 개시 코돈" 및 "출발 코돈"은 많은 코돈 서열을 포함할 수 있지만, 각 경우의 개시자 아미노산은 전형적으로 메티오닌 (진핵생물의 경우) 또는 포르밀메티오닌 (원핵생물의 경우)이다. 진핵 및 원핵 유전자는 2종 이상의 대안적인 출발 코돈을 가질 수 있고, 이것들 중 임의의 것이 특정 세포 유형 또는 조직에서 또는 특정 세트의 조건하에서 번역 개시를 위해 우선적으로 사용될 수 있다. 본 발명의 내용에서, "출발 코돈" 및 "번역 개시 코돈"은 생체내에서 본 발명의 종양 항원을 코딩하는 유전자로부터 전사된 mRNA 분자의 번역을 개시하는데 사용되는 코돈(들)을 지칭하며, 이러한 코돈의 서열(들)과는 무관하다.
유전자의 번역 종료 코돈 (또는 "정지 코돈")은 3종의 서열 (즉, 5'-UAA, 5'-UAG 및 5'-UGA. 상응하는 DNA 서열은 각각 5'-TAA, 5'-TAG 및 5'-TGA임) 중 하나를 가질 수 있다. 용어 "출발 코돈 영역" 및 "번역 개시 코돈 영역"은 번역 개시 코돈으로부터 어느 한쪽 방향 (즉, 5' 또는 3')의 약 25개 내지 약 50개의 인접 뉴클레오티드를 포함하는 이러한 mRNA 또는 유전자의 일부를 지칭한다. 유사하게, 용어 "정지 코돈 영역" 및 "번역 종료 코돈 영역"은 번역 종료 코돈으로부터 어느 한쪽 방향 (즉, 5' 또는 3')의 약 25개 내지 약 50개의 인접 뉴클레오티드를 포함하는 이러한 mRNA 또는 유전자의 일부를 지칭한다.
오픈 리딩 프레임 (ORF) 또는 "코딩 영역"은 번역 개시 코돈과 번역 종료 코돈 사이의 영역을 지칭하며, 이것 역시 효과적으로 표적화될 수 있는 영역이다. 다른 표적 영역은 번역 개시 코돈으로부터 5' 방향의 mRNA 일부 (따라서, mRNA의 5' 캡 부위와 번역 개시 코돈 사이의 뉴클레오티드 또는 유전자상의 상응하는 뉴클레오티드를 포함함)를 지칭하는 5' 비번역 영역 (5' UTR), 및 번역 종료 코돈으로부터 3' 방향의 mRNA 일부 (따라서, mRNA의 번역 종료 코돈과 3' 말단부 사이의 뉴클레오티드 또는 유전자상의 상응하는 뉴클레오티드를 포함함)를 지칭하는 3' 비번역 영역 (3' UTR)을 포함한다. mRNA의 5' 캡은 mRNA의 5'-말단 잔기에 5'-5' 트리포스페이트 연결부를 통해 연결된 N7-메틸화 구아노신 잔기를 포함한다. mRNA의 5' 캡 영역은 5' 캡 구조 자체 및 또한 캡에 인접한 처음 50개 뉴클레오티드를 포함하는 것으로 고려된다. 캡 영역 역시 바람직한 표적 영역일 수 있다.
일부 진핵 mRNA 전사체는 바로 번역되지만, 많은 것들은 번역 전에 전사체로부터 절단되는 "인트론"이라 공지된 영역을 1개 이상 함유한다. 나머지 (및 따라서 번역되는) 영역은 "엑손"이라 공지되어 있고, 함께 스플라이싱되어 연속 mRNA 서열을 형성한다. mRNA 스플라이싱 부위 (즉, 인트론-엑손 접합부) 역시 바람직한 표적 영역일 수 있고, 질환에서 이상 스플라이싱이 나타나거나 질환에서 특정 mRNA 스플라이싱 생성물의 과다생성이 나타나는 상황에 특히 유용하다. 재배열 또는 결실로 인한 이상 융합 접합부 역시 바람직한 표적이다. 또한, 인트론 역시 예를 들어 DNA 또는 프리(pre)-mRNA를 표적으로 하는 안티센스 화합물의 효과적이고 그로 인해 바람직한 표적 영역일 수 있음이 밝혀졌다.
일부 실시양태에서, 안티센스 억제를 위한 표적 부위는 시판되는 소프트웨어 프로그램 (예를 들어, 독일 고팅겐에 소재하는 바이오그노스티크(Biognostik), 인도 벵갈루루에 소재하는 시스아리스 소프트웨어(SysArris Software), 영국 리버풀에 소재하는 유니버시티 오브 리버풀(University of Liverpool)의 안티센스 리써치 그룹(Antisense Research Group), 미국 캘리포니아주 칼스배드에 소재하는 진트루브(GeneTrove))을 이용하여 확인된다. 다른 실시양태에서, 안티센스 억제를 위한 표적 부위는 PCT 공개 WO 0198537A2 (본원에 참고로 포함됨)에 기재된 접근가능한 부위 방법을 이용하여 확인된다.
1개 이상의 표적 부위가 일단 확인되면, 표적에 충분히 상보적인 (즉, 충분한 특이성으로 충분히 혼성화되는) 올리고뉴클레오티드를 선택하여 원하는 효과를 달성한다. 예를 들어, 본 발명의 바람직한 실시양태에서, 안티센스 올리고뉴클레오티드는 출발 코돈 또는 그 부근을 표적으로 한다.
본 발명의 내용에서, 안티센스 조성물 및 방법과 관련한 "혼성화"는 상보적 뉴클레오시드 또는 뉴클레오티드 염기들 사이의 왓슨-크릭(Watson-Crick), 후그스틴(Hoogsteen) 또는 역 후그스틴 수소 결합일 수 있는 수소 결합을 의미한다. 예를 들어, 아데닌 및 티민은 수소 결합의 형성을 통해 쌍을 이루는 상보적인 핵염기이다. 안티센스 화합물의 서열이 특이적으로 혼성화가능하기 위해서 그의 표적 핵산의 서열과 100% 상보적일 필요는 없음이 이해된다. 안티센스 화합물은, 이 화합물이 표적 DNA 또는 RNA 분자에 결합하여 표적 DNA 또는 RNA의 정상적인 기능을 간섭함으로써 유용성을 상실하게 하고 안티센스 화합물이 특이적 결합이 요망되는 조건 (즉, 생체내 검정 또는 치료학적 처치의 경우에는 생리적 조건 및 시험관내 검정의 경우에는 이러한 검정이 수행되는 조건)하에 비-표적 서열과 비-특이적 결합하는 것을 피하기에 충분한 정도의 상보성이 있는 경우에 특이적으로 혼성화가능하다.
안티센스 화합물은 일반적으로 연구 시약 및 진단제로서 사용된다. 예를 들어, 유전자 발현을 특이적으로 억제할 수 있는 안티센스 올리고뉴클레오티드는 특정 유전자의 기능의 밝혀내는데 사용될 수 있다. 안티센스 화합물은 또한 예를 들어 생물학적 경로의 다양한 구성원들의 기능을 구별하는데 사용된다.
안티센스의 특이성 및 감수성은 또한 치료 용도에도 적용된다. 예를 들어, 안티센스 올리고뉴클레오티드는 동물 및 인간에서의 질환 상태 치료에 있어서 치료 잔기로서 사용되어 왔다. 안티센스 올리고뉴클레오티드는 인간에게 안전하고 효과적으로 투여되어 왔고, 수많은 임상 시험이 현재 진행중이다. 따라서, 올리고뉴클레오티드는 세포, 조직 및 동물, 특히 인간의 치료를 위한 치료법에 유용하다고 간주될 수 있는 유용한 치료 양식임이 확립되어 있다.
안티센스 올리고뉴클레오티드가 안티센스 화합물의 바람직한 형태이지만, 본 발명은 하기 기재된 바와 같은 올리고뉴클레오티드 모방체를 포함하지만 이에 제한되지 않는 다른 올리고머 안티센스 화합물을 포함한다. 본 발명에 따른 안티센스 화합물은 바람직하게는 약 8개 내지 약 30개의 핵염기 (즉, 약 8개 내지 약 30개의 연결된 염기)를 포함하지만, 이보다 더 길거나 더 짧은 서열 둘다 본 발명에 따라 사용될 수 있다. 특히 바람직한 안티센스 화합물은 안티센스 올리고뉴클레오티드이고, 훨씬 더욱 바람직하게는 약 12개 내지 약 25개의 핵염기를 포함하는 것들이다.
본 발명에서 유용한 바람직한 안티센스 화합물의 구체적인 예는 변형된 주쇄 또는 비-천연 뉴클레오시드간 연결부를 함유하는 올리고뉴클레오티드를 포함한다. 본 명세서에서 정의된 바와 같이, 변형된 주쇄를 갖는 올리고뉴클레오티드는 주쇄에 인 원자를 보유하는 것들 및 주쇄에 인 원자를 갖지 않는 것들을 포함한다. 본 명세서의 목적상, 뉴클레오시드간 주쇄에 인 원자를 갖지 않는 변형된 올리고뉴클레오티드 역시 올리고뉴클레오시드인 것으로 간주될 수 있다.
바람직한 변형된 올리고뉴클레오티드 주쇄는 예를 들어 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 기타 알킬 포스포네이트, 예컨대 3'-알킬렌 포스포네이트 및 키랄 포스포네이트, 포스피네이트, 포스포르아미데이트, 예컨대 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 통상적인 3'-5' 연결부를 갖는 보라노포스페이트, 이것들의 2'-5' 연결된 유사체, 및 인접한 쌍의 뉴클레오시드 단위들이 3'-5'와 5'-3' 또는 2'-5'와 5'-2'로 연결된 도립된 극성을 갖는 것들을 포함한다. 다양한 염, 혼합 염 및 유리 산 형태 역시 포함된다.
인 원자를 내부에 포함하지 않는 바람직한 변형된 올리고뉴클레오티드 주쇄는 단쇄 알킬 또는 시클로알킬 뉴클레오티시드간 연결부, 혼합 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결부, 또는 1개 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결부에 의해 형성된 주쇄를 갖는다. 이것들은, 모르폴리노 연결부 (부분적으로는 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 주쇄; 술피드, 술폭시드 및 술폰 주쇄; 포름아세틸 및 티오포름아세틸 주쇄; 메틸렌 포름아세틸 및 티오포름아세틸 주쇄; 알켄 함유 주쇄; 술파메이트 주쇄; 메틸렌이미노 및 메틸렌히드라지노 주쇄; 술포네이트 및 술폰아미드 주쇄; 아미드 주쇄를 갖는 것들; 및 혼합된 N, O, S 및 CH2 성분 부분들을 갖는 것들을 포함한다.
다른 바람직한 올리고뉴클레오티드 모방체에서, 뉴클레오티드 단위의 당 및 뉴클레오시드간 연결부 둘다 (즉, 주쇄) 새로운 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 혼성화를 위해 유지된다. 우수한 혼성화 특성을 갖는 것으로 나타난 올리고뉴클레오티드 모방체인 이러한 올리고머 화합물은 펩티드 핵산 (PNA)이라 지칭된다. PNA 화합물에서, 올리고뉴클레오티드의 당-주쇄는 특정 아미노에틸글리신 주쇄에서 아미드 함유 주쇄로 대체된다. 핵염기는 보유되고, 주쇄 아미드 부분의 아자 질소 원자에 직접 또는 간접적으로 결합된다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 5,539,082, 5,714,331 및 5,719,262 (이들 문헌 각각은 본원에 참고로 포함됨)를 포함하지만 이에 제한되지 않는다. PNA 화합물에 관한 추가의 교시는 문헌 [Nielsen et al., Science 254: 1497 (1991)]에서 찾을 수 있다.
본 발명의 가장 바람직한 실시양태는 포스포로티오에이트 주쇄를 갖는 올리고뉴클레오티드 및 헤테로원자 주쇄를 갖는 올리고뉴클레오시드, 및 특히 상기 인용된 미국 특허 제5,489,677호의 -CH2, -NH-O-CH2-, -CH2-N(CH3)-O-CH2- [메틸렌 (메틸이미노) 또는 MMI 주쇄로도 공지됨], -CH2-O-N(CH3)-CH2-, -CH2-N(CH3)-N(CH3)-CH2-, 및 -O-N(CH3)-CH2-CH2- [여기서, 천연 포스포디에스테르 주쇄는 -O-P-O-CH2-로 나타냄], 및 상기 인용된 미국 특허 제5,602,240호의 아미드 주쇄를 갖는 올리고뉴클레오티드이다. 상기 인용된 미국 특허 제5,034,506호의 모르폴리노 주쇄 구조를 갖는 올리고뉴클레오티드 또한 바람직하다.
변형된 올리고뉴클레오티드는 또한 1개 이상의 치환된 당 잔기를 함유할 수 있다. 바람직한 올리고뉴클레오티드는 2' 위치에서 다음 중 하나를 포함한다: OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬 (여기서, 상기 알킬, 알케닐 및 알키닐은 치환되거나 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있음). O[(CH2)nO]mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2, 및 O(CH2)nON[(CH2)nCH3)]2 (여기서, n 및 m은 1 내지 약 10임)이 특히 바람직하다. 다른 바람직한 올리고뉴클레오티드는 2' 위치에서 다음 중 하나를 포함한다: C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로시클로알킬, 헤테로시클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단기, 리포터 기, 인터칼레이터, 올리고뉴클레오티드의 약동학 특성을 개선시키는 기, 또는 올리고뉴클레오티드의 약력학 특성을 개선시키는 기, 및 유사한 특성을 가진 다른 치환기. 바람직한 변형에는 2'-메톡시에톡시 (2'-O-CH2CH2OCH3, 2'-O-(2-메톡시에틸) 또는 2'-MOE로도 알려져 있음) (문헌 [Martin et al., Helv. Chim. Acta 78:486 [1995]]) 즉, 알콕시알콕시기가 포함된다. 추가의 바람직한 변형에는 2'-디메틸아미노옥시에톡시 (즉, O(CH2)2ON(CH3)2 기, 2'-DMAOE로도 알려져 있음), 및 2'-디메틸아미노에톡시에톡시 (당업계에 2'-O-디메틸아미노에톡시에틸 또는 2'-DMAEOE로도 알려져 있음), 즉, 2'-O-CH2-O-CH2-N(CH2)2가 포함된다.
다른 바람직한 변형에는 2'-메톡시 (2'-O-CH3), 2'-아미노프로폭시 (2'-OCH2CH2CH2NH2) 및 2'-플루오로 (2'-F)가 포함된다. 또한, 유사한 변형이 올리고뉴클레오티드 상의 다른 위치에서, 특히 3' 말단 뉴클레오티드 상의 당 또는 2'-5' 연결된 올리고뉴클레오티드에서의 3' 위치에서, 및 5' 말단 뉴클레오티드의 5' 위치에서도 이루어질 수 있다. 또한, 올리고뉴클레오티드는 펜토푸라노실 당 대신에 당 모방체, 예컨대 시클로부틸 잔기를 가질 수 있다.
올리고뉴클레오티드는 핵염기 (당업계에서 간단히 "염기"로 종종 지칭됨) 변형 또는 치환을 또한 포함할 수 있다. 본원에서 사용된 "변형되지 않은" 또는 "천연" 핵염기에는 퓨린 염기인 아데닌 (A) 및 구아닌 (G), 및 피리미딘 염기인 티미딘 (T), 시토신 (C) 및 우라실 (U)이 포함된다. 변형된 핵염기에는 다른 합성 및 천연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 히포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌이 포함된다. 추가의 핵염기에는 미국 특허 제3,687,808호에 개시된 것이 포함된다. 이들 핵염기 중 일부는 본 발명의 올리고머 화합물의 결합 친화도를 증가시키는데 특히 유용하다. 이들에는 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 퓨린, 예를 들어 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신이 포함된다. 5-메틸시토신 치환은 0.6-1.2℃만큼 핵산 이중나선 안정성을 증가시키는 것으로 확인되었고, 이는 현재 바람직한 염기 치환이며, 2'-O-메톡시에틸 당 변경과 조합될 때 훨씬 더 특히 바람직한 염기 치환이다.
본 발명의 올리고뉴클레오티드의 또 다른 변형은, 올리고뉴클레오티드의 활성, 세포 분포 또는 세포 흡수를 개선시키는 하나 이상의 잔기 또는 접합체를 올리고뉴클레오티드에 화학적으로 연결시키는 것을 포함한다. 이러한 잔기에는 지질 잔기, 예컨대 콜레스테롤 잔기, 콜산, 티오에테르, (예를 들어, 헥실-S-트리틸티올), 티오콜레스테롤, 지방족 쇄, (예를 들어, 도데칸디올 또는 운데실 잔기), 인지질, (예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트), 폴리아민 또는 폴리에틸렌 글리콜 쇄 또는 아다만탄 아세트산, 팔미틸 잔기, 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 잔기가 포함되나 이로 제한되지 않는다.
당업자는 상기 기재된 변형을 함유하는 올리고뉴클레오티드를 생성하는 방법을 잘 알고 있다. 본 발명은 상기 기재된 안티센스 올리고뉴클레오티드로 제한되지 않는다. 임의의 적합한 변형 또는 치환이 이용될 수 있다.
주어진 화합물의 모든 위치가 균일하게 변형될 필요는 없고, 사실상 1개 초과의 상기 언급된 변형이 단일 화합물 또는 심지어 올리고뉴클레오티드 내의 단일 뉴클레오시드에 도입될 수 있다. 본 발명은 또한 키메라 화합물인 안티센스 화합물도 포함한다. 본 발명의 문맥에서 "키메라" 안티센스 화합물 또는 "키메라"는 각각 1개 이상의 단량체 단위 (즉, 올리뉴클레오티드 화합물의 경우에는 뉴클레오티드)로 이루어진 2개 이상의 화학적으로 상이한 영역을 함유하는 안티센스 화합물, 특히 올리고뉴클레오티드이다. 전형적으로, 이들 올리고뉴클레오티드는, 뉴클레아제 분해에 대한 증가된 내성, 증가된 세포 흡수 및/또는 표적 핵산에 대한 증가된 결합 친화도가 올리고뉴클레오티드에게 부여되도록 올리고뉴클레오티드가 변형된 1개 이상의 영역을 함유한다. 올리고뉴클레오티드의 추가의 영역은 RNA:DNA 또는 RNA:RNA 하이브리드를 절단할 수 있는 효소에 대한 기질로서 작용할 수 있다. 예를 들어, RNaseH는 RNA:DNA 이중나선의 RNA 가닥을 절단하는 세포성 엔도뉴클레아제이다. 따라서, RNaseH의 활성화로 인해 RNA 표적이 절단되어 유전자 발현의 올리고뉴클레오티드 억제의 효율이 크게 증진된다. 결과적으로, 키메라 올리고뉴클레오티드가 사용되는 경우, 동일한 표적 영역에 혼성화되는 포스포로티오에이트 데옥시올리고뉴클레오티드와 비교할 때 더 짧은 올리고뉴클레오티드를 사용하여 유사한 결과가 종종 달성될 수 있다. RNA 표적의 절단은 겔 전기영동, 및 필요에 따라 당업계에 공지된 관련 핵산 혼성화 기술에 의해 통상적으로 검출될 수 있다.
본 발명의 키메라 안티센스 화합물은 상기 기재된 바와 같은 2개 이상의 올리고뉴클레오티드, 변형된 올리고뉴클레오티드, 올리고뉴클레오시드 및/또는 올리고뉴클레오티드 모방체의 복합 구조체로서 형성될 수 있다.
본 발명은 또한 상기 기재된 바와 같은 본 발명의 안티센스 화합물을 포함하는 제약 조성물 및 제제를 포함한다.
B. 유전자 요법
본 발명은 본 발명의 유전자 융합체의 발현을 조절하는데 사용하기 위한 임의의 유전자 조작의 용도를 고려한다. 유전자 조작의 예에는 유전자 녹아웃 (예를 들어, 염색체로부터 예를 들어 재조합을 이용하여 융합 유전자를 제거함), 유도가능한 프로모터와 함께 또는 없이 안티센스 화합물 구축물의 발현 등이 포함되나, 이로 제한되지 않는다. 시험관 내에서 또는 생체 내에서 핵산 구축물의 세포로의 전달은 임의의 적합한 방법을 이용하여 수행될 수 있다. 적합한 방법은 원하는 사건이 발생하도록 (예를 들어, 안티센스 구축물의 발현) 핵산 구축물을 세포 내로 도입시키는 것이다. 유전자 요법은 또한 (예를 들어, 유도가능 프로모터 (예를 들어, 안드로겐-반응성 프로모터)에 의해 자극시) 생체 내에서 발현되는 siRNA 또는 다른 간섭 분자를 전달하는데 이용될 수 있다.
유전 정보를 보유한 분자를 세포 내로 도입하는 것은 임의의 다양한 방법, 예컨대 이로 제한되는 것은 아니지만 네이키드 DNA 구축물의 직접 주사, 상기 구축물이 로딩된 금 입자와의 충돌, 및 예를 들어 리포좀, 생중합체 등을 이용한 거대분자 매개된 유전자 전송에 의해 달성된다. 바람직한 방법은 바이러스, 예컨대 이로 제한되는 것은 아니지만 아데노바이러스, 레트로바이러스, 우두 바이러스, 및 아데노-관련 바이러스로부터 유래된 유전자 전달 비히클을 이용한다. 아데노바이러스로부터 유래된 벡터는 레트로바이러스에 비해 더 높은 효율성을 갖기 때문에, 생체 내에서 핵산 분자를 숙주 세포로 전송하는데 있어서 바람직한 유전자 전달 비히클이다. 아데노바이러스 벡터는 생체내 유전자를 동물 모델의 다양한 고형 종양으로 및 면역-결핍 마우스의 인간 고형 종양 이종이식편으로 전송하는데 매우 효율적인 것으로 확인되었다. 아데노바이러스 벡터 및 유전자 전송 방법의 예는 PCT 공개 WO 00/12738 및 WO 00/09675 및 미국 특허 출원 제6,033,908호, 제6,019,978호, 제6,001,557호, 제5,994,132호, 제5,994,128호, 제5,994,106호, 제5,981,225호, 제5,885,808호, 제5,872,154호, 제5,830,730호 및 제5,824,544호 (이들 각각은 그 전문이 본원에 참고로 포함됨)에 기재되어 있다.
벡터는 다양한 방식으로 대상체에게 투여될 수 있다. 예를 들어, 본 발명의 일부 실시양태에서, 벡터는 직접 주사를 이용하여 종양 또는 종양 관련 조직에 투여된다. 다른 실시양태에서, 혈액 또는 림프 순환을 통해 투여된다 (예를 들어, PCT 공개 99/02685 (그 전문이 본원에 참고로 포함된) 참조). 아데노바이러스 벡터의 예시적인 용량 수준은 바람직하게는 관류액에 첨가된 108 내지 1011 벡터 입자이다.
C. 항체 요법
일부 실시양태에서, 본 발명은 본 발명의 유전자 융합체를 발현하는 전립선 종양을 표적화하는 항체를 제공한다. 임의의 적합한 항체 (예를 들어, 모노클로날, 폴리클로날, 또는 합성)가 본원에 개시된 치료 방법에 사용될 수 있다. 바람직한 실시양태에서, 암 요법을 위해 사용되는 항체는 인간화 항체이다. 항체를 인간화시키는 방법은 당업계에 널리 공지되어 있다 (예를 들어, 미국 특허 제6,180,370호, 제5,585,089호, 제6,054,297호, 및 제5,565,332호 (이들 각각은 그 전문이 본원에 참고로 포함됨) 참조).
일부 실시양태에서, 치료용 항체는 본 발명의 유전자 융합체에 대해 생성된 항체를 포함하며, 여기서 상기 항체는 세포독성제에 접합되어 있다. 이러한 실시양태에서, 정상 세포를 표적화하지 않는 종양 특이적 치료제가 생성되며, 따라서 전형적인 화학요법의 많은 해로운 부작용이 감소된다. 특정한 적용의 경우, 상기 치료제가 항체에 부착하는데 유용한 작용제, 특히 세포독성제, 또는 내피 세포의 성장 또는 세포 분열을 사멸 또는 억제하는 능력을 가진 다른 항세포 작용제로서의 역할을 하는 약리적 작용제일 것으로 예상된다. 본 발명은 항체에 접합되고 활성 형태로 전달될 수 있는 임의의 약리적 작용제의 용도를 고려한다. 예시적인 항세포 작용제에는 화학요법제, 방사성동위원소 및 세포독소가 포함된다. 본 발명의 치료용 항체는 다양한 세포독성 잔기, 예컨대 이로 제한되는 것은 아니지만 방사성 동위원소 (예를 들어, 요오드-131, 요오드-123, 테크니슘-99m, 인듐-111, 레늄-188, 레늄-186, 갈륨-67, 구리-67, 이트륨-90, 요오드-125 또는 아스타틴-211), 호르몬, 예를 들어 스테로이드, 항대사물질, 예를 들어 시토신 (예를 들어, 아라비노시드, 플루오로우라실, 메토트렉세이트 또는 아미노프테린; 안트라시클린; 미토마이신 C), 빈카 알칼로이드 (예를 들어, 데메콜신; 에토포시드; 미트라마이신), 및 항종양 알킬화제, 예컨대 클로람부실 또는 멜팔란을 포함할 수 있다. 다른 실시양태는 응고제, 시토카인, 성장 인자, 박테리아 내독소, 또는 박테리아 내독소의 지질 A 잔기와 같은 작용제를 포함할 수 있다. 예를 들어, 일부 실시양태에서, 치료제는 단지 몇몇 예로서 식물-, 진균- 또는 박테리아-유래된 독소, 예를 들어 A 쇄 독소, 리보솜 불활성화 단백질, α-사르신, 아스퍼질린, 레스트릭토신, 리보뉴클레아제, 디프테리아 독소 또는 슈도모나스 외독소를 포함할 것이다. 일부 바람직한 실시양태에서, 데글리코실화 리신 A 쇄가 사용된다.
어느 경우이든, 이들과 같은 작용제는 필요에 따라 공지된 접합 기술을 이용하여 표적화된 종양 세포의 부위에서 혈액 성분으로의 그들의 표적화, 내재화, 방출 또는 제시를 가능하게 하는 방식으로 성공적으로 항체에 접합될 수 있는 것으로 제안된다 (예를 들어, 문헌 [Ghose et al., Methods Enzymol., 93:280 [1983]] 참조). 예를 들어, 일부 실시양태에서, 본 발명은 본 발명의 암 마커 (예를 들어, ERG 또는 ETV1 융합체)를 표적화하는 면역독소를 제공한다. 면역독소는 특이적 표적화제, 일반적으로 종양-지시 항체 또는 단편과 세포독성제, 예를 들어 독소 잔기의 접합체이다. 표적화제는 독소를 표적화된 항원을 보유하는 세포로 지시하여 상기 세포를 선택적으로 사멸시킨다. 일부 실시양태에서, 치료용 항체는 높은 생체내 안정성을 제공하는 가교제를 사용한다 (문헌 [Thorpe et al., Cancer Res., 48:6396 [1988]]).
다른 실시양태에서, 특히 고형 종양의 치료와 관련하여, 항체는 혈관 내피 세포의 성장 또는 세포 분열을 억제함으로써 세포독성 또는 종양 혈관계에 대한 다른 항세포 효과를 갖도록 고안된다. 이 공격은 종양-국소적 혈관 허탈로 이어져, 종양 세포, 특히 혈관계에서 멀리 떨어져 있는 이들 종양 세포에게서 산소 및 영양물질을 박탈시켜, 궁극적으로 세포 사멸 및 종양 괴사로 이어진다.
바람직한 실시양태에서, 항체 기재 치료제는 하기 기재된 제약 조성물로서 제제화된다. 바람직한 실시양태에서, 본 발명의 항체 조성물의 투여에 의해 암에서 측정가능한 감소 (예를 들어, 종양의 감소 또는 제거)가 나타난다.
D. 제약 조성물
본 발명은 추가로 (예를 들어 본 발명의 유전자 융합체의 발현 또는 활성을 조절하는 제약 작용제를 포함하는) 제약 조성물을 제공한다. 본 발명의 제약 조성물은 국소 또는 전신 치료가 바람직한지 여부 및 치료될 영역에 따라 수많은 방식으로 투여될 수 있다. 투여는 국소 (안과적 투여, 및 질 및 직장 전달을 비롯한 점막으로의 투여 포함), 폐 (예를 들어, 분말 또는 에어로졸의 흡입 또는 취입에 의해, 예컨대 분무기에 의해; 기관내, 비내, 상피 및 경피), 경구 또는 비경구일 수 있다. 비경구 투여는 정맥내, 동맥내, 피하, 복강내 또는 근육내 주사 또는 주입; 또는 두개내, 예를 들어 경막내 또는 관절내 투여를 포함한다.
국소 투여용 제약 조성물 및 제제에는 경피 패치, 연고, 로션, 크림, 겔, 점적액, 좌약, 스프레이, 액체 및 분말이 포함될 수 있다. 통상의 제약 담체, 수성, 분말 또는 유성 기재, 증점제 등이 필요하거나 바람직할 수 있다..
경구 투여용 조성물 및 제제에는 분말 또는 과립, 물 또는 비-수성 매질 중의 현탁액 또는 용액, 캡슐, 사쉐 또는 정제가 포함된다. 증점제, 향미제, 희석제, 유화제, 분산 조제 또는 결합제가 바람직할 수 있다.
비경구, 경막내 또는 관절내 투여용 조성물 및 제제에는 완충제, 희석제 및 다른 적합한 첨가제, 예컨대 이로 제한되는 것은 아니지만 투과 향상제, 담체 화합물 및 다른 제약상 허용되는 담체 또는 부형제를 함유할 수 있는 멸균 수용액을 포함할 수 있다.
본 발명의 제약 조성물에는 용액, 에멀젼, 및 리포좀-함유 제제가 포함되나, 이로 제한되지 않는다. 이들 조성물은 사전 형성된 액체, 자가-유화성 고체 및 자가-유화성 반고체를 포함하나 이로 제한되지 않는 다양한 성분으로부터 생성될 수 있다.
단위 투여 형태로 편리하게 제시될 수 있는 본 발명의 제약 제제는 제약산업에 널리 공지된 통상적인 기술에 따라 제조될 수 있다. 이러한 기술은 활성 성분을 제약 담체(들) 또는 부형제(들)와 회합시키는 단계를 포함한다. 일반적으로 제제는, 활성 성분을 액체 담체 또는 미분된 고체 담체 또는 이들 둘 다와 균일하고 친밀하게 회합시킨 다음, 필요에 따라 제품으로 성형함으로써 제조된다.
본 발명의 조성물은 임의의 여러 가능한 투여 형태, 예컨대 이로 제한되는 것은 아니지만 정제, 캡슐, 액체 시럽, 연질 겔, 좌약, 및 관장제로 제제화될 수 있다. 본 발명의 조성물은 또한 수성, 비수성 또는 혼합 매질 중의 현탁액으로서 제제화될 수 있다. 수성 현탁액은 현탁액의 점성을 증가시키는 물질, 예를 들어 나트륨 카르복시메틸셀룰로스, 소르비톨 및/또는 덱스트란을 추가로 함유할 수 있다. 현탁액은 안정화제 또한 함유할 수 있다.
본 발명의 한 실시양태에서, 제약 조성물은 발포체로서 제제화되어 사용될 수 있다. 제약 발포체는 에멀젼, 마이크로에멀젼, 크림, 젤리 및 리포좀과 같은 이로 제한되지 않는 제제를 포함한다. 이들 제제는 기본적으로 유사하지만, 성분 및 최종 생성물의 점조도의 면에서 상이하다.
올리고뉴클레오티드의 흡수를 세포 수준에서 증진시키는 작용제 또한 본 발명의 제약 조성물 및 다른 조성물에 첨가될 수 있다. 예를 들어, 양이온성 지질, 예를 들어 리포펙틴 (미국 특허 제5,705,188호), 양이온성 글리세롤 유도체, 및 다가양이온성 분자, 예를 들어 폴리리신 (WO 97/30731) 또한 올리고뉴클레오티드의 세포 흡수를 증진시킨다.
본 발명의 조성물은 제약 조성물에서 통상적으로 발견되는 다른 보조 성분을 추가로 함유할 수 있다. 따라서, 예를 들어, 조성물은 추가의 상용성 제약 활성 물질, 예를 들어 항소양제, 수렴제, 국소 마취제 또는 항염증제를 함유할 수 있거나, 본 발명의 조성물의 다양한 투여 형태를 물리적으로 제제화하는데 유용한 추가의 물질, 예를 들어 염료, 향미제, 보존제, 항산화제, 불투명화제, 증점제 및 안정화제를 함유할 수 있다. 그러나, 이러한 물질은 첨가될 때 본 발명의 조성물의 성분들의 생물학적 활성을 과도하게 방해하지 않아야 한다. 제제는 멸균되어야 하고, 필요에 따라 제제의 핵산(들)과 유해하게 상호작용하지 않는 보조제, 예를 들어 윤활제, 보존제, 안정화제, 습윤제, 유화제, 삼투압에 영향을 주기 위한 염, 완충제, 착색제, 향미제 및/또는 방향성 물질 등과 혼합될 수 있다.
본 발명의 특정 실시양태는 (a) 하나 이상의 안티센스 화합물 및 (b) 비-안티센스 메카니즘에 의해 기능을 하는 하나 이상의 다른 화학요법제를 함유하는 제약 조성물을 제공한다. 이러한 화학요법제의 예에는 항암 약물, 예컨대 다우노루비신, 닥티노마이신, 독소루비신, 블레오마이신, 미토마이신, 질소 머스타드, 클로람부실, 멜팔란, 시클로포스파미드, 6-메르캅토퓨린, 6-티오구아닌, 시타라빈 (CA), 5-플루오로우라실 (5-FU), 플록수리딘 (5-FUdR), 메토트렉세이트 (MTX), 콜히친, 빈크리스틴, 빈블라스틴, 에토포시드, 테니포시드, 시스플라틴 및 디에틸스틸베스트롤 (DES)이 포함되나, 이로 제한되지 않는다. 항염증성 약물, 예컨대 이로 제한되는 것은 아니지만 비스테로이드성 항염증성 약물 및 코르티코스테로이드, 및 항바이러스성 약물, 예컨대 이로 제한되는 것은 아니지만 리비비린, 비다라빈, 아시클로비르 및 간시클로비르 또한 본 발명의 조성물 중에서 조합될 수 있다. 다른 비-안티센스 화학요법제 또한 본 발명의 범위 내에 있다. 2종 이상 조합된 화합물은 함께 또는 순차적으로 사용될 수 있다.
투약은 치료할 질환 상태의 중증도 및 반응성에 따라 좌우되고, 여기서 치료 과정은 수일 내지 수개월, 또는 치유가 이루어지거나 질환 상태의 축소가 달성될 때까지 지속한다. 최적 투약 스케쥴은 환자의 신체 내의 약물 축적의 측정으로부터 계산할 수 있다. 투여하는 의사는 최적의 투여량, 투약 방법론 및 반복 속도를 용이하게 결정할 수 있다. 최적 투여량은 개별 올리고뉴클레오티드의 상대적인 효능에 따라 달라질 수 있고, 일반적으로 시험관내 및 생체내 동물 모델에서 효과적인 것으로 밝혀진 EC50에 기초하여 또는 본원에 기재된 실시예에 기초하여 추정될 수 있다. 일반적으로, 투여량은 0.01 ㎍ 내지 100 g/kg (체중)이며, 매일, 매주, 매달 또는 매년 1회 이상 제공될 수 있다. 치료하는 의사는 체액 또는 체조직 내에서의 약물의 측정된 체류 시간 및 농도에 기초하여 투여를 위한 반복 속도를 추정할 수 있다. 성공적인 치료 후에는, 대상체가 질환 상태의 재발을 방지하기 위해 유지 요법을 진행하는 것이 바람직할 수 있으며, 여기서 올리고뉴클레오티드가 0.01 ㎍ 내지 100 g/kg (체중) 범위의 유지 용량으로 매일 1회 이상 내지 매 20년마다 1회 투여된다.
VII . 트랜스제닉 동물
본 발명은 본 발명의 외인성 암 마커 유전자 (예를 들어, 유전자 융합체) 또는 그의 돌연변이체 및 변이체 (예를 들어, 말단 절단 또는 단일 뉴클레오티드 다형성)를 포함하는 트랜스제닉 동물의 생성을 고려한다. 바람직한 실시양태에서, 트랜스제닉 동물은 야생형 동물과 비교해서 변경된 표현형 (예를 들어, 마커 존재의 증가 또는 감소)을 디스플레이한다. 이러한 표현형의 존재 또는 부재를 분석하기 위한 방법에는 본원에 개시된 것들이 포함되나, 이로 제한되지 않는다. 일부 바람직한 실시양태에서, 트랜스제닉 동물은 종양 성장의 증가 또는 감소 또는 암의 증거를 추가로 디스플레이한다.
본 발명의 트랜스제닉 동물은 약물 (예를 들어, 암 요법제) 스크리닝에서의 용도가 확인된다. 일부 실시양태에서, 시험 화합물 (예를 들어, 암 치료에 유용한 것으로 의심되는 약물) 및 대조군 화합물 (예를 들어, 위약)을 트랜스제닉 동물 및 대조군 동물에게 투여하여, 효과를 평가한다.
트랜스제닉 동물은 다양한 방법을 통해 생성될 수 있다. 일부 실시양태에서, 다양한 발생 단계의 배아 세포를 사용하여 트랜스제닉 동물의 생성을 위한 트랜스진을 도입한다. 배아 세포의 발생 단계에 따라 상이한 방법이 이용된다. 접합자는 미량-주사를 위한 최상의 표적이다. 마우스에서, 수컷 전핵은 약 20 마이크로미터 크기의 직경에 달하며, 이는 DNA 용액의 1-2 피코리터 (pl)의 재현가능한 주사를 허용한다. 유전자 전송을 위한 표적으로서 접합자의 사용은, 대부분의 경우에 주사된 DNA가 제1 절단 이전에 숙주 게놈으로 도입될 것이라는 점에서 큰 이점을 갖는다 (문헌 [Brinster et al., Proc. Natl. Acad. Sci. USA 82:4438-4442 [1985]]). 결과적으로, 트랜스제닉 비-인간 동물의 모든 세포는 도입된 트랜스진을 보유할 것이다. 일반적으로, 배아 세포의 50%가 트랜스진을 가질 것이기 때문에, 이는 또한 트랜스진을 조상의 자손에게 효과적으로 전달되는 것을 반영할 것이다. 미국 특허 제4,873,191호는 접합자의 미량-주사 방법을 기재하며, 상기 특허의 개시내용은 그 전문이 본원에 참고로 포함된다.
다른 실시양태에서, 레트로바이러스 감염을 이용하여 트랜스진을 비-인간 동물에게 도입한다. 일부 실시양태에서, 레트로바이러스 벡터는 난모 세포의 난황주위 공간에 레트로바이러스 벡터를 주사함으로써 난모세포를 형질감염시키는데 사용된다 (미국 특허 제6,080,912호 (본원에 참고로 포함됨)). 다른 실시양태에서, 발생 중인 비-인간 배아는 시험관 내에서 배반포 단계로 배양될 수 있다. 이 시간 동안, 할구는 레트로바이러스 감염에 대한 표적일 수 있다 (문헌 [Janenich, Proc. Natl. Acad. Sci. USA 73:1260 [1976]]). 투명대가 제거되도록 효소적 처리에 의해 할구의 효율적인 감염이 수득된다 (문헌 [Hogan et al., in Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. [1986]]). 트랜스진을 도입하는데 사용된 바이러스 벡터 시스템은 전형적으로 트랜스진을 보유하는 복제-결함 레트로바이러스이다 (문헌 [Jahner et al., Proc. Natl. Acad Sci. USA 82:6927 [1985]]). 형질감염은 바이러스-생산 세포의 단층 상에서 할구를 배양함으로써 용이하고 효율적으로 수득된다 (문헌 [Stewart, et al., EMBO J., 6:383 [1987]]). 대안적으로, 감염은 이후 단계에서 수행될 수 있다. 바이러스 또는 바이러스-생산 세포는 포배강에 주사될 수 있다 (문헌 [Jahner et al., Nature 298:623 [1982]]). 트랜스제닉 동물을 형성하는 세포의 하위 집합에서만 도입이 일어나기 때문에, 대부분의 조상은 트랜스진에 대해 모자이크성일 것이다. 또한, 조상은 일반적으로 자손에서 분리되는 게놈에서의 상이한 위치에서 트랜스진의 다양한 다양한 레트로바이러스 삽입을 함유할 수 있다. 또한, 임신 중기 배아의 자궁내 레트로바이러스 감염에 의해 비록 낮은 효율일지라도 트랜스진을 생식 계열에 도입하는 것 또한 가능하다 (문헌 [Jahner et al., supra [1982]]). 당업계에 공지된 트랜스제닉 동물을 생성하기 위해 레트로바이러스 또는 레트로바이러스 벡터를 사용하는 추가의 수단은 레트로바이러스 입자, 또는 레트로바이러스를 생성하는 미토마이신 C-처리된 세포를 유정란 또는 초기 배아의 난황주위 공간에 미량-주사하는 것을 포함한다 (PCT 국제 출원 WO 90/08832 [1990], 및 문헌 [Haskell and Bowen, Mol. Reprod. Dev., 40:386 [1995]]).
다른 실시양태에서, 트랜스진을 배아 줄기 세포에 도입하고, 형질감염된 줄기 세포를 이용하여 배아를 형성한다. ES 세포는 적절한 조건 하에서 시험관 내에서 이식전 배아를 배양함으로써 수득된다 (문헌 [Evans et al., Nature 292:154 [1981]], [Bradley et al., Nature 309:255 [1984]], [Gossler et al., Proc. Acad. Sci. USA 83:9065 [1986]], 및 [Robertson et al., Nature 322:445 [1986]]). 트랜스진은 당업계에 공지된 다양한 방법, 예컨대 인산칼슘 공침전, 원형질체 또는 스페로플라스트 융합, 리포펙션 및 DEAE-덱스트란-매개된 형질감염에 의해 DNA 형질감염으로 ES 세포에 효율적으로 도입될 수 있다. 트랜스진은 또한 레트로바이러스-매개된 형질도입에 의해 또는 미량-주사에 의해 ES 세포에 도입될 수 있다. 그 후, 이러한 형질감염된 ES 세포는 배반포-단계 배아의 포배강으로 도입된 후 배아를 콜로니화할 수 있고, 생성된 키메라 동물의 생식 계열에 기여할 수 있다 (검토를 위해, 문헌 [Jaenisch, Science 240:1468 [1988]] 참조). 형질감염된 ES 세포를 포배강에 도입하기 전에, 형질감염된 ES 세포를 다양한 선택 프로토콜에 적용하여, 트랜스진을 통합시킨 ES 세포를 풍부하게 하며, 이는 트랜스진이 이러한 선택을 위한 수단을 제공하는 것으로 가정된다. 대안적으로, 폴리머라제 연쇄 반응은 트랜스진을 통합시킨 ES 세포를 스크리닝하는데 이용될 수 있다. 이 기술은 포배강으로 전송하기 전에 적절한 선택 조건 하에서 형질감염된 ES 세포의 성장에 대한 필요를 없애준다.
또 다른 실시양태에서, 상동성 재조합을 이용하여, 유전자를 녹아웃시키거나 결실 돌연변이체 (예를 들어, 말단 절단 돌연변이체)를 생성한다. 상동성 재조합을 위한 방법은 미국 특허 제5,614,396호 (본원에 참고로 포함됨)에 기재되어 있다.
실험
본 발명의 특정한 바람직한 실시양태 및 측면을 입증하고 추가로 설명하기 위해 하기 실시예가 제공되며, 이는 본 발명의 범위를 제한하는 것으로 해석되지 않아야 한다.
실시예 1: ERG ETV1 유전자 융합체
A. 물질 및 방법
이상점 프로파일 분석 ( COPA )
10,486개의 마이크로어레이 실험을 포함하는 온코민(Oncomine) 3.0 내의 132개의 유전자 발현 데이터 세트에 대해 COPA 분석을 수행하였다. 또한, 99개의 증폭된 레이저-포획 미세박리된 전립선 조직 샘플로부터의 데이터도 COPA 분석에 포함시켰다. COPA는 3개의 단계를 갖는다. 먼저, 유전자 발현 값을 중위에 배치하고, 각각의 유전자의 중위 발현 값을 0으로 설정하였다. 두 번째로, 중위 절대 편차 (MAD)를 계산하고, 각각의 유전자 발현 값을 그의 MAD로 나누어 1로 크기를 조정하였다. 이상점 발현 값이 분산 추정에 지나치게 영향을 미치지 않도록 평균 및 표준 편차가 아닌 중위 및 MAD를 형질전환에 사용하였고, 이에 따라 표준화 후 보존하였다. 세 번째로, 각각의 유전자에 대해 제75, 제90, 및 제95 백분위의 형질전환 발현 값을 표로 만든 다음, 그의 백분위 점수에 의해 유전자를 순차 배열하여, 이상점 프로파일의 우선순위 목록을 제공하였다.
샘플
사용한 조직은 미시간 대학(University of Michigan)의 근치적 전립선절제술 시리즈 및 신속 부검 프로그램(Rapid Autopsy Program) (문헌 [Shah et al., Cancer Res 64, 9209 (Dec 15, 2004)])으로부터의 것으로, 이들은 둘 모두 미시간 대학 전립선암 우수 연구 전문화 프로그램 조직 코어(University of Michigan Prostate Cancer Specialized Program of Research Excellence (S.P.O.R.E.) Tissue Core)의 일부이다.
조직을 또한 유니버시티 호스피탈 Ulm(University Hospital Ulm) (Ulm, 독일)에서 근치적 전립선절제술 시리즈로부터 수득하였다. 모든 샘플은 각각의 기관에서 임상 시험 심사 위원회의 사전 승인을 받고 동의한 환자로부터 수집하였다. 모든 샘플로부터의 총 RNA를 제조자의 지시에 따라 트리졸 (인비트로겐 (Invitrogen))을 이용하여 단리하였다. 또한 RWPE, PC3, PC3+AR (문헌 [Dai et al., Steroids 61, 531 (1996)]), LNCaP, VCaP 및 DuCaP 세포주로부터 총 RNA를 단리하였다. RNA 완전성은 변성 포름알데히드 겔 전기영동 또는 애질런트 바이오분석기(Agilent Bioanalyzer) 2100에 의해 확인하였다. 또한, 양성 전립선 조직 총 RNA의 시판되는 풀 (pool) (CPP, 클론테크(Clontech))을 사용하였다.
정량적 PCR ( QPCR )
본질적으로 문헌 [Chinnaiyan et al., Cancer Res 65, 3328 (2005)], [Rubin et al., Cancer Res 64, 3814 (2004)]에 기재되어 있는 바와 같이 어플라이드 바이오시스템즈(Applied Biosystems) 7300 실시간 PCR 시스템에서 SYBR 그린 염료를 사용하여 정량적 PCR (QPCR)을 수행하였다. 간략하게, 무작위 프라이머 또는 무작위 프라이머 및 올리고 dT 프라이머의 존재하에서 슈퍼스크립트 III(SuperScript III) (인비트로겐)을 사용하여 1-5 ㎍의 총 RNA를 cDNA로 역전사시켰다. 모든 반응은 SYBR 그린 마스터 혼합물 (어플라이드 바이오시스템즈) 및 25 ng의 정방향 및 역방향 프라이머 둘 모두를 제조자의 권장 열순환주기 조건으로 이용하여 수행하였다. 모든 반응에 대해 용융 곡선 분석하고, 선택된 실험으로부터의 생성물을 1.5% 아가로스 겔 상에서 전기영동에 의해 분해하였다. 각각의 실험에서, 역치 수준은 서열 검출 소프트웨어 버전 1.2.2 (어플라이드 바이오시스템즈)를 이용하여 QPCR 반응의 지수기 동안 설정하였다. 각각의 샘플에 대한 하우스키핑 유전자 글리세르알데히드-3-포스페이트 데히드로게나제 (GAPDH)에 상대적인 각각의 표적 유전자의 양은 비교 역치 주기 (Ct) 방법 (어플라이드 바이오시스템즈 사용자 공고 #2)을 이용하여 측정하였고, cDNA 샘플을 도면 범례에 기재한 각각의 실험에 대한 교정자로서 제공하였다. 모든 올리고뉴클레오티드 프라이머는 통합 DNA 기술을 이용하여 합성하였다.
GAPDH 프라이머는 문헌 [Vandesompele et al., Genome Biol 3, RESEARCH0034 (2002)]에 기재되어 있는 바와 같고, 모든 다른 프라이머를 열거하였다 (표 4).
비교 Ct 방법을 이용하기 위해, 전립선암 cDNA 또는 플라스미드 주형의 연속 희석물을 이용하여 대략 동일한 효율의 프라이머를 확정하였다.
RNA 리가제 매개 cDNA 말단부 급속 증폭 ( RLM - RACE )
진레이서(GeneRacer) RLM-RACE 키트 (인비트로겐)를 제조자의 지시에 따라 이용하여 RNA 리가제 매개 cDNA 말단부 급속 증폭을 수행하였다. 먼저, QPCR에 의해 ERG 또는 ETV1의 발현에 기초하여 샘플을 선택하였다. 5 ㎍의 총 RNA를 송아지 장 포스파타제로 처리하여 말단절단된 mRNA 및 비-mRNA로부터 5' 포스페이트를 제거하고, 토바코 산(tobacco acid) 피로포스파타제로 탈캡핑하였다. 진레이스 RNA 올리고를 전장 전사체에 라이게이션하고, 슈퍼스크립트 III을 이용하여 역전사시켰다. 5' 말단부를 수득하기 위해, 첫번째 가닥 cDNA를 ETV1의 경우에는 진레이서 5' 프라이머 및 ETV1 엑손 4-5_r을 이용하여, 또는 ERG의 경우에는 진레이서 5' 프라이머 및 ERG 엑손 4a_r 또는 ERG 엑손 4b_r을 이용하여 백금 Taq 고정확도(Platinum Taq High Fidelity) (인비트로겐)로 증폭시켰다. 프라이머 서열을 제공한다 (표 S2). 생성물을 1.5% 아가로스 겔 상에서 전기영동에 의해 분해하고, 밴드를 잘라내고, 정제하고, TOPO TA를 pCR 4-TOPO에 클로닝하였다. 적어도 4개의 콜로니로부터 정제된 플라스미드 DNA에 대해, 미시간 대학 DNA 서열분석 코어에 의한 ABI 모델 3730 자동화 서열분석기 상에서 M13 역방향 및 M13 정방향 (-20) 프라이머 또는 T3 및 T7 프라이머를 이용하여 양향향으로 서열분석하였다. RLM-RACEd cDNA는 다른 검정에 사용하지 않았다.
TMPRSS2 : ERG 융합체에 대한 역전사 PCR
상기 기재한 바와 같이 QPCR을 이용하여 TMPRSS2:ERG 양성 사례를 확인한 후, 동일한 cDNA 샘플을 백금 Taq 고정확도 및 TPRSS2:ERG 프라이머로 PCR 증폭시켰다. 생성물을 전기영동에 의해 분해하고, pCR 4-TOPO로 클로닝하고, 상기 기재한 바와 같이 서열분석하였다.
시험관내 안드로겐 반응성
인간 안드로겐 수용체 (PC3+AR) (3)에 의해 안정적으로 형질감염된 RWPE, LNCaP, VCap DuCaP, PC3 및 PC3 세포를 1% 에탄올 대조군 또는 1 nM의 합성 안드로겐 R1881로 24 시간 동안 처리하였다. 총 RNA를 단리하고, 상기 기재한 바와 같이 ERG 엑손 5-6_f 및 _r 프라이머를 이용하여 역전사 및 QPCR하였다. 각각의 샘플에 대한 ERG/GAPDH의 상대적인 양을 RWPE 대조군 샘플에 대해 교정하였다.
형광 계내 혼성화 ( FISH )
정상 말초 림프구로부터 포르말린 고정시키고 파라핀 포매시킨 (FFPE) 조직 절편 및 전이성 전립선암 샘플 MET-26 및 MET-28을 간기 형광 계내 혼성화 (FISH) 분석에 사용하였다. 또한, 13개의 임상적 국소 전립선암 및 16개의 전이성 전립선암 샘플의 FFPE 절편으로부터의 코어를 함유하는 조직 마이크로어레이 상에서 간기 FISH를 수행하였다. 2-색상, 2-신호 접근법을 사용하여 각각의 유전자 유전자좌의 대부분에 걸친 프로브에 의해 TMPRSS2 및 ETV1의 융합을 평가하였다. 비오틴-14-dCTP BAC 클론 RP11-124L22를 ETV1 유전자좌에 사용하였고, 디곡신-dUTP 표지된 BAC 클론 RPP11-35CD는 TMPRSS2 유전자좌에 사용하였다. ERG을 포함하는 유전자 재배열을 분석하기 위해, ERG 유전자좌에 걸친 2개의 프로브 (비오틴-14-dCTP 표지된 BAC 클론 RP11-476D17 및 디곡신-dUTP 표지된 BAC 클론 RP11-95I21)에 의한 분할-신호 프로브 전략을 사용하였다. 모든 BAC 클론은 오클랜드 아동병원 연구소 (CHORI)에서 수득하였다. 조직 분석 전에, 모든 프로브의 완전성 및 순도는 정상 말초 림프구의 중기 전개에 대한 혼성화에 의해 확인하였다. 조직 혼성화, 세척 및 색상 검출은 문헌 [Rubin et al., Cancer Res 64, 3814 (2004)], [Garraway et al., Nature 436, 117 (2005)]에 기재된 바와 같이 수행하였다.
B. 결과
이상점 프로파일 분석
최근에, DNA 마이크로어레이를 이용한 유전자 발현 프로파일링이 암의 전체 전사체(transcriptome)를 연구하기 위한 일반적인 방법이 되었다. 마이크로어레이 연구는 암의 분자 이질성을 잘 이해하게 하였고, 종종 종양 조직학에 상응하는 질환의 신규한 분자 하위유형, 환자 성과, 및 치료 반응을 확인시켜주었다 (문헌 [Valk et al., N Engl J Med 350, 1617 (2004)]). 그러나, 일반적으로, 전체 전사체 분석은 신규한 원인 암 유전자를 발견하게 하지는 못했다. 종양유전자의 뚜렷한 과다발현을 야기하는 재배열 및 높은 수준의 복제 수 변화는 전체 전사체 데이터에서 입증되지만, 전통적인 분석 접근법에 의해서는 반드시 그렇지 않다는 가설이 세워졌다.
대부분의 암 유형에서, 종양유전자의 비균질한 활성화 패턴이 관찰되었고, 이에 따라 암 샘플 부류에 걸쳐 유전자의 공통적인 활성화를 조사하는 전통적인 분석 방법 (예를 들어, t-시험 또는 신호 대 잡음비)은 이러한 종양유전자 발현 프로파일을 발견하는 것에 실패할 것이다. 그 대신, 하위세트의 사례에서 뚜렷한 과다발현을 조사하는 방법이 필요하다. 본 발명을 개발하는 과정에서 수행된 실험은 암 이상점 프로파일 분석 (COPA)의 개발을 가능하게 하였다. COPA는 유전자 발현 프로파일의 중위값 및 중위 절대 편차에 기초하여 단순한 수치적 변환을 적용하는 것에 의해 이상점 프로파일을 강조하고 확인하는 것을 추구한다 (문헌 [Ross et al., Blood 102, 2951 (2003)]). 상기 접근법을 도 5A에 예시한다. COPA를 10,486개의 마이크로어레이 실험에 해당하는 132개의 유전자 발현 데이터세트의 개요로 구성된 온코민 데이터베이스에 적용하였다 (문헌 [Bittner et al., Nature 406, 536 (2000)]). COPA는 반복적 재배열 또는 높은 수준의 증폭이 발생한 것으로 인식된 특이적 암 유형에서 유전자에 대한 몇몇의 이상점 프로파일을 정확하게 확인하였다. 분석은 온코민 데이터세트에서의 최상위 10 가지의 이상점 프로파일의 순위를 매긴 암 유전자 센서스(Cancer Gene Census) (문헌 [Vasselli et al., Proc Natl Acad Sci U S A 100, 6958 (2003)])에 규정된 바와 같은 공지된 원인 암 유전자의 이상점 프로파일에 초점이 맞춰졌다 (표 1 및 표 3). 예를 들어, 볼크(Valk) 등의 급성 골수성 백혈병 (AML) 데이터세트에서, RUNX1T1 (ETO)은 제95 백분위로 가장 강력한 이상점 프로파일을 가졌고, 이는 상기 유전자의 공지의 전좌 및 AML의 하위세트에서의 종양발생 활성과 일치하였다 (문헌 [Davis et al., Proc Natl Acad Sci U S A 100, 6051 (2003)]) (표 1). 이상점 프로파일은 RUNX1 (AML1) 및 RUNX1T1 (ETO)이 융합된 t(8;21) 전좌로 보고된 사례와 정확하게 연관되었다 (도 5B). 유사하게, 로스(Ross) 등의 급성 골수성 백혈병 (ALL) 데이터세트에서, PBX1은 제90 백분위로 가장 강력한 이상점 프로파일을 나타내었고, 이는 ALL의 하위세트에서 발생하는 것으로 알려진 E2A-PBX1 전좌와 일치하였다 (문헌 [Segal et al., J Clin Oncol 21, 1775 (2003)]) (표 1). 다시, 이상점 발현 프로파일은 이러한 ALL 패널에서 특징적인 t(1;19) E2A-PBX1 전좌와 완벽하게 연관되었다 (도 51C).
전립선암에서 ETS 부류 구성원 ERG ETV1 에 대한 이상점 프로파일의 확인
이어서 신규한 COPA 예상을 조사하였다. 몇몇의 독립적인 데이터세트에서, 유잉 육종 및 골수성 백혈병에서 종양발생 전좌에 관여하는 것으로 알려진 2개의 ETS 부류 전사 인자인 ERG 및 ETV1에 대해 전립선암에서 COPA로 강력한 이상점 프로파일을 확인하였다 (문헌 [Lapointe et al., Proc Natl Acad Sci U S A 101, 811 (2004)], [Tian et al., N Engl J Med 349, 2483 (2003)]). 다나세카란(Dhanasekaran) 등 (문헌 [Keats et al., Blood 105, 4060 (2005)]), 웰시(Welsh) 등 (문헌 [Dhanasekaran et al., Faseb J 19, 243 (2005)]) 및 라포인테(Lapointe) 등 (문헌 [Wang et al., Lancet 365, 671 (2005)])의 전립선암 유전자 발현 데이터세트에서, ERG가 제75 백분위의 최고 득점 이상점 프로파일을 갖는 반면 (표 1), 라포인테 등 및 톰린스(Tomlins) 등 (문헌 [Welsh et al., Cancer Res 61, 5974 (2001)])의 데이터세트에서는, ETV1가 제90 백분위의 최고 득점 이상점 프로파일을 가졌다 (표 1). 전체적으로, COPA는 7번의 독립적인 전립선암 프로파일링 연구에서 ERG 또는 ETV1를 최상위 10개의 이상점 유전자 내에 9회 랭킹시켰다. ERG 및 ETV1은 둘 모두 유잉 육종에서 종양발생 전좌에 관여하였다. EWS 유전자의 5' 활성화 도메인의 ETS 부류 구성원의 고도로 보존된 3' DNA 결합 도메인에의 융합, 예컨대 ERG (t(21;22)(q22;q12)) 또는 ETV1 (t(7;22)(p21;q12))은 유잉 육종에서 특징적이다 (문헌 [Lapoint et al., 상기 문헌], [Zhan et al., Blood 99, 1745 (2002)], [Fonseca et al., Cancer Res 64, 1546 (2004)]). ETS 부류 구성원이 관여하는 전좌는 종양발생 형질전환에서 기능적으로 중복되기 때문에, 각각의 유잉 육종 사례에서는 전형적으로 단 하나의 유형의 전좌만이 관찰된다.
ERG 및 ETV1이 전립선암의 발생에 유사하게 관여하는 경우, 이들의 이상점 프로파일은 상호간에 배타적이어야 하며, 즉 각 사례는 2개의 유전자 중 하나만을 과다발현해야 하는 것으로 생각된다. 기능적으로 중복되는 유전자, 또는 동일한 종양발생 경로에서의 유전자의 돌연변이는 신생물성 진행에서 공동으로 선택되지 않을 것이다. 몇몇의 전립선암 데이터세트에 걸쳐 ERG 및 ETV1의 공동 발현 프로파일을 조사하였고, 이들이 상호 배타적인 이상점 프로파일을 나타내는 것이 관찰되었다. 2개의 대규모 전체 전사체 연구로부터, 상이한 마이크로어레이 플랫폼을 이용하여 육안 박리된 전립선 조직을 프로파일링한 것인 ERG 및 ETV1 발현 프로파일 (문헌 [Wang et al., 상기 문헌], [Cheok et al., Nat Genet 34, 85 (2003)])이 확인되었다 (도 1A, 좌측 및 중간 패널). 라포인테 등에 의한 연구는 전립선암 및 전이성 전립선암에 한정된 ERG 및 ETV1 이상점 발현을 갖는, 임상적 국소 전립선암인 양성 전립선 조직 및 전이성 전립선암을 프로파일링한 반면, 글린스키(Glinsky) 등에 의한 연구는 임상적 국소 전립선암 샘플 만을 프로파일링하였다. 이들 둘 모두의 연구에서, 전립선암은 배타적으로 ERG 또는 ETV1을 발현하였다 (도 1A, 우측 패널).
레이저 포획 미세박리 (LCM)에 의해 수득한 99개의 전립선 조직 샘플의 프로파일링 연구에서 유사한 결과를 확인하였다 (문헌 [Welsh et al., 상기 문헌]). ERG 또는 ETV1의 배타적인 이상점 발현에 더하여 (도 1B, 우측 패널), LCM 연구로부터의 결과는 ETV1 및 ERG가 전립선암 또는 전이성 전립선암의 상피 세포에서만 과다발현되지만, 추정상 전구체 병변 전립선 상피내 신생물 (PIN) 또는 인접 양성 상피에서는 그렇지 않음을 보여주었다. 관찰된 배타적인 이상점 패턴이 활성화 유전자가 다중 파트너와 융합될 수 있는 다른 전좌와 일치하는지 여부를 직접 판단하기 위해, 잔(Zhan) 등의 다발 골수종 데이터세트 (문헌 [Dhanasekaran et al., Nature 412, 822 (2001)])를 조사하였다. CCND1 또는 FGFR3에 대한 면역글로불린 중쇄 프로모터의 반복적 융합체, 각각 t(11,14) 또는 t(4,14)는 특이적 하위세트의 다발 골수종을 특징짓는다 (문헌 [Wigle et al., Cancer Res 62, 3005 (2002)]). CCND1는 제75 백분위에서 최고 득점 이상점을 갖고 FGFR3은 제95 백분위에서 3번째 최고 득점 이상점을 가지므로 (표 1) 이들 전좌를 이상점 프로파일 분석에 반영하였다 (도 1C). 2개의 사례를 제외하고, 골수종 샘플은 CCND1 또는 FGFR3의 배타적인 과다발현을 나타내었다 (도 1C, 우측 패널). 종합하면, 다수의 전립선암 데이터 세트에 걸친 ERG 및 ETV1의 이상점 프로파일은 다양한 인간 악성종양에서의 다른 원인 돌연변이와 일치하였다. 개별 전립선암 샘플에서 ERG 또는 ETV1의 배타적인 과다발현은 활성화 유전자가 생물학적으로 중복되는 파트너 유전자와 융합될 수 있는 다른 신생물, 예를 들어 다발 골수종에서와 일치하였다.
전립선암에서 ERG 또는 ETV1 에 대한 TMPRSS2 의 반복적 유전자 융합체의 발견.
다음으로, 개별 전립선암 샘플에서 ERG 및 ETV1 과다발현의 메카니즘을 판단하였다. 정량적 PCR (QPCR)을 수행하여 ERG 또는 ETV1이 과다발현된 전립선암 세포주 및 임상 시료를 확인하였다 (도 2a). QPCR에 의하면, 호르몬 불응성 전이성 전립선암 (MET-26RP, 전립선에서의 잔존 원발 암종 및 MET-26LN, 림프절 전이)으로 사망한 환자로부터 수득한 2개의 시료 및 LNCaP 전립선암 세포주에서 ETV1이 현저하게 과다발현되어 있었다 (도 2a). DNA 마이크로어레이 분석에 의하면, 이 환자로부터의 상이한 해부학적 위치로부터의 5개의 독립적인 전이 병소 뿐만 아니라 전립선에의 잔존 암종에서 또한 ETV1이 과다발현되어 있었는데 (문헌 [Welsh et al., 상기 문헌]), 이는 ETV1 활성화가 광범위한 전이 이전에 원발 종양에서 일어남을 시사한다. 호르몬 불응성 전이성 전립선암 (MET-28LN)으로 사망한 제2 환자 및 ERG가 과다발현된 2개의 전립선암 세포주, VCaP 및 DuCaP에서 또한 림프절 전이를 확인하였다 (도 2a). 이들 세포주는 제3 호르몬-불응성 전립선암 환자로부터의 척추 전이 (VCaP) 및 이중 전이 (DuCaP)에서 독립적으로 단리하였다 (문헌 [Golub et al., Science 286, 531 (1999)], [Rosenwald et al., Cancer Cell 3, 185 (2003)]). 이들 2가지 세포주에서의 ERG의 공통적인 과다발현은 또한 ERG 활성화가 광범위한 전이 이전에 일어남을 시사한다. 종합하면, 이들 결과는 특이적인 유전자 사건이 전립선 종양형성 동안 개별 샘플에서 ERG 또는 ETV1을 활성화할 수 있음을 시사한다.
이들 유전자 사건을 특징규명하기 위한 노력에서, ERG 또는 ETV1 발현이 높은 샘플에 대해 그들의 각각의 유전자좌 (7p21.2 및 21q22.3)에서의 염색체 증폭을 시험하였다. 게놈 DNA에서의 QPCR에 의하면, 각각의 전사체 과다발현과 함께 샘플에서의 ERG 또는 ETV1의 증폭 (문헌 [Sotiriou et al., Proc Natl Acad Sci U S A 100, 10393 (2003)])은 관찰되지 않았다. 다음으로, DNA 재배열의 발생을 검정하였다. 상기에서 기재한 QPCR에 사용된 프라이머가 유잉 육종에서 ERG 및 ETV1에 대한 공지의 절단위치에서 5'에 위치하기 때문에, 동일한 전좌가 전립선암에서 발생하는 것으로 보이지 않았다. 따라서, ETV1 엑손의 발현 수준은 ETV1 과다발현을 나타내는 상기에서 확인된 샘플에서 QPCR 엑손워킹(exonwalking)에 의해 측정하였다. ETV1 엑손 2에서 7에 걸친 5개의 프라이머쌍을 이용하였고, LNCaP 세포는 모든 측정된 ETV1 엑손의 본질적으로 균일한 과다발현을 나타내었으며, MET26 시료는 둘 모두 엑손 4-7에 비해 ETV1 엑손 2 및 3의 발현이 90%를 초과하여 감소되는 것으로 나타났다 (도 2b). 이러한 결과의 가능한 설명으로는 선택적 스플라이싱, 신규한 암-특이적 이소형 또는 보고되지 않은 재배열이 포함된다.
전장 ETV1 전사체의 특징규명을 위해, LNCaP 세포 및 MET26-LN에 대해 5' RNA 리가제-매개 cDNA 말단부 급속 증폭 (RLM-RACE)을 수행하였다. 또한, RLM-RACE를 수행하여 MET28-LN에서 ERG의 전장 전사체를 수득하였다. RLM-RACE cDNA로부터 ETV1의 PCR 증폭을 위해, 완전한 전사체의 5' 말단부에 라이게이션된 RNA-올리고뉴클레오티드에 상보적인 정방향 프라이머 및 LNCaP 세포 및 MET26-LN 둘 모두에서 과다발현되는 5'-최대 엑손인 엑손 4에서의 역방향 프라이머를 사용하였다. 상기한 바와 유사한 전략을 사용하여, ERG의 엑손 4가 MET28-LN에서 과다발현되는 것으로 판단하였다. 이러한 엑손에서의 역방향 프라이머를 RLM-RACE cDNA의 PCR 증폭을 위해 사용하였다. 클로닝된 생성물의 서열분석에 의해, 전립선 특이적 유전자 TMPRSS2 (28) (21q22.2)의 MET26-LN에서의 ETV1 및 MET28-LN에서의 ERG와의 융합체가 밝혀졌다 (도 2c). MET26-LN에서, 2개의 RLM-RACE PCR 생성물이 확인되었다.
제1 생성물, TMPRSS2:ETV1a는 TMPRSS2의 완전한 엑손 1이 ETV1의 엑손 4의 시작점과 융합된 것이다 (도 2c). 제2 생성물, TMPRSS2:ETV1b는 TMPRSS2의 엑손 1 및 2가 ETV1의 엑손 4의 시작점과 융합된 것이다 (도 6). 이들 생성물은 둘 모두 상기한 엑손워킹 QPCR과 일치하였고, MET26-LN는 엑손 2 및 3에서 과다발현되지 않는 것으로 나타났다. MET28-LN에서, 단일 RLM-RACE PCR 생성물이 확인되었고, 서열분석에 의해 TMPRSS2의 완전한 엑손 1이 ERG의 엑손 4의 시작점과 융합된 것으로 나타났다 (TMPRSS2:ERGa) (도 2c).
전립선암에서 TMPRSS2 : ERG TMPRSS2 : ETV1 유전자 융합체의 확인
이들 결과에 기초하여, TMPRSS2에서의 정방향 프라이머 및 ERG 및 ETV1의 엑손 4에서의 역방향 프라이머로 QPCR 프라이머쌍을 설계하였다. 이들 두 프라이머쌍을 모두 사용하여 42 사례의 임상적 국소 전립선암 및 전이성 전립선암으로부터의 한 패널의 샘플에 걸쳐 SYBR 그린 QPCR을 수행하였고, 대표적인 결과를 나타내었다 (도 2, d 및 e). 이들 결과는 ETV1 또는 ERG의 수준이 높은 샘플 만이 각각 TMPRSS2와의 융합 생성물을 발현하는 것으로 나타났다. QPCR은 일부 음성 샘플에서 35 주기 이후에 측정가능한 생성물을 생성하였지만, 용융 곡선 분석 결과 양성 및 음성 샘플에서 별개의 생성물로 밝혀졌고, QPCR 분석 40 주기 이후의 생성물의 겔 전기영동에 의해 음성 융합 샘플에서 단지 프라이머 이량체 만이 밝혀졌다 (도 2, d 및 e). 프라이머 이량체의 형성은 부분적으로 높은 GC 함량 (80.3%)으로 인해 TMPRSS2의 엑손 1에서 완전한 프라이머를 설계하는데 있어서의 곤란함으로 설명될 수 있다. 그러나, TMPRSS2:ERGa, TMPRSS2:ETV1a 및 TMPRSS2:ETV1b 융합체의 특이적 발현이 각각의 융합체에 걸친 정방향 프라이머를 이용한 택맨(Taqman) QPCR에 의해 확인되었고, 각각의 경우에서, 생성물은 단지 SYBR 그린 QPCR에서와 동일한 사례에서만 검출되었다 (문헌 [Sotiriou et al., 상기 문헌]). SYBR 그린 QPCR에 사용된 프라이머 및 앰플리콘의 특이성을 추가로 확인하기 위해, SYBR 그린 QPCR에서와 동이한 프라이머를 이용하여 TMPRSS2:ERGa를 발현하는 한 패널의 샘플에 대해 표준 역전사 PCR을 수행하였다. 크기가 유사한 생성물이 수득되었고, 클로닝된 생성물의 서열분석에 의해 TMPRSS2:ERGa의 존재를 확인하였다. ETV1 또는 ERG를 각각 높은 수준으로 발현하지만 전좌의 어떤 증거도 보이지 않는 2 사례, PCA16 및 PCA17을 QPCR (도 2, d 및 e)에 의해 확인하였다. RLM-RACE는 이들 결과를 지지하였는데, PCA16에서 ETV1 프라이머에 의해 생성된 생성물의 서열분석에 의해 어떤 융합 전사체의 증거도 나타나지 않았고, PCA17에서 ERG 프라이머에 의해 어떤 생성물도 수득할 수 없었다. LNCaP 세포에서 RLMRACE 또는 QPCR에 의해 어떠한 융합의 증거도 없는 유사한 결과가 얻어졌고, 이는 상기한 엑손 워킹 QPCR과 일치하였다.
전립선암 샘플에서 ETS 부류 구성원과의 TMPRSS2 융합 전사체에 대한 증거 요약
RLM-RACE 생성물의 서열 분석, QPCR 및 RT-PCR 생성물의 서열 분석을 비롯한 TMPRSS2:ERG 및 TMPRSS2:ETV1 융합 전사체에 대한 3개의 상이한 검정으로부터 결과를 표 2에 요약하였다. 모든 샘플에서 수행된 TMPRSS2 융합체에 대한 QPCR에 더하여, 선택된 샘플에서 이들 융합체의 존재를 몇몇의 기술을 이용하여 확인하였다. 예를 들어, PCA1 (전립선암 샘플 1)에서, RLMRACE 생성물 서열분석, QPCR 및 RT-PCR 생성물의 서열분석을 이용하여 TMPRSS2:ERGa를 확인하였다. QPCR 용융 곡선 분석 및 QPCR 생성물의 겔 전기영동에 의해, PCA4는 기대했던 것 보다 큰 앰플리콘을 생성하였다. 후속적 RLM-RACE 분석에 의해 TMPRSS2의 완전한 엑손 1의 ERG의 엑손 2의 시작점과의 융합을 확인하였다 (TMPRSS2:ERGb) (도 6). TMPRSS2:ERGb 접합부에 걸친 정방향 프라이머를 이용한 택맨 QPCR에 의해 PCA4에서 유일한 TMPRSS2:ERGb의 존재를 확인하였고, TMPRSS2:ERGa 접합부에 걸친 정방향 프라이머를 이용한 택맨 QPCR은 본 시료 (27)에서 생성물을 생성하지 못하였다. TMPRSS2:ERG 및 TMPRSS2:ETV1 융합체에 대한 증거는 QPCR 또는 DNA 마이크로어레이에 의해 각각 ERG 또는 ETV1을 과다발현한 사례에서만 찾아볼 수 있었다. 이들 결과는 이상점 분석에서 관찰된 배타적인 발현과 일치하였다.
형광 계내 혼성화 ( FISH )에 의한 TMPRSS2 : ETV1 전좌 ERG 재배열의 확인
TMPRSS2:ETV1 및 TMPRSS2:ERG 융합 전사체의 존재를 확인한 후, 포르말린 고정시키고 파라핀 포매시킨 (FFPE) 시료에 대한 간기 형광 계내 혼성화 (FISH)에 의해 염색체 수준에서 이러한 재배열의 증거를 수득하였다. 2 가지의 상이한 프로브 전략을 채용하였다: TMPRSS2:ETV1 전좌를 검출하기 위한 2-색상, 융합-신호 접근법 및 ERG 유전자좌의 재배열을 검출하기 위한 2-색상, 분할-신호 접근법. 이들 프로브 전략은 초기에 RLM-RACE, MET26 및 MET28에 사용된 2개의 사례에서 확증되었다 (도 3). TMPRSS2 및 ETV1에 대한 프로브를 사용하는 것에 의해, 정상 말초 림프구 (NPL)는 한 쌍의 적색 및 한 쌍의 녹색 신호를 나타내었다 (도 3A). MET26은 프로브의 중첩을 나타내는 한 쌍의 신호의 융합을 나타내었는데 (도 3B, 황색 화살촉), 이는 본 샘플에서의 TMPRSS2:ETV1 전사체의 발현과 일치하였다. 또한, 일치하는 낮은 수준의 ETV1 유전자좌의 증폭이 확인되었고, 이는 ETV1에 대한 2개의 잔류 신호로 나타났다 (도 3B, 적색 화살촉). 유사하게, ERG 유전자좌의 5' 및 3' 영역에 걸친 프로브를 이용하는 것에 의해, NPL에서 한 쌍의 황색 신호가 관찰되었다 (도 3C). MET28에서, 한 쌍의 프로브가 독립적인 녹색 및 적색 신호를 분할하였는데, 이는 ERG 유전자좌에서의 재배열을 나타낸다 (도 3D, 녹색 및 적색 화살표). 이러한 결과는 본 사례에서의 TMPRSS2:ERG 전사체의 발현과 일치하였다. 이들 결과에 기초하여, 13 사례의 국소 전립선암 및 16 사례의 전이성 전립선암으로부터의 코어를 함유하는 연속 조직 마이크로어레이에 대해 상기한 개별 FISH 분석을 수행하였다 (도 3E). 행렬에 의해 표시되는 바와 같이, 29 사례 중 23 사례 (79.3%)는 TMPRSS2:ETV1 융합 (7 사례) 또는 ERG 재배열 (16 사례)의 증거를 보였다. 또한, 29 사례 중 12 사례 (41.4%)는 ETV1 유전자좌에서 낮은 수준의 증폭의 증거를 나타내었다. 종전의 보고에 의하면 국소 및 전이성 전립선암에서 가장 흔하게 증폭된 영역 중 하나로서 ETV1의 게놈 위치, 7p가 확인되어 있다 (문헌 [Slamon et al., Science 235, 177 (1987)]). 그러나, ETV1 증폭이 ERG 재배열과 함께 6 사례에서 발생하였고, 본 발명자들의 전사체 데이터는 ERG 발현 및 TMPRSS2:ERG 융합의 수준이 높은 19 샘플 중 0 샘플에서 또한 ETV1 발현이 높다는 것을 나타내었기 때문에, 7p 증폭이 ETV1 발현을 추진시키는 것으로 보이지는 않았다. 또한, FISH에 의해 ETV1 증폭 및 TMPRSS2:ETV1 융합을 둘 모두 나타낸 경우, 단지 개별 ETV1 신호 만이 증폭되었고, 융합된 신호는 증폭되지 않았다. 그럼에도 불구하고, 이러한 FISH 분석으로부터의 결과는 게놈 수준에서의 TMPRSS2:ETV1 및 ERG 재배열의 존재를 보여주었고, 이는 상기한 전사체 데이터와 일치하였다.
TMPRSS2는 안드로겐-조절된 유전자이고, ERG와의 융합은 ERG의 안드로겐 조절을 야기한다. TMPRSS2는 그의 발현이 LNCaP 세포 내 안드로겐에 의해 증가되었고, 또한 그의 프로모터 내에 안드로겐 반응 요소 (ARE)를 함유하여, 초기에 전립선-특이적 유전자로서 확인되었다 (문헌 [Huang et al., Lancet 361, 1590 (2003)], [Schwartz et al., Cancer Res 62, 4722 (2002)]). 후속적인 연구에 의해 정상 및 신생물성 전립선 조직에서 높은 발현이 확인되었고, TMPRSS2가 안드로겐-감수성 전립선 세포주에서 안드로겐-조절되는 것으로 밝혀졌다 (문헌 [Schwartz et al., Cancer Res 62, 4722 (2002)], [Ferrando et al., Cancer Cell 1, 75 (2002)], [Chen et al., Mol Biol Cell 14, 3208 (2003)], [LaTulippe et al., Cancer Res 62, 4499 (2002)]). 또한, 안드로겐이 안드로겐 불감성 전립선암 세포주 PC3에서 TMPRSS2의 발현을 증가시키지 않는 반면, PC3 세포에서 안드로겐 수용체의 안정한 발현은 TMPRSS2를 안드로겐 반응성이게 만들었다 (문헌 [Schwartz et al., 상기 문헌], [Ferrando et al., 상기 문헌], [Chen et al., 상기 문헌], [LaTulippe et al., 상기 문헌]). 대조적으로, 안드로겐으로 처리한 LNCaP 전립선 세포주의 마이크로어레이 연구에 의해 ERG 또는 ETV1이 안드로겐-반응성인 것은 확인되지 않았고 (문헌 [Jain et al., Cancer Res 64, 3907 (2004)]), 그의 프로모터 서열의 조사는 컨센서스 ARE를 밝혀내지 못했다 (문헌 [Sotiriou et al., 상기 문헌]). 각각의 세포주에서 3번의 독립적인 검정에 의해 확인된 DuCaP 및 VCaP 세포주에서의 TMPRSS2:ERGa 융합체 (표 2)는 ERG의 안드로겐 조절을 야기할 것으로 생각된다. ERG 발현을 검정하기 위해 QPCR을 이용하는 것에 의해, ERG가 VCaP 및 DuCaP 세포 둘 모두에서 고도로 발현되더라도, 합성 안드로겐 R1881에 의한 처리는 비처리 대조군에 비해 ERG의 발현을 DuCaP 세포에서는 2.57배, 그리고 VCaP 세포에서는 5.02배 증가시키는 것으로 확인되었다 (도 4). ERG의 발현은 최소한이었고, R1881 처리 이후에 비처리 대조군과 비교하여 RWPE (1.37배), LnCaP (0.86배), PC3 (1.28배) 및 안드로겐 수용체를 발현하는 PC3 세포 (0.73배)에서 본질적으로 변화되지 않았다.
동일한 샘플의 마이크로어레이 분석에 의해 ERG가 DuCaP 및 VCaP 세포에서 안드로겐에 반응하여 단지 상향조절되는 것을 확인하였다 (문헌 [Sotiriou et al., 상기 문헌]). 본 발명은 특정 메카니즘으로 한정되지 않는다. 실제로, 메카니즘을 이해하는 것은 본 발명을 실시하기 위해 필요하지 않다. 그럼에도 불구하고, 이들 결과는 TMPRSS2와의 각각의 융합체가 존재하는 경우 전립선암에서 ERG 또는 ETV1의 일탈적인 발현에 대해 가능한 메카니즘을 시사하는 것으로 생각된다.
표 1. 암 이상점 프로파일 분석 (COPA). 강력한 이상점 프로파일을 갖는 암에서 원인 돌연변이를 겪은 것으로 공지된 유전자. "X"는 획득된 질병특유 전좌에 대한 문헌 증거를 나타낸다. "XX"는 특이적 전좌, 및 특이적 연구에서의 샘플을 그 전좌에 대해 특징규명하는 것에 대한 문헌 증거를 나타낸다. "Y"는 공지의 증폭과 일치함을 나타낸다. "**"는 전립선암에서의 ERG 및 ETV1 이상점 프로파일을 나타낸다.
Figure pct00002
표 2는 전립선암 샘플 및 세포주에서의 ETS 부류 구성원 상태에 대한 TMPRSS2 융합체의 개요를 보여준다. 모든 분석에 대해, 양성 결과는 "+"로 나타내고, 음성 결과는 "-"로 나타내었다. 블랭크 세포는 그 샘플에 대해 특이적 검정이 수행되지 않았음을 나타낸다. 정량적 PCR (QPCR)에 의해 ERG 또는 ETV1의 과다발현이 나타났고, 별표 표시된 샘플은, 그 샘플을 또한 cDNA 마이크로어레이로 평가하고 과다발현을 확인하였음을 나타낸다. TMPRSS2:ERG 또는 TMPRSS2:ETV1 유전자 융합체를 검출하기 위하여, 선택된 샘플의 서열분석을 나타낸 후에 이를 TMPRSS2 융합체를 갖는 샘플 및 과다발현된 ETS 부류 구성원에 대해 RLM-RACE 처리하였다. 모든 샘플을 QPCR에 의해 TMPRSS2:ETV1 및 TMPRSS2:ERG 발현에 대해 검정하였다. 또한, 선택된 사례를 QPCR의 경우와 같이 동일한 TMPRSS2 융합 프라이머를 사용하여 표준 역전사 PCR (RT-PCR)로 증폭시키고, 앰플리콘을 서열분석하였다. TMPRSS2:ETV1 또는 TMPRSS2:ERG 융합체에 대한 증거를 갖는 샘플을 마지막 칼럼에 나타냈다.
Figure pct00003
Figure pct00004
표 3. 암 이상점 프로파일 분석 (COPA). 온코민에서 연구의 상위 10개의 이상점 프로파일을 갖는 암에서의 원인 돌연변이를 겪는 것으로 공지되어 있는 유전자를 보여준다. "X"는 획득된 질병특유 전좌에 대한 문헌 증거를 나타낸다. "XX"는 특이적 전좌, 및 특이적 연구에서의 샘플을 그 전좌에 대해 특징규명하는 것에 대한 문헌 증거를 나타낸다. "Y"는 공지의 증폭과 일치함을 나타낸다. "**"는 전립선암에서의 ERG 및 ETV1 이상점 프로파일을 나타낸다.
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
표 4. 본 연구에 사용된 올리고뉴클레오티드 프라이머. 모든 프라이머, 유전자, 염기 및 엑손 (UCSC 게놈 브라우저를 이용한 인간 게놈의 2004년 5월 어셈블리로 본문에 기재된 참조 서열의 정렬에 따름)에 대해 기재하였다. 정방향 프라이머는 "f"로, 역방향 프라이머는 "r"로 나타내었다.
Figure pct00009
실시예 2: ETV4 유전자 융합체
A. 물질 및 방법
프로파일링 연구에서의 ETS 부류 발현
전립선암에서의 ETS 부류 구성원의 발현을 조사하기 위해, 온코민 데이터베이스 (문헌 [Rhodes et al., Neoplasia 2004;6: 1-6])에 있는 2개의 전립선암 프로파일링 연구를 이용하였다 (문헌 [Lapointe et al., Proc Natl Acad Sci U S A 2004;101:811-6] 및 [Tomlins et al., Science 2005;310:644-8]). 인터프로 (Interpro) 필터 'Ets' (인터프로 ID: IPR000418)에 의해 ETS 도메인을 갖는 유전자가 확인되었다. '유전자 당 중위값-중심' 옵션을 이용하여 온코민에서 열지도 표시를 생성하였고, 색상 대비를 설정하여 ERG 및 ETV1 차별적 발현을 강조하였다.
샘플
전립선암 조직 (PCA1-5)은 미시간 대학의 근치적 전립선절제술 시리즈로부터의 것이었고, 이는 미시간 대학 전립선암 우수 연구 전문화 프로그램 조직 코어의 일부이다. 모든 샘플은 환자 사전 동의 및 앞선 기관 감사 위원회 승인에 의해 수집하였다. 총 RNA를 트리졸(Trizol) (인비트로겐(Invitrogen), 미국 캘리포니아주 칼스바드)을 사용하여 제조자의 지시에 따라 단리하였다. 또한, 양성 전립선 조직 총 RNA의 시판되는 풀 (CPP, 클론테크(Clontech), 캘리포니아주 마운틴 뷰)을 이용하였다.
정량적 PCR ( QPCR )
QPCR을, 기재된 바와 같이 어플라이드 바이오시스템즈 7300 실시간 PCR 시스템 (어플라이드 바이오시스템즈, 캘리포니아주 포스터 시티) 상에서 SYBR 그린 염료를 사용하여 수행하였다 (상기 문헌 [Tomlins et al.]). 각각의 샘플에 대하여 하우스키핑 유전자 글리세르알데히드-3-포스페이트 데히드로게나제 (GAPDH)에 상대적인 각각의 표적 유전자의 양을 기록하였다. 표적 유전자의 상대적인 양은 양성 전립선 조직 (CPP)의 풀로부터의 상대적인 양으로 보정하였다. 모든 올리고뉴클레오티드 프라이머를 인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies) (아이오와주 코랄빌)에 의해 합성하였다. GAPDH 프라이머는 기재된 바와 같다 (문헌 [Vandesompele et al., Genome Biol 2002; 3:RESEARCH0034]). ETV4의 엑손에 대한 프라이머는 다음과 같았다 (5' → 3'로 기재):
ETV4_엑손2-f:
Figure pct00010
(서열 21),
ETV4_엑손2-r:
Figure pct00011
(서열 22),
ETV4_엑손3-f:
Figure pct00012
(서열 23),
ETV4_엑손4-r:
Figure pct00013
(서열 24),
ETV4_엑손11-f:
Figure pct00014
(서열 25),
ETV4_엑손12-r:
Figure pct00015
(서열 26),
ETV4_3'UTR-f:
Figure pct00016
(서열 27),
ETV4_3'UTR-r:
Figure pct00017
(서열 28). 엑손을, UCSC 게놈 브라우저를 이용한 인간 게놈의 2004년 5월 동결물(freeze)을 이용하여 ETV4 (NM 001986.1)에 대한 RefSeq의 정렬에 의해 넘버링하였다. TMPRSS2:ETV4a 및 TMPRSS2:ETV4b 전사체 둘 다를 검출하는, TMPRSS2:ETV4 융합 전사체, TMPRSS2:ETV4a-f ( (서열 29)) 및 TMPRSS2:ETV4b-f (
Figure pct00019
(서열 30))의 QPCR 확인을 위해, ETV4_엑손4-r을 사용하였다.
RNA 리가제 매개 cDNA 말단부 급속 증폭 ( RLM - RACE )
RLM-RACE를, 진레이서(GeneRacer) RLM-RACE 키트 (인비트로겐)를 이용하여 기재된 바와 같이 제조자의 지시에 따라 수행하였다 (상기 문헌 [Tomlins et al.]). ETV4의 5' 말단부를 얻기 위해, PCA5로부터의 제1-가닥 cDNA를, 진레이서 5' 프라이머 및 ETV4_엑손4-r 또는 ETV4_엑손7-r (
Figure pct00020
(서열 31))을 사용하여 증폭시켰다. 생성물을 클로닝하고, 기재된 바와 같이 서열분석하였다 (상기 문헌 [Tomlins et al.]). TMPRSS2:ETV4 전사체의 동등한 5' 말단부를 두 프라이머쌍 모두로부터 얻었다.
형광 계내 혼성화 ( FISH )
간기 FISH를 위해 포르말린 고정시키고 파라핀 포매시킨 (FFPE) 조직 절편을 사용하였다. 파라핀제거시킨 조직을 0.2 M HCl로 10분 동안, 2x SSC로 10분 동안 80℃에서 처리하고, 프로테이나제(Proteinase) K (인비트로겐)로 10분 동안 소화시켰다. 조직 및 BAC 프로브를 94℃에서 5분 동안 공동-변성시키고, 37℃에서 밤새 혼성화하였다. 혼성화 후, 2x SSC (0.1% 트윈(Tween)-20 함유)로 5분 동안 세척하고, 플루오레세인에 접합된 항-디곡시게닌 (로슈 어플라이드 사이언스(Roche Applied Science), 인디애나주 인디아나폴리스) 및 알렉사 플루오르(Alexa Fluor) 594에 접합된 스트렙타비딘 (인비트로겐)을 사용하여 형광 검출을 수행하였다. 슬라이드를 계수기염색하고, DAPI와 프로롱 골드 안티페이드(ProLong Gold Antifade) 시약 (인비트로겐)에 놓았다. 슬라이드를 레이카(Leica) DMRA 형광 현미경 (레이카, 일리노이주 디어필드)을 사용하여 검사하고, 시토 비전 (CytoVision) 소프트웨어 시스템 (어플라이드 이미징(Applied Imaging), 캘리포니아주 산타 클라라)을 이용하여 CCD 카메라로 영상화하였다.
모든 BAC는 BACPAC 리소스 센터(Resource Center) (캘리포니아주 오크랜드)로부터 입수하였고, 정상 말초 림프구의 중기 전개로의 혼성화에 의해 프로브 위치를 확인하였다. TMPRSS2:ETV4 융합체의 검출을 위해, RP11-35C4 (TMPRSS2의 5')를 ETV4의 3'에 위치한 다수의 BAC (ETV4의 디스탈에서 프록시말: RP11-266I24, RP11-242D8 및 RP11-100E5)와 함께 사용하였다. ETV4 재배열의 검출을 위해, RP11-436J4 (ETV4의 5')를 다수의 BAC (ETV4의 3')와 함께 사용하였다. 각각의 혼성화에 대해, 암성 세포의 영역을 병리학자에 의해 확인하고, 샘플 당 100개의 세포를 계수하였다. RP11-242D8을 사용한 TMPRSS2:ETV4 융합체에 대해 기록된 세포 계수 및 유사한 결과를 모든 3' ETV4 BAC로 얻었다. PCA5에서의 추가 재배열을 설명하기 위해, 2개의 프로브 ETV4의 3' (RP11-266I24 및 RP11-242D8), ERG 분할 신호 프로브 (RP11-95I21 및 RP11-476D17) 및 TMPRSS2:ETV1 융합체 프로브 (RP11-35C4 및 RP11-124L22)를 사용하여 FISH를 수행하였다. 퀴아필터 팩시 프렙(QIAFilter Maxi Prep) 키트 (퀴아겐(Qiagen), 캘리포니아주 발렌시아)를 이용하여 BAC DNA를 단리하고, 디곡시게닌- 또는 비오틴-닉(nick) 번역 믹스 (로슈 어플라이드 사이언스)를 이용하여 프로브를 합성하였다.
B. 결과
초기 COPA 스크리닝으로 ERG 또는 ETV1과의 TMPRSS2 융합체의 특징을 규명하였다 (실시예 1). 이들 유전자 융합체에 대해 음성인 전립선암이 다른 ETS 부류 구성원을 포함하는 재배열을 가진다는 것이 추가로 예상되었다. 온코민 데이터베이스 (상기 문헌 [Rhodes et al.])로부터의 전립선암 프로파일링 연구에서 모니터링된 모든 ETS 부류 구성원의 발현 신호에 의해, 각각의 2개의 연구 [하나의 육안 박리된 조직 프로파일링 (상기 문헌 [Lapointe et al.]) (도 7A) 및 다른 레이저 포획 미세박리된 (LCM) 조직 프로파일링 (도 7B)]로부터의 단일 전립선암 사례에서 ETS 부류 구성원 ETV4의 두드러진 과다발현이 확인되었다. 이들 사례가 ERG 또는 ETV1을 과다발현하지 않았고, 양성 전립선 조직의 과다발현이 나타나지 않았기 때문에, TMPRSS2와의 융합이 이들 사례에서 ETV4의 과다발현에 대하여 작용했음이 예상되었다. 전립선암 사례의 일부에서 또한 ELF3이 과다발현되었지만, 두 연구 모두에서 정상적인 전립선 조직 샘플도 또한 두드러진 ELF3 과다발현을 나타냈으며, 이는 양성 및 암성 조직 둘 다에서 발현을 촉진하는 유전자 융합체가 있을 가능성이 없음을 나타낸다. 따라서, ETV4 과다발현 사례 (본원에서 PCA5로 지정)를 추가로 분석하였다.
총 RNA를 PCA5로부터 단리하고, 엑손-이동(walking) 정량적 PCR을 이용하여 (QPCR) ETV4의 과다발현을 확인하였다. QPCR에서, 모은 양성 전립선 조직 (CPP) (약 900배), 및 ETV4를 과다발현하지 않고 TMPRSS2:ERG 양성 (PCA1-2) 또는 음성 (PCA3-4)인 전립선암과 비교시 본 경우에 ETV4의 엑손 2의 3'가 현저하게 과다발현되었음이 입증되었다 (도 8A). 그러나, PCA5의 디스탈 영역에 대한 ETV4의 엑손 2의 발현의 극적 감소 (>99%)가 관찰되었으며, 이는 앞서 TMPRSS2:ERG 및 TMPRSS2:ETV1 양성 사례에서 관찰된 바와 같이 TMPRSS2와의 융합이 가능함을 나타낸다 (상기 문헌 [Tomlins et al.]).
PCA5에서의 ETV4 전사체의 5' 말단부를 확인하기 위해, 엑손 7에서의 역방향 프라이머를 사용하여 RNA-리가제 매개 cDNA 말단부 급속 증폭 (RLM-RACE)을 수행하였다. RLM-RACE에서 ETV4로부터의 서열에 융합된 TMPRSS2의 약 8 kb 상류에 위치한 서열로 이루어진 5' 말단부를 각각 함유하는 2개의 전사체가 나타났다 (도 8B). 구체적으로, TMPRSS2:ETV4a의 5' 말단부는 TMPRSS2의 상기 영역 상류로부터 47개 염기 쌍을 갖는 반면, TMPRSS2:ETV4b의 5' 말단부는 동일한 말단 13개 염기 쌍을 가졌다. 두 전사체 모두의 이들 5' 말단부는 ETV4의 엑손 7에서의 역방향 프라이머를 통하여 엑손 3의 보고된 참조 서열 및 ETV4의 엑손 3의 인트론 부근 5'의 9개 염기 쌍으로 이루어진 동일한 인접 스트레치에 융합되었다.
QPCR을 이용하여 PCA5에서의 두 전사체 모두의 존재, 및 CPP 및 PCA1-4에서의 그의 부재를 확인하였다. TMPRSS2로부터의 공지의 엑손을 포함하는 융합 전사체의 존재를 추가로 설명하기 위해, 예상대로 TMPRSS2의 엑손 1에서의 정방향 프라이머 및 ETV4 엑손 4 역방향 프라이머를 사용하여 QPCR을 수행하였고, CPP 또는 PCA1-5에서 생성물은 검출되지 않았다.
ETV4 이상조절을 갖는 다른 전립선암이 TMPRSS2:ERG 및 TMPRSS2:ETV1 전사체 (TMPRSS2로부터의 공지의 엑손 포함)와 구조적으로 보다 유사한 TMPRSS2:ETV4 융합 전사체를 함유할 수 있는지의 여부는 알려지지 않았다. 본원에 보고된 TMPRSS2:ETV4 융합체는 TMPRSS2 상류 부근의 잘 특징규명된 ARE를 함유하지 않는다. 그러나, 본원에 기재된 TMPRSS2:ETV4 전사체에 존재하는 TMPRSS2 서열의 상류에 위치한 안드로겐 반응성 인핸서에 대한 증거가 존재한다 (문헌 [Rabbitts, Nature 1994;372:143-9]). 그럼에도 불구하고, 융합 전사체에 포함된 ETV4 엑손만의 두드러진 과다발현은, 유전자 융합체가 ETV4의 이상조절에서 역할을 함을 강하게 시사한다. 이와 함께, TMPRSS2:ETV4 융합 전사체의 구조는, TMPRSS2 상류의 제어 요소가 전사된 TMPRSS2 서열보다 ETS 부류 구성원의 이상 조절을 촉진한다는 결론을 뒷받침한다.
RLM-RACE 및 QPCR에 의해 입증된 바와 같이 TMPRSS2 (21q22) 및 ETV4 (17q21)를 둘러싼 게놈 유전자좌의 융합을 확인하기 위해, 간기 형광 계내 혼성화 (FISH)를 이용하였다. 프로브 TMPRSS2의 5' 및 ETV4의 3'를 사용하여, TMPRSS2 및 ETV4 유전자좌의 융합이 PCA5로부터의 암성 세포의 65%에서 관찰되었다 (도 8D). 프로브 ETV4의 5' 및 3'를 사용하여 ETV4의 재배열을 추가로 확인하자, PCA5로부터의 암성 세포의 64%가 분할 신호를 나타냈다. 또한, 2개의 프로브 ETV4의 3', ERG 분할 신호 프로브 및 TMPRSS2:ETV1 융합 프로브를 사용하여 PCA5 상에서 FISH를 수행하여, 각각의 혼성화에 대해 얻은 음성 결과로 추가의 재배열을 설명하였다.
이와 함께, 대부분의 분석 방법이 일치하는 탈조절을 나타내지 않는 프로파일은 무시하기 때문에, 결과는 종양 유전자 발현 데이터에서 이상점 프로파일을 조심스럽게 조사하는 용도를 강조하며 (문헌 [Eisen et al., Proc Natl Acad Sci U S A 1998;95:14863-8], [Golub et al., Science 1999;286:531-7], [Tusher et al., Proc Natl Acad Sci U S A 2001;98:5116-21]), 따라서 전립선암에서의 ETV4의 확인이 실패하는 것은 드문 것으로 나타났다 (98 사례 중 2 사례). TMPRSS2:ERG 및 TMPRSS2:ETV1 융합체의 확인과 겸하여, 본원에 나타낸 결과는 TMPRSS2 상류의 ARE 또는 인핸서의 하위버전에 의해 매개되는 ETS 부류 구성원의 이상조절이 전립선 종양형성의 특징임을 나타낸다.
실시예 3: 유전자 융합체 RNA 의 검출
본 실시예는 4가지 개별적인 정성적 검정에서의, 4가지 유전자 융합체 서열을 함유하는 RNA (IVT)의 표적 포획, 증폭 및 정성적 검출을 기재한다: TMPRSS2:ETV1a, TMPRSS2:ETV1b, TMPRSS2:ERGa 및 TMPRSS2:ERGb (압티마(APTIMA) 제제 시약, 및 적절한 표적 특이적 올리고뉴클레오티드, 프라이머 및 프로브로 스파이킹된(spiked) 각각에 대한 HPA 검출을 이용함). 표 5는 검정에 사용된 올리고뉴클레오티드의 서열을 보여준다.
Figure pct00021
A. 물질 및 방법
RNA 표적 포획
용해 완충액은 15 mM 인산나트륨 일염기성 일수화물, 15 mM 인산나트륨 이염기성 무수물, 1.0 mM EDTA 이나트륨 이수화물, 1.0 mM EGTA 유리 산, 및 110 mM 리튬 라우릴 술페이트를 함유하였다 (pH 6.7). 표적 포획 시약은 250 mM HEPES, 310 mM 수산화리튬, 1.88 M 염화리튬, 100 mM EDTA 유리 산, 및 카르복실레이트 변형된 1 ㎛ 자기 입자 세라-마그(SERA-MAG) MG-CM (세라딘, 인크.(Seradyn, Inc.); 미국 인디애나주 인디애나폴리스) (이에 공유 결합된 (dT)14 올리고머를 가짐) 250 ㎍/ml를 함유하였다 (pH 6.4). 세척 용액은 10 mM HEPES, 6.5 mM 수산화나트륨, 1 mM EDTA, 0.3% (v/v) 에탄올, 0.02% (w/v) 메틸 파라벤, 0.01% (w/v) 프로필 파라벤, 150 mM 염화나트륨, 0.1% (w/v) 나트륨 라우릴 술페이트 (SDS)를 함유하였다 (pH 7.5).
RNA 증폭 & 검출
증폭 시약은 26.7 mM rATP, 5.0 mM rCTP, 33.3 mM rGTP 및 5.0 mM rUTP, 125 mM HEPES, 8% (w/v) 트레할로스 이수화물, 1.33 mM dATP, 1.33 mM dCTP, 1.33 mM dGTP 및 1.33 mM dTTP를 함유하는 용액 (pH 7.5) 3.6 mL의 동결건조된 형태였다. 증폭 시약을 9.7 mL의 증폭 시약 재구성 용액으로 재구성하였다 (하기 참조). 사용 전에, 각각의 프라이머 올리고머 15 pmol을 첨가하였다. 증폭 시약 재구성 용액은 0.4% (v/v) 에탄올, 0.10% (w/v) 메틸 파라벤, 0.02% (w/v) 프로필 파라벤, 33 mM KCl, 30.6 mM MgCl2, 0.003% 페놀 레드를 함유하였다. 효소 시약은 20 mM HEPES, 125 mM N-아세틸-L-시스테인, 0.1 mM EDTA 이나트륨 이수화물, 0.2% (v/v) 트리톤7(TRITON7) X-100 계면활성제, 0.2 M 트레할로스 이수화물, 0.90 RTU/mL 몰로니(Moloney) 마우스 백혈병 바이러스 (MMLV) 역전사효소, 및 0.20 U/mL T7 RNA 중합효소를 함유하는 용액 (pH 7.0) 1.45 mL의 동결건조된 형태였다. MMLV 역전사효소에 대해 활성의 1 단위 (RTU)는 37℃에서 15분 이내에 cDNA 5.75 fmol의 합성 및 방출로 정의되며, T7 RNA 중합효소에 대해 활성의 1 단위 (U)는 37℃에서 20분 이내에 RNA 전사체 5.0 fmol의 생성으로 정의된다. 효소 시약을 3.6 mL의 효소 시약 재구성 용액으로 재구성하였다 (하기 참조). 효소 시약 재구성 용액은 50 mM HEPES, 1 mM EDTA, 10% (v/v) 트리톤7 X-100, 120 mM 염화칼륨, 20% (v/v) 글리세롤 무수물을 함유하였다 (pH 7.0). 혼성화 시약은 100 mM 숙신산 유리 산, 2% (w/v) 리튬 라우릴 술페이트, 100 mM 수산화리튬, 15 mM 알드리티올-2, 1.2 M 염화리튬, 20 mM EDTA 유리 산, 3.0% (v/v) 에탄올을 함유하였다 (pH 4.7). 선택 시약은 600 mM 붕산, 182.5 mM 수산화나트륨, 1% (v/v) 트리톤7 X-100을 함유하였다 (pH 8.5). 검출 시약은 검출 시약 I (1 mM 질산 및 32 mM 과산화수소 함유) 및 검출 시약 II (1.5 M 수산화나트륨 함유)로 구성되었다.
B. 검정 프로토콜
표적 포획
1. 반응 튜브당 샘플 400 ㎕에 대해 지시된 카피 수준으로 IVT 원액을 STM에 희석하여 샘플을 제조한다.
2. 반복 피펫터(pipettor)를 사용하여, TCO를 갖는 TCR 100 ㎕를 적절한 반응 튜브에 첨가한다.
3. 마이크로피펫터를 사용하여, 각각의 샘플 400 ㎕를 적합하게 표지된 곳에 첨가한다.
4. 실링(sealing) 카드(들)로 튜브를 덮고, 손으로 랙(rack)을 부드럽게 진탕시킨다. 볼텍싱해서는 안 된다. 랙을 수조에서 30±5분 동안 62±1℃에서 인큐베이션한다.
5. 수조로부터 랙을 수거하고, 흡수성 물질 상에서 튜브 바닥의 물을 빨아들여 건조시켰다.
6. 실링 카드가 확실히 견고하게 고정되도록 한다. 필요한 경우, 새 실링 카드로 교체하여 단단히 밀봉한다.
7. 실링 카드를 제거하지 않은 채로, 랙을 30±5분 동안 실온에서 인큐베이션한다.
8. 랙을 5 내지 10분 동안 TCS 자기 베이스 상에 위치시킨다.
9. 분배 매니폴드를 통해 압티마 세척 용액을 펌핑하여 분배 스테이션 펌프 라인을 프라이밍한다. 라인 내에 기포가 전혀 없고 10개의 노즐 모두가 안정적인 액체 스트림을 전달하도록 충분한 양의 액체를 시스템을 통해 펌핑한다.
10. 진공 펌프를 작동시키고, 흡인 매니폴드와 트랩 병 사이의 제1 커넥터에서 흡인 매니폴드를 단절시킨다. 진공 게이지가 확실히 25 (Hg)를 초과하여 판독되도록 한다. 이러한 판독을 달성하는 데 15초가 걸릴 수 있다. 매니폴드를 재연결하고, 진공 게이지가 확실히 7 내지 12 (Hg)에 있도록 한다. 모든 표적 포획 단계가 완료될 때까지 진공 펌프를 켠 채로 둔다.
11. 흡인 매니폴드를 팁의 제1 세트에 견고하게 부착시킨다. 팁이 튜브 바닥과 간결히 접촉하게 될 때까지 팁을 제1 TTU 내로 하강시킴으로써 모든 액체를 흡인시킨다. 팁을 튜브 바닥과 접촉시킨 채로 유지해서는 안 된다.
12. 흡인이 완료된 후, 팁을 그의 원래의 팁 카세트로 방출한다. 각각의 시료에 대해 전용 팁을 사용하여, 나머지 TTU에 대해 흡인 단계를 반복한다.
13. 각각의 TTU 상에 분배 매니폴드를 위치시키고, 분배 스테이션 펌프를 사용하여 1.0 mL의 압티마 세척 용액을 TTU의 각 튜브 내로 전달한다.
14. 튜브를 실링 카드로 덮고, 랙을 TCS로부터 수거한다. 다중-튜브 볼텍싱 믹서 상에서 1회 볼텍싱한다.
15. 랙을 5 내지 10분 동안 TCS 자기 베이스 상에 위치시킨다.
16. 단계 13 및 14에서와 같이 모든 액체를 흡인시킨다.
17. 최종 흡인 후, 랙을 TCS 베이스로부터 수거하고, 튜브를 시각적으로 검사하여 모든 액체가 흡인되었음을 확실히 한다. 어떠한 액체라도 보일 경우, 랙을 2분 동안 다시 TCS 베이스 상에 위치시키고, 각각의 시료에 대해 이전에 사용한 동일한 팁을 사용하여 해당 TTU에 대해 흡인을 반복한다.
프라이머 어닐링 및 증폭
1. 반복 피펫터를 사용하여, 분석물 특이적 프라미어를 함유하는 재구성 증폭 시약 75 ㎕를 각각의 반응 튜브에 첨가한다. 랙 내의 모든 반응 혼합물은 이제 적색이어야 한다.
2. 반복 피펫터를 사용하여, 200 ㎕의 오일 시약을 첨가한다.
3. 튜브를 실링 카드로 덮고, 다중-튜브 볼텍싱 믹서 상에서 볼텍싱한다.
4. 랙을 수조에서 10±5분 동안 62±1℃에서 인큐베이션한다.
5. 랙을 5±2분 동안 42±1℃의 수조로 옮긴다.
6. 랙을 수조에 둔 채로, 실링 카드를 조심스럽게 제거하고, 반복 피펫터를 사용하여 25 ㎕의 재구성 효소 시약을 각각의 반응 혼합물에 첨가한다. 모든 반응물은 이제 오렌지색이어야 한다.
7. 즉시 튜브를 새로운 실링 카드로 덮고, 수조로부터 수거하고, 손으로 랙을 부드럽게 진탕시켜 반응물을 혼합한다.
8. 랙을 60±15분 동안 42±1℃에서 인큐베이션한다.
혼성화
1. 랙을 증폭-전 수조로부터 수거하여 증폭-후 영역으로 옮긴다. 반복 피펫터를 사용하여, 분석물 특이적 프로브를 갖는 재구성 프로브 시약 100 ㎕를 첨가한다. 모든 반응 혼합물은 이제 황색이어야 한다.
2. 튜브를 실링 카드로 덮고, 다중-튜브 볼텍싱 믹서 상에서 10초 동안 볼텍싱한다.
2. 랙을 62±1℃ 수조에서 20±5분 동안 인큐베이션한다.
3. 수조로부터 랙을 수거하고, 5±1분 동안 실온에서 인큐베이션한다.
선택
1. 반복 피펫터를 사용하여, 250 ㎕의 선택 시약을 각각의 튜브에 첨가한다. 모든 반응물은 이제 적색이어야 한다.
2. 튜브를 실링 카드로 덮고, 10초 동안 또는 색상이 균일해질 때까지 볼텍싱하고, 랙을 수조에서 10±1분 동안 62±1℃에서 인큐베이션한다.
3. 랙을 수조로부터 수거한다. 랙을 15±3분 동안 실온에서 인큐베이션한다.
TTU 판독
1. 시험을 완료하기에 충분한 부피의 자동 검출 시약 I 및 II가 확실히 있도록 한다.
2. 1개의 빈 TTU를 카세트 위치 1번에 위치시켜 리더(LEADER) 광도계측기를 준비시키고, 세척 프로토콜을 수행한다.
3. TTU를 광도계측기에 로딩하고, HC+ Rev B 프로토콜을 실행한다.
C. 결과
TCR에 스파이킹된 각각의 TMPRSS2:ERG 및 TMPRSS2:ETV1 유전자 융합체 IVT를 사용한 4가지 검정에 대해, 결과를 표 6-9에 나타내었다.
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
실시예 4: 유전자 융합체에 대한 FISH 검정
본 실시예는 형광 계내 혼성화 (FISH)를 이용하여 29개의 전립선암 샘플 중 23개가 ERG 또는 ETV1에서의 재배열을 보유한다는 것을 입증하는 것을 기재한다. 세포주 실험은 TMPRSS2의 안드로겐-반응성 프로모터 요소가 전립선암에서 ETS 부류 구성원의 과다발현을 매개함을 시사한다. 이러한 결과는 암종의 발생, 및 전립선암의 분자 진단 및 치료와 관련이 있다.
하기하는 것은 FISH 검정에 사용된 특이적 BAC 프로브의 목록이다.
ETS 부류 구성원에서의 이상을 FISH 에 의해 시험하기 위한 임상적 FISH 검정
· ETV1에 걸쳐있는 1개의 프로브 및 TMPRSS2 유전자좌에 걸쳐있는 1개의 프로브를 이용한 ETV1-TMPRSS2 융합 시험
ETV1에 대한 BAC: RP11-692L4
TMPRSS2에 대한 BAC: RP11-121A5, (RP11-120C17, PR11-814F13, RR11-535H11)
· c-ERG:t-ERG 분리에 대한 프로브의 세트를 이용한 ERG 전좌 시험:
c-ERG에 대한 BAC: RP11-24A11
t-ERG에 대한 BAC: RP11-372O17, RP11-137J13
· ETV1 유전자좌에 걸쳐있는 1개의 프로브 및 염색체 7 상의 1개의 참조 프로브의 세트를 이용한 ETV1 결실/증폭 시험:
ETV1에 대한 BAC: RP11-692L4
염색체 7 상의 참조 프로브에 대한 BAC: 시판되는 염색체 중심절 상의 프로브
· ERG 유전자좌에 걸쳐있는 1개의 프로브 및 염색체 21 상의 1개의 참조 프로브의 세트를 이용한 ERG 결실/증폭 시험:
ERG에 대한 BAC: RP11-476D17
염색체 21 상의 참조 프로브에 대한 BAC: *
· TMPRSS2 유전자좌에 걸쳐있는 1개의 프로브 및 염색체 21 상의 1개의 참조 프로브의 세트를 이용한 TMPRSS2 결실/증폭 시험:
TMPRSS2에 대한 BAC: RP11-121A5, (RP11-120C17, PR11-814F13, RR11-535H11)
염색체 21 상의 참조 프로브에 대한 BAC: *
* 염색체 21 상의 참조 프로브에 대한 BAC : PR11 -32 L6 , RP11 -752 M23 , RP11-1107H21, RP11 -639A7, ( RP11 -1077 M21 )
실시예 5: TMPRSS2 : ERG 융합 관련 결실
본 실시예는 TMPRSS2:ERG 융합과 관련된 염색체 21q22.2-3 상의 ERG 및 TMPRSS2 사이에 위치한 공통적인 결실의 존재를 기재한다. 넓은 범위의 인간 PCA 샘플, 6개의 세포주 및 13개의 이종이식편을 사용하여 질환 진행 및 임상 결과 사이의 연관성을 검사하였다.
A. 물질 및 방법
임상 샘플
본 연구를 위해 사용된 전립선 샘플은 IRB 승인된 프로토콜 하에 수집하였다. 모든 임상적 국소 PCA 샘플을 1명의 병리학자에 의해 특징규명하고, 글리슨(Gleason) 점수를 할당하여 병리 기록에서 관찰자 간의 차이를 제거하였다. 울름(Ulm) 대학에서 진행중인 연구 프로토콜의 일부로서 임상적 국소 PCA 샘플을 수집하였다. 미시간 대학의 신속 부검 프로그램으로부터 호르몬 불응성 샘플을 획득하였다.
214명의 환자로부터의 897개의 조직 코어 (조직점(histospot))로 구성된 2개의 PCA 결과 어레이 상에서 FISH 실험을 수행하였다. 환자 인구통계의 요약을 표 10에 나타내었다. 모든 환자는 1989년에서 2001년 사이에 울름 대학 (독일 울름)에서 골반 림프절절제술과 함께 근치적 전립선절제술을 받았다. 수술전 PSA는 1 내지 314 ng/ml (평균 36 ng/ml)의 범위였다. 평균 및 최대 추적조사는 각각 3.4년 및 8.4년이었다.
세포주 및 이종이식편
안드로겐 비의존성 PCA 세포주 (PC-3, DU-145, HPV10 및 22Rv1) 및 안드로겐 민감성 PCA 세포주 (LNCaP)를 아메리칸 타입 컬쳐 컬렉션 (American Type Culture Collection; 미국 버지니아주 매나싸스(Manassas))으로부터 구입하고, 그의 규정된 배지에서 유지하였다. HPV10은 고등급의 PCA (글리슨 점수 4+4=8)로부터의 세포로부터 유래되었고, 이를 HPV18 DNA(18)로의 형질감염에 의해 형질전환시켰다. 22Rv1은, 부모의 안드로겐-의존성 CWR22 이종이식편의 거세-유발된 퇴행 및 퇴화 후 마우스에서 연속적으로 유전된 이종이식편으로부터 유래된 인간 PCA 상피 세포주이다. VCAP 세포주는 미시간 대학에서의 신속 부검 프로그램의 일부로서 척추의 전이 병변으로부터 유래되었다.
LuCaP 23.1, 35, 73, 77, 81, 86.2, 92.1 및 105는 안드로겐 비의존성 호르몬-불응성 질환 PCA를 갖는 환자로부터 유래되었다. LuCaP 49 및 115는 안드로겐 의존성 PCA를 갖는 환자로부터 유래되었다. LuCaP 58은 임상적으로 진행된 전이 질환을 갖는 치료되지 않은 환자로부터 유래되었고, LuCaP 96은 호르몬 불응성 PCA를 갖는 환자에서 성장한 전립선 유래 종양으로부터 확립되었다. LuCaP 49 (대망 종괴로부터 확립됨) 및 LuCaP 93은 호르몬-비민감성 (안드로겐 수용체 [AR]-음성) 소세포 PCA였다. 상기 2가지 이종이식편은 신경내분비 표현형을 나타내었다. LuCaP 23.1을 SCID 마우스에서 유지하고, 다른 이종이식편을 수컷 BALB/c nu/nu 마우스에 종양을 이식함으로써 유지하였다.
간기 FISH 를 이용한 TMPRSS2 : ERG 융합 상태 결정
TMPRSS2:ERG의 전좌에 대한 FISH 분석이 상기 및 앞서 기재되어 있다 (문헌 [Tomlins, et al., Science 310:644-8 (2005)]). 상기 분리 분석을 도 11 및 14에 나타내었다. 염색체 21q22.2 상의 ERG 재배열을 분석하기 위해, 각각 ERG 유전자좌의 이웃하는 중심절 및 끝분절 영역에 걸쳐지는, 비오틴-14-dCTP 표지된 BAC 클론 RP11-24A11 (궁극적으로 접합되어 적색 신호를 생성함) 및 디곡시게닌-dUTP 표지된 BAC 클론 RP11-137J13 (궁극적으로 접합되어 녹색 신호를 생성함)으로 이루어지는 분리 프로브 시스템을 적용하였다. 모든 BAC 클론은 오클랜드 아동 병원 연구소(Children's Hospital Oakland Research Institute) (CHORI)의 BACPAC 리소스 센터(Resource Center) (미국 캘리포니아주 오클랜드)로부터 얻었다.
상기 분리 프로브 시스템을 사용하면, ERG 재배열이 없는 핵은 2쌍의 병치된 적색 및 녹색 신호를 나타낸다. 병치된 적색-녹색 신호는 황색 융합 신호를 형성한다. ERG 재배열이 있는 핵은, 각각의 세포에서 전좌된 대립유전자를 위한 단일 적색 및 녹색 신호를 초래하는 하나의 병치된 적색-녹색 신호 쌍의 분리, 및 전좌되지 않은 대립유전자를 위한 조합된 황색 신호를 보여준다. 조직 분석에 앞서, 모든 프로브의 완전성 및 순도를 정상 말초 림프구 중기 도말(spread)에 혼성화시킴으로써 확인하였다. 조직 혼성화, 세척 및 형광 검출을 앞서 기재된 바와 같이 수행하였다 (문헌 [Garraway, et al., Nature 436:117-22 (2005)], [Rubin, et al., Cancer Res. 64:3814-22 (2004)]). 2개의 TMA로부터 59%의 PCA 사례에서 1개 이상의 TMA 코어를 평가할 수 있었다. 상기 검정의 기술적 난점에는 약한 프로브 신호를 평가하기 위한 진단 물질의 부재, 및 정확한 진단을 방해하는 겹쳐있는 세포가 포함된다. 나머지 분석은 평가될 수 있는 118개 사례의 임상적 국소 PCA에 집중되었다. 15개 사례는 평가될 수 있는 상응하는 호르몬 나이브 전이 림프절 샘플을 가졌다.
적절한 필터, CCD (전하 결합 소자) 카메라 및 시토비전(CytoVision) FISH 영상화 및 포착 소프트웨어 (어플라이드 이미징(Applied Imaging), 미국 캘리포니아주 산 호세(San Jose))가 장착된 올림푸스(Olympus) BX-51 형광 현미경을 이용하여 100x 유침 대물렌즈 하에 샘플을 분석하였다. 시험의 평가는 둘 다 간기 FISH 실험을 분석한 경험이 있는 2명의 병리학자에 의해 독립적으로 수행하였다. 각각의 사례에 대해, 사례당 100개 이상의 핵에 점수를 매기도록 시도하였다. 양쪽 병리학자의 결과 사이에 유의한 차이가 발견될 경우, 사례를 제3의 병리학자에 의해 중재하였다.
올리고뉴클레오티드 SNP 어레이 분석
SNP 어레이가 대립유전자의 유전자형 분석을 위해 의도된 것일지라도, SNP 어레이 데이터는 이형접합소실에 대한 정보 (문헌 [Lieberfarb, et al., Cancer Res 63:4781-5 (2003)], [Lin, et al., Bioinformatics 20:1233-40 (2004)]) 및 카피수 변경의 검출 (문헌 [Zhao, et al., Cancer Cell 3:483-95 (2003)])을 제공할 수 있다. SNP 어레이 분석을 이용하여, 흑색종 (MITF) (문헌 [Garraway, et al., Nature 436:117-22 (2005)]) 및 PCA (TPD52) (문헌 [Rubin, et al., Cancer Res. 64:3814-22 (2004)])를 비롯한 다양한 암에서 증폭되는 유전자를 확인 및 확증할 수 있었다.
게놈 표시의 단순화와 함께 100K 어레이 상에서의 SNP 검출을 개시하였다. 게놈 DNA의 2개의 250 ng 분취액을 개별적으로 XbaI, HindIII으로 소화시켰다. 소화된 단편을 올리고뉴클레오티드 링커에 독립적으로 라이게이션시켰다. 생성된 생성물을 200 내지 2000 bp의 PCR 단편이 증폭되는 조건 하에 단일 PCR 프라이머를 사용하여 증폭시켰다. 상기 단편은 게놈의 하위-분획을 나타낸다. 어레이 상에 타일링된 SNP를, 상기 XbaI 및 HindIII 단편 내에 놓여있는 것들로 예비 선택하고, 어레이 상에서 견고하게 검출되는 것들을 확증하였다. 이어서, 유도된 증폭 DNA 풀을 표지하고, 추가로 단편화하고, 개별 HindIII 및 XbaI 올리고뉴클레오티드 SNP 어레이에 혼성화시켰다.
어레이를 진칩(GeneChip) 스캐너 3000을 이용하여 스캐닝하였다. 유전자형 분석 콜(call) 및 신호 정량화를 진칩 작업 시스템(Operating System) 1.1.1 및 어피메트릭스 유전자형 분석 도구(Affymetrix Genotyping Tools) 2.0 소프트웨어를 이용하여 얻었다. 유전자형 분석 콜 비율이 90%를 초과하는 어레이만을 추가로 분석하였다. 미가공 데이터 파일을 dChipSNP에서 예비-프로세싱 및 시각화하였다 (문헌 [Lin, et al., Bioinformatics 20:1233-40 (2004)]). 특히, 예비프로세싱은 불변 프로브 세트를 이용한 기준선 어레이로의 어레이 데이터 표준화, 및 각각의 샘플 상의 각각의 SNP에 대해 단일 강도 값을 얻기 위한 모델 기재 (PM/MM) 방법을 이용한 후속 프로세싱을 포함하였다 (문헌 [Li, et al., Proc. Nat'l Acad. Sci. USA 98:31-6 (2001)]).
TMPRSS2 : ERG TMPRSS2 : ETV1 융합 전사체에 대한 정량적 PCR
엠제이 리서치(MJ Research)로부터의 DNA 엔진 옵티콘 2 기기 상에서 SYBR 녹색 염료 (키아겐)를 사용하여 QPCR을 수행하였다. 전체 RNA를 무작위 6량체의 존재 하에 택맨 역전사 시약 (어플라이드 바이오시스템즈)을 사용하여 cDNA로 역전사하였다. 모든 QPCR 반응은 SYBR 녹색 마스터 믹스 (키아겐)를 사용하여 수행하였다. 모든 올리고뉴클레오티드 프라이머는 인테그레이티드 디엔에이 테크놀로지스에서 디자인된 것이었다. 문헌 [Tomlin et al., Science 310:644-8 (2005)]에 기재되었고 융합체에 대해 특이적인 프라이머를 사용하였다:
Figure pct00026
GAPDH 프라이머는 앞서 기재되어 있었다 (문헌 [Vandesompele, et al., Genome Biol 3: RESEARCH 0034 (2002)]). 10 μMol의 정방향 및 역방향 프라이머를 사용하였고, 제조사의 권장 열주기 조건에 따라 절차를 수행하였다. 옵티콘 모니터 분석 소프트웨어 버전 2.02를 사용하여 QPCR 반응의 지수기 동안의 임계 수준을 세팅하였다. 각각의 샘플에 대해, 하우스키핑 유전자인 글리세르알데히드-3-포스페이트 데히드로게나제 (GAPDH)에 상대적인 각각의 표적 유전자의 양을 상대적 임계 주기 (Ct) 방법 (어플라이드 바이오시스템즈 사용자 게시물 제2호)을 이용하여 결정하였다. 모든 반응을 용해 곡선 분석에 적용시키고, 선택된 실험으로부터의 생성물을 2% 아가로스 겔 상에서 전기영동에 의해 분할하였다.
통계학
임상 및 병리학 파라미터를 재배열 상태 및 결실의 존재와의 연관성에 대해 조사하였다. 카이-제곱 검정 및 피셔 정확 검정을 적절히 이용하였다. 카플란-마이어(Kaplan-Meier) 분석을, 병리학 및 게놈 변경 파라미터의 전립선-특이적 항원 재발이 없는 생존 곡선을 생성하는 데 이용하였다. 로그-순위 검정을 연관성의 통계적 유의성을 평가하는 데 이용하였다. 선행 신생-아주반트 호르몬 제거 요법을 받은 환자는 제외하였다. 모든 통계는 윈도우즈용 SPSS 13.0 (에스피에스에스 인크.(SPSS Inc.), 미국 일리노이주 시카고)를 이용하여 0.05의 유의성 수준으로 수행하였다.
B. 결과
TMPRSS2 : ERG 유전자 재배열과 관련된 염색체 21 상의 결실 검출
PCA에서 TMPRSS2:ERG 재배열의 빈도를 특징규명하기 위해, 문헌 [Tomlins, et al., Science 310:644-8 (2005)]에 기재된 검정으로부터 변형된 FISH 검정을 이용하였다. 원래의 FISH 분석은 ERG 상의 중심절 3' 및 끝분절 5' 말단에 위치한 2개의 프로브를 사용한다. 신규 검정은 5' 프로브를 끝분절 방향으로 이동시켰다 (도 14). PCA 스크리닝 조직 마이크로어레이 (TMA)를 사용하여, TMPRSS2:ERG 재배열을 입증하는 PCA (도 11A 및 11B) 중 대략 70%가 또한 끝분절 5' ERG 프로브에 상응하는 녹색 신호의 상실 (도 11C 및 11D)을 보였다는 것이 관찰되었고, 이는 상기 염색체 영역이 결실되었음을 시사한다. 100K 올리고뉴클레오티드 SNP 어레이를, 상기 결실의 정도를 특징규명하는 데 사용하였다. 세포주, 이종이식편, 및 호르몬 나이브 및 호르몬 불응성 전이 PCA 샘플을 비롯한 30개의 PCA 샘플을 조사하여, 염색체 21q23 상의 ERG 및 TMPRSS2 사이의 게놈 상실을 확인하였다 (도 12a-c).
TMPRSS2:ERG 및 TMPRSS2:ETV1에 대한 재배열 상태를, 상기 30개의 PCA에 대해 FISH 및/또는 qPCR에 의해 결정하였다 (도 12a, 회색 및 연청색 막대). 불연속적인 게놈 상실이 LuCaP 49, LuCaP 93, ULM LN 13, MET6-9, MET18-2, MET24-28 및 MET28-27에 대한 TMPRSS2 및 ERG 유전자좌 사이의 영역을 포함하는 TMPRSS2:ERG 재배열 양성 샘플에서 관찰되었다. 상기 불연속 결실의 정도는 비균질적이었다. TMPRSS2 및 ERG 유전자좌 사이의 영역을 포함하는 염색체 21 상의 보다 광범위한 게놈 상실이 LuCaP 35, LuCaP 86.2, LuCaP 92.1 및 MET3-81에서 관찰되었다. VCaP 세포주 및 이종이식편 LuCap 23.1은 상기 영역에서의 상실을 입증하지 않았다. 샘플의 하위세트 45% (11개 중 5개)에 대해, 결실은 ERG 인트론 3에 근접하여 발생하였다. 대다수의 샘플 64% (11개 중 7개)에 대해, 결실은 TMPRSS2 상에 위치한 SNP (끝분절 방향으로의 다음 SNP는 약 100K bp 거리에 있음)에 근접하여 끝났다. VCaP 세포주는 염색체 21 전체를 따라 카피수 획득을 보여주었다.
TMPRSS2:ERG 재배열 양성 종양에 대해, 71% (7개 중 5개)의 호르몬 불응성 PCA가 TMPRSS2 및 ERG 유전자좌 사이의 결실을 입증한 반면, 단지 25% (4개 중 1개)의 호르몬 나이브 전이 PCA 샘플 (ULM LN 13)에서만 결실이 확인되었다. 2개의 별개의 하위-부류 (결실의 개시점에 의해 구별됨 - 38.765 Mb 또는 38.911 Mb)가 있는 결실 경계에 대해, 유의한 균질성이 있다. 표준 PCA 세포주 (PC-3, LNCaP, DU-145 또는 CWR22 (22Rv1)) 중 아무것도 TMPRSS2:ERG 또는 TMPRSS2:ETV1 융합을 입증하지 않았다. LuCaP 49 (대망 종괴로부터 확립됨) 및 LuCaP 93 (둘 다 호르몬-비민감성 (안드로겐 수용체 [AR]-음성) 소세포 PCA임)을 비롯하여 LuCap 이종이식편 중 몇몇은 결실이 있는 TMPRSS2:ERG 융합체를 입증하였다.
ERG의 카피수 획득이 TMPRSS2:ERG 재배열이 있는 사례 및 없는 사례 둘 다의 작은 하위세트에서 관찰되었다. 호르몬 불응성 PCA로부터 유래된 VCaP 세포주는, FISH에 의해 확인된 염색체 21 상에서의 유의한 카피수 획득을 입증하였다 (도 12a-c).
원발성 전립선암 샘플 및 및 호르몬 나이브 림프절 전이에서의 TMPRSS2:ERG 재배열
상기 관찰의 빈도 및 잠재적인 임상 유의성을 특징규명하기 위해, 118개의 임상적 국소 PCA 사례를 FISH에 의해 검사하였다. 임상 및 병리학 인구통계를 표 10에 나타내었다. 상기 환자 코호트는 높은 종양 등급 (글리슨 등급), 병리 단계 및 치료-전 PSA 수준에 의해 나타난 바와 같이 높은 질환 재발 위험성이 있다. PCA의 큰 영역이 현미경적으로 연구될 수 있는 상기 코호트로부터의 표준 조직 절편을 사용하여, TMPRSS2:ERG 재배열은 주어진 종양에 대해 균질한 것으로 관찰되었다. TMA 실험은 상기 관찰을 확인시켰다. 3 내지 6개의 코어가 종양의 상이한 구역으로부터 획득된 PCA 사례에서는, TMPRSS2:ERG 재배열 상태에 대해 100%의 일치성이 관찰되었다 (즉, 존재 또는 부재). 또한, 결실이 있는 TMPRSS2:ERG 재배열을 갖는 사례에서, 사례 중 97.9% (94/96)에서 동일한 환자로부터의 모든 TMA 코어에서 결실이 관찰된다는 것이 관찰되었다.
Figure pct00027
원발성 PCA 샘플 중 49.2% 및 호르몬 나이브 전이 LN 샘플 중 41.2%에서 TMPRSS2:ERG 재배열이 확인되었다 (도 13A). TMPRSS2:ERG 재배열이 있는 원발성 PCA 샘플 중 60.3% (35/58) 및 호르몬 나이브 림프절 종양 중 42.9% (3/7)에서 끝분절 프로브 (녹색 신호)의 결실 (도 1C-D)이 관찰되었다.
매칭되는 원발성 및 호르몬 나이브 림프절 종양이 있는 15개 사례에서, 47%의 쌍 (15쌍 중 7쌍)이 재배열을 입증하면서, TMPRSS2:ERG 재배열 상태에 대해 100%의 일치성이 있다. 끝분절 (녹색 신호) 프로브의 결실은 42.9%의 쌍 (7쌍 중 3쌍)에서 일치하게 보였다.
TMPRSS2 : ERG 재배열 상태 및 전립선암 진행
재배열 상태와 임상 및 병리학적 파라미터 사이의 연관성을 관찰하였다 (도 13). 결실이 있는 TMPRSS2:ERG 재배열은 진행된 종양 단계 (pT)를 갖는 PCA 사례에서 (p=0.03) (도 13B), 및 부위 골반 림프절로 전이된 질환의 존재 하에 (pN0 대 pN1 -2) (p=0.02) 보다 높은 백분율로 관찰되었다. 추적조사 데이터가 이용가능한 70명의 환자에 대해 전립선 특이적 항원 (PSA) 생화학적 실패에 의해 결정된, 결실의 존재 및 부재 하의 TMPRSS2:ERG 재배열과 임상 결과 사이의 연관성을 또한 평가하였다. 글리슨 등급, 종양 단계, 핵 등급 및 림프절 상태는 PSA 생화학적 실패의 좋은 예측변수였다 (모든 p-값 < 0.0005). FISH 검정에 의해 결정된 바와 같이, 결실이 없는 TMPRSS2:ERG 재배열된 PCA 사례가 PSA 재발이 없는 생존에 유리함을 시사하는 경향이 단일변량 수준에서 관찰되었다.
실시예 6: 치명적인 전립선암과 관련된 TMPRSS2 : ERG 유전자 융합
선행 연구에서, TMPRSS2 (21q22.3)의 5'-비번역 영역과 ETS 전사 인자 부류 구성원인 ERG (21q22.2), ETV1 (7p21.2) (문헌 [Tomlins, et al., Science 310:644-8 (2005)]) 또는 ETV4 (문헌 [Tomlins, et al., Cancer Res. 66(7):3396-400 (2006)])의 유전자 융합은, 대부분의 전립선암에서의 ETS 유전자의 과다발현을 위한 메카니즘을 제공하였다. 또한, 안드로겐으로 조절되는 유전자인 TMPRSS2와 종양유전자의 융합은, 질환 진행이 이들 분자 아형에 기반하여 달라질 수 있음을 시사하였다. 유전자 융합을 위한 가장 공통적인 메카니즘은 TMPRSS2 및 ERG 사이의 약 2.8 Mb의 게놈 DNA 상실이다 (도 17A 및 B). 본 실시예는 공통적인 TMPRSS2:ERG 유전자 융합의 존재에 기반한 전이 또는 전립선암 특이적 사망의 위험성을 기재한다.
A. 방법
연구 집단은, 스웨덴 외레브로(Oerebro) 대학 병원에서 1977년에서 1991년 사이에, 문헌 [Andren et al., J. Urol. 175(4):1337-40 (2006)]에 기재된 바와 같이 증후성 전립선 비대증에 대한 전립선의 요도경유 절제술 (TURP) 또는 방광경유 선종 적출술에 의해 초기 전립선암 (T1a-b, Nx, M0)을 갖는 것으로 진단된 사람들을 포함하였다. 진단에서의 기준선 평가에는 물리적 검사, 흉부 방사선촬영, 뼈 스캐닝 및 골격 방사선촬영 (필요한 경우)이 포함되었다. 림프절 단계분류는 수행하지 않았다. 상기 평가는 원격 전이에 대한 증거를 전혀 제공하지 않았기 때문에, 환자는 방관적으로 추적조사를 받고, 진단 후 처음 2년 동안은 6개월마다, 그리고 후속적으로 12개월 간격으로 임상 시험, 실험실 검사 및 뼈 스캐닝을 받았다. 뼈 스캐닝에 의해 결정된 전이가 발생한 환자를, 그가 증상을 나타내는 경우에 안드로겐 박탈 요법으로 치료하였다.
상기 코호트에서의 사망 원인을 연구 조사자에 의해 의료 기록을 검토하여 결정하였다. 스웨덴 사망 등록과 비교한 사망 원인에 관한 확증 연구는, 어떠한 사망 원인의 고의적인 축소 또는 과장 기록도 없이 90%를 초과하는 일치성을 보였다 (문헌 [Johansson, et al., Lancet 1(8642):799-803 (1989)]). 사망률에 대한 코호트의 추적조사는 100%였으며, 2005년 10월까지 추적조사를 놓친 환자는 없었다. 연구 종점은 원격 전이의 발생 또는 전립선암 특이적 사망으로 규정하였다 (중위 추적조사 시간 9.1년, 최대 27년).
모든 TURP 샘플을 1명의 병리학자에 의해 검토하여 전립선암의 진단을 확인하고, 글리슨 점수 및 핵 등급을 결정하고, 종양 부하를 앞서 기재된 바와 같이 추정하였다 (문헌 [J. Urol. 175(4): 1337-40 (2006)]). 조직 마이크로어레이를 수동 어레이어를 사용하여 조립하였다 (문헌 [Rubin, et al., Cancer Epidemiol. Biomarkers Prev. 14(6):l424-32 (2005)]). 전립선암에서의 TMPRSS2:ERG 재배열 빈도를, 원래 문헌 [Tomlins et al., Science 310:644-8 (2005)]에 기재된 검정으로부터 변형된 형광 계내 혼성화 (FISH) 검정을 이용하여 평가하였다. 신규 분석은 5' 프로브를 끝분절 방향으로 대략 600 kb 이동시켰다. 92개의 전립선암 사례에서 1개 이상의 TMA 코어를 평가할 수 있었다.
B. 결과
상기 집단-기재의, 국소 암을 갖는 것으로 진단된 사람들의 코호트에서 TMPRSS2:ERG 융합의 빈도는 15.2% (14/92)였다 (도 17A 및 B). TMPRSS2:ERG 융합 양성 종양은 보다 높은 글리슨 점수를 가질 확률이 높았다 (양측검정 P =.014) (표 11). 융합 상태와 치명적인 전립선암의 관계를 평가하기 위해, 누적 발생빈도 회귀분석을 이용하였다. TMPRSS2:ERG 유전자 융합의 존재와 전이 또는 질환 특이적 사망 사이의 유의한 연관성 (도 17C)이 3.6의 누적 발생빈도 비율 (CIR) (P = .004, 95% 신뢰 구간 [CI] = 1.5 내지 8.9)로 관찰되었다. 글리슨 점수에 대해 조정할 경우, CIR은 2.4였다 (P = .07, 및 95%CI = 0.9 내지 6.1). 본 발명은 특정 메카니즘에 제한되지 않는다. 실제로, 본 발명을 실시하기 위해 메카니즘의 이해는 필요하지 않다. 그럼에도 불구하고, 주어진 종양 내의 세포에서의 TMPRSS2:ERG 유전자 융합의 동질성, 및 (전립선 상피내 신생물과 비교하여) 오직 침윤성 전립선암에서의 상기 동질성의 존재에 기반하여, 상기 융합은 초기 사건이고, 이는 부분적으로 글리슨 패턴의 표현형 배후의 생물학에 기여할 수 있을 것으로 생각된다.
Figure pct00028
실시예 7: 전립선암을 갖는 환자의 소변에서의 TMPRSS2 : ETS 융합체의 검출
A. 물질 및 방법
소변 수집, RNA 단리 및 증폭
바늘 생검 또는 근치적 전립선절제술 전의 디지털 직장 검사 후에 환자로부터 소변 샘플을 얻었다. 소변은 DNA/RNA 보존제 (시에라 디아그노스틱스(Sierra Diagnostics))를 함유한 소변 수집 컵에 배출되었다. RNA의 단리를 위해, 최소 30 ml의 소변을 4℃에서 15분 동안 400 rpm에서 원심분리하였다. 알엔에이레이터(RNAlater) (암비온(Ambion))를 소변 침전물에 첨가하고, RNA가 단리될 때까지 -20℃에 보관하였다. 전체 RNA를 키아겐 알엔이지(RNeasy) 마이크로 키트를 사용하여 제조사의 지시에 따라 단리하였다. 전체 RNA를 옴니플렉스(OmniPlex) 전체 전사체 증폭(Whole Transcriptome Amplification; WTA) 키트 (루비콘 게노믹스(Rubicon Genomics))를 사용하여 제조사의 지시에 따라 증폭시켰다 (문헌 [Tomlins et al., Neoplasia 8:153 [2006]]). 25 ng의 전체 RNA를 WTA 라이브러리 합성을 위해 사용하고, cDNA 라이브러리를 WTA PCR 증폭 1 라운드에 적용시켰다. 증폭된 생성물을 키아퀵(QIAquick) PCR 정제 키트 (키아겐)를 사용하여 정제하였다. 세포주 유효성 검증(proof of concept) 실험을 위해, 지시된 수의 VCaP 또는 LNCaP 세포를 1 ml의 멸균 소변에 스파이킹하고, 샘플을 배출된 소변에 대한 것과 같이 처리하였다.
정량적 PCR
WTA 증폭된 cDNA로부터 ERG, ETV1 및 TMPRSS2:ERG 전사체를, 본질적으로 기재된 바와 같이 정량적 PCR (QPCR)을 이용하여 검출하였다 (문헌 [Tomlins et al., Neoplasia 8:153 [2006]], [Tomlins et al., Science 310:644 [2005]], 상기 실시예 1). 각각의 QPCR 반응을 위해, 10 ng의 WTA 증폭된 cDNA를 주형으로서 사용하였다. ERG, ETV1, PSA 및 GAPDH에 대한 반응은 2x 파워 SYBR 녹색 마스터 믹스 (어플라이드 바이오시스템즈), 및 25 ng의 정방향 및 역방향 프라이머 둘 다를 사용하였다. TMPRSS2:ERGa에 대한 반응은 2x 택맨 유니버설 PCR 마스터 믹스, 및 최종 농도 900 nM의 정방향 및 역방향 프라이머, 및 250 nM 프로브를 사용하였다. 택맨 검정에 있어서, 38 주기를 초과하는 Ct 값을 갖는 샘플은 전혀 증폭을 보이지 않은 것으로 간주하였다. 모든 샘플에 대해, ERG 및 ETV1의 양을 GAPDH의 양으로 표준화하였다. PSA의 증폭이 불충분한 샘플 (소변 내 전립선 세포의 불량한 회수를 나타냄)을 추가의 분석으로부터 제외하였다. ERG (엑손5_6 정방향) 및 ETV1 (엑손6_7)2, GAPDH3, 및 PSA4 프라이머는 기재된 바와 같았다. TMPRSS2:ERGa에 대해 특이적인 택맨 프라이머 및 프로브 (MGB 표지됨)는 하기와 같다:
Figure pct00029
형광 계내 혼성화 ( FISH )
간기 형광 계내 혼성화 (FISH)를 위해, 매칭되는 바늘 생검으로부터의 4 ㎛ 두께의 포르말린 고정시키고 파라핀 포매시킨 (FFPE) 절편을 사용하여 앞서 기재된 바와 같이 처리하고, 혼성화시켰다 (실시예 2 및 문헌 [Tomlins et al., Cancer Res 66:3396 [2006]]). ERG 재배열을 검출하기 위한 BAC 프로브인 RP11-95I21 (ERG에 대해 5') 및 RP11-476D17 (ERG에 대해 3')을 앞서 기재된 바와 같이 제조하였다 (문헌 [Tomlins et al., Cancer Res 66:3396 [2006]], [Tomlins et al., Science 310:644 [2005]], 상기 실시예 1 및 2).
B. 결과
본 실시예는 디지털 직장 검사 후 소변 내로 탈락된 전립선암 세포 내 TMPRSS2:ETS 융합 전사체의 존재에 의해 전립선암을 검출하는 비-침습적인 방법을 기재한다. 결과를 도 33에 도시하였다. 유효성 검증으로서, 높은 수준의 ERG 및 TMPRSS2:ERG (VCaP) 또는 높은 수준의 ETV1 (LNCaP)을 발현하는 전립선암 세포주로 스파이킹한 멸균 소변을 사용하였다. 도 33A에 도시한 바와 같이, 정량적 PCR (QPCR)에 의해 1,600개 세포에서 독점적으로 ERG 과다발현을 VCaP에서 검출할 수 있었고, 16,000개 세포에서 독점적으로 ETV1 과다발현을 LNCaP에서 검출할 수 있었다.
스파이킹된 VCaP 및 LNCaP 세포의 수를 GAPDH Ct (임계 주기) 값과 관련지음으로써, 일부 경우에 디지털 직장 검사 후의 환자로부터 얻은 소변이, ERG 또는 ETV1 과다발현을 신뢰성 있게 검출하기에 불충분한 수의 세포를 함유한 것을 관찰하였다. 이에 따라, 전립선암을 갖는 것으로 의심되는 환자의 소변으로부터 수집된 전체 RNA를, QPCR 분석 전에 옴니플렉스 전체 전사체 증폭을 이용하여 증폭시켰다. 상기 전략을 이용하여, 전립선암을 검출하기 위해 바늘 생검 전의 디지털 직장 검사 후 소변을 얻은 16명의 환자의 코호트를 평가하였다. 바늘 생검의 후속적인 평가는, 상기 코호트가 양성 전립선을 갖는 4명의 환자, 고등급의 전립선 상피내 신생물 (HGPIN)을 갖는 1명의 환자, 및 전립선암을 갖는 11명의 환자를 함유한다는 것을 입증하였다. 또한, 근치적 전립선절제술 전의 디지털 직장 검사 후 소변을 수집한 3명의 환자의 코호트를 평가하였다.
코호트 특징을 표 12에 나타내었다. 각각의 소변 시료는 고유의 환자로부터 유래되었고, ID를 할당받았다. 샘플의 공급원 (생검 전 또는 근치적 전립선절제술 (RP) 전)을 표시하였다. 바늘 생검 후의 진단 (양성, 고등급의 전립선 상피내 신생물 (HGPIN) 및 전립선암 (PCa) 포함)을 표시하였다. 바늘 생검 후에 전립선암을 갖는 것으로 진단된 환자에 대해 주요 글리슨, 소수 글리슨 및 글리슨 합계 점수를 표시하였다. 모든 환자에 대해, 가능한 경우, 생검 전 PSA (ng/ml) 및 연령을 기록하였다.
Figure pct00030
바늘 생검 코호트로부터, 5명의 환자가 ERG의 현저한 과다발현을 갖는 것으로 확인되었고, 이들 중 1명은 바늘 생검에 의해 HGPIN을 갖는 것으로 진단된 반면, 다른 4명은 전립선암을 갖는 것으로 진단되었다. 근치적 전립선절제술 코호트로부터, 전립선암을 갖는 3명의 환자 중 1명이 높은 ERG 발현을 갖는 것으로 확인되었다 (도 33B). 양쪽 코호트로부터의 어느 환자에서도 ETV1 과다발현은 검출되지 않았다. ERG를 과다발현한 샘플에서 TMPRSS2:ERG의 발현을 확인하기 위해, TMPRSS2:ERGa를 특이적으로 증폭시키도록 디자인된 택맨 프라이머/프로브 검정을 이용하였다. 상기 검정은 TMPRSS2:ERGa를 발현하는 VCaP 세포로부터의 생성물을 견고하게 증폭시켰다 (문헌 [Tomlins et al., Science 310:644 [2005]]). 또한, ERG를 과다발현한, 전립선암을 갖는 환자로부터의 6개의 소변 샘플 중 5개가 TMPRSS2:ERGa도 또한 발현한 반면 (Ct 값 29.8 내지 38.9), ERG 과다발현이 없는 환자로부터의 10개의 샘플 중 0개가 TMPRSS2:ERGa를 발현하였다. 1개의 샘플이 TMPRSS2:ERGa의 발현 없이 ERG를 과다발현하였으므로, 상기 샘플은 융합 전사체의 다른 이소형, 예컨대 TMPRSS2:ERGb 또는 보다 최근에 확인된 융합 전사체 (문헌 [Soller et al., Genes Chromosomes Cancer 45:717 [2006]], [Yoshimoto et al., Neoplasia 8:465:2006])를 발현할 확률이 높다. TMPRSS2:ERG 융합 전사체의 존재가 TMPRSS2:ERG 양성 암성 조직의 존재를 나타낸다는 것을 확인하기 위해, 대표적인 사례로부터의 매칭되는 조직 절편 상의 ERG 재배열을 검출하도록 디자인된 프로브를 사용하여 형광 계내 혼성화 (FISH)를 수행하였다. 소변 내의 검출가능한 TMPRSS2:ERG 전사체 및 암 진단을 갖는 3명의 환자 (소변 내의 검출가능한 TMPRSS2:ERG 전사체 및 고등급 PIN 진단을 갖는 1명의 환자, 및 검출가능한 TMPRSS2:ERG 전사체 및 암 진단을 갖는 2명의 환자)로부터, 매칭되는 조직을 얻었다. 도 33B에 도시한 바와 같이, 암을 갖지만 그의 소변에 검출가능한 TMPRSS2:ERG 전사체를 갖지 않는 것으로 진단된 환자는 둘 다, FISH에 의하면 암성 조직에 ERG 재배열을 보유하지 않았다. 암을 갖고, 그의 소변에 검출 가능한 TMPRSS2:ERG를 갖는 것으로 진단된 3명의 환자 모두는 또한 FISH에 의해서도 암성 조직에서의 ERG 재배열을 보여주었다. 마지막으로, 고등급 PIN 진단을 갖고 그의 소변에 검출가능한 TMPRSS2:ERG를 갖는 환자는 고등급 PIN 조직에서의 ERG 재배열을 보여주지 않았다. 이는 상기 환자가, 그의 소변 내의 검출가능한 TMPRSS2:ERG 전사체의 존재를 초래하는, 전립선 외 다른 곳의 진단되지 않은 암을 가지고 있을 수 있다는 것을 나타낸다.
실시예 8: 전립선암에서의 TMPRSS2 ETS 부류 유전자 융합체
본 연구는 임상적 국소 전립선암에 대해 외과적으로 처치된 111명의 미국인 남성으로 이루어진 스크리닝-기반 코호트에서 TMPRSS2ETS 부류 유전자 재배열의 빈도에 대한 종합적 분석을 기술한다.
A. 물질 및 방법
연구 집단, 임상 데이터 및 전립선 샘플 수집:
임상적 국소 전립선암의 공급원으로서, 주된 단일요법으로서 (즉, 보조 요법 또는 선행 (neoadjuvant) 호르몬 요법 또는 방사선 요법 없이) 미시간 대학교에서 근치적 전립선절제술을 받은 111명의 남성으로부터 암 및 양성 조직을 나타내는 코어를 함유한 조직 마이크로어레이 (TMA)를 구축하였다. 일련의 근치적 전립선절제술은 미시간 대학교의 전립선암 조직 코어 연구 우수성 특화 프로그램 (Specialized Program of Research Excellence; SPORE)의 일부이다. 각각의 대표적인 조직 블록으로부터 3가지 코어 (직경 0.6 mm)를 취하여, TMA를 구축하였다. TMA 구축 프로토콜은 문헌에 기재되어 있다(문헌 [Kononen et al., Nat. Med. 4:844 [1998]], [Rubin et al., Am J surg Pathol 26:312 [2002]]). 상세한 임상, 병리학적, 및 TMA 데이터는 이전에 설명된 바와 같이 보안 관계형 데이터베이스 상에 유지되어 있다 (문헌 [Manley et al., Am J. Pathol. 159:837 [2001]]).
간기 형광 계내 혼성화 검정을 이용한 TMPRSS2 - ETS 유전자 융합체에 대한 평가
간기 형광 계내 혼성화 (FISH)를 위해 4 ㎛ 두께의 조직 미세 어레이 절편을 사용하여, 이전에 설명된 바와 같이 처리 및 혼성화하였다(문헌 [Tomlins et al., Science 310:644 [2005]], [Tomlins et al., Cancer Res 66:3396 [2006]]). 슬라이드를 악시오플랜 이미징Z1 (Axioplan ImagingZ1) 현미경 (칼 자이스(Carl Zeiss))을 사용하여 검사하고, 메타퍼 (Metafer) 영상 분석 시스템 (메타 시스템즈 (Meta Systems, 독일 알트루스하임)) 중의 ISIS 소프트웨어 시스템을 이용하여 CCD 카메라로 영상화하였다. 병리학자를 통해 형태학상으로 무손상이고 오버랩하지 않는 핵에서의 FISH 신호를 수작업으로 점수화하고 (100x 유침), 한 사례로부터의 3개의 코어에서의 최소 30개 세포 또는 입수가능한 최대 수의 암 세포를 기록하였다. 30개의 평가가능한 세포가 부재하는 사례는 혼성화 불충분으로 보고되었다. 모든 BAC는 BACPAC 리소스 센터 (BACPAC Resource Center, 미국 캘리포니아주 오클랜드)로부터 입수하였으며, 프로브 위치는 정상 말초 림프구 중기 스프레드에 혼성화시켜 확인하였다. TMPRSS2, ERG 및 ETV4 재배열의 검출을 위해, 본 발명자들은 이하의 프로브를 사용하였다: RP11-35C4 (TMPRSS2에 대해 5') 및 RP11-120C17 (TMPRSS2에 대해 3'), RP11-95I21 (ERG에 대해 5') 및 RP11-476D17 (ERG에 대해 3'), 및 RP11-100E5 (ETV4에 대해 5') 및 RP11-436J4 (ETV4에 대해 3'). TMPSS2-ETV1 융합체의 검출을 위해서는, RP11-35C4 (TMPRSS2에 대해 5')를 RP11-124L22 (ETV1에 대해 3')와 함께 사용하였다. 퀴아필터 맥시 프렙 (QIAFilter Maxi Prep) 키트 (퀴아젠 (Qiagen), 미국 캘리포니아주 발렌시아)를 사용하여 BAC DNA를 단리하고, 디곡시게닌- 또는 비오틴-닉(nick) 번역 믹스 (로슈 어플라이드 사이언스 (Roche Applied Science), 미국 인디애나주 인디애나폴리스)를 사용하여 프로브를 합성하였다. 디곡시게닌 및 비오틴 표지된 프로브는 각각 플루오레세인 접합된 항-디곡시게닌 항체 (로슈 어플라이드 사이언스) 및 알렉사 (Alexa) 594 접합된 스트렙타비딘 (인비트로겐, 미국 캘리포니아주 칼스바드)을 이용하여 검출하였다.
염색체 수준에서의 재배열을 검출하기 위해 분리 (TMPRSS2, ERG, ETV4) 또는 융합 (TMPRSS2-ETV1) 프로브 전략을 이용하였다. DAPI 염색된 핵 내의 TMPRSS2, ERG 및 ETV4의 정상 신호 패턴은 동일 부위에 위치된 두 쌍의 녹색 및 적색 신호로 표시되었다. 이들 프로브에 대해, 동일 부위에 위치한 상기 두 신호 중 하나를 분리하여 재배열을 확인하였다. TMPRSS2-ETV1 융합체에 있어서, 두 쌍의 분리된 적색 및 녹색은 정상인 것으로 기록되었고, 분리된 신호 한 쌍 및 동일 부위에 위치한 신호 한 쌍은 재배열로 기록되었다.
B. 결과 및 논의
본 실시예는 임상적 국소 전립선암에 대해 외과적으로 처치된 미국 남성으로 이루어진 대규모 스크리닝-기반 코호트에서 TMPRSS2 및 ETS 전사 인자 유전자 재배열의 시그너쳐의 윤곽을 드러내는 종합적 분석을 기술한다. 도 34에 나타난 바와 같이, TMPRSS2 분할 프로브 FISH 검정 접근법을 이용하여 공지의 ETS 부류 파트너인 ERG, ETV1, ETV4 및 다른 알려지지 않은 파트너를 가진 전립선암에서 유전자 재배열의 전체적인 빈도를 검출하였다. 3개의 공지된 ETS 파트너 (ERG, ETV1 및 ETV4)에 대해 음성인 전립선암이 다른 ETS 부류 구성원이 연루된 재배열을 지닐 수 있다는 가설을 세웠다. 결과는 임상적 국소 전립선암에서 TMPRSS 및 ETS 부류 유전자 재배열의 분자 시그너쳐가 복잡함을 입증한다 (도 35A 및 B). 전체적인 TMPRSS2는 평가가능한 사례의 65%에서 재배열된 반면, ERG, ETV1 및 ETV4는 평가가능한 사례의 55%, 2% 및 2%에서 재배열되었다 (도 35A). TMPRSS2 재배열을 가진 사례의 40.5%에서, 3' 프로브의 소실이 관찰되었는데, 이는 유전자 융합체의 메카니즘으로서의 TMPRSS2 및 ERG 간의 염색체 결실과 일치한다. 이들 결과는 전립선암에서 TMPRSS2:ETS 융합체의 빈도가 높다는 것을 확증해 주며, TMPRSS2:ERG가 단연 가장 흔한 유형이라는 선행 연구를 확증해 준다 (문헌 [Tomlins et al., Science 310:644], [Perner et al., Cancer Res 66:3396 [2006]], [Yoshimoto et al., Neoplasia 8:4665 [2006]], [Soller et al., Genes Chromosomes Cancer 45:717 [2006]], [Wang et al., Cancer Res 66:8347 [2006] 및 상기 실시예).
코호트를 4개의 모든 프로브가 평가가능한 사례들만으로 제한하였을 때도 유사한 결과가 관찰되었다 (도 35A 및 B). 다수의 ETS 부류 구성원들의 재배열을 나타내는 사례가 없는 바, 이 분석은 TMPRSS2:ETS 재배열이 상호 배타적인 것을 확증해 준다. ERG, ETV1 또는 ETV4 재배열이 존재한 24개 사례 중 23개 사례가 TMPRSS2 검정에 의해 검출되었는 바, 이 검정은 또한 단일 TMPRSS2 검정이 효과적으로 거의 모든 ETS 재배열을 검출할 수 있다는 것을 증명한다. 5' ERG 프로브가 결실된 9개 사례 모두에서, 3' TMPRSS2 프로브의 결실이 확인되었다.
또한, TMPRSS2 프로브의 분리가 존재한 2개 사례가 확인되었는데, 이는 ERG, ETV1 또는 ETV4의 재배열이 부재한 재배열 (사례 32 및 36) 및 ERG 재배열이 부재하면서 TMPRSS2 재배열이 존재한 사례 (여기서는 ETV1 및/또는 ETV4가 평가될 수 없었음)를 나타낸다. 이들 사례는 전립선암에서 TMPRSS2가 신규한 ETS 부류 구성원 또는 관련성 없는 종양유전자와 파트너가 될 수 있다는 것을 시사한다. 이와 함께, 이들 결과는 전립선암에서 단일 TMPRSS2 검정이 진단 및 예후적 정보를 제공할 수 있다는 것을 시사한다.
실시예 9: PSA 유전자 융합체
FISH 실험을 이용하여, PSA에 대해 5' 및 3'으로 위치한 프로브에 대한 FISH에 의한 분할 신호를 보여주는 사례를 확인하였다. PSA 분할을 검출하기 위해 사용된 5' 및 3' BAC는 각각 RP11-510I16 및 RP11-26P14이다. PSA 유전자 융합체에 대한 파트너는 아직까지 확인되지 않고 있다. 이들 동일 프로브는 ETS 부류 구성원인 SPIB에서의 분할물에 결합하는데, 이 분할물이 PSA에 매우 가까이 위치해 있기 때문이다.
실시예 10: FLI1 과다발현
FLI1 유전자 융합체를 지니지 않은 상이한 세포 샘플에서 FLI1 발현을 분석하였다. FLI1이 고도로 발현된 사례로부터 FLI1의 5' 및 3' 엑손의 발현을 측정하였다. 이 결과는 도 18에 나타나 있다. 5' 및 3' 전사체의 풍부성에 있어서는 차이가 검출되지 않았다. RACE는 또한 융합 전사체를 나타내지 않았다. FLI1은 대조군 샘플과 비교하여 전립선암에서 과다발현되어 있었다. FLI1 증폭을 위한 프라이머와 더불어 TaqMan 프로브가 도 37에 나타나 있다.
FISH는 또한, 재배열을 나타내는, FLI1에 대한 분할 신호를 갖는 샘플을 확인하는 데도 사용되었는데, 그러나 이 사례들은 FISH에 의해 TMPRSS2:FLI1 융합체를 갖지 않는 것으로 나타난다. BAC 프로브는 표 13에 제시되어 있다. 이들 사례들에서는 또한 FLI1이 고도로 발현되어 있다.
실시예 11: 조직 마이크로어레이
유전자 융합체의 존재 여부를 분석하기 위해 조직 마이크로어레이를 사용하였다. 사용된 TMA는 전립선암 진행 어레이, 전립선암 발현 어레이, 가온된 부검 어레이, 전립선암 스크리닝 어레이, Erg 음성 전립선암 어레이, 및 개별 전립선암 사례를 포함하였다. 조직 마이크로어레이 상에서 이하의 유전자 프로브가 사용되었다: TMPRSS2-ETV1 융합 프로브, Erg 분할 프로브, TMPRSS2 분할 프로브, ETV1 분할 프로브, ETV4 분할 프로브, 및 FL1 분할 프로브.
또한, 발현 어레이 상에서는 Erg 분할 프로브를 사용하였다. 결과는 다음과 같다: 음성 사례: 30, 양성 사례: 29, 경계적 사례: 1. Erg 양성 사례와 더 높은 글리슨 (Gleason) 점수 (≥7) 간 약한 연관성이 존재하였다.
단백질 어레이 및 질량 분석기를 사용하여, ERG2에 대한 핵 상호작용자를 확인하였다. 결과는 도 21에 제시되어 있다.
실시예 12: Erg 발현에 대한 안드로겐의 조절
본 실시예는 Erg 발현에 대한 안드로겐의 조절을 기술한다. LNCap (TMPRSS2-ERG-) 및 VCaP (TMPRSS2-ERG+) 세포주를 사용하였다. 세포를 48시간 동안 다양한 양의 R1881에 접촉시켰다. Erg, PSA (+ 대조군) 및 베타-튜불린 (- 대조군)의 발현을 분석하였다. 결과는 도 19에 제시되어 있다. ERG 발현은 VCaP 세포에서는 안드로겐 의존적이나, LNCap 세포에서는 그렇지 않은 것으로 나타났다.
실시예 13: 펩티드 항체 및 아쿠아 프로브 생성
도 22-25는 펩티드 항체 생성에서의 사용 및 아쿠아 프로브의 제조를 위한 ERG1, ETV1, FLI-1, 및 ETV4의 서열 (밑줄)을 보여준다. 모든 ETS 부류 구성원에있어서 프라이머는 어플라이드 바이오시스템즈에서 설계되었다. 전립선암 사례에서 발현이 모니터링되었는데, 고 발현은 가능한 유전자 융합체에 대한 지표 및 FISH에 있어서의 지표이다.
실시예 14: LnCaP 세포에서의 ETV1
본 실시예는 VCaP 및 LNCaP에서의 안드로겐에 대한 전사 반응의 분석을 기술한다. 상기 두 세포주 모두에서 차별적으로 발현된 다수의 전사체, 예를 들어 PSA를 검출한 것 이외에도, VCaP 또는 LNCaP 세포에서 독특하게 이상조절된 많은 전사체가 또한 확인되었다. 상기 분석에 의해 ETV1가 LNCaP 세포에서 안드로겐에 대해 배타적으로 반응하는 것으로 확인되었다. LNCaP 세포에서 ETV1의 과다발현과 함께, FISH는 LNCaP 세포에서 ETV1 좌위를 조사하는데 사용되었다.
A. 물질 및 방법
세포주
본 연구에서는 전립선암 세포주 LNCaP (처음에 림프절 전립선암 전이로부터 유래함) 및 VCaP (문헌 [Korenchuk, S. et al., In vivo 15, 163-8 (2001)]) (처음에 척추 전립선암 전이로부터 유래함)가 사용되었다. 마이크로어레이 연구에 있어서, VCaP 및 LNCaP 세포를 챠콜-스트리핑된 (charcoal-stripped) 혈청 함유 배지 중에서 24시간 동안 성장시킨 후, 0.1% 에탄올 또는 에탄올 중에 용해된 합성 안드로겐 메틸트리에놀론 (R1881, 엔이엔 라이프 사이언스 프로덕츠 (NEN Life Science Products, 미국 매사추세츠주 보스톤)) 1 nM로 48시간 동안 처리하였다. 정량적 PCR (QPCR) 연구를 위해, 세포를 챠콜-스트리핑된 혈청 함유 배지에서 24시간 동안 성장시키고, 0.1% 에탄올, 아세톤 중에 용해된 카소덱스 (10 uM, 비칼루타미드, 아스트라제네카 파마슈티칼스 (AstraZeneca Pharmaceuticals, 미국 델라웨어주 윌밍턴) 또는 에탄올 중에 용해된 플루타미드 (10 uM, 시그마 (Sigma, 미국 미주리주 세인트루이스))와 함께 예비인큐베이션시켰다. 2시간 후에, 0.1% 에탄올 또는 0.5 nM의 R1881을 첨가하고, 세포를 48시간 후에 수거하였다. 트리졸 (Trizol) (인비트로겐, 미국 캘리포니아주 칼스바드)을 제조자의 지시에 따라 이용하여 모든 샘플로부터 총 RNA를 단리하였다. RNA 완전성은 변성 유발 포름알데히드 겔 전기영동 또는 애질런트 바이오애널라이저 (Bioanalyzer) 2100 (애질런트 테크놀로지스 (Agilent Technologies, 미국 캘리포니아주 팔로 알토))에 의해 입증되었다.
마이크로어레이 분석
본 연구를 위해 사용된 cDNA 마이크로어레이는 본질적으로 설명된 바와 같이 구축되었으나, 단 이 어레이는 32,448개의 특징을 함유한다. 어레이의 프린팅 및 후처리에 대한 프로토콜은 인터넷 상에서 입수가능하다. cDNA 마이크로어레이 분석은 본질적으로 설명된 바와 같이 실시하였다. 간략히, 대조군 및 R1881 처리된 VCaP 및 LNCaP 세포주로부터의 총 RNA를 역전사시키고, cy5 형광 염료로 표지하였다. 대조군 VCaP 또는 LNCaP 샘플로부터 취합한 총 RNA를 역전사시키고, 각각의 세포주로부터의 모든 혼성화에 대해 cy3 형광 염료로 표지하였다. 표지된 생성물을 이어서 혼합하고, cDNA 어레이에 혼성화하였다. 영상을 표시해 두고, 진픽스 (Genepix) 소프트웨어 패키지 (엑손 인스트루먼츠 인코포레이티드 (Axon Instruments Inc., 미국 캘리포니아주 유니온 시티))를 사용하여 표준화하였다. 어레이별로 데이터를 중위값-집중시키고, 적어도 80%의 샘플에서의 발현 값을 가진 유전자만을 분석에 사용하였다.
정량적 PCR ( QPCR )
문헌에 설명된 바와 같이, 어플라이드 바이오시스템즈 7300 실시간 PCR 시스템 (어플라이드 바이오시스템즈 (미국 캘리포니아주 포스터 시티)) 상에서 SYBR 그린 염료를 이용하여 QPCR을 실시하였다 (문헌 [Tomlins et al., Cancer Res 66, 3396-400 (2006)], [Tomlins et al., Science 310, 644-8 (2005)]). 각각의 샘플에 있어서 하우스키핑 유전자 글리세르알데히드-3-포스페이트 데히드로게나제 (GAPDH)에 대한 각각의 표적 유전자의 양을 보고하였다. 각각의 세포주 및/또는 실험에서 표적 유전자의 상대적인 양을 대조군에 대해 보정하였다. 모든 올리고뉴클레오티드 프라이머는 인테그레이티드 디엔에이 테크놀로지스 (Integrated DNA Technologies, 미국 아이오와주 코랄빌)에서 합성되었다. GAPDH (문헌 [Vandesompele et al., Genome Biol 3, RESEARCH0034 (2002)]), PSA (문헌 [Specht et al., Am J Pathol 158, 419-29 (2001)]), ERG (엑손 5-6_f 및 엑손 5-6_r) 및 ETV1 (엑손 6-7_f 및 엑손 6-7_r) 프라이머 (문헌 [Tomlins et al., Science 310, 644-8 (2005)])는 문헌에 설명된 바와 같았다.
형광 계내 혼성화 ( FISH )
표준 기술을 이용하여 정상 말초 림프구 (NPL) 및 LNCaP 세포로부터 중기 스프레드를 제조하였다. 슬라이드를 2x SSC로 2분 동안, 70% 에탄올로 2분 동안 및 100% 에탄올로 2분 동안 처리한 후, 프로브를 첨가하였다. 슬라이드에 커버슬립을 위치시키고, 75℃에서 2분 동안 인큐베이션한 후, 37℃에서 밤새 혼성화하였다. 42℃에서 5분 동안 2x SSC로 후-혼성화 세척을 실시한 후, PBST 중에서 3회 세척하였다. 플루오레세인에 접합된 항-디곡시게닌 (로슈 어플라이드 사이언스, 미국 인디애나주 인디애나폴리스) 및 알렉사 플루오르 (Alexa Fluor) 594에 접합된 스트렙타비딘 (인비트로겐, 미국 캘리포니아주 칼스바드)을 이용하여 형광 검출을 실시하였다. 슬라이드를 대비염색시키고, DAPI (인비트로겐)와 함께 프로롱 골드 안티페이드 시약 (ProLong Gold Antifade Reagent)에 담그었다. 슬라이드를 자이스 악시오 이미저 (Axio Imager) Z1 형광 현미경 (자이스 (Zeiss, 미국 뉴욕주 톤우드))을 사용하여 검사하고, ISIS 소프트웨어 (메타시스템즈 (Metasystems, 독일 알트루스하임)를 사용하여 CCD 카메라로 영상화하였다.
모든 BAC는 BACPAC 리소스 센터 (미국 캘리포니아주 오클랜드)로부터 수득하였으며, 정상 말초 림프구의 중기 스프레드에 대한 혼성화에 의해 프로브 위치를 확인하였다. 염색체 7p 상의 ETV1 영역에 대한 혼성화를 위해서, 이하의 4가지 BAC를 사용하였다 (끝분절에서부터 중심절 순): RP11-124L22, RP11-313C20, RP11-703A4 및 RP11-1149J13. 염색체 14q로의 국소화를 위해, FISH 맵핑된 BAC RP11-483K13를 사용하였는데, 이 역시 NPL을 이용할 경우 14q에 대해 혼성화하는 것으로 본 발명자들에 의해 확인되었다. 퀴아필터 맥시 프렙 키트 (퀴아젠, 미국 캘리포니아주 발렌시아)를 사용하여 BAC DNA를 단리하고, 디곡시게닌- 또는 비오틴-닉 번역 믹스 (로슈 어플라이드 사이언스)를 사용하여 프로브를 합성하였다.
B. 결과
결과는 도 26-28에 제시되어 있다. 도 26은 LNCaP 전립선암 세포주에서 ETV1의 과다발현 및 안드로겐 조절을 보여준다. 도 26A는 VCaP 및 LNCaP 전립선암 세포주에서 안드로겐-조절된 유전자의 발현 시그너쳐를 보여준다. 비히클 처리 (회색)와 비교하여 1 nM 합성 안드로겐 R1881 (녹색)에 의한 세포주 (3,499개 특징, p < 0.05 및 배수 변화비>=1.5)에서 유도 또는 억제를 나타낸 유전자의 히트맵 (Heatmap). 각각의 행은 유전자를 나타내며; 각각의 열은 샘플을 나타낸다. 황색 및 청색 세포는 색상 등급에 따라 각각 과다발현 또는 과소발현을 나타낸다. 회색 세포는 데이터 소실을 나타낸다. 각각의 세포주에서의 값을 상응하는 대조 샘플 상에 집중시켰다. 히트맵에서 PSA, ERG 및 ETV1의 위치가 표시되어 있으며, 이들의 발현은 삽입 사진에 나타나 있다. 도 26B는 정량적 PCR (QPCR)에 의한, VCaP 및 LNCaP 세포 모두에서 안드로겐에 의한 PSA 유도를 확인시켜 준다. LNCaP (적색) 및 VCaP (청색) 세포주에서 PSA의 상대적인 발현 (GAPDH에 대해 표준화됨)은 QPCR로 측정되었다. 세포를 표시된 바와 같이 항-안드로겐 카소덱스 또는 플루타미드의 존재 또는 부재 하에 비히클 또는 1 nM R1881로 48시간 동안 처리하였다. 각각의 세포주에 있어서 각각의 샘플 중의 PSA의 상대적인 양은 대조 샘플 중의 양에 대해 보정되었다. 도 26C는 LNCaP 세포에서 안드로겐에 의한 ETV1 유도를 보여준다. 동일한 샘플을 B로서 사용하여, ETV1의 상대적인 양을 QPCR로 측정하였다. 도 26D는 ETV1이 LNCaP 세포에서 현저하게 과다발현됨을 보여준다. 각각의 세포주로부터의 48시간 대조 샘플에서 PSA, ETV1 및 ERG의 상대적인 발현을 QPCR로 측정하였다. 각각의 샘플 중의 표적 유전자의 상대적인 양은 상기 두 세포주로부터의 PSA의 평균량에 대해 보정되었다. LNCaP 및 VCaP 간의 ERG 및 ETV1 발현의 배수 차이가 표시되어 있다.
도 27은 LNCaP 세포에서 ETV1의 재배열을 보여준다. 도 27A는 형광 계내 혼성화 (FISH)를 위한 프로브로서 사용되는 BAC의 개략도를 도시한 것이다. UCSC 게놈 브라우저 (Genome Browser)를 이용하여 인간 게놈의 2004년 5월 동결물 상에서 7p21 (ETV1 좌위 및 주위 BAC 포함) 및 14q32에서의 위치 및 좌표를 측정하였다. 본 연구에서 사용된 BAC는 숫자가 매겨진 직사각형으로 표시되어 있다. ETV1 및 DGKB의 위치가 전사의 방향을 나타내는 화살촉과 함께 나타나 있다. 도 27B는 RP11-124L22 및 RP11-1149J13이 정상 말초 림프구 (NPL)에서 염색체 7에 공동으로 위치한다는 것을 보여준다. NPL에서 중기 스프레드 (상부 패널) 또는 간기 세포 (하부 패널) 상의 RP11-124L22 (BAC #1) 및 RP11-1149J13 (BAC #4)의 위치는 FISH로 측정되었다. 모든 중기 사진에 있어서, 염색체 7 상의 신호는 화살표로 표시되어 있으며, 염색체 14 상의 신호는 상응하는 프로브 색상의 화살촉으로 표시되어 있다. 중기 스프레드의 정보 영역을 더 확대한 것은 네모에 나타나 있다. 도 27C는 중기 스프레드 (상부 패널) 및 간기 세포 (하부 패널)에 대한 BAC #1 및 BAC #4의 국소화가 근처의 4배수체 LNCaP 세포주에서 결정됨을 보여준다. 염색체 7 상에서 2개의 공동 위치된 신호, 염색체 7 상에서 2개의 적색 신호 및 상이한 염색체 상에서 2개의 녹색 신호가 관찰되었다. 도 27D는 RP11-124L22로부터의 신호가 LNCaP 세포에서 염색체 14에 국소화됨을 보여준다. C에서와 같지만, 단, RP11-124L22 (BAC #1)는 LNCaP 중기 스프레드 상에서 RP11-483K13 (BAC #5, 염색체 14q에 FISH 맵핑됨)와 공동으로 혼성화하였다. RP11-483K13으로부터의 4개의 적색 신호는 염색체 14q에 위치해 있고; 2개의 녹색 신호는 염색체 7p에 위치해 있고, 2개의 녹색 신호는 염색체 14q에 위치해 있다.
도 28은 전체 ETV1 좌위가 LNCaP 세포에서 염색체 14 내로 삽입됨을 보여준다. 도 28A는 본 실험에서 사용되는 BAC의 개략도를 도시한 것이다. 도 28B는 중기 스프레드 (상부 패널) 및 간기 세포 (하부 패널)에 대한 RP11-124L22 (BAC #1) 및 RP11-313C20 (BAC #2)의 국소화가 LNCaP 세포에서 FISH에 의해 결정됨을 보여준다. 중기 스프레드에서, 동시에 국소 존재하는 신호 두 쌍이 염색체 7 (황색 화살표) 및 염색체 14 (황색 화살촉) 상에서 관찰되었다.
이들 결과는 전체 ETV1 좌위가 염색체 7로부터 염색체 14로 전위된 것을 입증한다. 염색체 14 상의 삽입체의 게놈 서열 상류가 알려져 있지 않지만, 이 영역이 LNCaP 세포에서만 관찰되는 고수준의 ETV1 및 안드로겐 반응성을 유도하는 ARE를 함유하는 것일 가능성이 있다. 이들 결과는 LNCaP 세포가 인간 전립선암에서 관찰되는 ETS 유전자 융합체의 시험관내 모델로서 사용될 수 있다는 것을 시사한다.
실시예 15: 전립선암에서 ETS 부류 구성원의 녹다운
본 실시예는 전립선암에서의 ETS 부류 구성원의 녹다운을 설명한다. LnCaP 및 VCAP에서의 ETV1 및 ERG의 녹다운 발현을 위해 siRNA를 사용하였다. 정량적 PCR을 사용하여 녹다운을 확인하였다. 결과는 도 29 및 30에 제시되어 있다. 녹다운은 증식에 영향을 미치지 않았다. 안정한 녹다운을 위해 shRNA를 발현하는 렌티바이러스를 생성하였다.
애질런트 44K 전체 게놈 어레이 상에서 마이크로어레이를 실시하여, VCaP 세포 (TMPRSS2:ERG 융합체를 가진 것)에서 ERG 발현이 녹다운되었을 때 어떤 유전자가 차별적으로 발현되었는지를 측정하였다. 상기 실험을 위해, 이하의 3가지 조건을 사용하였다: ERG (ERGsi)용 다마콘 (Dharmacon) siRNA를 이용한 녹다운, 루시퍼라제의 녹다운 (대조군), 및 형질감염되지 않은 (untrans) VCaP 세포. ERG/untrans의 3회 혼성화 및 대조군/untrans의 2회 혼성화를 실시하였다. 이들 유전자는 모든 5회 실험에서 존재하는 것으로 불려졌으며, (두 조건의 평균에 대해) 0.5 미만의 표준 편차를 가졌으며, ERG 및 대조군 간 < 0.75 또는 > 1.5의 배수 차이를 나타내었다. ERGdif 필드는 ERG 및 대조군의 녹다운 실험 간의 배수 차이를 나타내며, 따라서, 1 미만의 값은 유전자가 ERG 녹다운에서 과소발현된 것을 의미한다 (ERG 자체는 이 분석에서 81위를 차지함).
실시예 16: 트랜스제닉 마우스
본 발명의 유전자 융합체와 더불어, ETS 및 안드로겐 반응성 유전자를 과다 발현하는 트랜스제닉 마우스를 생성하였다. 도 31은 마우스 생성에 사용되는 바이러스 과다발현 시스템을 제시하고 있다. 도 32는 트랜스제닉 마우스에서의 게놈 삽입의 개략도를 도시한 것이다. 이러한 마우스는 연구 (예를 들어, 기계론적 연구) 및 약물 스크리닝 응용에서 사용된다.
실시예 17: TMPRSS2 : ERGa 의 확인
상기 (실시예 1)에서 설명한 바와 같이, ERG에 대한 TMPRSS2의 융합체를 관찰하였다. TMPRSS2:ERGa 유전자 융합체로부터 발현된 단백질을 결정하기 위해, PCR을 이용하여 VCaP 전립선암 세포주로부터의 엑손 4의 시작 부위의 융합체 절단지점으로부터 엑손 11 내의 추정상의 정지 코돈까지의 ERG (NM_004449)의 일부를 증폭하였다(정지 코돈의 바로 상류에 3x 플래그 태그가 삽입되어 있음). 생성물을 pCR8/GW/TOPO TA (인비트로겐) 내로 TA 클로닝하고, 양 방향으로 서열분석하였다. 서열분석에 의해 2가지 상이한 이소 형태의 존재가 밝혀졌으며, 이들은 본원에서 ERG1 (ERG 이소형 1로부터의 엑손 6을 포함함 (NM_182918,
Figure pct00031
Figure pct00032
; 서열 73) 및 ERG2 (상기 엑손을 포함하지 않음)로 표기된다. 상기 생성물을 pLenti6/V5-DEST 목적 벡터 (destination vector) 내로 게이트웨이 (Gateway) 클로닝하였다. 이 플라스미드를 ERG 단백질 생성을 위한 핑크스 (PHINX) 세포 내로 직접 형질감염시켰다.
A. 방법
트랜스펙션 검정: 퓨진 (Fugene) 형질감염 시약 (로슈)을 제조자의 지시에 따라 사용하여 핑크스 세포를 ERG2 또는 빈 벡터 중 하나로 형질감염시켰다. 각각의 구출물에 대해 총 10개의 150 mm 직경 플레이트를 사용하였다. 형질감염 48시간 후에 세포를 수거하고, 이하에 설명된 바와 같이 면역침전 분석에 사용하였다.
단백질 용해 및 면역침전: 세포를 프로테아제 억제제를 함유한 얼음 냉각된 PBS 중에 세척하고, 1% NP40을 함유한 TBS에서 균질화하여 용해시켰다. 단백질을 함유한 상청액에 대해 브래드포즈 (Bradfords) 단백질 검정 (바이오래드 라보라토리즈 (Biorad Laboratories, 미국 캘리포니아주 허큘리즈))을 제조자의 지시에 따라 사용하여 이들의 단백질 함량을 추정하였다. 모든 샘플로부터의 등량의 단백질 (15 ml 완충액 중 약 30 mg)을 면역침전 연구에 사용하였다. 각각의 샘플에 이지뷰 레드 (EZVIEW Red) 항-플래그 M2 친화도 겔의 50% 슬러리 (시그마, 미국 미주리주 세인트루이스)의 약 200 마이크로리터를 첨가하고, 4℃에서 밤새 인큐베이션하였다. 면역침전물을 0.1% NP40을 함유한 TBS 및 TBS 단독으로 각각 3회씩 세척하였다. 플래그 펩티드 (시그마, 미국 미주리주 세인트루이스)를 제조자의 지시에 따라 사용하여 결합된 단백질을 용출시켰다. 용출은 3회로 수행되었다. 50% TCA (시그마, 미국 미주리주 세인트루이스)를 이용하여 용출물 중의 단백질을 침전시켰다. 침전물을 빙냉 아세톤으로 3회 세척하고, 램리 (Laemmeli) 완충액 내에 재현탁시키고, 4-20% BIS-TRIS 겔 (인비트로겐 코퍼레이션 (Invitrogen Corporation, 미국 캘리포니아주 칼스바드)) 상에서 전기영동시켰다. 겔을 질량 분석기에서 이용가능한 은 염색 (실버 퀘스트(Silver Quest), 인비트로겐 코퍼레이션 (미국 캘리포니아주 칼스바드))으로 염색하였다. ERG2에 상응하는 밴드 및 벡터 레인 중의 상응하는 영역을 각각 1 cm씩의 6개의 조각으로 절단해 냈다. 각각의 겔 조각을 겔 상의 더 높은 분자량 영역으로부터 출발하여 아래로 이동하면서 밴드 1 내지 6으로 표지하였다. 따라서, 밴드 1은 고 분자량 단백질을 함유한 영역에 상응하며, 밴드 6은 저 분자량의 영역에 상응한다. 그의 천연 분자 질량에 기초할 때, ERG2 (약 55 KDa)은 밴드 4 및 5 중으로 이동하였을 것이다. ERG2 서열 확인을 3회 반복하고, 모든 실험으로부터의 데이터를 통합하였다.
단백질 확인
겔 밴드를 수집하고, 은 염색 키트에 제공된 탈염색 용액을 제조자 (인비트로겐 코퍼레이션 (미국 캘리포니아주 칼스바드))의 지시에 따라 사용하여 탈염색하였다. 1M 암모늄 비카르보네이트 (pH 9) 중의 돼지 트립신 (1:50, 프로메가 코포레이션 (Promega Corporation, 미국 위스콘신주 매디슨)을 사용하여 겔 내 소화를 실시하였다. 이 소화는 37℃에서 16시간 동안 실시되었다. 24시간의 말미에, 3% 포름산을 이용하여 트립신 활성을 중지시켰다. 펩티드를 50% 아세토니트릴을 사용하여 추출하였다. 펩티드를 건조시키고, 0.1% 포름산을 포함하는 2% 아세토니트릴 내에 재현탁시키고, 패러다임 (Paradigm) HPLC 펌프 (마이크롬 바이오 리소시즈 인코포레이티드 (Michrome Bio Resources Inc.))에 부착된 0.075 mm x 150 mm C18 컬럼을 이용하여 역상 크로마토그래피로 분리하였다. 5 → 95% B (0.1% 포름산/95% 아세토니트릴)의 45-분 구배 (여기서 용매 A는 0.1% 포름산/2% 아세토니트릴이었음)를 이용하여 펩티드를 용출시켰다. 피니건 (Finnigan) LTQ 질량 분석기 (서모 일렉트론 코포레이션 (Thermo Electron Corp.))를 사용하여 스펙트럼을 획득하였는데, 이 기기는 동적 배제가 가능한 데이터-의존 모드로 작동하였다. 전체 MS 스캔에서 3개의 가장 풍부한 펩티드 이온에 대한 MS/MS 스펙트럼을 수득하였다. 복합적인, 동일하지 않은 NCBI 인간 참조 서열 데이터베이스에 대한 마스코트 (MASCOT) 검색 툴을 사용하여 상기 스펙트럼을 검색하였다. 이들 데이터베이스 검색 결과의 펩티드 지정 정확성에 대해서는 펩티드프로펫 (PeptideProphet) 프로그램을 이용하여 확증된다. 이는 혼합 모델이며; 검색 결과 점수 및 트립신 말단의 수를 비롯한 다양한 펩티드 특징에 기반하여 올바른 펩티드 동정의 확률을 부여하는 기대 최대화 평가이다. 제2의 프로그램인 프로틴프로펫(ProteinProphet)은 펩티드를 단백질 별로 무리짓고, 이들의 확률을 조합하여올바른 단백질 지정의 확률을 부여하는데 사용된다. 차별적인 능력은 이들의 NSP 값, 또는 시블링 (sibling) 펩티드의 수를 이용한 개별 펩티드 확률에 대한 후속적인 재-추정에 따라 증가하며, 이는 펩티드 분류 정보 및 가능한 멀티-히트 (multi-hit) 단백질의 상태에까지 이른다.
결과:
Figure pct00033
Figure pct00034
Figure pct00035
상기 표는 3가지 상이한 실험에 대해 수득된 ERG2에 대한 커버리지 맵을 보여준다. 밑줄친 아미노산 서열은 VCAP 세포로부터 클로닝된 ERG1의 실리코 번역된 서열에 상응한다. 아미노산 서열
Figure pct00036
(서열 196)은 ERG1에 특이적이며 ERG2에는 보이지 않는 엑손에 상응한다. 나머지 아미노산 서열은 3회 실험 각각에서 확인된 ERG2 서열에 상응한다. 모든 실험에서 ERG2는 밴드 1-5에서 확인되었다. 이들 밴드 각각에서 수득된 ERG2에 대한 펩티드 서열이 도시되어 있다. ERG2 단백질이 매우 많이 포함된 것이 3회의 실험에 걸쳐 관찰되었다. 이 커버리지 맵은 처음 50개 아미노산 잔기에 상응하는, 클로닝된 단백질의 N-말단 영역 내의 펩티드의 커버리지가 질량 분석법 커버리지 맵에서 거의 관찰되지 않는 것을 밝혀주었다. 그러나, 아미노산 발린으로 시작하는 펩티드
Figure pct00037
(서열 197)는 매우 풍부한 것으로 나타났으며, 그에 따라 모든 실험에서 확인되었다. 더 밀접한 평가는 제47번 위치의 아미노산이 인 프레임 (in frame) 메티오닌인 것을 시사하였다. 다수의 실험에서 제47번 메티오닌의 임의의 펩티드 상류 (N 말단)가 없는 것은 그것이 ERG2의 N-말단 아미노산이라는 것을 확인해 준다. 또한, 제50번 위치에서의 아르기닌 잔기의 존재는 이를 잠재적인 트립신 절단 부위가 되게 한다. 이 부위에서 트립신에 의한 소화가 일어난다면 더 짧은 N-말단 펩티드 MSPR (이는 너무 작아 이온 트랩 질량 분석기로 확인될 수 없음), 및 더 긴 C-말단 펩티드
Figure pct00038
(서열 198)가 생성될 것이며, 후자는 모든 실험에서 확인되었다. 또한, 펩티드 서열
Figure pct00039
(서열 199)가 단 하나의 실험에서 매우 낮은 확률 점수로 확인되었다. 이는 NCBI에서 보고된 바와 같은 ERG의 N-말단과 일치한다. 이 서열은 VCAP 세포로부터 클로닝된 이소적으로 과다발현된 구출물의 일부가 아니었다. 이는 핑크스 세포에서 발현된 것으로 따라서 양성 세포와 관련된 ERG의 일부를 나타내는 것일 수 있는 생체내 ERG로부터 수득된 것일 수 있다.
따라서, 요컨대, 상기 결과는 상기 제3의 메티오닌이 TMPRSS2-ERG 융합체 생성물에 대한 번역 시작 부위라는 것을 나타낸다.
Figure pct00040
Figure pct00041
(서열 200). 제1 메티오닌은 내인성 ERG에 대한 번역 시작 부위이다.
Figure pct00042
(서열 201). 도 20은 내인성 및 융합 폴리펩티드의 개략도를 도시한 것이다.
실시예 18: 소변 샘플에 대한 FISH 분석
소변으로부터의 전립선 세포를 단리 및 준비하기 위해, 주의깊은 수지 직장 검사 후 약 30 ml의 소변을 수집하였다. 즉시, 15 ml의 PreservCyt를 첨가하고, 샘플을 50 ml 튜브 내에서 실온에서 10분 동안 4000 rpm에서 원심분리하였다. 상청액을 폐기하고, 펠릿을 15 ml의 0.75 M KCl 내에 15분 동안 실온에서 재현탁시키고, 4000 rpm에서 50 ml 튜브 내에서 10분 동안 실온에서 원심분리하였다. 상청액을 폐기하고, 펠릿을 10 ml의 3:1 비의 메탄올:빙초산 내에 재현탁시켰다. 이어서, 이를 4000 rpm에서 8분 동안 원심분리하였다. 200 μl만을 남기고 상청액을 폐기하고, 펠릿을 재현탁시켰다. 이어서, 재현탁시킨 펠릿을 유리 슬라이드 상에 점적시키고, 공기 건조되도록 방치하였다. 혼성화 및 프로브 제조는 ERG 5'/3' 및 TMPRSS 5'/3' 프로브 쌍을 이용하여 상기 실시예 2에서와 같이 하였다.
실시예 19: 추가의 ETV1 유전자 융합체
A. 물질 및 방법
샘플 및 세포주
전립선 조직은 미시간 대학교에서의 일련의 근치적 전립선절제술 및 신속 부검 프로그램1 (Rapid Autopsy Program1)로부터 수득한 것이었으며, 이들은 모두 미시간 대학교 전립선암 조직 코어 연구 우수성 특화 프로그램 (S.P.O.R.E.)의 일부이다. 모든 샘플은 환자의 고지에 의한 동의 및 임상시험 심사 위원회의 사전 승인 하에 수집되었다.
ATCC로부터 양성 불멸화 전립선 세포주인 RWPE 및 전립선암 세포주인 LNCaP, Du145 NCI-H660 및 PC3을 입수하였다. 원발 양성 전립선 상피 세포 (PrEC)는 캠브렉스 바이오 사이언스 (Cambrex Bio Science, 미국 메릴랜드주 워커스빌)로부터 입수하였다. 전립선암 세포주인 C4-2B, LAPC4 및 MDA-PCa 2B는 에반 켈러 (Evan Keller, 미시간 대학교)로부터 제공받았다. 전립선암 세포주 22-RV1은 질 맥코스카 (Jill McKoska, 미시간 대학교)로부터 제공받았다. VCaP는 호르몬-불응성 전이성 전립선암을 가진 환자의 척추 전이물로부터 유래한 것이었다(문헌 [Korenchuk et al., In Vivo 15, 163-8 (2001)]).
안드로겐 자극 실험을 위해서, LNCaP 세포를 챠콜-스트리핑된 혈청 함유 배지에서 24시간 동안 성장시킨 후, 1% 에탄올 또는 에탄올 중에 용해시킨 메틸트리에놀론 1 nM (R1881, 엔이엔 라이프 사이언스 프로덕츠, 미국 매사추세츠주 보스톤)로 24시간 동안 처리하였다. 모든 샘플에 있어서, 총 RNA는 트리졸 (인비트로겐, 미국 캘리포니아주 칼스바드)을 제조자의 지시에 따라 이용하여 단리시켰다.
정량적 PCR ( QPCR )
문헌에 설명된 바와 같이 어플라이드 바이오시스템즈 7300 실시간 PCR 시스템 상에서 파워 에스와이비알 그린 마스터믹스 (Power SYBR Green Mastermix) (어플라이드 바이오시스템즈, 미국 캘리포니아주 포스터 시티)를 이용하여 정량적 PCR (QPCR)을 실시하였다 (문헌 [Tomlins et al., Cancer Res 66, 3396-400 (2006)], [Tomlins et al., Recurrent fusion of TMPRSS2 and ETS transcription factor genes in prostate cancer. Science 310, 644-8 (2005)]). 모든 올리고뉴클레오티드 프라이머는 인테그레이티드 디엔에이 테크놀로지스 (미국 아이오와주 코랄빌)에서 합성한 것이었으며, 이에 대해서는 표 15에 나열되어 있다. HMBS 및 GAPDH5, 및 PSA6 프라이머는 설명된 바와 같았다. 안드로겐 자극 반응은 4중으로 실시하였고, 여타의 모든 반응은 2중으로 실시하였다.
RNA 리가제 매개 cDNA 말단부 급속 증폭 ( RLM - RACE )
진레이서 (GeneRacer) RLM-RACE 키트 (인비트로겐)를 제조자의 지시에 따라 이용하여 문헌에 설명된 바와 같이 RLM-RACE를 실시하였다 (문헌 [Tomlins et al., 2005, 상기 참조], [Tomlins et al., 2006, 상기 참조]). ETV1의 5' 말단부를 수득하기 위해, 진레이서 5' 프라이머 및 ETV1_엑손4-5-r을 이용하여 플래티넘 택 하이 피델리티 (Platinum Taq High Fidelity) (인비트로겐)로 제1-가닥 cDNA를 증폭시켰다. 생성물을 문헌에 설명된 바와 같이 클로닝하고, 양 방향으로 서열분석하였다 (문헌 [Tomlins et al., 2005, 상기 참조], [Tomlins et al., 2006, 상기 참조]). RLM-RACE에 적용된 cDNA는 다른 분석에서는 사용되지 않았다.
형광 계내 혼성화 ( FISH )
포르말린 고정되고 파라핀 포매된 (FFPE) 조직 절편에 대해 간기 FISH를 문헌에 설명된 바와 같이 실시하였다 (문헌 [Tomlins et al., 2005, 상기 참조]). 분석당 최소 50개의 핵을 평가하였다. 표준 세포유전학 기술을 이용하여 LNCaP 및 MDA-PCa 2B의 중기 스프레드를 준비하였다. 슬라이드를 2x SSC 중에 2분 동안, 70% 에탄올 중에 2분 동안 및 100% 에탄올 중에 2분 동안 예비-처리하고, 공기 건조시켰다. 슬라이드 및 프로브를 75℃에서 2분 동안 함께 변성시키고, 37℃에서 밤새 혼성화하였다. 혼성화 후에는 42℃에서 0.5x SSC 중에 5분 동안 둔 후, PBST 중에서 3회 세척하였다. 플루오레세인에 접합된 항-디곡시게닌 (로슈 어플라이드 사이언스, 미국 인디애나주 인디애나폴리스) 및 알렉사 플루오르 594에 접합된 스트렙타비딘 (인비트로겐)을 이용하여 형광 검출을 실시하였다. 슬라이드를 대비염색시키고, DAPI가 함유된 프로롱 골드 안티페이드 시약 (인비트로겐)에 담그었다. 슬라이드를 자이스 악시오 이미저 Z1 형광 현미경 (자이스, 미국 뉴욕주 톤우드)을 사용하여 검사하고, ISIS 소프트웨어 (메타시스템즈, 독일 알트루스하임)를 이용하여 CCD 카메라로 영상화하였다. BAC (표 16에 나열됨)는 BACPAC 리소스 센터 (미국 캘리포니아주 오클랜드)로부터 입수하였으며, 프로브는 문헌에 설명된 바와 같이 제조하였다 (문헌 [Tomlins et al., 2005, 상기 참조]). 예비-표지된 염색체 7 중심절 및 7p 끝분절 프로브는 바이시스 (Vysis, 미국 일리노이주 데스 플레인스)로부터 입수하였다. 모든 프로브의 완전성 및 올바른 배치는 정상 말초 림프구의 중기 스프레드에 대한 혼성화에 의해 확인되었다.
조직 특이적 발현
14q13-q21에서의 5' 융합 파트너 및 유전자의 조직 특이적 발현을 측정하기 위해, 온코민 데이터베이스를 이용한, 29가지 상이한 유형의 630개 종양의 발현 프로파일로 이루어진 국제 유전체학 컨소시엄(International Genomics Consortium)의 expO 데이터세트를 이용하였다. 상업적 어레이 플랫폼으로는 모니터되지 않는 HERV-K_22q11.23의 발현을 조사하기 위해, 문헌에 설명된 바와 같이 (문헌 [Stauffer et al., Cancer Immun 4, 2 (2004)]), HERV-K_22q11.23을 명확히 식별해주는 MPSS 태그 "
Figure pct00043
" (서열 308)를 이용하여 링스 테라퓨틱스 (Lynx Therapeutics)의 정상 조직 대량 병렬 시그너쳐 서열분석 (MPSS) 데이터세트 (GSE1747)에서 조회하였다. expO 데이터세트로부터의 종양 유형 및 MPSS 데이터세트로부터의 정상 조직 유형에 대한 설명은 표 17에 제공되어 있다.
발현 프로파일링
애질런트 인간 전장 게놈 올리고 마이크로어레이 (미국 캘리포니아주 산타 클라라)를 이용하여 LNCaP, C4-2B, RWPE-ETV1 및 RWPE-GUS 세포에 대한 발현 프로파일링을 실시하였다. 트리졸을 이용하여 단리한 총 RNA를 퀴아젠 RNA이지 마이크로 (RNAeasy Micro) 키트 (미국 캘리포니아주 발렌시아)를 이용하여 정제하였다. 1 ㎍의 총 RNA를 cRNA로 전환시키고, 제조자 (애질런트)의 프로토콜에 따라 표지하였다. 65℃에서 16시간 동안 혼성화를 실시하고, 애질런트 DNA 마이크로어레이 스캐너로 어레이를 스캔하였다. 영상을 분석하고, 애질런트 피쳐 익스트랙션 (Feature Extraction) 소프트웨어 9.1.3.1을 이용하여 데이터를 추출하였으며, 이 때 각각의 어레이에 대해 선형 및 로웨스 (lowess) 표준화를 실시하였다. LNCaP 및 C4-2B 혼성화에 있어서, 각각의 세포주에 대한 기준은 취합된 양성 전립선 총 RNA (클론테크 (Clontech, 미국 캘리포니아주 마운틴 뷰)였다. 각각의 세포주에 대해 염료 플립 (dye flip)을 또한 실시하였다. 염료 플립에 대한 보정 후 2개의 LNCaP 어레이에서의 평균 발현 (로그비(Log Ratio))을 2개의 C4-2B 어레이에서의 평균 발현으로 나누어 특징을 등급화하였다. RWPE 세포에 대해서는, 4회의 혼성화를 실시하였다 (2번씩의 RWPE-ETV1/RWPE-GUS 및 RWPE-GUS/RWPE-ETV1 혼성화). 염료 플립에 대한 보정 후의 4회의 모든 혼성화 및 2배 평균 과다발현 또는 과소발현 (로그비)에서 유의한 차별적인 발현을 가진 특징만을 포함하도록 필터링하여 과다발현 및 하향발현된 시그너쳐를 생성하였다(PValueLogRatio < 0.01).
서던 혼성화
LNCaP, VCaP, 취합된 정상 인간 남성 DNA (프로메가 (Promega, 미국 위스콘신주 매디슨) 및 정상 태반 DNA (프로메가)로부터의 게놈 DNA (10 ㎍)를 EcoRI 또는 PstI (뉴 잉글랜드 바이올로지컬스 (New England Biologicals, 미국 매사추세츠주 입스위치)로 밤새 소화시켰다. 단편을 0.8% 아가로스 겔 상에서 40 V에서 밤새 분할시키고, 하이본드 (Hybond) NX 나일론 멤브레인으로 이동시키고, 예비혼성화한 후, 프로브와 혼성화시키고, 표준 프로토콜에 따라 세척하였다. 취합된 정상 인간 남성 게놈 DNA (표 15)에 대해 플래티넘 택 하이 피델리티를 이용한 PCR 증폭으로, FISH에 의해 연루된 것으로 시사된 염색체 7의 영역에 위치한 일련의 22개 프로브 (RP11-313C20 및 RP11-703A4 사이)를 생성하였다. 각각의 프로브 25 ng를 dCTP-P32로 표지하고, 혼성화에 사용하였다.
PCR
LNCaP 세포에서 ETV1 중단점을 확인하기 위해서, 서던 블로팅에 의해 확인되는 재배열을 기초로 한 역 PCR 전략을 사용하였다. 야생형 서열로부터 역 상보적이고 프라이머 Bl, B2, B3으로 분화되는 프라이머 Al, A2, A3을 PstI이 소화되고 재결찰된 (분자내 결찰을 촉진하기 위해서) LNCaP 게놈 DNA 주형 상에서 역 PCR을 위해서 사용하였다. 네스트 (nested) PCR을 다음 순서의 프라이머 조합으로 실시하였다: Al-Bl, A2-B2 및 A3-B3. 제조자의 제안에 따라 융합 생성물을 증폭하기 위해서 익스팬드 (Expand) 20 kbplus PCR 시스템 (로슈 디아그노스틱스 게엠베하 (Roche Diagnostics GmbH), 독일 만하임 소재)을 사용하였다. 네스트 PCR에서 관찰된 농축된 3Kb 밴드를 pCR8/GW/TOPO (인비트로겐)로 클로닝하고, 미니프렙 (miniprep) DNA를 삽입물에 대해 스크리닝하고, 양성 클론을 시퀀싱하였다 (유니버서티 오브 미시건 DNA 시퀀싱 코어 (University of Michigan DNA Sequencing Core), 미국 미시간주 앤 아버 소재). 이후, 융합 특이적 프라이머를 사용하는 플래티넘 태크 하이 피델러티 (Platinum Taq High Fidelity)를 사용하여 PCR에 의해 융합을 확인하였다 (표 15).
ETV1 시험관내 과다발현
TMPRSS2:ETV1의 보고된 ETV1의 정지 코돈으로의 융합에 존재하는 ETV1의 cDNA (269-1521, NM_004956.3)는 MET264로부터 RT-PCR에 의해 증폭되고 관문 진입 벡터 pCR8/GW/TOPO (인비트로겐)로 TOPO 클로닝되어, pCR8-ETV1을 산출하였다. 아데노바이러스 및 렌티바이러스 구출물을 발생시키기 위해서, pCR8-ETV1 및 대조군 진입 클론 (pENTR-GUS)을 LR Clonase II (인비트로겐)를 사용하여 각각 pAD/CMV/V5 (인비트로겐) 및 pLenti6/CMV/V5 (인비트로겐)로 재조합하였다. 대조군 pAD/CMV/LACZ 클론을 인비트로겐으로부터 얻었다. 유니버서티 오브 미시건 벡터 코어에 의해 아데노바이러스 및 렌티바이러스를 발생시켰다. ETV1 또는 GUS를 발현시키는 렌티바이러스로 양성 불멸화 전립선 세포주 RWPE를 감염시키고, 안정한 클론을 블라스티시딘 (인비트로겐)으로 선택적으로 발생시켰다. 1차 PrEC 세포에서 안정한 세포주를 발생시킬 수 없었기 때문에 양성 PrEC를 ETV1 또는 LACZ를 발현시키는 아데노바이러스로 감염시켰다. 지시된 시점에서 3중으로 세포의 트립신화 (trypsinizing) 및 쿨터 (Coulter) 계수기에 의한 분석에 의해 세포 계수를 평가하였다. 침윤 분석을 위해서, 동일한 수의 PREC-ETV1 및 -LACZ (감염 48시간 후) 또는 안정한 RPWE-ETV1 및 -GUS 세포를 24 웰 배양 플레이트의 삽입물에 존재하는 기저막 매트릭스 (EC 매트릭스, 케미콘 (Chemicon), 미국 캘리포니아주 테메큘라 소재) 상에 시딩하고, 우태 혈청을 화학유인물질로서 하부 챔버에 첨가하였다. 48시간 후, 비-침윤성 세포 및 EC 매트릭스를 면봉으로 제거하였다. 침윤된 세포를 크리스탈 바이올렛으로 착색시키고, 사진을 찍었다. 삽입물을 10% 아세트산으로 처리하고, 560nm에서 흡광도를 측정하였다.
ETV1 녹다운
LNCaP 세포에서 ETV1의 siRNA 녹다운을 위해서, ETV1에 대한 다르마콘 (Dharmacon) SMARTpool (MU-003801-01, 미국 일리노이주 시카고 소재)을 구성하는 개별 siRNA를 qPCR에 의해 ETV1 녹다운에 대해 시험하고, 가장 효과적인 단일 siRNA (D-003801-05)를 추가 실험을 위해 사용하였다. siCONTROL 비-표적화 siRNA #1 (D-001210-01) 또는 ETV1에 대한 siRNA를 올리고펙타민 (Oligofectamine) (인비트로겐)을 사용하여 LNCaP 세포로 형질감염시켰다. 24시간 후에, 제2의 동일한 형질감염을 수행하고, 하기 기술된 것과 같이 RNA 단리 및 침윤 분석을 위해서 세포를 24시간 후에 수거하였다. LNCaP 세포에서 ETV1의 shRNA 녹다운을 위해서, pMS2 레트로바이러스 벡터로부터의 ETV1에 대한 shRNAmir 구출물 (V2HS_61929, 오픈 바이오시스템즈 (Open Biosystems), 미국 알라바마주 헌츠빌 소재)을 제조자의 프로토콜에 따라 빈 pGIPZ 렌티바이러스 벡터 (RHS4349, 오픈 바이오시스템즈)로 클로닝하였다. shRNAmir가 있는 ETV1에 대한 pGIPZ 렌티바이러스 또는 비-침묵화 대조군 (RHS4346)을 유니버서티 오브 미시건 벡터 코어에 의해 발생시켰다. LNCaP 세포를 렌티바이러스로 감염시키고, 하기 기술된 것과 같이 48시간 후 침윤 분석을 위해서 세포를 사용하였다. 6개의 독립적인 실험으로부터의 대표적인 결과를 제시하였다.
침윤 분석
화학유인물질로서 하부 챔버에 우태 혈청을 첨가하면서, 동일한 수의 지시된 세포를 24 웰 배양 플레이트의 삽입물에 존재하는 기저막 매트릭스 (EC 매트릭스, 케미콘, 미국 캘리포니아주 테메큘라 소재) 상에 시딩하였다. 48시간 후, 비-침윤성 세포 및 EC 매트릭스를 면봉으로 제거하였다. 침윤된 세포를 크리스탈 바이올렛으로 착색시키고, 사진을 찍었다. 삽입물을 10% 아세트산으로 처리하고, 560nm에서 흡광도를 측정하였다.
FACS 세포 주기 분석
세포 주기 특성 결정을 위해서 FACS로 RWPE-ETV1 및 RWPE-GUS 세포를 평가하였다. 2×PBS로 세포를 세척하고, 약 2×106개 세포를 PBS 내에 재현탁시킨 후, 70% 에탄올 내에 고정시켰다. 펠릿화시킨 세포를 세척하고, RNase (최종 농도 100 ㎍/ml) 및 프로피듐 요오다이드 (최종 농도 10 ㎍/ml)로 37℃에서 30분간 처리하였다. 착색된 세포를 FACSDivia를 구동하는 LSR II 유동 세포측정기 (비디 바이오사이언시즈 (BD Biosciences), 미국 캘리포니아주 산 호세 소재) 상에서 분석하고, ModFit LT (베러티 소프트웨어 하우스 (Verity Software House), 미국 메인주 톱샴 소재)를 사용하여 세포 주기 단계를 계산하였다.
연질 아가 분석
보통의 매질에서 낮은 융점의 아가로스의 0.6% (wt/vol) 바닥 층을 6 웰 배양 플레이트에 준비하였다. 상부에, 1×104개 RWPE-GUS, RWPE-ETV1 또는 DU145 (양성 대조군) 세포를 함유하는 0.3% 아가로스의 층을 위치시켰다. 12일 후에, 병소를 크리스탈 바이올렛으로 착색시키고, 계수하였다.
면역블롯 분석
50 mM 트리스-HCl (pH 7.4), 1% NP40 (시그마, 미국 미주리주 세인트루이스 소재) 및 완전한 프로테이나제 억제제 혼합물 (로슈)을 함유하는 NP40 용해 완충제 중에서 세포를 균질화시켰다. 15 ㎍의 단백질 추출물을 SDS 샘플 완충제와 혼합하고, 환원 조건 하에 10% SDS-폴리아크릴아미드 겔 상으로 전기영동하였다. 분리된 단백질을 니트로셀룰로스 막 (아머샴 파마시아 바이오테크 (Amersham Pharmacia Biotech), 미국 뉴저지주 피츠카타웨이 소재) 상으로 이동시켰다. 차단 완충제 [0.1% 트윈 (Tween) (TBS-T)을 갖는 트리스-완충 염수 및 5% 탈지 분유] 중에 1 시간 동안 막을 인큐베이션하였다. 지시된 희석도로 차단 완충제에서 밤새 4℃에서 1차 항체를 적용하였다. TBS-T 완충제로 3회 세척한 후, 양고추냉이 퍼옥시다제-연결된 당나귀 항-마우스 IgG 항체 (아머샴 파마시아 바이오테크)로 1시간 동안 실온에서 1:5,000 희석도로 막을 인큐베이션하였다. 증진된 화학발광 검출 시스템 (아머샴 파마시아 바이오테크) 및 자기방사법 (autoradiography)으로 신호를 시각화하였다.
로딩 대조군에 대해 마우스 모노클로날 항-MMP-3 (IM36L, 칼바이오켐 (Calbiochem), 미국 샌디에고 소재)을 1:500 희석도로 적용하고, 마우스 모노클로날 항-uPA (IM13L, 칼바이오켐)를 1:500 희석도로 적용하고, 마우스 항-GAPDH 항체 (아브캠 (Abcam), 미국 매사추세츠주 캠브리지 소재)를 1:30,000 희석도로 적용하였다.
트랜스제닉 ETV1 마우스
ETV1의 생체내 과다발현에 대해, 정지 코돈 전에 삼중 FLAG 태그를 코딩하는 역 프라이머가 있는 주형으로 pCR8-ETV1을 사용하여 PCR에 의해 C 말단 3xFLAG-에피토프 태그가 부착된 구출물을 발생시켰다. 생성물을 pCR8로 TOPO 클로닝하였다. 전립선 특이적 ETV1 트랜스제닉 구출물을 발생시키기 위해서, 3xFLAG-ETV1을 변형된 소형 복합 프로바신 프로모터 (ARR2PB)의 pBSII (스트라타젠 (Stratagene), 미국 캘리포니아주 라 욜라 소재) 하류 및 소 성장 호르몬 polyA 부위 (PA-BGH)의 상류로 삽입하였다. ARR2PB 서열은 원래의 프로바신 서열 PB (-426/+28)에 추가하여 2종의 추가의 안드로겐 반응 요소를 포함하였다. 구출물을 시퀀싱하여 FVB 마우스 란(egg)으로의 미세주사 전에 일시적인 형질감염시 LNCaP 세포에서의 안드로겐에 의한 프로모터 유도성에 대해 시험하였다. 유니버서티 오브 미시건 트랜스제닉 애니멀 모델 코어 (University of Michigan Transgenic Animal Model Core)에 의해 ARR2PB-ETV1 플라스미드가 PvuI/KpnI//SacII로 선형화되고, FVB 마우스 수정란으로 미세주사되고, 가-임신 암컷에 외과적으로 이식되었다. 꼬리 단편으로부터 단리된 게놈 DNA를 사용하여 PCR에 의해 트랜스제닉 시조를 스크리닝하였다. 트랜스제닉 ARR2PB-ETV1 시조를 FVB 마우스와 교배하고, 트랜스진-양성 수컷 마우스 자손을 다양한 시점에 계획 도살하였다. 니콘 (Nikon) 박리 스코프를 사용하여 트랜스제닉 마우스로부터 전립선을 박리하고, 10% 완충 포르말린 내에 고정시키고, 파라핀 내에 포매시켰다. 5 ㎛ 절편을 헤마톡실린 및 에오신으로 착색시키고, 인간 암의 마우스 모델 컨소시엄 전립선 병리 위원회의 바 하버 미팅의 합의 보고서에 제공된 기준에 따라 3명의 병리학자가 평가하였다 (문헌 [Nam et al., Cancer Biol Ther 6 (2007)]).
ETV1-FLAG, 기저 세포 마커 p63 및 시토케라틴 5 (CK5) 및 평활근 액틴의 면역조직화학적 검출을 위해서, 파라핀이 제거된 슬라이드를 마이크로웨이브-시트레이트 항원 회복시키고, 토끼 항-FLAG 폴리클로날 항체 (1:50 희석도, 밤새 인큐베이션, 셀 시그널링 테크놀로지 (Cell Signaling Technology), #2368), 마우스 모노클로날 항-p63 항체 (1:100 희석도, 45' 인큐베이션, 랩비젼 (LabVision), MS 108 1P1), 마우스 모노클로날 항-평활근 액틴 항체 (1:50 희석도, 30' 인큐베이션, DakoAb M0851) 및 토끼 폴리클로날 항-CK5 항체 (1:500 희석도, 30' 인큐베이션, 아브캠, ab24647)와 각각 인큐베이션하였다. M.O.M 면역검출 키트 (PK2200, 벡터 래보래토리스 (Vector Laboratories))를 사용하는 표준 비오틴-아비딘 복합체 기술을 사용하여 p63 및 SMA를 시각화하였다. 인비젼 (Envision)+시스템-HRP (DAB) 키트 (K4011, 다코시토메이션 (DakoCytomation))를 사용하여 FLAG 및 CK5를 검출하였다.
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
B. 결과
전립선암에서 신규한 5' ETS 융합 파트너의 확인
qPCR에 의해, ETV1의 이상점-발현이 있는 케이스를 식별하기 위해서 ERG 및 ETV1 발현에 대해 전립선 조직 샘플의 2개의 코호트를 스크리닝하였다. 도 38a에 제시된 것과 같이, 2개의 코호트에 걸쳐, 54개의 국소 전립선암 샘플의 26 및 3이 각각 ERG (48%) 및 ETV1 (5.5%) 이상점-발현을 나타냈다. 추가로, 2가지 호르몬-불응성 전이성 전립선암 샘플, MET26 및 MET23이 ETV1 이상점-발현을 나타냈다. qPCR에 의해, ERG 이상점-발현이 있는 26개의 국소 샘플 중 25개 (96%)가 TMPRSS2:ERG 융합 전사체를 발현시켰다. MET26 외에, 4개의 ETV1 이상점 (PCa_ETV1_1-3 및 MET23)을 포함하는 어떠한 샘플도 TMPRSS2:ETV1 융합 전사체를 발현시키지 않았다.
상기 케이스에서 ETV1 전사체 구조를 특징화하기 위해서, 5' RNA 리가제 매개 cDNA 말단부 급속 증폭 (RLM-RACE)을 실시하였다. MET26에서와 같이 TMPRSS2로부터의 5' 엑손보다, 4개의 모든 샘플이 독특한 5' 서열을 포함하였다 (도 38b). PCa_ETV1_1에서, ETV1의 엑손 1-4를 5' 긴 말단 반복 (LTR) 및 인간 내인성 레트로바이러스 부류 K의 gag 서열과 상동인 22q11.23 (이하에서 HERV-K_22q11.23으로 언급됨)로부터의 2개의 엑손으로 대체하였다. PCa_ETV1_2에서, ETV1의 엑손 1을 HNRPA2B1 (7p15)로부터의 엑손 1로 대체하였고, PCa_ETV1_3에서, ETV1의 엑손 1-4를 추가의 상류 서열 및 SLC45A3 (1q32)의 엑손 1로 대체하였다. MET23에서, ETV1을 엑손 1-5을 C15ORF21로부터의 엑손 1 및 2 (15q21)로 대체하였다 (도 1b). 상기 융합 전사체의 예외적인 발현을 qPCR에 의해 확인하고, 이러한 케이스에서 게놈 수준에서의 융합을 FISH에 의해 확인하였다 (도 38c, 39 & 40). PCa_ETV1_2에서, FISH는, 머리에서 꼬리 방향으로 7p 상에 약 13 MB 떨어진 HNRP2A2B1 및 ETV1 사이의 염색체내 결실과 일치하는, 프로브 5'의 HNRPA2B1 및 프로브 3'의 ETV1로의 상응하는 융합이 있는 프로브 3'의 HNRPA2B1 및 프로브 5'의 ETV1로의 결실을 증명하였다 (도 38c & 40). 유전자 융합체의 서열을 도 51에 제시하였다.
5' 융합 파트너의 뚜렷한 기능적 클래스
HERV-K_22q11.23:ETV1, SLC45A3:ETV1 및 C15ORF21:ETV1 융합체는 5' 파트너로부터 예측된 번역 서열을 함유하지 않고, HNRPA2B1:ETV1 융합체 중의 HNRPA2B1 서열은 단지 2개의 잔기만이 융합 단백질에 기여할 것이다. 따라서, 5' 파트너의 프로모터 요소가 상기 경우에서 이상 ETV1 발현을 유도함에 따라, 상기 유전자의 조직 특이성 및 안드로겐 조절이 특성화된다. SLC45A3, C15ORF21 및 HNRPA2B1의 조직 특이성을 조사하기 위해, 29종의 다른 유형의 630개 종양으로부터의 발현 프로파일로 이루어진 국제 유전체학 컨소시엄(the International Genomics Consortium)의 expO 데이터세트를 온코민 데이터베이스를 사용하여 검색하였다 (문헌 [Rhodes et al., Neoplasia 9, 166-80 (2007)]). TMPRSS2와 유사하게, SLC45A3은 모든 다른 종양 유형 (중위값 = 0.33, P = 2.4E-7)과 비교하여 전립선암에서 현저한 과다발현을 나타냈다 (중위값 = 2.45, 어레이 당 표준편차 > 중위값). C15ORF21은 전립선암에서 유사한 과다발현을 나타냈다 (중위값 = 2.06 vs. -0.12, P = 3.4E-6). 대조적으로, HNRPA2B1은 전립선 및 다른 종양 유형에서 높은 발현을 나타냈다 (중위값 = 2.36 vs. 2.41, P > 0.05) (도 38d). HERV-K_22q11.23은 expO 데이터세트에서 사용되는 DNA 마이크로어레이에 의해 모니터링되지 않지만, 이는 문헌 [Stauffer et al., Cancer Immun 4, 2 (2004)]에 기재된 바와 같이 고도 병렬 시그너쳐 서열분석 (massively parallel signature sequencing: MPSS)에 의해 명확하게 측정된다. 따라서, HERV-K_22q11.23의 발현은 32개의 정상적인 조직 유형으로부터의 프로파일을 함유하는 링크스 테라퓨틱스(Lynx Therapeutics) MPSS 데이터세트에서 검색하였으며 (문헌 [Jongeneel et al., Genome Res 15, 1007-14 (2005)]), 이는 HERV-K_22q11.23이 31개의 다른 정상적인 조직과 비교하여 (중위값 = 백만개 당 9개 전사체) 정상 전립선 조직에서 최고 수준으로 발현되었음을 보여준다 (백만개 당 94개 전사체) (도 38d).
qPCR에 의해, LNCaP 전립선암 세포주에서 SLC45A3 (21.6배, P = 6.5E-4) 및 HERV-K_22q11.23 (7.8배, P = 2.4E-4)의 내인성 발현은 TMPRSS2와 유사하게 (14.8배, P = 9.95E-7) 합성 안드로겐 R1881에 의해 급격하게 증가된다. 반대로, C15ORF21의 발현은 R1881 자극에 의해 유의하게 감소된다 (1.9배, P = 0.0012). 마지막으로, HNRPA2B1의 발현은 안드로겐 자극에 의해 유의하게 변화되지 않는다 (1.17배, P = 0.29) (도 38e).
ETV1 은 양성 전립선 세포에서 침윤을 유도함
5' 파트너가 ETV1 전사체에 대한 코딩 서열에 기여하지 않기 때문에, 임상 샘플 및 전립선암 세포주에서 상이한 부류의 ETV1 재배열의 공통 결과는 말단절단된 ETV1의 이상 과다발현이다. 따라서, 상기 사건을 시험관내 및 생체내에서 재현하여 전립선암에서 비정상 ETS 부류 구성원 발현의 역할을 측정하였다. 아데노바이러스 및 렌티바이러스 구출물은 인덱스 TMPRSS2:ETV1 융합체 양성 케이스, MET26 (ETV1의 보고된 정지 코돈을 통해 엑손 4에서 시작함)에서 발현되는 바와 같이 ETV1을 과다발현하도록 설계되었다 (도 41a). 양성 불멸화 전립선 상피 세포주 RWPE를 ETV1을 발현하는 렌티바이러스로 감염시키고, 안정한 RWPE-ETV1 세포, 및 ETV1을 발현하는 아데노바이러스로의 감염에 의해 1차 양성 전립선 상피 세포주 PrEC에서 일시적으로 과다발현된 ETV1을 선별하였다. RWPE 및 PrEC 세포 둘 다에서, ETV1의 과다발현은 증식에 대해 검출가능한 효과가 없었으며 (도 44a-b), 세포 주기 분석은 S 기에서 RWPE-ETV1 및 RWPE-GUS 세포의 백분율 차이가 없음을 보여준다 (도 44c). 추가로, 소프트 아가 형질전환 분석은 ETV1 과다발현이 RWPE 세포를 형질전환시키기에 충분하지 않음을 보여준다 (도 44d).
ETV1 과다발현은 RWPE (3.4배, P = 0.0005) 및 PrEC (6.3배, P = 0.0006) 둘 다에서 침윤을 현저하게 증가시킨다 (도 41b-c). 추가로, 상이한 서열에 대해 디자인된 siRNA 또는 shRNA를 사용한 LNCaP의 ETV1 녹다운은 침윤을 유의하게 억제하였으며 (도 41d-e & 도 45), 이는 종래 연구와 일치한다 (문헌 [Cai et al., Mol Endocrinol (2007)]). 상기 결과는 ETV1 과다발현이 중요한 종양발생 표현형인 침윤을 유도함을 입증한다. 안정한 ETV1 과다발현에 의해 조절되는 전사 프로그램을 연구하기 위해서, RWPE-ETV1 세포를 프로파일링하고, 발현 시그너쳐를 몰레큘라 콘셉츠 맵(Molecular Concepts Map: MCM)으로 일컬어지는 생물학상 관련 컨셉의 개론에 대해 분석하였다. MCM은 불균형 오버랩에 의해 20,000개 초과의 생물학상 관련 유전자 세트 사이의 연관성을 조사하기 위한 공급원이다 (문헌 [Tomlins et al., Nat Genet 39, 41-51 (2007)]). 도 41f에 제시한 바와 같이, MCM 분석은 본 발명의 ETV1 과다발현된 시그너쳐가 풍부한 세포 침윤과 관련한 분자 컨셉의 네트워크를 확인하였으며, 이는 상기 기재된 표현형 결과와 일치한다. qPCR 및 면역블로팅에 의해, 매트릭스 메탈로프로테이나제 및 우로키나제 플라스미노겐 활성화제 경로의 구성원을 비롯한, 종래 침윤과 관련이 있는 다수의 유전자의 과다발현을 RWPE-ETV1 세포에서 확인하였다 (문헌 [Laufs et al., Cell Cycle 5, 1760-71 (2006)], [Fingleton, Front Biosci 11, 479-91 (2006)]) (도 41g & 47). 이들 결과는 ETV1이 매트릭스 메탈로프로테이나제를 통해 LNCaP 세포에서 침윤을 매개한다는 것을 입증하는 최근 연구와 일치한다 (카이(Cai) 등의 상기문헌).
마우스 전립선에서의 ETV1 발현은 mPIN 을 유도함
다음으로, 안드로겐 조절하에 전립선에서 오로지 강한 트랜스진 발현을 유발하는 변형된 프로바신 프로모터의 제어하에, FLAG-태그가 부착된 말단절단된 버전의 ETV1 (ARR2Pb-ETV1) (도 41a)을 발현하는 트랜스제닉 마우스를 사용하여 생체내 ETV1 과다발현의 효과를 연구하였다 (문헌 [Ellwood-Yen et al., Cancer Cell 4, 223-38 (2003)]). 상기 트랜스진은 인간 전립선암에서 동정된 ETV1의 안드로겐-유도 유전자 융합체 (즉, TMPRSS2:ETV1, SLC45A3:ETV1 및 HERV-K_22q11.23:ETV1)와 기능적으로 유사하다. 다중 ARR2Pb-ETV1 시조를 획득하였고, 표현형 분석을 위해 전개시켰다. 12-14주령까지, ARR2Pb-ETV1 트랜스제닉 마우스의 6/8 (75%)에서 마우스 전립선 상피내 신생물 (mPIN)이 발병되었다 (표 18 및 도 42). mPIN의 정의와 일치하게, 본 발명자들은 층형성, 과염색증 및 거대핵소체를 비롯한 핵 비정형성을 나타내는, ARR2Pb-ETV1 마우스의 정상 전립선 내 함유된 병소의 증식성 병변을 관찰하였다 (도 42a-f). mPIN은 ARR2Pb-ETV1 마우스의 모든 3개의 전립선 엽 (전방, 복부 및 배측방)에서 관찰되며, 가장 일반적으로는 복부 엽에서 관찰된다 (7/11, 63.6%) (표 18). 면역조직화학에 의해, 강한 ETV1-FLAG 발현은 ARR2Pb-ETV1 마우스에서 오로지 mPIN 병소에서만 관찰되며 양성 선에서는 관찰되지 않고 (도 48), qPCR에 의해 트랜스진 발현이 전립선에 국한되는 것을 확인하였다.
모든 병변은 인접 평활근 액틴 염색에 의해 입증된 바와 같이, 무손상 섬유근육층의 존재로 인해 계내에 위치하는 것으로 확인되었다 (도 42g-h). 그러나, 기저 세포 마커 시토케라틴 5 및 p63으로의 면역조직화학은 양성 선과 비교하여 ARR2Pb-ETV1 mPIN의 경우에 주변 기저 상피층의 소실을 나타내었으며 (도 42i-l), 이는 기저 세포층의 파괴를 의미한다. 이러한 결과는 ETV1이 마우스 전립선에서 신생물성 표현형을 유도하고, 인간 전립선암에서 ETS 유전자 융합체에 대해 종양발생 역할의 토대를 제공함을 입증한다.
Figure pct00050
실시예 20: ETV5 유전자 융합체
이 실시예는 TMPRSS2:ETV5 및 SLC45A3:ETV5 유전자 융합체의 확인을 기재한다. SYBR 그린 QPCR에 의한 ETV5 이상점 발현의 검출에 대해, 다음 프라이머쌍을 사용하였다:
ETV5_엑손13-f:
Figure pct00051
(서열 416)
ETV5_엑손13-r:
Figure pct00052
(서열 417)
PCa_ETV5_1로부터 TMPRSS2:ETV5 융합체의 확인에 대해, RLM-RACE에 대한 다음 프라이머를 사용하였다:
ETV5_엑손6-r:
Figure pct00053
(서열 418)
PCa_ETV5_2로부터 SLC45A3:ETV5 융합체의 확인에 대해, 다음 프라이머를 사용하였다:
ETV5_엑손11-r:
Figure pct00054
(서열 419)
도 52는 상기 언급된 융합체의 서열을 보여준다. TMPRSS2:ETV5의 경우, 3개 스플라이스 변이체가 확인되었다. 상기 모든 변이체에 대한 서열이 제시되었다. 도 53은 QPCR에 의한 ETV5 이상점 발현의 도시로서 2 가지 전립선암 (PCa) 사례의 확인을 보여준다 (a). 패널 b는 상기 두 경우에 대한 융합 전사물의 구조를 보여준다 (RACE에 의해 측정됨).
실시예 21: 추가의 ERG , ETV1 ETV4 유전자 융합체
ETS 전사 인자 ERG, ETV1, ETV4 또는 ETV5와 관련한 반복적인 유전자 융합체는 전립선암의 40-70%에서 확인되었다. 광범위한 형광 계내 혼성화 (FISH) 분할 프로브 전략을 이용하여 110명의 임상적 국소 전립선암 환자의 코호트에서 27종의 ETS 부류 구성원 및 그의 5개의 공지된 5' 융합 파트너의 정보를 모두 얻었다. 이러한 광범위한 FISH 스크리닝에 기초하여, 4 가지의 주목할만한 관측 결과를 얻었다. 첫째, 전립선암의 상당 분율 (44%)은 ETS 유전자 융합체로 인한 것이 아닐 수 있다. 둘째, SLC45A3은 ERG의 5' 융합 파트너인데, 이전에는, TMPRSS2만이 ERG의 5' 파트너인 것으로 기재되었다. 셋째, 2개의 전립선-특이적 안드로겐-유도 유전자인 FLJ35294 및 CANT1은 각각 ETV1 및 ETV4에 대한 5' 파트너이다. 넷째, 편재식으로 발현되는 안드로겐-감수성 유전자인 DDX5는 ETV4와 프레임에 맞게 융합되어 DDX5:ETV4 융합 단백질의 발현을 야기한다.
A. 물질 및 방법
연구 집단, 임상 데이터 , 및 조직 마이크로어레이 ( TMA ) 구축
미시간 대학 병원에서 2004년부터 2006년까지 1차 치료법으로서 근치적 전립선절제술을 받은 110명의 임상적 국소 전립선암 환자를 대표하도록 TMA를 구축하였다. 각각의 대표적인 종양 병소로부터 코어 (직경 0.6 mm)를 취하고, 병리학자가 그 형태학을 확인하였다. 상세한 임상적, 병리학적 및 TMA 데이터를 이전에 설명된 바와 같이 (그 전문이 본원에 참고로 포함되는 문헌 [Mehra et al. Mod Pathol. 2007;20(5):538-44]) 확립된 관계 데이터베이스로 유지하였다. 환자의 실태적 인구 통계를 표 19에 나타냈다. 상기 근치적 전립선절제술 조영술은 리서치 엑셀런스 티슈 코어(Research Excellence Tissue Core)의 미시간 대학 전립선암 특수화 프로그램의 부분이다.
Figure pct00055
형광 계내 혼성화 ( FISH ) 및 FISH -기재 스크리닝 전략
이전에 확증된 FISH-기재 분할 프로브 전략을 이용하여 전립선암에서 공지된 신규한 유전자 이상을 조사하였다 (그 전문이 본원에 참고로 포함되는 문헌 [Tomlins et al. Nature 2007;448(7153):595-9], [Tomlins et al. Cancer Res 2006;66(7):3396-400], [Tomlins et al. Science 2005;310(5748):644-8]). 박테리아 인공 염색체 (BAC) (표 20에 나열됨)를 BACPAC 리소스 센터(Resource Center) (캘리포니아주 오클란드 소재)로부터 획득하였고, 프로브를 제조하였다.
Figure pct00056
모든 프로브의 완전성 및 올바른 국소화를 정상 말초 림프구의 중기 전개로의 혼성화에 의해 입증하였다. 슬라이드를 영상화Zl 현미경 (카를 차이스(Carl Zeiss, 독일 오베르코헨))을 사용하여 검사하였다. FISH 신호를 병리학자에 의해 형태학적으로 무손상이고 비중복되는 핵에서 수동적으로 채점하고 (100x 유침), 각각의 부위로부터 최소 50개의 암세포를 기록하였다. 신호가 매우 약하거나 없는 암 부위는 불충분하게 혼성화된 것으로 기록하였다. 모든 3개의 코어에서 종양 조직이 없는 사례는 제외하였다.
FISH-기재의 고처리량 스크리닝 전략의 흐름도를 도시하였다 (도 54). 중지점이 특성화된 ERG, ETV1, ETV4 및 ETV5 재배열의 검출을 위해, 분할 프로브용 BAC를 사용하였다 (그 전문이 본원에 참고로 포함되는 문헌 [Helgeson et al. Cancer Res 2008 68(1):73-80]). 전립선암에서 미지의 재배열 상태를 갖는 나머지 ETS 부류 유전자의 경우, 전립선암 TMA에 대한 초기 스크리닝을 위해 약 1 Mb의 관심 영역을 플랭킹하는 분할 프로브를 이용하였다 (도 54A, B). 후속적으로, 관심 유전자 (약 200 Kb)를 정확히 플랭킹하는 ETS 유전자-특이적 프로브를 사용하여 초기 스크리닝시 확인한 전립선암 사례로부터의 조직 절편 상의 ETS 이상을 확인하였다 (도 54C).
상기 TMA를 본 연구를 분할 프로브 FISH 전략에 의해 개시한 시점에 공지된 모든 5' 파트너의 재배열에 대해 추가로 평가하였다. ETS 유전자 및 공지의 5' 파트너 둘 다에 대해 재배열된 경우, 사전에 확증된 융합 프로브 전략을 이용하여 잠재적인 유전자 융합체를 확인하였다 (도 54D). ETS 유전자만이 재배열된 경우, 동결된 조직을 수득하여 RNA 리가제 매개 cDNA 말단부 급속 증폭 (RLM-RACE)에 의해 5' 융합 파트너를 확인하였다 (도 54D).
세포주 연구
LNCaP, 안드로겐 감응성 전립선암 세포주를 10% FBS를 함유하는 RPMI 중에 유지하였다. 안드로겐 자극 실험을 위해, 5%의 목탄-처리된 FCS로 보충한 후, 1% 에탄올 또는 10 nM R1881으로 0, 3, 12, 24, 및 48시간의 시점 동안 처리한 페놀 레드-유리 RPMI 중에 세포를 2일 동안 배치하였다. 세포를 16시간 동안 안드로겐으로 처리하고 염색질 면역침전 (칩) 분석을 위해 가교하였다. 전체 RNA를 제조자의 지시에 따라 트리졸(Trizol) (인비트로겐, 캐나다 칼스배드)로 단리하였다.
정량적 실시간 역전사효소 PCR (Q- PCR )
Q-PCR을 표준 프로토콜에 따라 수행하였다. 모든 올리고뉴클레오티드 프라이머를 인터그레이티드 DNA 테크놀로지스(Integrated DNA Technologies, 미국 아이오와주 코랄빌)에 의해 합성하였고 표 21에 나열하였다.
Figure pct00057
샘플을 하우스키핑 유전자 GAPDH의 mRNA 수준에 의해 표준화하였다. 안드로겐 자극 반응을 3중으로 수행하고, 모든 다른 반응은 2중으로 수행하였다.
RNA 리가제 매개 cDNA 말단부 급속 증폭 ( RLM - RACE )
전립선암 내의 이상 ETS 유전자의 미지의 5' 파트너를 확인하기 위해 RLM-RACE를 수행하였다. 제1-가닥 cDNA를 백금 Taq 고 적합도 효소 (인비트로겐)를 사용하고, 이어서 제조자의 지시에 따라 터치다운 PCR 프로토콜을 사용하여 유전자 특이적 역방향 프라이머 ETV1_엑손4-5r, ETV4_엑손7r 및 5' 유전자 레이서 프라이머 (인비트로겐)로 증폭시켰다. PCR 증폭 생성물을 pCR4-TOPO TA 벡터 (인비트로겐)로 클로닝하고 기재된 바와 같이 벡터 프라이머를 사용하여 2방향으로 서열분석하였다.
염색질 면역침전 (칩) 분석
칩 실험은 이전에 설명된 바와 같이 (그 전문이 본원에 참고로 포함되는 문헌 [Yu et al., Cancer Cell 2007;12(5):419-31]) 호르몬-결핍된 세포의 R1881 또는 에탄올 처리 16시간 후 5 ㎍의 항-안드로겐 수용체 (AR) 항체 (업스테이트 (Upstate, 미국 뉴욕주 레이크 플래시드))를 사용하여 수행하였다. 투입 온전한-세포 추출 DNA 및 칩-풍부화된 DNA를 라이게이션-매개 PCR에 의해 증폭시키고, 표적 프로모터의 qPCR 평가를 수행하였다. 칩 풍부화는 투입 DNA의 백분율로서 평가되었다.
조직-특이적 발현
5' 융합 파트너의 조직-특이적 발현을 결정하기 위해, 온코민 데이터베이스를 사용하여 29개 독특한 유형의 630개 종양의 발현 프로파일로 이루어진 국제 게놈 컨소시엄의 엑스포 데이터 세트를 얻었다.
DDX5 - ETV4 클로닝 및 발현
전장 DDX5-ETV4 융합체 cDNA를 코자크 서열-FLAG 태그-출발 코돈-DDX5 N-말단 뉴클레오티드 서열 (
Figure pct00058
; 서열 438)을 함유하는 5' 프라이머 및 정지 코돈 (
Figure pct00059
; 서열 439)에 이르기까지 ETV4의 C-말단 뉴클레오티드에 상응하는 3' 프라이머를 갖는 사례 번호 85로부터의 5'RLM-RACE 생성물을 사용하여 게이트웨이 클로닝 시스템의 엔트리 벡터 pENTR-D-TOPO (인비트로겐)로 클로닝하였다. 발현 구출물을 LR 클로나제 II (인비트로겐)를 사용하여 pENTR-D-Topo-DDX5-ETV4와 pCDNA3.2-DEST 벡터 (인비트로겐)의 재조합에 의해 생성하였다. 인간 배아 신장 (HEK) 293 세포를 FuGENE6 형질감염 시약 (로체(Roche))을 사용하여 pCDN32-FLAG-DDX5-ETV4 발현 구출물로 일시적으로 형질감염시켰다. 형질감염된 세포로부터의 용해물을 SDS-PAGE에 의해 재용해시키고, 폴리비닐리덴 디플루오라이드 막 (지이 헬쓰케어) 상에 전달하였다. 상기 막을 차단 버터 [트리스-완충 염수, 0.1% 트윈(Tween) (TBS-T), 5% 무지방 무수 밀크] 중에서 1시간 동안 인큐베이션하고, FLAG 태그에 대한 토끼 폴리클로날 항체로 1:1000 희석물에서 4℃에서 밤새 인큐베이션하였다 (셀 시그널링 테크놀로지(Cell Signaling Technology)). TBS-T로 세척한 후, 블롯을 양고추냉이 퍼옥시다제-접합된 2차 항체로 인큐베이션하였고 신호는 제조자 (지이 헬쓰케어)에 의해 기재된 바와 같이 증진된 화학발광 시스템에 의해 시각화되었다. 블롯을 동등한 적재량의 확인을 위해 GAPDH (앱캠(Abcam))으로 다시 프로브하였다. 전립선 조직 용해물을 면역블로팅을 위해 ETV4 폴리클로날 항체 (앱노바(Abnova))로 유사하게 가공하였다.
B. 결과
포괄적인 프로파일을 110 사례의 임상적 국소 전립선암으로 이루어진 TMA에 대한 FISH 분할 프로브 혼성화를 사용하여 전립선암의 모든 27개의 ETS 부류 유전자 및 모든 5개의 공지의 5' 융합 파트너의 재배열 상태를 생성하였다 (도 54).
27개 ETS 전사 인자 및 5개 5' 융합 파트너에 대한 유전자 재배열의 매트릭스 표현을 생성하였다 (도 55a-b). ERG는 전립선암 내에 가장 일반적으로 재배열된 ETS 유전자이고 TMPRSS2는 가장 일반적으로 재배열된 5' 융합 파트너였다. 상기 TMA에 대해 나타내어진 코호트에서, 사례들 중 43% (43/99)에서 ERG가 재배열되었고, 그 중 63% (27/43)는 그의 5' 말단부의 결실을 통해 TMPRSS2에 융합되었으며, 이는 이전 기록과 유사하다 (그 전문이 본원에 참고로 포함되는 문헌 [Perner et al. Cancer Res 2006;66(17):8337-41]). 전반적으로, ERG 양성 사례 중 98% (42/43)는 TMPRSS2를 5' 융합 파트너로 가졌다. ERG 양성 사례 중 하나는 TMPRSS2에 대하여 음성이었다. 본 발명의 FISH 스크리닝의 추가 검사시 (도 55), 상기 사례는 5' 파트너 SLC45A3의 재배열을 가졌다 (사례 번호 102). SLC45A3:ERG의 게놈 융합체를 프로브 5'에서 SLC45A3 및 3'에서 ERG로 융합 분석을 사용하여 확인하였고 (도 56), 이에 따라 ERG의 신규한 5' 융합 파트너로 SLC45A3이 연루되었다. 상기 발견에 앞서, 이들의 염색체 21 상의 공동 국소화로 인해 아마 ERG가 TMPRSS2와 단독으로 파트너링되는 것으로 생각되었다. SLC45A3은 ETV1 및 ETV5의 5' 융합 파트너인 것으로 사전에 확인되었다 (그 전문이 본원에 참고로 포함되는 문헌 [Helgeson Cancer Res 2008;68(1):73-80]).
ERG와 반대로, ETV1은 환자 중 약 5% (5/99)에서 재배열되었다 (사례 번호 4, 51, 54, 72, 91, 도 55a-b). ETV1은 TMPRSS2, SLC45A3, HERVK_22 q11.23, C15ORF21 및 HNRPA2B1을 비롯한 많은 유전자에 융합되는 것으로 나타났다. 본 연구에서 나타낸 110개 사례에서, 사례 번호 4 및 72는 각각 SLC45A 3 및 HNRPA2B1의 재배열에 더하여 ETV1 내의 재배열을 가졌다. 융합 프로브 FISH 분석을 이용하여 이들 두 사례 각각에서 SLC45A3:ETV1 (프로브 5'에서 SLC45A3 및 3'에서 ETV1) 및 HNRPA2B1:ETV1 (프로브 5'에서 HNRPA2B1 및 3'에서 ETV1) 융합체를 확인하였다. 사례 번호 72는 문헌에 보고된 HNRPA2B1:ETV1의 제2 사례였으며, 이는 HNRPA2B1:ETV1 융합체가 전립선암에서 반복적임을 시사한다. SLC45A3:ETV1 융합체를 갖는 사례 번호 4는 일찍이 보고된 사례와 동일한 것임이 확인되었다 (문헌 [Tomlins et al. Nature 2007;448(7153):595-9.]). ETV1 양성 사례 번호 51, 54, 91에서, FISH에 의해 공지의 5' 파트너 내의 재배열이 없음이 확인되었다. 사례 번호 54에서는, 본 발명자들은 RLM-RACE를 사용하여 ETV1의 엑손 1 내지 4가 전립선 EST 유전자 FLJ35294 (17pl3.1)의 5' 서열의 263개의 염기쌍에 의해 대체된다는 것을 확인하였다 (도 57a).
ETV4 재배열은 본 발명의 코호트에서 환자 중 5% (5/100)에서 나타났다 (사례 번호 40, 46, 53, 64, 85, 도 55a-b). 사례 번호 64 및 85는 전좌 (분할)에 걸쳐 재배열되었지만, 사례 40 및 46에서는 ETV4에 대한 프로브 5'의 결실이 확인되었다. 반대로, 사례 번호 53은 ETV4에 대한 프로브 3'의 결실을 드러냈다 (이들의 유의성은 불명확함). 유의하게는, 사례 번호 40 및 64도 또한 TMPRSS2 분할 프로브로 스크리닝한 경우 TMPRSS2에 대한 이상을 나타내었다. 이들 두 사례는 융합 프로브 분석 (프로브 5'에서 TMPRSS2 및 3'에서 ETV4를 이용함)을 사용하여 TMPRSS2:ETV4 융합체를 가짐을 확인하였다. 사례 번호 40에서는, 분할 신호 대신에, 프로브 5' 및 3'을 사용하여 ETV4에 대한 5' 말단부 결실을 검출하였으며, 이는 상기 사례에서 TMPRSS2:ETV4 융합체가 불균형 전좌에 결쳐 발생함을 시사한다. RLM-RACE는 ETV4의 엑손 1이 TMPRSS2의 엑손 1-2로 대체됨을 추가로 드러냈다. 따라서, 상기 사례는 TMPRSS2의 신규한 상류 엑손이 융합에 관여하는 이미 보고된 TMPRSS2:ETV4 융합체 (문헌 [Tomlins et al. Cancer Res 2006;66(7):3396-400.])와 상이하다. ETV4는 사례 번호 46 및 85에서 재배열되었고, 반면에 공지의 5' 파트너 내의 유전자 이상은 FISH에 의해 관측되지 않았다. RLM-RACE는 이들 두 사례에서 ETV4 전사체를 특징규명하였다. 사례 번호 46에서, ETV4의 엑손 5는 이전에 보고된 융합 서열 (그 전문이 본원에 참고로 포함되는 문헌 [Hermans et al. Cancer Res 2008;68(9):3094-8])과 동일한, 17q25.3 상에 위치한 CANT1 유전자의 엑손 1a에 융합되었다 (도 57a). 사례 번호 85에서, 또 다른 신규한 5' 파트너 유전자, DEAD (Asp-Glu-Ala-Asp) 박스 폴리펩티드 5 (DDX5)는 RLM-RACE에 의해 확인되었다 (도 57a). DDX5-ETV4의 서열 분석은 융합 전사체가 DDX5의 엑손 1-3으로 이루어지고, ETV4의 엑손 5-13으로 프레임에 맞게 융함됨을 나타냈다 (도 57a). FLJ35294:ETV1, CANT1:ETV4 및 DDX5:ETV4의 게놈 융합체는 융합 프로브 FISH 분석에 의해 확인하였다 (도 58).
ETV5 재배열 사례는 본 발명의 코호트에서 확인되지 않았다. 나머지 23개의 ETS 전사 인자 중, FISH 스크리닝 전략을 사용하여 적은 비율의 전립선암 사례가 ETS 유전자에 대한 5' 또는 3' 결실 이상을 드러내었다 (도 55a-b). 단일 결실 사례를 ETV3, ELFl 및 SPIC의 5' 말단부 및 ETV3, ELF2 및 ELK3의 3' 말단부에서 발견하였다. 약 1Mb 분할 프로브 접근법을 이용한 FISH 스크리닝은 사례 번호 12에서는 ELK3 유전자좌 및 사례 번호 21에서는 ELF4 유전자좌에 대한 분할 신호를 얻었지만, 영역을 좁힘에 의한 추가의 FISH 분석은 ELF4 유전자의 220 Kb 하류 및 ELK3 유전자의 140 Kb 상류의 중지점 위치를 확인하였다. 유의하게도, ELK4 재배열을 검출하기 위해 사용된 BAC는 두 유전자의 근접성 (약 20 Kb)으로 인해 SLC45A3 이상을 검출하기 위해 이용된 것과 동일하였다. 분할 신호는 4개의 사례 (번호 4, 39, 67 및 102)에서 관측되었다. 이들 중, 사례 번호 4 및 번호 102는 각각 SLC45A3:ETV1 및 SLC45A3:ERG 융합체를 갖는 것으로 확인되었다. 이들 사례 중 어느 것도 ELK4와 SLC45A3 사이의 융합체를 갖지 않았다. 따라서, 이들 단일선 결실 중 다수는 비-특이적, 비-반복적인 병변인 듯하다.
또한, 110명의 환자의 TMA를 전립선암 내의 ETS 이상의 모든 공지의 5' 파트너에 대해 스크리닝하였고 TMPRSS2가 사례 중 47% (48/102)에서 재배열되었음을 발견하였다. SLC45A3은 사례들 중 2% (2/89)에서 재배열되었고, 이어서 HNRPA2B1은 1% (1/99)에서, 그리고 C15ORF21은 1% (1/88)에서 재배열되었다. HERV-K_22q11.23 재배열은 상기 코호트에서 확인되지 않았다. FISH 분석은 ETS 유전자 이상 없이 5' 파트너 재배열된 몇몇의 사례를 밝혀냈으며, 이는 이들이 비-ETS 유전자 융합체 파트너를 가질 수 있음을 나타낸다 (도 55a-b).
본 연구에서 확인된 ETV1 및 ETV4의 5' 융합 파트너를 특징규명하였다. Q-PCR에 의해, ETV1 또는 ETV4 과다발현을, 각각 FLJ35294:ETV1, CANT1:ETV4 및 DDX5:ETV4 융합체를 갖는 사례 번호 54, 46, 및 85에서 확인하였다 (도 59a). 이상 ETS 발현이 FLJ35294, CANT1 및 DDX5의 제어 요소에 의해 구동되는 것이 가능함에 따라, 전립선암 내의 이들의 조직 특이성 및 안드로겐 조절을 검사하였다. TMPRSS2와 유사하게, SLC45A3, FLJ35294 및 CANT1은 온코민에서 입수한 국제 게놈 컨소시엄 엑스포데이터 세트를 사용하여 다른 암 유형과 비교하여 전립선암에서 현저한 과다발현을 나타내었다 (도 57b, P=2.8 x 10-7(FLJ35294); P=6.8 x 10-7(CANT1)). 대조적으로, DDX5는 모든 종양 유형에서 높은 발현을 나타내었으며 (도 57b), 이는 전립선 특이성보다는 하우스-키핑 기능을 가질 수 있음을 나타낸다.
Q-PCR에 의해, 내인성 FLJ35294 (48시간에서 11.6배, P=0.0006) 및 CANT1 (24시간에서 3.8배, P=O.0014)의 발현은 LNCaP 전립선암 세포주에서 합성 안드로겐 Rl 881로의 처리에 의해 유의하게 유도되었다 (도 59b). 칩 분석은 FLJ35294 (9배 풍부화, P= 0.005) 및 CANT1 (40배 풍부화, P=0.0014) 유전자 내의 프로모터 영역의 안드로겐 수용체 (AR) 점유를 입증하였다 (도 59c). 대조적으로, DDX5의 발현은 R1881 자극에 영향을 받지 않았고 (도 59b) AR은 DDX5의 프로모터 영역에 동원되지 않았다 (도 59c). 따라서, FLJ35294-ETV1 및 CANT1-ETV4 융합체는 전립선-특이적 안드로겐-유도 5' 파트너 유전자로부터의 융합체를 포함하는 재배열을 포함하는 전립선암 내의 클래스 II 유전자 융합체로 분류할 수 있고; 반면에 DDX5-ETV4는 비-조직-특이적 프로모터 요소가 ETS 유전자 발현을 구동하는 클래스 IV 유전자 융합체를 나타낼 수 있다.
FLJ35294-ETV1 및 CANT1-ETV4 융합체는 5' 파트너로부터 예측된 전사 서열 (엑손)을 함유하지 않는다. 그러나, 전립선암 내의 거의 모든 이미 보고된 유전자 융합체와 달리, DDX5:ETV4 융합체 전사체는 ETV4의 416 C-말단 아미노산에 융합된 DDX5 단백질의 N-말단 102 아미노산 스트레치를 갖는 추정 융합 단백질을 코딩한다 (도 59d). 융합 단백질은 사례 번호 85로부터의 전장 cDNA의 인프레임 N-말단 FLAG 에피토프 태그를 인코딩하는 발현 벡터로 클로닝함으로써 상기 키메라 전사체에 의해 발현된다. 인간 배아 신장 (HEK) 293 세포로의 일시적인 형질감염시, DDX5-ETV4 융합 단백질의 발현은 독립적으로 유래된 클론에 걸쳐서 검출하였다 (도 59d). 사례 번호 85가 DDX5:ETV4 융합 단백질을 발현시키는지 평가하기 위해, 조직 추출물을 ETV4의 C-말단 말단부에 대한 항체를 사용하는 먼역블롯 분석에 노출시켰다 (도 59d). 오직 DDX5:ETV4 양성 사례만이 이상 57kDa 융합 단백질을 발현하였다.
상기 명세서에 언급된 모든 간행물, 특허, 특허 출원 및 관리 번호는 그 전문이 본원에 참고로 포함된다. 본 발명을 구체적인 실시양태와 관련하여 설명하였지만, 청구된 본 발명은 이러한 구체적인 실시양태로 부당하게 제한되지는 않는 것으로 해석되어야 한다. 실제로, 본 발명의 설명된 조성물 및 방법의 다양한 변형 및 변경이 당업자에게 자명할 것이고, 다음 특허청구범위 내에 있는 것으로 의도된다.
SEQUENCE LISTING <110> The Regents of the University of Michigan Chinnaiyan, Arul M. Han, Bo Kumar, Chandan <120> Recurrent Gene Fusions in Prostate Cancer <130> UM-10017/US-1/CIP <140> US 12/272,865 <141> 2008-11-18 <150> US 11/825,552 <151> 2007-07-06 <150> US 11/519,397 <151> 2006-09-12 <150> US 60/795,590 <151> 2006-04-28 <150> US 60/779,041 <151> 2006-03-03 <150> US 60/730,358 <151> 2005-10-27 <150> US 60/716,436 <151> 2005-09-12 <160> 439 <170> PatentIn version 3.5 <210> 1 <211> 24 <212> DNA <213> Homo sapiens <400> 1 aacagagatc tggctcatga ttca 24 <210> 2 <211> 24 <212> DNA <213> Homo sapiens <400> 2 cttctgcaag ccatgtttcc tgta 24 <210> 3 <211> 24 <212> DNA <213> Homo sapiens <400> 3 aggaaacatg gcttgcagaa gctc 24 <210> 4 <211> 26 <212> DNA <213> Homo sapiens <400> 4 tctggtacaa actgctcatc attgtc 26 <210> 5 <211> 26 <212> DNA <213> Homo sapiens <400> 5 ctcaggtacc tgacaatgat gagcag 26 <210> 6 <211> 24 <212> DNA <213> Homo sapiens <400> 6 catggactgt ggggttcttt cttg 24 <210> 7 <211> 26 <212> DNA <213> Homo sapiens <400> 7 aacagccctt taaattcagc tatgga 26 <210> 8 <211> 21 <212> DNA <213> Homo sapiens <400> 8 ggagggcctc attcccactt g 21 <210> 9 <211> 22 <212> DNA <213> Homo sapiens <400> 9 ctaccccatg gaccacagat tt 22 <210> 10 <211> 22 <212> DNA <213> Homo sapiens <400> 10 cttaaagcct tgtggtggga ag 22 <210> 11 <211> 24 <212> DNA <213> Homo sapiens <400> 11 cgcagagtta tcgtgccagc agat 24 <210> 12 <211> 24 <212> DNA <213> Homo sapiens <400> 12 ccatattctt tcaccgccca ctcc 24 <210> 13 <211> 23 <212> DNA <213> Homo sapiens <400> 13 cgactggagc acgaggacac tga 23 <210> 14 <211> 24 <212> DNA <213> Homo sapiens <400> 14 catggactgt ggggttcttt cttg 24 <210> 15 <211> 22 <212> DNA <213> Homo sapiens <400> 15 ggcgttccgt aggcacactc aa 22 <210> 16 <211> 20 <212> DNA <213> Homo sapiens <400> 16 cctggctggg ggttgagaca 20 <210> 17 <211> 21 <212> DNA <213> Homo sapiens <400> 17 taggcgcgag ctaagcagga g 21 <210> 18 <211> 25 <212> DNA <213> Homo sapiens <400> 18 gtaggcacac tcaaacaacg actgg 25 <210> 19 <211> 19 <212> DNA <213> Homo sapiens <400> 19 cgcgagctaa gcaggaggc 19 <210> 20 <211> 22 <212> DNA <213> Homo sapiens <400> 20 caggccatga aaagccaaac tt 22 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <400> 21 ccggatggag cggaggatga 20 <210> 22 <211> 20 <212> DNA <213> Homo sapiens <400> 22 cgggcgattt gctgctgaag 20 <210> 23 <211> 19 <212> DNA <213> Homo sapiens <400> 23 gccgcccctc gactctgaa 19 <210> 24 <211> 24 <212> DNA <213> Homo sapiens <400> 24 gagccacgtc tcctggaagt gact 24 <210> 25 <211> 21 <212> DNA <213> Homo sapiens <400> 25 ctggccggtt cttctggatg c 21 <210> 26 <211> 18 <212> DNA <213> Homo sapiens <400> 26 cgggccgggg aatggagt 18 <210> 27 <211> 22 <212> DNA <213> Homo sapiens <400> 27 cctggagggt accggtttgt ca 22 <210> 28 <211> 20 <212> DNA <213> Homo sapiens <400> 28 ccgcctgcct ctgggaacac 20 <210> 29 <211> 30 <212> DNA <213> Homo sapiens <400> 29 aaataagttt gtaagaggag cctcagcatc 30 <210> 30 <211> 24 <212> DNA <213> Homo sapiens <400> 30 atcgtaaaga gcttttctcc ccgc 24 <210> 31 <211> 23 <212> DNA <213> Homo sapiens <400> 31 gaaagggctg taggggcgac tgt 23 <210> 32 <211> 327 <212> DNA <213> Homo sapiens <400> 32 ccgtcggcgc cgagggagtt agtgcgaccc ggctcggcgc gcacggccaa ggcacgcgcg 60 ctggcacacg cgggcgcgga cacgcgcgga cacacacgtg cgggacacgc cctcccccga 120 cggcggcgct aacctctcgg ttattccagg atctttggag acccgaggaa agccgtgttg 180 accaaaagca agacaaatga ctcacagaga aaaaagatgg cagaaccaag ggcaactaaa 240 gccgtcaggt tctgaacagc tggtagatgg gctggcttac tgaaggacat gattcagact 300 gtcccggacc cagcagctca tatcaag 327 <210> 33 <211> 6158 <212> DNA <213> Homo sapiens <400> 33 gttgatagaa gtccagatcc tgaggaaatc tccagctaaa tgctcaaaat ataaaatact 60 gagctgagat ttgcgaagag cagcagcatg gatggatttt atgaccagca agtgccttac 120 atggtcacca atagtcagcg tgggagaaat tgtaacgaga aaccaacaaa tgtcaggaaa 180 agaaaattca ttaacagaga tctggctcat gattcagaag aactctttca agatctaagt 240 caattacagg aaacatggct tgcagaagct caggtacctg acaatgatga gcagtttgta 300 ccagactatc aggctgaaag tttggctttt catggcctgc cactgaaaat caagaaagaa 360 ccccacagtc catgttcaga aatcagctct gcctgcagtc aagaacagcc ctttaaattc 420 agctatggag aaaagtgcct gtacaatgtc agtgcctatg atcagaagcc acaagtggga 480 atgaggccct ccaacccccc cacaccatcc agcacgccag tgtccccact gcatcatgca 540 tctccaaact caactcatac accgaaacct gaccgggcct tcccagctca cctccctcca 600 tcgcagtcca taccagatag cagctacccc atggaccaca gatttcgccg ccagctttct 660 gaaccctgta actcctttcc tcctttgccg acgatgccaa gggaaggacg tcctatgtac 720 caacgccaga tgtctgagcc aaacatcccc ttcccaccac aaggctttaa gcaggagtac 780 cacgacccag tgtatgaaca caacaccatg gttggcagtg cggccagcca aagctttccc 840 cctcctctga tgattaaaca ggaacccaga gattttgcat atgactcaga agtgcctagc 900 tgccactcca tttatatgag gcaagaaggc ttcctggctc atcccagcag aacagaaggc 960 tgtatgtttg aaaagggccc caggcagttt tatgatgaca cctgtgttgt cccagaaaaa 1020 ttcgatggag acatcaaaca agagccagga atgtatcggg aaggacccac ataccaacgg 1080 cgaggatcac ttcagctctg gcagtttttg gtagctcttc tggatgaccc ttcaaattct 1140 cattttattg cctggactgg tcgaggcatg gaatttaaac tgattgagcc tgaagaggtg 1200 gcccgacgtt ggggcattca gaaaaacagg ccagctatga actatgataa acttagccgt 1260 tcactccgct attactatga gaaaggaatt atgcaaaagg tggctggaga gagatatgtc 1320 tacaagtttg tgtgtgatcc agaagccctt ttctccatgg cctttccaga taatcagcgt 1380 ccactgctga agacagacat ggaacgtcac atcaacgagg aggacacagt gcctctttct 1440 cactttgatg agagcatggc ctacatgccg gaagggggct gctgcaaccc ccacccctac 1500 aacgaaggct acgtgtatta acacaagtga cagtcaagca gggcgttttt gcgcttttcc 1560 ttttttctgc aagatacaga gaattgctga atctttgttt tatttctgtt gtttgtattt 1620 tatttttaaa taataataca caaaaagggg cttttcctgt tgcattattc tatggtctgc 1680 catggactgt gcactttatt tgagggtggg tgggagtaat ctaaacattt attctgtgta 1740 acaggaagct aatgggtgaa tgggcagagg gatttgggga ttacttttta cttaggcttg 1800 ggatggggtc ctacaagttt tgagtatgat gaaactatat catgtctgtt tgatttcata 1860 acaacataag ataatgttta ttttatcggg gtatctatgg tacagttaat ttcacgttgt 1920 gtaaatatcc acttggagac tatttgcctt gggcattttc ccctgtcatt tatgagtctc 1980 tgcaggtgta caaaaaaacc ccaatctact gtaaatggca gtttaattgt tagaaatgac 2040 tgtttttgca ccacttgtaa aaaggtattt agcgattgca tttgctgttt gttgttttat 2100 tttgctttat atatgacttg cagaggataa ccataaaatg ggtaattctc tctgaagttg 2160 aataatcacc atgactgtaa atgaggggca caattttgga ctctggcgcc aaactgagtc 2220 ataggccagt agcattacgt gtatctggtg ccaccttgct gtttagatac aaatcatacc 2280 gtcttttaaa tattttgaag cccatttcag ttaaataatg acatgtcatg gtcctttgga 2340 atcttcattt aaatgttaaa tctggaatca aaatgaagca aaaaatatct gtctcctttt 2400 cactttcttc agtacataaa tacattattt aatcaataag aattaactgt actaaatcat 2460 gtattatgct gttctagtta cagcaaacac tctttaagaa aaatatccaa tacactaaat 2520 aggtactata gtaattttta gacatggtac ccattgatat gcatttaaac cttttactgc 2580 tgtgttatgt tgataacata tataaatatt agataatgct aatgcttctg ctgctgtctt 2640 ttctgtaata ttctctttca tgctgaattt actatgacca tttataagca gtgcagttaa 2700 ctacagatag catttcagga caaaatagat gactcaaacc atttattgct taaaaaatag 2760 cttacgccat gctatgctat aagcagcttt tatgcacatt gacaaatgaa gagtaagctt 2820 cagcttgcta aaggaaactg tggaaccttt tgtaactttt ggtgatatgg aaaattattt 2880 acaaaccgtc aaagaatatg aggaagttgc tgtatgacat agtgctggca ctgatattat 2940 ccatcatctc tttttggaca cttctgtaaa tgtgattgga ttgtttgaaa gaagatttaa 3000 agtttcaaag ttttttgttc tgtttttgct ttgcatttgg agaaaatatt gaaagcaggg 3060 tatgttgttt cattcacctt gaaaaaacca tgagtaaatg gggatataga atctctgaat 3120 agctcgctaa aagattcaag caagggacat gaattttgtt ccatctatca ataatatcca 3180 gaagaacaac ttttttaaag agtctatagc aaaaagcaaa aaaaaaaaaa aattctaaac 3240 acaaagtcaa aataaaccta ttgtaaaagc atttcgtgat gagcatgaaa aagattgttt 3300 aaagatgatc cccccagcta cccattttcc aaaactacac agatcacagc tcatttctct 3360 aagtggagca gttatcaaga aacccaaaca ccaaaattgc tactcttcac atttaatcct 3420 acaaaaagta ctccaatttc aaaatatgta tgtaacctgc gatttcaatg attgttgttc 3480 atatacatca tgtattattt tggcccattt tgggcctaaa aaagaaaact atgccttaaa 3540 aatcagaacc ttttctcccc actatgctta tgtggccatc tacagcactt agaataaaaa 3600 cagatgttaa aatattcagt gaaagtttta ttggaaaaag gaattgagat atataattga 3660 gatttggtga aattgaagga gaaaatttaa gtgagtcttt aaaatatatt ctgaatgaaa 3720 actgtattga ggattcattt ttgttccttt tttttctttt tctcttttct cctttttctt 3780 ctttttaata gtctagtttt agtcagtcag tgaggaagaa ttgggccatg ctaacgttat 3840 cacaagagaa caatggcaga aatggtatta gttatataat atttaaggac aaactatatg 3900 ttttgctgtt ttaacgtagt gactcactga actaaataca taattgacca acattaagtg 3960 tatttccaat acagaagggt tgaaaatatt acattataaa ctcttttgaa aaatgtatct 4020 aaaatttttt aagttctgtt ttgattccac tttttggttg agtttttatg tttttgtttt 4080 caggtagatt aataaatctg gcagctgatt tctgcaagat tcttgtgttt tgaatttctc 4140 attgaattgg ctactcaaac atagaaatca tttgttaatg atgtaatgtc ttctctcagc 4200 ttttatcttc actgctgttt gctgtctctt gatgatgaca tgttaatacc caatagatta 4260 attgcaacaa acacttatac tcaaataact aagtaaaaat aatttttctt gttatgtcca 4320 tgaaaagtgc ttcagaataa aaatccacaa gactgacagt gcagaacatt tttctcaaat 4380 catgggcgga tcttggaggt ctagtttccc gtagatgctg taaccaatta ccacaacttc 4440 agtaatttac acaaatttat cttatagttc tggaggcaga agttcaaaag aagccttaag 4500 agactaaaac caagatgtcc ttaggtctgg ttccttctgg aggctccagg ggagattctt 4560 ccagctttca cttctagagt ctgctgacat tccttggctc ctggctacat cacttcaatc 4620 tctgcttcca tggtcacata ctcttctact atagtcaaat ttccttcctg cctcttataa 4680 ggatgcttgt gattacattt aggggatgct cagataatcc aggacaatct ctccatctca 4740 agatccttaa cttaatgacg tgtgccaagt ccctttggct agataattat tcataggtcc 4800 cagggattag gacatggatg taaggggtga gggcagggct gttattcaga acaccgcacg 4860 gaggaggaag actgtgtagc aaagactcta attgatttac tcaggaacag tggagttctg 4920 ctgagggatc taggatttga aagtactaga gtttgctttt atttaccact gagatatttt 4980 ccccttattc tgcataaata attttgaaaa ctttctatat taaatttcaa ctattccact 5040 aaaatgtctg gtaatcacat caagccttta gattattcaa atccttcccc agcccccagg 5100 aaaacactaa gtcatgaaac agaaaaacag aaggtatgat aataatagta ataacagtta 5160 aatcagtggt ctaatccaga ttttattttt taatacattt cttttggtgt taatatgggt 5220 tactatgtga tcttatcatt tgctagtgat tattacttat taggtaagaa caatgtgtaa 5280 aatatgtcta ttactcaaaa gaacaattgc aaaatgagtc aacttatctt tatataacca 5340 ggaaagaaat atattgccag aagctacaga attttgccag atgataggga tttctaaaat 5400 gagccacttt gtctatcatg cagccttttc agagcttgta atgagaaaac attacagagg 5460 agaaggtcat ttggatgttt gttacttgga atcctagaaa acaaaaacta aaatttaaaa 5520 ataagaagtg agtaagctat tttccatttg cgatttggta tggagaagag aggaaataga 5580 attattaaaa aaatacaaat tgggtaaaag tgatggtgga aaaaatataa agaaggcaaa 5640 tgtacatatt aagcaattct actaagaatt ggaaaaatca agtttcaaaa agatggtaat 5700 agttgggcat gatactagaa aatttcaccc agtttattca gagctcaact agtactttta 5760 ggacttcttt ttttatatac atgagactca ctttgacata cttaaaaaaa aaacagttta 5820 tggaaagtac agtttaagag gagaatttga ttagactaag tggatatctt tatagaaata 5880 ttaatgattt cagaattttc agttacaagt gtatataccg tggctattgt ttatggattc 5940 atatgtaagg tagggtcttt tttgcatata gactccagta ttagttactt tcattctaaa 6000 attatattta tgcttctatg gggaagaaaa tttttaattc acttggttgt attaaaatta 6060 tacttacggt ttgagaaaac atgctatgaa aatcatgatt atagcaaatt aaatatgctc 6120 aaaatttaaa tctaaaataa aagcccagaa actgaaaa 6158 <210> 34 <211> 5228 <212> DNA <213> Homo sapiens <400> 34 cgggcgaggg ccgggcagga ggagcgggcg cggcgcgggc gaggctggga cccgagcgcg 60 ctcacttcgc cgcaaagtgc caacttcccc tggagtgccg ggcgcgcacc gtccgggcgc 120 gggggaaaga aaggcagcgg gaatttgaga tttttgggaa gaaagtcgga tttcccccgt 180 ccccttcccc ctgttactaa tcctcattaa aaagaaaaac aacagtaact gcaaacttgc 240 taccatcccg tacgtccccc actcctggca ccatgaaggc ggccgtcgat ctcaagccga 300 ctctcaccat catcaagacg gaaaaagtcg atctggagct tttcccctcc ccggatatgg 360 aatgtgcaga tgtcccacta ttaactccaa gcagcaaaga aatgatgtct caagcattaa 420 aagctacttt cagtggtttc actaaagaac agcaacgact ggggatccca aaagaccccc 480 ggcagtggac agaaacccat gttcgggact gggtgatgtg ggctgtgaat gaattcagcc 540 tgaaaggtgt agacttccag aagttctgta tgaatggagc agccctctgc gccctgggta 600 aagactgctt tctcgagctg gccccagact ttgttgggga catcttatgg gaacatctag 660 agatcctgca gaaagaggat gtgaaaccat atcaagttaa tggagtcaac ccagcctatc 720 cagaatcccg ctatacctcg gattacttca ttagctatgg tattgagcat gcccagtgtg 780 ttccaccatc ggagttctca gagcccagct tcatcacaga gtcctatcag acgctccatc 840 ccatcagctc ggaagagctc ctctccctca agtatgagaa tgactacccc tcggtcattc 900 tccgagaccc tctccagaca gacaccttgc agaatgacta ctttgctatc aaacaagaag 960 tcgtcacccc agacaacatg tgcatgggga ggaccagtcg tggtaaactc gggggccagg 1020 actcttttga aagcatagag agctacgata gttgtgatcg cctcacccag tcctggagca 1080 gccagtcatc tttcaacagc ctgcagcgtg ttccctccta tgacagcttc gactcagagg 1140 actatccggc tgccctgccc aaccacaagc ccaagggcac cttcaaggac tatgtgcggg 1200 accgtgctga cctcaataag gacaagcctg tcattcctgc tgctgcccta gctggctaca 1260 caggcagtgg accaatccag ctatggcagt ttcttctgga attactcact gataaatcct 1320 gtcagtcttt tatcagctgg acaggagatg gctgggaatt caaactttct gacccagatg 1380 aggtggccag gagatgggga aagaggaaaa acaaacctaa gatgaattat gagaaactga 1440 gccgtggcct acgctactat tacgacaaaa acatcatcca caagacagcg gggaaacgct 1500 acgtgtaccg ctttgtgtgt gacctgcaga gcctgctggg gtacacccct gaggagctgc 1560 acgccatgct ggacgtcaag ccagatgccg acgagtgatg gcactgaagg ggctggggaa 1620 accctgctga gaccttccaa ggacagccgt gttggttgga ctctgaattt tgaattgtta 1680 ttctattttt tattttccag aactcatttt ttaccttcag gggtgggagc taagtcagtt 1740 gcagctgtaa tcaattgtgc gcagttggga aaggaaagcc aggacttgtg gggtgggtgg 1800 gaccagaaat tcttgagcaa attttcagga gagggagaag ggccttctca gaagcttgaa 1860 ggctctggct taacagagaa agagactaat gtgtccaatc atttttaaaa atcatccatg 1920 aaaaagtgtc ttgagttgtg gacccattag caagtgacat tgtcacatca gaactcatga 1980 aactgatgta aggcaattaa tttgcttctg tttttaggtc tgggagggca aaaaagaggt 2040 gggtgggatg aaacatgttt tgggggggga tgcactgaaa atctgagaac tatttaccta 2100 tcactctagt tttgaagcaa agatggactt cagtggggag gggccaaaac cgttgttgtg 2160 ttaaaattta ttttattaaa ttttgtgcca gtattttttt tcttaaaaat cgtcttaagc 2220 tctaaggtgg tctcagtatt gcaatatcat gtaagtttgt ttttatttgc cggctgagga 2280 ttctgtcaca atgaaagaaa actgtttata tagaccccat tggaaaagca aaacgctctc 2340 actgagatca gggatcccaa attcatggga cttatataag aaggacaatt aatgctgatt 2400 tgggtacagg ggaattatgt gtgtgaatgt catctacaat taaaaaaaat tagcacatcc 2460 ctttacttac ttgttatcag tggattctcg gggtttggac ttaatgttga gctaagaagc 2520 attaagtctt tgaactgaat gtattttgca tccctggttt tggacgacag taaacgtagg 2580 agcactgttg aagtcctgga agggagatcg aaggaggaag attgacttgg ttctttctta 2640 gtcctatatc tgtagcatag atgacttgga ataaaagctg tatgcatggg cattacccct 2700 caggtcctaa gaaataagtc ctgaatgcat gtcgttccaa actaacactc tgtaattttt 2760 cttttatgtc ttattttcca agagtcctcc attttttgca ccccctcacc gccaactctg 2820 ttattcagta gagagaagtg tacggctttc tgattggtga gtgaaaaagt aacttgagac 2880 acgacctaag ttgaagagtt tagacttgct gagttttaga agtgatggaa attaagagag 2940 catttcaata aaatgtgact tggctgtctt tggaagagaa gtgcaaggct ttcctttgaa 3000 gaatttaaat tagtccggta ggatgtcagg tgagactgtg tatgcaaaat gaatggcaca 3060 ggtgatgcca gggcctcttg cttgggtctg atgtcttggc acagggtaag tgaaggttaa 3120 ttccagaaga gaggaatgac ttgaaggcaa aggaaactaa ggaaggaggt tcagtgagga 3180 aaataaggtt gtccatgaga tttgaataga tttttagttc ccccaaggtt taaatacaaa 3240 catagtcaag caaggtagtc atctttctgc tggttgtgag ggggaatctg aaaatggagt 3300 tttagaggaa aagtcaacat ctaactagtg aggaaaagtg cctaatacaa ttagaatctc 3360 cctcactcta tagttgccca gttgaaagga taaggaggag gggtggcttt tatggacttc 3420 catgagagaa ggaaagaaat atttcaggta agcttctcag ggctggccct ttttgggatt 3480 tggatgagaa attggaagta ctaactactt tctagcatat ctttaagaaa attgattgtt 3540 atttactccc agatcctctt gcagacccag aattatcagg aacatagctc tgtgattcat 3600 gagtgtcccc atactgatga attggagcat ccatatggaa agcaaaggca gaattatccc 3660 agctgtatta ttttgatctt ttggatgcag gtgccttaat gaagctctca aaatatttta 3720 ggagctgctc agggagtgtt gggtggaact gtttggacta cattgttttc tcttagatta 3780 tgtgattttt gttgggcact ggcaaaaggt gtgtgtgtga atgtgtgcat gtgtgtgaat 3840 gttgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tttgcagaca tgcaaaactg 3900 cagctgaaat aataccttag atttctaggt aagtctttcc acatttcaat aatgggtaag 3960 agtagaacca gggccgggta tcaattattg cttgctgttt gcaaccaggc ataaaatcac 4020 tttctcaaat catccaccgt tcctattaaa tttatgccgg aaactctcct tctgtgagta 4080 taactcctgc agttcctata gcagataaga tataagaaag tgcctcctag tgctcctccg 4140 cccgcttgtt tgctaaaatt ccctttctct ctaagtccac cattttcaag atttgtagat 4200 agtgtattag ttaagacagc tttgtcgatc tggccagatg ttttttctcc tttgtccaaa 4260 ggccagagac catcccagga agagtggtgg gtggtttata cactggaaat gttgcgttta 4320 tgctttttaa aaacacacgt taacttcaga ggaaggatgg gcaaatctgg tctagctggg 4380 tgaaaccctt attttcccag agatgcctta acctttgttg gttttggctt tagggttcag 4440 agtcactttt gttcccttct ccattctgga gagggacttc ccctacatag agccctgatt 4500 tttgtggctg tggggattgg aggtagcatt caaagatcag atgtgctttt cctcactttg 4560 gagatgaaca ctctgggttt tacagcatta acctgcctaa ccttcatggt gagaaataca 4620 ccatctctct tctagtcatg ctgtgcatgc cgcttactct gttggggtct atataaattt 4680 gttgaactct tacctacatt ccaaagaagt ttcaaggaac cataaatata tgtatacata 4740 tacatatata aaatatatat attaaaataa aattatcagg aatactgcct cagttattga 4800 actttttttt ttaagaatac ttttttttta agctgagaag tatagggatg aaaaagatgt 4860 tatattgtgt ttgactattt tccaacttgt attttcatat aatttatatt ttttaaaagc 4920 tgaaaattta gaagcaagat gaaaaaaagg aaaagcaggt gctttttaaa aatcagaact 4980 gaggtagctt agagatgtag cgatgtaagt gtcgatgttt ttttaaaaaa aaatgcaaaa 5040 aaattcttat ggcggagttt tttgtttgtt tattttagta gctgatgctg gcacatcatt 5100 ttgctggaga gttttttata tactgtagcc tgatttcata ttgtatttta aactgtgtga 5160 aattaaaaac aaagaatttc attcataaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5220 aaaaaaaa 5228 <210> 35 <211> 3672 <212> DNA <213> Homo sapiens <400> 35 gcccggttac ttcctccaga gactgacgag tgcggtgtcg ctccagctca gagctcccgg 60 agccgcccgg ccagcgtccg gcctccctga tcgtctctgg ccggcgccct cgccctcgcc 120 cggcgcgcac cgagcagccg cgggcgccga gcagccaccg tcccgaccaa gcgccggccc 180 tgcccgcagc ggcaggatga atgatttcgg aatcaagaat atggaccagg tagcccctgt 240 ggctaacagt tacagaggga cactcaagcg ccagccagcc tttgacacct ttgatgggtc 300 cctgtttgct gtttttcctt ctctaaatga agagcaaaca ctgcaagaag tgccaacagg 360 cttggattcc atttctcatg actccgccaa ctgtgaattg cctttgttaa ccccgtgcag 420 caaggctgtg atgagtcaag ccttaaaagc taccttcagt ggcttcaaaa aggaacagcg 480 gcgcctgggc attccaaaga acccctggct gtggagtgag caacaggtat gccagtggct 540 tctctgggcc accaatgagt tcagtctggt gaacgtgaat ctgcagaggt tcggcatgaa 600 tggccagatg ctgtgtaacc ttggcaagga acgctttctg gagctggcac ctgactttgt 660 gggtgacatt ctctgggaac atctggagca aatgatcaaa gaaaaccaag aaaagacaga 720 agatcaatat gaagaaaatt cacacctcac ctccgttcct cattggatta acagcaatac 780 attaggtttt ggcacagagc aggcgcccta tggaatgcag acacagaatt accccaaagg 840 cggcctcctg gacagcatgt gtccggcctc cacacccagc gtactcagct ctgagcagga 900 gtttcagatg ttccccaagt ctcggctcag ctccgtcagc gtcacctact gctctgtcag 960 tcaggacttc ccaggcagca acttgaattt gctcaccaac aattctggga ctcccaaaga 1020 ccacgactcc cctgagaacg gtgcggacag cttcgagagc tcagactccc tcctccagtc 1080 ctggaacagc cagtcgtcct tgctggatgt gcaacgggtt ccttccttcg agagcttcga 1140 agatgactgc agccagtctc tctgcctcaa taagccaacc atgtctttca aggattacat 1200 ccaagagagg agtgacccag tggagcaagg caaaccagtt atacctgcag ctgtgctggc 1260 cggcttcaca ggaagtggac ctattcagct gtggcagttt ctcctggagc tgctatcaga 1320 caaatcctgc cagtcattca tcagctggac tggagacgga tgggagttta agctcgccga 1380 ccccgatgag gtggcccgcc ggtggggaaa gaggaaaaat aagcccaaga tgaactacga 1440 gaagctgagc cggggcttac gctactatta cgacaagaac atcatccaca agacgtcggg 1500 gaagcgctac gtgtaccgct tcgtgtgcga cctccagaac ttgctggggt tcacgcccga 1560 ggaactgcac gccatcctgg gcgtccagcc cgacacggag gactgaggtc gccgggacca 1620 ccctgagccg gccccaggct cgtggactga gtgggaagcc catcctgacc agctgctccg 1680 aggacccagg aaaggcagga ttgaaaatgt ccaggaaagt ggccaagaag cagtggcctt 1740 attgcatccc aaaccacgcc tcttgaccag gctgcctccc ttgtggcagc aacggcacag 1800 ctaattctac tcacagtgct tttaagtgaa aatggtcgag aaagaggcac caggaagccg 1860 tcctggcgcc tggcagtccg tgggacggga tggttctggc tgtttgagat tctcaaagga 1920 gcgagcatgt cgtggacaca cacagactat ttttagattt tcttttgcct tttgcaacca 1980 ggaacagcaa atgcaaaaac tctttgagag ggtaggaggg tgggaaggaa acaaccatgt 2040 catttcagaa gttagtttgt atatattatt ataatcttat aattgttctc agaatccctt 2100 aacagttgta tttaacagaa attgtatatt gtaatttaaa ataattatat aactgtattt 2160 gaaataagaa ttcagacatc tgaggtttta tttcattttt caatagcaca tatggaattt 2220 tgcaaagatt taatctgcca agggccgact aagagaagtt gtaaagtatg tattatttac 2280 atttaataga cttacaggga taaggcctgt ggggggtaat ccctgctttt tgtgtttttt 2340 tgtttgtttg tttgtttgtt tttggggggt tttcttgcct tggttgtctg gcaaggactt 2400 tgtacatttg ggagttttta tgagaaactt aaatgttatt atctgggctt atatctggcc 2460 tctgctttct cctttaattg taaagtaaaa gctataaagc agtatttttc ttgacaaatg 2520 gcatatgttt tccacttctt tgcatgcgtt taagtcagtt tatacacaaa atggatttta 2580 ttttttagtt taactgtgtt tctccgacag ctcacctctc tctgaccacc cagccatttc 2640 cttcctgtgc tccacgttct tctgtgtgat taaaataaga atattatttt tggaaatatg 2700 caactccttt tcagagatca ggagggattt atgtagcagc tatttttact gcaaaagtaa 2760 ttcactggaa aaaaaatgta atttgtaaga aagctttatt tttatctcag ctctatgtaa 2820 agttaaagtt actgtacaga gctgaaggac ggggggcggt aggggtcttg atgaaacctc 2880 ttgaacgaag cacagtttgt cccatctttg ttcactcgtg tgtctcaacc atcttaatag 2940 catgctgctc ctttttgctc agtgtccaca gcaagatgac gtgattctta ttttcttgga 3000 cacagactat tctgaggcac agagcgggga cttaagatgg gaaagagaaa gcatcggagc 3060 cattcattcg gagaaaacgt tttgatcaaa atggagactt ttgtagtcgt ttcaaaagag 3120 cacctgagtc atgtgtattc ccggccttta taaatgaccc ggtcaagttg gtttcaaagt 3180 ccgacaggct tgtctgttta ctagctgcgt ggccttggac gggtggctga catctgtaaa 3240 gaatcctcct gtgatgaaac tgaggaatcg ggtggccggg caagctggga agagcaaagc 3300 cagagctgcg ctgcctcaat acccacaaaa gaccattccc agtatacata agcacaggat 3360 gtttttctca agagggatgt atttatcact tggacatctg tttataatat aaacagacat 3420 gtgactggga acatcttgct gccaaaagaa tcctaggcag tggctcattg tatgtgaggt 3480 tgaaccacgt gaaattgcca atattaggct ggcttttatc tacaaagaag gagtttcatg 3540 gggttcagcc taacagttat ggaaactaca gtccttataa accattggca tggtaataaa 3600 cagatcttaa gtataaaaat tttgtaattg ggcctttact ctctcaataa taaagtattt 3660 tgtttatata aa 3672 <210> 36 <211> 2668 <212> DNA <213> Homo sapiens <400> 36 cgctacacac aggtacccct gggatggcgt gagcactccc ccagcgatgg acccatctgt 60 gacgctgtgg cagtttctgc tgcagctgct gagagagcaa ggcaatggcc acatcatctc 120 ctggacttca cgggatggtg gtgaattcaa gctggtggat gcagaggagg tggcccggct 180 gtgggggcta cgcaagaaca agaccaacat gaattacgac aagctcagcc gggccttgcg 240 gtactactat gacaagaaca tcatccgcaa ggtgagcggc cagaagttcg tctacaagtt 300 tgtgtcctac cctgaggtcg cagggtgctc cactgaggac tgcccgcccc agccagaggt 360 gtctgttacc tccaccatgc caaatgtggc ccctgctgct atacatgccg ccccagggga 420 cactgtctct ggaaagccag gcacacccaa gggtgcagga atggcaggcc caggcggttt 480 ggcacgcagc agccggaacg agtacatgcg ctcgggcctc tattccacct tcaccatcca 540 gtctctgcag ccgcagccac cccctcatcc tcggcctgct gtggtgctcc ccagtgcagc 600 tcctgcaggg gcagcagcgc ccccctcggg gagcaggagc accagtccaa gccccttgga 660 ggcctgtctg gaggctgaag aggccggctt gcctctgcag gtcatcctga ccccgcccga 720 ggccccaaac ctgaaatcgg aagagcttaa tgtggagccg ggtttgggcc gggctttgcc 780 cccagaagtg aaagtagaag ggcccaagga agagttggaa gttgcggggg agagagggtt 840 tgtgccagaa accaccaagg ccgagccaga agtccctcca caggagggcg tgccagcccg 900 gctgcccgcg gttgttatgg acaccgcagg gcaggcgggc ggccatgcgg cttccagccc 960 tgagatctcc cagccgcaga agggccggaa gccccgggac ctagagcttc cactcagccc 1020 gagcctgcta ggtgggccgg gacccgaacg gaccccagga tcgggaagtg gctccggcct 1080 ccaggctccg gggccggcgc tgaccccatc cctgcttcct acgcatacat tgaccccggt 1140 gctgctgaca cccagctcgc tgcctcctag cattcacttc tggagcaccc tgagtcccat 1200 tgcgccccgt agcccggcca agctctcctt ccagtttcca tccagtggca gcgcccaggt 1260 gcacatccct tctatcagcg tggatggcct ctcgaccccc gtggtgctct ccccagggcc 1320 ccagaagcca tgactactac caccaccacc accacccctt ctggggtcac tccatccatg 1380 ctctctccag ccagccatct caaggagaaa catagttcaa ctgaaagact catgctctga 1440 ttgtggtggg gtggggatcc ttgggaagaa ttactcccaa gagtaactct cattatctcc 1500 tccacagaaa acacacagct tccacaactt ctctgttttc tgtcagtccc ccagtggccg 1560 cccttacacg tctcctactt caatggtagg ggcggtttat ttatttattt tttgaaggcc 1620 actgggagga gcctgaccta accttttagg gtggttagga catctccccc acctccccac 1680 ttttttcccc aagacaagac aatcgaggtc tggcttgaga acgacctttc tttctttatt 1740 tctcagcctg cccttgggga gatgagggag ccctgtctgc gtttttggat gtgagtagaa 1800 gagttagttt gttttgtttt attattcctg gccatactca ggggtccagg aagaatttgt 1860 accatttaat gggttgggag tcttggccaa ggaagaatca cacccttgga atagaaattt 1920 ccacctcccc aacctttctc tcagacagct tatccttttc aaccaacttt ttggccaggg 1980 aggaatgtcc cttttgttct tccccctgag aagccattcc tttgtctgcc aacctccctg 2040 gggtcctgcc tgtttcctcc caatggaggg tttttttggg gggtggtccc cgtctggggg 2100 gcccctccag ccagtactcc aggtctccct gtctctcccc cgctgccatt ttgatagtat 2160 aatctatttt taaatggggc ttttcaatag gggagaggga gtcatctctt cctatatttg 2220 gtggggtggg tgggaaggaa gggatttggg ggggaatctt cctgccgcct cccccactcc 2280 aagtgtttat ttttgatacc aaacatgaat tttcagttcc ctccctccca gccccccaat 2340 ttcctgcggg cgggtacaaa ggaccctttc aatgtccctg gagttgggag ggaggaatgg 2400 gggacataaa gcctgtcctg tctctattct aggcaagaga gagtgggttc aaaagactcc 2460 tgggctcacc tgttagcgct ggcccagccc aggccttggg acctgggggt tggtgatttg 2520 ggggacagtg ctacactcgt ctccactgtt tgttttactt ccccaaaatg gacctttttt 2580 ttttctaaag agtcccagag aatggggaat tgttcctgta aatatatatt tttcaaagtg 2640 aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668 <210> 37 <211> 5992 <212> DNA <213> Homo sapiens <400> 37 gcgtcccggg tccccgcgcc gcgccgcgac ctgcagaccc cgccgccgcg ctcgggcccg 60 tctcccacgc ccccgccgcc ccgcgcgccc aactccgccg gccgccccgc cccgccccgc 120 gcgctccaga cccccggggc ggctgccggg agagatgctg gaagaaactt cttaaatgac 180 cgcgtctggc tggccgtgga gcctttctgg gttggggaga ggaaaggaaa gtggaaaaaa 240 cctgagaact tcctgatctc tctcgctgtg agacatgtct gagactcctg ctcagtgtag 300 cattaagcag gaacgaattt catatacacc tccagagagc ccagtgccga gttacgcttc 360 ctcgacgcca cttcatgttc cagtgcctcg agcgctcagg atggaggaag actcgatccg 420 cctgcctgcg cacctgcgct tgcagccaat ttactggagc agggatgacg tagcccagtg 480 gctcaagtgg gctgaaaatg agttttcttt aaggccaatt gacagcaaca cgtttgaaat 540 gaatggcaaa gctctcctgc tgctgaccaa agaggacttt cgctatcgat ctcctcattc 600 aggtgatgtg ctctatgaac tccttcagca tattctgaag cagaggaaac ctcggattct 660 tttttcacca ttcttccacc ctggaaactc tatacacaca cagccggagg tcatactgca 720 tcagaaccat gaagaagata actgtgtcca gaggaccccc aggccatccg tggataatgt 780 gcaccataac cctcccacca ttgaactgtt gcaccgctcc aggtcaccta tcacgacaaa 840 tcaccggcct tctcctgacc ccgagcagcg gcccctccgg tcccccctgg acaacatgat 900 ccgccgcctc tccccggctg agagagctca gggacccagg ccgcaccagg agaacaacca 960 ccaggagtcc taccctctgt cagtgtctcc catggagaat aatcactgcc cagcgtcctc 1020 cgagtcccac ccgaagccat ccagcccccg gcaggagagc acacgcgtga tccagctgat 1080 gcccagcccc atcatgcacc ctctgatcct gaacccccgg cactccgtgg atttcaaaca 1140 gtccaggctc tccgaggacg ggctgcatag ggaagggaag cccatcaacc tctctcatcg 1200 ggaagacctg gcttacatga accacatcat ggtctctgtc tccccgcctg aagagcacgc 1260 catgcccatt gggagaatag cagactgtag actgctttgg gattacgtct atcagttgct 1320 ttctgacagc cggtacgaaa acttcatccg atgggaggac aaagaatcca aaatattccg 1380 gatagtggat cccaacggac tggctcgact gtggggaaac cataagaaca gaacaaacat 1440 gacctatgag aaaatgtcca gagccctgcg ccactactac aaactaaaca ttatcaggaa 1500 ggagccagga caaaggcttt tgttcaggtt tatgaaaacc ccagatgaaa tcatgagtgg 1560 ccgaacagac cgtctggagc acctagagtc ccaggagctg gatgaacaaa tataccaaga 1620 agatgaatgc tgaaggaacc aacagtccac ctcagcgggc cagcagccca gggaacccct 1680 gcccaccagg attgctggaa gtgtgacgga gcaggcgggc tgaggagagt ggaaaaggaa 1740 gcgacccaga aatggcaggg acacttctct tgcagaccaa gagggaccct ggagcacctt 1800 agacaaacta cccagcacag gcggggctgg aattctggcg gagggcatga gcctgggact 1860 ccatgtcacg tttccttctg atttggaatc tctccatctg taattcctca ccctcaccct 1920 tccaccgttg ttagtatcat ggtgtttttg tttttgtttt tgttttaaga acctgcagtt 1980 tgactcttca tcgttcatct aggggaagac atctgatgtt gttttcctat ggaaatatat 2040 atctattata tatatatttt ttgcaaatct cacaaagtgc ggcaagccca gctggtcagg 2100 aaagagaata cttgcagagg ggttcaggtt cctctttttc ctgccacgtg gatcaggtct 2160 gttcctgtta ctgttgggtc ttggctgaaa aaaaaaaatg cttttaaaaa agataaaatg 2220 aaaaggagag ctctcttttt ctctctcttg ctctgttctt cccttggtcc cctctgtcct 2280 cccgccctgc ctgcagttga gattcagatg ccttctgaca gagttcagcc tcttggagag 2340 tcttggggat tgttggcacc taaacagaat cagtgacccg ggtgctttgt ggccagcagc 2400 acagaatcaa acccgcatcc cagcattggg ccacccatct gagggaggcc aaaatcatca 2460 cagatgctgc tgtgctgcag acagatacat gctagtccag agagccgccc ctgagatggc 2520 tgtgagaacc atgtgtctaa ggcgtaagat aaggatggaa ggctgtccaa gttatttgga 2580 aggcctcggc agcttgggat tagcttggga gcgcagcgct gcaaagtgga aaatatgaaa 2640 agaccacaca ggcccagcag tccagaaact gggcaaaaat attctgcagt ggggatttat 2700 ttttccaaag caggtaacag aggctagtga gaaagaaaag ctcctctctg ctccattcca 2760 aaggccatct tgtggtcagt ttcatgccct cacctgattt tttttttttt tttttttttt 2820 caattcctaa ccttttttaa agtttcctgg tctccactgg acacagagct ttggagacgg 2880 aggatcccag agggcagtct cagttgcaat cagtgtgtgc ccagcctggg cagacaggaa 2940 attcctcgga tacattattt tttctttctt tcatagctgt gtctcagaaa ggacccattt 3000 gtggctcttt ttcacctcaa aataagatcg atggtatctt gtaaaatgag ggtagtgcca 3060 cttcttagta tttttgaaag ctgttttaga tttttttttt ttttcctttt ctagccatct 3120 aaattgactc ttccaatata ggtctcagaa atccaatatt tggagtacaa tttcttttaa 3180 tccagattac acctgcctta caaagcaccc cctccttgtt cccctctgtt tcctctactc 3240 agttggggga gaaactcaca gctcctccgg gatacatatg tgccctcagc agcagctccc 3300 aggtgaagtt accagacccc tgggcttctc cccagctttt tctgagttga gtcagacatg 3360 tagagtttgg gtcacacagg caagaggaat tttccctcgg ccttactgac aaggacacca 3420 acctagggtg caaacagatg gactatggtt caaggacact ggaattgagg agctgatcaa 3480 ggctctcttc agccttgctc tgtccctgcc tcttatcaga gcacaggtag acacacgggc 3540 atagccagcc cactcctact gtcacaggcg ccccaccatt caaccttccg ggaggtcagg 3600 gaccttctat atgaggcgag tgggtctcag tctgcttgaa tggtgatgag attctgctgg 3660 atctcagcac gctgcaggtg tcttttgaga gcattcagta ggacatggtg atccctattt 3720 cagcctctaa gatgactggt attctatctg aaatgcagag attaagccaa atacctgatg 3780 tattgtgaaa gccactgatt ttaagaatgg agagaaaggg attttttact gcatccctct 3840 gtatgaatat gaaatcagag accagggcat gatgttgcta ggattagagc ctctcagtct 3900 ggcctcttca cccaagtgca agaactcagt ctcttactgt tcaaagaatc ttaacagttg 3960 aattatggag ggaaattccc ttttgcccca agcatttcta tatttaaagc aatatcccag 4020 gagaatatgt tagacttagg atgatacctt cagccacttg aagaagaaat agaaggcgct 4080 cattccaata tagtctttat ttcccattca gatacaggtt gagcatccct aatctgaaca 4140 gttaaaaccc ccaaatgccc caaaatccaa accttcctga acgctatgac accatgagtg 4200 gaaaattcca cacctaacaa acacatttgc tttcttatgg ttcaatgtac acaaactgtt 4260 ttatatagaa aatgatttca aatatcataa aattaccttc aggctatgtg tataaagtat 4320 atatgagcca taaatgaatt ttgtgtttag actttgtgtc catccccaag atctctcatt 4380 ttatatatat atatatatat atatatatat atatatatat atatatatac acacacacac 4440 acatacacaa atattccagg atacaaaaaa aaacatttaa aaatccgaga cccagaacac 4500 ttctggtccc aagcatttca gataagggat atcaatctgt actaccaata aggatttcgt 4560 aattccccta actgcaaatg tcctcttcat ttgttcttta tgagaaaacc cgggtagtgc 4620 cagcacctgg atacagtatt tacaccctgc agaccctaaa gatttcagat tcagttagca 4680 aaccttgatg aagcacctgc tggacactga gggacccaaa gctcaatcag ccataatccc 4740 tgctttcaga gtttatattg tacctgccta atccacccgg cgtgactcat ttcaacacta 4800 agtactaggg gtgttgtcag gagacaaatc tgaagtcagg agaggaaaat gcaaaggagc 4860 cctgccgtgt gatggatgtg cattctcact tgggtcttga agttctcatt cctacatctc 4920 aagctagcca ggcagtctcc tctctatcag aagaaagcac tggtaattgg ctagactggc 4980 tatgttgaag gtaacatgaa ctctaagatc ttgacccagg gcgacttggt tttgcttaag 5040 gtggcatcac caatgttcca aatcctttag ggagatgagg gtatccccac agaaaaagag 5100 gaataataga ccaatggatt ttctcctttc accagtatgt ttggaaccct ctgatccaat 5160 gtcctttgat actgatctct tgtccaaatg agaatgtcgc tttagctgaa attcaaatgg 5220 ctgtgacaat ttaccgaaat gatgaagtaa ccaccattcc cacctttcac tgcctaggct 5280 ccaagtctga atacattttt gaaataggaa ctcccttttg caaaaaagaa acctgggtgt 5340 cagggaggtg aagtgacttg ccctaggagc agacagcatg ccaagaatgg aattaggctc 5400 aggatccagc ctgggctcac cctgtgtggc tcattcccac ccaggaaact gaagataaaa 5460 gatttgggaa aacacaccaa gaaaaagggg cagttttctt tgcccaagca tttggtgcta 5520 gttagaggct gttcactctc tcctgctcct cttcggagta gaaataaagg ctgtgacaca 5580 aggaagccag tggggtggga gggaggcacc ataatccctc cctaaaaccc acagaagact 5640 aacctgatac tcttttgacc caactgcatc aacactaaac agctgcagac cccctgaatc 5700 tttcacacat gccaagtgaa cattcttgat gatttctctt tgtgaccgca accacctgca 5760 aaccagaacg actctagaat ttccttcccc gccccccttt ttgtttagtt tctaatctct 5820 tgtttatgag gtgtggggtt tataagggac tgaatcaaat gaatgtaaca aaaaagaaaa 5880 aaaaaacaaa aaaaaatgcc ttttctcagg gccagtgagt tgcaaataat ttttaaagaa 5940 aagcctataa ttacatcatc tcaataaatt ttttataaaa aaaaaaaaaa aa 5992 <210> 38 <211> 1670 <212> DNA <213> Homo sapiens <400> 38 gatttcctcc cacgcgacct tccagttctc ggagccaggt taggggtttg gcggaggagg 60 actgcggggc gcgggcctag ggccccagca gccacggcca ggggagcgct caagacagaa 120 agccggtggc ttcctcacct ccacctgtaa tgcaggaggg agaattggct atttctccta 180 taagccctgt ggcagccatg cctcccctag gcacccacgt gcaagccaga tgtgaagctc 240 aaattaacct gctgggtgaa ggggggatct gcaagctgcc aggaagactc cgcatccagc 300 ccgcactgtg gagcagggag gacgtgctgc actggctgcg ctgggcagag caggagtact 360 ctctgccatg caccgcggag cacgggttcg agatgaacgg acgcgccctc tgcatcctca 420 ccaaggacga cttccggcac cgtgcgccca gctcaggtga cgtcctgtat gagctgctcc 480 agtacatcaa gacccagcgg cgagccctgg tgtgtggacc cttttttgga gggatcttca 540 ggctgaagac gcccacccag cactctccag tccccccgga agaggtgact ggcccctctc 600 agatggacac ccgaaggggc cacctgctgc agccaccaga cccagggctt accagcaact 660 tcggccacct ggatgaccct ggcctggcaa ggtggacccc tggcaaggag gagtccctca 720 acttatgtca ctgtgcagag ctcggctgca ggacccaggg ggtctgttcc ttccccgcga 780 tgccgcaggc ccccattgac ggcaggatcg ctgactgccg cctgctgtgg gattacgtgt 840 atcagctgct ccttgatacc cgatatgagc cctacatcaa gtgggaagac aaggacgcca 900 agatcttccg agttgtggat ccaaatgggc tcgccagact ctggggaaat cacaagaacc 960 gggtgaacat gacctacgag aagatgtctc gtgccctgcg ccactattat aagcttaata 1020 tcattaagaa ggaaccgggg cagaaactcc tgttcagatt tctaaagact ccgggaaaga 1080 tggtccagga caagcacagc cacctggagc cgctggagag ccaggagcag gacagaatag 1140 agttcaagga caagaggcca gaaatctctc cgtgaggggc aggtggactc caggcacccg 1200 gtaccgatgg ggcagggacc gagtctccca tgaaggcaga ctcctcctcc cagcagagca 1260 gcaggatccc cagccagact ctgtacccac aggattacag ccattgcttg ggaaggctgg 1320 gaggcctccc atccaggaca ctgggggcag gagtgtcatc ttttgggcag ggcaatcctg 1380 gggctaaatg aggtacaggg gaatggactc tcccctactg cacccctggg agaggaagcc 1440 aggcaccgat agagcaccca gccccacccc tgtaaatgga atttaccaga tgaagggaat 1500 gaagtccctc actgagcctc agatttcctc acctgtgaaa tgggctgagg caggaaatgg 1560 gaaaaagtgt tagtgcttcc aggcggcact gacagcctca gtaacaataa aaacaatggt 1620 agctgaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1670 <210> 39 <211> 4071 <212> DNA <213> Homo sapiens <400> 39 gagtccagcc gctggtgcgc ggagcggttc accgtcttcg gagcggttcg gcccagcctt 60 tcgcccaggc gcccaggccc gctgcgcgcg tgcgtgagcg cgcctgcgcc gccagggccg 120 ctgcaagggg aggagagcgg ccgcctcagg aggatccctt ttcccccaga aattactcaa 180 tgctgaaacc tctcaaagtg gtattagaga cgctgaaagc accatggacg ggttttatga 240 tcagcaagtc ccttttatgg tcccagggaa atctcgatct gaggaatgca gagggcggcc 300 tgtgattgac agaaagagga agtttttgga cacagatctg gctcacgatt ctgaagagct 360 atttcaggat ctcagtcaac ttcaagaggc ttggttagct gaagcacaag ttcctgatga 420 tgaacagttt gtcccagatt ttcagtctga taacctggtg cttcatgccc cacctccaac 480 caagatcaaa cgggagctgc acagcccctc ctctgagctg tcgtcttgta gccatgagca 540 ggctcttggt gctaactatg gagaaaagtg cctctacaac tattgtgcct atgataggaa 600 gcctccctct gggttcaagc cattaacccc tcctacaacc cccctctcac ccacccatca 660 gaatccccta tttcccccac ctcaggcaac tctgcccacc tcagggcatg cccctgcagc 720 tggcccagtt caaggtgtgg gccccgcccc cgccccccat tcgcttccag agcctggacc 780 acagcagcaa acatttgcgg tcccccgacc accacatcag cccctgcaga tgccaaagat 840 gatgcctgaa aaccagtatc catcagaaca gagatttcag agacaactgt ctgaaccctg 900 ccaccccttc cctcctcagc caggagttcc tggagataat cgccccagtt accatcggca 960 aatgtcagaa cctattgtcc ctgcagctcc cccgccccct cagggattca aacaagaata 1020 ccatgaccca ctctatgaac atggggtccc gggcatgcca gggcccccag cacacgggtt 1080 ccagtcacca atgggaatca agcaggagcc tcgggattac tgcgtcgatt cagaagtgcc 1140 taactgccag tcatcctaca tgagaggggg ttatttctcc agcagccatg aaggtttttc 1200 atatgaaaaa gatccccgat tatactttga cgacacttgt gttgtgcctg agagactgga 1260 aggcaaagtc aaacaggagc ctaccatgta tcgagagggg cccccttacc agaggcgagg 1320 ttcccttcag ctgtggcagt tcctggtcac ccttcttgat gacccagcca atgcccactt 1380 cattgcctgg acaggtcgag gcatggagtt caagctgata gaaccggaag aggttgctcg 1440 gcgctggggc atccagaaga accggccagc catgaactat gacaagctga gccgctctct 1500 ccgctattac tatgaaaagg gcatcatgca gaaggtggct ggagagcgat acgtctacaa 1560 atttgtctgt gacccagatg ccctcttctc catggctttc ccggataacc agcgtccgtt 1620 cctgaaggca gagtccgagt gccacctcag cgaggaggac accctgccgc tgacccactt 1680 tgaagacagc cccgcttacc tcctggacat ggaccgctgc agcagcctcc cctatgccga 1740 aggctttgct tactaagttt ctgagtggcg gagtggccaa accctagagc tagcagttcc 1800 cattcaggca aacaagggca gtggttttgt ttgtgttttt ggttgttcct aaagcttgcc 1860 ctttgagtat tatctggaga acccaagctg tctctggatt ggcaccctta aagacagata 1920 cattggctgg ggagtgggaa cagggagggg cagaaaacca ccaaaaggcc agtgcctcaa 1980 ctcttgattc tgatgaggtt tctgggaaga gatcaaaatg gagtctcctt accatggaca 2040 atacatgcaa agcaatatct tgttcaggtt agtacccgca aaacgggaca tgatgtgaca 2100 atctcgatcg atcatggact actaaatggc ctttacatag aagggctctg atttgcacaa 2160 tttgttgaaa aatcacaaac ccatagaaaa gtgagtaggc taagttgggg aggctcaaac 2220 cattaagggt taaaaataca tcttaaacat tggaaagctc ttctagctga atctgaaata 2280 ttaccccttg tctagaaaaa ggggggcagt cagaacagct gttccccact ccgtgttctc 2340 aaaatcataa accatggcta ctcttgggaa ccacccggcc atgtggtcgc caagtagagc 2400 aagccccctt tctcttccca atcacgtggc tgagtgtgga tgacttttat tttaggagaa 2460 gggcgattaa cacttttgac agtattttgt tttgccctga tttgggggat tgttttgttt 2520 tggtggttgt tttggaaaaa cagtttataa actgattttt gtagttttgg tatttaaagc 2580 aaaaaaacga aaaacaaaaa acaaaaacaa accttttggt aatgtgcact gtgtctttag 2640 ccagggccgt gcaacttatg aagacactgc agcttgagag gggctttgct gaggcttccc 2700 cttggccatg tgaaagcccg ccttgttgcc tgctttgtgc tttctgcacc agacaacctg 2760 atggaacatt tgcacctgag ttgtacattt ttgaagtgtg cagggcagcc tggacacaag 2820 cttagattct ctatgtatag ttccccgtgt tcactaacat gccctctctg gaaagcatat 2880 gtatataaca tgtgtcatgt cctttggaaa cctggtcacc tggtgaaaac ccttgggatt 2940 cttccctggg catgactgat gacaatttcc atttcatcag tttgttttgt tttccttttt 3000 ctttaaatct tggactttaa accctacctg tgtgattcag tagggtttga gacttagctg 3060 tgatactgac aggtaagcaa cagtgctagc attctagatt cctgcctttt tttaaaaaga 3120 aattattctc attgctgtat tatattggaa aagttttaaa caaccaagct aaagctatgt 3180 gaaagttgag ctcaaagtag aggaaaagtt actggtggta ccttgctgcc tgctctgctg 3240 gtagaattct gtgctccccg tgacacttag tacattaaga atgactacac tgttcctcgt 3300 atgtgaagga ggcagtgctg actccgtgag tgtgagacac gtgctttgaa ctgcttttct 3360 attcatggag cactccatag tctcaaactg tcccccttat gaccaacagc acatttgtga 3420 agaggttcgc agggataagg ggtgcacttt atagctatgg aaacatgaga ttctcctcta 3480 ttggaagcta attagcccac aaaggtggta aacctgtaga ttgggcctta attagcattg 3540 tactctaatc aaaggactct ttctaaacca tatttatagc tttcttaacc tacacatagt 3600 ctatacatag atgcatattt tacccccagc tggctagaga tttatttgtt gtaaatgctg 3660 tatagatttg gttttccttt ctttacttac cctggtttgg attttttttt tttttttttt 3720 tgaatggatt tatgctgtct tagcaatatg acaataatcc tctgtagctt gagctacccc 3780 tcccctgctg taacttacgt gacctgtgct gtcactgggc ataggacagc ggcatcacgg 3840 ttgcattccc attggactca tgcacctccc ggatggtttt tgtttttttc gggggttctt 3900 tggggtttgt ttgtttgctt cttttccaga gtgtggaaag tctacagtgc agaaaggctt 3960 gaacctgcca gctgatttga aatactttca ccctgcgcag ggccgtatgc atcctgccaa 4020 gctgcgttat attctgtact gtgtacaata aagaagtttg cttttcgttt a 4071 <210> 40 <211> 3499 <212> DNA <213> Homo sapiens <400> 40 gccaagaagc ttgagagaag aaaaatttca gaaaaattgt ctcaatttga ctagaatatc 60 aatgaaccag gaaaactgaa gcaccttccc taaagaaaac ttgggtatac aattactcca 120 cagacagagc tgagggtttt ttacccaaat cagtcactgg attttgctgc ctgatacgtg 180 aatcttcttg gaatttttct catgtggatc taaggggaat gctttattat ggctgctgtt 240 gtccaacaga acgacctagt atttgaattt gctagtaacg tcatggagga tgaacgacag 300 cttggtgatc cagctatttt tcctgccgta attgtggaac atgttcctgg tgctgatatt 360 ctcaatagtt atgccggtct agcctgtgtg gaagagccca atgacatgat tactgagagt 420 tcactggatg ttgctgaaga agaaatcata gacgatgatg atgatgacat cacccttaca 480 gttgaagctt cttgtcatga cggggatgaa acaattgaaa ctattgaggc tgctgaggca 540 ctcctcaata tggattcccc tggccctatg ctggatgaaa aacgaataaa taataatata 600 tttagttcac ctgaagatga catggttgtt gccccagtca cccatgtgtc cgtcacatta 660 gatgggattc ctgaagtgat ggaaacacag caggtgcaag aaaaatatgc agactcaccg 720 ggagcctcat caccagaaca gcctaagagg aaaaaaggaa gaaaaactaa accaccacga 780 ccagattccc cagccactac gccaaatata tctgtgaaga agaaaaacaa agatggaaag 840 ggaaacacaa tttatctttg ggagttttta ctggcactgc tccaggacaa ggctacttgt 900 cctaaataca tcaagtggac ccagcgagag aaaggcattt ttaaattggt ggattctaaa 960 gcagtgtcca ggttgtgggg gaagcacaaa aacaaacctg atatgaatta tgagaccatg 1020 ggaagagcac tcaggtacta ttaccaaagg ggtattctgg caaaagtgga aggtcagcgc 1080 ttggtgtatc agtttaaaga aatgccaaaa gatcttatat atataaatga tgaggatcca 1140 agttccagca tagagtcttc agatccatca ctatcttcat cagccacttc aaataggaat 1200 caaaccagcc ggtcgagagt atcttcaagt ccaggggtaa aaggaggagc cactacagtt 1260 ctaaaaccag ggaattctaa agctgcaaaa cccaaagatc ctgtggaagt tgcacaacca 1320 tcagaagttt tgaggacagt gcagcccacg cagtctccat atcctaccca gctcttccgg 1380 actgttcatg tagtacagcc agtacaggct gtcccagagg gagaagcagc tagaaccagt 1440 accatgcagg atgaaacatt aaattcttcc gttcagagta ttaggactat acaggctcca 1500 acccaagttc cagtggttgt gtctcctagg aatcagcagt tgcatacagt aacactccaa 1560 acagtgccac tcacaacagt tatagccagc acagatccat cagcaggtac tggatctcag 1620 aagtttattt tacaagccat tccatcatca cagcccatga cagtactgaa agaaaatgtc 1680 atgctgcagt cacaaaaggc gggctctcct ccttcaattg tcttgggccc tgcccaggtt 1740 cagcaggtcc ttactagcaa tgttcagacc atttgcaatg gaaccgtcag tgtggcttcc 1800 tctccatcct tcagtgctac tgcacctgtg gtgacctttt ctcctcgcag ttcacagctg 1860 gttgctcacc cacctggcac tgtaatcact tcagttatca aaactcaaga aacaaaaact 1920 cttacacagg aagtagagaa aaaggaatct gaagatcatt tgaaagagaa cactgagaaa 1980 acggagcagc agccacagcc ttatgtgatg gtagtgtcca gttccaatgg atttacttct 2040 caggtagcta tgaaacaaaa cgaactgctg gaacccaact ctttttagtt aatataccaa 2100 agcttatgaa taattgtttg ttaattgaac attttcaatt atatgcagac tgactgattc 2160 taagataaat tctaaggagg tttctaattt tgtaattgtt aaaaatagag ttaattttga 2220 ctttgttaga tgagggagga aaactcaact gtttctcttt gttatctaaa tgtttcagaa 2280 ttcaatcgtg aaggaacagg cattttacac tatgaagaca ttcttttgag atttttattt 2340 cagttgctat atcataagca tttttaaagt ttcttttcta attttacatt gtattagatt 2400 ttctgattct tttgtaaata cagaacttaa atagaaggca acaggaaatt tatataggaa 2460 ctattttcat tccacttgtg taagttaagt cttgactctt tcaaatgcaa aaaacctatt 2520 ttatgctttg ttaaaattat ggtgtcactt agattgactt tagttgactg cactatataa 2580 tatagaacta tgaatatgta gaataacatg aaaaattgga ggtgctggtg gtatggctga 2640 ccctgtttca gaagcaggat agtataaaag catcagccta agaatggcac tcccactaac 2700 tagctatgta atcttgacct ctttgggctt tagttcctct cataaaagga agagatgtat 2760 tggattagac tagattatca ccactttctc ttctagttct aattttttta attctaatac 2820 ctatattttc aagttatgtc aattaaatca ttatcaggtt atttcctaat gtaagaatag 2880 ctaaaatgtt gcagagaaat aagtgaccca acaaaattta ttcatctgtt atgggtaaga 2940 tctgccataa attcttccta aataatttgt ttactaactc tttaggccac tgtgctttgc 3000 ggtccattag taaacttgtg ttgctaagtg ctaaacagaa tactgctatt ttgagagagt 3060 caagactctt tcttaagggc caagaaagca acttgagcct tgggctaatc tggctgagta 3120 gtcagttata aaagcataat tgctttatat tttggatcat tttttactgg gggcggactt 3180 ggggggggtt gcatacaaag ataacatata tatccaactt tctgaaatga aatgttttta 3240 gattactttt tcaactgtaa ataatgtaca tttaatgtca caagaaaaaa atgtcttctg 3300 caaattttct agtataacag aaatttttgt agatgaaaaa aatcattatg tttagaggtc 3360 taatgctatg ttttcatatt acagagtgaa tttgtattta aacaaaaatt taaattttgg 3420 aatcctctaa acatttttgt atctttaatt ggtttattat taaataaatc atataaaaat 3480 tctcaaaaaa aaaaaaaaa 3499 <210> 41 <211> 2212 <212> DNA <213> Homo sapiens <400> 41 gcccggctcc tgggagcagg tctcggcccc cgcttggggc cccggccgtg cggccggagg 60 gagcggccgg atggagcgga ggatgaaagc cggatacttg gaccagcaag tgccctacac 120 cttcagcagc aaatcgcccg gaaatgggag cttgcgcgaa gcgctgatcg gcccgctggg 180 gaagctcatg gacccgggct ccctgccgcc cctcgactct gaagatctct tccaggatct 240 aagtcacttc caggagacgt ggctcgctga agctcaggta ccagacagtg atgagcagtt 300 tgttcctgat ttccattcag aaaacctagc tttccacagc cccaccacca ggatcaagaa 360 ggagccccag agtccccgca cagacccggc cctgtcctgc agcaggaagc cgccactccc 420 ctaccaccat ggcgagcagt gcctttactc cagtgcctat gaccccccca gacaaatcgc 480 catcaagtcc cctgcccctg gtgcccttgg acagtcgccc ctacagccct ttccccgggc 540 agagcaacgg aatttcctga gatcctctgg cacctcccag ccccaccctg gccatgggta 600 cctcggggaa catagctccg tcttccagca gcccctggac atttgccact ccttcacatc 660 tcagggaggg ggccgggaac ccctcccagc cccctaccaa caccagctgt cggagccctg 720 cccaccctat ccccagcaga gctttaagca agaataccat gatcccctgt atgaacaggc 780 gggccagcca gccgtggacc agggtggggt caatgggcac aggtacccag gggcgggggt 840 ggtgatcaaa caggaacaga cggacttcgc ctacgactca gatgtcaccg ggtgcgcatc 900 aatgtacctc cacacagagg gcttctctgg gccctctcca ggtgacgggg ccatgggcta 960 tggctatgag aaacctctgc gaccattccc agatgatgtc tgcgttgtcc ctgagaaatt 1020 tgaaggagac atcaagcagg aaggggtcgg tgcatttcga gaggggccgc cctaccagcg 1080 ccggggtgcc ctgcagctgt ggcaatttct ggtggccttg ctggatgacc caacaaatgc 1140 ccatttcatt gcctggacgg gccggggaat ggagttcaag ctcattgagc ctgaggaggt 1200 cgccaggctc tggggcatcc agaagaaccg gccagccatg aattacgaca agctgagccg 1260 ctcgctccga tactattatg agaaaggcat catgcagaag gtggctggtg agcgttacgt 1320 gtacaagttt gtgtgtgagc ccgaggccct cttctctttg gccttcccgg acaatcagcg 1380 tccagctctc aaggctgagt ttgaccggcc tgtcagtgag gaggacacag tccctttgtc 1440 ccacttggat gagagccccg cctacctccc agagctggct ggccccgccc agccatttgg 1500 ccccaagggt ggctactctt actagccccc agcggctgtt ccccctgccg caggtgggtg 1560 ctgccctgtg tacatataaa tgaatctggt gttggggaaa ccttcatctg aaacccacag 1620 atgtctctgg ggcagatccc cactgtccta ccagttgccc tagcccagac tctgagctgc 1680 tcaccggagt cattgggaag gaaaagtgga gaaatggcaa gtctagagtc tcagaaactc 1740 ccctgggggt ttcacctggg ccctggagga attcagctca gcttcttcct aggtccaagc 1800 cccccacacc ttttccccaa ccacagagaa caagagtttg ttctgttctg ggggacagag 1860 aaggcgcttc ccaacttcat actggcagga gggtgaggag gttcactgag ctccccagat 1920 ctcccactgc ggggagacag aagcctggac tctgccccac gctgtggccc tggagggtac 1980 cggtttgtca gttcttggtg ctctgtgttc ccagaggcag gcggaggttg aagaaaggaa 2040 cctgggatga ggggtgctgg gtataagcag agagggatgg gttcctgctc caagggaccc 2100 tttgcctttc ttctgccctt tcctaggccc aggcctgggt ttgtacttcc acctccacca 2160 catctgccag accttaataa aggcccccac ttctcccaaa aaaaaaaaaa aa 2212 <210> 42 <211> 2667 <212> DNA <213> Homo sapiens <400> 42 tctgagaggc gaggccgggt gaggcggcga gggcggcccg acgggcgcgg gacgggacgg 60 ggcagcgagg gcgccgggag ccgcggcccg gaatcggggc gcttcgcccc gggcccccca 120 gcatgaagac cccggcggac acagggtttg ccttcccgga ttgggcctac aagccagagt 180 cgtcccctgg ctcaaggcag atccagctgt ggcactttat cctggagctg ctgcggaagg 240 aggagtacca gggcgtcatt gcctggcagg gggactacgg ggaattcgtc atcaaagacc 300 ctgatgaggt ggcccggctg tggggcgttc gcaagtgcaa gccccagatg aattacgaca 360 agctgagccg ggccctgcgc tattactata acaagcgcat tctgcacaag accaagggga 420 aacggttcac ctacaagttc aatttcaaca aactggtgct ggtcaattac ccattcattg 480 atgtggggtt ggctgggggt gcagtgcccc agagtgcccc gccagtgccg tcgggtggta 540 gccacttccg cttccctccc tcaacgccct ccgaggtgct gtcccccacc gaggaccccc 600 gctcaccacc agcctgctct tcatcttcat cttccctctt ctcggctgtg gtggcccgcc 660 gcctgggccg aggctcagtc agtgactgta gtgatggcac gtcagagctg gaggaaccgc 720 tgggagagga tccccgcgcc cgaccacccg gccctccgga tctgggtgcc ttccgagggc 780 ccccgctggc ccgcctgccc catgaccctg gtgtcttccg agtctatccc cggcctcggg 840 gtggccctga acccctcagc cccttccctg tgtcgcctct ggccggtcct ggatccctgc 900 tgccccctca gctctccccg gctctgccca tgacgcccac ccacctggcc tacactccct 960 cgcccacgct gagcccgatg taccccagtg gtggcggggg gcccagcggc tcagggggag 1020 gctcccactt ctccttcagc cctgaggaca tgaaacggta cctgcaggcc cacacccaaa 1080 gcgtctacaa ctaccacctc agcccccgcg ccttcctgca ctaccctggg ctggtggtgc 1140 cccagcccca gcgccctgac aagtgcccgc tgccgcccat ggcacccgag accccaccgg 1200 tcccctcctc ggcctcgtca tcctcttctt cttcttcctc cccattcaag tttaagctcc 1260 agcggccccc actcggacgc cggcagcggg cagctgggga gaaggccgta gccgctgctg 1320 acaagagcgg tggcagtgca ggcgggctgg ctgagggggc aggggcgcta gccccaccgc 1380 ccccgccacc acagatcaag gtggagccca tctcggaagg cgagtcggag gaggtagagg 1440 tgactgacat cagtgatgag gatgaggaag acggggaggt gttcaagacg ccccgtgccc 1500 cacctgcacc ccctaagcct gagcccggcg aggcacccgg ggcatcccag tgcatgcccc 1560 tcaagctacg ctttaagcgg cgctggagtg aagactgtcg cctcgaaggg ggtgggggcc 1620 ccgctggggg ctttgaggat gagggtgagg acaagaaggt gcgtggggag gggcctgggg 1680 aggctggggg gcccctcacc ccaaggcggg tgagctctga cctccagcat gccacggccc 1740 agctctccct ggagcaccga gactcctgag ggctgtgggc aggggacctg tgtgccccgc 1800 accccccatg cttcttttgc tgccttaagc cccctatgcc ctggaggtga gggcagctct 1860 cttgtctctt ccctgcctcc tcccttttcc ctccccacat tttgtataaa actttaattt 1920 ctttttttta aaaatggtgg gggtgggtgg gtgcccaggg ctaggggcta ttccctgtct 1980 ctgtgggttt ctaagctctg ggcaaattgg tggtaggggg agggaggggg aagttaaggg 2040 ggtcacctcc attctgggga atttatattt gaattgaggc tttggcctta acacccagga 2100 acttttctat tacaatcgct taggaagtaa agccttgtct ccctccctgt tctctgcctc 2160 ttgtacccct ctgacccacc cgctctgccc cactcccagc cctcctcagc cccagccctg 2220 cctgccctgc ccctccaggg ggccatgagt gcctaggttt ctcatacccc acaaggtcac 2280 agcaggggag ggagggacaa ttttataatg aaccaaaaat tccatgtgtt ggggggtggg 2340 gggcggagga gggtgagggg tgccgcccat gggccacaaa tctctacaag tgcctgctat 2400 ccctctccca ctccccaccc cagcaccggt ccaacccctt catccccagc tgctcctagg 2460 actggcccat gggcaggcgg gtggggggat gggaaggggg tgccctgaaa ccaaactgga 2520 agccccctct gcctcccagc tggggcctct ggggtggggt ggggggctgt ggtcaagcct 2580 tattctgtat tggggactga gggtgggggg agtagagggg ccgctggaga atgtattcaa 2640 aacaataaac tttggacctt tggaaaa 2667 <210> 43 <211> 1364 <212> DNA <213> Homo sapiens <400> 43 aaaatcagga acttgtgctg gccctgcaat gtcaagggag ggggctcacc cagggctcct 60 gtagctcagg gggcaggcct gagccctgca cccgccccac gaccgtccag cccctgacgg 120 gcaccccatc ctgaggggct ctgcattggc ccccaccgag gcaggggatc tgaccgactc 180 ggagcccggc tggatgttac aggcgtgcaa aatggaaggg tttcccctcg tcccccctcc 240 atcagaagac ctggtgccct atgacacgga tctataccaa cgccaaacgc acgagtatta 300 cccctatctc agcagtgatg gggagagcca tagcgaccat tactgggact tccaccccca 360 ccacgtgcac agcgagttcg agagcttcgc cgagaacaac ttcacggagc tccagagcgt 420 gcagcccccg cagctgcagc agctctaccg ccacatggag ctggagcaga tgcacgtcct 480 cgataccccc atggtgccac cccatcccag tcttggccac caggtctcct acctgccccg 540 gatgtgcctc cagtacccat ccctgtcccc agcccagccc agctcagatg aggaggaggg 600 cgagcggcag agccccccac tggaggtgtc tgacggcgag gcggatggcc tggagcccgg 660 gcctgggctc ctgcctgggg agacaggcag caagaagaag atccgcctgt accagttcct 720 gttggacctg ctccgcagcg gcgacatgaa ggacagcatc tggtgggtgg acaaggacaa 780 gggcaccttc cagttctcgt ccaagcacaa ggaggcgctg gcgcaccgct ggggcatcca 840 gaagggcaac cgcaagaaga tgacctacca gaagatggcg cgcgcgctgc gcaactacgg 900 caagacgggc gaggtcaaga aggtgaagaa gaagctcacc taccagttca gcggcgaagt 960 gctgggccgc gggggcctgg ccgagcggcg ccacccgccc cactgagccc gcagcccccg 1020 ccggccccgc caggcctccc cgctggccat agcattaagc cctcgcccgg cccggacaca 1080 gggaggacgc tcccggggcc cagaggcagg actgtggcgg gccgggctcc gtcacccgcc 1140 cctcccccca ctccaggccc cctccacatc ccgcttcgcc tccctccagg actccacccc 1200 ggctcccgac gccagctggg cgtcagaccc accggcaacc ttgcagagga cgacccgggg 1260 tactgccttg ggagtctcaa gtccgtatgt aaatcagatc tcccctctca cccctcccac 1320 ccattaacct cctcccaaaa aacaagtaaa gttattctca atcc 1364 <210> 44 <211> 3034 <212> DNA <213> Homo sapiens <400> 44 tttcttgtta aacaaacacc taatttattt cttggaggtt ttgttcagct gtcctaattt 60 atgactttac attccttctg gtgctaaact gctcaagtag cctcttgtat caagtgtgac 120 ctgattcctt aagaatttta cttaatgaga acctctaagc tagaaactct tgctaggtgt 180 ttcatgcacc ttattttctt taatcattac aacaactcta agattgggtt ctctccacct 240 tataaatgat gactgtttta gagaggttaa ggttgcttaa aattggtgag ttagtgaggg 300 gtagagccac gaatggattt ctggtcgctg cctccatcgt cagggcaagc ttttcccacg 360 actccagcgc ttccatttgt cagtccccag gctagaaagc cacagtgcta atttagtatt 420 tatcaagcgt ttgtagtgtc ctgggatctg gcacttcgat gagaaagctg tgacggcccc 480 aacttctaac agcgagtggt aaggaggacg agggacacag gagggaggag actctcccca 540 aagcttagca ccaacagaag tggtcccccg caggttgctc tgcgagcgcc acctcttccc 600 tccaaccgag gagaaagtgg cgcgcctttg aggagtccga ggtcccggcc caggcggcag 660 cttgggtcct ggcgggttcc ggacgggcgc ctcagggacc tggaagcaac cgcaccgaac 720 gcgacggaga gcggcgagac gactccagga ggcgcccgag ctacatcccc cggccacacc 780 aaacccgggt ttgctggcag acgcggctca cgacacccct tagggtcgca gcccctcccc 840 cggaagtgac gtgtagcgac tacggcgtct gggagggacc caggagcagt cggggggttt 900 gagagtggcg gcggccgcgg agggcctggc aggccccgcc gctgcaagga acgccccgaa 960 cgcgcgcgcc cggcgtgtag cggccccaag acccgcgccg ccgctgccgc gtgcgggggc 1020 ggggagggcg gggcgccagg agccgcggcg gcgggagatg cgggcggctg cgggcacccg 1080 gcgggctcgg cttggccgcc gccgccttct acggctccgc cgcgggggtc gcagcggctg 1140 ccgcgccgtc ctcgagtttc cagcgtgagg aggaggctga gggcggagag gcgcatcgtg 1200 ttcgaggcgg agaccgaggg ggagccccgc gcgcggcgtc gctcattgct atggacagtg 1260 ctatcaccct gtggcagttc cttcttcagc tcctgcagaa gcctcagaac aagcacatga 1320 tctgttggac ctctaatgat gggcagttta agcttttgca ggcagaagag gtggctcgtc 1380 tctgggggat tcgcaagaac aagcctaaca tgaattatga caaactcagc cgagccctca 1440 gatactatta tgtaaagaat atcatcaaaa aagtgaatgg tcagaagttt gtgtacaagt 1500 ttgtctctta tccagagatt ttgaacatgg atccaatgac agtgggcagg attgagggtg 1560 actgtgaaag tttaaacttc agtgaagtca gcagcagttc caaagatgtg gagaatggag 1620 ggaaagataa accacctcag cctggtgcca agacctctag ccgcaatgac tacatacact 1680 ctggcttata ttcttcattt actctcaact ctttgaactc ctccaatgta aagcttttca 1740 aattgataaa gactgagaat ccagccgaga aactggcaga gaaaaaatct cctcaggagc 1800 ccacaccatc tgtcatcaaa tttgtcacga caccttccaa aaagccaccg gttgaacctg 1860 ttgctgccac catttcaatt ggcccaagta tttctccatc ttcagaagaa actatccaag 1920 ctttggagac attggtttcc ccaaaactgc cttccctgga agccccaacc tctgcctcta 1980 acgtaatgac tgcttttgcc accacaccac ccatttcgtc cataccccct ttgcaggaac 2040 ctcccagaac accttcacca ccactgagtt ctcacccaga catcgacaca gacattgatt 2100 cagtggcttc tcagccaatg gaacttccag agaatttgtc actggagcct aaagaccagg 2160 attcagtctt gctagaaaag gacaaagtaa ataattcatc aagatccaag aaacccaaag 2220 ggttagaact ggcacccacc cttgtgatca cgagcagtga tccaagccca ctgggaatac 2280 tgagcccatc tctccctaca gcttctctta caccagcatt tttttcacag acacccatca 2340 tactgactcc aagccccttg ctctccagta tccacttctg gagtactctc agtcctgttg 2400 ctcccctaag tccagccaga ctgcaaggtg ctaacacact tttccagttt ccttctgtac 2460 tgaacagtca tgggccattc actctgtctg ggctggatgg accttccacc cctggcccat 2520 tttccccaga cctacagaag acataaccta tgcacttgtg gaatgagaga accgaggaac 2580 gaagaaacag acattcaaca tgattgcatt tgaagtgagc aattgatagt tctacaatgc 2640 tgataataga ctattgtgat ttttgccatt ccccattgaa aacatctttt taggattctc 2700 tttgaatagg actcaagttg gactatatgt ataaaaatgc cttaattgga gtctaaactc 2760 cacctccctc tgtcttttcc ttttcttttt ctttccttcc ttccttttct tttctccttt 2820 aaaaatattt tgagctttgt gctgaagaag tttttggtgg gctttagtga ctgtgctttg 2880 caaaagcaat taagaacaaa gttactcctt ctggctattg ggaccctttg gccaggaaaa 2940 attatgctta gaatctatta tttaaagaaa tatttgtgaa atgaaaaaaa aaaaaaaaaa 3000 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 3034 <210> 45 <211> 3077 <212> DNA <213> Homo sapiens <400> 45 tttcttgtta aacaaacacc taatttattt cttggaggtt ttgttcagct gtcctaattt 60 atgactttac attccttctg gtgctaaact gctcaagtag cctcttgtat caagtgtgac 120 ctgattcctt aagaatttta cttaatgaga acctctaagc tagaaactct tgctaggtgt 180 ttcatgcacc ttattttctt taatcattac aacaactcta agattgggtt ctctccacct 240 tataaatgat gactgtttta gagaggttaa ggttgcttaa aattggtgag ttagtgaggg 300 gtagagccac gaatggattt ctggtcgctg cctccatcgt cagggcaagc ttttcccacg 360 actccagcgc ttccatttgt cagtccccag gctagaaagc cacagtgcta atttagtatt 420 tatcaagcgt ttgtagtgtc ctgggatctg gcacttcgat gagaaagctg tgacggcccc 480 aacttctaac agcgagtggt aaggaggacg agggacacag gagggaggag actctcccca 540 aagcttagca ccaacagaag tggtcccccg caggttgctc tgcgagcgcc acctcttccc 600 tccaaccgag gagaaagtgg cgcgcctttg aggagtccga ggtcccggcc caggcggcag 660 cttgggtcct ggcgggttcc ggacgggcgc ctcagggacc tggaagcaac cgcaccgaac 720 gcgacggaga gcggcgagac gactccagga ggcgcccgag ctacatcccc cggccacacc 780 aaacccgggt ttgctggcag acgcggctca cgacacccct tagggtcgca gcccctcccc 840 cggaagtgac gtgtagcgac tacggcgtct gggagggacc caggagcagt cggggggttt 900 gagagtggcg gcggccgcgg agggcctggc aggccccgcc gctgcaagga acgccccgaa 960 cgcgcgcgcc cggcgtgtag cggccccaag acccgcgccg ccgctgccgc gtgcgggggc 1020 ggggagggcg gggcgccagg agccgcggcg gcgggagatg cgggcggctg cgggcacccg 1080 gcgggctcgg cttggccgcc gccgccttct acggctccgc cgcgggggtc gcagcggctg 1140 ccgcgccgtc ctcgagtttc cagcgtgagg aggaggctga gggcggagag gcgcatcgtg 1200 ttcgaggcgg agaccgaggg ggagccccgc gcgcggcgtc gctcattgct atggacagtg 1260 ctatcaccct gtggcagttc cttcttcagc tcctgcagaa gcctcagaac aagcacatga 1320 tctgttggac ctctaatgat gggcagttta agcttttgca ggcagaagag gtggctcgtc 1380 tctgggggat tcgcaagaac aagcctaaca tgaattatga caaactcagc cgagccctca 1440 gatactatta tgtaaagaat atcatcaaaa aagtgaatgg tcagaagttt gtgtacaagt 1500 ttgtctctta tccagagatt ttgaacatgg atccaatgac agtgggcagg attgagggtg 1560 actgtgaaag tttaaacttc agtgaagtca gcagcagttc caaagatgtg gagaatggag 1620 ggaaagataa accacctcag cctggtgcca agacctctag ccgcaatgac tacatacact 1680 ctggcttata ttcttcattt actctcaact ctttgaactc ctccaatgta aagcttttca 1740 aattgataaa gactgagaat ccagccgaga aactggcaga gaaaaaatct cctcaggagc 1800 ccacaccatc tgtcatcaaa tttgtcacga caccttccaa aaagccaccg gttgaacctg 1860 ttgctgccac catttcaatt ggcccaagta tttctccatc ttcagaagaa actatccaag 1920 ctttggagac attggtttcc ccaaaactgc cttccctgga agccccaacc tctgcctcta 1980 acgtaatgac tgcttttgcc accacaccac ccatttcgtc cataccccct ttgcaggaac 2040 ctcccagaac accttcacca ccactgagtt ctcacccaga catcgacaca gacattgatt 2100 cagtggcttc tcagccaatg gaacttccag agaatttgtc actggagcct aaagaccagg 2160 attcagtctt gctagaaaag gacaaagtaa ataattcatc aagatccaag aaacccaaag 2220 ggttagaact ggcacccacc cttgtgatca cgagcagtga tccaagccca ctgggaatac 2280 tgagcccatc tctccctaca gcttctctta caccagcatt tttttcacag gtagcttgct 2340 cgctctttat ggtgtcacca ttgctttcat ttatttgccc ttttaagcaa atccagaatt 2400 tatacactca agtttgcttt ctgttactta ggtttgtctt agaaaggtta tgtgtgactg 2460 tcatgtgaaa gttaccccat ttctcatctt aattaggatt gctaaaatag aaagtttgga 2520 gtattttctt aaaaaattca ttgttctaca agtaaataaa tattttgatt tttctatttc 2580 ctcctaaaga aagtacacac actctctcgc tctctctcgg tcttataaaa ctcgttggtg 2640 tcttataaaa caaacagtga taatctcaag ttagaaaaca gtaggtcctg agaaccataa 2700 gaaaaatgac tggtgtgatg ttgagtaaca agttggtaca gttactttag ctatttatta 2760 acttgctcat ctcatagaac attttagtag atttttcaca cacctcatta ttaaaaaaaa 2820 acaaacatgc tggtgtcttg gttacccatt attcctctgt acctgaattc aggttggttt 2880 ttctatttgg aaaagacttt ataaatgttg gcttaaaaag aggttgagca ccagaatctc 2940 agaatttacc accaaagaac tcatccatgt aaccaaaaac cacttgtacc cccaaaaact 3000 attgaaataa aaatttaaaa aattttaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3060 aaaaaaaaaa aaaaaaa 3077 <210> 46 <211> 1443 <212> DNA <213> Homo sapiens <400> 46 ggggggggtg gatgaggagg agccggagac gccgcggagg agaccggacc gaagacggac 60 cgtgccggga agagcaggcg ggtgaaaatg aaagccggct gtagcatcgt ggaaaagcca 120 gaaggaggtg gagggtatca gtttcctgac tgggcctaca aaacagagtc atccccaggc 180 tcccggcaga tccagctgtg gcacttcatc ctggagctgc tgcagaagga agagttccgc 240 catgtcatcg cctggcagca gggagagtac ggggaatttg tcatcaagga tccagatgag 300 gtggcccgcc tctggggccg caggaaatgc aaaccacaga tgaattatga caagctgagc 360 cgggccctca gatactatta caacaagagg atccttcata aaacaaaagg gaaaagattt 420 acctataaat ttaacttcaa caagctggtg atgcccaact acccattcat caacattcgg 480 tcaagtggta agatacaaac tcttttggta gggaattaat tttgaattga aaagaatttt 540 taaaaatcca aatctaagac atggcatgtt taggaagatt ttagaaacac taaaataatg 600 tgatcctttg gattgcctca atgttcttac tcaagtcatc tcacttataa ggagagttat 660 aggctattca gtatcaagat agatttcttt ggtttatttg gttggttccc ttttctgcat 720 attgtttgta atctcctaga tactattacg ctatcttgtt tgggaatgat gtttcatagg 780 tttgtgatga tctttacgtt caggactcag ttttaacacc cagcccagtg gttctttcat 840 agatgggaac ctgtttctac aaacacttcc gattttctgt gaaactacca agctctccct 900 tatcaagtga atatcatcaa aaccacagca tccttgatca gagaaggggg aggttcacat 960 gtttgcagtg aaaagcagtg tctttgatct gcaacagcaa atcctcagag aaaaagattc 1020 tggggttact tgaccttctc tcctgttaag tgcagtaggg cttcccctct tgactttcct 1080 ggttatagct ttccatcaca gctccccaca ttctctcttg atgttgaaag cagtctctca 1140 aaagactttg ttgttgtgtg gttttttgtt tgtgattttt ttccttatgc aaatcatact 1200 cctgcccaag aaaatacagt agttcccctt atctgagcag tatatgttct aagaccccta 1260 gtagattcgc aaaccacaga tagtaccaaa ctccattcat atatatgatg ttttttcttc 1320 ccttaacccc actcatatgt atctgtgata acgtttaatt tataaattag gcacagtaag 1380 agattaatga caataataaa atagaaaaat tataaaaaaa aaaaaaaaaa aaaaaaaaaa 1440 aaa 1443 <210> 47 <211> 229 <212> DNA <213> Homo sapiens <400> 47 cccactagtt acccacccca aactggatcc tacagccaag ctccaagtca atatagccaa 60 cagagcagca gctacgggca gcagaatccg tatcagatcc tgggcccgac cagcagtcgc 120 ctagccaacc ctggaagcgg gcagatccag ctgtggcaat tcctcctgga gctgctctcc 180 gacagcgcca acgccagctg tatcacctgg gaggggacca acggggagt 229 <210> 48 <211> 2319 <212> DNA <213> Homo sapiens <400> 48 cacaaggcta caggtgtctt tatttccact gcacgctggt gctgggagcg cctgccttct 60 cttgccttga aagcctcctc tttggaccta gccaccgctg ccctcacggt aatgttggac 120 tcggtgacac acagcacctt cctgcctaat gcatccttct gcgatcccct gatgtcgtgg 180 actgatctgt tcagcaatga agagtactac cctgcctttg agcatcagac agcctgtgac 240 tcatactgga catcagtcca ccctgaatac tggactaagc gccatgtgtg ggagtggctc 300 cagttctgct gcgaccagta caagttggac accaattgca tctccttctg caacttcaac 360 atcagtggcc tgcagctgtg cagcatgaca caggaggagt tcgtcgaggc agctggcctc 420 tgcggcgagt acctgtactt catcctccag aacatccgca cacaaggtta ctcctttttt 480 aatgacgctg aagaaagcaa ggccaccatc aaagactatg ctgattccaa ctgcttgaaa 540 acaagtggca tcaaaagtca agactgtcac agtcatagta gaacaagcct ccaaagttct 600 catctatggg aatttgtacg agacctgctt ctatctcctg aagaaaactg tggcattctg 660 gaatgggaag atagggaaca aggaattttt cgggtggtta aatcggaagc cctggcaaag 720 atgtggggac aaaggaagaa aaatgacaga atgacatatg aaaagttgag cagagccctg 780 agatactact ataaaacagg aattttggag cgggttgacc gaaggttagt gtacaaattt 840 ggaaaaaatg cacacgggtg gcaggaagac aagctatgat ctgctccagg catcaagctc 900 attttatgga tttctgtctt ttaaaacaat cagattgcaa tagacattcg aaaggcttca 960 ttttcttctc tttttttttt aacctgcaaa catgctgata aaatttctcc acatctcagc 1020 ttacatttgg attcagagtt gttgtctacg gagggtgaga gcagaaactc ttaagaaatc 1080 ctttcttctc cctaagggga tgaggggatg atcttttgtg gtgtcttgat caaactttat 1140 tttcctagag ttgtggaatg acaacagccc atgccattga tgctgatcag agaaaaacta 1200 ttcaattctg ccattagaga cacatccaat gctcccatcc caaaggttca aaagttttca 1260 aataactgtg gcagctcacc aaaggtgggg gaaagcatga ttagtttgca ggttatggta 1320 ggagagggtg agatataaga catacatact ttagatttta aattattaaa gtcaaaaatc 1380 catagaaaag tatccctttt tttttttttt gagacgggtt ctcactatgt tgcccagggc 1440 tggtcttgaa ctcctatgct caagtgatcc tcccacctcg gcctcccaaa gtactgtgat 1500 tacaagcgtg agccacggca cctgggcaga aaagtatctt aattaatgaa agagctaagc 1560 catcaagctg ggacttaatt ggatttaaca taggttcaca gaaagtttcc taaccagagc 1620 atctttttga ccactcagca aaacttccac agacatcctt ctggacttaa acacttaaca 1680 ttaaccacat tattaattgt tgctgagttt attccccctt ctaactgatg gctggcatct 1740 gatatgcaga gttagtcaac agacactggc atcaattaca aaatcactgc tgtttctgtg 1800 attcaagctg tcaacacaat aaaatcgaaa ttcattgatt ccatctctgg tccagatgtt 1860 aaacgtttat aaaaccggaa atgtcctaac aactctgtaa tggcaaatta aattgtgtgt 1920 cttttttgtt ttgtctttct acctgatgtg tattcaagtg ctataacacg tatttccttg 1980 acaaaaatag tgacagtgaa ttcacactaa taaatgttca taggttaaag tctgcactga 2040 cattttctca tcaatcactg gtatgtaagt tatcagtgac tgacagctag gtggactgcc 2100 cctaggactt ctgtttcacc agagcaggaa tcaagtggtg aggcactgaa tcgctgtaca 2160 ggctgaagac ctccttatta gagttgaact tcaaagtaac ttgttttaaa aaatgtgaat 2220 tactgtaaaa taatctattt tggattcatg tgttttccag gtggatatag tttgtaaaca 2280 atgtgaataa agtatttaac atgtaaaaaa aaaaaaaaa 2319 <210> 49 <211> 3617 <212> DNA <213> Homo sapiens <400> 49 acccgtggtg ccccatccct ataggagctg gtgagattgc agcctgctgc ctcccctcca 60 tcagccacag ctattggatt tcccacccag aatctttagg taaatgagat catgattctg 120 gaaggaggtg gtgtaatgaa tctcaacccc ggcaacaacc tccttcacca gccgccagcc 180 tggacagaca gctactccac gtgcaatgtt tccagtgggt tttttggagg ccagtggcat 240 gaaattcatc ctcagtactg gaccaagtac caggtgtggg agtggctcca gcacctcctg 300 gacaccaacc agctggatgc caattgtatc cctttccaag agttcgacat caacggcgag 360 cacctctgca gcatgagttt gcaggagttc acccgggcgg cagggacggc ggggcagctc 420 ctctacagca acttgcagca tctgaagtgg aacggccagt gcagtagtga cctgttccag 480 tccacacaca atgtcattgt caagactgaa caaactgagc cttccatcat gaacacctgg 540 aaagacgaga actatttata tgacaccaac tatggtagca cagtagattt gttggacagc 600 aaaactttct gccgggctca gatctccatg acaaccacca gtcaccttcc tgttgcagag 660 tcacctgata tgaaaaagga gcaagacccc cctgccaagt gccacaccaa aaagcacaac 720 ccgagaggga ctcacttatg ggaattcatc cgcgacatcc tcttgaaccc agacaagaac 780 ccaggattaa taaaatggga agaccgatct gagggcgtct tcaggttctt gaaatcagag 840 gcagtggctc agctatgggg taaaaagaag aacaacagca gcatgaccta tgaaaagctc 900 agccgagcta tgagatatta ctacaaaaga gaaattctgg agcgtgtgga tggacgaaga 960 ctggtatata aatttgggaa gaatgcccga ggatggagag aaaatgaaaa ctgaagctgc 1020 caatactttg gacacaaacc aaaacacaca ccaaataatc agaaacaaag aactcctgga 1080 cgtaaatatt tcaaagacta cttttctctg atatttatgt accatgaggg gaacaagaaa 1140 ctacttctaa cgggaagaag aaacactaca gtcgattaaa aaaattattt tgttacttcg 1200 aagtatgtcc tatatgggga aaaaacgtac acagttttct gtgaaatatg atgctgtatg 1260 tggttgtgat tttttttcac ctctattgtg aattcttttt cactgcaaga gtaacaggat 1320 ttgtagcctt gtgcttcttg ctaagagaaa gaaaaacaaa atcagagggc attaaatgtt 1380 ttgtatgtga catgatttag aaaaaggtga tgcatcctcc tcacataagc atccatatgg 1440 cttcgtcaag ggaggtgaac attgttgctg agttaaattc cagggtctca gatggttagg 1500 acaaagtgga tggatgccgg gaagtttaac ctgagcctta ggatccaatg agtggagaat 1560 ggggacttcc aaaacccaag gttggctata atctctgcat aaccacatga cttggaatgc 1620 ttaaatcagc aagaagaata atggtggggt ctttatactc attcaggaat ggtttatctg 1680 atgccagggc tgtcttcctt tctccccttt ggatggttgg tgaaatactt taattgccct 1740 gtctgctcac ttctagctat ttaagagaga acccagcttg gttctttttt gctccaagtg 1800 cttaaaaata agttggaaaa aggagacggt ggtgtggaaa tggctgaaga gtttgctctt 1860 gtatccctat agtccaaggt ttctcaatct gcacaattga catttttggc cggagtgttc 1920 tttgtggtga gggctttcct gtgcattgta agatgttcag cagtatccac tcatggtctc 1980 taaccacttg acaccagaaa ccccccagct gtgataacgc aaaatgtctc tagacatcac 2040 caaatgttcc ctgggggtgg caaatttgcc cttgattgag aaccaccagt ttagctagtc 2100 aatatgagga tggtggttta ttctcagaag aaaaagatat gtaaggtctt ttagctcctt 2160 agagtgaagc aaaagcaaga cttcaacctc aacctatctt tatgttttaa atgttaggga 2220 caataagttg aaatagctag aggagcttct tttcagaacc ccagatgaga gccaatgtca 2280 gataaagtaa gcatagtaat gtagcaggaa ctacaataga agacattttc actggaatta 2340 caaagcagaa ttaaaattat attgtagaag gaaacaccaa gaaaagaatt tccagggaaa 2400 atcctctttg caggtattaa ttcttataat tttttgtctt ttggattatc tgtttactgt 2460 ctcatctgaa ctgatcccag gtgaacggtt tattgcctag atttgtactc agaggaattt 2520 tttttgtttt gttttgtctt ttaagaaagg aaagaaagga tgaaaaaaat aaacagaaaa 2580 ctcagctcag gcacaattgt caccaaggag ttaaaagctt cttcttcaat agaggaattg 2640 ttctgggggt cctggagact taccattgag ccatgcaatc tgggaagcac aggaataagt 2700 agacactttg aaaatggatt tgaatgttct catccctttt gcagcttttc tttttggctc 2760 tctcatgtcc ttggcttgct cctctattct acctctcttt ctccagcaat aatatgcaaa 2820 tgaagacatg tatccataag aaggagtgct cttcatcaac taatagagca cctaccacag 2880 tgtcatacct ggtagaggtg agcaattcat attcaaaggt tgcaaagtgt ttgtaatata 2940 ttcatgaggc tggaagtaag aagaattaaa aatttgtcct aattacaatg agaaccattc 3000 taggtagtga tcttggagca cacatgaata actttctgaa ggtgcaacca aatccatttt 3060 tatttctgcc tggcttggtc acctctgtaa aggtttaact tagtgttgtc aagtaacagt 3120 tactgaaaga gctgagaaaa agaacaatga acagcaacga tcttgactgt gcaactcaga 3180 cattcctgca gaaaagacat atgttgcttt acaagaaggc caaagaacta tggggccttc 3240 ccagcatttg actgttcatt gcatagaatg aattaaatat ccagttactt gaatgggtat 3300 aacgcatgaa tatttgtgtg tctgtgtgtg tgtctgagtt gtgtgatttt attaggggca 3360 tctgccaatt ctctcactgt ggttccttct ctgactttgc ctgttcatca tctaaggagg 3420 ctagatcctt cgctgacttc accattcctc aaacctgtaa gtttctcact tcttccaaat 3480 tggctttggc tctttctgca acctttccat tcaagagcaa tctttgctaa ggagtaagtg 3540 aatgtgaaga gtaccaacta caacaattct acagataatt agtggattgt gttgtttgtt 3600 gagagtgaag gtttctt 3617 <210> 50 <211> 1894 <212> DNA <213> Homo sapiens <400> 50 gtctgacttc ctcccagcac attcctgcac tctgccgtgt ccacactgcc ccacagaccc 60 agtcctccaa gcctgctgcc agctccctgc aagcccctca ggttgggcct tgccacggtg 120 ccagcaggca gccctgggct gggggtaggg gactccctac aggcacgcag ccctgagacc 180 tcagagggcc accccttgag ggtggccagg cccccagtgg ccaacctgag tgctgcctct 240 gccaccagcc ctgctggccc ctggttccgc tggcccccca gatgcctggc tgagacacgc 300 cagtggcctc agctgcccac acctcttccc ggcccctgaa gttggcactg cagcagacag 360 ctccctgggc accaggcagc taacagacac agccgccagc ccaaacagca gcggcatggg 420 cagcgccagc ccgggtctga gcagcgtatc ccccagccac ctcctgctgc cccccgacac 480 ggtgtcgcgg acaggcttgg agaaggcggc agcgggggca gtgggtctcg agagacggga 540 ctggagtccc agtccacccg ccacgcccga gcagggcctg tccgccttct acctctccta 600 ctttgacatg ctgtaccctg aggacagcag ctgggcagcc aaggcccctg gggccagcag 660 tcgggaggag ccacctgagg agcctgagca gtgcccggtc attgacagcc aagccccagc 720 gggcagcctg gacttggtgc ccggcgggct gaccttggag gagcactcgc tggagcaggt 780 gcagtccatg gtggtgggcg aagtgctcaa ggacatcgag acggcctgca agctgctcaa 840 catcaccgca gatcccatgg actggagccc cagcaatgtg cagaagtggc tcctgtggac 900 agagcaccaa taccggctgc cccccatggg caaggccttc caggagctgg cgggcaagga 960 gctgtgcgcc atgtcggagg agcagttccg ccagcgctcg cccctgggtg gggatgtgct 1020 gcacgcccac ctggacatct ggaagtcagc ggcctggatg aaagagcgga cttcacctgg 1080 ggcgattcac tactgtgcct cgaccagtga ggagagctgg accgacagcg aggtggactc 1140 atcatgctcc gggcagccca tccacctgtg gcagttcctc aaggagttgc tactcaagcc 1200 ccacagctat ggccgcttca ttaggtggct caacaaggag aagggcatct tcaaaattga 1260 ggactcagcc caggtggccc ggctgtgggg catccgcaag aaccgtcccg ccatgaacta 1320 cgacaagctg agccgctcca tccgccagta ttacaagaag ggcatcatcc ggaagccaga 1380 catctcccag cgcctcgtct accagttcgt gcaccccatc tgagtgcctg gcccagggcc 1440 tgaaacccgc cctcaggggc ctctctcctg cctgccctgc ctcagccagg ccctgagatg 1500 ggggaaaacg ggcagtctgc tctgctgctc tgaccttcca gagcccaagg tcagggaggg 1560 gcaaccaact gccccagggg gatatgggtc ctctggggcc ttcgggacca tggggcaggg 1620 gtgcttcctc ctcaggccca gctgctcccc tggaggacag agggagacag ggctgctccc 1680 caacacctgc ctctgacccc agcatttcca gagcagagcc tacagaaggg cagtgactcg 1740 acaaaggcca caggcagtcc aggcctctct ctgctccatc cccctgcctc ccattctgca 1800 ccacacctgg catggtgcag ggagacatct gcacccctga gttgggcagc caggagtgcc 1860 cccgggaatg gataataaag atactagaga actg 1894 <210> 51 <211> 2180 <212> DNA <213> Homo sapiens <400> 51 gggcggaaaa gcctgtttac acagactgca caccgcctgg ggaataatgc agtaaaggaa 60 gtgagccggc tcggcctgac tgctccaact tcctgctctc acacacacca gaggggaaaa 120 aaaaagagga gcgagagaaa gaaaaaaagg gggaaaaatc aggatctcat tacaagagcc 180 acagaccgtc tgcagacgcc tgtcagcatg gaaagtcggg ggctttcgcc cgggtcctcc 240 tagaaattcc ccccgaagaa gactccccca catctgggta tggagagtgc aatcacgctg 300 tggcagttcc tgttgcagtt gctgctggat cagaaacatg agcatttgat ctgctggacc 360 tcgaacgatg gtgaattcaa gctcctcaaa gcagaagaag tggccaagct gtggggactc 420 cgaaaaaaca aaacaaatat gaactatgat aagctgagca gagccctgcg atactattat 480 gacaagaaca tcatcaagaa ggtgatcggg cagaagtttg tgtacaagtt tgtctctttc 540 ccggagatcc tgaagatgga tcctcacgcg gtggagatca gccgggagag ccttctgctg 600 caggacagcg actgcaaggc gtctccggag ggccgcgagg cccacaaaca cggcctggcc 660 gccctcagaa gcacgagccg caacgaatac atccactcag gcctgtactc gtccttcacc 720 attaattccc tgcagaaccc accagacgcc ttcaaggcca tcaagacgga gaagctggag 780 gagccgcccg aagacagccc ccccgtggaa gaagtcagga ctgtgatcag gtttgtgacc 840 aataaaaccg acaagcacgt caccaggccg gtggtgtccc tgccttccac gtcagaggct 900 gcggcggcgt ccgccttcct ggcctcgtcc gtctcggcca agatctcctc tttaatgttg 960 ccaaacgctg ccagtatttc atccgcctca cccttctcat ctcggtcccc gtccctgtcc 1020 cccaactcac ccctcccttc tgaacacaga agcctcttcc tggaggccgc ctgccatgac 1080 tccgattccc tggagccctt gaacctgtca tcgggctcca agaccaagtc tccatctctt 1140 cccccaaagg ccaaaaaacc caaaggcttg gaaatctcag cgcccccgct ggtgctctcc 1200 ggcaccgaca tcggctccat cgccctcaac agcccagccc tcccctcggg atccctcacc 1260 ccagccttct tcaccgcaca gacaccaaat ggattgcttc tgactccgag tccactgctc 1320 tccagcatac atttctggag cagccttagt ccagttgctc cgctgagtcc tgccaggctg 1380 caagggccaa gcacgctgtt ccagttcccc acactgctta atggccacat gccagtgcca 1440 atccccagtc tggacagagc tgcttctcca gtactgcttt cttcaaactc tcagaaatcc 1500 tgatgacgtc tggccacaat taaggactca ttaactgatg aaacaaattt gtccccacgg 1560 gctagtttac ctgtgtcgtg agaaggacat tgtgaaactc ttgttaattt ggtttgcact 1620 tttcataaca tggatagtct agatttatgt tagcatttta aaaactgttt ttgatatatt 1680 caagtatata tgaaaatctg tttggcatta agtgaatttt aatgtttttg tttttatatc 1740 cttttagctc ttaagtgttg aacactgttg acagtgaaga acttttctta atggttttca 1800 gtataactaa taaggatgtg aagctttttt ctctttagtt ctgagtatgc taaactgtgt 1860 gcttatatag actataacca gttgtgcctt cctttgcatt taatgtaaat gaatgattta 1920 tatatttttt agtattaaga ggaaatgttt gaaagatgaa aattagtatc aaacagctct 1980 ctagtagaat ttcattattt ttcaccagtg ggcaatatga aagcatatat cacgttttgt 2040 tttactttca attgtataag aattgcctta gaacctcttt tgaactgaaa ttcagtaaat 2100 gtccaagtaa tgtttttata ataaactaag ccatatttag acaataaaca tcgaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa 2180 <210> 52 <211> 3171 <212> DNA <213> Homo sapiens <400> 52 gttgccagct gcggcggccg ccacagccac agccgccgcc gccgccgccg ccgcccctgc 60 ccctgccgcc cctgcccctg ccgttaggtg gtggggtttc tcagcccggc ggcgggaggc 120 gggccggcct cggcttcctg tcggaggacg cgcaaggatc cgggcgtcgg agtgtgtgcg 180 agtgcgtgag tgtgtgtcgg tcgcacggcg tgtgtctccg gccgcgggtt ccgcctcctc 240 ccctgccgcc gctgctcacg gtgtaagtca atgtgaagca gcagctccag ccccgggata 300 aacatggcga cgtctctgca tgagggaccc acgaaccagc tggatctgct catccgggcc 360 gtggaagcat cagttcacag cagtaatgca cactgtacag ataagacaat tgaagctgct 420 gaagccctgc ttcatatgga atctcctacc tgcttgaggg attcaagaag tcctgtggaa 480 gtgtttgttc ctccttgtgt atcaactcca gaattcatcc atgctgctat gaggccagat 540 gtcattacag aaactgtagt ggaggtgtca actgaagagt ctgaacccat ggatacctct 600 cctattccaa catcaccaga tagccatgaa ccaatgaaaa agaaaaaagt tggccgtaaa 660 ccaaagaccc agcaatcacc aatttccaat gggtctcctg agttaggtat aaagaagaaa 720 ccaagagaag gaaaaggaaa cacaacctat ttgtgggagt ttcttttaga tctacttcaa 780 gataaaaata cttgtcccag gtatattaaa tggactcaga gagaaaaagg catattcaag 840 ctggtggatt caaaggctgt ctctaagctt tggggaaagc ataagaacaa accagacatg 900 aactatgaaa ccatgggacg agctttgaga tactactacc aaaggggaat tcttgcaaag 960 gttgaaggac agaggcttgt atatcagttc aaggatatgc cgaaaaacat agtggtcata 1020 gatgatgaca aaagtgaaac ctgtaatgaa gatttagcag gaactactga tgaaaaatca 1080 ttagaacgag tgtcactgtc tgcagaaagt ctcctgaaag cagcatcctc tgttcgcagt 1140 ggaaaaaatt catcccctat aaactgctcc agagcagaga agggtgtagc tagagttgtg 1200 aatatcactt cccctgggca cgatgcttca tccaggtctc ctactaccac tgcatctgtg 1260 tcagcaacag cagctccaag gacagttcgt gtggcaatgc aggtacctgt tgtaatgaca 1320 tcattgggtc agaaaatttc aactgtggca gttcagtcag ttaatgcagg tgcaccatta 1380 ataaccagca ctagtccaac aacagcgacc tctccaaagg tagtcattca gacaatccct 1440 actgtgatgc cagcttctac tgaaaatgga gacaaaatca ccatgcagcc tgccaaaatt 1500 attaccatcc cagctacaca gcttgcacag tgtcaactgc agacaaagtc aaatctgact 1560 ggatcaggaa gcattaacat tgttggaacc ccattggctg tgagagcact tacccctgtt 1620 tcaatagccc atggtacacc tgtaatgaga ctatcaatgc ctactcagca ggcatctggc 1680 cagactcctc ctcgagttat cagtgcagtc ataaaggggc cagaggttaa atcggaagca 1740 gtggcaaaaa agcaagaaca tgatgtgaaa actttgcagc tagtagaaga aaaaccagca 1800 gatggaaata agacagtgac ccacgtagtg gttgtcagtg cgccttcagc tattgccctt 1860 cctgtaacta tgaaaacaga aggactagtg acatgtgaga aataaaatag cagctccacc 1920 atggacttca ggctgttagt ggcagtactg acataaacat ttgcaaggga agtcatcaag 1980 aaaagtcaaa gaagacttta aaacattttt aatgcatata caaaaacaat cagacttact 2040 ggaaataaat tacctatccc atgtttcagt gggaaatgaa ctacatattg agatgctgac 2100 agaaaactgc ctcttacagt aggaaacaac tgaacccatc aataagaaaa aggatcgaaa 2160 gggaccaagc agctcactac gatatcaagt tacactaaga cttggaacac taacattctg 2220 taagaggtta tatagttttc agtgggaggg gttgggatgg gtaatctcat tgttacatat 2280 agcaattttt gatgcatttt atatgcatac cagcaattat tactgtgttc gcacagttct 2340 cacttaactg gtgctatgtg aagactctgc taatataggt attttagaat gtgaattgaa 2400 gaatggatcc caaaaacttc agaaagagga tagcaaaaaa agatctagtg cgattttata 2460 tatatatata tatatatata catacatata tatatatcat atagcttaag ctgatttaaa 2520 acaaaggcct tagactaatt ttcgattttc tttcttgaaa taagctaatg gcttgtttgt 2580 gtaaagcttt tttattaaaa gaaaaatttt aaaaatcttg tacctagcac agtattgtta 2640 tagaatatac atgtaacatt ttatatggta gtttaagtct gtcagtttct taattgtgga 2700 caaattaaca gttggctctg gccttttgct gtaacatgcc tgtgtcactc acttagcctt 2760 ggcatttgtg cagacatacc attttcagtt ctgctgtcac ttggaagttc aggctcagca 2820 tgaatttttg gcaggtagct ctaatacctg gagttttctt tgtttttttt tctttttttt 2880 agttgaagtt tatgagggaa ataccagtgt tcagttttga actataatag tttgtatatt 2940 caacatttga agtatattct attttgttgt actcttgttt caaagtgtat tcaagtaggt 3000 tttctgaaat atagaaatga aatttatctt ctgttttggt ctctggtgat attttaaaca 3060 atatttaaaa gtcagtatag aagtgtttta gttaggaagt gataaaacat ctctcttctc 3120 cttcccaact actgcatgaa gaaattctac ttccattata ttaatatttg g 3171 <210> 53 <211> 3218 <212> DNA <213> Homo sapiens <400> 53 aaaatagtga aggatgctta gactacttaa catacaaact gctttctggt taatcatctt 60 tagaagactg gatttctgga tatctactcc actccatctc tattgacttt taaaacatga 120 taatgcaaac ctataacact ggcaaccatc agtgaacctt taatttcatt gattaatagc 180 gtttgaagct tcctcaggga ataacaatga catcagcagt ggttgacagt ggaggtacta 240 ttttggagct ttccagcaat ggagtagaaa atcaagagga aagtgaaaag gtttctgaat 300 atccagcagt gattgtggag ccagttccaa gtgccagatt agagcagggc tatgcagccc 360 aggttctggt ttatgatgat gagacttata tgatgcaaga tgtggcagaa gaacaagaag 420 ttgagaccga gaatgtggaa acagtggaag catcagttca cagcagtaat gcacactgta 480 cagataagac aattgaagct gctgaagccc tgcttcatat ggaatctcct acctgcttga 540 gggattcaag aagtcctgaa ttcatccatg ctgctatgag gccagatgtc attacagaaa 600 ctgtagtgga ggtgtcaact gaagagtctg aacccatgga tacctctcct attccaacat 660 caccagatag ccatgaacca atgaaaaaga aaaaagttgg ccgtaaacca aagacccagc 720 aatcaccaat ttccaatggg tctcctgagt taggtataaa gaagaaacca agagaaggaa 780 aaggaaacac aacctatttg tgggagtttc ttttagatct acttcaagat aaaaatactt 840 gtcccaggta tattaaatgg actcagagag aaaaaggcat attcaagctg gtggattcaa 900 aggctgtctc taagctttgg ggaaagcata agaacaaacc agacatgaac tatgaaacca 960 tgggacgagc tttgagatac tactaccaaa ggggaattct tgcaaaggtt gaaggacaga 1020 ggcttgtata tcagttcaag gatatgccga aaaacatagt ggtcatagat gatgacaaaa 1080 gtgaaacctg taatgaagat ttagcaggaa ctactgatga aaaatcatta gaacgagtgt 1140 cactgtctgc agaaagtctc ctgaaagcag catcctctgt tcgcagtgga aaaaattcat 1200 cccctataaa ctgctccaga gcagagaagg gtgtagctag agttgtgaat atcacttccc 1260 ctgggcacga tgcttcatcc aggtctccta ctaccactgc atctgtgtca gcaacagcag 1320 ctccaaggac agttcgtgtg gcaatgcagg tacctgttgt aatgacatca ttgggtcaga 1380 aaatttcaac tgtggcagtt cagtcagtta atgcaggtgc accattaata accagcacta 1440 gtccaacaac agcgacctct ccaaaggtag tcattcagac aatccctact gtgatgccag 1500 cttctactga aaatggagac aaaatcacca tgcagcctgc caaaattatt accatcccag 1560 ctacacagct tgcacagtgt caactgcaga caaagtcaaa tctgactgga tcaggaagca 1620 ttaacattgt tggaacccca ttggctgtga gagcacttac ccctgtttca atagcccatg 1680 gtacacctgt aatgagacta tcaatgccta ctcagcaggc atctggccag actcctcctc 1740 gagttatcag tgcagtcata aaggggccag aggttaaatc ggaagcagtg gcaaaaaagc 1800 aagaacatga tgtgaaaact ttgcagctag tagaagaaaa accagcagat ggaaataaga 1860 cagtgaccca cgtagtggtt gtcagtgcgc cttcagctat tgcccttcct gtaactatga 1920 aaacagaagg actagtgaca tgtgagaaat aaaatagcag ctccaccatg gacttcaggc 1980 tgttagtggc agtactgaca taaacatttg caagggaagt catcaagaaa agtcaaagaa 2040 gactttaaaa catttttaat gcatatacaa aaacaatcag acttactgga aataaattac 2100 ctatcccatg tttcagtggg aaatgaacta catattgaga tgctgacaga aaactgcctc 2160 ttacagtagg aaacaactga acccatcaat aagaaaaagg atcgaaaggg accaagcagc 2220 tcactacgat atcaagttac actaagactt ggaacactaa cattctgtaa gaggttatat 2280 agttttcagt gggaggggtt gggatgggta atctcattgt tacatatagc aatttttgat 2340 gcattttata tgcataccag caattattac tgtgttcgca cagttctcac ttaactggtg 2400 ctatgtgaag actctgctaa tataggtatt ttagaatgtg aattgaagaa tggatcccaa 2460 aaacttcaga aagaggatag caaaaaaaga tctagtgcga ttttatatat atatatatat 2520 atatatacat acatatatat atatcatata gcttaagctg atttaaaaca aaggccttag 2580 actaattttc gattttcttt cttgaaataa gctaatggct tgtttgtgta aagctttttt 2640 attaaaagaa aaattttaaa aatcttgtac ctagcacagt attgttatag aatatacatg 2700 taacatttta tatggtagtt taagtctgtc agtttcttaa ttgtggacaa attaacagtt 2760 ggctctggcc ttttgctgta acatgcctgt gtcactcact tagccttggc atttgtgcag 2820 acataccatt ttcagttctg ctgtcacttg gaagttcagg ctcagcatga atttttggca 2880 ggtagctcta atacctggag ttttctttgt ttttttttct tttttttagt tgaagtttat 2940 gagggaaata ccagtgttca gttttgaact ataatagttt gtatattcaa catttgaagt 3000 atattctatt ttgttgtact cttgtttcaa agtgtattca agtaggtttt ctgaaatata 3060 gaaatgaaat ttatcttctg ttttggtctc tggtgatatt ttaaacaata tttaaaagtc 3120 agtatagaag tgttttagtt aggaagtgat aaaacatctc tcttctcctt cccaactact 3180 gcatgaagaa attctacttc cattatatta atatttgg 3218 <210> 54 <211> 1901 <212> DNA <213> Homo sapiens <400> 54 gcggcgagtg gagcgggagc cgactggaag aagggctcta gggagggggc tgtggctgct 60 ggggtccgag gtggggccgg gtacaccagc cccatcactg tttgcagaga gtcagggagg 120 cggaaaagac acgcgctcta ggctcccatc agggcacatg gcccgggccc atcccccgcg 180 cgtctccccg gctgcggggc gcggggggct gccgggtgcg cttggctgtg gcgcggcgcg 240 ttggagactt tattgcgatg ggacgataag aggggcgggg gcggggtcct gggggccgag 300 gcggcagcgc tttaattaaa acggaaattg cggccccggg ccgcgcgggg gccggagggt 360 tccaagcggc cccttagctg gaagcgtttc tccaggaccc ccccgcaacc cccgccacgc 420 ccgggctgcc ccctcccgcc aggccctgcc ggacccggcg ccgtcttctc ctccttgtca 480 cccgcggtcg cttcgggcgg ggatcggtgc caccgagcgc aaagcctgcc tcgcccccct 540 tccccgtccc ccccatctcc caccgcccag tccccggcgg cgatgagaca gagcggcgcc 600 tcccagcccc tgctgatcaa catgtacctg ccagatcccg tcggagacgg tctcttcaag 660 gacgggaaga acccgagctg ggggccgctg agccccgcgg ttcagaaagg cagcggacag 720 atccagctgt ggcagtttct gctggagctg ctggctgacc gcgcgaacgc cggctgcatc 780 gcgtgggagg gcggtcacgg cgagttcaag ctcacggacc cggacgaggt ggcgcggcgg 840 tggggcgagc gcaagagcaa gcccaacatg aactacgaca agctgagccg cgccctgcgc 900 tactactacg acaagaacat catgagcaag gtgcatggca agcgctacgc ctaccgcttc 960 gacttccagg gcctggcgca ggcctgccag ccgccgcccg cgcacgctca tgccgccgcc 1020 gcagctgctg ccgccgccgc ggccgcccag gacggcgcgc tctacaagct gcccgccggc 1080 ctcgccccgc tgcccttccc cggcctctcc aaactcaacc tcatggccgc ctcggccggg 1140 gtcgcgcccg ccggcttctc ctactggccg ggcccgggcc ccgccgccac cgctgccgcc 1200 gccaccgccg cgctctaccc cagtcccagc ttgcagcccc cgcccgggcc cttcggggcc 1260 gtggccgcag cctcgcactt ggggggccat taccactaga cggggcggtc gggtgcctgc 1320 ggcctcgccc gcacgcctag agtctcgccc gatcccatcg gcatcccggg gagggcccgg 1380 gagcctccgt caaccgtcct ctaatccaga gtttactcca cctgccgcac ttagcagggg 1440 gacgggaccg aagctccctc aatccttgtc tggtactaga tttgctcctg tcccaccccg 1500 cagtcccctg aggagggcga tgtgcgccct ctttcacttt ttttcttcta ggtctccagg 1560 tcccggaggg gatttgtgga cctctcttgt ctccccacca ctccagtgca tttccgcctg 1620 gctcctagaa gccccattca atatcactac tctttaacga gtgccaaatc ttttcccact 1680 tttgctcttc cccaaggaac tgctcccacc tcagcacgtg gaggcctctc acggtcctcc 1740 ttcctgggac ctgagcaggt ttggtgaaag ccaccgtcct ccgtgacaca cggccccctt 1800 cctcctgtcc ccacactccc aggagaaact cccggtgtgt ttctgaccct ttcagcccca 1860 ttaaagctcc tgagctctca aaaaaaaaaa aaaaaaaaaa a 1901 <210> 55 <211> 21 <212> DNA <213> Homo sapiens <400> 55 taggcgcgag ctaagcagga g 21 <210> 56 <211> 25 <212> DNA <213> Homo sapiens <400> 56 gtaggcacac tcaaacaacg actgg 25 <210> 57 <211> 19 <212> DNA <213> Homo sapiens <400> 57 cgcgagctaa gcaggaggc 19 <210> 58 <211> 22 <212> DNA <213> Homo sapiens <400> 58 caggccatga aaagccaaac tt 22 <210> 59 <211> 49 <212> DNA <213> Homo sapiens <400> 59 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tttcucgauu cguccuccg 49 <210> 60 <211> 51 <212> DNA <213> Homo sapiens <400> 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tttauccgcg cucgauucgu c 51 <210> 61 <211> 23 <212> DNA <213> Homo sapiens <400> 61 gagggcgagg ggcggggagc gcc 23 <210> 62 <211> 31 <212> DNA <213> Homo sapiens <400> 62 cctatcatta ctcgatgctg ttgataacag c 31 <210> 63 <211> 43 <212> DNA <213> Homo sapiens <400> 63 aatttaatac gactcactat agggagaaac tttcagcctg ata 43 <210> 64 <211> 51 <212> DNA <213> Homo sapiens <400> 64 aatttaatac gactcactat agggagactc tgtgagtcat ttgtcttgct t 51 <210> 65 <211> 47 <212> DNA <213> Homo sapiens <400> 65 aatttaatac gactcactat agggagagca cactcaaaca acgactg 47 <210> 66 <211> 23 <212> DNA <213> Homo sapiens <400> 66 gcgcggcagc ucagguaccu gac 23 <210> 67 <211> 26 <212> DNA <213> Homo sapiens <400> 67 gcuuugaacu cacucaggua ccugac 26 <210> 68 <211> 27 <212> DNA <213> Homo sapiens <400> 68 gagcgcggca ggaagccuua ucaguug 27 <210> 69 <211> 28 <212> DNA <213> Homo sapiens <400> 69 gagcgcggca gguuauucca ggaucuuu 28 <210> 70 <211> 17 <212> DNA <213> Homo sapiens <400> 70 cgcggcagga agcctta 17 <210> 71 <211> 22 <212> DNA <213> Homo sapiens <400> 71 tccgtaggca cactcaaaca ac 22 <210> 72 <211> 18 <212> DNA <213> Homo sapiens <400> 72 cagttgtgag tgaggacc 18 <210> 73 <211> 72 <212> DNA <213> Homo sapiens <400> 73 ggggtgcagc ttttattttc ccaaatactt cagtatatcc tgaagctacg caaagaatta 60 caactaggcc ag 72 <210> 74 <211> 40 <212> PRT <213> Homo sapiens <400> 74 Met Ala Ser Thr Ile Lys Glu Ala Leu Ser Val Val Ser Glu Asp Gln 1 5 10 15 Ser Leu Phe Glu Cys Ala Tyr Gly Thr Pro His Leu Ala Lys Thr Glu 20 25 30 Met Thr Ala Ser Ser Ser Ser Asp 35 40 <210> 75 <211> 5 <212> PRT <213> Homo sapiens <400> 75 Ser Ser Ser Ser Asp 1 5 <210> 76 <211> 40 <212> PRT <213> Homo sapiens <400> 76 Tyr Gly Gln Thr Ser Lys Met Ser Pro Arg Val Pro Gln Gln Asp Trp 1 5 10 15 Leu Ser Gln Pro Pro Ala Arg Val Thr Ile Lys Met Glu Cys Asn Pro 20 25 30 Ser Gln Val Asn Gly Ser Arg Asn 35 40 <210> 77 <211> 13 <212> PRT <213> Homo sapiens <400> 77 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 78 <211> 13 <212> PRT <213> Homo sapiens <400> 78 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 79 <211> 13 <212> PRT <213> Homo sapiens <400> 79 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 80 <211> 13 <212> PRT <213> Homo sapiens <400> 80 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 81 <211> 21 <212> PRT <213> Homo sapiens <400> 81 Tyr Gly Gln Thr Ser Lys Met Ser Val Pro Gln Gln Asp Trp Leu Ser 1 5 10 15 Gln Pro Pro Ala Arg 20 <210> 82 <211> 13 <212> PRT <213> Homo sapiens <400> 82 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 83 <211> 13 <212> PRT <213> Homo sapiens <400> 83 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 84 <211> 13 <212> PRT <213> Homo sapiens <400> 84 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 85 <211> 25 <212> PRT <213> Homo sapiens <400> 85 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg Met Glu Cys 1 5 10 15 Asn Pro Ser Gln Val Asn Gly Ser Arg 20 25 <210> 86 <211> 13 <212> PRT <213> Homo sapiens <400> 86 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 87 <211> 13 <212> PRT <213> Homo sapiens <400> 87 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg 1 5 10 <210> 88 <211> 40 <212> PRT <213> Homo sapiens <400> 88 Ser Pro Asp Glu Cys Ser Val Ala Lys Gly Gly Lys Met Val Gly Ser 1 5 10 15 Pro Asp Thr Val Gly Met Asn Tyr Gly Ser Tyr Met Glu Glu Lys His 20 25 30 Met Pro Pro Pro Asn Met Thr Thr 35 40 <210> 89 <211> 9 <212> PRT <213> Homo sapiens <400> 89 His Met Pro Pro Pro Asn Met Thr Thr 1 5 <210> 90 <211> 9 <212> PRT <213> Homo sapiens <400> 90 His Met Pro Pro Pro Asn Met Thr Thr 1 5 <210> 91 <211> 9 <212> PRT <213> Homo sapiens <400> 91 His Met Pro Pro Pro Asn Met Thr Thr 1 5 <210> 92 <211> 12 <212> PRT <213> Homo sapiens <400> 92 Asn Tyr Gly Ser Tyr Met Glu Glu Lys His Met Pro 1 5 10 <210> 93 <211> 28 <212> PRT <213> Homo sapiens <400> 93 Met Val Gly Ser Pro Asp Thr Val Gly Met Asn Tyr Gly Ser Tyr Met 1 5 10 15 Glu Glu Lys His Met Pro Pro Pro Asn Met Thr Thr 20 25 <210> 94 <211> 9 <212> PRT <213> Homo sapiens <400> 94 His Met Pro Pro Pro Asn Met Thr Thr 1 5 <210> 95 <211> 9 <212> PRT <213> Homo sapiens <400> 95 His Met Pro Pro Pro Asn Met Thr Thr 1 5 <210> 96 <211> 28 <212> PRT <213> Homo sapiens <400> 96 Met Val Gly Ser Pro Asp Thr Val Gly Met Asn Tyr Gly Ser Tyr Met 1 5 10 15 Glu Glu Lys His Met Pro Pro Pro Asn Met Thr Thr 20 25 <210> 97 <211> 28 <212> PRT <213> Homo sapiens <400> 97 Met Val Gly Ser Pro Asp Thr Val Gly Met Asn Tyr Gly Ser Tyr Met 1 5 10 15 Glu Glu Lys His Met Pro Pro Pro Asn Met Thr Thr 20 25 <210> 98 <211> 40 <212> PRT <213> Homo sapiens <400> 98 Asn Glu Arg Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr 1 5 10 15 Asp His Val Arg Gln Trp Leu Glu Trp Ala Val Lys Glu Tyr Gly Leu 20 25 30 Pro Asp Val Asn Ile Leu Leu Phe 35 40 <210> 99 <211> 39 <212> PRT <213> Homo sapiens <400> 99 Asn Glu Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr Asp 1 5 10 15 His Val Arg Gln Trp Leu Glu Trp Ala Val Lys Glu Tyr Gly Leu Pro 20 25 30 Asp Val Asn Ile Leu Leu Phe 35 <210> 100 <211> 15 <212> PRT <213> Homo sapiens <400> 100 Asn Glu Arg Glu Tyr Gly Leu Pro Asp Val Asn Ile Leu Leu Phe 1 5 10 15 <210> 101 <211> 3 <212> PRT <213> Homo sapiens <400> 101 Asn Glu Arg 1 <210> 102 <211> 27 <212> PRT <213> Homo sapiens <400> 102 Asn Glu Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr Asp 1 5 10 15 His Val Arg Gln Trp Leu Glu Trp Ala Val Lys 20 25 <210> 103 <211> 32 <212> PRT <213> Homo sapiens <400> 103 Asn Glu Arg Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr 1 5 10 15 Asp His Val Arg Glu Tyr Gly Leu Pro Asp Val Asn Ile Leu Leu Phe 20 25 30 <210> 104 <211> 39 <212> PRT <213> Homo sapiens <400> 104 Asn Glu Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr Asp 1 5 10 15 His Val Arg Gln Trp Leu Glu Trp Ala Val Lys Glu Tyr Gly Leu Pro 20 25 30 Asp Val Asn Ile Leu Leu Phe 35 <210> 105 <211> 40 <212> PRT <213> Homo sapiens <400> 105 Asn Glu Arg Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr 1 5 10 15 Asp His Val Arg Gln Trp Leu Glu Trp Ala Val Lys Glu Tyr Gly Leu 20 25 30 Pro Asp Val Asn Ile Leu Leu Phe 35 40 <210> 106 <211> 20 <212> PRT <213> Homo sapiens <400> 106 Asn Glu Arg Arg Val Ile Val Pro Ala Asp Pro Thr Leu Trp Ser Thr 1 5 10 15 Asp His Val Arg 20 <210> 107 <211> 12 <212> PRT <213> Homo sapiens <400> 107 Glu Tyr Gly Leu Pro Asp Val Asn Ile Leu Leu Phe 1 5 10 <210> 108 <211> 40 <212> PRT <213> Homo sapiens <400> 108 Gln Asn Ile Asp Gly Lys Glu Leu Cys Lys Met Thr Lys Asp Asp Phe 1 5 10 15 Gln Arg Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu Leu Ser His Leu 20 25 30 His Tyr Leu Arg Glu Thr Pro Leu 35 40 <210> 109 <211> 28 <212> PRT <213> Homo sapiens <400> 109 Gln Asn Ile Asp Gly Lys Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu 1 5 10 15 Leu Ser His Leu His Tyr Leu Arg Glu Thr Pro Leu 20 25 <210> 110 <211> 4 <212> PRT <213> Homo sapiens <400> 110 Glu Thr Pro Leu 1 <210> 111 <211> 10 <212> PRT <213> Homo sapiens <400> 111 Gln Asn Ile Asp Gly Lys Glu Thr Pro Leu 1 5 10 <210> 112 <211> 4 <212> PRT <213> Homo sapiens <400> 112 Glu Thr Pro Leu 1 <210> 113 <211> 4 <212> PRT <213> Homo sapiens <400> 113 Glu Thr Pro Leu 1 <210> 114 <211> 28 <212> PRT <213> Homo sapiens <400> 114 Gln Asn Ile Asp Gly Lys Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu 1 5 10 15 Leu Ser His Leu His Tyr Leu Arg Glu Thr Pro Leu 20 25 <210> 115 <211> 4 <212> PRT <213> Homo sapiens <400> 115 Glu Thr Pro Leu 1 <210> 116 <211> 28 <212> PRT <213> Homo sapiens <400> 116 Gln Asn Ile Asp Gly Lys Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu 1 5 10 15 Leu Ser His Leu His Tyr Leu Arg Glu Thr Pro Leu 20 25 <210> 117 <211> 28 <212> PRT <213> Homo sapiens <400> 117 Gln Asn Ile Asp Gly Lys Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu 1 5 10 15 Leu Ser His Leu His Tyr Leu Arg Glu Thr Pro Leu 20 25 <210> 118 <211> 22 <212> PRT <213> Homo sapiens <400> 118 Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu Leu Ser His Leu His Tyr 1 5 10 15 Leu Arg Glu Thr Pro Leu 20 <210> 119 <211> 6 <212> PRT <213> Homo sapiens <400> 119 Gln Asn Ile Asp Gly Lys 1 5 <210> 120 <211> 20 <212> PRT <213> Homo sapiens <400> 120 Pro Ser Tyr Asn Ala Asp Ile Leu Leu Ser His Leu His Tyr Leu Arg 1 5 10 15 Glu Thr Pro Leu 20 <210> 121 <211> 40 <212> PRT <213> Homo sapiens <400> 121 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg Leu Met His Ala Arg Asn Thr Gly Gly Ala Ala Phe Ile Phe Pro 20 25 30 Asn Thr Ser Val Tyr Pro Glu Ala 35 40 <210> 122 <211> 9 <212> PRT <213> Homo sapiens <400> 122 Pro Arg Leu Met His Ala Arg Asn Thr 1 5 <210> 123 <211> 10 <212> PRT <213> Homo sapiens <400> 123 Pro His Leu Thr Ser Asp Asp Val Asp Lys 1 5 10 <210> 124 <211> 17 <212> PRT <213> Homo sapiens <400> 124 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 125 <211> 17 <212> PRT <213> Homo sapiens <400> 125 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 126 <211> 17 <212> PRT <213> Homo sapiens <400> 126 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 127 <211> 17 <212> PRT <213> Homo sapiens <400> 127 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 128 <211> 10 <212> PRT <213> Homo sapiens <400> 128 Pro His Leu Thr Ser Asp Asp Val Asp Lys 1 5 10 <210> 129 <211> 17 <212> PRT <213> Homo sapiens <400> 129 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 130 <211> 17 <212> PRT <213> Homo sapiens <400> 130 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 131 <211> 17 <212> PRT <213> Homo sapiens <400> 131 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 132 <211> 3 <212> PRT <213> Homo sapiens <400> 132 Arg Asn Thr 1 <210> 133 <211> 17 <212> PRT <213> Homo sapiens <400> 133 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg <210> 134 <211> 18 <212> PRT <213> Homo sapiens <400> 134 Pro His Leu Thr Ser Asp Asp Val Asp Lys Ala Leu Gln Asn Ser Pro 1 5 10 15 Arg Leu <210> 135 <211> 40 <212> PRT <213> Homo sapiens <400> 135 Thr Gln Arg Ile Thr Thr Arg Pro Asp Leu Pro Tyr Glu Pro Pro Arg 1 5 10 15 Arg Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala 20 25 30 Ala Gln Pro Ser Pro Ser Thr Val 35 40 <210> 136 <211> 8 <212> PRT <213> Homo sapiens <400> 136 Asp Leu Pro Tyr Glu Pro Pro Arg 1 5 <210> 137 <211> 23 <212> PRT <213> Homo sapiens <400> 137 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 138 <211> 7 <212> PRT <213> Homo sapiens <400> 138 Pro Tyr Glu Pro Pro Arg Arg 1 5 <210> 139 <211> 23 <212> PRT <213> Homo sapiens <400> 139 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 140 <211> 23 <212> PRT <213> Homo sapiens <400> 140 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 141 <211> 30 <212> PRT <213> Homo sapiens <400> 141 Pro Tyr Glu Pro Pro Arg Arg Ser Ala Trp Thr Gly His Gly His Pro 1 5 10 15 Thr Pro Gln Ser Lys Ala Ala Gln Pro Ser Pro Ser Thr Val 20 25 30 <210> 142 <211> 23 <212> PRT <213> Homo sapiens <400> 142 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 143 <211> 23 <212> PRT <213> Homo sapiens <400> 143 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 144 <211> 9 <212> PRT <213> Homo sapiens <400> 144 Asp Leu Pro Tyr Glu Pro Pro Arg Arg 1 5 <210> 145 <211> 30 <212> PRT <213> Homo sapiens <400> 145 Pro Tyr Glu Pro Pro Arg Arg Ser Ala Trp Thr Gly His Gly His Pro 1 5 10 15 Thr Pro Gln Ser Lys Ala Ala Gln Pro Ser Pro Ser Thr Val 20 25 30 <210> 146 <211> 32 <212> PRT <213> Homo sapiens <400> 146 Asp Leu Pro Tyr Glu Pro Pro Arg Arg Ser Ala Trp Thr Gly His Gly 1 5 10 15 His Pro Thr Pro Gln Ser Lys Ala Ala Gln Pro Ser Pro Ser Thr Val 20 25 30 <210> 147 <211> 9 <212> PRT <213> Homo sapiens <400> 147 Asp Leu Pro Tyr Glu Pro Pro Arg Arg 1 5 <210> 148 <211> 32 <212> PRT <213> Homo sapiens <400> 148 Asp Leu Pro Tyr Glu Pro Pro Arg Arg Ser Ala Trp Thr Gly His Gly 1 5 10 15 His Pro Thr Pro Gln Ser Lys Ala Ala Gln Pro Ser Pro Ser Thr Val 20 25 30 <210> 149 <211> 9 <212> PRT <213> Homo sapiens <400> 149 Ala Ala Gln Pro Ser Pro Ser Thr Val 1 5 <210> 150 <211> 23 <212> PRT <213> Homo sapiens <400> 150 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 151 <211> 32 <212> PRT <213> Homo sapiens <400> 151 Asp Leu Pro Tyr Glu Pro Pro Arg Arg Ser Ala Trp Thr Gly His Gly 1 5 10 15 His Pro Thr Pro Gln Ser Lys Ala Ala Gln Pro Ser Pro Ser Thr Val 20 25 30 <210> 152 <211> 40 <212> PRT <213> Homo sapiens <400> 152 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg Leu Ala Asn Pro Gly Ser Gly Gln Ile Gln 20 25 30 Leu Trp Gln Phe Leu Leu Glu Leu 35 40 <210> 153 <211> 2 <212> PRT <213> Homo sapiens <400> 153 Pro Lys 1 <210> 154 <211> 20 <212> PRT <213> Homo sapiens <400> 154 Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu Gly Pro 1 5 10 15 Thr Ser Ser Arg 20 <210> 155 <211> 22 <212> PRT <213> Homo sapiens <400> 155 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 156 <211> 22 <212> PRT <213> Homo sapiens <400> 156 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 157 <211> 22 <212> PRT <213> Homo sapiens <400> 157 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 158 <211> 22 <212> PRT <213> Homo sapiens <400> 158 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 159 <211> 22 <212> PRT <213> Homo sapiens <400> 159 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 160 <211> 20 <212> PRT <213> Homo sapiens <400> 160 Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu Gly Pro 1 5 10 15 Thr Ser Ser Arg 20 <210> 161 <211> 22 <212> PRT <213> Homo sapiens <400> 161 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 162 <211> 22 <212> PRT <213> Homo sapiens <400> 162 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 163 <211> 22 <212> PRT <213> Homo sapiens <400> 163 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 164 <211> 2 <212> PRT <213> Homo sapiens <400> 164 Pro Lys 1 <210> 165 <211> 22 <212> PRT <213> Homo sapiens <400> 165 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 166 <211> 22 <212> PRT <213> Homo sapiens <400> 166 Pro Lys Thr Glu Asp Gln Arg Pro Gln Leu Asp Pro Tyr Gln Ile Leu 1 5 10 15 Gly Pro Thr Ser Ser Arg 20 <210> 167 <211> 2 <212> PRT <213> Homo sapiens <400> 167 Pro Lys 1 <210> 168 <211> 40 <212> PRT <213> Homo sapiens <400> 168 Leu Ser Asp Ser Ser Asn Ser Ser Cys Ile Thr Trp Glu Gly Thr Asn 1 5 10 15 Gly Glu Phe Lys Met Thr Asp Pro Asp Glu Val Ala Arg Arg Trp Gly 20 25 30 Glu Arg Lys Ser Lys Pro Asn Met 35 40 <210> 169 <211> 9 <212> PRT <213> Homo sapiens <400> 169 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 170 <211> 9 <212> PRT <213> Homo sapiens <400> 170 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 171 <211> 9 <212> PRT <213> Homo sapiens <400> 171 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 172 <211> 9 <212> PRT <213> Homo sapiens <400> 172 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 173 <211> 9 <212> PRT <213> Homo sapiens <400> 173 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 174 <211> 10 <212> PRT <213> Homo sapiens <400> 174 Met Thr Asp Pro Asp Glu Val Ala Arg Arg 1 5 10 <210> 175 <211> 15 <212> PRT <213> Homo sapiens <400> 175 Thr Asp Pro Asp Glu Val Ala Arg Arg Lys Ser Lys Pro Asn Met 1 5 10 15 <210> 176 <211> 9 <212> PRT <213> Homo sapiens <400> 176 Met Thr Asp Pro Asp Glu Val Ala Arg 1 5 <210> 177 <211> 6 <212> PRT <213> Homo sapiens <400> 177 Lys Ser Lys Pro Asn Met 1 5 <210> 178 <211> 40 <212> PRT <213> Homo sapiens <400> 178 Asn Tyr Asp Lys Leu Ser Arg Ala Leu Arg Tyr Tyr Tyr Asp Lys Asn 1 5 10 15 Ile Met Thr Lys Val His Gly Lys Arg Tyr Ala Tyr Lys Phe Asp Phe 20 25 30 His Gly Ile Ala Gln Ala Leu Gln 35 40 <210> 179 <211> 11 <212> PRT <213> Homo sapiens <400> 179 Phe Asp Phe His Gly Ile Ala Gln Ala Leu Gln 1 5 10 <210> 180 <211> 11 <212> PRT <213> Homo sapiens <400> 180 Phe Asp Phe His Gly Ile Ala Gln Ala Leu Gln 1 5 10 <210> 181 <211> 11 <212> PRT <213> Homo sapiens <400> 181 Phe Asp Phe His Gly Ile Ala Gln Ala Leu Gln 1 5 10 <210> 182 <211> 11 <212> PRT <213> Homo sapiens <400> 182 Phe Asp Phe His Gly Ile Ala Gln Ala Leu Gln 1 5 10 <210> 183 <211> 25 <212> PRT <213> Homo sapiens <400> 183 Tyr Tyr Tyr Asp Lys Asn Ile Met Thr Lys Tyr Ala Tyr Lys Phe Asp 1 5 10 15 Phe His Gly Ile Ala Gln Ala Leu Gln 20 25 <210> 184 <211> 7 <212> PRT <213> Homo sapiens <400> 184 Asn Tyr Asp Lys Leu Ser Arg 1 5 <210> 185 <211> 17 <212> PRT <213> Homo sapiens <400> 185 Asn Tyr Asp Lys Leu Ser Arg Tyr Tyr Tyr Asp Lys Asn Ile Met Thr 1 5 10 15 Lys <210> 186 <211> 40 <212> PRT <213> Homo sapiens <400> 186 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 1 5 10 15 Tyr Met Gly Ser Tyr His Ala His Pro Gln Lys Met Asn Phe Val Ala 20 25 30 Pro His Pro Pro Ala Leu Pro Val 35 40 <210> 187 <211> 10 <212> PRT <213> Homo sapiens <400> 187 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys 1 5 10 <210> 188 <211> 24 <212> PRT <213> Homo sapiens <400> 188 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 1 5 10 15 Tyr Met Gly Ser Tyr His Ala His 20 <210> 189 <211> 27 <212> PRT <213> Homo sapiens <400> 189 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 1 5 10 15 Tyr Met Gly Ser Tyr His Ala His Pro Gln Lys 20 25 <210> 190 <211> 27 <212> PRT <213> Homo sapiens <400> 190 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 1 5 10 15 Tyr Met Gly Ser Tyr His Ala His Pro Gln Lys 20 25 <210> 191 <211> 17 <212> PRT <213> Homo sapiens <400> 191 Tyr Pro Ser Asp Leu Pro Tyr Met Gly Ser Tyr His Ala His Pro Gln 1 5 10 15 Lys <210> 192 <211> 27 <212> PRT <213> Homo sapiens <400> 192 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 1 5 10 15 Tyr Met Gly Ser Tyr His Ala His Pro Gln Lys 20 25 <210> 193 <211> 39 <212> PRT <213> Homo sapiens <400> 193 Thr Ser Ser Ser Phe Phe Ala Ala Pro Asn Pro Tyr Trp Asn Ser Pro 1 5 10 15 Thr Gly Gly Ile Tyr Pro Asn Thr Arg Leu Pro Thr Ser His Met Pro 20 25 30 Ser His Leu Gly Thr Tyr Tyr 35 <210> 194 <211> 5 <212> PRT <213> Homo sapiens <400> 194 Asn Ser Pro Thr Gly 1 5 <210> 195 <211> 11 <212> PRT <213> Homo sapiens <400> 195 Ser Pro Thr Gly Gly Ile Tyr Pro Asn Thr Arg 1 5 10 <210> 196 <211> 24 <212> PRT <213> Homo sapiens <400> 196 Gly Gly Ala Ala Phe Ile Phe Pro Asn Thr Ser Val Tyr Pro Glu Ala 1 5 10 15 Thr Gln Arg Ile Thr Thr Arg Pro 20 <210> 197 <211> 10 <212> PRT <213> Homo sapiens <400> 197 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro 1 5 10 <210> 198 <211> 10 <212> PRT <213> Homo sapiens <400> 198 Val Pro Gln Gln Asp Trp Leu Ser Gln Pro 1 5 10 <210> 199 <211> 12 <212> PRT <213> Homo sapiens <400> 199 Met Ile Gln Thr Val Pro Asp Pro Ala Ala His Ile 1 5 10 <210> 200 <211> 55 <212> PRT <213> Homo sapiens <400> 200 Met Ala Ser Thr Ile Lys Glu Ala Leu Ser Val Val Ser Glu Asp Gln 1 5 10 15 Ser Leu Phe Glu Cys Ala Tyr Gly Thr Pro His Leu Ala Lys Thr Glu 20 25 30 Met Thr Ala Tyr Gly Gln Thr Ser Lys Met Ser Pro Arg Val Pro Gln 35 40 45 Gln Asp Trp Leu Ser Gln Pro 50 55 <210> 201 <211> 12 <212> PRT <213> Homo sapiens <400> 201 Met Ile Gln Thr Val Pro Asp Pro Ala Ala His Ile 1 5 10 <210> 202 <211> 23 <212> DNA <213> Homo sapiens <400> 202 gctgcagact tggccaaatg gac 23 <210> 203 <211> 23 <212> DNA <213> Homo sapiens <400> 203 tcaccaccga cagagcctcc tta 23 <210> 204 <211> 26 <212> DNA <213> Homo sapiens <400> 204 accacatgaa tggatccagg gagtct 26 <210> 205 <211> 24 <212> DNA <213> Homo sapiens <400> 205 accagcttgc tgcatttgct aacg 24 <210> 206 <211> 20 <212> DNA <213> Homo sapiens <400> 206 ctccgcgcca ccaccctcta 20 <210> 207 <211> 24 <212> DNA <213> Homo sapiens <400> 207 ggccagcagt gaactttccc tgag 24 <210> 208 <211> 23 <212> DNA <213> Homo sapiens <400> 208 ctcctcccaa catgaccacc aac 23 <210> 209 <211> 22 <212> DNA <213> Homo sapiens <400> 209 gtctgcgggg acgatgactc tc 22 <210> 210 <211> 23 <212> DNA <213> Homo sapiens <400> 210 catgtgaggc aatggctgga gtg 23 <210> 211 <211> 26 <212> DNA <213> Homo sapiens <400> 211 ccatgttctg gaaaaaggat gtgtcg 26 <210> 212 <211> 21 <212> DNA <213> Homo sapiens <400> 212 ccttggaggg gcacaaacga t 21 <210> 213 <211> 22 <212> DNA <213> Homo sapiens <400> 213 ggtcgggccc aggatctgat ac 22 <210> 214 <211> 21 <212> DNA <213> Homo sapiens <400> 214 cgccaacgcc agctgtatca c 21 <210> 215 <211> 19 <212> DNA <213> Homo sapiens <400> 215 agcgcctggc cacctcatc 19 <210> 216 <211> 30 <212> DNA <213> Homo sapiens <400> 216 atgtttttat gaccaaagca gtttcttgtc 30 <210> 217 <211> 27 <212> DNA <213> Homo sapiens <400> 217 atgacgggtt aagtccatga ttctgtg 27 <210> 218 <211> 21 <212> DNA <213> Homo sapiens <400> 218 cgaaagctgc tcaaccatct c 21 <210> 219 <211> 22 <212> DNA <213> Homo sapiens <400> 219 taactgagga cgctggtctt ca 22 <210> 220 <211> 15 <212> DNA <213> Homo sapiens <400> 220 ccacagtgcc caaaa 15 <210> 221 <400> 221 000 <210> 222 <211> 25 <212> DNA <213> Homo sapiens <400> 222 cggcaaaaga tatgcttaca aattt 25 <210> 223 <211> 19 <212> DNA <213> Homo sapiens <400> 223 gacgactcgg tcggatgtg 19 <210> 224 <211> 14 <212> DNA <213> Homo sapiens <400> 224 cacggcattg ccca 14 <210> 225 <211> 17 <212> DNA <213> Homo sapiens <400> 225 cgcggcagga agcctta 17 <210> 226 <211> 22 <212> DNA <213> Homo sapiens <400> 226 tccgtaggca cactcaaaca ac 22 <210> 227 <211> 18 <212> DNA <213> Homo sapiens <400> 227 cagttgtgag tgaggacc 18 <210> 228 <211> 25 <212> DNA <213> Homo sapiens <400> 228 gctcgctccg atactattat gagaa 25 <210> 229 <211> 25 <212> DNA <213> Homo sapiens <400> 229 cacacacaaa cttgtacacg taacg 25 <210> 230 <211> 16 <212> DNA <213> Homo sapiens <400> 230 accagccacc ttctgc 16 <210> 231 <211> 25 <212> DNA <213> Homo sapiens <400> 231 ggtcgaggca tggaatttaa actga 25 <210> 232 <211> 22 <212> DNA <213> Homo sapiens <400> 232 gctggcctgt ttttctgaat gc 22 <210> 233 <211> 15 <212> DNA <213> Homo sapiens <400> 233 tcgggccacc tcttc 15 <210> 234 <211> 12 <212> PRT <213> Homo sapiens <400> 234 Met Ile Gln Thr Val Pro Asp Pro Ala Ala His Ile 1 5 10 <210> 235 <211> 23 <212> PRT <213> Homo sapiens <400> 235 Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala Ala 1 5 10 15 Gln Pro Ser Pro Ser Thr Val 20 <210> 236 <211> 42 <212> PRT <213> Homo sapiens <220> <221> NON_CONS <222> (18)..(19) <400> 236 Met Ile Gln Thr Val Pro Asp Pro Ala Ala Ser His Ile Lys Glu Ala 1 5 10 15 Leu Ser Gly Gly Ala Ala Phe Ile Phe Pro Asn Thr Ser Val Tyr Pro 20 25 30 Glu Ala Thr Gln Arg Ile Thr Thr Arg Pro 35 40 <210> 237 <211> 18 <212> PRT <213> Homo sapiens <400> 237 Met Ile Gln Thr Val Pro Asp Pro Ala Ala Ser His Ile Lys Glu Ala 1 5 10 15 Leu Ser <210> 238 <211> 42 <212> PRT <213> Homo sapiens <220> <221> NON_CONS <222> (10)..(11) <220> <221> NON_CONS <222> (14)..(15) <220> <221> NON_CONS <222> (18)..(19) <400> 238 Met Ala Ser Thr Ile Lys Glu Ala Leu Ser Met Thr Ala Ser Met Ser 1 5 10 15 Pro Arg Gly Gly Ala Ala Phe Ile Phe Pro Asn Thr Ser Val Tyr Pro 20 25 30 Glu Ala Thr Gln Arg Ile Thr Thr Arg Pro 35 40 <210> 239 <211> 18 <212> PRT <213> Homo sapiens <220> <221> NON_CONS <222> (10)..(11) <220> <221> NON_CONS <222> (14)..(15) <400> 239 Met Ala Ser Thr Ile Lys Glu Ala Leu Ser Met Thr Ala Ser Met Ser 1 5 10 15 Pro Arg <210> 240 <211> 479 <212> PRT <213> Homo sapiens <400> 240 Met Ala Ser Thr Ile Lys Glu Ala Leu Ser Val Val Ser Glu Asp Gln 1 5 10 15 Ser Leu Phe Glu Cys Ala Tyr Gly Thr Pro His Leu Ala Lys Thr Glu 20 25 30 Met Thr Ala Ser Ser Ser Ser Asp Tyr Gly Gln Thr Ser Lys Met Ser 35 40 45 Pro Arg Val Pro Gln Gln Asp Trp Leu Ser Gln Pro Pro Ala Arg Val 50 55 60 Thr Ile Lys Met Glu Cys Asn Pro Ser Gln Val Asn Gly Ser Arg Asn 65 70 75 80 Ser Pro Asp Glu Cys Ser Val Ala Lys Gly Gly Lys Met Val Gly Ser 85 90 95 Pro Asp Thr Val Gly Met Asn Tyr Gly Ser Tyr Met Glu Glu Lys His 100 105 110 Met Pro Pro Pro Asn Met Thr Thr Asn Glu Arg Arg Val Ile Val Pro 115 120 125 Ala Asp Pro Thr Leu Trp Ser Thr Asp His Val Arg Gln Trp Leu Glu 130 135 140 Trp Ala Val Lys Glu Tyr Gly Leu Pro Asp Val Asn Ile Leu Leu Phe 145 150 155 160 Gln Asn Ile Asp Gly Lys Glu Leu Cys Lys Met Thr Lys Asp Asp Phe 165 170 175 Gln Arg Leu Thr Pro Ser Tyr Asn Ala Asp Ile Leu Leu Ser His Leu 180 185 190 His Tyr Leu Arg Glu Thr Pro Leu Pro His Leu Thr Ser Asp Asp Val 195 200 205 Asp Lys Ala Leu Gln Asn Ser Pro Arg Leu Met His Ala Arg Asn Thr 210 215 220 Gly Gly Ala Ala Phe Ile Phe Pro Asn Thr Ser Val Tyr Pro Glu Ala 225 230 235 240 Thr Gln Arg Ile Thr Thr Arg Pro Asp Leu Pro Tyr Glu Pro Pro Arg 245 250 255 Arg Ser Ala Trp Thr Gly His Gly His Pro Thr Pro Gln Ser Lys Ala 260 265 270 Ala Gln Pro Ser Pro Ser Thr Val Pro Lys Thr Glu Asp Gln Arg Pro 275 280 285 Gln Leu Asp Pro Tyr Gln Ile Leu Gly Pro Thr Ser Ser Arg Leu Ala 290 295 300 Asn Pro Gly Ser Gly Gln Ile Gln Leu Trp Gln Phe Leu Leu Glu Leu 305 310 315 320 Leu Ser Asp Ser Ser Asn Ser Ser Cys Ile Thr Trp Glu Gly Thr Asn 325 330 335 Gly Glu Phe Lys Met Thr Asp Pro Asp Glu Val Ala Arg Arg Trp Gly 340 345 350 Glu Arg Lys Ser Lys Pro Asn Met Asn Tyr Asp Lys Leu Ser Arg Ala 355 360 365 Leu Arg Tyr Tyr Tyr Asp Lys Asn Ile Met Thr Lys Val His Gly Lys 370 375 380 Arg Tyr Ala Tyr Lys Phe Asp Phe His Gly Ile Ala Gln Ala Leu Gln 385 390 395 400 Pro His Pro Pro Glu Ser Ser Leu Tyr Lys Tyr Pro Ser Asp Leu Pro 405 410 415 Tyr Met Gly Ser Tyr His Ala His Pro Gln Lys Met Asn Phe Val Ala 420 425 430 Pro His Pro Pro Ala Leu Pro Val Thr Ser Ser Ser Phe Phe Ala Ala 435 440 445 Pro Asn Pro Tyr Trp Asn Ser Pro Thr Gly Gly Ile Tyr Pro Asn Thr 450 455 460 Arg Leu Pro Thr Ser His Met Pro Ser His Leu Gly Thr Tyr Tyr 465 470 475 <210> 241 <211> 13 <212> PRT <213> Homo sapiens <400> 241 Gly Ala Ala Phe Ile Phe Pro Asn Thr Ser Val Tyr Pro 1 5 10 <210> 242 <211> 477 <212> PRT <213> Homo sapiens <400> 242 Met Asp Gly Phe Tyr Asp Gln Gln Val Pro Tyr Met Val Thr Asn Ser 1 5 10 15 Gln Arg Gly Arg Asn Cys Asn Glu Lys Pro Thr Asn Val Arg Lys Arg 20 25 30 Lys Phe Ile Asn Arg Asp Leu Ala His Asp Ser Glu Glu Leu Phe Gln 35 40 45 Asp Leu Ser Gln Leu Gln Glu Thr Trp Leu Ala Glu Ala Gln Val Pro 50 55 60 Asp Asn Asp Glu Gln Phe Val Pro Asp Tyr Gln Ala Glu Ser Leu Ala 65 70 75 80 Phe His Gly Leu Pro Leu Lys Ile Lys Lys Glu Pro His Ser Pro Cys 85 90 95 Ser Glu Ile Ser Ser Ala Cys Ser Gln Glu Gln Pro Phe Lys Phe Ser 100 105 110 Tyr Gly Glu Lys Cys Leu Tyr Asn Val Ser Ala Tyr Asp Gln Lys Pro 115 120 125 Gln Val Gly Met Arg Pro Ser Asn Pro Pro Thr Pro Ser Ser Thr Pro 130 135 140 Val Ser Pro Leu His His Ala Ser Pro Asn Ser Thr His Thr Pro Lys 145 150 155 160 Pro Asp Arg Ala Phe Pro Ala His Leu Pro Pro Ser Gln Ser Ile Pro 165 170 175 Asp Ser Ser Tyr Pro Met Asp His Arg Phe Arg Arg Gln Leu Ser Glu 180 185 190 Pro Cys Asn Ser Phe Pro Pro Leu Pro Thr Met Pro Arg Glu Gly Arg 195 200 205 Pro Met Tyr Gln Arg Gln Met Ser Glu Pro Asn Ile Pro Phe Pro Pro 210 215 220 Gln Gly Phe Lys Gln Glu Tyr His Asp Pro Val Tyr Glu His Asn Thr 225 230 235 240 Met Val Gly Ser Ala Ala Ser Gln Ser Phe Pro Pro Pro Leu Met Ile 245 250 255 Lys Gln Glu Pro Arg Asp Phe Ala Tyr Asp Ser Glu Val Pro Ser Cys 260 265 270 His Ser Ile Tyr Met Arg Gln Glu Gly Phe Leu Ala His Pro Ser Arg 275 280 285 Thr Glu Gly Cys Met Phe Glu Lys Gly Pro Arg Gln Phe Tyr Asp Asp 290 295 300 Thr Cys Val Val Pro Glu Lys Phe Asp Gly Asp Ile Lys Gln Glu Pro 305 310 315 320 Gly Met Tyr Arg Glu Gly Pro Thr Tyr Gln Arg Arg Gly Ser Leu Gln 325 330 335 Leu Trp Gln Phe Leu Val Ala Leu Leu Asp Asp Pro Ser Asn Ser His 340 345 350 Phe Ile Ala Trp Thr Gly Arg Gly Met Glu Phe Lys Leu Ile Glu Pro 355 360 365 Glu Glu Val Ala Arg Arg Trp Gly Ile Gln Lys Asn Arg Pro Ala Met 370 375 380 Asn Tyr Asp Lys Leu Ser Arg Ser Leu Arg Tyr Tyr Tyr Glu Lys Gly 385 390 395 400 Ile Met Gln Lys Val Ala Gly Glu Arg Tyr Val Tyr Lys Phe Val Cys 405 410 415 Asp Pro Glu Ala Leu Phe Ser Met Ala Phe Pro Asp Asn Gln Arg Pro 420 425 430 Leu Leu Lys Thr Asp Met Glu Arg His Ile Asn Glu Glu Asp Thr Val 435 440 445 Pro Leu Ser His Phe Asp Glu Ser Met Ala Tyr Met Pro Glu Gly Gly 450 455 460 Cys Cys Asn Pro His Pro Tyr Asn Glu Gly Tyr Val Tyr 465 470 475 <210> 243 <211> 14 <212> PRT <213> Homo sapiens <400> 243 Pro His Ser Pro Cys Ser Glu Ile Ser Ser Ala Cys Ser Gln 1 5 10 <210> 244 <211> 13 <212> PRT <213> Homo sapiens <400> 244 Thr Pro Ser Ser Thr Pro Val Ser Pro Leu His His Ala 1 5 10 <210> 245 <211> 16 <212> PRT <213> Homo sapiens <400> 245 Arg Ala Phe Pro Ala His Leu Pro Pro Ser Gln Ser Ile Pro Asp Ser 1 5 10 15 <210> 246 <211> 452 <212> PRT <213> Homo sapiens <400> 246 Met Asp Gly Thr Ile Lys Glu Ala Leu Ser Val Val Ser Asp Asp Gln 1 5 10 15 Ser Leu Phe Asp Ser Ala Tyr Gly Ala Ala Ala His Leu Pro Lys Ala 20 25 30 Asp Met Thr Ala Ser Gly Ser Pro Asp Tyr Gly Gln Pro His Lys Ile 35 40 45 Asn Pro Leu Pro Pro Gln Gln Glu Trp Ile Asn Gln Pro Val Arg Val 50 55 60 Asn Val Lys Arg Glu Tyr Asp His Met Asn Gly Ser Arg Glu Ser Pro 65 70 75 80 Val Asp Cys Ser Val Ser Lys Cys Ser Lys Leu Val Gly Gly Gly Glu 85 90 95 Ser Asn Pro Met Asn Tyr Asn Ser Tyr Met Asp Glu Lys Asn Gly Pro 100 105 110 Pro Pro Pro Asn Met Thr Thr Asn Glu Arg Arg Val Ile Val Pro Ala 115 120 125 Asp Pro Thr Leu Trp Thr Gln Glu His Val Arg Gln Trp Leu Glu Trp 130 135 140 Ala Ile Lys Glu Tyr Ser Leu Met Glu Ile Asp Thr Ser Phe Phe Gln 145 150 155 160 Asn Met Asp Gly Lys Glu Leu Cys Lys Met Asn Lys Glu Asp Phe Leu 165 170 175 Arg Ala Thr Thr Leu Tyr Asn Thr Glu Val Leu Leu Ser His Leu Ser 180 185 190 Tyr Leu Arg Glu Ser Ser Leu Leu Ala Tyr Asn Thr Thr Ser His Thr 195 200 205 Asp Gln Ser Ser Arg Leu Ser Val Lys Glu Asp Pro Ser Tyr Asp Ser 210 215 220 Val Arg Arg Gly Ala Trp Gly Asn Asn Met Asn Ser Gly Leu Asn Lys 225 230 235 240 Ser Pro Pro Leu Gly Gly Ala Gln Thr Ile Ser Lys Asn Thr Glu Gln 245 250 255 Arg Pro Gln Pro Asp Pro Tyr Gln Ile Leu Gly Pro Thr Ser Ser Arg 260 265 270 Leu Ala Asn Pro Gly Ser Gly Gln Ile Gln Leu Trp Gln Phe Leu Leu 275 280 285 Glu Leu Leu Ser Asp Ser Ala Asn Ala Ser Cys Ile Thr Trp Glu Gly 290 295 300 Thr Asn Gly Glu Phe Lys Met Thr Asp Pro Asp Glu Val Ala Arg Arg 305 310 315 320 Trp Gly Glu Arg Lys Ser Lys Pro Asn Met Asn Tyr Asp Lys Leu Ser 325 330 335 Arg Ala Leu Arg Tyr Tyr Tyr Asp Lys Asn Ile Met Thr Lys Val His 340 345 350 Gly Lys Arg Tyr Ala Tyr Lys Phe Asp Phe His Gly Ile Ala Gln Ala 355 360 365 Leu Gln Pro His Pro Thr Glu Ser Ser Met Tyr Lys Tyr Pro Ser Asp 370 375 380 Ile Ser Tyr Met Pro Ser Tyr His Ala His Gln Gln Lys Val Asn Phe 385 390 395 400 Val Pro Pro His Pro Ser Ser Met Pro Val Thr Ser Ser Ser Phe Phe 405 410 415 Gly Ala Ala Ser Gln Tyr Trp Thr Ser Pro Thr Gly Gly Ile Tyr Pro 420 425 430 Asn Pro Asn Val Pro Arg His Pro Asn Thr His Val Pro Ser His Leu 435 440 445 Gly Ser Tyr Tyr 450 <210> 247 <211> 14 <212> PRT <213> Homo sapiens <400> 247 Ser Leu Phe Asp Ser Ala Tyr Gly Ala Ala Ala His Leu Pro 1 5 10 <210> 248 <211> 18 <212> PRT <213> Homo sapiens <400> 248 His Lys Ile Asn Pro Leu Pro Pro Gln Ile Asn Gln Pro Val Arg Val 1 5 10 15 Asn Val <210> 249 <211> 17 <212> PRT <213> Homo sapiens <400> 249 Arg Glu Ser Pro Val Asp Cys Ser Val Ser Lys Cys Ser Lys Leu Val 1 5 10 15 Gly <210> 250 <211> 7 <212> PRT <213> Homo sapiens <400> 250 Thr Gln Glu His Val Arg Gln 1 5 <210> 251 <211> 8 <212> PRT <213> Homo sapiens <400> 251 Ser Ser Arg Leu Ser Val Lys Glu 1 5 <210> 252 <211> 9 <212> PRT <213> Homo sapiens <400> 252 Pro Asn Thr His Val Pro Ser His Leu 1 5 <210> 253 <211> 484 <212> PRT <213> Homo sapiens <400> 253 Met Glu Arg Arg Met Lys Ala Gly Tyr Leu Asp Gln Gln Val Pro Tyr 1 5 10 15 Thr Phe Ser Ser Lys Ser Pro Gly Asn Gly Ser Leu Arg Glu Ala Leu 20 25 30 Ile Gly Pro Leu Gly Lys Leu Met Asp Pro Gly Ser Leu Pro Pro Leu 35 40 45 Asp Ser Glu Asp Leu Phe Gln Asp Leu Ser His Phe Gln Glu Thr Trp 50 55 60 Leu Ala Glu Ala Gln Val Pro Asp Ser Asp Glu Gln Phe Val Pro Asp 65 70 75 80 Phe His Ser Glu Asn Leu Ala Phe His Ser Pro Thr Thr Arg Ile Lys 85 90 95 Lys Glu Pro Gln Ser Pro Arg Thr Asp Pro Ala Leu Ser Cys Ser Arg 100 105 110 Lys Pro Pro Leu Pro Tyr His His Gly Glu Gln Cys Leu Tyr Ser Ser 115 120 125 Ala Tyr Asp Pro Pro Arg Gln Ile Ala Ile Lys Ser Pro Ala Pro Gly 130 135 140 Ala Leu Gly Gln Ser Pro Leu Gln Pro Phe Pro Arg Ala Glu Gln Arg 145 150 155 160 Asn Phe Leu Arg Ser Ser Gly Thr Ser Gln Pro His Pro Gly His Gly 165 170 175 Tyr Leu Gly Glu His Ser Ser Val Phe Gln Gln Pro Leu Asp Ile Cys 180 185 190 His Ser Phe Thr Ser Gln Gly Gly Gly Arg Glu Pro Leu Pro Ala Pro 195 200 205 Tyr Gln His Gln Leu Ser Glu Pro Cys Pro Pro Tyr Pro Gln Gln Ser 210 215 220 Phe Lys Gln Glu Tyr His Asp Pro Leu Tyr Glu Gln Ala Gly Gln Pro 225 230 235 240 Ala Val Asp Gln Gly Gly Val Asn Gly His Arg Tyr Pro Gly Ala Gly 245 250 255 Val Val Ile Lys Gln Glu Gln Thr Asp Phe Ala Tyr Asp Ser Asp Val 260 265 270 Thr Gly Cys Ala Ser Met Tyr Leu His Thr Glu Gly Phe Ser Gly Pro 275 280 285 Ser Pro Gly Asp Gly Ala Met Gly Tyr Gly Tyr Glu Lys Pro Leu Arg 290 295 300 Pro Phe Pro Asp Asp Val Cys Val Val Pro Glu Lys Phe Glu Gly Asp 305 310 315 320 Ile Lys Gln Glu Gly Val Gly Ala Phe Arg Glu Gly Pro Pro Tyr Gln 325 330 335 Arg Arg Gly Ala Leu Gln Leu Trp Gln Phe Leu Val Ala Leu Leu Asp 340 345 350 Asp Pro Thr Asn Ala His Phe Ile Ala Trp Thr Gly Arg Gly Met Glu 355 360 365 Phe Lys Leu Ile Glu Pro Glu Glu Val Ala Arg Leu Trp Gly Ile Gln 370 375 380 Lys Asn Arg Pro Ala Met Asn Tyr Asp Lys Leu Ser Arg Ser Leu Arg 385 390 395 400 Tyr Tyr Tyr Glu Lys Gly Ile Met Gln Lys Val Ala Gly Glu Arg Tyr 405 410 415 Val Tyr Lys Phe Val Cys Glu Pro Glu Ala Leu Phe Ser Leu Ala Phe 420 425 430 Pro Asp Asn Gln Arg Pro Ala Leu Lys Ala Glu Phe Asp Arg Pro Val 435 440 445 Ser Glu Glu Asp Thr Val Pro Leu Ser His Leu Asp Glu Ser Pro Ala 450 455 460 Tyr Leu Pro Glu Leu Ala Gly Pro Ala Gln Pro Phe Gly Pro Lys Gly 465 470 475 480 Gly Tyr Ser Tyr <210> 254 <211> 12 <212> PRT <213> Homo sapiens <400> 254 Gly Tyr Leu Asp Gln Gln Val Pro Tyr Thr Phe Ser 1 5 10 <210> 255 <211> 11 <212> PRT <213> Homo sapiens <400> 255 Leu Arg Glu Ala Leu Ile Gly Pro Leu Gly Lys 1 5 10 <210> 256 <211> 7 <212> PRT <213> Homo sapiens <400> 256 Leu Phe Gln Asp Leu Ser His 1 5 <210> 257 <211> 7 <212> PRT <213> Homo sapiens <400> 257 Ser Glu Asn Leu Ala Phe His 1 5 <210> 258 <211> 7 <212> PRT <213> Homo sapiens <400> 258 Thr Asp Pro Ala Leu Ser Cys 1 5 <210> 259 <211> 20 <212> PRT <213> Homo sapiens <400> 259 Ser Arg Lys Pro Pro Leu Pro Tyr His His Gly Glu Gln Cys Leu Tyr 1 5 10 15 Ser Ser Ala Tyr 20 <210> 260 <211> 25 <212> PRT <213> Homo sapiens <400> 260 Asp Pro Pro Arg Gln Ile Ala Ile Lys Ser Pro Ala Pro Gly Ala Leu 1 5 10 15 Gly Gln Ser Pro Leu Gln Pro Phe Pro 20 25 <210> 261 <211> 21 <212> PRT <213> Homo sapiens <400> 261 Ser Gln Pro His Pro Gly His Tyr Leu Gly Glu His Ser Ser Val Phe 1 5 10 15 Gln Gln Pro Leu Asp 20 <210> 262 <211> 5 <212> PRT <213> Homo sapiens <400> 262 Ile Cys His Ser Phe 1 5 <210> 263 <211> 21 <212> PRT <213> Homo sapiens <400> 263 Glu Pro Leu Pro Ala Pro Tyr Gln His Gln Leu Ser Glu Pro Cys Pro 1 5 10 15 Pro Tyr Pro Gln Gln 20 <210> 264 <211> 15 <212> PRT <213> Homo sapiens <400> 264 Tyr His Asp Pro Leu Tyr Glu Gln Gly Gln Pro Ala Val Asp Gln 1 5 10 15 <210> 265 <211> 10 <212> PRT <213> Homo sapiens <400> 265 Arg Tyr Pro Gly Ala Gly Val Val Ile Lys 1 5 10 <210> 266 <211> 12 <212> PRT <213> Homo sapiens <400> 266 Tyr Asp Ser Asp Val Thr Gly Cys Ala Ser Met Tyr 1 5 10 <210> 267 <211> 12 <212> PRT <213> Homo sapiens <400> 267 Tyr Glu Lys Pro Leu Arg Pro Phe Pro Asp Asp Val 1 5 10 <210> 268 <211> 5 <212> PRT <213> Homo sapiens <400> 268 Cys Val Val Pro Glu 1 5 <210> 269 <211> 71 <212> DNA <213> Homo sapiens <400> 269 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca g 71 <210> 270 <211> 142 <212> DNA <213> Homo sapiens <400> 270 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca ggtcatattg aacattccag atacctatca ttactcgatg ctgttgataa 120 cagcaagatg gctttgaact ca 142 <210> 271 <211> 365 <212> DNA <213> Homo sapiens <400> 271 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca ggtcatattg aacattccag atacctatca ttactcgatg ctgttgataa 120 cagcaagatg gctttgaact cagggtcacc accagctatt ggaccttact atgaaaacca 180 tggataccaa ccggaaaacc cctatcccgc acagcccact gtggtcccca ctgtctacga 240 ggtgcatccg gctcagtact acccgtcccc cgtgccccag tacgccccga gggtcctgac 300 gcaggcttcc aaccccgtcg tctgcacgca gcccaaatcc ccatccggga cagtgtgcac 360 ctcaa 365 <210> 272 <211> 452 <212> DNA <213> Homo sapiens <400> 272 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca ggtcatattg aacattccag atacctatca ttactcgatg ctgttgataa 120 cagcaagatg gctttgaact cagggtcacc accagctatt ggaccttact atgaaaacca 180 tggataccaa ccggaaaacc cctatcccgc acagcccact gtggtcccca ctgtctacga 240 ggtgcatccg gctcagtact acccgtcccc cgtgccccag tacgccccga gggtcctgac 300 gcaggcttcc aaccccgtcg tctgcacgca gcccaaatcc ccatccggga cagtgtgcac 360 ctcaaagact aagaaagcac tgtgcatcac cttgaccctg gggaccttcc tcgtgggagc 420 tgcgctggcc gctggcctac tctggaagtt ca 452 <210> 273 <211> 572 <212> DNA <213> Homo sapiens <400> 273 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca ggtcatattg aacattccag atacctatca ttactcgatg ctgttgataa 120 cagcaagatg gctttgaact cagggtcacc accagctatt ggaccttact atgaaaacca 180 tggataccaa ccggaaaacc cctatcccgc acagcccact gtggtcccca ctgtctacga 240 ggtgcatccg gctcagtact acccgtcccc cgtgccccag tacgccccga gggtcctgac 300 gcaggcttcc aaccccgtcg tctgcacgca gcccaaatcc ccatccggga cagtgtgcac 360 ctcaaagact aagaaagcac tgtgcatcac cttgaccctg gggaccttcc tcgtgggagc 420 tgcgctggcc gctggcctac tctggaagtt catgggcagc aagtgctcca actctgggat 480 agagtgcgac tcctcaggta cctgcatcaa cccctctaac tggtgtgatg gcgtgtcaca 540 ctgccccggc ggggaggacg agaatcggtg tg 572 <210> 274 <211> 67 <212> DNA <213> Homo sapiens <400> 274 ctttgataaa taagtttgta agaggagcct cagcatcgta aagagctttt ctccccgctt 60 ctcgcag 67 <210> 275 <211> 33 <212> DNA <213> Homo sapiens <400> 275 atcgtaaaga gcttttctcc ccgcttctcg cag 33 <210> 276 <211> 102 <212> DNA <213> Homo sapiens <400> 276 gttattccag gatctttgga gacccgagga aagccgtgtt gaccaaaagc aagacaaatg 60 actcacagag aaaaaagatg gcagaaccaa gggcaactaa ag 102 <210> 277 <211> 86 <212> DNA <213> Homo sapiens <400> 277 ccgtcaggtt ctgaacagct ggtagatggg ctggcttact gaaggacatg attcagactg 60 tcccggaccc agcagctcat atcaag 86 <210> 278 <211> 218 <212> DNA <213> Homo sapiens <400> 278 gaagccttat cagttgtgag tgaggaccag tcgttgtttg agtgtgccta cggaacgcca 60 cacctggcta agacagagat gaccgcgtcc tcctccagcg actatggaca gacttccaag 120 atgagcccac gcgtccctca gcaggattgg ctgtctcaac ccccagccag ggtcaccatc 180 aaaatggaat gtaaccctag ccaggtgaat ggctcaag 218 <210> 279 <211> 152 <212> DNA <213> Homo sapiens <400> 279 gaactctcct gatgaatgca gtgtggccaa aggcgggaag atggtgggca gcccagacac 60 cgttgggatg aactacggca gctacatgga ggagaagcac atgccacccc caaacatgac 120 cacgaacgag cgcagagtta tcgtgccagc ag 152 <210> 280 <211> 204 <212> DNA <213> Homo sapiens <400> 280 atcctacgct atggagtaca gaccatgtgc ggcagtggct ggagtgggcg gtgaaagaat 60 atggccttcc agacgtcaac atcttgttat tccagaacat cgatgggaag gaactgtgca 120 agatgaccaa ggacgacttc cagaggctca cccccagcta caacgccgac atccttctct 180 cacatctcca ctacctcaga gaga 204 <210> 281 <211> 81 <212> DNA <213> Homo sapiens <400> 281 ctcctcttcc acatttgact tcagatgatg ttgataaagc cttacaaaac tctccacggt 60 taatgcatgc tagaaacaca g 81 <210> 282 <211> 72 <212> DNA <213> Homo sapiens <400> 282 ggggtgcagc ttttattttc ccaaatactt cagtatatcc tgaagctacg caaagaatta 60 caactaggcc ag 72 <210> 283 <211> 69 <212> DNA <213> Homo sapiens <400> 283 atttaccata tgagcccccc aggagatcag cctggaccgg tcacggccac cccacgcccc 60 agtcgaaag 69 <210> 284 <211> 57 <212> DNA <213> Homo sapiens <400> 284 ctgctcaacc atctccttcc acagtgccca aaactgaaga ccagcgtcct cagttag 57 <210> 285 <211> 48 <212> DNA <213> Homo sapiens <400> 285 atccttatca gattcttgga ccaacaagta gccgccttgc aaatccag 48 <210> 286 <211> 521 <212> DNA <213> Homo sapiens <400> 286 gcagtggcca gatccagctt tggcagttcc tcctggagct cctgtcggac agctccaact 60 ccagctgcat cacctgggaa ggcaccaacg gggagttcaa gatgacggat cccgacgagg 120 tggcccggcg ctggggagag cggaagagca aacccaacat gaactacgat aagctcagcc 180 gcgccctccg ttactactat gacaagaaca tcatgaccaa ggtccatggg aagcgctacg 240 cctacaagtt cgacttccac gggatcgccc aggccctcca gccccacccc ccggagtcat 300 ctctgtacaa gtacccctca gacctcccgt acatgggctc ctatcacgcc cacccacaga 360 agatgaactt tgtggcgccc caccctccag ccctccccgt gacatcttcc agtttttttg 420 ctgccccaaa cccatactgg aattcaccaa ctgggggtat ataccccaac actaggctcc 480 ccaccagcca tatgccttct catctgggca cttactacta a 521 <210> 287 <211> 54 <212> DNA <213> Homo sapiens <400> 287 ctcaggtacc tgacaatgat gagcagtttg taccagacta tcaggctgaa agtt 54 <210> 288 <211> 130 <212> DNA <213> Homo sapiens <400> 288 tggcttttca tggcctgcca ctgaaaatca agaaagaacc ccacagtcca tgttcagaaa 60 tcagctctgc ctgcagtcaa gaacagccct ttaaattcag ctatggagaa aagtgcctgt 120 acaatgtcag 130 <210> 289 <211> 189 <212> DNA <213> Homo sapiens <400> 289 tgcctatgat cagaagccac aagtgggaat gaggccctcc aaccccccca caccatccag 60 cacgccagtg tccccactgc atcatgcatc tccaaactca actcatacac cgaaacctga 120 ccgggccttc ccagctcacc tccctccatc gcagtccata ccagatagca gctaccccat 180 ggaccacag 189 <210> 290 <211> 248 <212> DNA <213> Homo sapiens <400> 290 atttcgccgc cagctttctg aaccctgtaa ctcctttcct cctttgccga cgatgccaag 60 ggaaggacgt cctatgtacc aacgccagat gtctgagcca aacatcccct tcccaccaca 120 aggctttaag caggagtacc acgacccagt gtatgaacac aacaccatgg ttggcagtgc 180 ggccagccaa agctttcccc ctcctctgat gattaaacag gaacccagag attttgcata 240 tgactcag 248 <210> 291 <211> 69 <212> DNA <213> Homo sapiens <400> 291 aagtgcctag ctgccactcc atttatatga ggcaagaagg cttcctggct catcccagca 60 gaacagaag 69 <210> 292 <211> 69 <212> DNA <213> Homo sapiens <400> 292 gctgtatgtt tgaaaagggc cccaggcagt tttatgatga cacctgtgtt gtcccagaaa 60 aattcgatg 69 <210> 293 <211> 170 <212> DNA <213> Homo sapiens <400> 293 gagacatcaa acaagagcca ggaatgtatc gggaaggacc cacataccaa cggcgaggat 60 cacttcagct ctggcagttt ttggtagctc ttctggatga cccttcaaat tctcatttta 120 ttgcctggac tggtcgaggc atggaattta aactgattga gcctgaagag 170 <210> 294 <211> 102 <212> DNA <213> Homo sapiens <400> 294 gtggcccgac gttggggcat tcagaaaaac aggccagcta tgaactatga taaacttagc 60 cgttcactcc gctattacta tgagaaagga attatgcaaa ag 102 <210> 295 <211> 222 <212> DNA <213> Homo sapiens <400> 295 gtggctggag agagatatgt ctacaagttt gtgtgtgatc cagaagccct tttctccatg 60 gcctttccag ataatcagcg tccactgctg aagacagaca tggaacgtca catcaacgag 120 gaggacacag tgcctctttc tcactttgat gagagcatgg cctacatgcc ggaagggggc 180 tgctgcaacc cccaccccta caacgaaggc tacgtgtatt aa 222 <210> 296 <211> 93 <212> DNA <213> Homo sapiens <400> 296 aaatcgcccg gaaatgggag cttgcgcgaa gcgctgatcg gcccgctggg gaagctcatg 60 gacccgggct ccctgccgcc ctcgactctg aag 93 <210> 297 <211> 48 <212> DNA <213> Homo sapiens <400> 297 atctcttcca ggatctaagt cacttccagg agacgtggct cgctgaag 48 <210> 298 <211> 54 <212> DNA <213> Homo sapiens <400> 298 ctcaggtacc agacagtgat gagcagtttg ttcctgattt ccattcagaa aacc 54 <210> 299 <211> 127 <212> DNA <213> Homo sapiens <400> 299 tagctttcca cagccccacc accaggatca agaaggagcc ccagagtccc cgcacagacc 60 cggccctgtc ctgcagcagg aagccgccac tcccctacca ccatggcgag cagtgccttt 120 actccag 127 <210> 300 <211> 162 <212> DNA <213> Homo sapiens <400> 300 tgcctatgac ccccccagac aaatcgccat caagtcccct gcccctggtg cccttggaca 60 gtcgccccta cagccctttc cccgggcaga gcaacggaat ttcctgagat cctctggcac 120 ctcccagccc caccctggcc atgggtacct cggggaacat ag 162 <210> 301 <211> 266 <212> DNA <213> Homo sapiens <400> 301 ctccgtcttc cagcagcccc tggacatttg ccactccttc acatctcagg gagggggccg 60 ggaacccctc ccagccccct accaacacca gctgtcggag ccctgcccac cctatcccca 120 gcagagcttt aagcaagaat accatgatcc cctgtatgaa caggcgggcc agccagccgt 180 ggaccagggt ggggtcaatg ggcacaggta cccaggggcg ggggtggtga tcaaacagga 240 acagacggac ttcgcctacg actcag 266 <210> 302 <211> 75 <212> DNA <213> Homo sapiens <400> 302 gtgtcaccgg gtgcgcatca atgtacctcc acacagaggg cttctctggg ccctctccag 60 gtgacggggc catgg 75 <210> 303 <211> 69 <212> DNA <213> Homo sapiens <400> 303 gctatggcta tgagaaacct ctgcgaccat tcccagatga tgtctgcgtt gtccctgaga 60 aatttgaag 69 <210> 304 <211> 173 <212> DNA <213> Homo sapiens <400> 304 gagacatcaa gcaggaaggg gtcggtgcat ttcgagaggg gccgccctac cagcgccggg 60 gtgccctgca gctgtggcaa tttctggtgg ccttgctgga tgacccaaca aatgcccatt 120 tcattgcctg gacgggccgg ggaatggagt tcaagctcat tgagcctgag gag 173 <210> 305 <211> 102 <212> DNA <213> Homo sapiens <400> 305 gtcgccaggc tctggggcat ccagaagaac cggccagcca tgaattacga caagctgagc 60 cgctcgctcc gatactatta tgagaaaggc atcatgcaga ag 102 <210> 306 <211> 225 <212> DNA <213> Homo sapiens <400> 306 gtggctggtg agcgttacgt gtacaagttt gtgtgtgagc ccgaggccct cttctctttg 60 gccttcccgg acaatcagcg tccagctctc aaggctgagt ttgaccggcc tgtcagtgag 120 gaggacacag tccctttgtc ccacttggat gagagccccg cctacctccc agagctggct 180 ggccccgccc agccatttgg ccccaagggt ggctactctt actag 225 <210> 307 <211> 3226 <212> DNA <213> Homo sapiens <400> 307 cgcgagctaa gcaggaggcg gaggcggagg cggagggcga ggggcgggga gcgccgcctg 60 gagcgcggca ggtcatattg aacattccag atacctatca ttactcgatg ctgttgataa 120 cagcaagatg gctttgaact cagggtcacc accagctatt ggaccttact atgaaaacca 180 tggataccaa ccggaaaacc cctatcccgc acagcccact gtggtcccca ctgtctacga 240 ggtgcatccg gctcagtact acccgtcccc cgtgccccag tacgccccga gggtcctgac 300 gcaggcttcc aaccccgtcg tctgcacgca gcccaaatcc ccatccggga cagtgtgcac 360 ctcaaagact aagaaagcac tgtgcatcac cttgaccctg gggaccttcc tcgtgggagc 420 tgcgctggcc gctggcctac tctggaagtt catgggcagc aagtgctcca actctgggat 480 agagtgcgac tcctcaggta cctgcatcaa cccctctaac tggtgtgatg gcgtgtcaca 540 ctgccccggc ggggaggacg agaatcggtg tgttcgcctc tacggaccaa acttcatcct 600 tcagatgtac tcatctcaga ggaagtcctg gcaccctgtg tgccaagacg actggaacga 660 gaactacggg cgggcggcct gcagggacat gggctataag aataattttt actctagcca 720 aggaatagtg gatgacagcg gatccaccag ctttatgaaa ctgaacacaa gtgccggcaa 780 tgtcgatatc tataaaaaac tgtaccacag tgatgcctgt tcttcaaaag cagtggtttc 840 tttacgctgt atagcctgcg gggtcaactt gaactcaagc cgccagagca ggatcgtggg 900 cggtgagagc gcgctcccgg gggcctggcc ctggcaggtc agcctgcacg tccagaacgt 960 ccacgtgtgc ggaggctcca tcatcacccc cgagtggatc gtgacagccg cccactgcgt 1020 ggaaaaacct cttaacaatc catggcattg gacggcattt gcggggattt tgagacaatc 1080 tttcatgttc tatggagccg gataccaagt agaaaaagtg atttctcatc caaattatga 1140 ctccaagacc aagaacaatg acattgcgct gatgaagctg cagaagcctc tgactttcaa 1200 cgacctagtg aaaccagtgt gtctgcccaa cccaggcatg atgctgcagc cagaacagct 1260 ctgctggatt tccgggtggg gggccaccga ggagaaaggg aagacctcag aagtgctgaa 1320 cgctgccaag gtgcttctca ttgagacaca gagatgcaac agcagatatg tctatgacaa 1380 cctgatcaca ccagccatga tctgtgccgg cttcctgcag gggaacgtcg attcttgcca 1440 gggtgacagt ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga 1500 tacaagctgg ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat 1560 ggtattcacg gactggattt atcgacaaat gagggcagac ggctaatcca catggtcttc 1620 gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc gtgcatgatt 1680 tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac ttgtctggct 1740 ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc ctgctctccc 1800 taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg gtcaagtgtg 1860 gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt ccaggggcca 1920 attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag atgaaaaagg 1980 agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc tggggccact 2040 tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt cttagagcct 2100 tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt ggtgacgtgg 2160 tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa tatagacagt 2220 gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc tggtgcaggt 2280 ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct cctcatcctc 2340 cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg gcagggcgcc 2400 aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg aggtccatgg 2460 gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt ctacacattg 2520 ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca ccttcattta 2580 actctttgaa actgtatcac ctttgccaag taagagtggt ggcctatttc agctgctttg 2640 acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag caaagtgccc 2700 atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg gtcccttcca 2760 atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg ccataaccat 2820 gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc aagaatgaaa 2880 tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcttgcaat cccatttgca 2940 ggatccgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct tggaaacagt 3000 tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta atggtgaaaa 3060 cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc tttttttgta 3120 tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata aattatgcga 3180 tttttttttc aaagcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 3226 <210> 308 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 308 gatctttgtg acctact 17 <210> 309 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 309 ctaccccatg gaccacagat tt 22 <210> 310 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 310 cttaaagcct tgtggtggga ag 22 <210> 311 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 311 cgcagagtta tcgtgccagc agat 24 <210> 312 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 312 ccatattctt tcaccgccca ctcc 24 <210> 313 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 313 cgactggagc acgaggacac tga 23 <210> 314 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 314 catggactgt ggggttcttt cttg 24 <210> 315 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 315 agacatctgg cgttggtaca taggac 26 <210> 316 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 316 gagtcccaag tacgtccacg gtcag 25 <210> 317 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 317 ggactgtggg gttctttctt gattttc 27 <210> 318 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 318 tgcgggaaat cgggctgaag 20 <210> 319 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 319 ttttcctgac atttgttggt ttctcgtt 28 <210> 320 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 320 cgctggctcc gggtgacag 19 <210> 321 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 321 gtggggttct ttcttgattt tcagtgg 27 <210> 322 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 322 caactaacac tgcggcttcc tgag 24 <210> 323 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 323 cattcccact tgtggcttct gat 23 <210> 324 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 324 caggagtgta cgggaatgtg atggt 25 <210> 325 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 325 gattagccgt ctgccctcat ttgt 24 <210> 326 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 326 tgccatgaag atcagtacta cagcagaat 29 <210> 327 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 327 gtggcccata aactcatgaa tcacc 25 <210> 328 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 328 cagatcgtgg ccggtggttc t 21 <210> 329 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 329 gggtgcatca ggcaaatttc tacaag 26 <210> 330 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 330 caacaacaaa atgaggaact ggctact 27 <210> 331 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 331 attccatatt tgctcgctct gtcag 25 <210> 332 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 332 gaagatggaa gggcatgaaa ccag 24 <210> 333 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 333 gctgaccggg acggaggagt 20 <210> 334 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 334 tcgtgggcga ggggctgta 19 <210> 335 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 335 catccgaacg ccttcatcat agtgt 25 <210> 336 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 336 cttttctcta gggtgaaggg actctcg 27 <210> 337 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 337 cttcacccac aaggctcact gtagac 26 <210> 338 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 338 gctttggctt tgttactttt gatgacc 27 <210> 339 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 339 gcctttctta cttctgcatt atgaccatt 29 <210> 340 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 340 aaggacgtgc aaggatgttt ttatt 25 <210> 341 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 341 atgggaagat gggggctgtt 20 <210> 342 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 342 gtcaatggct aaaagatgga taaaagtgga 30 <210> 343 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 343 cagatagaag aggggttagc aaaatgtgtt 30 <210> 344 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 344 cagaaggcaa atgtgagagg atagtc 26 <210> 345 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 345 ctggatctgt aacacccgtg agc 23 <210> 346 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 346 aaaaagcaaa gacaagaccg tggatt 26 <210> 347 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 347 gaactacctg cgtgctgact tggagat 27 <210> 348 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 348 aaaaggcaaa gaggggttaa aacatacata 30 <210> 349 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 349 aacccctcct tccacttctc cact 24 <210> 350 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 350 tggaggcata gaaaagctga gaaataag 28 <210> 351 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 351 ttggtgctag aagaactggg agaaac 26 <210> 352 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 352 gaaagtcagg ggcacatata gattagag 28 <210> 353 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 353 gccttcccca tacagtttct cctt 24 <210> 354 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 354 aagttcgtta agcccaggat cgtaggta 28 <210> 355 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 355 atatgaagcc agcagccagg tagca 25 <210> 356 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 356 ttagataaac tgaaagccga acctgaac 28 <210> 357 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 357 caaactggca agcaatgtga actgt 25 <210> 358 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 358 tcaccgacaa aacccataga gaaagagt 28 <210> 359 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 359 ttaaatggtg aggcaatgag gaaagtg 27 <210> 360 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 360 ttgctcattc tctttctccc ctacactaa 29 <210> 361 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 361 tccccaccac caaccatcct c 21 <210> 362 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 362 ctgggggaaa agcaagtagg aaagta 26 <210> 363 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 363 acaagagtta gtcacggcaa aggagtt 27 <210> 364 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 364 gccctttgcc catgagaact aa 22 <210> 365 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 365 tcccagaaga gatgatatga ggtgtc 26 <210> 366 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 366 tcagtcccat ctccccctaa acca 24 <210> 367 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 367 caccattctc acccgaccac attg 24 <210> 368 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 368 tgtaaactgc aatgaaaaga aaagaaaaag 30 <210> 369 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 369 caagagatgg gagaggaaga atgaataata 30 <210> 370 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 370 ctatctagtc ccttacgctt tccctgtg 28 <210> 371 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 371 cattagcatt tggcctttgg tca 23 <210> 372 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 372 tgcctcccca taagtcacca atctc 25 <210> 373 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 373 cctgtattct aaccctggac ttctcatcaa 30 <210> 374 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 374 cttgtttatt ggcctagtcc tttgtgct 28 <210> 375 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 375 gctttgtggg tagtcctgtc tgagtg 26 <210> 376 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 376 ggcccatccc ggtttgctaa 20 <210> 377 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 377 gtttccccac cacttccttt ctatgtc 27 <210> 378 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 378 gcacaagaca tacacgcaga tacac 25 <210> 379 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 379 aacgctggac tatggaactt tacctg 26 <210> 380 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 380 tcctctcatt cattttgcat tcgtgttag 29 <210> 381 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 381 ggctttgagg gattactggg ttgttct 27 <210> 382 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 382 gcagggcaaa gaagcagtag g 21 <210> 383 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 383 ggatcccaat ttagtttcaa gttacg 26 <210> 384 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 384 atgtgctggc tagattggac tgaaaa 26 <210> 385 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 385 caataaagct ggaggggtga taaataaat 29 <210> 386 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 386 ttagaaggag acaatcttat tccag 25 <210> 387 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 387 ctcttaaaga gatgaagcag ggag 24 <210> 388 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 388 ttggctagat acagggtgaa tatt 24 <210> 389 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 389 tgaattcatg tgtgtagctg agcc 24 <210> 390 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 390 tgacagcggg aataaagtac atgc 24 <210> 391 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 391 gttgggaggt ttacttgcca atta 24 <210> 392 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 392 acattttgct aacccctctt ctatct 26 <210> 393 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 393 tcaacctcaa aaataaatgg catct 25 <210> 394 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 394 gcatggcccc cgaggagat 19 <210> 395 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 395 cttggcccat gaaaaggact gtt 23 <210> 396 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 396 aggtacggga ccctgttcac gat 23 <210> 397 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 397 ctaccagcat gctaaagcga ttgtct 26 <210> 398 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 398 cgagtccaag cgggagacag aata 24 <210> 399 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 399 tacacccctg ggactcagca catt 24 <210> 400 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 400 ttcattttgg ccatctcttc cttcag 26 <210> 401 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 401 tatccagctc gtacctcatt tcctct 26 <210> 402 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 402 gcccaccagc tccaacacag 20 <210> 403 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 403 gaagggtcaa gcaggaggtc atag 24 <210> 404 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 404 ccctgtggat gactgagtac ctgaac 26 <210> 405 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 405 ggcatcccag cctccgttat c 21 <210> 406 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 406 aattttgtgc tgcccgatga tgac 24 <210> 407 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 407 ggaacagaag gccgggaggt agt 23 <210> 408 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 408 gaaggccaag tggtccgtgt ga 22 <210> 409 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 409 cagctgttgt actccttgcc attgaa 26 <210> 410 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 410 gcctatgccc cctgagagtg 20 <210> 411 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 411 gcttgagttg gcctagtttg ttgttc 26 <210> 412 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 412 tgcccggacc aaggatacag t 21 <210> 413 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 413 agcgcgtggc cgaactcat 19 <210> 414 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 414 tacggctctg aagtcaccac caaaat 26 <210> 415 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 415 ccccagctca caattccagt caa 23 <210> 416 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 416 ccgaaggctt tgcttactaa gtttctga 28 <210> 417 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 417 cactgccctt gtttgcctga atg 23 <210> 418 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 418 agctcccgtt tgatcttggt tgg 23 <210> 419 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 419 catggtaggc tcctgtttga ctttg 25 <210> 420 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 420 ttcgagatga tgccattgaa 20 <210> 421 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 421 tcctgaattt tctcccatgc 20 <210> 422 <211> 0 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 422 000 <210> 423 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 423 acgagaactg ggtgtccaac 20 <210> 424 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 424 actccagcag gcagactcat 20 <210> 425 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 425 ttctaaattt ttatgaagcc aatttc 26 <210> 426 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 426 cagatccagt ctgtgccact 20 <210> 427 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 427 tgcaccacca actgcttagc 20 <210> 428 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 428 ggcatggact gtggtcatga g 21 <210> 429 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 429 catggactgt ggggttcttt cttg 24 <210> 430 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 430 gagccacgtc tcctggaagt gact 24 <210> 431 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 431 gaaagggctg taggggcgac tgt 23 <210> 432 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 432 cgcagagtta tcgtgccagc aga 23 <210> 433 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 433 ccatattctt tcaccgccca ctcc 24 <210> 434 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 434 ctaccccatg gaccacagat tt 22 <210> 435 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 435 cttaaagcct tgtggtggga ag 22 <210> 436 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 436 ctggccggtt cttctggatg c 21 <210> 437 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 437 cgggccgggg aatggagt 18 <210> 438 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 438 caccatggat tacaaggatg acgacgataa gtcgggttat tcgagtgacc gagaccgcgg 60 c 61 <210> 439 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 439 ctagtaagag tagccaccct tggggcca 28

Claims (18)

  1. (a) 환자로부터의 샘플을 제공하고;
    (b) 샘플 내에서 SLC45A3 유전자의 전사 조절 영역으로부터의 5' 부분 및 ERG 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는
    것을 포함하고, 여기서 샘플 내의 유전자 융합체 존재의 검출이 환자에서 전립선암을 확인하는 것인, 환자에서 전립선암을 확인하는 방법.
  2. 제1항에 있어서, SLC45A3 유전자의 전사 조절 영역이 SLC45A3 유전자의 프로모터 영역을 포함하는 것인 방법.
  3. 제1항에 있어서, 단계 (b)가 SLC45A3 유전자의 전사 조절 영역으로부터의 5' DNA 부분 및 ERG 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함하는 것인 방법.
  4. 제1항에 있어서, 단계 (b)가 SLC45A3 유전자의 전사 조절 영역으로부터 전사된 5' RNA 부분 및 ERG 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함하는 것인 방법.
  5. 제1항에 있어서, 샘플이 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 및 전립선 세포로 이루어진 군으로부터 선택되는 것인 방법.
  6. (a) 환자로부터의 샘플을 제공하고;
    (b) 샘플 내에서 FLJ35294 유전자의 전사 조절 영역으로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는
    것을 포함하고, 여기서 샘플 내의 유전자 융합체 존재의 검출이 환자에서 전립선암을 확인하는 것인, 환자에서 전립선암을 확인하는 방법.
  7. 제6항에 있어서, FLJ35294 유전자의 전사 조절 영역이 FLJ35294 유전자의 프로모터 영역을 포함하는 것인 방법.
  8. 제6항에 있어서, ETS 부류 구성원 유전자가 ETV1인 방법.
  9. 제6항에 있어서, 단계 (b)가 FLJ35294 유전자의 전사 조절 영역으로부터의 5' DNA 부분 및 ETS 부류 구성원 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함하는 것인 방법.
  10. 제6항에 있어서, 단계 (b)가 FLJ35294 유전자의 전사 조절 영역으로부터 전사된 5' RNA 부분 및 ETS 부류 구성원 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함하는 것인 방법.
  11. 제6항에 있어서, 샘플이 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 및 전립선 세포로 이루어진 군으로부터 선택되는 것인 방법.
  12. (a) 환자로부터의 샘플을 제공하고;
    (b) 샘플 내에서 DDX5 유전자로부터의 5' 부분 및 ETS 부류 구성원 유전자로부터의 3' 부분을 갖는 유전자 융합체의 존재 또는 부재를 검출하는
    것을 포함하고, 여기서 샘플 내의 유전자 융합체 존재의 검출이 환자에서 전립선암을 확인하는 것인, 환자에서 전립선암을 확인하는 방법.
  13. 제12항에 있어서, ETS 부류 구성원 유전자가 ETV4인 방법.
  14. 제12항에 있어서, 단계 (b)가 DDX5 유전자로부터의 5' DNA 부분 및 ETS 부류 구성원 유전자로부터의 3' DNA 부분을 갖는 게놈 DNA의 염색체 재배열을 검출하는 것을 포함하는 것인 방법.
  15. 제12항에 있어서, 단계 (b)가 DDX5 유전자로부터 전사된 5' RNA 부분 및 ETS 부류 구성원 유전자로부터 전사된 3' RNA 부분을 갖는 키메라 mRNA 전사체를 검출하는 것을 포함하는 것인 방법.
  16. 제12항에 있어서, 단계 (b)가 DDX5 유전자에 의해 코딩된 아미노-말단 부분 및 ETS 부류 구성원 유전자에 의해 코딩된 카르복시-말단 부분을 갖는 키메라 단백질을 검출하는 것을 포함하는 것인 방법.
  17. 제12항에 있어서, 샘플이 조직, 혈액, 혈장, 혈청, 소변, 소변 상청액, 소변 세포 펠릿, 정액, 전립선 분비물 및 전립선 세포로 이루어진 군으로부터 선택되는 것인 방법.
  18. (a) 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분이 SLC45A3 유전자의 전사 조절 영역으로부터의 것이고 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분이 ERG 유전자로부터의 것인, 키메라 게놈 DNA 또는 키메라 mRNA의 접합부에 혼성화하는 서열을 포함하는 올리고뉴클레오티드 프로브;
    (b) SLC45A3 유전자의 전사 조절 영역으로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 올리고뉴클레오티드 프로브, 및 ERG 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 올리고뉴클레오티드 프로브;
    (c) SLC45A3 유전자의 전사 조절 영역으로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오티드, 및 ERG 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오티드;
    (d) 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분이 FLJ35294 유전자의 전사 조절 영역으로부터의 것이고 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분이 ETV1 유전자로부터의 것인, 키메라 게놈 DNA 또는 키메라 mRNA의 접합부에 혼성화하는 서열을 포함하는 올리고뉴클레오티드 프로브;
    (e) FLJ35294 유전자의 전사 조절 영역으로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 올리고뉴클레오티드 프로브, 및 ETV1 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 올리고뉴클레오티드 프로브;
    (f) FLJ35294 유전자의 전사 조절 영역으로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오티드, 및 ETV1 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오티드;
    (g) 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분이 DDX5 유전자로부터의 것이고 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분이 ETV4 유전자로부터의 것인, 키메라 게놈 DNA 또는 키메라 mRNA의 접합부에 혼성화하는 서열을 포함하는 올리고뉴클레오티드 프로브;
    (h) DDX5 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 올리고뉴클레오티드 프로브, 및 ETV4 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 올리고뉴클레오티드 프로브;
    (i) DDX5 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오티드, 및 ETV4 유전자로부터의 키메라 게놈 DNA 또는 키메라 mRNA의 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오티드;
    (j) DDX5 유전자에 의해 코딩된 아미노-말단 부분 및 ETV4 유전자에 의해 코딩된 카르복시-말단 부분을 갖는 키메라 단백질에 대한 항체
    중 하나 이상을 포함하는 조성물.
KR1020117013985A 2008-11-18 2009-11-18 전립선암에서의 반복적 유전자 융합체 KR20110084995A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/272,865 US9957569B2 (en) 2005-09-12 2008-11-18 Recurrent gene fusions in prostate cancer
US12/272,865 2008-11-18

Publications (1)

Publication Number Publication Date
KR20110084995A true KR20110084995A (ko) 2011-07-26

Family

ID=41668351

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117013985A KR20110084995A (ko) 2008-11-18 2009-11-18 전립선암에서의 반복적 유전자 융합체

Country Status (10)

Country Link
US (1) US9957569B2 (ko)
EP (1) EP2358899A2 (ko)
JP (3) JP2012509068A (ko)
KR (1) KR20110084995A (ko)
CN (1) CN102812130A (ko)
AU (1) AU2009316693B2 (ko)
BR (1) BRPI0916121A8 (ko)
CA (1) CA2744059A1 (ko)
IL (1) IL212964A0 (ko)
WO (1) WO2010059702A2 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2622295C (en) 2005-09-12 2019-01-15 The Regents Of The University Of Michigan Recurrent gene fusions in prostate cancer
US9957569B2 (en) 2005-09-12 2018-05-01 The Regents Of The University Of Michigan Recurrent gene fusions in prostate cancer
WO2008039774A1 (en) 2006-09-25 2008-04-03 Mayo Foundation For Medical Education And Research Extracellular and membrane-associated prostate cancer markers
US8338109B2 (en) 2006-11-02 2012-12-25 Mayo Foundation For Medical Education And Research Predicting cancer outcome
WO2009009431A2 (en) 2007-07-06 2009-01-15 The Regents Of The University Of Michigan Mipol1-etv1 gene rearrangements
WO2009020521A2 (en) 2007-08-03 2009-02-12 The Brigham And Women's Hospital, Inc. Identification and treatment of estrogen responsive prostate tumors
CA2725978A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
US10407731B2 (en) 2008-05-30 2019-09-10 Mayo Foundation For Medical Education And Research Biomarker panels for predicting prostate cancer outcomes
AU2010203517B2 (en) * 2009-01-09 2012-08-16 The Regents Of The University Of Michigan Recurrent gene fusions in cancer
EP3546596B1 (en) 2009-05-26 2022-05-11 Quest Diagnostics Investments Incorporated Use of a kit for detecting gene dysregulations
CN102712953A (zh) 2009-09-17 2012-10-03 密歇根大学董事会 前列腺癌中的复发性基因融合物
US8546552B2 (en) 2009-12-23 2013-10-01 Quest Diagnostics Investments Incorporated TMPRSS2 for the diagnosis of prostate disease
US9315802B2 (en) 2009-12-30 2016-04-19 Quest Diagnostics Investments Incorporated RNA isolation from soluble urine fractions
US20130267443A1 (en) 2010-11-19 2013-10-10 The Regents Of The University Of Michigan ncRNA AND USES THEREOF
US8945556B2 (en) 2010-11-19 2015-02-03 The Regents Of The University Of Michigan RAF gene fusions
EP3336200A1 (en) * 2010-11-19 2018-06-20 The Regents Of The University Of Michigan Prostate cancer ncrna and uses thereof
US9663781B2 (en) 2010-12-30 2017-05-30 Quest Diagnostics Investments Incorporated Diagnosis of prostate cancer
EP2791359B1 (en) 2011-12-13 2020-01-15 Decipher Biosciences, Inc. Cancer diagnostics using non-coding transcripts
WO2013123035A1 (en) 2012-02-13 2013-08-22 Molecular Systems Corporation System and method for processing and detecting nucleic acids
US11648561B2 (en) 2012-02-13 2023-05-16 Neumodx Molecular, Inc. System and method for processing and detecting nucleic acids
CA2881627A1 (en) 2012-08-16 2014-02-20 Genomedx Biosciences Inc. Cancer diagnostics using biomarkers
WO2014066376A1 (en) * 2012-10-25 2014-05-01 Neumodx Molecular, Inc. Method and materials for isolation of nucleic acid materials
CN103336914B (zh) * 2013-05-31 2016-05-25 中国人民解放军国防科学技术大学 一种提取荟萃生物标志物的方法及装置
US9994912B2 (en) 2014-07-03 2018-06-12 Abbott Molecular Inc. Materials and methods for assessing progression of prostate cancer
CA2995457A1 (en) * 2015-08-13 2017-02-16 Dyax Corp. Evacuated blood collection tubes containing protease inhibitors for the assessment of contact system activation
CN110506127B (zh) 2016-08-24 2024-01-12 维拉科特Sd公司 基因组标签预测前列腺癌患者对术后放射疗法应答性的用途
US11208697B2 (en) 2017-01-20 2021-12-28 Decipher Biosciences, Inc. Molecular subtyping, prognosis, and treatment of bladder cancer
CN106866824B (zh) * 2017-03-06 2020-10-27 哈尔滨医科大学 一种抗ddx5的全人源单克隆抗体及其制备方法和应用
CA3055925A1 (en) 2017-03-09 2018-09-13 Decipher Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
WO2018175273A1 (en) 2017-03-21 2018-09-27 The Regents Of The University Of Michigan Erg targeted therapy
AU2018266733A1 (en) 2017-05-12 2020-01-16 Veracyte, Inc. Genetic signatures to predict prostate cancer metastasis and identify tumor aggressiveness
US10964410B2 (en) * 2017-05-25 2021-03-30 Koninklijke Philips N.V. System and method for detecting gene fusion
US10769307B2 (en) 2018-05-30 2020-09-08 Bank Of America Corporation Processing system using natural language processing for performing dataset filtering and sanitization
CN113528660A (zh) * 2020-09-18 2021-10-22 深圳汇芯生物医疗科技有限公司 前列腺癌的风险评估装置
CN112522404B (zh) * 2020-12-10 2023-06-09 珠海中科先进技术研究院有限公司 一种用于检测前列腺癌的多重荧光pcr试剂盒

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4109496A (en) 1977-12-20 1978-08-29 Norris Industries Trapped key mechanism
US4323546A (en) 1978-05-22 1982-04-06 Nuc Med Inc. Method and composition for cancer detection in humans
GB2043675B (en) * 1979-03-08 1983-02-23 British Gas Corp Gas oil purification
US4873191A (en) 1981-06-12 1989-10-10 Ohio University Genetic transformation of zygotes
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
ATE88761T1 (de) 1986-01-10 1993-05-15 Amoco Corp Kompetitiver homogener test.
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5080891A (en) 1987-08-03 1992-01-14 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
US5283174A (en) 1987-09-21 1994-02-01 Gen-Probe, Incorporated Homogenous protection assay
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US4968103A (en) 1988-07-22 1990-11-06 Photofinish Cosmetics Inc. Method of making a brush
US5225326A (en) 1988-08-31 1993-07-06 Research Development Foundation One step in situ hybridization assay
ATE282716T1 (de) 1989-07-11 2004-12-15 Gen Probe Inc Verfahren zur amplifikation von nukleinsäuresequenzen
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5614396A (en) 1990-06-14 1997-03-25 Baylor College Of Medicine Methods for the genetic modification of endogenous genes in animal cells by homologous recombination
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5270184A (en) 1991-11-19 1993-12-14 Becton, Dickinson And Company Nucleic acid target generation
US5545524A (en) 1991-12-04 1996-08-13 The Regents Of The University Of Michigan Compositions and methods for chromosome region-specific probes
DE69326967T2 (de) 1992-01-17 2000-06-15 Lakowicz, Joseph R. Phasenmodulationsenergieübertragungsfluoroimmunassay
ATE316573T1 (de) 1992-10-30 2006-02-15 Gen Hospital Corp Wechselwirkendes fallensystem zur isolierung von proteinen
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
JP3448090B2 (ja) 1994-02-16 2003-09-16 浜松ホトニクス株式会社 エネルギー移動検出法およびその装置
US20050214309A1 (en) 1994-03-18 2005-09-29 Hinrichs Steven H Methods and compositions for modulating transcription factor activity
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
JP3189000B2 (ja) 1994-12-01 2001-07-16 東ソー株式会社 特定核酸配列の検出方法
US5856125A (en) 1995-06-05 1999-01-05 The United States Of America As Represented By The Department Of Health And Human Services ETS2 repressor factor (ERF) genetic locus and its products
US5710029A (en) 1995-06-07 1998-01-20 Gen-Probe Incorporated Methods for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5854206A (en) 1995-08-25 1998-12-29 Corixa Corporation Compounds and methods for treatment and diagnosis of prostate cancer
US6121489A (en) 1996-03-05 2000-09-19 Trega Biosciences, Inc. Selectively N-alkylated peptidomimetic combinatorial libraries and compounds therein
AR006250A1 (es) 1996-03-15 1999-08-11 Corixa Corp Compuestos y metodos para la inmunoterapia e inmunodiagnostico del cancer prostatico
DE69738687D1 (de) 1996-04-12 2008-06-26 Phri Properties Inc Sonden, kits und assays
CA2267347A1 (en) 1996-10-07 1998-04-16 Meat And Livestock Commission Assay for duroc muscle fibre type
US7125969B1 (en) 1996-11-27 2006-10-24 The Regents Of The University Of California ETS-related gene overexpressed in human breast and epithelial cancers
IL131560A0 (en) 1997-02-25 2001-01-28 Corixa Corp Compounds for immunotherapy of prostate cancer and methods for their use
US6943236B2 (en) 1997-02-25 2005-09-13 Corixa Corporation Compositions and methods for the therapy and diagnosis of prostate cancer
US6395278B1 (en) 1997-02-25 2002-05-28 Corixa Corporation Prostate specific fusion protein compositions
US20030185830A1 (en) 1997-02-25 2003-10-02 Corixa Corporation Compositions and methods for the therapy and diagnosis of prostate cancer
US20020119531A1 (en) 1997-02-27 2002-08-29 Olga Bandman Prostate-associated protease antibody
US6043033A (en) 1997-02-27 2000-03-28 Incyte Pharmaceuticals, Inc. Human prostate-associated protease
US20030103981A1 (en) 1997-02-27 2003-06-05 Incyte Genomics, Inc. Methods of use of a prostate-associated protease in the diagnosis and treatment of prostate cancer
DE69837839T2 (de) 1997-03-07 2007-12-13 Clare Chemical Research LLC, Denver Fluorometrischer Nachweis mit sichtbarem Light
US6080912A (en) 1997-03-20 2000-06-27 Wisconsin Alumni Research Foundation Methods for creating transgenic animals
ES2402947T3 (es) 1997-04-10 2013-05-10 Stichting Katholieke Universiteit University Medical Centre Nijmegen PCA3, genes PCA3 y métodos de uso
US6187799B1 (en) 1997-05-23 2001-02-13 Onyx Pharmaceuticals Inhibition of raf kinase activity using aryl ureas
US7037667B1 (en) 1998-06-01 2006-05-02 Agensys, Inc. Tumor antigen useful in diagnosis and therapy of prostate and colon cancer
ATE490977T1 (de) 1998-06-01 2010-12-15 Agensys Inc Tumorantigen verwendbar in der diagnose und therapie von prostata und dickdarm-krebs
CA2331266A1 (en) 1998-06-16 1999-12-23 The Regents Of The University Of California Exons 4 and 7 encode separate transactivating and chromatin localizing domains in esx
WO2000000605A1 (en) 1998-06-29 2000-01-06 Myriad Genetics, Inc. Tmprss2 is a tumor suppressor
CA2333253C (en) 1998-07-02 2010-09-07 Gen-Probe Incorporated Molecular torches
AU762812B2 (en) 1998-07-14 2003-07-03 Corixa Corporation Compositions and methods for therapy and diagnosis of prostate cancer
JP2002523760A (ja) 1998-09-02 2002-07-30 ダイアデクスアス・インコーポレーテッド 様々な癌を診断、監視、段階づけ、造影及び治療する新規な方法
US6872811B1 (en) 1998-09-30 2005-03-29 Millennium Pharmaceuticals, Inc. HRPCa9 and HRPCa10 nucleic acids and polypeptides
EP1117836A2 (en) 1998-09-30 2001-07-25 Millennium Pharmaceuticals, Inc. Expressionanalysis of specific nucleic acids and polypeptides useful in the diagnosis and treatment of prostate cancer
US6573043B1 (en) 1998-10-07 2003-06-03 Genentech, Inc. Tissue analysis and kits therefor
JP2002527758A (ja) 1998-10-19 2002-08-27 ダイアデクスアス・インコーポレーテッド 前立腺癌を診断、監視、病期分類、イメージング及び治療する方法
US6902892B1 (en) 1998-10-19 2005-06-07 Diadexus, Inc. Method of diagnosing, monitoring, staging, imaging and treating prostate cancer
US6566063B1 (en) 1999-05-14 2003-05-20 Chiron Corporation Methods for determining metastatic potential of breast cancer cells by detecting GSEF gene product expression
US6828429B1 (en) 1999-03-26 2004-12-07 Henry M. Jackson Foundation For The Advancement Of Military Medicine Prostate-specific gene, PCGEM1, and the methods of using PCGEM1 to detect, treat, and prevent prostate cancer
US6303305B1 (en) 1999-03-30 2001-10-16 Roche Diagnostics, Gmbh Method for quantification of an analyte
WO2000065067A2 (en) 1999-04-23 2000-11-02 University Of Washington Prostate-specific polynucleotides, polypeptides and their methods of use
US6541205B1 (en) 1999-05-24 2003-04-01 Tosoh Corporation Method for assaying nucleic acid
AU2001236519A1 (en) 2000-01-24 2001-07-31 Millennium Pharmaceuitcals, Inc. Identification, assessment, prevention, and therapy of prostate cancer
DE10004102A1 (de) 2000-01-31 2002-06-20 Metagen Pharmaceuticals Gmbh Nachweis von differenzieller Genexpression
WO2001060860A2 (en) 2000-02-17 2001-08-23 Millennium Predictive Medicine, Inc. Genes differentially expressed in human prostate cancer and their use
AU2001261676A1 (en) 2000-05-16 2001-11-26 Glaxo Group Limited Method and reagent for the inhibition of erg
EP1322780A4 (en) 2000-07-27 2005-08-03 Univ Australian COMBINATION PROBES AND USES THEREOF
JP2004509882A (ja) 2000-09-21 2004-04-02 スミスクライン ビーチャム パブリック リミテッド カンパニー Rafキナーゼ阻害剤としてのイミダゾール誘導体
US7892730B2 (en) 2000-12-22 2011-02-22 Sagres Discovery, Inc. Compositions and methods for cancer
US6897024B2 (en) 2001-05-31 2005-05-24 Stichting Katholieke Universiteit More Particularly The University Medical Centre Nijmegen Nucleic acid molecules comprising the promoter for PCA3, and uses thereof
US20040009481A1 (en) 2001-06-11 2004-01-15 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of human prostate cancer
US20030108963A1 (en) 2001-07-25 2003-06-12 Millennium Pharmaceuticals, Inc. Novel genes, compositions, kit, and methods for identification, assessment, prevention and therapy of prostate cancer
US6537811B1 (en) 2001-08-01 2003-03-25 Isis Pharmaceuticals, Inc. Antisense inhibition of SAP-1 expression
US7229774B2 (en) 2001-08-02 2007-06-12 Regents Of The University Of Michigan Expression profile of prostate cancer
WO2003023057A2 (de) 2001-09-06 2003-03-20 Adnagen Ag Verfahren und diagnose-kit zur selektionierung und/oder zum qualitativen und/oder quantitativen nachweis von zellen
US6949342B2 (en) 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
WO2004023973A2 (en) 2002-09-12 2004-03-25 Incyte Corporation Molecules for diagnostics and therapeutics
US7790867B2 (en) 2002-12-05 2010-09-07 Rosetta Genomics Inc. Vaccinia virus-related nucleic acids and microRNA
WO2004070056A2 (en) 2003-02-07 2004-08-19 Diagnocure Inc. Method to detect prostate cancer in a sample
EP2196474A3 (en) 2003-02-14 2010-12-15 Sagres Discovery, Inc. Therapeutic targets in cancer
WO2004092397A2 (en) 2003-04-15 2004-10-28 Novartis Ag Tmprss2 regulatory sequences and uses thereof
US8679789B2 (en) 2003-05-01 2014-03-25 Gen-Probe Incorporated Oligonucleotides comprising a molecular switch
WO2004097358A2 (en) 2003-05-02 2004-11-11 Bayer Healthcare Ag Diagnostics and therapeutics for diseases associated with human transmembrane serine protease 2 (tmprss2)
US20060019256A1 (en) 2003-06-09 2006-01-26 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2004113571A2 (en) 2003-06-26 2004-12-29 Exonhit Therapeutics Sa Prostate specific genes and the use thereof as targets for prostate cancer therapy and diagnosis
CA2432365A1 (en) 2003-06-30 2004-12-30 Jack A. Schalken Specific method of prostate cancer detection based on pca3, and kits therefore
WO2005007090A2 (en) 2003-07-03 2005-01-27 President And Fellows Of Harvard College Inhibitors of the map kinase pathway
US20070048738A1 (en) 2003-07-14 2007-03-01 Mayo Foundation For Medical Education And Research Methods and compositions for diagnosis, staging and prognosis of prostate cancer
EP1664718B1 (en) 2003-09-05 2009-12-09 Thomas Jefferson University Diagnosis and monitoring of hepatocellular carcinoma
WO2005113816A2 (en) * 2004-05-07 2005-12-01 Henry M. Jackson Foundation For The Advancement Of Military Medicine Methods of diagnosing or treating prostate cancer using the erg gene, alone or in combination with other over or under expressed genes in prostate cancer
US20060068425A1 (en) 2004-08-13 2006-03-30 Millennium Pharmaceuticals, Inc. Genes, compositions, kits, and methods for identification, assessment, prevention, and therapy of prostate cancer
US7374885B2 (en) 2004-08-27 2008-05-20 Gen-Probe Incorporated Single-primer nucleic acid amplification methods
US20060275794A1 (en) 2005-03-07 2006-12-07 Invitrogen Corporation Collections of matched biological reagents and methods for identifying matched reagents
US7638278B2 (en) 2005-05-13 2009-12-29 The Board Of Trustees Of The Leland Stanford Junior University Markers of DNA copy number alteration for improved prognostication in prostate cancer
CA2622295C (en) 2005-09-12 2019-01-15 The Regents Of The University Of Michigan Recurrent gene fusions in prostate cancer
US9957569B2 (en) 2005-09-12 2018-05-01 The Regents Of The University Of Michigan Recurrent gene fusions in prostate cancer
EP2837697B1 (en) 2006-10-10 2016-12-07 The Henry M. Jackson Foundation for the Advancement of Military Medicine, Inc. Prostate cancer-specific alterations in ERG gene expression and detection methods based on those alternations
EP2604701B1 (en) 2007-07-06 2015-11-04 The Regents Of The University Of Michigan Recurrent gene fusions in prostate cancer
US20100305188A1 (en) 2007-10-03 2010-12-02 Kyowa Hakko Kirin Co., Ltd. Nucleic acid capable of regulating the proliferation of cell
CN102439174B (zh) 2009-02-19 2015-02-04 康奈尔大学 基于检测slc45a3-elk4融合转录子的用于诊断前列腺癌的组合物和方法
CN102712953A (zh) 2009-09-17 2012-10-03 密歇根大学董事会 前列腺癌中的复发性基因融合物

Also Published As

Publication number Publication date
CA2744059A1 (en) 2010-05-27
WO2010059702A3 (en) 2010-07-29
IL212964A0 (en) 2011-07-31
WO2010059702A2 (en) 2010-05-27
BRPI0916121A8 (pt) 2018-06-19
CN102812130A (zh) 2012-12-05
JP2012509068A (ja) 2012-04-19
JP2018019720A (ja) 2018-02-08
US9957569B2 (en) 2018-05-01
JP2015177809A (ja) 2015-10-08
US20090239221A1 (en) 2009-09-24
BRPI0916121A2 (pt) 2015-11-03
EP2358899A2 (en) 2011-08-24
AU2009316693A1 (en) 2010-05-27
AU2009316693B2 (en) 2012-08-23

Similar Documents

Publication Publication Date Title
KR20110084995A (ko) 전립선암에서의 반복적 유전자 융합체
JP6404378B2 (ja) 前立腺癌における再発性遺伝子融合
US10190173B2 (en) Recurrent gene fusions in prostate cancer
US20030219761A1 (en) Novel prostate-specific or test-specific nucleic acid molecules, polypeptides, and diagnostic and therapeutic methods

Legal Events

Date Code Title Description
A201 Request for examination
PA0105 International application

Patent event date: 20110617

Patent event code: PA01051R01D

Comment text: International Patent Application

PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20110617

Comment text: Request for Examination of Application

PG1501 Laying open of application
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20130313

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20130819

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20130313

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I