KR102605084B1 - 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 - Google Patents
전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 Download PDFInfo
- Publication number
- KR102605084B1 KR102605084B1 KR1020200172534A KR20200172534A KR102605084B1 KR 102605084 B1 KR102605084 B1 KR 102605084B1 KR 1020200172534 A KR1020200172534 A KR 1020200172534A KR 20200172534 A KR20200172534 A KR 20200172534A KR 102605084 B1 KR102605084 B1 KR 102605084B1
- Authority
- KR
- South Korea
- Prior art keywords
- intron
- degenerative brain
- intron retention
- disease
- maintenance
- Prior art date
Links
- 230000014759 maintenance of location Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 39
- 208000014644 Brain disease Diseases 0.000 title claims abstract description 32
- 230000003412 degenerative effect Effects 0.000 title claims abstract description 32
- 238000011222 transcriptome analysis Methods 0.000 title abstract description 8
- 238000012423 maintenance Methods 0.000 claims abstract description 31
- 238000003745 diagnosis Methods 0.000 claims abstract description 13
- 239000012472 biological sample Substances 0.000 claims abstract description 12
- 210000004369 blood Anatomy 0.000 claims abstract description 11
- 239000008280 blood Substances 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 210000002381 plasma Anatomy 0.000 claims abstract description 4
- 210000002966 serum Anatomy 0.000 claims abstract description 4
- 206010012289 Dementia Diseases 0.000 claims description 34
- 101150031329 Ets1 gene Proteins 0.000 claims description 8
- 238000003559 RNA-seq method Methods 0.000 claims description 8
- 108020004999 messenger RNA Proteins 0.000 claims description 8
- 101150009248 rpl4 gene Proteins 0.000 claims description 8
- 239000002299 complementary DNA Substances 0.000 claims description 5
- 210000000601 blood cell Anatomy 0.000 claims description 4
- 238000003757 reverse transcription PCR Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 208000024827 Alzheimer disease Diseases 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 3
- 208000028698 Cognitive impairment Diseases 0.000 claims description 2
- 238000001712 DNA sequencing Methods 0.000 claims description 2
- 208000023105 Huntington disease Diseases 0.000 claims description 2
- 208000018737 Parkinson disease Diseases 0.000 claims description 2
- 238000012300 Sequence Analysis Methods 0.000 claims description 2
- 208000010877 cognitive disease Diseases 0.000 claims description 2
- 238000007847 digital PCR Methods 0.000 claims description 2
- 238000002493 microarray Methods 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 15
- 238000010172 mouse model Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 13
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 8
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 7
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000002790 cross-validation Methods 0.000 description 6
- 238000011818 5xFAD mouse Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000008021 deposition Effects 0.000 description 4
- 210000001652 frontal lobe Anatomy 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 210000003478 temporal lobe Anatomy 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 101150027068 DEGS1 gene Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101000617536 Homo sapiens Presenilin-1 Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102100022033 Presenilin-1 Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2539/00—Reactions characterised by analysis of gene expression or genome comparison
- C12Q2539/10—The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
- C12Q2539/105—Involving introns, exons, or splice junctions
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 전사체분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법에 관한 것으로, 보다 상세하게는 피검체로부터 제공된 혈액, 혈장, 혈구 및 혈청으로 이루어진 군에서 선택된 어느 하나 이상의 생물학적 샘플에서 전사체의 인트론 유지를 검출하여 퇴행성 뇌 질환을 진단하는 방법에 관한 것이다.
본 발명의 방법에 따르면 인트론 유지량의 변화를 분석하여 퇴행성 뇌 질환을 정확하게 진단할 수 있을 뿐 아니라, 비침습적인 방법으로 수득이 가능한 혈액 샘플만으로 퇴행성 뇌 질환 초기에 신속한 진단이 가능하다.
본 발명의 방법에 따르면 인트론 유지량의 변화를 분석하여 퇴행성 뇌 질환을 정확하게 진단할 수 있을 뿐 아니라, 비침습적인 방법으로 수득이 가능한 혈액 샘플만으로 퇴행성 뇌 질환 초기에 신속한 진단이 가능하다.
Description
본 발명은 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법에 관한 것으로, 보다 상세하게는 피검체로부터 제공된 혈액, 혈장, 혈구 및 혈청으로 이루어진 군에서 선택된 어느 하나 이상의 생물학적 샘플에서 전사체의 인트론 유지를 검출하여 퇴행성 뇌 질환을 진단하는 방법에 관한 것이다.
스플라이싱(splicing)은 전구체-mRNA(Precursor-mRNA, Pre-mRNA)로부터 유전 정보를 가지고 있지 않은 인트론(intron)을 제거하고, 유전 정보를 가지는 엑손(exon) 부분만을 이어 단일 폴리펩티드(polypeptide) 사슬로 번역하기 위한 mRNA의 개조 과정으로, 진핵생물의 유전자 발현조절에 있어서 필수적인 과정이다.
선택적 스플라이싱(alternative splicing)은 m-RNA의 다양한 엑손의 조합으로부터 특이적으로 선택된 엑손만의 조합으로 mRNA를 생성하는 과정으로, 이를 통해 하나의 유전자로부터 다양한 형태의 mRNA의 생성이 가능하게 되어 유전체의 확장 없이 다양한 단백질이 생산되어 세포의 다양성을 제공하는 역할을 하는 것으로 알려져 있다. 인간 전사체의 전체적인 조사에 따르면 인트론을 포함한 95%의 유전자가 선택적 스플라이싱을 거치는 것으로 예측하고 있다(Pan Q, etal, Nat. Genet. 40(12):1413-1415, 2008; Wang ET, etal.Nature 456(7221):470-476, 2008). 선택적 스플라이싱을 통해, 발현된 하나의 유전자는 각각 다른 기능을 나타내는 다양한 단백질로 번역될 수 있다.
선택적 스플라이싱은 발달, 조직 또는 세포의 종류에 따라, pre-mRNA 염기 서열상의 시스-작용 요소(cis-acting element) 및 이에 결합하는 트랜스-작용 단백질(trans-acting protein)의 상호 작용에 의하여 조절(regulation)된다.
최근 들어, 상기 조절에 관여하는 인자들에 생기는 돌연변이(mutation) 또는 결함(lacking)으로 인한 비정상적인 스플라이싱과 관련된 질병이 보고되고 있다.
한편, 최근 노령화에 따라 퇴행성 뇌 질환 환자가 점차 증가하는 추세이며 노인 10명 중 1명 이상은 치매와 같은 퇴행성 뇌 질환을 앓고 있다. 지금까지는 퇴행성 뇌 질환을 양전자방출단층촬영 또는 인지능력 검사 등을 통해 진단해 왔다. 하지만 기존의 진단 방법들은 질환이 어느 정도 진행된 후에야 진단이 가능하다는 한계가 있다. 그리고 이미 진단된 이후에 뒤늦게 증상을 완화하기 위한 치료를 시작하면 큰 비용과 시간이 소요되는 문제가 있다.
따라서, 퇴행성 뇌 질환을 초기에 간편한 방법으로 진단할 수 있는 방법에 대한 요구가 증가하고 있으며, 이러한 방법론의 한 방향으로 선택적 스플라이싱의 검출이 활용될 수 있을 것으로 기대된다.
본 발명자는 퇴행성 뇌 질환을 초기에, 그리고 비침습적인 방법으로 간단하게 진단할 수 있는 방법을 찾기 위해 예의 연구를 거듭한 결과, 전사체(Transcript) 분석을 통한 선택적 스플라이싱 변화 중 인트론 유지(intron retention)의 변화를 확인하는 방법으로 치매를 매우 정확하고 빠르게 진단할 수 있음을 확인하였다. 특히, 본 발명자는 이와 같은 방법이 피검체로부터 제공된 혈액 샘플, 보다 구체적으로는 혈구 분석이라는 비침습적인 방법을 통해 퇴행성 뇌 질환을 진단할 수 있음을 확인하였다.
따라서, 본 발명의 목적은 퇴행성 뇌 질환의 진단에 유용한 정보를 제공하기 위하여, (a) 피검체로부터 제공된 생물학적 샘플에서 전사체의 인트론 유지(intron retention)를 검출하는 단계; 및 (b) 상기 검출된 피검체의 전사체 인트론 유지 정도를 정상 대조군과 비교하여 증가된 경우 퇴행성 뇌 질환에 걸린 것으로 판정하는 단계를 포함하는, 생물학적 샘플에서 전사체의 인트론 유지를 검출하는 방법을 제공하는 것이다.
전술한 본 발명의 목적을 달성하기 위하여, 본 발명은 퇴행성 뇌 질환의 진단에 유용한 정보를 제공하기 위하여, (a) 피검체로부터 제공된 생물학적 샘플에서 전사체의 인트론 유지(intron retention)를 검출하는 단계; 및 (b) 상기 검출된 피검체의 전사체 인트론 유지 정도를 정상 대조군과 비교하여 증가된 경우 퇴행성 뇌 질환에 걸린 것으로 판정하는 단계를 포함하는, 생물학적 샘플에서 전사체의 인트론 유지를 검출하는 방법을 제공한다.
이하, 본 발명에 대해 상세히 설명한다.
본 발명은 퇴행성 뇌 질환의 진단에 유용한 정보를 제공하기 위하여, (a) 피검체로부터 제공된 생물학적 샘플에서 전사체의 인트론 유지(intron retention)를 검출하는 단계; 및 (b) 상기 검출된 피검체의 전사체 인트론 유지 정도를 정상 대조군과 비교하여 증가된 경우 퇴행성 뇌 질환에 걸린 것으로 판정하는 단계를 포함하는, 생물학적 샘플에서 전사체의 인트론 유지를 검출하는 방법을 제공한다.
본 발명의 일실시예에서, 본 발명자는 퇴행성 뇌 질환에서 나타날 수 있는 분자생물학적 메커니즘의 변화를 확인하고, 선택적 스플라이싱 중 하나인 인트론 유지량의 변화를 분석하여 치매 진단의 방법을 확인하였다. 기존 전두엽 데이터에 대한 전사체 분석 및 인트론 유지의 변화를 감지하기 위해 RNA-seq, RI 파이프라인을 사용하여 분석한 결과, 다수의 유전자에서 인트론 유지의 변화가 나타남을 확인하였다. 또한, 인트론 유지의 변화량을 통해 정상군과 치매 환자군을 AUC 0.94±0.08의 분류 정확도로 구별할 수 있음을 확인하였다. 특히, 치매 마우스 모델의 말초 혈액 단핵세포에서도 선택적 스플라이싱, 보다 구체적으로는 전사체의 인트론 유지량의 변화가 나타남을 확인하였다. 정상군과 치매군에 대해 P-value 0.05 이하의 유의성이 나타나는 인트론 유지 영역은 말초 혈액 단핵세포에서 13개 영역이 발견되었다. 이를 통해, 인트론 유지의 변화를 혈액에서 검출함으로써 퇴행성 뇌 질환에 관한 정보를 획득하고 정상인과 환자를 분류할 수 있음을 확인하였다.
본 발명의 일양태에서, 상기 퇴행성 뇌 질환은 인지장애, 알츠하이머병, 파킨슨병, 헌팅턴병 및 치매로 이루어진 군에서 선택되는 것을 특징으로 할 수 있다.
본 발명의 다른 일양태에서, 상기 전사체의 인트론 유지 검출은 생물학적 샘플에서 mRNA 또는 이의 cDNA 카피를 서열 분석하여 수행되는 것을 특징으로 할 수 있다.
한 실시태양에서, 생물학적 샘플에서 추출한 RNA를 증폭하지 않고 직접 분석할 수 있다.
한 실시태양에서, 서열분석을 하기 이전에 전사체를 증폭시키는 것이 유익하거나, 다르게는 바람직할 수 있다. 증폭 방법은 보편적으로 사용되는 것이며, 이는 일반적으로 당업계에 공지되어 있다.
한 실시태양에서, 상기 전사체는 mRNA이다. 이어서, 추가로 증폭시키기 이전에 mRNA를 상보성 DNA로 역전사시키는 것이 바람직할 수 있다. 상기와 같은 역전사 단계는 단독으로 수행되거나, 증폭 단계와 함께 수행될 수 있다. 역전사 단계와 증폭 단계를 조합시킨 방법의 일례로는 역전사 중합효소 연쇄 반응 (RT-PCR)이 있다.
상기 전사체의 인트론 유지 검출은 정상인 또는 공지된 유전자의 전사체 정보를 획득한 후, 이와 상응하는 상기 피검체의 전사체 서열과 비교함으로써 수행될 수 있다.
예를 들어, (i) 인트론 유지량을 검출하기 위해 우선 샘플에서 Total RNA를 분리하고 역전사효소를 이용하여 cDNA를 제작하는 단계; (ii) 인트론 유지가 나타나는 인트론 영역을 인지할 수 있는 특정 시퀀스를 프라이머 쌍으로 디자인하거나, 엑손-인트론 부위를 인지할 수 있는 특정 시퀀스를 프라이머로 제작하는 단계; 및 (iii) 상기 제작된 cDNA와 프라이머를 이용하여 Real-time PCR을 통해 나온 값을 정상 대조군과 비교하여 실험군에서의 인트론 유지량을 정량화하는 단계를 포함하는 방법에 따라 인트론 유지를 검출할 수 있다.
본 발명의 다른 일양태에서, 상기 생물학적 샘플은 혈액, 혈장, 혈구 및 혈청으로 이루어진 군에서 선택되는 1종 이상일 수 있으며, 바람직하게는 혈구일 수 있으나, 이에 제한되는 것은 아니다.
인트론 유지의 존재 또는 부재 여부를 검출하는 것은 예를들어, DNA 시퀀싱, RNA 시퀀싱, PCR, RT-PCR, 디지털 PCR, 마이크로어레이로 미니시퀀싱, 올리고뉴클레오티드 혼성화, 파이로시퀀싱, 일루미나 게놈 분석기, 심도 시퀀싱, 질량 분광분석법 또는 다른 핵산 서열 검출 방법과 같은 방법에 의해서 인트론 유지가 발생한 부위의 서열을 측정하는 것을 포함한다. 인트론 유지를 검출하는 방법은 당업계에 주지되어 있다. 예를 들어, 원하는 유전 서열 중 하나 이상의 공지 DNA 또는 RNA의 세그먼트를 증폭시키는 과정을 포함한다. 이어서, 증폭된 세그먼트 중 인트론 유지를 확인하기 위해 상기 공지된 DNA 또는 RNA의 증폭된 세그먼트와 피검체의 세그먼트를 시퀀싱하고/거나 전기영동 시킬 수 있다.
본 발명의 일양태에서, 상기 방법은 퇴행성 뇌 질환 환자 및 정상 대조군 사이에 발현량의 차이가 없는 유전자를 선별하고, 이의 전사체에서 인트론 유지 정도를 비교하는 것을 특징으로 할 수 있다.
본 발명의 다른 일양태에서, 상기 선별된 유전자는 모든 샘플(정상 대조군 및 환자군)에서 전사체의 평균 발현량이 일정 수준 이상인 조건을 만족하는 것을 특징으로 할 수 있다.
이를 통해, 인트론 유지량 외에 전사체의 발현량 차이 등 진단에 영향을 주는 요소들을 제거함으로써, 인트론 유지량의 차이만으로 정확하게 퇴행성 뇌 질환을 진단하는 것이 가능할 수 있다.
본 발명의 일양태에서, 상기 선별된 유전자의 단일 염기쌍 단위로 인트론 유지량을 측정하고, 그룹/샘플 간의 인트론 유지량에 대한 비교를 위해 모든 측정된 인트론 유지량을 정규화하는 단계가 추가로 수행될 수 있다. 정규화된 인트론 유지량에 대해 해당 인트론 영역의 길이를 나누어 단위 길이 당 인트론 유지량을 산출하고, 이를 기초로 정상 대조군과 환자군의 인트론 유지량 차이를 비교할 수 있다.
본 발명의 방법에 따르면 인트론 유지량의 변화를 분석하여 퇴행성 뇌 질환을 정확하게 진단할 수 있을 뿐 아니라, 비침습적인 방법으로 수득이 가능한 혈액 샘플만으로 퇴행성 뇌 질환 초기에 신속한 진단이 가능하다.
도 1은 RNA sequencing 분석 파이프라인의 도식이다.
도 2는 인트론 유지량을 측정하기 위한 분석 파이프라인의 도식이다.
도 3은 전두엽 데이터에서 도 1과 도 2의 방법을 통해 계산해낸 인트론 유지 변화량을 입력 값으로 하여 학습된 머신러닝 모형의 환자 분류 성능의 측정한 AUC-ROC 그래프이다.
도 4는 치매모델 생쥐의 뇌에서 아밀로이드 베타의 퇴적을 확인하기 위하여 6개월된 정상 생쥐(WT)과 치매모델 생쥐(5XFAD)의 뇌를 종으로 잘라서 해마부분에서의 아밀로이드 베타의 퇴적을 확인한결과 정상에 비해 치매모델 생쥐에서 아밀로이드 베타의 퇴적이 증가 되어있음을 확인한 결과이다.
도 5 및 도 6은 정상 생쥐(WT)와 치매모델 생쥐(5XFAD)의 혈액으로부터 분리된 말초혈액 단핵세포(PBMC)에서 전사체 분석을 통해 인트론 유지의 차이가 나타나는지 확인한 결과 치매모델 생쥐에서 Ets1, Rpl4 유전자내 인트론 유지가 나타나는 것을 Integrative Genomics View (IGV)를 통해 확인한 결과이다.
도 2는 인트론 유지량을 측정하기 위한 분석 파이프라인의 도식이다.
도 3은 전두엽 데이터에서 도 1과 도 2의 방법을 통해 계산해낸 인트론 유지 변화량을 입력 값으로 하여 학습된 머신러닝 모형의 환자 분류 성능의 측정한 AUC-ROC 그래프이다.
도 4는 치매모델 생쥐의 뇌에서 아밀로이드 베타의 퇴적을 확인하기 위하여 6개월된 정상 생쥐(WT)과 치매모델 생쥐(5XFAD)의 뇌를 종으로 잘라서 해마부분에서의 아밀로이드 베타의 퇴적을 확인한결과 정상에 비해 치매모델 생쥐에서 아밀로이드 베타의 퇴적이 증가 되어있음을 확인한 결과이다.
도 5 및 도 6은 정상 생쥐(WT)와 치매모델 생쥐(5XFAD)의 혈액으로부터 분리된 말초혈액 단핵세포(PBMC)에서 전사체 분석을 통해 인트론 유지의 차이가 나타나는지 확인한 결과 치매모델 생쥐에서 Ets1, Rpl4 유전자내 인트론 유지가 나타나는 것을 Integrative Genomics View (IGV)를 통해 확인한 결과이다.
이하, 본 발명을 하기 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명이 이들에 의해 제한되는 것은 아니다.
1. 치매 환자와 정상 대조군 샘플에서 인트론 유지의 검출 및 비교
본 발명자는 먼저 정상군과 치매 환자군에서 실험을 진행한 전사체 분석 결과를 활용하여 선택적 스플라이싱의 한 메커니즘인 인트론 유지 변화를 확인하고자 하였다.
2018년 Nature Neuroscience에서 발표된 논문 (Nativio R, Donahue G, Berson A, Lan Y et al. Nat. Neurosci. 21(4), 497-505 (2018))에서 분석을 진행한 측두엽 데이터 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE104704 (이하 측두엽 데이터)를 수집하여 본 연구진이 설계한 RNA-seq 파이프라인을 통해 정상군의 18 샘플과 치매 환자군의 12 샘플에 대해 그룹별 전사체 분석을 수행하였다 (도 1). 정상군은 치매 징후가 보이지 않는 그룹이며, 치매 환자군은 치매 진단 분류 1 내지 6에 해당하는 그룹이다.
RNA-seq 파이프라인을 통해 구해진 각 전사체의 발현량 및 정상-환자 그룹 간 동일 전사체의 발현량 차이에 대한 조건을 만족하는 후보 유전자를 선별하였다. 선별된 유전자는 그룹 간 동일 전사체에 대한 발현량의 차이가 작으면서 (도 2, filtering- ), 모든 샘플에서 전사체의 평균 발현량이 일정 수준 이상 (도 2, filtering- )인 조건을 만족하는 전사체를 포함한 유전자이다. 이 조건은 인트론 유지량 외에 전사체의 발현량 차이와 같은 치매 진단에 영향을 주는 요소들을 제거하기 위한 것이다. 따라서, 위 조건을 만족하는 전사체를 포함하는 유전자는 인트론 유지량을 제외한 기타 조건에 대해 그룹 간 차이가 존재하지 않는다. 측두엽 데이터에 대해, , 의 조건을 적용한 결과 총 211개의 후보 유전자가 선별되었다 (표 1, Filtered Gene).
선택적 스플라이싱이 발생한 영역을 탐지할 수 있는 알고리즘을 통해 선별된 유전자 내 인트론 후보 영역을 탐색하였다 (도 2, RI Detection Algorithm). 측두엽 데이터에서, , 의 조건을 통해 선별된 211개의 유전자에 대해 IRFinder를 적용하여 모든 샘플에서 공통적으로 발생되는 170개의 인트론 영역이 선별되었으며 (도 2, Filtered RI Region), 해당 인트론 영역을 포함하는 유전자는 총 29개가 선별되었다.
선별된 인트론 영역에 대해 단일 염기쌍(Single base pair) 단위로 인트론 유지량을 측정하였다 (도 2, RI Level Measure). 그룹/샘플 간의 인트론 유지량에 대한 비교를 위해 Voom 알고리즘을 활용하여 계산된 가중치를 곱하여 모든 측정된 인트론 유지량에 대한 정규화를 수행하였다. 정규화된 인트론 유지량에 대해 해당 인트론 영역의 길이를 나누어주어, 단위 길이 당 인트론 유지량을 측정하였다 (도 2).
위의 파이프라인을 활용하여 치매 모델에서 발견한 인트론 유지 변화를 기계학습(machine learning) 방법을 통해 기존에 보고된 인체 데이터를 활용하여 치매 환자를 판별할 수 있는 시스템을 개발하였다.
전두엽 데이터의 모든 샘플에 대해 RNA-Seq 및 Retained Intron (도 2) 파이프라인을 통해 선별된 인트론의 유지량을 학습데이터로 하였다. 또한, 정상군은 0 환자군은 1의 정답 라벨로 구성하였다. 본 연구에서는 모델의 학습 정확도를 높이기 위하여 데이터에 대해 차원 축소(Dimension Reduction) 기법인 PCA(Principle component Analysis)를 적용하여 축소된 데이터를 구성하였다. 이는 적은 수의 데이터를 활용하는 기계학습에서 발생할 수 있는 과적합(overfitting) 문제를 해결하는 방법으로, 본 발명에서는 3-5차원으로 축소된 데이터를 학습데이터로써 활용하였다.
머신러닝 학습에서 고정된 데이터에 의해 발생하는 과적합 문제를 해결하기 위해 교차검증을 활용하였다. 교차검증은 데이터를 k개의 하위 세트로 나누어 각 하위 세트에서 구한 모델의 검정력의 평균을 통해 정확도를 평가하는 방법으로, 본 연구에서는 k=5인 교차검증을 활용하였다. 각 모델은 Support Vector Machine, Decision Tree, Random Forest, XGBoost, CatBoost Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., & Gulin, A. Advances in neural information processing systems 2018, pp. 6638-6648 (2018) 알고리즘을 활용하여 분석을 수행하였다. 모든 모델에 대한 분석을 통해 CatBoost 알고리즘이 평균 0.94±0.08의 AUC를 보임을 통해 시스템적으로 정상과 치매를 잘 판별함을 확인하였다 (도 3).
2. 치매 마우스 모델의 혈구에서 인트론 유지의 검출 및 비교
본 연구진은 현재 알려져 있는 데이터를 이용하여 확인한 인트론 유지 변화를 치매 마우스 모델을 이용하여 검증하는 연구를 진행하였다. 이를 검증하기 위해 치매 마우스 모델로 5xFAD를 사용하였는데 이 마우스는 베타 아밀로이드 생성에 관여하는 유전자인 APP, PSEN1의 돌연변이를 이식한 트랜스제닉 동물로 알츠하이머성 치매 연구 모델로 많이 사용되고 있다. 먼저 뇌조직과 망막조직에서 베타 아밀로이드의 발현을 면역 조직 화학법을 적용하여 확인한 결과 치매 마우스 모델에서 베타 아밀로이드의 발현이 증가 되어있음을 확인하였다(도 4).
인트론 유지 변화를 확인하기 위해 검증된 치매 모델 마우스의 말초 혈액 단핵세포(PBMC)를 이용하여 실험을 진행하였다. 태어난 후 6개월 된 정상 쥐(C57BL/6J)와 치매 모델 쥐(5xFAD)에서 말초 혈액 단핵세포를 분리하였고, 모아진 샘플로부터 Total RNA를 분리한 다음 전사체 분석을 위하여 시퀀싱 라이브러리를 제작하였다.
정상 쥐 및 치매 모델 쥐에서 유래한 샘플을 이용하여 제작된 라이브러리를 통해 시퀀싱을 진행하고 본 발명이 제시하는 파이프라인(도 1 및 도 3) 인트론 유지량에 대해 분석하였다. 조건 , 의 경우, 말초 혈액 단일 세포에서 14개의 선별된 유전자에 대해 13개의 공통된 인트론 영역, 4개의 인트론 영역을 포함하는 유전자가 선별되었다.
이를 통해 스플라이싱의 메커니즘 중의 하나인 인트론 유지가 치매 마우스의 말초 혈액 단핵세포에서 유의미하게 나타나는 것을 확인하였다 (도 5).
본 발명의 각 도면에 대해 보다 상세히 설명하면 다음과 같다:
도 1은 RNA sequencing 분석 파이프라인의 도식이다. 먼저 사람 유전체의 기준 시퀀스 정보가 기록된 fasta, gtf 파일을 기준으로 aligner가 사용하는 형식의 인덱스 파일을 생성한다. 그 다음 시퀀서로부터 얻은 RNA발현을 기록한 fastq파일을 트리밍하여 전처리한다. 앞서 생성한 인덱스 파일을 기준으로 전처리 한 fastq파일과 비교하여 정렬 연산을 실시하고 이 정보가 기록된 bam파일을 생성한다. bam파일을 사용하여 transcript당 발현량을 연산하고 이를 표준화한 FPKM값을 얻는다. FPKM값을 기준으로 전처리 필터링을 실시한 후 다음 분석에 사용할 transcript를 선별한다. 그 다음 edgeR 라이브러리를 사용하여 voom 표준화한 다음 log fold change와 p-value를 사용하여 DEG(differentially expressed gene)을 실시한다. 이를 유전체 데이터베이스 정보와 병합하여 최종 분석 테이블과 각종 플롯을 얻는다.
도 2는 인트론 유지량을 측정하기 위한 분석 파이프라인의 도식이다. [도 2]에서는 도 1의 과정을 통해 측정한 RNA 발현량 및 DEG 및 후보 인트론 유지 영역을 발견할 수 있는 다양한 알고리즘(RI detection Algorithm)에서 찾아낸 결과 값을 활용한다. 도 2의 필터링에서는 사전에 설정된 임계 값을 기준으로 조건에 맞는 인트론 유지가 발생하는 영역을 추출한다. 추출된 인트론 유지 영역에 대해 도 2의 RI Level Measure에서는 주어진 단일 염기쌍 단위의 인트론 유지 영역 산출 및 RNA 발현량에 따른 가중치 곱을 통해 최종 인트론 유지 값을 산출한다. 이후 도 2의 패턴 인식에서는 해당 데이터에 대한 차원 축소를 포함한 데이터 전처리를 수행하고, 기계학습 모형에 의한 학습을 통해 결과 값을 산출하고, 해당 결과 값에 따라 성능 개선을 위한 전 과정을 반복한다. 이후 가장 높은 정확도를 갖는 기계학습 모형을 환자/정상 구분을 위한 모형으로 저장하고, 해당 인트론 유지 영역을 함께 저장한다.
도 3은 전두엽 데이터에서 도 1과 도 2의 방법을 통해 계산해낸 인트론 유지 변화량을 입력 값으로 하여 학습된 머신러닝 모형의 환자 분류 성능의 측정한 AUC-ROC 그래프이다. 5회의 교차검증을 통해 평균 AUC-ROC를 산출하였으며, 그 값은 0.94 ±0.08로 측정되었다 (도 3의 파란 선). AUC-ROC는 다양한 임계 값에서 학습된 모형의 분류 성능에 대한 측정값으로써, 0과 1사이의 값을 가진다. AUC-ROC의 값이 높다는 것은 환자/정상을 분류하는 모델의 성능이 훌륭하다는 것을 의미하며, 본 모델을 통해 추산된 0.94는 다양한 임계 값에서 훌륭하게 환자를 분류해 낼 수 있음을 의미한다. 또한 각 교차 검증에서 측정된 AUC-ROC를 함께 [도 3]에 나타냈으며, 각 교차 검증에서 측정된 AUC-ROC 값들의 표준편차를 회색영역으로 표시하였다.
도 4는 치매모델 생쥐의 뇌에서 아밀로이드 베타의 퇴적을 확인하기 위하여 6개월된 정상 생쥐(WT)과 치매모델 생쥐(5XFAD)의 뇌를 종으로 잘라서 해마부분에서의 아밀로이드 베타의 퇴적을 확인한 결과로서, 정상에 비해 치매모델 생쥐에서 아밀로이드 베타의 퇴적이 증가 되어있음을 확인하였다. 파란색(DAPI)으로 염색된 부분은 세포의 핵을 나타내었다.
도 5 및 도 6은 정상 생쥐(WT)와 치매모델 생쥐(5XFAD)의 혈액으로부터 분리된 말초혈액 단핵세포(PBMC)에서 전사체 분석을 통해 인트론 유지의 차이가 나타나는지 확인한 결과로서, 치매모델 생쥐에서 Ets1, Rpl4 유전자내 인트론 유지가 나타나는 것을 Integrative Genomics View (IGV)를 통해 확인하였다.
본 발명의 방법에 따르면 인트론 유지량의 변화를 분석하여 퇴행성 뇌 질환을 정확하게 진단할 수 있을 뿐 아니라, 비침습적인 방법으로 수득이 가능한 혈액 샘플만으로 퇴행성 뇌 질환 초기에 신속한 진단이 가능하여 산업상 이용가능성이 매우 높다.
Claims (8)
- 퇴행성 뇌 질환의 진단에 유용한 정보를 제공하기 위하여,
(a) 피검체로부터 제공된 생물학적 샘플에서 Ets1, Rpl4, 또는 Ets1 및 Rpl4의 전사체의 인트론 유지(intron retention)를 검출하는 단계; 및
(b) 상기 검출된 피검체의 Ets1, Rpl4, 또는 Ets1 및 Rpl4의 전사체 인트론 유지 정도를 정상 대조군과 비교하여 증가된 경우 퇴행성 뇌 질환에 걸린 것으로 판정하는 단계를 포함하는, 생물학적 샘플에서 전사체의 인트론 유지를 검출하는 방법.
- 제1항에 있어서, 상기 퇴행성 뇌 질환은 인지장애, 알츠하이머병, 파킨슨병, 헌팅턴병 및 치매로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 Ets1, Rpl4, 또는 Ets1 및 Rpl4의 전사체의 인트론 유지 검출은 상기 생물학적 샘플에서 mRNA 또는 이의 cDNA 카피를 서열 분석하여 수행되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 생물학적 샘플은 혈액, 혈장, 혈구 및 혈청으로 이루어진 군에서 선택되는 1종 이상인 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 생물학적 샘플은 혈구인 것을 특징으로 하는 방법.
- 제3항에 있어서, 상기 서열 분석은 DNA 시퀀싱, RNA 시퀀싱, PCR, RT-PCR, 디지털 PCR 및 마이크로어레이로 이루어진 군에서 선택된 방법에 의해 수행되는 것을 특징으로 하는 방법.
- 삭제
- 제1항에 있어서, 상기 퇴행성 뇌 질환의 진단은 질환의 초기 진단인 것을 특징으로 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200172534A KR102605084B1 (ko) | 2020-12-10 | 2020-12-10 | 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200172534A KR102605084B1 (ko) | 2020-12-10 | 2020-12-10 | 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220082545A KR20220082545A (ko) | 2022-06-17 |
KR102605084B1 true KR102605084B1 (ko) | 2023-11-24 |
Family
ID=82269242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200172534A KR102605084B1 (ko) | 2020-12-10 | 2020-12-10 | 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102605084B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023246806A1 (zh) * | 2022-06-21 | 2023-12-28 | 上海魁特迪生物科技有限公司 | 疾病模型及其用途 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111370055A (zh) | 2020-03-05 | 2020-07-03 | 中南大学 | 内含子保留预测模型建立方法及其预测方法 |
WO2020210537A1 (en) | 2019-04-09 | 2020-10-15 | Envisagenics, Inc. | Cancer-specific molecules and methods of use thereof |
-
2020
- 2020-12-10 KR KR1020200172534A patent/KR102605084B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020210537A1 (en) | 2019-04-09 | 2020-10-15 | Envisagenics, Inc. | Cancer-specific molecules and methods of use thereof |
CN111370055A (zh) | 2020-03-05 | 2020-07-03 | 中南大学 | 内含子保留预测模型建立方法及其预测方法 |
Non-Patent Citations (2)
Title |
---|
Neural Regen Res. Vol. 15, No. 2, 페이지 259-260(2020.02.) |
이주현. 중앙대학교 석사학위논문. (2020.08.) |
Also Published As
Publication number | Publication date |
---|---|
KR20220082545A (ko) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110305965B (zh) | 一种预测非小细胞肺癌(nsclc)患者对免疫疗法的敏感性的方法 | |
CN112020565A (zh) | 用于确保基于测序的测定的有效性的质量控制模板 | |
US20220101944A1 (en) | Methods for detecting copy-number variations in next-generation sequencing | |
US20210358626A1 (en) | Systems and methods for cancer condition determination using autoencoders | |
US20230268025A1 (en) | Target-associated molecules for characterization associated with biological targets | |
JP7005596B2 (ja) | 乳がんに関連する染色体相互作用の検出 | |
WO2010028098A4 (en) | Pathways underlying pancreatic tumorigenesis and an hereditary pancreatic cancer gene | |
WO2018222883A1 (en) | Investigating tumoral and temporal heterogeneity through comprehensive -omics profiling in patients with metastatic triple negative breast cancer | |
CA2877436A1 (en) | Systems and methods for generating biomarker signatures | |
CN107208131A (zh) | 用于肺癌分型的方法 | |
CN112501290B (zh) | 与乳腺癌预后相关的标志分子以及检测试剂盒 | |
KR102605084B1 (ko) | 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 | |
CN113493829B (zh) | 生物标志物在肺动脉高压诊疗中的应用 | |
Ma et al. | Gene network-based cancer prognosis analysis with sparse boosting | |
JP6703479B2 (ja) | 個人の喫煙ステータスを予測するためのシステムおよび方法 | |
KR102124193B1 (ko) | 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 우울증 또는 자살 위험 예측용 마커, 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법 | |
CN104212884B (zh) | 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒 | |
JP2022534236A (ja) | 多重オミックス分析を利用した鬱病または自殺危険の予測用マーカー発掘方法、鬱病または自殺危険の予測用マーカー、及び多重オミックス分析を利用した鬱病または自殺危険の予測方法 | |
KR102659915B1 (ko) | 환자의 의학적 정보를 예측하기 위한 유전자 선별 방법 및 이의 활용 | |
JP2017527827A (ja) | 膵臓がんに冒された患者の生存予後を判断する方法 | |
WO2022071952A1 (en) | Linked dual barcode insertion constructs | |
WO2023238973A1 (ko) | 전사체 분석을 이용한 인트론 유지 검출을 통해 퇴행성 뇌 질환을 진단하는 방법 | |
CN117497047B (zh) | 基于外显子测序筛选肿瘤基因标志物的方法、设备和介质 | |
WO2024114678A1 (en) | Fragmentomics in urine and plasma | |
Kuznetsov et al. | CNV-Finder: Streamlining Copy Number Variation Discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |