JP2023524016A - 結腸細胞増殖性障害を特定するためのrnaマーカと方法 - Google Patents
結腸細胞増殖性障害を特定するためのrnaマーカと方法 Download PDFInfo
- Publication number
- JP2023524016A JP2023524016A JP2022565960A JP2022565960A JP2023524016A JP 2023524016 A JP2023524016 A JP 2023524016A JP 2022565960 A JP2022565960 A JP 2022565960A JP 2022565960 A JP2022565960 A JP 2022565960A JP 2023524016 A JP2023524016 A JP 2023524016A
- Authority
- JP
- Japan
- Prior art keywords
- mir
- hsa
- mirna
- subject
- mirnas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002062 proliferating effect Effects 0.000 title claims abstract description 208
- 210000001072 colon Anatomy 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims description 205
- 238000011282 treatment Methods 0.000 claims abstract description 89
- 210000004369 blood Anatomy 0.000 claims abstract description 32
- 239000008280 blood Substances 0.000 claims abstract description 32
- 206010009944 Colon cancer Diseases 0.000 claims description 309
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 255
- 208000029742 colonic neoplasm Diseases 0.000 claims description 217
- 208000035475 disorder Diseases 0.000 claims description 206
- 239000012472 biological sample Substances 0.000 claims description 139
- 206010028980 Neoplasm Diseases 0.000 claims description 134
- 229920002477 rna polymer Polymers 0.000 claims description 129
- 150000007523 nucleic acids Chemical class 0.000 claims description 122
- 201000011510 cancer Diseases 0.000 claims description 107
- 239000000523 sample Substances 0.000 claims description 96
- 210000004027 cell Anatomy 0.000 claims description 94
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 87
- 208000003200 Adenoma Diseases 0.000 claims description 76
- 206010001233 Adenoma benign Diseases 0.000 claims description 71
- 230000014509 gene expression Effects 0.000 claims description 70
- 238000005259 measurement Methods 0.000 claims description 66
- 102000039446 nucleic acids Human genes 0.000 claims description 66
- 108020004707 nucleic acids Proteins 0.000 claims description 66
- 238000010801 machine learning Methods 0.000 claims description 57
- 108020004414 DNA Proteins 0.000 claims description 55
- 206010048832 Colon adenoma Diseases 0.000 claims description 51
- 239000002299 complementary DNA Substances 0.000 claims description 50
- 201000010099 disease Diseases 0.000 claims description 49
- 238000012549 training Methods 0.000 claims description 45
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims description 35
- 238000003860 storage Methods 0.000 claims description 31
- 238000012544 monitoring process Methods 0.000 claims description 29
- 201000002758 colorectal adenoma Diseases 0.000 claims description 27
- 230000035945 sensitivity Effects 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 24
- 206010058314 Dysplasia Diseases 0.000 claims description 21
- 208000007660 Residual Neoplasm Diseases 0.000 claims description 21
- 210000002381 plasma Anatomy 0.000 claims description 21
- 208000004804 Adenomatous Polyps Diseases 0.000 claims description 20
- 206010025323 Lymphomas Diseases 0.000 claims description 20
- 208000015634 Rectal Neoplasms Diseases 0.000 claims description 20
- 206010039491 Sarcoma Diseases 0.000 claims description 20
- 208000002458 carcinoid tumor Diseases 0.000 claims description 20
- 206010038038 rectal cancer Diseases 0.000 claims description 20
- 201000001275 rectum cancer Diseases 0.000 claims description 20
- 206010007275 Carcinoid tumour Diseases 0.000 claims description 19
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 claims description 19
- 201000004528 gastrointestinal lymphoma Diseases 0.000 claims description 19
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 claims description 19
- 238000012706 support-vector machine Methods 0.000 claims description 16
- 210000002966 serum Anatomy 0.000 claims description 15
- 230000003321 amplification Effects 0.000 claims description 14
- -1 hsa-miR-5096 Proteins 0.000 claims description 14
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 14
- 230000000112 colonic effect Effects 0.000 claims description 13
- 210000001124 body fluid Anatomy 0.000 claims description 12
- 238000003753 real-time PCR Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 12
- 238000010839 reverse transcription Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 11
- 239000002253 acid Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 239000012634 fragment Substances 0.000 claims description 10
- 210000002700 urine Anatomy 0.000 claims description 10
- 238000007637 random forest analysis Methods 0.000 claims description 9
- 210000000601 blood cell Anatomy 0.000 claims description 8
- 239000010839 body fluid Substances 0.000 claims description 8
- 230000002980 postoperative effect Effects 0.000 claims description 8
- 210000004881 tumor cell Anatomy 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 230000002441 reversible effect Effects 0.000 claims description 7
- 108091068993 Homo sapiens miR-142 stem-loop Proteins 0.000 claims description 6
- 108091072656 Homo sapiens miR-3065 stem-loop Proteins 0.000 claims description 6
- 108091066985 Homo sapiens miR-335 stem-loop Proteins 0.000 claims description 6
- 108091067010 Homo sapiens miR-338 stem-loop Proteins 0.000 claims description 6
- 108091066899 Homo sapiens miR-340 stem-loop Proteins 0.000 claims description 6
- 108091032108 Homo sapiens miR-424 stem-loop Proteins 0.000 claims description 6
- 108091064332 Homo sapiens miR-4772 stem-loop Proteins 0.000 claims description 6
- 108091064268 Homo sapiens miR-4785 stem-loop Proteins 0.000 claims description 6
- 108091044861 Homo sapiens miR-548n stem-loop Proteins 0.000 claims description 6
- 108091063733 Homo sapiens miR-570 stem-loop Proteins 0.000 claims description 6
- 108091061594 Homo sapiens miR-590 stem-loop Proteins 0.000 claims description 6
- 108091038962 Homo sapiens miR-6073 stem-loop Proteins 0.000 claims description 6
- 108091045825 Homo sapiens miR-1181 stem-loop Proteins 0.000 claims description 4
- 108091078081 Homo sapiens miR-320d-1 stem-loop Proteins 0.000 claims description 4
- 230000000903 blocking effect Effects 0.000 claims description 4
- 108091092259 cell-free RNA Proteins 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 239000000539 dimer Substances 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 208000022271 tubular adenoma Diseases 0.000 claims description 4
- 108700039887 Essential Genes Proteins 0.000 claims description 3
- 108091067628 Homo sapiens miR-10a stem-loop Proteins 0.000 claims description 3
- 108091044886 Homo sapiens miR-1250 stem-loop Proteins 0.000 claims description 3
- 108091044694 Homo sapiens miR-1255a stem-loop Proteins 0.000 claims description 3
- 108091044798 Homo sapiens miR-1287 stem-loop Proteins 0.000 claims description 3
- 108091044974 Homo sapiens miR-1303 stem-loop Proteins 0.000 claims description 3
- 108091069089 Homo sapiens miR-146a stem-loop Proteins 0.000 claims description 3
- 108091070489 Homo sapiens miR-17 stem-loop Proteins 0.000 claims description 3
- 108091067602 Homo sapiens miR-181b-1 stem-loop Proteins 0.000 claims description 3
- 108091065989 Homo sapiens miR-181b-2 stem-loop Proteins 0.000 claims description 3
- 108091070517 Homo sapiens miR-19a stem-loop Proteins 0.000 claims description 3
- 108091070519 Homo sapiens miR-19b-1 stem-loop Proteins 0.000 claims description 3
- 108091070495 Homo sapiens miR-19b-2 stem-loop Proteins 0.000 claims description 3
- 108091069457 Homo sapiens miR-200b stem-loop Proteins 0.000 claims description 3
- 108091066023 Homo sapiens miR-200c stem-loop Proteins 0.000 claims description 3
- 108091070496 Homo sapiens miR-20a stem-loop Proteins 0.000 claims description 3
- 108091032024 Homo sapiens miR-20b stem-loop Proteins 0.000 claims description 3
- 108091070494 Homo sapiens miR-22 stem-loop Proteins 0.000 claims description 3
- 108091069527 Homo sapiens miR-223 stem-loop Proteins 0.000 claims description 3
- 108091069063 Homo sapiens miR-23b stem-loop Proteins 0.000 claims description 3
- 108091070400 Homo sapiens miR-27a stem-loop Proteins 0.000 claims description 3
- 108091070397 Homo sapiens miR-28 stem-loop Proteins 0.000 claims description 3
- 108091065163 Homo sapiens miR-30c-1 stem-loop Proteins 0.000 claims description 3
- 108091067641 Homo sapiens miR-30c-2 stem-loop Proteins 0.000 claims description 3
- 108091072948 Homo sapiens miR-3138 stem-loop Proteins 0.000 claims description 3
- 108091072940 Homo sapiens miR-3157 stem-loop Proteins 0.000 claims description 3
- 108091072674 Homo sapiens miR-3187 stem-loop Proteins 0.000 claims description 3
- 108091067007 Homo sapiens miR-324 stem-loop Proteins 0.000 claims description 3
- 108091066896 Homo sapiens miR-331 stem-loop Proteins 0.000 claims description 3
- 108091056656 Homo sapiens miR-3648-1 stem-loop Proteins 0.000 claims description 3
- 108091045458 Homo sapiens miR-3648-2 stem-loop Proteins 0.000 claims description 3
- 108091056681 Homo sapiens miR-3651 stem-loop Proteins 0.000 claims description 3
- 108091056608 Homo sapiens miR-3679 stem-loop Proteins 0.000 claims description 3
- 108091067245 Homo sapiens miR-378a stem-loop Proteins 0.000 claims description 3
- 108091032793 Homo sapiens miR-450a-1 stem-loop Proteins 0.000 claims description 3
- 108091064510 Homo sapiens miR-450a-2 stem-loop Proteins 0.000 claims description 3
- 108091086503 Homo sapiens miR-450b stem-loop Proteins 0.000 claims description 3
- 108091023089 Homo sapiens miR-4685 stem-loop Proteins 0.000 claims description 3
- 108091064508 Homo sapiens miR-501 stem-loop Proteins 0.000 claims description 3
- 108091030843 Homo sapiens miR-5189 stem-loop Proteins 0.000 claims description 3
- 108091063807 Homo sapiens miR-545 stem-loop Proteins 0.000 claims description 3
- 108091060472 Homo sapiens miR-550a-3 stem-loop Proteins 0.000 claims description 3
- 108091054788 Homo sapiens miR-550b-1 stem-loop Proteins 0.000 claims description 3
- 108091054783 Homo sapiens miR-550b-2 stem-loop Proteins 0.000 claims description 3
- 108091063765 Homo sapiens miR-584 stem-loop Proteins 0.000 claims description 3
- 108091058649 Homo sapiens miR-6125 stem-loop Proteins 0.000 claims description 3
- 108091061644 Homo sapiens miR-624 stem-loop Proteins 0.000 claims description 3
- 108091061649 Homo sapiens miR-625 stem-loop Proteins 0.000 claims description 3
- 108091024724 Homo sapiens miR-6721 stem-loop Proteins 0.000 claims description 3
- 108091024560 Homo sapiens miR-6741 stem-loop Proteins 0.000 claims description 3
- 108091024423 Homo sapiens miR-6790 stem-loop Proteins 0.000 claims description 3
- 108091024378 Homo sapiens miR-6867 stem-loop Proteins 0.000 claims description 3
- 108091084852 Homo sapiens miR-7704 stem-loop Proteins 0.000 claims description 3
- 108091082621 Homo sapiens miR-7847 stem-loop Proteins 0.000 claims description 3
- 108091087110 Homo sapiens miR-940 stem-loop Proteins 0.000 claims description 3
- 108091087115 Homo sapiens miR-942 stem-loop Proteins 0.000 claims description 3
- 108091008060 MIR10A Proteins 0.000 claims description 3
- 108091008051 MIR27A Proteins 0.000 claims description 3
- 208000037062 Polyps Diseases 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 108091060457 Homo sapiens miR-320b-1 stem-loop Proteins 0.000 claims description 2
- 108091062096 Homo sapiens miR-320b-2 stem-loop Proteins 0.000 claims description 2
- 238000002123 RNA extraction Methods 0.000 claims description 2
- 230000000779 depleting effect Effects 0.000 claims description 2
- 208000017819 hyperplastic polyp Diseases 0.000 claims description 2
- 108091090911 miR-1181 stem-loop Proteins 0.000 claims description 2
- 108091087311 miR-320c stem-loop Proteins 0.000 claims description 2
- 108091054873 miR-320c-1 stem-loop Proteins 0.000 claims description 2
- 108091025794 miR-320c-2 stem-loop Proteins 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 201000007553 villous adenocarcinoma Diseases 0.000 claims description 2
- 208000009540 villous adenoma Diseases 0.000 claims description 2
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 claims 7
- 201000010989 colorectal carcinoma Diseases 0.000 claims 7
- 150000007513 acids Chemical class 0.000 claims 1
- 239000002679 microRNA Substances 0.000 abstract description 400
- 108091070501 miRNA Proteins 0.000 abstract description 187
- 238000003745 diagnosis Methods 0.000 abstract description 21
- 230000008984 colonic lesion Effects 0.000 abstract description 16
- 230000003902 lesion Effects 0.000 abstract description 12
- 239000000090 biomarker Substances 0.000 abstract description 10
- 230000002265 prevention Effects 0.000 abstract description 5
- 108700011259 MicroRNAs Proteins 0.000 description 217
- 102000053602 DNA Human genes 0.000 description 54
- 238000012360 testing method Methods 0.000 description 41
- 238000012163 sequencing technique Methods 0.000 description 29
- 230000015654 memory Effects 0.000 description 28
- 238000003556 assay Methods 0.000 description 26
- 108091049552 miR-889 stem-loop Proteins 0.000 description 26
- 238000001514 detection method Methods 0.000 description 22
- 238000002591 computed tomography Methods 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- 108091007700 MIR543 Proteins 0.000 description 18
- 108091076271 miR-543 stem-loop Proteins 0.000 description 15
- 238000001356 surgical procedure Methods 0.000 description 15
- 238000012216 screening Methods 0.000 description 14
- 230000001225 therapeutic effect Effects 0.000 description 14
- 108090000623 proteins and genes Proteins 0.000 description 13
- 238000001959 radiotherapy Methods 0.000 description 13
- 238000002512 chemotherapy Methods 0.000 description 12
- 201000010897 colon adenocarcinoma Diseases 0.000 description 12
- 239000003814 drug Substances 0.000 description 12
- 125000003729 nucleotide group Chemical group 0.000 description 12
- 230000009471 action Effects 0.000 description 11
- 238000009169 immunotherapy Methods 0.000 description 11
- 238000007477 logistic regression Methods 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000002052 colonoscopy Methods 0.000 description 10
- 238000002790 cross-validation Methods 0.000 description 10
- 108091079007 miR-376b stem-loop Proteins 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 10
- 239000002243 precursor Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 9
- 108091027963 non-coding RNA Proteins 0.000 description 9
- 102000042567 non-coding RNA Human genes 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 229940079593 drug Drugs 0.000 description 8
- 108091031484 miR-335 stem-loop Proteins 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000002604 ultrasonography Methods 0.000 description 8
- 108020004417 Untranslated RNA Proteins 0.000 description 7
- 102000039634 Untranslated RNA Human genes 0.000 description 7
- 238000009534 blood test Methods 0.000 description 7
- 238000000354 decomposition reaction Methods 0.000 description 7
- 238000009533 lab test Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 108091038449 miR-1185-1 stem-loop Proteins 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 210000000038 chest Anatomy 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 238000002595 magnetic resonance imaging Methods 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 238000002600 positron emission tomography Methods 0.000 description 6
- 230000004043 responsiveness Effects 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 238000007847 digital PCR Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 108091007428 primary miRNA Proteins 0.000 description 5
- 108020004418 ribosomal RNA Proteins 0.000 description 5
- 108091086467 Homo sapiens miR-889 stem-loop Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 4
- 238000000205 computational method Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000013399 early diagnosis Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 108091032955 Bacterial small RNA Proteins 0.000 description 3
- 230000005778 DNA damage Effects 0.000 description 3
- 231100000277 DNA damage Toxicity 0.000 description 3
- 206010061818 Disease progression Diseases 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108091078837 Homo sapiens miR-10399 stem-loop Proteins 0.000 description 3
- 108091062191 Homo sapiens miR-1185-1 stem-loop Proteins 0.000 description 3
- 108091062138 Homo sapiens miR-1185-2 stem-loop Proteins 0.000 description 3
- 108091083670 Homo sapiens miR-12135 stem-loop Proteins 0.000 description 3
- 108091044774 Homo sapiens miR-1277 stem-loop Proteins 0.000 description 3
- 108091068986 Homo sapiens miR-135a-2 stem-loop Proteins 0.000 description 3
- 108091065981 Homo sapiens miR-155 stem-loop Proteins 0.000 description 3
- 108091051657 Homo sapiens miR-1843 stem-loop Proteins 0.000 description 3
- 108091072946 Homo sapiens miR-3140 stem-loop Proteins 0.000 description 3
- 108091072961 Homo sapiens miR-3143 stem-loop Proteins 0.000 description 3
- 108091072670 Homo sapiens miR-3184 stem-loop Proteins 0.000 description 3
- 108091072560 Homo sapiens miR-3202-1 stem-loop Proteins 0.000 description 3
- 108091067253 Homo sapiens miR-369 stem-loop Proteins 0.000 description 3
- 108091067566 Homo sapiens miR-374a stem-loop Proteins 0.000 description 3
- 108091067563 Homo sapiens miR-376a-1 stem-loop Proteins 0.000 description 3
- 108091063912 Homo sapiens miR-376a-2 stem-loop Proteins 0.000 description 3
- 108091053844 Homo sapiens miR-376b stem-loop Proteins 0.000 description 3
- 108091067243 Homo sapiens miR-377 stem-loop Proteins 0.000 description 3
- 108091067554 Homo sapiens miR-381 stem-loop Proteins 0.000 description 3
- 108091067543 Homo sapiens miR-382 stem-loop Proteins 0.000 description 3
- 108091032537 Homo sapiens miR-409 stem-loop Proteins 0.000 description 3
- 108091053847 Homo sapiens miR-410 stem-loop Proteins 0.000 description 3
- 108091032109 Homo sapiens miR-423 stem-loop Proteins 0.000 description 3
- 108091053855 Homo sapiens miR-485 stem-loop Proteins 0.000 description 3
- 108091063520 Homo sapiens miR-5009 stem-loop Proteins 0.000 description 3
- 108091064470 Homo sapiens miR-518b stem-loop Proteins 0.000 description 3
- 108091086476 Homo sapiens miR-543 stem-loop Proteins 0.000 description 3
- 108091061687 Homo sapiens miR-548a-3 stem-loop Proteins 0.000 description 3
- 108091055281 Homo sapiens miR-548al stem-loop Proteins 0.000 description 3
- 108091054148 Homo sapiens miR-548am stem-loop Proteins 0.000 description 3
- 108091089169 Homo sapiens miR-548ax stem-loop Proteins 0.000 description 3
- 108091044789 Homo sapiens miR-548k stem-loop Proteins 0.000 description 3
- 108091055558 Homo sapiens miR-548o-2 stem-loop Proteins 0.000 description 3
- 108091054786 Homo sapiens miR-548z stem-loop Proteins 0.000 description 3
- 108091089493 Homo sapiens miR-5581 stem-loop Proteins 0.000 description 3
- 108091038964 Homo sapiens miR-6077 stem-loop Proteins 0.000 description 3
- 108091061622 Homo sapiens miR-628 stem-loop Proteins 0.000 description 3
- 108091061677 Homo sapiens miR-654 stem-loop Proteins 0.000 description 3
- 108091061564 Homo sapiens miR-656 stem-loop Proteins 0.000 description 3
- 108091086478 Homo sapiens miR-665 stem-loop Proteins 0.000 description 3
- 108091041397 Homo sapiens miR-6770 stem-loop Proteins 0.000 description 3
- 108091024616 Homo sapiens miR-6770-1 stem-loop Proteins 0.000 description 3
- 108091041395 Homo sapiens miR-6770-3 stem-loop Proteins 0.000 description 3
- 108091060481 Homo sapiens miR-758 stem-loop Proteins 0.000 description 3
- 206010073365 Intraductal papillary mucinous carcinoma of pancreas Diseases 0.000 description 3
- 108091007699 MIR665 Proteins 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 230000005750 disease progression Effects 0.000 description 3
- 230000002550 fecal effect Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 201000004754 pancreatic intraductal papillary-mucinous neoplasm Diseases 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 239000013074 reference sample Substances 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 229920001621 AMOLED Polymers 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 108091069031 Homo sapiens miR-190a stem-loop Proteins 0.000 description 2
- 108091044873 Homo sapiens miR-548g stem-loop Proteins 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 238000010802 RNA extraction kit Methods 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 238000011226 adjuvant chemotherapy Methods 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 238000013079 data visualisation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108091025804 miR-12135 stem-loop Proteins 0.000 description 2
- 108091049014 miR-548k stem-loop Proteins 0.000 description 2
- 238000003253 miRNA assay Methods 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 210000004877 mucosa Anatomy 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 208000012201 sexual and gender identity disease Diseases 0.000 description 2
- 208000015891 sexual disease Diseases 0.000 description 2
- 238000002579 sigmoidoscopy Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000019399 Colonic disease Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000012623 DNA damaging agent Substances 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 206010072082 Environmental exposure Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 108091007417 HOX transcript antisense RNA Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108091060471 Homo sapiens miR-320c-1 stem-loop Proteins 0.000 description 1
- 108091078079 Homo sapiens miR-320c-2 stem-loop Proteins 0.000 description 1
- 108091078082 Homo sapiens miR-320d-2 stem-loop Proteins 0.000 description 1
- 108091044800 Homo sapiens miR-548e stem-loop Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091093105 Nuclear DNA Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 206010033307 Overweight Diseases 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 108020005093 RNA Precursors Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028733 RNTP Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108091007416 X-inactive specific transcript Proteins 0.000 description 1
- 108091035715 XIST (gene) Proteins 0.000 description 1
- 108091029474 Y RNA Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 230000025084 cell cycle arrest Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 210000001731 descending colon Anatomy 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001085 differential centrifugation Methods 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000001631 hypertensive effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091081505 miR-190 stem-loop Proteins 0.000 description 1
- 108091049762 miR-190a stem-loop Proteins 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012340 reverse transcriptase PCR Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Zoology (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Software Systems (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biochemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioethics (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
Abstract
本開示は、結腸細胞増殖性障害を患っていない個体または結腸細胞増殖性障害を発症するリスクが低い個体の対応試料と比較して、それぞれ結腸細胞増殖性障害を患う個体または結腸細胞増殖性障害を発症するリスクが高い個体の試料において差動的に発現されるmiRNAに関連する。いくつかの実施形態では、miRNAは、大腸病変を患うとともに結腸細胞増殖性障害を発症するリスクがないか低い個体の対応組織試料または血液試料と比較して、大腸病変を患うとともに結腸細胞増殖性障害を発症するリスクが高い個体の組織試料または血漿試料において差動的に発現される。差動的に発現されたこれらmiRNAは、結腸細胞増殖性障害の診断、処置、および/または予防のバイオマーカとして、特に大腸病変を患う対象に使用することができる。【選択図】図2
Description
関連出願への相互参照
本出願は、2020年4月29日出願の米国仮特許出願第63/017,552号、および2020年5月14日出願の米国仮特許出願第63/024,875号の利益を主張するものであり、これら出願はそれぞれ、その全体を参照することで本明細書中に援用される。
本出願は、2020年4月29日出願の米国仮特許出願第63/017,552号、および2020年5月14日出願の米国仮特許出願第63/024,875号の利益を主張するものであり、これら出願はそれぞれ、その全体を参照することで本明細書中に援用される。
処置が最も有効なのは症状発症前の早期段階で悪性腫瘍または前駆病変が検出されるときであるため、癌のスクリーニングと早期検出は、癌に対し最も有効な戦略と認められている。例えば、大腸癌では、大腸内視鏡検査が早期診断の改善に役割を果たす。大腸内視鏡は早期検出に有用ではあるが、患者が遵守する割合は低く、手術の侵襲性が原因で推奨規則が満たされていない状態でスクリーニングが行われる。このため、早期癌検出におけるより有望な手法は、非侵襲的な方法により提供される。
本開示は、結腸細胞増殖性障害(例えば、大腸癌)の検出および疾患進行に関連する遺伝子に対するマイクロリボ核酸(マイクロRNAまたはmiRNA)プロファイリングに関する。本開示のいくつかの実施形態は、結腸細胞増殖性障害を患っていない対象または結腸細胞増殖性障害を発症するリスクが低い対象の対応試料と比較して、結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料において差動的に発現されるmiRNAを提供する。いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが高い対象と、結腸細胞増殖性障害を発症するリスクが低い対象はそれぞれ、大腸粘膜内に非侵襲性前駆病変(以降、大腸病変とする)が生じる。結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料中に様々な存在量で存在する(多くの場合、「差動的に発現される」と称される)miRNAは、結腸細胞増殖性障害の診断、処置、および/または予防のバイオマーカとして使用することができる。
本明細書中で特定されるmiRNAは、結腸細胞増殖性障害を患う対象を特定して結腸細胞増殖性障害を患っていない対象と判別するために、もしくは結腸細胞増殖性障害を発症するリスクが高い対象を特定して結腸細胞増殖性障害を発症するリスクが低い対象と判別するために、または結腸細胞増殖性障害前駆体(膵管内乳頭粘液性腫瘍(IPMN)など)を有する対象とIPMNがない対象を特定するために、あるいは悪性IPMNを有する対象と良性IPMNを有する対象を特定するために使用することができる。このため、これらmiRNAは、結腸細胞増殖性障害のモニタリング、処置、および管理に伴う決断の指針となる補助ツールとして使用することができる。
本開示のいくつかの実施形態は、例えば対象が大腸病変を患っているとき、結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料において差動的に発現される本明細書に記載のmiRNAに対し訓練された、機械学習モデル分類器を提供する。一例では、組織学的重症度を精査するために大腸病変を患う対象に使用可能である、血液を用いた低侵襲性miRNAアッセイの方法が提供される。別の実施形態では、結腸細胞増殖性障害を示すmiRNAは、対象から得た無細胞試料、例えば、全血、血漿、または血清など対象から得た体液試料中に検出される。そのため、本発明は、結腸細胞増殖性障害、外科切除、免疫療法、放射線療法、または化学療法などの処置を正当化(warrant)する高リスクまたは低リスク大腸病変、およびモニタリング可能である低リスク大腸病変の有無を判別するために使用可能であるmiRNAを提供する。結腸細胞増殖性障害または病変の存在のモニタリングと確認は、例えば大腸内視鏡検査、超音波検査、MM、またはCTスキャンにより実行することができる。
一態様では、本開示は、表1~表11に列挙される群から選択される1つもしくは複数、2つ以上、3つ以上、または4つ以上のmiRNAからなる所定のセットを含む、結腸細胞増殖性障害の特徴を示すマイクロリボ核酸(miRNA)シグネチャパネルを提供し、4つ以上のmiRNAが、結腸細胞増殖性障害またはその亜型を患う対象から得た生体試料と、結腸細胞増殖性障害またはその亜型を患っていない対象から得た生体試料との間で差動的に発現される。
いくつかの実施形態では、miRNAシグネチャパネルは、進行型腺腫の特徴を示すとともに、a)hsa-miR-1273a、hsa-miR-17-5p、hsa-miR-20a-3p、hsa-miR-20b-5p、b)hsa-miR-3065-5p、hsa-miR-4785、hsa-miR-5096、hsa-miR-5189-5p、またはc)hsa-miR-545-3p、hsa-miR-570-3p、hsa-miR-624-3p、hsa-mir-1181、hsa-mir-6073を含むmiRNAからなる所定のセットを含んでおり、miRNAは、進行型腺腫またはその亜型を患う対象から得た生体試料と、進行型腺腫またはその亜型を患っていない対象から得た生体試料との間で差動的に発現される。
いくつかの実施形態では、miRNAシグネチャパネルは、大腸癌の特徴を示すとともに、a)hsa-miR-1250-5p、hsa-miR-1255a、hsa-miR-223-3p、hsa-miR-338-3p、hsa-miR-338-5p、b)hsa-miR-424-5p、hsa-miR-424-3p、hsa-miR-450a-5p、hsa-miR-450b-5p、hsa-miR-4772-3p、c)hsa-miR-4772-5p、hsa-miR-625-5p、hsa-miR-7847-3p、hsa-miR-1181、hsa-miR-3651、hsa-mir-6073、d)hsa-mir-6125、hsa-mir-7704、hsa-miR-19b-3p、hsa-miR-19a-3p、hsa-miR-3157-5p、e)hsa-miR-142-3p、hsa-miR-30c-5p、hsa-miR-6741-5p、hsa-miR-590-3p、hsa-miR-4685-5p、f)hsa-miR-3648、hsa-miR-331-3p、hsa-miR-1303、hsa-miR-6790-3p、hsa-miR-6867-5p、hsa-miR-942-5p、g)hsa-miR-378a-3p、hsa-miR-1287-5p、hsa-mir-4785、hsa-miR-324-3p、hsa-miR-550b-2-5p、h)hsa-miR-200c-3p、hsa-miR-200b-3p、hsa-miR-3679-5p、hsa-miR-550a-3-5p、hsa-miR-3187-3p、i)hsa-miR-181b-5p、hsa-miR-3138、hsa-miR-146a-5p、hsa-miR-6721-5p、hsa-miR-23b-3p、hsa-miR-28-5p、j)hsa-miR-320d、hsa-miR-940、hsa-miR-320d-1、hsa-miR-10a-5p、hsa-miR-340-5p、k)hsa-miR-320b、hsa-miR-335-5p、hsa-miR-320c、hsa-miR-501-3p、hsa-miR-548n、またはl)hsa-miR-27a-3p、hsa-miR-3065-3p、hsa-miR-548aa@、hsa-miR-584-3p、hsa-miR-22-3pを含むmiRNAからなる所定のセットを含んでおり、miRNAは、大腸癌またはその亜型を患う対象から得た生体試料と、大腸癌またはその亜型を患っていない対象から得た生体試料との間で差動的に発現される。
いくつかの実施形態では、miRNAからなる所定のセットは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、生体試料は、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、生体試料は、核酸、DNA、RNA、または無細胞核酸(cfDNAまたはcfRNA)を含む。
いくつかの実施形態では、miRNAは、成熟miRNAおよびmiRNAヘアピンを含む。
いくつかの実施形態では、シグネチャパネルは、表1~表11に列挙される群から選択される1つまたは複数、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、10以上、11以上、または12以上のmiRNAにおける差動的発現を含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される。
別の実施形態では、本開示は、健康な対象集団(例えば、結腸細胞増殖性障害がない対象)と、結腸細胞増殖性障害を患う対象とを判別可能な分類器であって、a)分類器は、表1~表11に列挙される群から選択される6つ以上または12以上の予め選択したmiRNAにおける差動的miRNA発現を表す測定値のセットを含み、この測定値は、健康な対象と結腸細胞増殖性障害を患う対象から得たmiRNA発現データから取得され、b)測定値は、差動的miRNA発現の特性に相当する一組の特徴を生成するために使用され、この一組の特徴は、機械学習モデル(例えば、統計モデル)を使用してコンピュータにより処理され、c)機械学習モデルは、健康な対象集団と、結腸細胞増殖性障害を患う対象とを判別可能な分類器として有用な特徴ベクトルを提供する、分類器を提供する。
いくつかの実施形態では、予め選択したmiRNAは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、測定値のセットは、異なる数を有するフラグメントの観察の数または割合、生のmiRNA存在量、ハウスキーピング遺伝子へと正規化されるmiRNA存在量、合成配列へと正規化されるmiRNA存在量、対数正規化されたmiRNA存在量、フラグメント長、フラグメント中点、成熟miRNAまたはmiRNAヘアピンに沿ったリードマッピング位置およびリードパイルアップ、ならびにmiRNAクラスタの存在量からなる群から選択される差動的miRNA発現の特徴を記述する。
いくつかの実施形態では、機械学習モデルは、訓練生体試料、結腸細胞増殖性障害を患う対象に相当すると特定される訓練生体試料の第1のサブセット、および結腸細胞増殖性障害を患っていない対象に相当すると特定される訓練生体試料の第2のサブセットから取得した訓練データを用いて訓練される。
いくつかの実施形態では、分類器は、a)miRNAシグネチャパネルに基づき対象を分類するのに操作可能な分類器を含むコンピュータ可読媒体と、b)コンピュータ可読記憶媒体に記憶される命令を実行するための1または複数のプロセッサとを含む、結腸細胞増殖性障害を検出するためのシステムに設けられる。
いくつかの実施形態では、上記システムは、深層学習分類器、ニューラルネットワーク分類器、線形判別分析(LDA)分類器、二次判別分析(QDA)分類器、サポート・ベクター・マシン(SVM)分類器、ランダムフォレスト(RF)分類器、線形カーネル・サポート・ベクター・マシン分類器、一次または二次多項式カーネル・サポート・ベクター・マシン分類器、リッジ回帰分類器、弾性ネットアルゴリズム分類器、逐次最小問題最適化アルゴリズム分類器、単純ベイズアルゴリズム分類器、および主成分分析分類器からなる群から選択される機械学習分類器として構成される分類回路を含む。
別の実施形態では、本開示は、対象から得た生体試料のマイクロリボ核酸(miRNA)プロファイルを決定するための方法であって、a)生体試料からRNA分子を単離する工程と、b)RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する前または後にRNAアダプタをRNA分子にライゲートする工程と、c)cDNA分子を増幅する工程と、d)cDNA分子の核酸配列を決定する工程と、e)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて核酸配列を参照核酸配列にアライメントする工程と、f)アライメントされた核酸配列に少なくとも部分的に基づき対象のmiRNAプロファイルを決定する工程とを含む方法を提供する。
いくつかの実施形態では、予め選択したmiRNAは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、上記方法は、RNA分子またはcDNA分子を富化または枯渇させる工程をさらに含む。
いくつかの実施形態では、参照核酸配列は、ゲノム、トランスクリプトーム、またはカスタムトランスクリプトームの参照核酸配列を含む。
いくつかの実施形態では、上記方法は、増幅前にmiRNAライブラリを調製する工程をさらに含む。
いくつかの実施形態では、アダプタのライゲーションは、上記cの前にRNAアダプタライゲーション、アダプタブロッキング、アダプタ環状化、および二量体除去を含む。
いくつかの実施形態では、RNAアダプタをライゲートする工程は、アダプタブロッキング、アダプタ環状化、および/または二量体除去を実行することを含む。
いくつかの実施形態では、RNAアダプタをライゲートする工程は、3’RNAアダプタライゲーション、5’RNAアダプタライゲーション、固有分子識別子(UMI)割付けによる逆転写、および/またはcDNAクリーンアップを実行することを含む。
別の態様では、本開示は、対象から得た生体試料のマイクロリボ核酸(miRNA)プロファイルを決定するための方法であって、1)生体試料からのRNA分子の抽出後、直接RNAを計数すること、2)生体試料からのRNA分子の抽出後、Aテーリングを行い、次いで鋳型スイッチングによりcDNAへと逆転写(RT)すること、3)生体試料からのRNA分子の抽出後、Aテーリングを行い、次いで逆転写ポリメラーゼ連鎖反応(RT-PCR)と量的PCR(qPCR)またはデジタルドロップレットPCR(ddPCR)を行うこと、4)生体試料からのRNA分子の抽出後、配列特異的ライゲーションを行い、次いでRT-PCRとqPCRまたはddPCRを行うこと、ならびに5)RNA単離を実行しない条件下で生体試料から得たRNA分子の抽出不要miRNAプロファイリングを行うことのうち、1または複数を行う工程と、前記対象から得た生体試料のmiRNAプロファイルを決定する工程と含む方法を提供する。
いくつかの実施形態では、miRNAプロファイルを決定する工程は、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である参照核酸配列の使用を含む。
いくつかの実施形態では、miRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することを含む。
いくつかの実施形態では、miRNAプロファイルを決定する工程は、発現されたmiRNAに基づき正規化されたカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む。
いくつかの実施形態では、miRNAプロファイルは、結腸細胞増殖性障害と関連付けられ、かつ、結腸細胞増殖性障害を患っている、または結腸細胞増殖性障害を患っていないとの対象の分類を提供する。
いくつかの実施形態では、対象から得た生体試料は、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、上記方法は、miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、miRNAプロファイルのmiRNA発現が参照miRNAプロファイルと比して少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%変化することの測定に少なくとも部分的に基づき、対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む
いくつかの実施形態では、上記方法は、miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、miRNAプロファイルのmiRNA発現が参照miRNAプロファイルと比して少なくとも15%変化することの測定に少なくとも部分的に基づき、対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される。
いくつかの実施形態では、進行型腺腫は、管状腺腫、尿細管腺腫、絨毛腺腫、腺癌、または過形成ポリープを含む。
別の態様では、本開示は、対象における結腸細胞増殖性障害の有無を検出するための方法であって、a)生体試料からリボ核酸(RNA)分子を単離する工程と、b)RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する前または後にRNAアダプタをRNA分子にライゲートする工程と、c)cDNA分子を増幅する工程と、d)cDNA分子の核酸配列を決定する工程と、e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて核酸配列を参照核酸配列にアライメントする工程と、f)アライメントされた核酸配列に少なくとも部分的に基づきmiRNAプロファイルを決定する工程と、g)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルを用いてmiRNAプロファイルをコンピュータにより処理することで、結腸細胞増殖性障害の有無に関連する出力値を提供し、それにより対象における結腸細胞増殖性障害の有無を示す工程とを含む方法を提供する。
いくつかの実施形態では、上記bは、試料特異的バーコードおよび/または分子特異的固有分子識別子(UMI)を組み入れることを含む。
いくつかの実施形態では、予め選択したmiRNAは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、参照核酸配列は、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することを含む。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む。
いくつかの実施形態では、対象から得た生体試料は、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、上記方法は、miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、miRNAプロファイルのmiRNA発現が参照miRNAプロファイルと比して少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%変化することの測定に少なくとも部分的に基づき、対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む
いくつかの実施形態では、上記方法は、miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、miRNAプロファイルのmiRNA発現が参照miRNAプロファイルと比して少なくとも15%変化することの測定に少なくとも部分的に基づき、対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される。
別の態様では、本開示は、対象から得た生体試料のmiRNAプロファイルを決定するための方法であって、a)生体試料からリボ核酸(RNA)分子を単離する工程と、b)RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する工程と、c)RNAアダプタをRNA分子またはcDNA分子にライゲートする工程と、d)cDNA分子を増幅する工程と、e)cDNA分子の核酸配列を決定する工程と、f)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて核酸配列を参照核酸配列にアライメントする工程と、g)アライメントされた核酸配列に少なくとも部分的に基づきmiRNAプロファイルを決定する工程とを含む方法を提供する。
いくつかの実施形態では、予め選択したmiRNAは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、上記方法は、検出された結腸細胞増殖性障害に基づき対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、本開示は、対象における結腸細胞増殖性障害の有無を検出するための方法であって、a)生体試料からリボ核酸(RNA)分子を単離する工程と、b)RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する工程と、c)RNAアダプタをRNA分子またはcDNA分子にライゲートする工程と、d)cDNA分子を増幅する工程と、e)cDNA分子の核酸配列を決定する工程と、f)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて核酸配列を参照核酸配列にアライメントする工程と、g)アライメントされた核酸配列に少なくとも部分的に基づきmiRNAプロファイルを決定する工程と、h)結腸細胞増殖性障害を患っていない対象と結腸細胞増殖性障害を患う対象とを判別するよう訓練された機械学習モデルを用いてmiRNAプロファイルをコンピュータにより処理する工程と、i)機械学習モデルにより、結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を患っていない対象に関連する値を出力することで、対象における結腸細胞増殖性障害の有無を検出する工程とを含む方法を提供する。
いくつかの実施形態では、予め選択したmiRNAは、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、上記方法は、検出された結腸細胞増殖性障害に基づき対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、本開示は、以前に疾患の処置を受けた対象における最小残存病変をモニタリングするための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、対象における最小残存病変の変化を検出する工程とを含む方法を提供する。
いくつかの実施形態では、最小残存病変は、処置への応答、腫瘍細胞量、術後残存腫瘍、再発、二次スクリーン(secondary screen)、一次スクリーン(primary screen)、および癌の進展からなる群から選択される。いくつかの実施形態では、上記方法は、対象における最小残存病変に対し検出された変化に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、処置に対する対象の応答を決定するための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、処置に対する対象の応答を決定する工程とを含む方法が、提供される。いくつかの実施形態では、この方法は、対象において決定された処置に対する応答に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、対象の腫瘍細胞量をモニタリングするための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、対象の腫瘍細胞量をモニタリングする工程とを含む方法が、提供される。いくつかの実施形態では、この方法は、対象の腫瘍細胞量に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、対象の術後残存腫瘍を検出するための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、対象の術後残存腫瘍を検出する工程とを含む方法が、提供される。いくつかの実施形態では、この方法は、対象の術後残存腫瘍に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、対象における再発を検出するための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、対象における再発を検出する工程とを含む方法が、提供される。いくつかの実施形態では、この方法は、対象の検出された再発に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
別の態様では、対象のmiRNAプロファイルに少なくとも部分的に基づき、二次スクリーンを実行するための方法が提供される。
別の態様では、対象のmiRNAプロファイルに少なくとも部分的に基づき、一次スクリーンを実行するための方法が提供される。
別の態様では、対象の癌の進展をモニタリングするための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、ベースラインのmiRNA状態の生成後に対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、ベースラインのmiRNA状態と現在のmiRNA状態との差異を決定することで、対象の癌の進展をモニタリングする工程とを含む方法が、提供される。いくつかの実施形態では、この方法は、対象の癌の進展に基づき、対象に処置を施す工程をさらに含む。いくつかの実施形態では、処置は、化学療法、放射線療法、免疫療法、または手術を含む。
いくつかの実施形態では、miRNAプロファイルは、少なくとも約40%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約50%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約60%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約70%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約80%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約90%の感度で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約95%の感度で対象における大腸癌の存在または感受性を示す。
いくつかの実施形態では、miRNAプロファイルは、少なくとも約30%の陽性適中率(PPV)で対象における大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約40%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約50%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約60%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約70%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約80%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約90%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約95%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約99%の陽性適中率(PPV)で大腸癌の存在または感受性を示す。
いくつかの実施形態では、miRNAプロファイルは、少なくとも約40%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約50%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約60%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約70%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約80%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約90%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約95%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。いくつかの実施形態では、miRNAプロファイルは、少なくとも約99%の陰性適中率(NPV)で大腸癌の存在または感受性を示す。
いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.50の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.60の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.70の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.80の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.90の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.95の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。いくつかの実施形態では、訓練されたアルゴリズムは、少なくとも約0.99の曲線下面積(AUC)で対象における大腸癌の存在または感受性を決定する。
いくつかの実施形態では、上記方法は、ユーザの電子デバイスの報告またはグラフィカル・ユーザ・インターフェースを提示する工程をさらに含む。いくつかの実施形態では、ユーザは、対象、個体、または患者である。
いくつかの実施形態では、上記方法は、対象、個体、または患者における大腸癌の存在または感受性の決定の可能性を決定する工程をさらに含む。
いくつかの実施形態では、訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)は、教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポート・ベクター・マシン(SVM)、ニューラルネットワーク、またはランダムフォレストを含む。
いくつかの実施形態では、上記方法は、対象に、大腸癌患者を処置するための治療介入(例えば、化学療法、放射線療法、免疫療法、または手術)など、少なくとも部分的にmiRNAのプロファイルまたは解析に基づく治療介入を提供する工程をさらに含む。
いくつかの実施形態では、上記方法は、大腸癌の存在または感受性をモニタリングする工程をさらに含み、モニタリングする工程は、上記対象における大腸癌の存在または感受性を複数の時点で精査することを含み、精査は、複数の時点それぞれで求められた大腸癌の存在または感受性に基づいて行われる。
いくつかの実施形態では、複数の時点の間の、対象の大腸癌の存在または感受性の評価における差は、(i)対象の大腸癌の存在または感受性の診断、(ii)対象の大腸癌の存在または感受性の予後、および(iii)対象の大腸癌の存在または感受性を処置するための治療経過の有効性もしくは非有効性からなる群から選択される、1もしくは複数の臨床的指標を示す。
いくつかの実施形態では、上記方法は、訓練されたアルゴリズムを用いて複数の別個のサブタイプまたは段階の大腸癌の中から対象の大腸癌のサブタイプを判定することにより、対象の大腸癌を階層化する工程をさらに含む。
本開示の別の態様は、結腸細胞増殖性障害を患う対象の集団を、結腸細胞増殖性障害を患っていない対象と判別するための分類器を提供し、この分類器は、表1~表11に列挙される群から選択される6以上のmiRNAにおける差動的なmiRNA存在量を表す複数組の測定値を含み、測定値は、結腸細胞増殖性障害を患っていない対象および結腸細胞増殖性障害を患う対象から得たmiRNA発現データから取得され、測定値は、差動的miRNA存在量の特性に相当する一連の特徴を生成するのに使用され、この特徴は、機械学習モデルまたは統計モデルに組み入れられ、機械学習モデルまたは統計モデルは、結腸細胞増殖性障害を患っていない対象の集団を、結腸細胞増殖性障害を患う対象と判別することが可能な分類器として有用である特徴ベクトルを提供する。
本開示の別の態様は、1または複数のコンピュータプロセッサによる実行後、上記または本明細書の他の場所のいずれかに記載の方法を実施する機械実行可能コードを備える、非一時的コンピュータ可読媒体を提供する。
本開示の別の態様は、1または複数のコンピュータプロセッサおよびそれに繋がれたコンピュータメモリを備えたシステムを提供する。コンピュータメモリは、1または複数のコンピュータプロセッサによる実行後、上記または本明細書の他の場所のいずれかに記載の方法を実施する機械可読コードを備える。
本開示の別の態様は、a)機械学習モデルを用いたmiRNAシグネチャパネルに基づき、結腸細胞増殖性障害を患う対象の集団と結腸細胞増殖性障害を患っていない対象とを判別するための分類器と、b)コンピュータ可読媒体に記憶された命令を実行するための1または複数のプロセッサとを備えるシステムを提供する。
参照による引用
本明細書中で言及される刊行物、特許、および特許出願はすべて、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により引用されると具体的かつ個別に示されるのと同じ程度にまで、参照により本明細書に引用される。参照により引用される刊行物と特許または特許出願が本明細書に含まれる開示と矛盾する限り、本明細書は、このような矛盾が生じるあらゆる題材にした材料に取って代わる、および/または優先するように意図される。
本明細書中で言及される刊行物、特許、および特許出願はすべて、あたかも個々の刊行物、特許、または特許出願がそれぞれ参照により引用されると具体的かつ個別に示されるのと同じ程度にまで、参照により本明細書に引用される。参照により引用される刊行物と特許または特許出願が本明細書に含まれる開示と矛盾する限り、本明細書は、このような矛盾が生じるあらゆる題材にした材料に取って代わる、および/または優先するように意図される。
ここに、本開示の例を、ほんの一例として添付の図面を参照しつつ記述する。本発明の新規な特徴は、添付の特許請求の範囲において具体的に明記される。本発明の原理が利用される例示的実施形態を明記する以下の詳細な説明と、添付の図面(本明細書では「図面(Figure)」や「図(FIG.)」ともいう)を参照することで、本発明の特徴と利点がより良く理解されるであろう。
本発明の様々な実施形態が本明細書中で示され、記述されているが、かかる実施形態はほんの一例として提供されることは当業者に明白であろう。多数の変形、変更、および置換えが、本発明から逸脱することなく当業者によりなされてよい。本明細書に記載の本発明の実施形態に対する様々な代替物が利用されてよいことを理解されたい。
処置が最も有効なのは症状発症前の早期段階で悪性腫瘍または前駆病変が検出されるときであるため、癌のスクリーニングと早期検出は、癌に対し最も有効な戦略と認められている。例えば、大腸癌では、大腸内視鏡検査が早期診断の改善に役割を果たす。大腸内視鏡は早期検出に有用ではあるが、患者が遵守する割合は低く、手術の侵襲性が原因で推奨規則が満たされていない状態でスクリーニングが行われる。このため、早期癌検出におけるより有望な手法は、非侵襲的な方法により提供される。
本開示は、結腸細胞増殖性障害(例えば、大腸癌)の検出および疾患進行に関連する遺伝子に対するマイクロリボ核酸(マイクロRNAまたはmiRNA)プロファイリングに関する。本開示のいくつかの実施形態は、結腸細胞増殖性障害を患っていない対象または結腸細胞増殖性障害を発症するリスクが低い対象の対応試料と比較して、結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料において差動的に発現されるmiRNAを提供する。いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが高い対象と、結腸細胞増殖性障害を発症するリスクが低い対象はそれぞれ、大腸粘膜内に生じる非侵襲性前駆病変(以降、大腸病変とする)を患っている。結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料中に様々な存在量で存在する(多くの場合、「差動的に発現される」と称される)miRNAは、結腸細胞増殖性障害の診断、処置、および/または予防のバイオマーカとして使用することができる。
本明細書中で特定されるmiRNAは、結腸細胞増殖性障害を患っている対象を特定して結腸細胞増殖性障害を患っていない対象と判別するために、もしくは結腸細胞増殖性障害を発症するリスクが高い対象を特定して結腸細胞増殖性障害を発症するリスクが低い対象と判別するために、または結腸細胞増殖性障害前駆体(膵管内乳頭粘液性腫瘍(IPMN)など)を有する対象とIPMNがない対象を特定するために、あるいは悪性IPMNを有する対象と良性IPMNを有する対象を特定するために使用することができる。このため、これらmiRNAは、結腸細胞増殖性障害のモニタリング、処置、および管理に伴う決断の指針となる補助ツールとして使用することができる。
本開示のいくつかの実施形態は、例えば対象が大腸病変を患っているとき、結腸細胞増殖性障害を患う対象または結腸細胞増殖性障害を発症するリスクが高い対象の試料において差動的に発現される本明細書に記載のmiRNAに対し訓練された、機械学習モデル分類器を提供する。一例では、組織学的重症度を精査するために大腸病変を患う対象に使用可能である、血液を用いた低侵襲性miRNAアッセイの方法が提供される。別の実施形態では、結腸細胞増殖性障害を示すmiRNAは、対象から得た無細胞試料、例えば、全血、血漿、または血清など対象から得た体液試料中に検出される。そのため、本発明は、結腸細胞増殖性障害、外科切除、免疫療法、放射線療法、または化学療法などの処置を正当化(warrant)する高リスクまたは低リスク大腸病変、およびモニタリング可能である低リスク大腸病変の有無を判別するために使用可能であるmiRNAを提供する。結腸細胞増殖性障害または病変の存在のモニタリングと確認は、例えば大腸内視鏡検査、超音波検査、MM、またはCTスキャンにより実行することができる。
本開示は、概して癌検出と疾患モニタリングに関する。より具体的には、この分野は、早期大腸癌に対する癌関連マイクロRNA(miRNA)検出と疾患モニタリングに関する。特異的には、大腸癌(CRC)および/または大腸腺腫(CA)、例えば進行型大腸腺腫(AA)などの結腸細胞増殖性障害を患うか、それを発症するリスクがあるヒト対象を特定するために、循環miRNAシグネチャパネルとその使用が提供される。
本開示は、概して癌検出と疾患モニタリングに関する。本開示は、例えば対象が大腸病変を患うときに結腸細胞増殖性障害の存在を示すか、結腸細胞増殖性障害を発症する高いリスクを示す、対象のmiRNAを特定する。早期検出により、増殖し拡散する前に癌を排除することができるため、癌のスクリーニングとモニタリングにより生存アウトカムが改善する。例えば、大腸癌では、大腸内視鏡検査が早期診断の改善に役割を果たす。しかし生憎、患者が遵守する割合は低く、手術の侵襲性が原因で推奨規則が満たされない状態でスクリーニングが行われる。
本明細書には、疾患を患う対象において上方調節もしくは過剰発現されるmiRNAの発現プロファイルまたは存在量に基づき、結腸細胞増殖性障害を患うリスクのある対象をスクリーニングまたは特定するための方法が記載される。本明細書にはさらに、対象、例えばヒト対象に対する結腸細胞増殖性障害の診断に有用なデータを取得するための方法が記載される。結腸細胞増殖性障害の非限定的な例として、大腸癌、大腸腺腫、または進行型大腸腺腫が挙げられる。
本明細書で使用するとき、「結腸細胞増殖性障害を発症する高リスク(high risk of developing a colon cell proliferative disorder)」という用語は、結腸細胞増殖性障害を患っていない、または近い将来結腸細胞増殖性障害を発症するリスクが低い対象に比べて、近い将来結腸細胞増殖性障害を発症するリスクが高い対象を表す。本明細書で使用するとき、「近い将来(near future)」という用語は、約1か月~約2年、約6か月~約18か月、または約1年の期間を表す。
結腸細胞増殖性障害は、あらゆる腫瘍段階(例えば、TX、T0、Tis、T1、T2、T3、T4)、あらゆる局所リンパ節または遠隔転移段階(例えば、NX、N0、N1、M0、M1)、あらゆる段階(例えば、ステージ0(Tis、N0、M0)、ステージIA(T1、N0、M0)、ステージIIA(T3、N0、M0)、ステージIIB(T1~3、N1、M0)、ステージIII(T4、あらゆるN、M0)、またはステージIV(あらゆるT、あらゆるN、M1))、切除可能、局所進行型(切除不可能)、または転移性の障害であってよい。
現行のスクリーニングツールは、偽陽性および偽陰性の結果が生じること、および理想的な特異性および感度を満たしていないことを理由に、課題に直面する場合がある。理想的な癌スクリーニングツールは、不必要な調査を最小限に抑える(偽陽性が低い)が癌の大部分を検出する(偽陰性が低い)、高い陽性予測値(PPV)を有する場合がある。別の重要な妥協案(compromise)は、一般的にサイズに基づき腫瘍を検出する下限を表す、検査感度とは異なる「検出感度」である。検出可能なレベルで循環腫瘍マーカを放出するのに十分なサイズへの腫瘍成長が可能になると、癌進行の早期検出と予防の目的が頓挫してしまう。したがって本開示は、大腸癌の早期診断のために、血液を用いた高感度で有効なスクリーニングの必要性に対処する。
「液体生検」とも称される循環腫瘍DNA検出により、非侵襲的な形で腫瘍の検出と有益な調査が可能になる場合がある。これら液体生検における腫瘍特異的変異の特定は、結腸癌、乳癌、および前立腺癌を診断するために使用されてよい。しかし、循環中に存在する正常な(例えば、非腫瘍由来)DNAのバックグラウンドが高いことが原因で、これらの技法は感度が制限される場合がある。このため、リスク集団の再発スクリーニングと一次スクリーニングにおいて早期または低腫瘍量の大腸癌腫瘍マーカを検出するために、より高感度で特異的なスクリーニングツールが依然として必要とされる。
本開示は、結腸細胞増殖性障害、例えば大腸癌とその進行に関連する循環miRNAをプロファイリングすることを目的とする方法とシステムを提供する。結腸細胞増殖性障害の存在、または結腸細胞増殖性障害を発症する高リスクを示すそれらのmiRNAは、例えば対象に大腸病変しかないときに、結腸細胞増殖性障害を可能な限り早期に診断、処置、またはその進行を予防するために使用されてよい。本明細書にはさらに、具体的に対象に大腸病変があるときに、結腸細胞増殖性障害を診断、または対象における結腸細胞増殖性障害を発症するリスクを精査するためのキットと方法が提供される。
miRNAは、概して植物や動物に見出される約18~22個のヌクレオチドからなる小さなノンコーディングRNAを表す。miRNAは、3’非翻訳領域(3’-UTR)中の特定部位に結合することによりmRNA標的を転写後調節し、それによりこれらmRNA標的の分解を促進するか、その翻訳を阻害する場合がある。miRNAは、増殖、分化、およびアポトーシスなどの複数の生理学的細胞機能に寄与する場合がある。miRNAは癌遺伝子と腫瘍抑制遺伝子の発現を調節するため、miRNAの調節不全は癌に重要な役割を果たす場合がある。無細胞miRNA(cfmiRNA)、循環腫瘍細胞(CTC)、循環腫瘍DNA(ctDNA)、腫瘍教育血小板(TEP)、および細胞外小胞(EV)は、疾患状態の検出を補助するとともに、疾患状態についての関連する予後情報と予測情報を提供する場合がある。
miRNAは、真核生物の核DNAによりコードされると、mRNA分子内の相補的配列との塩基対合を介して機能し、通常は翻訳抑制または標的分解を介して遺伝子サイレンシングをもたらす場合がある。miRNAは、pri-miRNAと呼ばれる大型RNA前駆物質としてRNAポリメラーゼにより転写される。pri-miRNAは、核内でさらに処理されて、pre-miRNAを産出する場合がある。pri-miRNAは、長さ約70のヌクレオチドであってよく、不完全なステムループ、または「ヘアピン」構造へと折り重ねられる。次いで、pri-miRNAは細胞質へと輸出され、さらなる処理を受けることで成熟miRNAを生成する場合がある。試料のmiRNAプロファイルは、試料中の様々なmiRNAの発現レベルを示す場合がある。
差動的に発現されたmiRNAは、参照試料における発現レベルと比して、過剰発現、上方調節、過小発現、または下方調節されるmiRNAであってよい(例えば、組織試料の検査細胞が、対象細胞、または細胞もしくは無細胞流体試料、あるいは参照発現レベル(参照値)と比較される)。参照発現レベルは、例えば、関連集団(例えば、疫学的に関連のある集団)における「正常」状態(例えば、疾患がない)または対応する目的の疾患状態を反映し得る。
いくつかの実施形態では、miRNAは、対象試料または参照発現レベルにおける対応miRNAより少なくとも約1.8倍多く、またはそれよりも少なく試料中で発現される場合、「差動的に発現される」または「差動的に豊富」と特定され、あるいは、試料と対象試料または参照発現レベルとの間の発現レベル差の統計的有意差(p値)は0.05未満である。
いくつかの実施形態では、miRNAは、対照試料または参照発現試料における対応miRNAより約2倍、約3倍、約4倍、約5倍、もしくは5倍より多く、またはそれよりも少なく試料中で発現される場合、「差動的に発現される」または「差動的に豊富」と特定される。いくつかの実施形態では、発現レベルは、限定されないがlog2、CPM(counts per million)、合成スパイクインへの正規化、またはハウスキーピング遺伝子への正規化など、参照標準に基づき正規化される。
差動的に発現されたmiRNAは、試料中には存在するが参照試料中ではめったに観察されない、または試料中に存在しないが参照試料中によく見られるmiRNAであってよい(例えば、組織試料の検査細胞が、対象細胞、または細胞もしくは無細胞流体試料、あるいは参照発現レベル(参照値)と比較される)。
本明細書中の一態様では、疾患状態に基づき試料を対象と判別するのに有用なmiRNAパネルを使用する方法が提供される。本明細書中の他の態様では、miRNAパネルを使用して結腸細胞増殖性障害を検出、分化、および判別するための方法、アッセイ、ならびにキットが提供される。結腸細胞増殖性障害の非限定的な例として、腺癌、腺腫、ポリープ、扁平上皮癌、カルチノイド腫瘍、肉腫、およびリンパ腫が挙げられる。
いくつかの実施形態では、上記方法は、結腸細胞増殖性障害の分化、検出、および判別のためのマーカとして選択される1または複数のmiRNAの使用を含む。
I.定義
本明細書と特許請求の範囲で使用するとき、単数形「a」、「an」、および「the」は、前後関係から明らかでない限り、複数形を含む。例えば、「核酸」という用語は複数の核酸を含み、核酸の混合物も含まれる。
本明細書と特許請求の範囲で使用するとき、単数形「a」、「an」、および「the」は、前後関係から明らかでない限り、複数形を含む。例えば、「核酸」という用語は複数の核酸を含み、核酸の混合物も含まれる。
本明細書で使用するとき、「対象」という用語は、概して検査可能または検出可能な遺伝情報を有する実体または媒体を表す。対象は、個人、個体、または患者とすることができる。対照は、例えば哺乳動物などの脊椎動物とすることができる。哺乳動物の非限定的な例として、ヒト、サル、家畜、競技用動物、げっ歯類、およびペットが挙げられる。対象は、癌を患うか、または癌を患う疑いのある個人とすることができる。対象は、対象の癌または他の疾患、障害、もしくは疾病など、対象の健康上もしくは生理学的な状態または疾病を示す症状を呈している場合がある。代替的に、対象は、このような健康上もしくは生理学的な状態または疾病に対して無症候性の可能性がある。
本明細書で使用するとき、「試料」という用語は、概して1または複数の対象から取得されるか得られる生体試料を表す。生体試料は、無細胞生体試料または実質的に細胞を含まない生体試料であるか、あるいは処理または分画されることで無細胞生体試料を産出する場合がある。例えば、無細胞生体試料として、無細胞リボ核酸(cfRNA)、無細胞デオキシリボ核酸(cfDNA)、無細胞胎児DNA(cfFDNA)、血漿、血清、尿、唾液、羊水、およびそれらの誘導体が挙げられる場合がある。無細胞生体試料は、エチレンジアミンテトラ酢酸(EDTA)回収管、無細胞RNA回収管(例えば、Streck RNA Complete BCT)、または無細胞DNA回収管(例えば、Streck Cell-Free DNA BCT)を用いて取得されるか、得られる場合がある。無細胞生体試料は、分画化(例えば、差動遠心分離)により全血試料から得られる場合がある。生体試料またはその誘導体は、細胞を含有してよい。例えば、生体試料は、血液試料またはその誘導体(例えば、回収管または血液滴により採取した血液)であってよい。
本明細書で使用するとき、「核酸」という用語は、概して多量体型のあらゆる長さのヌクレオチド、すなわちデオキシリボヌクレオチド(dNTP)もしくはリボヌクレオチド(rNTP)のいずれか、またはそれらのアナログを表す。核酸は、あらゆる三次元構造を有し、既知または未知のあらゆる機能を実行する場合がある。核酸の非限定的な例として、デオキシリボ核酸(DNA)、リボ核酸(RNA)、遺伝子もしくは遺伝子フラグメントのコーディングまたはノンコーディング領域 連結解析から定められる座位(loci(locus))、エクソン、イントロン、メッセンジャRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、短鎖干渉RNA(siRNA)、ショートヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換え核酸、分岐状核酸、プラスミド、ベクター、あらゆる配列の単離DNA、あらゆる配列の単離RNA、核酸プローブ、およびプライマーが挙げられる。核酸は、メチル化ヌクレオチドやヌクレオチドアナログなどの1または複数の修飾ヌクレオチドを含んでよい。存在する場合、ヌクレオチド構造に対する修飾は、核酸の組立ての前または後に行われてよい。核酸のヌクレオチドの配列は、非ヌクレオチド成分により中断される場合がある。核酸は、レポータ物質(reporter agent)とのコンジュゲーションまたは結合などにより、重合後にさらに修飾されてよい。
本明細書で使用するとき、「標的核酸」という用語は、概して塩基配列を有する核酸分子集団中にある核酸分子を表し、その存在、量、もしくは配列、またはそれらの変更を判定することが所望される。標的核酸は、DNA、RNA、およびそのアナログを含むあらゆる種類の核酸であってよい。本明細書で使用するとき、「標的リボ核酸(RNA)」は、概してRNAである標的核酸を表す。本明細書で使用するとき、「標的デオキシリボ核酸(DNA)」は、概してDNAである標的核酸を表す。
本明細書で使用するとき、「増幅すること(amplifying)」および「増幅(amplification)」という用語は、概して核酸分子のサイズまたは量を増加させることを表す。核酸分子は、一本鎖または二本鎖であってよい。増幅は、核酸分子の1または複数のコピーまたは「増幅産物」を生成することを含む場合がある。増幅は、例えば伸長(例えば、プライマー伸長)またはライゲーションにより実行されてよい。増幅は、一本鎖核酸分子に相補的な鎖を生成するためにプライマー伸長反応を実行することを含む場合があり、場合によっては、この鎖および/または一本鎖核酸分子の1または複数コピーを生成する。「DNA増幅」という用語は、概してDNA分子または「増幅DNA産物」の1または複数のコピーを生成することを表す。「逆転写増幅」という用語は、概して逆転写酵素の作用を介してリボ核酸(RNA)鋳型からデオキシリボ核酸(DNA)の生成を表す。
「無細胞核酸」または「cfNA」という用語は、本明細書で使用するとき、概して細胞に含有されない生物学的試料中の核酸を表す。cfNAの非限定的な例として、無細胞RNA(cfRNA)と無細胞DNA(cfDNA)が挙げられる。cfNAは、血流中などにある体液中で自由に循環する場合がある。
本明細書で使用するとき、「無細胞試料」という用語は、概して無傷の細胞を実質的に欠いた生体試料を表す。無細胞試料は、それ自体が実質的に細胞を欠いた生体試料から得られるか、または細胞が除去されている試料から得られる場合がある。無細胞試料の非限定的な例として、血液、血清、血漿、尿、精液、痰、糞便、乳管滲出液(ductal exudate)、リンパ液、および回収済洗浄液(recovered lavage)から得たものが挙げられる。
本明細書で使用するとき、「循環腫瘍DNA」または「ctDNA」という用語は、概して腫瘍由来のcfDNAを表す。
本明細書で使用するとき、「結腸細胞増殖性障害」という用語は、概して結腸もしくは直腸における細胞の乱雑または異常な増殖を含む障害あるいは疾患を表す。結腸細胞増殖性障害の非限定的な例として、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫が挙げられる。
本明細書で使用するとき、「健康な(healthy)」という用語は、概して結腸直腸細胞増殖障害を患っていない対象を表す。健康は動的な状態ではあるが、本明細書で使用するとき、この用語は、特定の記述において言及がなされている疾患状態がない、対象の病理学的状態を表す。一例では、大腸癌を患う対象を分類可能なシグネチャパネルについて言及するとき、健康な個体、健康な試料、または健康な個体から得た試料は、大腸癌(CRC)、進行性腺腫(AA)、または良性腺腫(NAA)がない個体を表す。他の疾患または健康状態が対象に存在する場合があるが、本明細書で使用するとき、「健康な」という用語は、論じられている疾患を患う対象とその疾患がない対象との比較または分類を行う目的で、明記された疾患がない状態を示す。
「最小残存疾患」または「MRD」という用語は、概して癌処置後の対象の身体に存在する癌細胞が少数であることを表す。癌処置の有効性を判定するとともにさらなる処置計画の指針を出すために、MRD検査が実行されてよい。
本明細書で使用するとき、「スクリーニング」という用語は、概して大腸癌または大腸腺腫を患うリスクのある対象の集団に対し審査または検査を行うことを表し、健康な対象を、未診断の大腸癌もしくは大腸腺腫を患う対象、またはこのような適応症を患うリスクが高い対象と区別することを目的とする。
本明細書で使用するとき、「大腸癌」という用語は、概して小腸より下にある腸管(例えば、大腸(結腸)、例えば、盲腸、上行結腸、横行結腸、下行結腸、s状結腸、および直腸)の細胞の癌を特徴とする医学的状態を表す。
本明細書で使用するとき、「大腸腺腫」という用語は、概して大腸癌の良性および前癌期である、腺腫性ポリープとも呼ばれる結腸の腺腫を表す。大腸腺腫は、大腸癌に進行するリスクが高いことを示す場合がある。
本明細書で使用するとき、「進行型大腸腺腫」は、概してサイズが少なくとも10mmであるか、または組織学的に高悪性度の異形成または絨毛成分が20%を超える腺腫を表す。
本明細書で使用するとき、「最小侵襲性生体試料」または「非侵襲性試料」という用語は、概して、対象から血液を取得するのに使用される細い針を除く器具を必要とすることなく、患者の身体から採取されるあらゆる試料を表す。いくつかの実施形態では、低侵襲性生体試料として、血液、血清、または血漿の試料が挙げられる。
本明細書で使用するとき、「上方調節された(up-regulated)」または「過剰発現された(over-expressed)」という用語は、概して、所与の「閾値」または「カットオフ値」に対して発現レベルが少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、または150%より多く増加することを表す。
本明細書で使用するとき、「閾値」または「カットオフ値」という用語は、概して、対象の発現レベルが閾値、カットオフ値、または参照レベルを超える場合に、対象が所与の感度と特異性で大腸癌または大腸腺腫を患う可能性が高いことを示す参照発現レベルを表す。
本明細書で使用するとき、「キット」という用語は、あらゆる特定のデバイスに限定されず、限定されないがマイクロアレイ、バイオアレイ、バイオチップ、またはバイオチップアレイなど、本開示のシステムと方法を実施するのに適したあらゆるデバイスを含む場合がある。
本明細書で使用するとき、癌の「種類」と「サブタイプ」という用語は、概して、乳癌などの癌の1つの「種類」が、例えば、段階、形態学、組織学、遺伝子発現、受容体プロファイル、変異プロファイル、攻撃性、予後、および悪性特徴に基づき「サブタイプ」であり得るように、比較的本明細書中で使用される。同様に、「種類」と「サブタイプ」は、より精密なレベルで、例えば、1つの組織学的な「種類」を、例えば変異プロファイルまたは遺伝子発現に従い定義される「サブタイプ」へと分化するために適用される場合がある。疾患進行に関する組織学的かつ病理学的特徴に基づき癌の種類の分類を表すために、癌の「ステージ」も使用される。
本明細書で使用するとき、「miRNA」もしくは「miR」または「マイクロRNA」という用語は、概してコーディングRNAにハイブリダイズするとともにその発現を調節する、長さ17~25の間である核酸塩基のノンコーディングRNAを表す。17~25個のヌクレオチドmiRNA分子は、天然処理経路を通じて(例えば、無傷の細胞または細胞溶解物を用いて)、または合成処理経路により(例えば、単離されたDicer、Argonauto、またはRNAaseIIIなどの単離された処理酵素を用いて)miR前駆物質から取得することができる。17~25個のヌクレオチドRNA分子は、miR前駆物質から処理されることなく、生物学的合成または化学的合成により直接産出することもできる。
本明細書で使用するとき、「miRNA分子」という用語は、概してmiRNAを表現するあらゆる核酸分子を表す。非限定的な例として、天然miRNA分子、pre-miRNA、pri-miRNA、およびmiRNA分子が挙げられ、これらは、核酸配列において天然形態と同一であるほか、これら天然形態の核酸配列と同一であり、天然形態の核酸配列では、1または複数の核酸が、1または複数のDNAヌクレオチドおよび/または核酸アナログにより置き換えられるか、あるいは表現されている。場合により、miRNA分子は、miRNAをコードする核酸分子、または単に核酸分子と称される。
本明細書で使用するとき、「miRNAプロファイル」という用語は、概して複数のmiRNAの発現レベルまたは存在量の集まりを表す。miRNAプロファイルは、個々のmiRNAの発現レベルまたは存在量の量的尺度である。ここで、各miRNAは数値で表される。個々のmiRNAの値が高いほど、このmiRNAの発現レベルが高くなる。miRNAプロファイルは、生体試料のRNAから取得される。miRNAプロファイルを判定するのに使用されてよい技法の非限定的な例として、マイクロアレイ、RT-PCR、および次世代シーケンシングが挙げられる。RNA、全RNA、またはそのあらゆる画分は、解析の出発材料として使用することができる。miRNAプロファイルにより判定される複数のmiRNAは、1つの既知のmiRNAの選択から、すべての既知のmiRNAの選択にまで及ぶ可能性がある。
本明細書で使用するとき、「miRNAからなる所定のセット(pre-determined set of miRNAs)」または「miRNAシグネチャ」という用語は、概して条件1と別の条件2とを判別可能な、miRNAからなる固定のセットを表す。例えば、条件1は大腸癌であり、条件2は正常対照である。この場合、対応するmiRNAからなる所定のセットは、大腸癌患者または正常対照患者から得た試料を区別可能である。代替的に、条件1が大腸癌であり、条件2が進行性腺腫である場合、対応するmiRNAからなる所定のセットは、大腸癌患者と進行性腺腫患者とを区別可能である。サンプル分析を、例えばmiRNAプロファイルの判定に使用されてよいマトリクス上で実行するには、これらのmiRNAからなる固定のセットは、プローブ、またはmiRNAからなる所定のセットにより定義される他の方法により表される。標的方法を用いたシーケンシング、例えば、トランスクリプトームワイドmiRNAシーケンシングおよびdd/q-PCR法のための方法を、選択することができる。例えば、健康な対照から得た大腸癌診断用のmiRNAからなる所定のセットが25個のmiRNAからなるとき、これら25個のmiRNAを検出可能なプローブまたは方法は、診断解析の実行において実施される必要がある。
本明細書で使用するとき、「共通miRNAシグネチャプロファイル」という用語は、概して条件1と別の条件2とを区別可能である、miRNAまたはノンコーディングRNAからなる固定のセットを表す。共通miRNAまたはノンコーディングRNAのシグネチャプロファイルは、例えばデータベースに記憶された複数のmiRNAプロファイルからその場で算出される。ある状態と別の状態2とを区別可能な共通のmiRNAシグネチャプロファイルは、健康状態1または別の状態2のいずれかに関連するデータベースに新たなプロファイルが追加されるとすぐに変化する。この点で、共通miRNAシグネチャプロファイルは、miRNAからなる所定のセットとは異なる。さらに、共通miRNAシグネチャプロファイル、例えば、データベースに記憶されたmiRNAプロファイルを生成するための基礎は、例えば、可能な限り多くのmiRNAを検出するために、可能な限り多くの異なる捕捉プローブを表しているマトリクス上で、捕捉プローブから生成される。
本明細書で使用するとき、「ノンコーディングRNA」または「ncRNA」という用語は、概してタンパク質へと翻訳されない機能性RNA分子を表す。場合によりncRNAは、非タンパク質コーディングRNA(npcRNA)、非メッセンジャRNA(nmRNA)、小型非メッセンジャNA(snmRNA)、または機能性RNA(fRNA)を表す。スモールRNA(sRNA)という用語は、多くの場合、細菌ncRNAに使用される。ノンコーディングRNAが最終生成物として転写されるDNA配列は、多くの場合RNA遺伝子またはノンコーディングRNA遺伝子と呼ばれる。ノンコーディングRNA遺伝子として、転写RNA(tRNA)やリボソームRNA(rRNA)などの高度に豊富で機能的に重要なRNAのほか、snoRNA、マイクロRNA、siRNA、およびpiRNAなどのRNA、XistやHOTAIRなどの長鎖ncRNAが挙げられる。ヒトゲノム内にコードされるncRNAの数は、不明である。しかし、近年のトランスクリプトミック研究とバイオインフォマティック研究で、数千ものncRNAの存在が認められている。新たに特定されたncRNAの大半は機能が検証されていないため、多くのncRNAは非機能性の場合がある。
II.試料のアッセイ
無細胞生体試料は、ヒト対象から取得されるか、または得られる場合がある。無細胞生体試料は、処理前に、様々な温度(例えば、室温、冷蔵または冷凍条件下、例えば25℃、4℃、-18℃、-20℃、または-80℃)や様々な懸濁器具(suspensions)(例えば、EDTA回収管、無細胞RNA回収管、または無細胞DNA回収管)などの様々な保管条件で保管される場合がある。
無細胞生体試料は、ヒト対象から取得されるか、または得られる場合がある。無細胞生体試料は、処理前に、様々な温度(例えば、室温、冷蔵または冷凍条件下、例えば25℃、4℃、-18℃、-20℃、または-80℃)や様々な懸濁器具(suspensions)(例えば、EDTA回収管、無細胞RNA回収管、または無細胞DNA回収管)などの様々な保管条件で保管される場合がある。
無細胞生体試料は、癌を患う対象、癌を患っている疑いのある対象、または癌を患っていないかその疑いがない対象から取得されてよい。
無細胞生体試料は、癌を患う対象を処置する前および/または後に取得されてよい。無細胞生体試料は、処置または処置計画の間に対象から取得されてよい。処置の効果を経時的にモニタリングするために、複数の無細胞生体試料が対象から取得されてよい。無細胞生体試料は、臨床検査を介して確定的な陽性または陰性の診断が入手不能な癌を患っていることが明瞭であるかその疑いのある対象から入手される場合がある。試料は、癌を患う疑いのある対象から入手される場合がある。無細胞生体試料は、疲労、悪心、体重減少、痛みと疼痛、衰弱、または出血などの原因不明の症状を発症する対象から入手される場合がある。無細胞生体試料は、原因が明らかな症状を患う対象から入手される場合がある。無細胞生体試料は、家族歴、年齢、高血圧もしくは高血圧前段階、糖尿病もしくは糖尿病前段階、体重過多もしくは肥満、環境曝露、生活様式のリスク因子(例えば、喫煙、飲酒、または薬物使用)、または他のリスク因子の存在などの因子が原因で、癌を発症するリスクのある対象から入手される場合がある。
無細胞生体試料は、アッセイを行いトランスクリプトームデータを生成するのに適した無細胞リボ核酸(cfRNA)分子、アッセイを行いゲノムデータを生成するのに適した無細胞デオキシリボ核酸(cfDNA)分子、またはそれらの混合物もしくは組合せなど、アッセイの対象とすることができる1または複数の分析物を含有する場合がある。このような1または複数の分析物(例えば、cfRNA分子および/またはcfDNA分子)は、1または複数の適切なアッセイを用いた下流アッセイ(downstream assaying)を行うために、対象の1または複数の無細胞生体試料から単離されるか、または抽出されてよい。
対象から無細胞生体試料を取得した後、無細胞生体試料は、対象の癌を示すデータセットを生成するために処理される場合がある。例えば、癌関連ゲノム座位のパネルにおける無細胞生体試料の核酸分子の存在、不在、または定量的評価(例えば、癌関連ゲノム座位におけるRNA転写物またはDNAの定量的測定)である。対象から取得した無細胞生体試料の処理は、(i)無細胞生体試料を、複数の核酸分子を単離、富化、または抽出するのに十分な条件に晒すこと、および(ii)複数の核酸分子を解析してデータセットを生成することを含む場合がある。
いくつかの実施形態では、複数の核酸分子は、無細胞生体試料から抽出され、シーケンシングにかけられることで、複数のシーケンシングリードが生成される。核酸分子は、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含んでよい。核酸分子(例えば、RNAまたはDNA)は、MagMAX mirVana Total RNA Isolation Kit、QIAamp ccfDNA/RNA Kit、Zymo Quick-cfRNA Serum & Plasma Kit、MP BiomedicalsのFastDNA Kitプロトコル、QiagenのQIAamp DNA無細胞生体ミニキット、またはNorgen Biotekの無細胞生体DNA単離キットなど、様々な方法により無細胞生体試料から抽出される場合がある。抽出方法は、試料からすべてのRNAまたはDNA分子を抽出する場合がある。代替的に、抽出方法は、試料からRNAまたはDNA分子の一部を選択的に抽出する場合がある。試料から抽出したRNA分子は、逆転写(RT)によりDNA分子に変換される場合がある。
シーケンシングは、大規模並列シーケンシング(MPS)、ペアエンドシーケンシング、抗スループットシーケンシング、次世代シーケンシング(NGS)、ショットガンシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、パイロシーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、およびRNA-Seq(Illumina)などのあらゆる適切なシーケンシング法により実行されてよい。
シーケンシングは、例えばRNA分子またはDNA分子の核酸増幅を含む場合がある。いくつかの実施形態では、核酸増幅は、ポリメラーゼ連鎖反応(PCR)である。適切な回数のPCR(例えば、PCR、qPCR、逆転写酵素PCR、デジタルPCRなど)が、核酸(例えば、RNAまたはDNA)の初期量を、その後の配列決定のために所望の入力量にまで十分に増幅するために実施される場合がある。場合により、PCRは、標的核酸の大規模増幅に使用されてよい。この大規模増幅は、最初に異なる分子へとライゲートされ得るアダプタ配列を使用すること、続いて普遍的プライマーを使用するPCR増幅を含む場合がある。PCRは、例えば、Life Technologies、Affymetrix、Promega、Qiagenなどが提供する多数の市販キットのうちいずれかを用いて実施される場合がある。他の場合、核酸集団内の特定の標的核酸のみが増幅されてよい。特定のプライマーは、場合によりアダプタライゲーションと組み合わせて、下流シーケンシングのための特定の標的を選択的に増幅するために使用される場合がある。PCRは、癌に関連するゲノム座位などの1または複数のゲノム座位の標的化増幅を含む場合がある。シーケンシングは、Qiagen、NEB、Thermo Fisher Scientific、またはBio-RadによるOneStep RT-PCRキットプロトコルなどの同時逆転写(RT)およびポリメラーゼ連鎖反応(PCR)の使用を含む場合がある。
無細胞生体試料から単離または抽出したRNAまたはDNA分子は、複数の試料のマルチプレキシング(multiplexing)を可能にするために、例えば識別可能なタグでタグ付けされてよい。あらゆる数のRNAまたはDNA試料がマルチプレキシングされてよい。例えば、マルチプレキシングされた反応は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、または100より多くの初期無細胞生体試料から得たRNAまたはDNAを含有する場合がある。例えば、複数の無細胞生体試料は、各DNA分子が、その由来となる試料(および対象)に戻って追跡され得るように、試料バーコードによりタグ付けされてよい。このようなタグは、ライゲーションにより、またはプライマーを用いたPCR増幅によりRNAまたはDNA分子に結合されてよい。
核酸分子をシーケンシングにかけた後、癌の存在、不在、または相対的精査を示すデータを生成するために、適切なバイオインフォマティクスプロセスがシーケンスリードに対し実行されてよい。例えば、シーケンスリードは、1または複数の参照ゲノム(例えば、ヒトゲノムなどの1または複数の種のゲノム)へとアライメントされる場合がある。アライメントされたシーケンスリードは、癌を示すデータセットを生成するために1または複数のゲノム座位において定量化されてよい。例えば、癌に関連付けられた複数のゲノム座位に相当する配列に対し定量化を行うことで、癌を示すデータセットを生成してよい。
アッセイの読み出しは、癌を示すデータを生成するために1または複数のゲノム座位(例えば、癌関連ゲノム座位)にて定量化されてよい。例えば、複数のゲノム座位(例えば、癌関連ゲノム座位)に相当するアレイハイブリダイゼーションまたはポリメラーゼ連鎖反応(PCR)に対し定量化を行うことで、癌を示すデータを生成してよい。アッセイの読み出しは、量的PCR(qPCR)値、デジタルPCR(dPCR)値、デジタルドロップレットPCR(ddPCR)値、蛍光値など、またはそれらの正規化された値を含む場合がある。このアッセイは、家庭設定で実行されるように構成された家庭用検査であってよい。
いくつかの実施形態では、対象の無細胞生体試料を同時に処理するために、複数のアッセイが使用されてよい。例えば、対象から取得されるか得られる第1の無細胞生体試料を処理して、癌を示す第1のデータセットを生成するために第1のアッセイが使用され、かつ、対象から取得されるか得られる第2の無細胞生体試料を処理して、癌を示す第2のデータセットを生成するために第2のアッセイが使用される場合がある。次いで、第1のデータセットおよび第2のデータセットのいずれかまたは両方を解析し、対象の癌を評価してよい。例えば、第1のデータセットと第2のデータセットの組み合わせに基づき、1つの診断指標または診断スコアを生成することができる。別の例として、第1のデータセットと第2のデータセットに基づき、別個の診断指標または診断スコアを生成することができる。
III.シグネチャパネル
本開示は、結腸細胞増殖性障害の発症に関連付けられる試料中で特定されるmiRNA分子の組合せから測定可能な特徴を得るために生体試料を解析するための方法とシステムを提供する。特定されたmiRNA分子を回収することで、シグネチャが結腸細胞増殖性障害またはその段階の特徴を示すシグネチャパネルを形成してよい。シグネチャパネルパネルから得た特徴は、対象の集団を、結腸細胞増殖性障害を患っているか、または結腸細胞増殖性障害を患っていないと層別化するように構成された分類器を作製するために、訓練されたアルゴリズム(例えば、機械学習モデル)を用いて処理されてよい。この方法は、シグネチャパネルに記載されるmiRNAを有する1または複数の核酸を用いることを特徴とする場合がある。
本開示は、結腸細胞増殖性障害の発症に関連付けられる試料中で特定されるmiRNA分子の組合せから測定可能な特徴を得るために生体試料を解析するための方法とシステムを提供する。特定されたmiRNA分子を回収することで、シグネチャが結腸細胞増殖性障害またはその段階の特徴を示すシグネチャパネルを形成してよい。シグネチャパネルパネルから得た特徴は、対象の集団を、結腸細胞増殖性障害を患っているか、または結腸細胞増殖性障害を患っていないと層別化するように構成された分類器を作製するために、訓練されたアルゴリズム(例えば、機械学習モデル)を用いて処理されてよい。この方法は、シグネチャパネルに記載されるmiRNAを有する1または複数の核酸を用いることを特徴とする場合がある。
本明細書に記載のmiRNAシグネチャパネルは、結腸細胞増殖性障害に関連付けられた特定のmiRNAに対する迅速かつ特異的な分析を可能にし得る。本明細書に記載されるとともに本明細書中の方法に使用されるシグネチャパネルは、結腸細胞増殖性障害の診断、予後、処置選択、およびモニタリング(例えば、処置のモニタリング)の改善のために使用されてよい。
シグネチャパネルと方法は、全血、血漿、または血清などの体液試料から早期結腸細胞増殖性障害を検出するために使用されるマーカまたはシグネチャパネルが必要であるという点で、現行の手法よりも顕著な改善を提供する。結腸細胞増殖性障害を検出かつ診断するのに使用される現行の方法として、大腸内視鏡検査、s状結腸鏡検査、および便潜血結腸癌検査(fecal occult blood colon cancer)が挙げられる場合がある。これらの方法と比較して、本明細書に提供される方法は、大腸内視鏡検査よりも侵襲性がはるかに低く、同様に、s状結腸鏡検査、糞便免疫化学検査(FIT)、および糞便潜血検査(FOBT)より感度が高いと言わないまでも侵襲性が低い場合がある。これらマーカの現在の使用と比較して、本明細書で提供される方法は、遺伝子パネルと感度の高いアッセイ技法を組み合わせて使用すること利点により、感度と特異性の観点から有意な利点を提供し得る。
有益なmiRNAを含むシグネチャパネルは、意図したアッセイの目的に応じて選択され得る。標的とされた方法では、意図した標的miRNAのセットに基づきプライマー対が設計されてよい。いくつかの実施形態では、miRNAのセットは、表1に列挙される群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、または3つより多くのmiRNAを含む。いくつかの実施形態では、miRNAのセットは、表1に列挙される領域すべてを含む。いくつかの実施形態では、大腸癌に関連するmiRNAのセットは、表1に列挙される群から選択される。
いくつかの実施形態では、大腸癌に関連するmiRNAのセットは、表2に列挙される群から選択される。
いくつかの実施形態では、大腸癌に関連するmiRNAのセットは、表3に列挙される群から選択される。
いくつかの実施形態では、大腸癌に関連するmiRNAのセットは、表4に列挙される群から選択される。
いくつかの実施形態では、大腸癌に関連するmiRNAのセットは、表5に列挙される群から選択される。
差動的に発現されたmiRNAのプロファイルは、対照レベルまたは参照レベルと比較して流体または組織試料中に差動的に発現される一組のmiRNAを表す。特異的に発現されたmiRNAのプロファイルは、下方調節または過小発現されたmiRNAのプロファイル、および上方調節/過剰発現されたmiRNAのプロファイルを含む。
いくつかの実施形態では、miRNAは、結腸細胞増殖性障害を発症するリスクが低い対象の対応試料と比較して、結腸細胞増殖性障害を発症するリスクが高い対象の試料中で差動的に発現される。いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが高い対象と、結腸細胞増殖性障害を発症するリスクが低い対象はそれぞれ、大腸病変を患っている。結腸細胞増殖性障害を発症するリスクが高いまたはそれを患う対象の試料中に差動的に発現されるmiRNAは、結腸細胞増殖性障害の診断または予防のためのバイオマーカとして使用することができる。例えば、結腸細胞増殖性障害を発症するリスクが低い対象の対応細胞と比較して、結腸細胞増殖性障害を発症するリスクが高い対象の試料中に差動的に発現されるmiRNAは、hsa-mir-889、hsa-mir-543、hsa-mir-376b、hsa-mir-335、hsa-mir-1185-1、hsa-mir-548k、hsa-mir-12135、hsa-mir-369、hsa-mir-190a、hsa-mir-6770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142、およびhsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340、およびhsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g、およびhsa-mir-656のうち、1または複数を含む。
いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが低い対象の対応試料と比較して、結腸細胞増殖性障害を発症するリスクが高い対象の試料中に高度に発現されるmiRNAは、hsa-mir-889、hsa-mir-543、hsa-mir-376b、hsa-mir-335、hsa-mir-1185-1、hsa-mir-548k、hsa-mir-12135、hsa-mir-369、hsa-mir-190a、hsa-mir-6770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142、およびhsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340、およびhsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g、およびhsa-mir-656のうち、1または複数を含む。
いくつかの実施形態では、結腸細胞増殖性障害は進行性腺腫である。
いくつかの実施形態では、結腸細胞増殖性障害を発症するリスクが低い対象の対応試料と比較して、結腸細胞増殖性障害を発症するリスクが高い対象の試料中に低度に発現されるmiRNAは、hsa-mir-889、hsa-mir-543、hsa-mir-376b、hsa-mir-335、hsa-mir-1185-1、hsa-mir-548k、hsa-mir-12135、hsa-mir-369、hsa-mir-190a、hsa-mir-6770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142、およびhsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340、およびhsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g、およびhsa-mir-656のうち、1または複数を含む。
一例では、miRNAのパネルは、進行性腺腫がない健康な対象から得た試料中の発現と比して、進行性腺腫を患う対象から得た試料中の発現が増加している。一例では、パネルは、表6に列挙される群から選択される2つ以上のmiRNAを含む。他の例では、パネルは、列挙されたmiRNAのうち3つ以上、4つ以上、5つ以上、または6つ以上を含む。
進行性腺腫がない健康な対象から得た試料中の発現と比して、進行性腺腫を患う対象から得た試料中の発現が増加しているmiRNAのパネルにおける別の例では、パネルは、表7に列挙される群から選択される2つ以上のmiRNAを含む。他の例では、パネルは、列挙されたmiRNAのうち3つ以上、4つ以上、5つ以上、または6つ以上を含む。
いくつかの実施形態では、パネルは、a)hsa-miR-1273a、hsa-miR-17-5p、hsa-miR-20a-3p、hsa-miR-20b-5p、b)hsa-miR-3065-5p、hsa-miR-4785、hsa-miR-5096、hsa-miR-5189-5p、またはc)hsa-miR-545-3p、hsa-miR-570-3p、hsa-miR-624-3p、hsa-mir-1181、hsa-mir-6073を含む5つ以上のmiRNAから選択される。
一例では、miRNAのパネルは、進行性腺腫がない健康な対象から得た試料中の発現と比して、進行性腺腫を患う対象から得た試料中の発現が減少している。一例では、パネルは、表8に列挙される群から選択される2つ以上のmiRNAを含む。他の例では、パネルは、列挙されたmiRNAのうち3つ以上、4つ以上、5つ以上、または6つ以上を含む。
一例では、miRNAのパネルは、大腸癌がない健康な対象から得た試料中の発現と比して、大腸癌を患う対象から得た試料中の発現が増加している。一例では、パネルは、表9に列挙される群から選択される2つ以上のmiRNAを含む。他の例では、パネルは、列挙されたmiRNAのうち3つ以上、4つ以上、5つ以上、または6つ以上を含む。
大腸癌がない健康な対象から得た試料中の発現と比して、大腸癌を患う対象から得た試料中の発現が増加しているmiRNAのパネルにおける別の例では、パネルは、表10に列挙される群から選択される2つ以上のmiRNAを含む。他の例では、パネルは、列挙されたmiRNAのうち3つ以上、4つ以上、5つ以上、または6つ以上を含む。
別の例では、パネルは、a)hsa-miR-1250-5p、hsa-miR-1255a、hsa-miR-223-3p、hsa-miR-338-3p、hsa-miR-338-5p、b)hsa-miR-424-5p、hsa-miR-424-3p、hsa-miR-450a-5p、hsa-miR-450b-5p、hsa-miR-4772-3p、c)hsa-miR-4772-5p、hsa-miR-625-5p、hsa-miR-7847-3p、hsa-miR-1181、hsa-miR-3651、hsa-mir-6073、d)hsa-mir-6125、hsa-mir-7704、hsa-miR-19b-3p、hsa-miR-19a-3p、hsa-miR-3157-5p、e)hsa-miR-142-3p、hsa-miR-30c-5p、hsa-miR-6741-5p、hsa-miR-590-3p、hsa-miR-4685-5p、f)hsa-miR-3648、hsa-miR-331-3p、hsa-miR-1303、hsa-miR-6790-3p、hsa-miR-6867-5p、hsa-miR-942-5p、g)hsa-miR-378a-3p、hsa-miR-1287-5p、hsa-mir-4785、hsa-miR-324-3p、hsa-miR-550b-2-5p、h)hsa-miR-200c-3p、hsa-miR-200b-3p、hsa-miR-3679-5p、hsa-miR-550a-3-5p、hsa-miR-3187-3p、i)hsa-miR-181b-5p、hsa-miR-3138、hsa-miR-146a-5p、hsa-miR-6721-5p、hsa-miR-23b-3p、hsa-miR-28-5p、j)hsa-miR-320d、hsa-miR-940、hsa-miR-320d-1、hsa-miR-10a-5p、hsa-miR-340-5p、k)hsa-miR-320b、hsa-miR-335-5p、hsa-miR-320c、hsa-miR-501-3p、hsa-miR-548n、またはl)hsa-miR-27a-3p、hsa-miR-3065-3p、hsa-miR-548aa@、hsa-miR-584-3p、hsa-miR-22-3pを含む5つ以上のmiRNAから選択される。
一例では、miRNAのパネルは、大腸癌がない健康な対象から得た試料中の発現と比して、大腸癌を患う対象から得た試料中の発現が減少している。一例では、パネルは、表11に列挙される群から選択される2つ以上のmiRNAを含む。
いくつかの実施形態では、結腸細胞増殖性障害は進行性腺腫である。
いくつかの実施形態では、結腸細胞増殖性障害は大腸癌である。
いくつかの実施形態では、miR-889単独から出発するバイオマーカの特定の具体的な組合せは、miR-889、miR-543、miR-376b、miR-335、およびmiR-1185-1単独の使用と比較して、進行型大腸腺腫の存在を検出しかつ大腸癌の存在を検出することにおいてk-分割交差検証、AUC、感度、および特性における頻度の観点から良好な結果をもたらす。
いくつかの実施形態では、このような例は、少なくとも(miR-889)もしくは少なくとも(miR-889およびmiR-543)もしくは少なくとも(miR-889およびmiR-376b)、または少なくとも(miR-889およびmiR-335)、または少なくとも(miR-889およびmiR-1185-1)、または少なくとも(miR-889、miR-543、およびmiR-376b)、または少なくとも(miR-889、miR-543、およびmiR-335)、または少なくとも(miR-889、miR-376b、およびmiR-335)、または少なくとも(miR-889、miR-543、およびmiR-1185-1)、または少なくとも(miR-889、miR-543、およびmiR-548k)、または少なくとも(miR-889、miR-543、およびmiR-12135)、または少なくとも(miR-889、miR-543、miR-376b、miR-335、およびmiR-1185-1)を含み、大腸癌および進行性腺腫を患う対象の血漿試料において有意に上方調節される。この意味では、表1に示すように、少なくとも(miR-889)もしくは少なくとも(miR-889およびmiR-543)もしくは少なくとも(miR-889およびmiR-376b)、または少なくとも(miR-889およびmiR-335)、または少なくとも(miR-889およびmiR-1185-1)、または少なくとも(miR-889、miR-543、およびmiR-376b)、または少なくとも(miR-889、miR-543、およびmiR-335)、または少なくとも(miR-889、miR-376b、およびmiR-335)、または少なくとも(miR-889、miR-543、およびmiR-1185-1)、または少なくとも(miR-889、miR-543、およびmiR-548k)、または少なくとも(miR-889、miR-543、およびmiR-12135)、または少なくとも(miR-889、miR-543、miR-376b、miR-335、およびmiR-1185-1)の組合せである。
いくつかの実施形態では、本開示の方法は、(例えば、結腸増殖性障害を患うことに基づき)処置を必要とする対象に処置を施す工程を含む場合がある。大腸腺腫は大腸癌の前駆物質として見ることができるため、確認された腺腫-癌腫の配列、および進行型大腸腺腫が癌に移行する可能性が高いという概念により、大腸腺腫(例えば、進行型大腸腺腫)は、例えば大腸内視鏡検査を通じて除去されることにより処置される場合がある(その後、監視が行われる場合がある)。大腸癌の治療は、癌を発見した段階に左右される。早期大腸癌は、手術で処置される場合がある。ステージI大腸癌の約95%、ステージII大腸癌の65~80%が、手術により治癒することができる。しかし、直腸癌は、再発リスクを最小限に抑えるためにさらなる放射線療法を必要とする場合がある。進行期(ステージIIIとステージIV)での処置は、多くの場合、手術、化学療法、抗体による処置、抗VEGF/R、および放射線療法を含む治療法の組合せを含む。大腸癌を患う対象に対する処置は、例えば、その全体を参照することで本明細書に引用される、Wolpinらによる「Systemic Treatment of Colorectal Cancer」,Gastroenterology,Volume 134,Issue 5,2008,Pages 1296-1310.e1,ISSN 0016-5085により記載され得る。
処置は、対象のmiRNAプロファイルおよび/または対象の一組の生体形質に少なくとも部分的に基づき(例えば、複数の可能な処置選択肢の中から)選択され、施される場合がある。生体形質は、測定、診断、予後、または予測(例えば、訓練済み機械学習分類器を使用して判定される)であってよい。
いくつかの実施形態では、生体形質は悪性腫瘍を含む。いくつかの実施形態では、生体形質は癌の種類を含む。いくつかの実施形態では、生体形質は癌のステージを含む。いくつかの実施形態では、生体形質は癌の分類を含む。いくつかの実施形態では、癌の分類は癌のグレードを含む。いくつかの実施形態では、癌の分類は組織学的分類を含む。いくつかの実施形態では、生体形質は代謝プロファイルを含む。いくつかの実施形態では、生体形質は突然変異を含む。いくつかの実施形態では、突然変異は疾患関連型突然変異である。いくつかの実施形態では、生体形質は臨床アウトカムを含む。いくつかの実施形態では、生体形質は薬物応答を含む。
V.分類器、機械学習モデル、およびシステム
いくつかの例では、miRNAシーケンシング機能は、配列組成と対象群(例えば、患者群)との相関性を見出すように訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)へ入力されるデータセットとして使用される。このような患者群の例は、疾患または疾病の有無、疾患または疾病の高リスクまたは低(non-elevated)リスク、疾患または疾病のステージ、疾患または疾病のサブタイプ、処置に対する応答と処置に対する不応答、および進行と非進行を含む。いくつかの例では、既知の条件または特徴を具備する対象から得た試料を比較するために、特徴マトリクスが生成される。いくつかの実施形態では、試料は、健康な対象、または明らかな適応症をいずれも患っていない対象、および癌を患っていることが明らかな患者から得られる。
いくつかの例では、miRNAシーケンシング機能は、配列組成と対象群(例えば、患者群)との相関性を見出すように訓練されたアルゴリズム(例えば、機械学習モデルまたは分類器)へ入力されるデータセットとして使用される。このような患者群の例は、疾患または疾病の有無、疾患または疾病の高リスクまたは低(non-elevated)リスク、疾患または疾病のステージ、疾患または疾病のサブタイプ、処置に対する応答と処置に対する不応答、および進行と非進行を含む。いくつかの例では、既知の条件または特徴を具備する対象から得た試料を比較するために、特徴マトリクスが生成される。いくつかの実施形態では、試料は、健康な対象、または明らかな適応症をいずれも患っていない対象、および癌を患っていることが明らかな患者から得られる。
本明細書で使用するとき、機械学習およびパターン認識に関する場合、「特徴(feature)」という用語は、一般に、ある減少における個々の測定可能な特性または特徴が観察されることを表す。「特徴」の概念は、例えば、限定されないが線形回帰およびロジスティック回帰などの統計的技法に使用される説明変数の概念に関連する。特徴は、数値または定言的であってよい(例えば、文字列やグラフなどの構造的特徴が構文パターン認識に使用される)。
本明細書で使用するとき、「入力特徴」(または「特徴」)という用語は、一般に、訓練済みアルゴリズム(例えば、機械学習モデルまたは分類器)が試料の出力分類(標識)を予測するのに使用される変数、例えば、状態、配列の内容(例えば、突然変異)、示唆されたデータ収集演算、または示唆された処置を表す。変数の値は、試料に対して判定されるとともに、分類を判定するために使用されてよい。
複数のアッセイにおいて、上記システムは、訓練済みアルゴリズム(例えば、機械学習モデルまたは分類器)へと入力を行うように設定される。システムは、各生体試料に対しアッセイを行い、測定値から特徴ベクトルを形成する。システムは、特徴ベクトルを機械学習モデルに入力し、生体試料が特定の特性を有するかどうかの出力分類を取得する。
いくつかの実施形態では、機械学習モデルは、対象集団またはこの集団の特徴における対象または特徴の2つ以上の群または分類を判別可能な分類器を出力する。いくつかの実施形態では、分類器は、訓練済み機械学習分類器である。
いくつかの実施形態では、癌組織中のバイオマーカの有益な座位または特徴は、プロファイルを形成するためにアッセイされる。2つの集団(例えば、治療剤に応答する対象と応答しない対象)を判別する際に特定の特徴(例えば、本明細書に記載のバイオマーカのいずれか、および/または追加のバイオメディカル情報のいずれかの項目)のパフォーマンスをプロットすることにより、受信者操作特性(ROC)曲線が生成されてよい。いくつかの実施形態では、集団全体にわたる特徴データ(例えば、症例と対照)は、単一の特徴の値に基づき昇順に選別される。
いくつかの例では、特定の特性は、健康vs癌、疾患の高リスクvs低リスク、疾患のサブタイプ、疾患のステージ、進行vs非進行、および応答vs不応答から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
A.データ解析
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方においてデータ解析が実現されるシステム、方法、またはキットを提供する。いくつかの例では、解析アプリケーションまたはシステムは、少なくともデータ受信モジュール、データ前処理モジュール、データ解析モジュール(1または複数の種類のゲノムデータ上で動作可能なもの)、データ解釈モジュール、またはデータ可視化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、室内実験ハードウェアまたは計測手段を、室内実験データを処理するコンピュータシステムと接続するコンピュータシステムを含むことができる。いくつかの実施形態では、データ前処理モジュールは、解析の準備のためにデータに対する演算を実行するハードウェアシステムまたはコンピュータソフトウェアを含むことができる。前処理モジュール中のデータに適用され得る演算の例として、アフィン変換、ノイズ除去演算、データクリーニング、再フォーマット、またはサブサンプリングが挙げられる。1または複数のゲノム材料からゲノムデータを解析するのに特化し得るデータ解析モジュールは、例えば、組み立てられたゲノム配列を取得し、確率および統計解析を実行して、疾患、病理学、状況、リスク、状態、または表現型に関連する異常パターンを特定することができる。データ解釈モジュールは、特定された異常パターンと健康状態、機能状況、予後、またはリスクとの関連性の理解を支援するのに、例えば統計、数学、または生物学から抽出される解析法を使用することができる。データ可視化モジュールは、結果の理解または解釈を容易にすることのできるデータの視覚表現を作り出すために、数学的モデリング、コンピュータグラフィック、またはレンダリングの方法を使用することができる。
いくつかの例では、本開示は、ソフトウェアアプリケーション、コンピューティングハードウェア、またはその両方においてデータ解析が実現されるシステム、方法、またはキットを提供する。いくつかの例では、解析アプリケーションまたはシステムは、少なくともデータ受信モジュール、データ前処理モジュール、データ解析モジュール(1または複数の種類のゲノムデータ上で動作可能なもの)、データ解釈モジュール、またはデータ可視化モジュールを含む。いくつかの実施形態では、データ受信モジュールは、室内実験ハードウェアまたは計測手段を、室内実験データを処理するコンピュータシステムと接続するコンピュータシステムを含むことができる。いくつかの実施形態では、データ前処理モジュールは、解析の準備のためにデータに対する演算を実行するハードウェアシステムまたはコンピュータソフトウェアを含むことができる。前処理モジュール中のデータに適用され得る演算の例として、アフィン変換、ノイズ除去演算、データクリーニング、再フォーマット、またはサブサンプリングが挙げられる。1または複数のゲノム材料からゲノムデータを解析するのに特化し得るデータ解析モジュールは、例えば、組み立てられたゲノム配列を取得し、確率および統計解析を実行して、疾患、病理学、状況、リスク、状態、または表現型に関連する異常パターンを特定することができる。データ解釈モジュールは、特定された異常パターンと健康状態、機能状況、予後、またはリスクとの関連性の理解を支援するのに、例えば統計、数学、または生物学から抽出される解析法を使用することができる。データ可視化モジュールは、結果の理解または解釈を容易にすることのできるデータの視覚表現を作り出すために、数学的モデリング、コンピュータグラフィック、またはレンダリングの方法を使用することができる。
いくつかの例では、機械学習法は、試料集団中の試料を判別するために適用される。いくつかの実施形態では、機械学習法は、健康な試料と疾患(例えば、腺腫)進行した試料との間で試料を判別するために適用される。
いくつかの実施形態では、予測エンジンを訓練するのに使用される1または複数の機械学習演算として、一般化線形モデル、一般化加法モデル、ノンパラメトリック回帰演算、ランダムフォレスト 分類子、空間回帰演算、ベイズ回帰モデル、時系列解析、ベイズネットワーク、ガウスネットワーク、決定木学習演算、人工ニューラルネットワーク、リカレントニューラルネットワーク、強化学習演算、線形または非線形回帰演算、サポート・ベクター・マシン、クラスタリング演算、および遺伝的アルゴリズム演算のうち、1または複数が挙げられる。
いくつかの例では、コンピュータ処理方法は、ロジスティック回帰、多重線形回帰(MLR)、次元削減、部分最小二乗(PLS)回帰、主成分回帰、オートエンコーダ、変分オートエンコーダ、特異値分解、フーリエ基底、ウェーブレット、判別解析、サポート・ベクター・マシン、決定木、分類および回帰木(CART)、ツリーベースの方法、ランダムフォレスト、勾配ブーストツリー、ロジスティック回帰、行列分解、多次元スケーリング(MDS)、次元性削減法、t-分散確率的近傍埋め込み(t-SNE)、多層パーセプトロン(MLP)、ネットワーククラスタリング、ニューロ-ファジィ、および人工ニューラルネットワークから選択される。
いくつかの例では、本明細書に開示される方法は、対象または複数の対象からの試料の核酸シーケンシングデータに関する計算解析を含むことができる。
B.分類子の生成
一態様では、開示されたシステムと方法は、cfRNAの生体試料からのmiRNA配列分析から導出した特徴情報に基づき生成された分類子を提供する。分類子は、cfDNAなどの生体試料中で特定された配列特徴に基づき、集団内の群を判別するための予測エンジンの一部を形成する。
一態様では、開示されたシステムと方法は、cfRNAの生体試料からのmiRNA配列分析から導出した特徴情報に基づき生成された分類子を提供する。分類子は、cfDNAなどの生体試料中で特定された配列特徴に基づき、集団内の群を判別するための予測エンジンの一部を形成する。
いくつかの実施形態では、分類子は、配列情報の類似部分を統一されたフォーマットおよび統一されたスケールへとフォーマット化することで配列情報を正規化し、正規化配列情報を柱状データベースに記憶し、記憶された正規化配列情報に1または複数の機械学習演算を適用することで、特定の集団に対して1または複数の特徴の組み合わせをマッピングする予測エンジンを訓練し、アクセスされたフィールド情報に予測エンジンを適用して群に関連付けられた対象を特定し、対象を群に分類することにより、作成される。
特異性とは、本明細書で使用するとき、概して「疾患のない人々に対する検査が陰性の確率」を表す。これは、検査が陰性であった疾患のない人の数を、疾患のない対象の総数で割ることにより算出され得る。
いくつかの例では、モデル、分類子、または予測検査の特異性は、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%である。
感度とは、本明細書で使用するとき、概して「疾患を患う人々に対する検査が陽性の確率」を表す。これは、検査が陽性であった疾患を患う人の数を、疾患を患う対象の総数で割ることにより算出され得る。
いくつかの例では、モデル、分類子、または予測検査の感度は、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%である。
C.デジタル処理デバイス
いくつかの例では、本明細書に記載される主題は、デジタル処理デバイスまたはその使用を含むことができる。いくつかの例では、デジタル処理デバイスは、デバイスの機能を実行する1または複数のハードウェア中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、あるいはテンソル・プロセシング・ユニット(TPU)を含むことができる。いくつかの例では、デジタル処理デバイスは、実行可能命令を実行するように構成されたオペレーティングシステムを含むことができる。
いくつかの例では、本明細書に記載される主題は、デジタル処理デバイスまたはその使用を含むことができる。いくつかの例では、デジタル処理デバイスは、デバイスの機能を実行する1または複数のハードウェア中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、あるいはテンソル・プロセシング・ユニット(TPU)を含むことができる。いくつかの例では、デジタル処理デバイスは、実行可能命令を実行するように構成されたオペレーティングシステムを含むことができる。
いくつかの例では、デジタル処理デバイスは、任意選択でコンピュータネットワークに接続することができる。いくつかの例では、デジタル処理デバイスは、任意選択でインターネットに接続されてもよい。いくつかの例では、デジタル処理デバイスは、任意選択でクラウド・コンピューティング・インフラストラクチャに接続されてもよい。いくつかの例では、デジタル処理デバイスは、任意選択でイントラネットに接続されてもよい。いくつかの例では、デジタル処理デバイスは、任意選択でデータ記憶デバイスに接続されてもよい。
適切なデジタル処理デバイスの非限定的な例として、サーバコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、サブノートブックコンピュータ、ネットブックコンピュータ、ネットパッドコンピュータ、セットトップコンピュータ、ハンドヘルドコンピュータ、インターネットアプライアンス、モバイルスマートフォン、およびタブレットコンピュータが挙げられる。適切なタブレットコンピュータとして、例えば、ブックレット、スレート、および転換可能な構成を具備するものを挙げることができる。
いくつかの例では、デジタル処理デバイスは、実行可能命令を実行するように構成されたオペレーティングシステムを含むことができる。例えば、オペレーティングシステムは、デバイスのハードウェアを管理し、アプリケーションの実行のためのサービスを提供するプログラムおよびデータを含む、ソフトウェアを含むことができる。オペレーティングシステムの非限定的な例として、Ubuntu、FreeBSD、OpenBSD、NetBSD(登録商標)、Linux(登録商標)、Apple(登録商標)Mac OS X Server(登録商標)、Oracle(登録商標)Solaris(登録商標)、Windows Server(登録商標)、およびNovell(登録商標)NetWare(登録商標)が挙げられる。適切なパーソナルコンピュータのオペレーティングシステムの非限定的な例として、Microsoft(登録商標)Windows(登録商標)、Apple(登録商標)Mac OS X(登録商標)、UNIX(登録商標)、および、GNU/Linux(登録商標)などのUNIX(登録商標)様オペレーティングシステムが挙げられる。いくつかの例では、オペレーティングシステムは、クラウドコンピューティングにより提供されてもよく、クラウド・コンピューティング・リソースは1または複数のサービスプロバイダにより提供されてもよい。
いくつかの例では、デバイスは、記憶デバイスおよび/またはメモリデバイスを含むことができる。記憶デバイスおよび/またはメモリデバイスは、一時的または永続的にデータまたはプログラムを記憶するのに使用される1または複数の物理装置であってよい。いくつかの例では、デバイスは揮発性メモリであり、記憶した情報を維持するのに電力を要する場合がある。いくつかの例では、デバイスは不揮発性メモリであり、デジタル処理デバイスに電力が供給されていないときでも記憶情報を保持する場合がある。いくつかの例では、不揮発性メモリはフラッシュメモリを含むことができる。いくつかの例では、不揮発性メモリは、ダイナミック・ランダム・アクセス・メモリ(DRAM)を含むことができる。いくつかの例では、不揮発性メモリは強誘電性ランダム・アクセス・メモリ(FRAM(登録商標))を含むことができる。いくつかの例では、不揮発性メモリは、相変化ランダム・アクセス・メモリ(PRAM)を含むことができる。
いくつかの例では、デバイスは、例えば、CD-ROM、DVD、フラッシュメモリデバイス、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、およびクラウドコンピューティングベースのストレージを含む記憶デバイスであってよい。いくつかの例では、記憶デバイスおよび/またはメモリデバイスは、本明細書に開示されるものなどのデバイスの組合せであってもよい。いくつかの例では、デジタル処理デバイスは、視覚情報をユーザに送信するためのディスプレイを含むことができる。いくつかの例では、ディスプレイは陰極線管(CRT)であってよい。いくつかの例では、ディスプレイは液晶ディスプレイ(LCD)であってよい。いくつかの例では、ディスプレイは、薄膜トランジスタ液晶ディスプレイ(TFT-LCD)であってよい。いくつかの例では、ディスプレイは、有機発光ダイオード(OLED)ディスプレイであってよい。いくつかの例では、OLEDディスプレイは、パッシブマトリクスOLED(PMOLED)またはアクティブマトリクスOLED(AMOLED)ディスプレイであってよい。いくつかの例では、ディスプレイはプラズマディスプレイであってよい。いくつかの例では、ディスプレイはビデオプロジェクタであってよい。いくつかの例では、ディスプレイは、本明細書に開示されるものなどのデバイスの組合せであってもよい。
いくつかの例では、デジタル処理デバイスは、ユーザから情報を受信するための入力デバイスを含むことができる。いくつかの例では、入力デバイスはキーボードであってよい。いくつかの例では、入力デバイスは、例えば、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含むポインティングデバイスであってもよい。いくつかの例では、入力デバイスは、タッチスクリーンまたはマルチタッチスクリーンであってもよい。いくつかの例では、入力デバイスは、音声または他の音声入力を捕えるためのマイクであってもよい。いくつかの例では、入力デバイスは、動作または視覚入力を捕えるためのビデオカメラであってもよい。いくつかの例では、入力デバイスは、本明細書に開示されるものなどのデバイスの組合せであってもよい。
D.非一時的コンピュータ可読記憶媒体
いくつかの例では、本明細書に開示される主題は、任意選択でネットワーク化されたデジタル処理デバイスのオペレーティングシステムにより実行可能な命令を含むプログラムでコードされる、1または複数の非一時的コンピュータ可読記憶媒体を含むことができる。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスの有形コンポーネントであってよい。いくつかの例では、コンピュータ可読記憶媒体は、任意選択でデジタル処理デバイスから取り外し可能であってよい。いくつかの例では、コンピュータ可読記憶媒体として、例えば、CD-ROM、DVD、フラッシュメモリデバイス、固体メモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウド・コンピューティング・システムおよびサービスなどを挙げることができる。いくつかの例では、プログラムと命令は、永久的に、実質的に永久的に、半永久的に、または非一時的に媒体上でコードされる場合がある。
いくつかの例では、本明細書に開示される主題は、任意選択でネットワーク化されたデジタル処理デバイスのオペレーティングシステムにより実行可能な命令を含むプログラムでコードされる、1または複数の非一時的コンピュータ可読記憶媒体を含むことができる。いくつかの例では、コンピュータ可読記憶媒体は、デジタル処理デバイスの有形コンポーネントであってよい。いくつかの例では、コンピュータ可読記憶媒体は、任意選択でデジタル処理デバイスから取り外し可能であってよい。いくつかの例では、コンピュータ可読記憶媒体として、例えば、CD-ROM、DVD、フラッシュメモリデバイス、固体メモリ、磁気ディスクドライブ、磁気テープドライブ、光ディスクドライブ、クラウド・コンピューティング・システムおよびサービスなどを挙げることができる。いくつかの例では、プログラムと命令は、永久的に、実質的に永久的に、半永久的に、または非一時的に媒体上でコードされる場合がある。
E.コンピュータシステム
本開示は、本明細書に記載の方法を実施するようにプログラムされたコンピュータシステムを提供する。図1は、患者データ、生体データ、生体配列、および参照配列を記憶、処理、特定、または解釈するようにプログラムあるいは他の方法で構成されるコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生体データ、生体配列、または参照配列の様々な態様を処理することができる。コンピュータシステム(101)は、ユーザの電子デバイス、またはその電子デバイスに対して遠隔に位置するコンピュータシステムであってよい。電子デバイスは、モバイル電子デバイスであってもよい。
本開示は、本明細書に記載の方法を実施するようにプログラムされたコンピュータシステムを提供する。図1は、患者データ、生体データ、生体配列、および参照配列を記憶、処理、特定、または解釈するようにプログラムあるいは他の方法で構成されるコンピュータシステム(101)を示す。コンピュータシステム(101)は、本開示の患者データ、生体データ、生体配列、または参照配列の様々な態様を処理することができる。コンピュータシステム(101)は、ユーザの電子デバイス、またはその電子デバイスに対して遠隔に位置するコンピュータシステムであってよい。電子デバイスは、モバイル電子デバイスであってもよい。
コンピュータシステム(101)は、中央処理ユニット(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも呼ばれる)(105)を含み、この中央処理ユニットは、シングルコアもしくはマルチコアプロセッサ、または並列のための複数のプロセッサであってもよい。コンピュータシステム(101)はまた、メモリもしくはメモリ位置(110)(例えば、ランダム・アクセス・メモリ、読取り専用メモリ、フラッシュメモリ)、電子記憶ユニット(115)(例えば、ハードディスク)、1または複数の他のシステムと通信するための通信インターフェース(120)(例えば、ネットワークアダプタ)、および、キャッシュ、他のメモリ、データ記憶および/または電子表示アダプタなどの周辺デバイス(125)も含む。メモリ(110)、記憶ユニット(115)、インターフェース(120)、および周辺デバイス(125)は、マザーボードなどの通信バス(実線)を介してCPU(105)と通信状態にある。記憶ユニット(115)は、データを記憶するためのデータ記憶ユニット(すなわちデータリポジトリ)であってもよい。コンピュータシステム(101)は、通信インターフェース(120)の補助により、コンピュータネットワーク(「ネットワーク」)(130)に動作可能に結合される場合がある。ネットワーク(130)は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信状態にあるイントラネットおよび/もしくはエクストラネットであってもよい。いくつかの例では、ネットワーク(130)は、電気通信および/またはデータネットワークである。ネットワーク(130)は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる1または複数のコンピュータサーバを含むことができる。いくつかの例では、ネットワーク(130)は、コンピュータシステム(101)の補助により、ピア・ツー・ピアネットワークを実装することができ、これにより、コンピュータシステム(101)に結合されたデバイスがクライアントまたはサーバとして挙動することが可能になる場合がある。
CPU(105)は、プログラムまたはソフトウェアに組み込まれ得る一連の機械可読命令を実行することができる。命令は、メモリ(110)などのメモリ位置に記憶されてよい。命令はCPU(105)に向けられてよく、その後、CPU(105)を、本開示の方法を実装するようにプログラムまたはその他の方法で構成することができる。CPU(105)により実行される演算の例として、フェッチ、デコード、実行、およびライトバックを挙げることができる。
CPU(105)は、集積回路などの回路の一部であってよい。システム(101)の1または複数の他のコンポーネントが回路に含まれてもよい。いくつかの例では、回路は特定用途集積回路(ASIC)である。
記憶ユニット(115)は、ドライバ、ライブラリ、および保存プログラムなどのファイルを記憶することができる。記憶ユニット(115)は、ユーザデータ、例えば、ユーザ嗜好およびユーザプログラムを記憶することができる。いくつかの例では、コンピュータシステム(101)は、イントラネットまたはインターネットを介してコンピュータシステム(101)と通信状態にあるリモートサーバ上に位置するなど、コンピュータシステム(101)の外部にある1または複数の追加のデータ記憶ユニットを含むことができる。
コンピュータシステム(101)は、ネットワーク(130)を介して1または複数の遠隔コンピュータシステムと通信することができる。例えば、コンピュータシステム(101)は、ユーザの遠隔コンピュータシステムと通信することができる。遠隔コンピュータシステムの例として、パーソナルコンピュータ(例えば、携帯用PC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samusn(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android-enabled device、Blackbery(登録商標))、またはパーソナル・デジタル・アシスタントが挙げられる。ユーザは、ネットワーク(130)を介してコンピュータシステム(101)にアクセスすることができる。
本明細書に記載される方法は、例えば、メモリ(110)または電子記憶ユニット(115)上など、コンピュータシステム(101)の電子記憶位置に記憶される機械(例えば、コンピュータプロセッサ)実行可能コードにより実施される場合がある。機械実行可能コードまたは機械可読コードは、ソフトウェアの形で提供されてよい。使用中、コードはプロセッサ(105)により実行されてよい。いくつかの例では、コードは、記憶ユニット(115)から検索されて、プロセッサ(105)によるアクセス準備のためにメモリ(110)に記憶されてもよい。いくつかの例では、電子記憶ユニット(115)は排除されてもよく、機械実行可能命令はメモリ(110)に記憶される。
コードは、予めコンパイルされ、コードを実行するように適合されたプロセッサを有するマシンとともに使用するために構成されるか、または実行中に解釈またはコンパイルされてもよい。コードは、予めコンパイルされるか、解釈されるか、またはコンパイルされたままの形でコードの実行を可能にするように選択され得るプログラミング言語で供給されてもよい。
コンピュータシステム(101)など、本明細書で提供されるシステムと方法の態様は、プログラミングにおいて具体化される場合がある。この技術の様々な態様は、典型的には機械(またはプロセッサ)実行可能コード、および/または1種の機械可読媒体に担持されるか具体化される関連データの形にある、「製品」または「製造品」と考慮される場合がある。機械実行可能コードは、メモリ(例えば、読取り専用メモリ、ランダム・アクセス・メモリ、フラッシュメモリ)またはハードディスクなどの電子記憶ユニットに記憶されてよい。「記憶」型媒体として、コンピュータやプロセッサなどの有形メモリ、または、ソフトウェアプログラミングにおいてあらゆる時間に非一時的な記憶を提供し得るそれらの関連モジュール、例えば様々なセミコンダクタメモリやテープドライブのうちいずれかまたは両方を挙げることができる。ソフトウェアのすべてまたは一部は、インターネットまたはその他様々な電気通信ネットワークを介して通信されることがある。このような通信は、例えば、1つのコンピュータまたはプロセッサから別のコンピュータへの、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのローディングを可能にする場合がある。このため、ソフトウェア要素を有し得る別の種類の媒体は、有線および光回線ネットワークを介して、および様々なエアリンク上で、ローカルデバイス間の物理インターフェース全体において使用されるなどの、光波、電波、および電磁波を含む。有線または無線リンク、光リンクなどの波を運ぶ物理要素はまた、ソフトウェアを有する媒体とみなされる場合がある。本明細書で使用するとき、非一時的で有形の「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサに命令を送るのに関与するあらゆる媒体を表す。
したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形記憶媒体、搬送波媒体、または物理伝送媒体を含むがこれらに限定されない、多くの形態を呈する場合がある。不揮発性記憶媒体として、例えば、図に示されるデータベースを実装するために使用され得るなどの、あらゆるコンピュータ等における記憶デバイスのいずれかなどの光ディスクまたは磁気ディスクが挙げられる。揮発性記憶媒体として、このようなコンピュータプラットフォームのメインメモリなどの動的メモリが挙げられる。有形伝送媒体として、コンピュータシステム内のバスを備えるワイヤを含む、同軸ケーブル、銅線および光ファイバが挙げられる。搬送波伝送媒体は、電気信号もしくは電磁信号、または無線周波数(RF)および赤外線(IR)データの通信中に生成されるものなどの音響波または光波の形態を呈する場合がある。そのため、コンピュータ可読媒体によく見られる形態として、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、あらゆる他の磁気媒体、CD-ROM、DVD、もしくはDVD-ROM、あらゆる他の光学媒体、パンチカード紙テープ、穴のパターンを有する他のあらゆる物理記憶媒体、RAM、ROM、PROM、およびEPROM、FLASH(登録商標)-EPROM、あらゆる他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、このような搬送波を運ぶケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る他のあらゆる媒体が挙げられる。コンピュータ可読媒体におけるこれら形態の多くは、実行のために1または複数の命令の1または複数のシーケンスをプロセッサに運ぶことに関与する場合がある。
コンピュータシステム(101)は、例えば、核酸配列、濃縮核酸試料、miRNAプロファイル、発現プロファイル、およびRNA発現プロファイルの解析を提供するためのユーザインターフェース(UI)(140)を含む電子ディスプレイ(135)を含むか、またはそれと通信状態とすることができる。UIの例として、グラフィカル・ユーザ・インターフェース(GUI)およびウェブベースのユーザインターフェースが挙げられるが、これらに限定されない。
本開示の方法とシステムは、1または複数のアルゴリズムにより実装される場合がある。アルゴリズムは、中央処理ユニット(105)による実行に際してソフトウェアを介して実施されてもよい。このアルゴリズムは、例えば、患者データ、生体データ、生体配列、および参照配列を記憶、処理、特定、または解釈することができる。
いくつかの例では、本明細書に開示される主題は、少なくとも1つのコンピュータプログラムまたはその使用を含むことができる。コンピュータプログラムは、指定されたタスクを実行するために書き込まれる、デジタル処理デバイスのCPU、GPU、またはTPU内で実行可能な一連の命令とすることができる。コンピュータ可読命令は、特定のタスクを実行するか、または特定の抽象データ型を実施する、関数、オブジェクト、アプリケーション・プログラミング・インターフェース(API)、データ構造などのプログラムモジュールとして実施されてもよい。本明細書で提供される開示に照らして、コンピュータプログラムは、様々なバージョンの様々な言語で書かれてよい。
コンピュータ可読命令の機能性は、様々な環境で所望されるように組み合わされるか、または分散される場合がある。いくつかの例では、コンピュータプログラムは、1つの命令シーケンスを含むことができる。いくつかの例では、コンピュータプログラムは、複数の命令シーケンスを含むことができる。いくつかの例では、コンピュータプログラムは、1つの位置から提供されてよい。いくつかの例では、コンピュータプログラムは、複数の位置から提供されてよい。いくつかの例では、コンピュータプログラムは、1または複数のモジュールを含むことができる。いくつかの例では、コンピュータプログラムは、部分的または全体的に、1または複数のウェブアプリケーション、1または複数のモバイルアプリケーション、1または複数のスタンドアロンアプリケーション、1または複数のウェブ・ブラウザ・プラグイン、エクステンション、アドイン、またはアドオン、あるいはそれらの組合せを含むことができる。
いくつかの例では、コンピュータ処理は、統計、数学、生物学、またはそれらのあらゆる組合せの方法であってよい。いくつかの例では、コンピュータ処理方法は、例えば、ロジスティック回帰、次元削減、主成分解析、オートエンコーダ、特異値分解、フーリエ基底、特異値分解、ウェーブレット、判別解析、サポート・ベクター・マシン、ツリーベース方法、ランダムフォレスト、勾配ブーストツリー、ロジスティック回帰、行列分解、ネットワーククラスタリング、およびニューラルネットワークを含む、次元削減法を含む。
いくつかの例では、コンピュータ処理方法は、例えば、回帰、サポート・ベクター・マシン、ツリーベース方法、およびネットワークを含む教師あり機械学習方法である。
いくつかの例では、コンピュータ処理方法は、例えば、クラスタリング、ネットワーク、主成分解析、および行列分解を含む教師なし機械学習方法である。
F.データベース
いくつかの例では、本明細書に開示される主題は、患者データ、生体データ、生体配列、または参照配列を記憶するための1または複数のデータベース、またはその使用を含むことができる。参照配列は、データベースから導出される場合がある。本明細書で提供される開示に照らすと、多くのデータベースが、配列情報の記憶と検索に適し得る。いくつかの例では、適切なデータベースとして、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関係モデルデータベース(entity-relationship model database)、連想データベース、およびXMLデータベースを挙げることができる。いくつかの例では、データベースは、インターネットベースであってよい。いくつかの例では、データベースは、ウェブベースであってよい。いくつかの例では、データベースは、クラウドコンピューティングベースであってよい。いくつかの例では、データベースは、1または複数のローカルコンピュータ記憶デバイスに基づく場合がある。
いくつかの例では、本明細書に開示される主題は、患者データ、生体データ、生体配列、または参照配列を記憶するための1または複数のデータベース、またはその使用を含むことができる。参照配列は、データベースから導出される場合がある。本明細書で提供される開示に照らすと、多くのデータベースが、配列情報の記憶と検索に適し得る。いくつかの例では、適切なデータベースとして、例えば、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関係モデルデータベース(entity-relationship model database)、連想データベース、およびXMLデータベースを挙げることができる。いくつかの例では、データベースは、インターネットベースであってよい。いくつかの例では、データベースは、ウェブベースであってよい。いくつかの例では、データベースは、クラウドコンピューティングベースであってよい。いくつかの例では、データベースは、1または複数のローカルコンピュータ記憶デバイスに基づく場合がある。
一態様では、本開示は、本明細書に開示される方法を実行するようにプロセッサを指示する命令を含む非一時的コンピュータ可読媒体を提供する。
一態様では、本開示は、コンピュータ可読媒体を備えるコンピュータデバイスを提供する。
別の態様では、本開示は、生体試料の分類を実行するためのシステムであって、
a)複数の訓練試料であって、それぞれが分子の複数の分類を有しており、1または複数の既知のラベルを含む、複数の訓練試料を受けるためのリザーバと、
b)複数の訓練試料のそれぞれにおいて機械学習モデルに入力されるように操作可能なアッセイに相当する一組の特徴を特定するための特徴モジュールであって、一組の特徴は複数の訓練データ中の分子の特性に相当し、複数の訓練データのそれぞれにおいて、システムは複数組の測定値を得るために複数の異なるアッセイに訓練試料中の分子の複数の分類を晒すように操作可能であり、各組の測定値は、1つのアッセイから訓練試料中の分子の分類に適用され、複数組の測定値は複数の訓練試料において得られる、特徴モジュールと、
c)訓練試料の訓練ベクトルを得るために複数組の測定値を解析するための解析モジュールであって、訓練ベクトルは対応するアッセイのN組の特徴の特徴値を含み、各特徴値は1つの特徴に相当するとともに1または複数の測定値を含み、訓練ベクトルは、複数の異なるアッセイの第1のサブセットに相当するN組の特徴のうち少なくとも2つから少なくとも1つの特徴を用いて形成される、解析モジュールと、
d)複数の訓練試料の出力ラベルを得るために機械学習モデルのパラメータを用いて訓練ベクトル上でシステムに通知を行うラベリングモジュールと、
e)出力ラベルと訓練試料の既知のラベルとを比較するコンパレータモジュールと、
f)出力ラベルと訓練サンプルの既知のラベルとの比較に基づき、機械学習モデルの訓練の一部としてパラメータの最適値を反復的に検索するための訓練モジュールと、
g)機械学習モデルのパラメータおよび機械学習モデルの一組の特徴を提供する出力モジュールと
を含むシステムを提供する。
a)複数の訓練試料であって、それぞれが分子の複数の分類を有しており、1または複数の既知のラベルを含む、複数の訓練試料を受けるためのリザーバと、
b)複数の訓練試料のそれぞれにおいて機械学習モデルに入力されるように操作可能なアッセイに相当する一組の特徴を特定するための特徴モジュールであって、一組の特徴は複数の訓練データ中の分子の特性に相当し、複数の訓練データのそれぞれにおいて、システムは複数組の測定値を得るために複数の異なるアッセイに訓練試料中の分子の複数の分類を晒すように操作可能であり、各組の測定値は、1つのアッセイから訓練試料中の分子の分類に適用され、複数組の測定値は複数の訓練試料において得られる、特徴モジュールと、
c)訓練試料の訓練ベクトルを得るために複数組の測定値を解析するための解析モジュールであって、訓練ベクトルは対応するアッセイのN組の特徴の特徴値を含み、各特徴値は1つの特徴に相当するとともに1または複数の測定値を含み、訓練ベクトルは、複数の異なるアッセイの第1のサブセットに相当するN組の特徴のうち少なくとも2つから少なくとも1つの特徴を用いて形成される、解析モジュールと、
d)複数の訓練試料の出力ラベルを得るために機械学習モデルのパラメータを用いて訓練ベクトル上でシステムに通知を行うラベリングモジュールと、
e)出力ラベルと訓練試料の既知のラベルとを比較するコンパレータモジュールと、
f)出力ラベルと訓練サンプルの既知のラベルとの比較に基づき、機械学習モデルの訓練の一部としてパラメータの最適値を反復的に検索するための訓練モジュールと、
g)機械学習モデルのパラメータおよび機械学習モデルの一組の特徴を提供する出力モジュールと
を含むシステムを提供する。
VI.集団中の対象を分類する方法
開示された方法は、対象に発現されたmiRNAの解析により、結腸細胞増殖性障害に関連するゲノムDNA発現のパラメータを確認することに関する。この方法は、結腸細胞増殖性障害の改善された診断、治療、およびモニタリングにおける、より具体的には、この障害のステージまたはサブクラスと障害に対する遺伝的素因との改善された特定およびそれらの判別を可能にすることによる使用のための方法である。
開示された方法は、対象に発現されたmiRNAの解析により、結腸細胞増殖性障害に関連するゲノムDNA発現のパラメータを確認することに関する。この方法は、結腸細胞増殖性障害の改善された診断、治療、およびモニタリングにおける、より具体的には、この障害のステージまたはサブクラスと障害に対する遺伝的素因との改善された特定およびそれらの判別を可能にすることによる使用のための方法である。
いくつかの実施形態では、上記方法は、集団中の対象から得た生体試料中でのmiRNAの差動発現を解析する工程を含む。
本開示は、例えば、結腸細胞増殖性障害を患う対象と患っていない対象との間で差動的に発現された無細胞miRNAを検出するために、無細胞試料に適用され得る結腸細胞増殖性障害を検出するための方法を提供する。この方法は、結腸細胞増殖性障害を患っていない健康な対象と比較して結腸細胞増殖性障害シグナルが基本的に「陽性」または「陰性」とする、miRNAの検出を利用する。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
ある態様では、本開示は、対象から得た生体試料のmiRNAプロファイルを判定するための方法であって、
a)生体試料からRNAを単離する工程と、
b)RNAをcDNAに逆転写する前または後に、生体試料から得た核酸にRNAアダプタをライゲートする工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて核酸分子の核酸配列を参照核酸配列にアライメントして、対象のmiRNAプロファイルを判定する工程と
を含む方法を提供する。
a)生体試料からRNAを単離する工程と、
b)RNAをcDNAに逆転写する前または後に、生体試料から得た核酸にRNAアダプタをライゲートする工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて核酸分子の核酸配列を参照核酸配列にアライメントして、対象のmiRNAプロファイルを判定する工程と
を含む方法を提供する。
いくつかの実施形態では、核酸シーケンシングライブラリは、増幅前に調製される。
いくつかの実施形態では、アダプタのライゲーションは、上記cの前にRNAアダプタライゲーション、アダプタブロッキング、アダプタ環状化、および二量体除去を含む。
いくつかの実施形態では、参照核酸配列は、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することを含む。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む。
いくつかの実施形態では、miRNAプロファイルは、結腸細胞増殖性障害と関連付けられ、かつ、結腸細胞増殖性障害があるとの対象の分類を提供する。
いくつかの実施形態では、対象から得た生体試料は、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、上記方法は、対象から測定したmiRNAシグネチャパネルを、健康な対象から測定したmiRNAシグネチャパネルのデータベースであって、コンピュータシステムに記憶されているデータベースに適用する工程、および、健康な対象から得たmiRNA状態と比較したときにmiRNAシグネチャパネルに少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%の変化を測定することにより、対象が結腸細胞増殖性障害を患うリスクが増加したと判定する工程を含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される。
別の態様では、本開示は、対象における結腸細胞増殖性障害を検出するための方法であって、
a)生体試料からRNAを単離する工程と、
b)生体試料から得たRNAにRNAアダプタをライゲートして、RNAをcDNAに逆転写する工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルの核酸配列をアライメントして、対象のmiRNAプロファイルを判定する工程と、
f)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルにmiRNAプロファイルを入力することで、結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより前記対象における結腸細胞増殖性障害の存在を示す工程と
を含む方法を提供する。
a)生体試料からRNAを単離する工程と、
b)生体試料から得たRNAにRNAアダプタをライゲートして、RNAをcDNAに逆転写する工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルの核酸配列をアライメントして、対象のmiRNAプロファイルを判定する工程と、
f)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルにmiRNAプロファイルを入力することで、結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより前記対象における結腸細胞増殖性障害の存在を示す工程と
を含む方法を提供する。
いくつかの実施形態では、参照核酸配列は、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することを含む。
いくつかの実施形態では、対象のmiRNAプロファイルを決定する工程は、発現されたmiRNAのカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む。
いくつかの実施形態では、miRNAプロファイルは、2つの対象群を区別可能な分類器(例えば、健康vs癌、疾患のステージ、進行腺腫vs癌)を取得するために機械学習モデルに入力される。
いくつかの実施形態では、対象から得た生体試料は、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される。
いくつかの実施形態では、上記方法は、対象から測定したmiRNAシグネチャパネルを、健康な対象から測定したmiRNAシグネチャパネルのデータベースであって、コンピュータシステムに記憶されているデータベースに適用する工程、および、健康な対象から得たmiRNA状態と比較したときにmiRNAシグネチャパネルのmiRNA発現に少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%の変化を測定することにより、対象が結腸細胞増殖性障害を患うリスクが増加したと判定する工程を含む。
いくつかの実施形態では、結腸細胞増殖性障害は、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される。
いくつかの実施形態では、結腸細胞増殖性障害は、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される。
本明細書に記載される訓練された機械学習方法、モデル、および識別分類器は、癌の検出、診断、および処置応答性を含む様々な医療用途に適用される場合がある。モデルは対象メタデータおよび分析物由来の特徴を用いて訓練されてもよいため、アプリケーションは、集団内の対象を層別化して、適宜処置の決定をガイドするように調整される場合がある。
診断
本明細書で提供される方法とシステムは、人工知能を用いた手法を使用して予測解析を行い、対象(患者)から取得したデータを解析して、癌(例えば、大腸癌、CRC)を患う対象の診断の出力を生成する場合がある。例えば、アプリケーションは、取得したデータに予測アルゴリズムを適用して、癌を患う対象の診断を生成することができる。予測アルゴリズムは、取得したデータを処理して癌を患う対象の診断を生成するように構成された、機械学習ベース予測器などの人工知能ベース予測器を含んでよい。
本明細書で提供される方法とシステムは、人工知能を用いた手法を使用して予測解析を行い、対象(患者)から取得したデータを解析して、癌(例えば、大腸癌、CRC)を患う対象の診断の出力を生成する場合がある。例えば、アプリケーションは、取得したデータに予測アルゴリズムを適用して、癌を患う対象の診断を生成することができる。予測アルゴリズムは、取得したデータを処理して癌を患う対象の診断を生成するように構成された、機械学習ベース予測器などの人工知能ベース予測器を含んでよい。
機械学習予測器は、データセット、例えば、対象の生体試料上で、本明細書に記載のシグネチャパネルを用いて、機械学習予測器への入力として癌を患った患者の1または複数の組のコホート、および機械学習予測器への出力として対象の明らかな診断(例えば、病期分類、および/または腫瘍画分)アウトカムからRNAアッセイを行うことにより生成されたデータセットを用いて訓練される場合がある。
訓練データセット(例えば、対象の生体試料上で、本明細書に記載のシグネチャパネルを用いてメチル化アッセイを行うことにより生成されたデータセット)は、例えば、よく見られる特性(特徴)およびアウトカム(ラベル)を有する対象の1または複数の組から生成される場合がある。訓練データセットは、診断に関連する特徴に対応する一組の特徴とラベルを含んでもよい。特徴は、例えば、cfRNAアッセイ測定の特定の範囲またはカテゴリなどの特性、例えば、基準ゲノムの一組のビン(ゲノムウインドウ)のそれぞれの中で重なるか、またはその中にある、健康な試料および疾患試料から得た生体試料中のcfRNAまたはそのフラグメントの数を含む場合がある。例えば、所与の時点で所与の対象から採取した一組の特徴は、総体的に所与の時点での特定された対象の癌を示し得る診断シグネチャとして機能する場合がある。特性はさらに、1または複数の癌などの対象の診断結果を示すラベルを含む場合もある。
ラベルは、例えば、対象の明らかな診断(例えば、病期分類および/または腫瘍画分)アウトカムなどのアウトカムを含む場合がある。アウトカムは、対象の癌に関連付けられる特性を含む場合がある。例えば、特性は、1または複数の癌を患う対象を示す場合がある。
訓練セット(例えば、訓練データセット)は、1または複数組の対象(例えば、1または複数の癌を患うか、または患っていない患者の後向きおよび/または前向きコホート)に相当する一組のデータに対するランダムなサンプリングにより選択されてもよい。代替的に、訓練セット(例えば、訓練データセット)は、1または複数組の対象(例えば、1または複数の癌を患うか、または患っていない患者の後向きおよび/または前向きコホート)に相当する一組のデータに対する比例サンプリングにより選択されてもよい。訓練セットは、1または複数組の対象(例えば、異なる臨床施設または検査の患者)に対応するデータセット全体で平衡化される場合がある。機械学習予測器は、診断精度測定値に相当する最小の所望の値を有するなど、精度または性能に関する特定の予め定めた条件が満たされるまで訓練される場合がある。例えば、診断精度測定は、対象における1または複数の癌の診断、病期分類、または腫瘍画分の予測に相当し得る。
診断精度測定の例として、癌(例えば、大腸癌)を検出または予測する診断精度に相当する受信者操作特性(ROC)曲線の感度、特異性、陽性予測値(PPV)、陰性予測値(NPV)、精度、および曲線下面積(AUC)が挙げられる場合がある。
一態様では、本開示は、対象の集団を判別可能な分類器を使用する方法であって、
a)生体試料中のRNAをアッセイすることにより、生体試料中のRNAを表す一組の測定値を提供する工程と、
b)機械学習または統計モデルに入力する生体試料中のRNAの特性に相当する一組の特徴を特定する工程と、
c)複数組の測定値それぞれから、特徴値であって、それぞれが一組の特徴のうち1つの特徴に相当するとともに1または複数の測定値を含む、特徴値の特徴ベクトルを調製する工程であって、特徴ベクトルは複数組の測定値の各組を用いて得られる少なくとも1つの特徴値を含む、工程と、
d)コンピュータシステムのメモリに、分類器を含む機械学習モデルであって、訓練生体試料から得られる訓練ベクトルを用いて訓練される機械学習モデル、特定された特性を有すると特定された訓練生体試料の第1のサブセット、および特定された特性を有さないと特定された訓練生体試料の第2のサブセットをロードする工程と、
e)機械学習モデルに特徴ベクトルを入力して、特定された特性を生体試料が有するかどうかの出力分類を取得することにより、特定された特性を有する対象の集団を判別する工程と
を含む。
a)生体試料中のRNAをアッセイすることにより、生体試料中のRNAを表す一組の測定値を提供する工程と、
b)機械学習または統計モデルに入力する生体試料中のRNAの特性に相当する一組の特徴を特定する工程と、
c)複数組の測定値それぞれから、特徴値であって、それぞれが一組の特徴のうち1つの特徴に相当するとともに1または複数の測定値を含む、特徴値の特徴ベクトルを調製する工程であって、特徴ベクトルは複数組の測定値の各組を用いて得られる少なくとも1つの特徴値を含む、工程と、
d)コンピュータシステムのメモリに、分類器を含む機械学習モデルであって、訓練生体試料から得られる訓練ベクトルを用いて訓練される機械学習モデル、特定された特性を有すると特定された訓練生体試料の第1のサブセット、および特定された特性を有さないと特定された訓練生体試料の第2のサブセットをロードする工程と、
e)機械学習モデルに特徴ベクトルを入力して、特定された特性を生体試料が有するかどうかの出力分類を取得することにより、特定された特性を有する対象の集団を判別する工程と
を含む。
別の態様では、本開示は、対象における癌を特定するための方法であって、
a)生体試料からRNAを単離する工程と、
b)生体試料から得たRNAにRNAアダプタをライゲートして、RNAをcDNAに逆転写する工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて核酸分子の核酸配列を参照核酸配列にアライメントして、対象のmiRNAプロファイルを判定する工程と、
f)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルにmiRNAプロファイルを入力することで、結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより対象における結腸細胞増殖性障害の存在を示して、対象が癌を患っている可能性を生成する工程と
を含む方法を提供する。
a)生体試料からRNAを単離する工程と、
b)生体試料から得たRNAにRNAアダプタをライゲートして、RNAをcDNAに逆転写する工程と、
c)工程b)のcDNAを増幅する工程と、
d)cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて核酸分子の核酸配列を参照核酸配列にアライメントして、対象のmiRNAプロファイルを判定する工程と、
f)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルにmiRNAプロファイルを入力することで、結腸細胞増殖性障害の存在に関連する出力値を提供し、それにより対象における結腸細胞増殖性障害の存在を示して、対象が癌を患っている可能性を生成する工程と
を含む方法を提供する。
いくつかの実施形態では、少なくとも約10個の別個のmiRNAは、少なくとも約20個の別個のmiRNAを含み、少なくとも約20個の別個のmiRNAはそれぞれ、表1~表11に列挙されるmiRNAのうち少なくとも一部を含む。いくつかの例では、少なくとも約10個の別個のmiRNAは、少なくとも約30個の別個のmiRNAを含み、少なくとも約30個の別個のmiRNAはそれぞれ、表1~表11に列挙されるmiRNAのうち少なくとも一部を含む。
いくつかの実施形態は、特に対象が膵臓病変を患うときに、結腸細胞増殖性障害を患うか、または結腸細胞増殖性障害を発症するリスクが高い対象の試料に差動的に発現された、miRNAのプロファイルを提供する。結腸細胞増殖性障害を患うか、または結腸細胞増殖性障害を発症するリスクが高い対象の試料に差動的に発現されたmiRNAのプロファイルは、上方調節/過剰発現されたmiRNAのプロファイル、および下方調節または過小発現されたmiRNAのプロファイルを含む。
いくつかの実施形態では、対象において、結腸細胞増殖性障害の存在、または結腸細胞増殖性障害を発症する高リスクを検出するための方法は、
a)対象中の1または複数のmiRNAの発現レベルを対象から検出する工程と、
b)検出した発現レベルと参照発現レベルとを比較する工程であって、試料中の1または複数のmiRNAの差動的発現は、参照発現レベルと比較したとき、結腸細胞増殖性障害の不在または結腸細胞増殖性障害を発症する低リスクに対して、結腸細胞増殖性障害の存在または結腸細胞増殖性障害を発症する高リスクを示す、工程と
を含む。
a)対象中の1または複数のmiRNAの発現レベルを対象から検出する工程と、
b)検出した発現レベルと参照発現レベルとを比較する工程であって、試料中の1または複数のmiRNAの差動的発現は、参照発現レベルと比較したとき、結腸細胞増殖性障害の不在または結腸細胞増殖性障害を発症する低リスクに対して、結腸細胞増殖性障害の存在または結腸細胞増殖性障害を発症する高リスクを示す、工程と
を含む。
試料中の1または複数のmiRNAの差動的発現は、参照発現レベルと比較して、結腸細胞増殖性障害前駆体を示す場合がある。
いくつかの実施形態では、試料は組織試料であり、1または複数のmiRNAは、結腸細胞増殖性障害を発症するリスクが低い対象の対応する細胞と比較して、結腸細胞増殖性障害を発症するリスクが高い対象の細胞中で差動的に発現されるmiRNAのプロファイルに属する。
いくつかの実施形態では、対象は大腸病変を患っており、1または複数のmiRNAは、膵臓病変を患うとともに、結腸細胞増殖性障害を発症するリスクが低い対象の対応する試料と比較して、大腸病変を患うとともに、結腸細胞増殖性障害を発症するリスクが高い対象の試料中で差動的に発現されたmiRNAのプロファイルに属する。
いくつかの方法は、試料中の1または複数のmiRNAの発現レベルを検出するために使用されてよい。例えば、miRNAの測定は、バーコードベースアッセイ、miRNAマイクロアレイ解析(例えば、チップ)、デジタルポリメラーゼ連鎖反応(PCR)、リアルタイムPCR、量的逆転写PCR(qRT-PCR)、半量的PCR、ノーザンブロット、またはin situハイブリダイゼーションにより実施することができる。例えば、成熟miRNAは、例えばin vitroアッセイを用いて測定される。
発現の閾値またはカットオフ値を確立するための様々な統計的かつ数学的な方法が、使用されてよい。特定のバイオマーカの閾値またはカットオフの発現レベルは、例えば、本開示の実施例と図面に記載されるものなどの、受信者操作特性(ROC)プロットからのデータに基づき選択されてよい。いくつかの実施形態では、これらの閾値またはカットオフの発現レベルは、例えば、特定のバイオマーカまたはそれらの組合せに対してROCプロットに沿って移動し、感度または特異性の様々な値を得ることで全体的なアッセイパフォーマンスに影響を及ぼすことにより、変動することができる。例えば、臨床的観点から強固な診断方法を有することを目的とする場合、高感度を優先する必要がある。しかし、費用対効果の高い方法を目標とする場合、高特異性を優先する必要がある。最良のカットオフは、最高の感度と特異性を生成する特定のバイオマーカについてのROCプロットから得られた値を表す。感度および特異度の値は、閾値(カットオフ)の範囲にわたって算出される。このため、閾値またはカットオフ値は、感度および/または特異度が少なくとも約70%であり、例えば、アッセイされた患者集団の少なくとも60%、またはアッセイされた患者集団の少なくとも65%、70%、75%、もしくは80%において、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも100%とすることができるように、選択することができる。
結果的に、本開示の実施形態の一部は、診断またはスクリーニングされることとなる対象から単離された侵襲性が最小の試料において、前述された少なくともマイクロRNAの発現レベルを判定して、マイクロRNAの発現レベルを所定の閾値またはカットオフ値と比較することにより実行されてもよく、所定の閾値またはカットオフ値は、大腸癌または大腸腺腫を患うリスクにある患者集団において判定されたマイクロRNAの発現レベルに基づき算出されたROC曲線において、所望の感度で最高の特異度と相関するマイクロRNAの発現レベルに相当しており、所定のカットオフ値に対するマイクロRNAのうち少なくとも1つの過剰発現は、対象が大腸癌または大腸腺腫を患うことを所望の感度で示す。
別の例として、このような所定の状態は、結腸細胞増殖性障害の予測感度が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含む状態であってもよい。
別の例として、このような所定の状態は、結腸細胞増殖性障害の予測の陽性予測値(PPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含む状態であってもよい。
別の例として、このような所定の状態は、結腸細胞増殖性障害の予測の陰性予測値(NPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の値を含む状態であってもよい。
別の例として、このような所定の状態は、結腸細胞増殖性障害の予測における受信者操作特性(ROC)曲線の曲線下面積(AUC)が、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、または少なくとも約0.99の値を含む状態であってもよい。
処置反応性
本明細書に記載の予測分類器、システム、および方法は、(例えば、個体の生体試料に対して本明細書に記載のシグネチャパネルを用いてRNAアッセイを行うことに基づき)多数の臨床適用のために個体集団を分類するために適用される場合がある。このような臨床適用の例として、初期段階の癌の検出、癌の診断、特定の疾患段階への癌の分類、癌を処置するための治療剤に対する応答性または抵抗性の判定が挙げられる。
本明細書に記載の予測分類器、システム、および方法は、(例えば、個体の生体試料に対して本明細書に記載のシグネチャパネルを用いてRNAアッセイを行うことに基づき)多数の臨床適用のために個体集団を分類するために適用される場合がある。このような臨床適用の例として、初期段階の癌の検出、癌の診断、特定の疾患段階への癌の分類、癌を処置するための治療剤に対する応答性または抵抗性の判定が挙げられる。
本明細書に記載の方法とシステムは、等級や段階など、結腸細胞増殖性障害の特性に適用されてよい。そのため、異なる組織中の異なる癌の種類にわたる癌治療薬の応答性を予測して、処置応答性に基づき対象を分類するために、分析物とアッセイとの組合せが本システムと方法に使用される場合がある。いくつかの実施形態では、本明細書に記載の分類器は、対象の群を処置応答者および非応答者へと階層化することが可能である。
別の態様では、本開示は、疾患を以前に処置された対象における最小残存病変をモニタリングするための方法であって、ベースラインのmiRNA状態として本明細書に記載されるmiRNAプロファイルを判定する工程と、解析を繰り返して1または複数の所定の時点でmiRNAプロファイルを判定する工程であって、ベースラインからの変化は対象におけるベースラインでの最小残存病変の変化を示す、工程とを含む方法を、提供する。
いくつかの実施形態では、最小残存病変は、処置への応答、腫瘍細胞量、術後残存腫瘍、再発、二次スクリーン、一次スクリーン、および癌の進展から選択される。
別の態様では、処置に対する応答を判定するための方法が提供される。
別の態様では、腫瘍細胞量をモニタリングするための方法が提供される。
別の態様では、術後残存腫瘍を検出するための方法が提供される。
別の態様では、再発を検出するための方法が提供される。
別の態様では、二次スクリーンとして使用するための方法が提供される。
別の態様では、一次スクリーンとして使用するための方法が提供される。
別の態様では、癌の進展をモニタリングするための方法が提供される。
本開示はまた、目的の疾病または疾患の薬物標的(例えば、特定の分類に関連するかそれにおいて重要な遺伝子)を判定するための方法であって、少なくとも1つの遺伝子の遺伝子発現レベルについて対象から得られた試料を評価する工程と、近傍解析ルーチン(neighborhood analysis routine)を用いて試料の分類に関連する遺伝子を判定することで、その分類に関連する1または複数の薬物標的を確認する工程とを含む方法を、提供する。
本開示はまた、疾患の分類を処置するように設計された薬物の有効性を判定するための方法であって、疾患の分類を有する個体から試料を得る工程と、試料を薬物に曝露する工程と、少なくとも1つの遺伝子の遺伝子発現のレベルについて薬物曝露を受けた試料を評価する工程と、加重投票スキーム(weighted voting scheme)で構築したコンピュータモデルを用いて、薬物曝露を受けた試料を、モデルの遺伝子発現レベルに対する試料の相対的遺伝子発現レベルに応じて疾患の分類へと分類する工程とを含む方法を、提供する。
本開示はまた、疾患の分類を処置するように設計された薬物の有効性を判定するための方法であって、個体が薬物に晒されており、当該方法が、薬物に晒された個体から試料を得る工程と、少なくとも1つの遺伝子の遺伝子発現レベルについて試料を評価する工程と、加重投票スキームを用いて構築したモデルを用いて試料を疾患の分類へと分類する工程と、モデルの遺伝子発現レベルと比較して試料の遺伝子発現レベルを評価する工程とを含む方法を、提供する。
本開示はまた、対象が表現型分類(例えば、知能、処置への応答、寿命、ウイルス感染の可能性、または肥満症)に属するかどうかを判定する方法であって、対象から試料を得る工程と、少なくとも1つの遺伝子の遺伝子発現レベルについて試料を評価する工程と、加重投票スキームを用いて構築したモデルを用いて試料を疾患の分類へと分類する工程であって、モデルの遺伝子発現レベルと比較して試料の遺伝子発現レベルを評価することを含む、工程とを含む方法を、提供する。
一態様では、処置応答性に基づき集団を分類することに関連する、本明細書に記載のシステムと方法は、DNA損傷剤、DNA修復標的治療薬、DNA損傷シグナル伝達の阻害剤、DNA損傷により誘導される細胞周期休止の阻害剤、およびDNA損傷を間接的に生じさせるプロセスの阻害といった分類であるが、これらの分類に限定されない化学療法剤により処置される癌について言及している。これら化学療法剤はそれぞれ、用語が本明細書で使用されるとき、「DNA損傷治療剤」とみなされる場合がある。
患者の分析物データに基づき、患者は、臨床的再発のリスクが高いまたは低い患者など、高リスクおよび低リスクの患者群に分類される場合があり、その結果を使用して処置の期間が決定されてもよい。例えば、高リスク患者であると判定された患者は、手術後に補助化学療法により処置される場合がある。低リスク患者とみなされた患者では、補助化学療法は手術後に保留される場合がある。したがって、いくつかの態様では、本開示は再発のリスクを示す大腸癌腫瘍の遺伝子発現プロファイルを調製するための方法を提供する。
いくつかの例では、本明細書に記載の分類器は、対象の集団を処置応答者と処置非応答者との間で階層化することが可能である。
別の態様では、本明細書に開示される方法は、癌の検出またはモニタリングを含む臨床用途に適用される場合がある。
いくつかの実施形態では、本明細書に開示される方法は、処置に対する応答を判定および/または予測するために適用される場合がある。
大腸癌のモニタリング
データセットを処理するために訓練されたアルゴリズムを使用した後、大腸癌は対象において特定またはモニタリングされてよい。この特定は、大腸癌関連miRNAのパネルにおけるデータセットの配列リードの量的測定(例えば、RNA転写物の量的測定)に少なくとも部分的に基づく場合がある。例えば、モニタリングは、2つ以上の異なる時点それぞれにおいて対象の大腸癌を評価することを含む場合がある。
データセットを処理するために訓練されたアルゴリズムを使用した後、大腸癌は対象において特定またはモニタリングされてよい。この特定は、大腸癌関連miRNAのパネルにおけるデータセットの配列リードの量的測定(例えば、RNA転写物の量的測定)に少なくとも部分的に基づく場合がある。例えば、モニタリングは、2つ以上の異なる時点それぞれにおいて対象の大腸癌を評価することを含む場合がある。
いくつかの実施形態では、本明細書に開示される方法は、腫瘍細胞量をモニタリングおよび/または予測するために適用される場合がある。
いくつかの実施形態では、本明細書に開示される方法は、術後の残存腫瘍を検出および/または予測するために適用される場合がある。
いくつかの実施形態では、本明細書に開示される方法は、術後の最小残存病変を検出および/または予測するために適用される場合がある。
いくつかの実施形態では、本明細書に開示される方法は、再発を検出および/または予測するために適用される場合がある。
一態様では、本明細書に開示される方法は、二次スクリーンとして適用される場合がある。
一態様では、本明細書に開示される方法は、一次スクリーンとして適用される場合がある。
一態様では、本明細書に開示される方法は、癌の発症をモニタリングするために適用される場合がある。
一態様では、本明細書に開示される方法は、癌のリスクをモニタリングおよび/または予測するために適用される場合がある。
大腸癌は、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い精度で、対象において特定される場合がある。訓練済みアルゴリズムにより大腸癌を特定する精度は、大腸癌を患うか患っていないと正確に特定または分類される独立した検査試料(例えば、大腸癌を患うことが明らかな対象、または大腸癌の臨床検査結果が陰性である対象)の割合として算出される場合がある。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い陽性予測値(PPV)で、対象において特定される場合がある。訓練済みアルゴリズムを用いて大腸癌を特定するPPVは、実際に大腸癌を患っている対象に相当する、大腸癌を患っていると特定されるか、または分類される無細胞生体試料の割合として算出される場合がある。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い陰性予測値(NPV)で、対象において特定される場合がある。訓練済みアルゴリズムを用いて大腸癌を特定するNPVは、実際に大腸癌がない対象に相当する、大腸癌を患っていないと特定されるか、または分類される無細胞生体試料の割合として算出される場合がある。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれよりも高い臨床的感度で、対象において特定される場合がある。訓練済みアルゴリズムを用いて大腸癌を特定する臨床的感度は、大腸癌を患っていると正確に特定または分類される、大腸癌の存在に関連付けられる独立した検査試料(例えば、大腸癌を患っていることが明らかな対象)の割合として算出される場合がある。
大腸癌は、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれよりも高い臨床的特異性で、対象において特定される場合がある。訓練済みアルゴリズムを用いて大腸癌を特定する臨床的特異性は、大腸癌を患っていないと正確に特定または分類される、大腸癌の不在に関連付けられる独立した検査試料(例えば、大腸癌の臨床検査結果が陰性の対象)の割合として算出される場合がある。
いくつかの実施形態では、訓練済みアルゴリズムは、対象が、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれよりも高い大腸癌のリスクにあることを判定する場合がある。
訓練済みアルゴリズムは、対象が、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれよりも高い精度で大腸癌のリスクにあることを判定する場合がある。
大腸癌を患っていると対象を特定するに際して、対象は、任意選択で治療的介入(例えば、対象の大腸癌を処置するための適切な処置期間を定める)が提供されてよい。治療的介入は、薬物の有効量の処方、大腸癌に対するさらなる検査または評価、大腸癌のさらなるモニタリング、またはそれらの組合せを含む場合がある。対象が現在、処置期間により大腸癌の処置を受けている場合、治療的介入は、(例えば、現在の処置期間が有効でないことにより処置の有効性を増加させるために)その後の異なる処置の期間を含む場合がある。
治療的介入は、大腸癌の診断を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学(cell-free biological cytology)、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物の量的測定)は、患者(例えば、大腸癌を患う対象または大腸癌の処置を受けている対象)をモニタリングするために一定期間にわたり評価される場合がある。このような場合、患者のデータセットの量的測定は、処置期間の間に変化する場合がある。例えば、有効な処置により大腸癌リスクが低下した患者のデータセットの量的測定は、健康な対象(例えば、大腸癌がない対象)のプロファイルまたは分布に向けて推移し得る。反対に、例えば、有効でない処置により大腸癌のリスクが増加した患者のデータセットの量的測定は、大腸癌が高いか、または大腸癌がさらに進行した対象のプロファイルまたは分布に向けて推移し得る。
対象の大腸癌は、対象の大腸癌を処置するための処置期間をモニタリングすることにより、モニタリングされてよい。モニタリングは、2つ以上の異なる時点において対象の大腸癌を評価することを含む場合がある。この評価は、2つ以上の時点それぞれにおいて判定される大腸癌関連ゲノム座位のパネルに対する量的測定を含む、大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物またはDNAの量的測定)に少なくとも基づく場合がある。
いくつかの実施形態では、2つ以上の時点の間に判定された大腸癌関連ゲノム座位のパネルに対する量的測定を含む、大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物またはDNAの量的測定)における差異は、(i)対象の大腸癌の診断、(ii)対象の大腸癌の予後、(iii)対象の大腸癌のリスク増加、(iv)対象の大腸癌のリスク低下、(v)対象の大腸癌を処置するための処置期間の有効性、および(vi)対象の大腸癌を処置するための処置期間の非有効性など、1または複数の臨床的指標を示すことがある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、対象の大腸癌の診断を示す場合がある。例えば、大腸癌が以前の時点で対象に検出されなかったが、後の時点で対象に検出された場合、その差は、対象の大腸癌の診断を示す。対象の大腸癌の診断に対するこのような指標に基づき、例えば、対象に新たな治療介入を実施するなどの臨床行為または決定を行ってもよい。臨床行為または決定は、大腸癌の診断を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、対象の大腸癌の予後を示す場合がある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、大腸癌のリスクが増加した対象を示す場合がある。例えば、大腸癌が早い時点と遅い時点の両方で対象に検出され、その差が正の差である場合(例えば、大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物またはDNAの量的測定)が、早い時点から遅い時点まで増加した場合)、その差は、大腸癌のリスクが増加したことを示す場合がある。大腸癌のリスク増加に対するこのような指標に基づき、例えば、対象に新たな治療介入を実施するか、治療介入を切り替える(例えば、現在の処置を終了し、新たな処置を実施する)などの臨床行為または決定を行ってもよい。臨床行為または決定は、大腸癌のリスク増加を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、大腸癌のリスクが減少した対象を示す場合がある。例えば、大腸癌が早い時点と遅い時点の両方で対象に検出され、その差が負の差である場合(例えば、大腸癌関連ゲノム座位のパネルの量的測定を含む、大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物またはDNAの量的測定)が、早い時点から遅い時点まで減少した場合)、その差は、大腸癌のリスクが減少したことを示す場合がある。大腸癌のリスク減少に対するこのような指標に基づき、対象に対し臨床行為または決定(例えば、現在の治療介入を継続するか、または終了させる)を行ってもよい。臨床行為または決定は、大腸癌のリスク減少を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、対象の大腸癌を処置するための処置期間の有効性を示す場合がある。例えば、大腸癌が以前の時点で対象に検出されたが、後の時点で対象に検出されなかった場合、その差は、対象の大腸癌を処置するための処置期間の有効性を示す場合がある。対象の大腸癌を処置するための処置期間の有効性に対するこのような指標に基づき、例えば、対象において現在の治療介入を継続するか、または終了するなどの臨床行為または決定を行ってもよい。臨床行為または決定は、大腸癌を処置するための処置期間の有効性を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
いくつかの実施形態では、2つ以上の時点間で判定される大腸癌関連のゲノム座位のパネルの量的測定を含む、大腸癌関連のゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連のゲノム座位におけるRNA転写物またはDNAの量的測定)の差は、対象の大腸癌を処置するための処置期間の非有効性を示す場合がある。例えば、大腸癌が早い時点と遅い時点の両方で対象に検出され、その差が正またはゼロの差である場合(例えば、大腸癌関連ゲノム座位のパネルの量的測定を含む、大腸癌関連ゲノム座位のパネルにおけるデータセットの配列リードの量的測定(例えば、大腸癌関連ゲノム座位におけるRNA転写物またはDNAの量的測定)が、早い時点から遅い時点まで増加するか、または一定のレベルを維持した場合)、かつ、有効な処置が早い時点で認められた場合、その差は、対象の大腸癌を処置するための処置期間の非有効性を示す場合がある。対象の大腸癌を処置するための処置期間の非有効性に対するこのような指標に基づき、例えば、対象において現在の治療介入を終了する、および/または異なる新たな治療介入に切り替える(例えば、実施する)などの臨床行為または決定を行ってもよい。臨床行為または決定は、大腸癌を処置するための処置期間の非有効性を確認するために二次臨床検査に対象を推薦することを含み得る。二次臨床検査は、画像検査、血液検査、コンピュータ断層撮影(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影(PET)スキャン、PET-CTスキャン、無細胞生体細胞学、FIT検査、FOBT検査、またはそれらのあらゆる組合せを含む場合がある。
VII.キット
本開示は、対象の癌を特定またはモニタリングするためのキットを提供する。キットは、対象の無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)を特定するためのプローブまたはプライマーを含む場合がある。無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)は、1または複数の癌を示す場合がある。プローブは、無細胞生体試料中の複数の癌関連ゲノム座位における配列に対して選択的であり得る。キットは、対象の無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)を示すデータセットを生成するために、プローブを用いて無細胞生体試料を処理するための指示書(instructions)を含んでもよい。
本開示は、対象の癌を特定またはモニタリングするためのキットを提供する。キットは、対象の無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)を特定するためのプローブまたはプライマーを含む場合がある。無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)は、1または複数の癌を示す場合がある。プローブは、無細胞生体試料中の複数の癌関連ゲノム座位における配列に対して選択的であり得る。キットは、対象の無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)を示すデータセットを生成するために、プローブを用いて無細胞生体試料を処理するための指示書(instructions)を含んでもよい。
キット中のプローブは、無細胞生体試料中の複数の癌関連ゲノム座位における配列に対して選択的であり得る。キット中のプローブは、複数の癌関連ゲノム座位に相当する核酸(例えば、RNAまたはDNA)分子を選択的に富化するように構成され得る。キット中のプローブは、核酸プライマーであってよい。キット中のプローブは、複数の癌関連miRNAまたはそのフラグメントのうち1もしくは複数から得られる核酸配列に対し、部分的または完全な配列相補性を有する場合がある。複数の癌関連miRNAは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、またはそれ以上の別個の癌関連miRNAを含む場合がある。複数の癌関連miRNAは、表1~表11に列挙されるmiRNAからなる群から選択される1または複数の員を含む場合がある。
キット中の指示書は、無細胞生体試料中の複数の癌関連ゲノム座位における配列に対して選択的であるプローブを用いて、無細胞生体試料をアッセイするための指示書を含み得る。これらのプローブは、複数の癌関連ゲノム座位のうちの1または複数から得られる核酸配列(例えば、RNAまたはDNA)に対して配列相補性を有する核酸分子(例えば、RNAまたはDNA)であってよい。これらの核酸分子は、プライマーまたは富化配列であり得る。無細胞生体試料をアッセイするための指示書は、アレイハイブリダイゼーション、ポリメラーゼ連鎖反応(PCR)、または核酸シーケンシング(例えば、DNAシーケンシングまたはRNAシーケンシング)を行い、無細胞生体試料を処理して、無細胞生体試料中の複数の癌関連miRNAそれぞれの量的測定(例えば、存在、不在、または相対量を示すもの)を示すデータセットを生成するための指示書を含み得る。無細胞生体試料中の複数の癌関連miRNAそれぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)は、1または複数の癌を示す場合がある。
キット中の指示書は、アッセイの読み出しを測定かつ解釈するための指示書を含む場合があり、この読み出しは、複数の癌関連ゲノム座位のうち1または複数において定量されて、無細胞生体試料中の複数の癌関連ゲノム座位それぞれにおける配列の量的測定(例えば、存在、不在、または相対量を示すもの)を示すデータセットを生成する場合がある。例えば、複数の癌関連miRNAに相当する、アレイハイブリダイゼーションまたはポリメラーゼ連鎖反応(PCR)の定量は、無細胞生体試料中の量的測定(例えば、存在、不在、または相対量を示すもの)、およびmiRNAの生体特性が明らかな対象間の差動的発現を示すデータセットを生成する場合がある。アッセイの読み出しは、量的PCR(qPCR)値、デジタルPCR(dPCR)値、デジタルドロップレットPCR(ddPCR)値、蛍光値など、またはそれらの正規化された値を含む場合がある。
実施例1:無細胞核酸に対するmiRNA解析
本検査では、計276名の被験者を前向きに対象とした。145名は新たに散発性大腸腫瘍と診断された患者(CRC39名、進行性腺腫(AA)49名、非進行性腺腫57名)、131名はいずれの癌の病歴もなく、最近の大腸内視鏡検査で大腸腫瘍性病変の欠如を認めた健康な個人である。AA患者は、大きさが少なくとも10mmの腺腫、もしくは組織学的に高悪性度の異形成、または20%を超える絨毛成分を認めた患者であった。全個体で血液試料を採取してから、内視鏡検査または手術を行った。
本検査では、計276名の被験者を前向きに対象とした。145名は新たに散発性大腸腫瘍と診断された患者(CRC39名、進行性腺腫(AA)49名、非進行性腺腫57名)、131名はいずれの癌の病歴もなく、最近の大腸内視鏡検査で大腸腫瘍性病変の欠如を認めた健康な個人である。AA患者は、大きさが少なくとも10mmの腺腫、もしくは組織学的に高悪性度の異形成、または20%を超える絨毛成分を認めた患者であった。全個体で血液試料を採取してから、内視鏡検査または手術を行った。
検査コホートの説明は表12に示し、この表には、(病期、性別、年齢による)分類モデルに対するCRC実験に使用した健康な試料と癌試料の数を示す。
276名の個体それぞれにおいて、MagMax mirVana Total RNA単離キットを用いて、血漿100マイクロリットル(uL)からRNAを抽出した。抽出の間、分量が明らかな52個の合成miRNAを、各血漿試料に対するスパイクインとして添加した。
シーケンシングライブラリの構築
A.ライブラリ構築
無細胞核酸試料をライブラリ調製にかけ、次世代シーケンシングを行った。本明細書中で使用される次世代シーケンシング手法において、「ライブラリ調製」には、末端修復、A-テーリング、アダプタライゲーション、または、後のRNAのシーケンシングを可能にするために無細胞RNA上で行われるあらゆる他の調製が含まれる。いくつかの例では、調製された無細胞核酸ライブラリ配列は、無細胞核酸試料分子上にライゲートされるアダプタ、配列タグ、インデックスバーコードを伴う。次世代シーケンシングのためのライブラリ調製を容易にするために、様々な市販のキットが利用可能である。次世代シーケンシングライブラリの構築は、高スループットシーケンシングのために、まとまった一連の(coordinated series of)酵素反応を用いて核酸標的を調製して、特定のサイズのRNAフラグメントの寄せ集めを生成することを含む。新たなライブラリ調製技法の進歩と開発により、次世代シーケンシングの適用は、トランスクリプトミクスやエピジェネティクスなどの分野にまで拡大している。
A.ライブラリ構築
無細胞核酸試料をライブラリ調製にかけ、次世代シーケンシングを行った。本明細書中で使用される次世代シーケンシング手法において、「ライブラリ調製」には、末端修復、A-テーリング、アダプタライゲーション、または、後のRNAのシーケンシングを可能にするために無細胞RNA上で行われるあらゆる他の調製が含まれる。いくつかの例では、調製された無細胞核酸ライブラリ配列は、無細胞核酸試料分子上にライゲートされるアダプタ、配列タグ、インデックスバーコードを伴う。次世代シーケンシングのためのライブラリ調製を容易にするために、様々な市販のキットが利用可能である。次世代シーケンシングライブラリの構築は、高スループットシーケンシングのために、まとまった一連の(coordinated series of)酵素反応を用いて核酸標的を調製して、特定のサイズのRNAフラグメントの寄せ集めを生成することを含む。新たなライブラリ調製技法の進歩と開発により、次世代シーケンシングの適用は、トランスクリプトミクスやエピジェネティクスなどの分野にまで拡大している。
いくつかの実施形態では、ライブラリ調製キットは、Nextera Flex(Illumina)、IonAmpliseq(Thermo Fisher Scientific)、およびGenexus(Thermo Fisher Scientific)、Agilent ClearSeq(Agilent)、Agilent SureSelect Capture(Agilent)、RealSeq(Realseq Biosciences)、Archer FusionPlex(Illumina)、BiooScientific NEXTflex(Perkin Elmer)、IDT xGen(Illumina)、Illumina TruSight(Illumina)、SMARTer smRNA-Seq(Takara)、Nimblegene SeqCap(Illumina)、Qiaseq(Qiagen)、またはQiagen GeneRead(Qiagen)から選択される。
RealSeq(登録商標)(RealSeq Biosciences、旧Somagenics)は、次世代シーケンシング(NSG)における組み込みバイアスを大幅に低減する、小型のRNAシーケンシングライブラリを調製するための方法である。この技法により、よく用いられるシーケンシングライブラリ調製において、一部では10,000倍にもなる多くのmiRNAの検出不足が生じるという課題が解決する。大半のバイアスは、配列決定ライブラリの調製中にmiRNA/小RNAの3’および5’末端に2個のアダプタを取り付ける酵素ライゲーション反応における配列依存的な変動が原因である。新規な単一のアダプタと分子内ライゲーション(circularization)を用いることで、RealSeq(登録商標)はライブラリ調製のバイアスを大幅に低減する。
B.シーケンシング
シーケンシングライブラリを2ナノモル(nM)に希釈した。個体1名につき約10万回のリード深さにまでシーケンシングを行うために、試料をIllumina NextSeq機器の上に載せた。
シーケンシングライブラリを2ナノモル(nM)に希釈した。個体1名につき約10万回のリード深さにまでシーケンシングを行うために、試料をIllumina NextSeq機器の上に載せた。
C.RealSeq解析の概要
Trimmomatic、Skewer、SeqPurge、Atroposなどのトリミングソフトウェアを使用して配列リードをトリミングし、RealSeq特有のアダプタ、ならびに他のプライマーおよびアダプタを取り除いた。次いで、bowtie2アライメントソフトウェアを用いて、トリミングされたリードを、成熟miRNA配列、tRNA、rRNA、ミトコンドリアRNA、U snRNA、Y RNA、および合成スパイクイン配列で作製したカスタムトランスクリプトームへとアライメントした。samtools idxstatsを使用し、各特徴に対するマッピングのリード数を計数した。
Trimmomatic、Skewer、SeqPurge、Atroposなどのトリミングソフトウェアを使用して配列リードをトリミングし、RealSeq特有のアダプタ、ならびに他のプライマーおよびアダプタを取り除いた。次いで、bowtie2アライメントソフトウェアを用いて、トリミングされたリードを、成熟miRNA配列、tRNA、rRNA、ミトコンドリアRNA、U snRNA、Y RNA、および合成スパイクイン配列で作製したカスタムトランスクリプトームへとアライメントした。samtools idxstatsを使用し、各特徴に対するマッピングのリード数を計数した。
様々なデータ前処理工程を行い、解析のためにデータをさらに特色付けた。データの前処理は、欠損値の追加、情報の集計、カテゴリによるデータの標識化(データビニング)、および軌道の平滑化を目的とする。主成分分析や特徴選択のような、より高度な技法は統計式を用いて実行し、複雑なデータセットに適用した。
ヘアピン配列へのマッピングのリードが300,000未満の試料は、その後の解析から除外した。全試料にわたり数が25未満の特徴も除外した。比正規化平均(mean of ratios normalization)、M値、RUVseq、およびlog2CPMのトリミング平均を含む、いくつかの正規化戦略を比較した。比正規化平均法を使用し、データを正規化した。
カスタムスクリプトを使用して配列をトリミングし、miRNA配列からIlluminaアダプタを除外した。次いで、bowtieを用いてmiRNA配列を、(1)ヒトゲノム、(2)把握された成熟ヒトmiRNAをすべて含むカスタムトランスクリプトーム、および(3)ヘアピンmiRNA配列の第2のトランスクリプトームのほか、非ヒト由来の合成miRNA52個のリストにもマッピングした。マッピング位置から、miRNAヘアピンとmiRNAヘアピン両方の計数表を各個体から作製した。
これらの計数データセットを用いて、健康な個体と大腸癌または進行腺腫を患う個体との血漿間で差動的に豊富であるmiRNAを特定した。両方の計数マトリクスを、(1)M値のトリミング平均、(2)比の平均、および(3)RUVseqを含む複数の方法を用いて正規化した。これら3つの方法はそれぞれ、正規化因子を生成するために全RNAライブラリ上に加え、第2の正規化因子のセットを生成するために合成RNAスパイクイン上でも実行した。各方法から正規化した計数を別々に使用して、有意に異なる成熟miRNA、および健康な状態でのmiRNAヘアピン存在量を表す配列を特定するモデルを生成した。2つ以上の方法においてpが0.05未満であるヘアピンとmiRNAは強力に支持されていることを認め、CRCおよび/またはAAのマーカとして特定した。
分類モデルでは、第4の正規化法としてCombatを追加して、同じ正規化を両データセット(成熟miRNAとmiRNAヘアピン)に使用した。正規化した計数は、血漿の質、年齢、性別、および採取部位を含む把握された交絡因子に対しても調整した。得られた計数データセットから、k=8のk-bestモデルを構築した。それぞれデータを4つのフォールドに分割し、データの3つのフォールド上で訓練を行い、最後の4番目のフォールドで検査を行う500個の独立したシード上で、モデルを実行した。次いで、各モデルで特定した8つの特徴を、差動的に豊富なmiRNAとヘアピンのリストと比較した。
実施例2:大腸癌および進行腺腫の分類シグネチャの生成
評価された機械学習法には、場合により次元削減、続いて教師あり分類アルゴリズムを含む、一連の変換が含まれていた。
評価された機械学習法には、場合により次元削減、続いて教師あり分類アルゴリズムを含む、一連の変換が含まれていた。
分類モデルの評価における交差検証(CV)手順の目的は、モデルの構築に使用しなかった、以前に確認されなかった新たなデータに対するモデルのパフォーマンスを推定することである。目標は、データの異なるサブセット上でモデルを繰り返し訓練して、訓練中にモデルにより確認されないデータの提供されたサブセット上で検査することにより、近似値を提供することである。K分割交差検証の手順では、データセット全体をk個の群に分割する必要がある。k個の群(すなわちフォールド)それぞれにおいて、機械学習モデルを他のk-1個のフォールドを用いて訓練し、提供されたフォールドを検査セットとして使用する。層別化したk分割交差検証により、試料のおおよその割合がフォールド全体でほぼ等価となるように、フォールドへの分割前に試料が分類ごとに層別化される。
多くのモデルをk分割交差検証(k=5)で訓練し、続いて最良の実行モデルを、追加の交差検証手順で評価した。上位10個の特徴を、交差検証中にANOVA F-統計に基づき選択した。ロジスティック回帰を使用して試料を分類した。100個の異なる乱数シードを使用してデータをフォールドに分割したため、計500個のモデルを実行した(100個のシード、シード1個につき5個のフォールド)。
特徴選択中にmiRNAを選択した。シードのカラム数は、実行された500個のモデルに対する特徴選択中にmiRNAが取り上げられた回数を示す。hsa-mir-889において数が多い、例えば499の場合、このmiRNAが500個のモデルのうち499において選択されたことが認められる。
先ず、外れ値(全訓練試料においてその特徴の99パーセンタイルを上回った所与の試料の特徴値として定めた値)を、99パーセンタイルの値に代入した。続いて、平均を減算し、標準偏差で除算することにより、各特徴を全訓練試料に対して標準化した。訓練セットの平均と標準偏差を用いての同じ外れ値の置換を使用して、検査セットを標準化した。次元削減変換法を選択した場合、これを訓練セット上で訓練して、訓練セットと検査セット両方の試料すべてに適用した。本試験で使用した次元低減変換は、打ち切り特異値分解(SVD)と主成分分析(PCA)であった。
候補となる2つの分類アルゴリズム、すなわちロジスティック回帰とサポート・ベクター・マシン(SVM)を、変換入力上で訓練した。訓練データから無作為に選択した20%を含む検証セットを有するフォールドごとに100回の反復の無作為検索を使用して、各方法について複数のハイパーパラメータを検討した。最良の実行検証に相当するハイパーパラメータを選択して機械学習モデルを訓練し、検査フォールドを評価した。ロジスティック回帰には2つのハイパーパラメータとして、正則化強度の逆数と、L1またはL2ペナルティのいずれか選択があった。表13は、k分割交差検証において大腸癌を患う個体に関連付けられると特定された無細胞核酸試料中のmiRNAの集団を、ロジスティック回帰モデルに対する関連平均係数値(例えば、miRNAが選択されたシードの数の平均)とともに示す。
合計で、138個のmiRNAが大腸癌に関連することが分かった。健康な個体と大腸癌を患う個体とを判別するために、特定されたmiRNAをすべて分類モデルに含める必要はなかった。このため、一部の領域は、全体として評価された様々な種類の癌を示すと考えられる。他のmiRNAは、大腸癌のサブグループにおいてより頻繁である。本アッセイと、検査した癌の種類の状況から、特定のmiRNAは、CVにおいてより高い頻度で「大腸癌に特異的に関連する」と説明され、試料配列を予測モデルで訓練したときにシグネチャにより大きな加重を運び得る。大腸癌に関連するこれらの高い頻度のmiRNAは、健康な人とCRCとの間で個体集団を区別するように訓練された特定のモデルに使用する。図2は、特徴選択中に選択されるmiRNAを示すヒストグラムを提供する図である。バーは、miRNAが選択されたモデルの数(最大=500)を表す。図3は、頻繁に選択された上位10個のmiRNAのロジスティック回帰計数を示すグラフを提供する図である。
本発明の好ましい実施形態が本明細書中で示され、記述されているが、かかる実施形態はほんの一例として提供されることは当業者に明白であろう。本発明は本明細書内で提供される特定の例により限定されることは意図されていない。本発明は前述の明細書を参照して説明されているが、本明細書中の実施形態の記載と例示は、限定的な意味で解釈されるようには意図されていない。多数の変形、変更、および置換えが、本発明から逸脱することなく当業者によりなされるであろう。さらに、本発明の態様はすべて、様々な条件と変数に依存する、本明細書に明記する特定の描写、構成、または相対的比率に限定されないことを理解されたい。本明細書に記載の本発明の実施形態に対する様々な代替物が、本発明の実施に利用されてよいことを理解されたい。そのため、本発明は、あらゆるこのような代替物、修正、変形、または等価物も包含することが企図される。以下の特許請求の範囲は本発明の範囲を規定し、これら特許請求の範囲およびその等価物内にある方法と構造はそれにより包含されることが意図される。
Claims (57)
- 結腸細胞増殖性障害の特徴を示すマイクロリボ核酸(miRNA)シグネチャパネルであって、
表1~表11に列挙される群から選択される1つもしくは複数、2つ以上、3つ以上、または4つ以上のmiRNAからなる所定のセットであって、前記結腸細胞増殖性障害またはその亜型を患う対象から得た生体試料と、前記結腸細胞増殖性障害またはその亜型を患っていない対象から得た生体試料との間で差動的に発現されるセット
を含むmiRNAシグネチャパネル。 - 進行型腺腫の特徴を示すとともに、a)hsa-miR-1273a、hsa-miR-17-5p、hsa-miR-20a-3p、hsa-miR-20b-5p、b)hsa-miR-3065-5p、hsa-miR-4785、hsa-miR-5096、hsa-miR-5189-5p、またはc)hsa-miR-545-3p、hsa-miR-570-3p、hsa-miR-624-3p、hsa-mir-1181、hsa-mir-6073を含むmiRNAからなる所定のセットを含んでおり、前記miRNAが、進行型腺腫またはその亜型を患う対象から得た生体試料と、進行型腺腫またはその亜型を患っていない対象から得た生体試料との間で差動的に発現される、請求項1に記載のmiRNAシグネチャパネル。
- 大腸癌の特徴を示すとともに、a)hsa-miR-1250-5p、hsa-miR-1255a、hsa-miR-223-3p、hsa-miR-338-3p、hsa-miR-338-5p、b)hsa-miR-424-5p、hsa-miR-424-3p、hsa-miR-450a-5p、hsa-miR-450b-5p、hsa-miR-4772-3p、c)hsa-miR-4772-5p、hsa-miR-625-5p、hsa-miR-7847-3p、hsa-miR-1181、hsa-miR-3651、hsa-mir-6073、d)hsa-mir-6125、hsa-mir-7704、hsa-miR-19b-3p、hsa-miR-19a-3p、hsa-miR-3157-5p、e)hsa-miR-142-3p、hsa-miR-30c-5p、hsa-miR-6741-5p、hsa-miR-590-3p、hsa-miR-4685-5p、f)hsa-miR-3648、hsa-miR-331-3p、hsa-miR-1303、hsa-miR-6790-3p、hsa-miR-6867-5p、hsa-miR-942-5p、g)hsa-miR-378a-3p、hsa-miR-1287-5p、hsa-mir-4785、hsa-miR-324-3p、hsa-miR-550b-2-5p、h)hsa-miR-200c-3p、hsa-miR-200b-3p、hsa-miR-3679-5p、hsa-miR-550a-3-5p、hsa-miR-3187-3p、i)hsa-miR-181b-5p、hsa-miR-3138、hsa-miR-146a-5p、hsa-miR-6721-5p、hsa-miR-23b-3p、hsa-miR-28-5p、j)hsa-miR-320d、hsa-miR-940、hsa-miR-320d-1、hsa-miR-10a-5p、hsa-miR-340-5p、k)hsa-miR-320b、hsa-miR-335-5p、hsa-miR-320c、hsa-miR-501-3p、hsa-miR-548n、またはl)hsa-miR-27a-3p、hsa-miR-3065-3p、hsa-miR-548aa@、hsa-miR-584-3p、hsa-miR-22-3pを含むmiRNAからなる所定のセットを含んでおり、前記miRNAが、大腸癌またはその亜型を患う対象から得た生体試料と、大腸癌またはその亜型を患っていない対象から得た生体試料との間で差動的に発現される、請求項1に記載のmiRNAシグネチャパネル。
- miRNAからなる前記所定のセットが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項1に記載のmiRNAシグネチャパネル。
- 前記生体試料が、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される、請求項1に記載のmiRNAシグネチャパネル。
- 前記生体試料が、核酸、DNA、RNA、または無細胞核酸(cfDNAもしくはcfRNA)を含む、請求項1に記載のmiRNAシグネチャパネル。
- 前記miRNAが、成熟miRNAおよびmiRNAヘアピンを含む、請求項1に記載のmiRNAシグネチャパネル。
- 表1~表11に列挙される群から選択される6つ以上、または12以上のmiRNAにおける差動的発現を含む、請求項1に記載のmiRNAシグネチャパネル。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項1に記載のmiRNAシグネチャパネル。
- 前記結腸細胞増殖性障害が、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される、請求項1に記載のmiRNAシグネチャパネル。
- 健康な対象集団と、結腸細胞増殖性障害を患う対象とを判別可能な分類器であって、
a)前記分類器は、表1~表11に列挙される群から選択される6つ以上または12以上の予め選択したmiRNAにおける差動的miRNA発現を表す測定値のセットを含み、該測定値は、健康な対象と結腸細胞増殖性障害を患う対象から得たmiRNA発現データから取得され、
b)前記測定値は、前記差動的miRNA発現の特性に相当する一組の特徴を生成するために使用され、該一組の特徴は、機械学習モデルを使用してコンピュータにより処理され、
c)前記機械学習モデルは、健康な対象集団と、結腸細胞増殖性障害を患う対象とを判別可能な分類器として有用な特徴ベクトルを提供する、分類器。 - 前記予め選択したmiRNAが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項11に記載の分類器。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項11に記載の分類器。
- 前記測定値のセットが、異なる数を有するフラグメントの観察の数または割合、生のmiRNA存在量、ハウスキーピング遺伝子へと正規化されるmiRNA存在量、合成配列へと正規化されるmiRNA存在量、対数正規化されたmiRNA存在量、フラグメント長、フラグメント中点、成熟miRNAまたはmiRNAヘアピンに沿ったリードマッピング位置およびリードパイルアップ、ならびにmiRNAクラスタの存在量からなる群から選択される差動的miRNA発現の特徴を記述する、請求項11に記載の分類器。
- 前記機械学習モデルが、訓練生体試料、結腸細胞増殖性障害を患う対象に相当すると特定される前記訓練生体試料の第1のサブセット、および結腸細胞増殖性障害を患っていない対象に相当すると特定される前記訓練生体試料の第2のサブセットから取得した訓練データを用いて訓練される、請求項11に記載の分類器。
- a)miRNAシグネチャパネルに基づき前記対象を分類するのに操作可能な分類器を含むコンピュータ可読媒体と、
b)前記コンピュータ可読記憶媒体に記憶される命令を実行するための1または複数のプロセッサと
を含む、結腸細胞増殖性障害を検出するためのシステムに設けられる、請求項11に記載の分類器。 - 前記システムが、深層学習分類器、ニューラルネットワーク分類器、線形判別分析(LDA)分類器、二次判別分析(QDA)分類器、サポート・ベクター・マシン(SVM)分類器、ランダムフォレスト(RF)分類器、線形カーネル・サポート・ベクター・マシン分類器、一次または二次多項式カーネル・サポート・ベクター・マシン分類器、リッジ回帰分類器、弾性ネットアルゴリズム分類器、逐次最小問題最適化アルゴリズム分類器、単純ベイズアルゴリズム分類器、および主成分分析分類器からなる群から選択される機械学習分類器として構成される分類回路を含む、請求項16に記載の分類器。
- 対象から得た生体試料のマイクロリボ核酸(miRNA)プロファイルを決定するための方法であって、
a)前記生体試料からRNA分子を単離する工程と、
b)前記RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する前または後にRNAアダプタを前記RNA分子にライゲートする工程と、
c)前記cDNA分子を増幅する工程と、
d)前記cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて前記核酸配列を参照核酸配列にアライメントする工程と、
f)アライメントされた前記核酸配列に少なくとも部分的に基づき前記対象のmiRNAプロファイルを決定する工程と
を含む方法。 - 予め選択したmiRNAが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項18に記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項18に記載の方法。
- RNA分子またはcDNA分子を富化または枯渇させる工程をさらに含む、請求項18に記載の方法。
- 前記参照核酸配列が、ゲノム、トランスクリプトーム、またはカスタムトランスクリプトームの参照核酸配列を含む、請求項18に記載の方法。
- 増幅前にmiRNAライブラリを調製する工程をさらに含む、請求項18に記載の方法。
- 前記RNAアダプタをライゲートする工程が、アダプタブロッキング、アダプタ環状化、および二量体除去を実行することを含む、請求項18に記載の方法。
- 前記RNAアダプタをライゲートする工程が、3’RNAアダプタライゲーション、5’RNAアダプタライゲーション、固有分子識別子(UMI)割付けによる逆転写、およびcDNAクリーンアップを実行することを含む、請求項18に記載の方法。
- 対象から得た生体試料のマイクロリボ核酸(miRNA)プロファイルを決定するための方法であって、1)前記生体試料からのRNA分子の抽出後、直接RNAを計数すること、2)前記生体試料からのRNA分子の抽出後、Aテーリングを行い、次いで鋳型スイッチングによりcDNAへと逆転写(RT)すること、3)前記生体試料からのRNA分子の抽出後、Aテーリングを行い、次いで逆転写ポリメラーゼ連鎖反応(RT-PCR)と量的PCR(qPCR)またはデジタルドロップレットPCR(ddPCR)を行うこと、4)前記生体試料からのRNA分子の抽出後、配列特異的ライゲーションを行い、次いでRT-PCRとqPCRまたはddPCRを行うこと、ならびに5)RNA単離を実行しない条件下で前記生体試料から得たRNA分子の抽出不要miRNAプロファイリングを行うことのうち、1または複数を行う工程と、前記対象から得た前記生体試料のmiRNAプロファイルを決定する工程と含む方法。
- 前記miRNAプロファイルを決定する工程が、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である参照核酸配列の使用を含む、請求項26に記載の方法。
- 前記miRNAプロファイルを決定する工程が、発現されたmiRNAのカウントテーブルを生成することを含む、請求項26に記載の方法。
- 前記miRNAプロファイルを決定する工程が、発現されたmiRNAに基づき正規化されたカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む、請求項26に記載の方法。
- 前記miRNAプロファイルが、結腸細胞増殖性障害と関連付けられ、かつ、結腸細胞増殖性障害がある、または結腸細胞増殖性障害を患っていないとの対象の分類を提供する、請求項26に記載の方法。
- 前記対象から得た生体試料が、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される、請求項26に記載の方法。
- 前記miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、前記miRNAプロファイルのmiRNA発現が前記参照miRNAプロファイルと比して少なくとも15%変化することの測定に少なくとも部分的に基づき、前記対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む、請求項26に記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項26に記載の方法。
- 前記結腸細胞増殖性障害が、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される、請求項26に記載の方法。
- 前記進行型腺腫が、管状腺腫、尿細管腺腫、絨毛腺腫、腺癌、または過形成ポリープを含む、請求項26に記載の方法。
- 対象における結腸細胞増殖性障害の有無を検出するための方法であって、
a)前記生体試料からリボ核酸(RNA)分子を単離する工程と、
b)前記RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する前または後にRNAアダプタを前記RNA分子にライゲートする工程と、
c)前記cDNA分子を増幅する工程と、
d)前記cDNA分子の核酸配列を決定する工程と、
e)表1~表11に列挙される群から選択されるmiRNAの予め特定されたパネルにおいて前記核酸配列を参照核酸配列にアライメントする工程と、
f)アライメントされた前記核酸配列に少なくとも部分的に基づきmiRNAプロファイルを決定する工程と、
g)健康な対象と結腸細胞増殖性障害を患う対象とを判別可能となるよう訓練された機械学習モデルを用いて前記miRNAプロファイルをコンピュータにより処理することで、結腸細胞増殖性障害の有無に関連する出力値を提供し、それにより前記対象における結腸細胞増殖性障害の有無を示す工程と
を含む方法。 - bが、試料特異的バーコードおよび/または分子特異的固有分子識別子(UMI)を組み入れることを含む、請求項36に記載の方法。
- 予め選択したmiRNAが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項36に記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項36に記載の方法。
- 前記参照核酸配列が、ヒトゲノムまたはヒトトランスクリプトームのデータベースの一部である、請求項36に記載の方法。
- 前記対象のmiRNAプロファイルを決定する工程が、発現されたmiRNAのカウントテーブルを生成することを含む、請求項36に記載の方法。
- 前記対象のmiRNAプロファイルを決定する工程が、発現されたmiRNAのカウントテーブルを生成することで、差動的に豊富なmiRNAを特定することを含む、請求項36に記載の方法。
- 前記対象から得た前記生体試料が、体液、便、結腸流出液、尿、血漿、血清、全血、単離した血液細胞、血液から単離した細胞、およびそれらの組合せからなる群から選択される、請求項36に記載の方法。
- 前記miRNAプロファイルを健康な対象から得た参照miRNAプロファイルのデータベースと比較する工程と、前記miRNAプロファイルのmiRNA発現が参照miRNAプロファイルと比して少なくとも15%変化することの測定に少なくとも部分的に基づき、前記対象が結腸細胞増殖性障害を患うリスクは増加すると決定する工程とをさらに含む、請求項36に記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項36に記載の方法。
- 前記結腸細胞増殖性障害が、ステージ1大腸癌、ステージ2大腸癌、ステージ3大腸癌、およびステージ4大腸癌からなる群から選択される、請求項36に記載の方法。
- 検出された前記結腸細胞増殖性障害に基づき前記対象に処置を施す工程をさらに含む、請求項36に記載の方法。
- 対象から得た生体試料のmiRNAプロファイルを決定するための方法であって、
a)前記生体試料からリボ核酸(RNA)分子を単離する工程と、
b)前記RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する工程と、
c)RNAアダプタを前記RNA分子または前記cDNA分子にライゲートする工程と、
d)前記cDNA分子を増幅する工程と、
e)前記cDNA分子の核酸配列を決定する工程と、
f)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて前記核酸配列を参照核酸配列にアライメントする工程と、
g)アライメントされた前記核酸配列に少なくとも部分的に基づき前記miRNAプロファイルを決定する工程と
を含む方法。 - 予め選択した前記miRNAが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項48に記載の方法。
- 対象における結腸細胞増殖性障害の有無を検出するための方法であって、
a)前記生体試料からリボ核酸(RNA)分子を単離する工程と、
b)前記RNA分子を相補的デオキシリボ核酸(cDNA)分子に逆転写する工程と、
c)RNAアダプタを前記RNA分子または前記cDNA分子にライゲートする工程と、
d)前記cDNA分子を増幅する工程と、
e)前記cDNA分子の核酸配列を決定する工程と、
f)表1~表11に列挙される群から選択されるmiRNAのパネルにおいて前記核酸配列を参照核酸配列にアライメントする工程と、
g)アライメントされた前記核酸配列に少なくとも部分的に基づきmiRNAプロファイルを決定する工程と、
h)前記結腸細胞増殖性障害を患っていない対象と前記結腸細胞増殖性障害を患う対象とを判別するよう訓練された機械学習モデルを用いて前記miRNAプロファイルをコンピュータにより処理する工程と、
i)前記機械学習モデルにより、前記結腸細胞増殖性障害を患う対象または前記結腸細胞増殖性障害を患う対象に関連する値を出力することで、前記対象における結腸細胞増殖性障害の有無を検出する工程と
を含む方法。 - 予め選択した前記miRNAが、表1~表11に列挙される群から選択される少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、少なくとも170、少なくとも180、少なくとも190、少なくとも200、または少なくとも250のmiRNAを含む、請求項50に記載の方法。
- 前記結腸細胞増殖性障害が、腺腫(腺腫性ポリープ)、固着性鋸歯状腺腫(SSA)、進行型腺腫、大腸異形成、大腸腺腫、大腸癌、結腸癌、直腸癌、大腸癌腫、大腸腺癌、カルチノイド腫瘍、胃腸カルチノイド腫瘍、胃腸間質腫瘍(GIST)、リンパ腫、および肉腫からなる群から選択される、請求項50に記載の方法。
- 検出された前記結腸細胞増殖性障害に基づき前記対象に処置を施す工程をさらに含む、請求項50に記載の方法。
- 以前に疾患の処置を受けた対象における最小残存病変をモニタリングするための方法であって、表1~表11に列挙される群から選択されるマイクロリボ核酸(miRNA)のパネルを用いて前記対象から得た生体試料のmiRNAプロファイルを決定することで、ベースラインのmiRNA状態を生成する工程と、前記ベースラインのmiRNA状態の生成後に前記対象から得た生体試料のmiRNAプロファイルを1または複数の時点で決定することで、現在のmiRNA状態を生成する工程と、前記ベースラインのmiRNA状態と前記現在のmiRNA状態との差異を決定することで、前記対象における前記最小残存病変の変化を検出する工程とを含む方法。
- 前記最小残存病変が、処置への応答、腫瘍細胞量、術後残存腫瘍、再発、二次スクリーン、一次スクリーン、および癌の進展からなる群から選択される、請求項54に記載の方法。
- 前記miRNAプロファイルが、少なくとも約40%の感度で前記対象における大腸癌の存在または感受性を示す、請求項54に記載の方法。
- 前記対象における前記最小残存病変に対し検出された前記変化に基づき、前記対象に処置を施す工程をさらに含む、請求項54に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063017552P | 2020-04-29 | 2020-04-29 | |
US63/017,552 | 2020-04-29 | ||
US202063024875P | 2020-05-14 | 2020-05-14 | |
US63/024,875 | 2020-05-14 | ||
PCT/US2021/029361 WO2021222220A2 (en) | 2020-04-29 | 2021-04-27 | Rna markers and methods for identifying colon cell proliferative disorders |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023524016A true JP2023524016A (ja) | 2023-06-08 |
JPWO2021222220A5 JPWO2021222220A5 (ja) | 2024-05-10 |
Family
ID=78332157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022565960A Pending JP2023524016A (ja) | 2020-04-29 | 2021-04-27 | 結腸細胞増殖性障害を特定するためのrnaマーカと方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230160019A1 (ja) |
EP (1) | EP4143309A2 (ja) |
JP (1) | JP2023524016A (ja) |
KR (1) | KR20230017206A (ja) |
CN (1) | CN115812101A (ja) |
AU (1) | AU2021263680A1 (ja) |
CA (1) | CA3181389A1 (ja) |
WO (1) | WO2021222220A2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
WO2023225560A1 (en) | 2022-05-17 | 2023-11-23 | Guardant Health, Inc. | Methods for identifying druggable targets and treating cancer |
WO2024009221A1 (en) * | 2022-07-04 | 2024-01-11 | Artificial Intelligence Expert Srl | Method and system for multi-cancer management in subject |
CN118048450A (zh) * | 2022-11-15 | 2024-05-17 | 杭州诺辉健康科技有限公司 | 使用miRNA亚型的家族占比检测癌症 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100010196A1 (en) * | 1997-09-26 | 2010-01-14 | Abt Holding Company | Compositions and methods for non-targeted activation of endogenous genes |
US20040018973A1 (en) * | 2002-01-25 | 2004-01-29 | University Of Pittsburgh | Nuclear matrix protein alterations associated with colon cancer and colon metastasis to the liver, and uses thereof |
EP1974058B1 (en) * | 2006-01-11 | 2014-06-11 | Genomic Health, Inc. | Gene expression markers for colorectal cancer prognosis |
US20130137593A1 (en) * | 2010-04-15 | 2013-05-30 | Hadasit Medical Research Services And Development Ltd. | Early detection and staging of colorectal cancer using a panel of micro rnas |
WO2016131030A1 (en) * | 2015-02-13 | 2016-08-18 | Patel Abhijit Ajit | Methods for highly parallel and accurate measurement of nucleic acids |
US10889862B2 (en) * | 2017-01-23 | 2021-01-12 | Srnalytics, Llc. | Methods for identifying and using small RNA predictors |
KR20200143462A (ko) * | 2018-04-13 | 2020-12-23 | 프리놈 홀딩스, 인크. | 생물학적 샘플의 다중 분석물 검정을 위한 기계 학습 구현 |
-
2021
- 2021-04-27 KR KR1020227041793A patent/KR20230017206A/ko active Search and Examination
- 2021-04-27 AU AU2021263680A patent/AU2021263680A1/en active Pending
- 2021-04-27 CN CN202180046619.4A patent/CN115812101A/zh active Pending
- 2021-04-27 JP JP2022565960A patent/JP2023524016A/ja active Pending
- 2021-04-27 WO PCT/US2021/029361 patent/WO2021222220A2/en unknown
- 2021-04-27 CA CA3181389A patent/CA3181389A1/en active Pending
- 2021-04-27 EP EP21796511.0A patent/EP4143309A2/en active Pending
-
2022
- 2022-10-26 US US18/049,785 patent/US20230160019A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115812101A (zh) | 2023-03-17 |
KR20230017206A (ko) | 2023-02-03 |
WO2021222220A3 (en) | 2021-12-09 |
WO2021222220A2 (en) | 2021-11-04 |
AU2021263680A1 (en) | 2022-11-24 |
CA3181389A1 (en) | 2021-11-04 |
EP4143309A2 (en) | 2023-03-08 |
US20230160019A1 (en) | 2023-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7368483B2 (ja) | 相同組換え欠損を推定するための統合された機械学習フレームワーク | |
US20210057046A1 (en) | Methods and systems for analyzing microbiota | |
US20230101485A1 (en) | Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis | |
JP2021521536A (ja) | 生体試料の多検体アッセイのための機械学習実装 | |
US20230160019A1 (en) | Rna markers and methods for identifying colon cell proliferative disorders | |
US20150080243A1 (en) | Methods and compositions for detecting cancer based on mirna expression profiles | |
KR20220133868A (ko) | 패치 컨볼루션 신경망을 사용한 암 분류 | |
US20230178181A1 (en) | Methods and systems for detecting cancer via nucleic acid methylation analysis | |
US20230175058A1 (en) | Methods and systems for abnormality detection in the patterns of nucleic acids | |
US20220275455A1 (en) | Data processing and classification for determining a likelihood score for breast disease | |
US20180371553A1 (en) | Methods and compositions for the analysis of cancer biomarkers | |
US20220213558A1 (en) | Methods and systems for urine-based detection of urologic conditions | |
EP3810807A1 (en) | Methods and compositions for the analysis of cancer biomarkers | |
Saha et al. | DeMoS: Dense Module based Gene Signature Detection through Quasi-Clique: An Application to Cervical Cancer Prognosis | |
WO2023183468A2 (en) | Tcr/bcr profiling for cell-free nucleic acid detection of cancer | |
WO2024155681A1 (en) | Methods and systems for detecting and assessing liver conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240426 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240426 |