CN105779434A - 试剂盒及其用途 - Google Patents
试剂盒及其用途 Download PDFInfo
- Publication number
- CN105779434A CN105779434A CN201410778723.4A CN201410778723A CN105779434A CN 105779434 A CN105779434 A CN 105779434A CN 201410778723 A CN201410778723 A CN 201410778723A CN 105779434 A CN105779434 A CN 105779434A
- Authority
- CN
- China
- Prior art keywords
- cancer
- reference sequence
- optionally
- subunit
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000523 sample Substances 0.000 claims abstract description 146
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 137
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 92
- 238000012163 sequencing technique Methods 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000001514 detection method Methods 0.000 claims abstract description 33
- 238000012216 screening Methods 0.000 claims abstract description 32
- 201000011510 cancer Diseases 0.000 claims abstract description 27
- 239000000758 substrate Substances 0.000 claims abstract description 3
- 230000035772 mutation Effects 0.000 claims description 95
- 239000012634 fragment Substances 0.000 claims description 47
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 22
- 201000005202 lung cancer Diseases 0.000 claims description 22
- 208000020816 lung neoplasm Diseases 0.000 claims description 22
- 150000007523 nucleic acids Chemical class 0.000 claims description 18
- 206010009944 Colon cancer Diseases 0.000 claims description 17
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 16
- 239000013642 negative control Substances 0.000 claims description 16
- 230000003321 amplification Effects 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 15
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 12
- 108020004707 nucleic acids Proteins 0.000 claims description 12
- 206010033128 Ovarian cancer Diseases 0.000 claims description 11
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 11
- 239000013641 positive control Substances 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 201000007270 liver cancer Diseases 0.000 claims description 8
- 208000014018 liver neoplasm Diseases 0.000 claims description 8
- 206010006187 Breast cancer Diseases 0.000 claims description 7
- 208000026310 Breast neoplasm Diseases 0.000 claims description 7
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 7
- 206010014733 Endometrial cancer Diseases 0.000 claims description 7
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 7
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 7
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 7
- 208000024770 Thyroid neoplasm Diseases 0.000 claims description 7
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 7
- 201000010881 cervical cancer Diseases 0.000 claims description 7
- 206010017758 gastric cancer Diseases 0.000 claims description 7
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 7
- 201000002528 pancreatic cancer Diseases 0.000 claims description 7
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 7
- 201000011549 stomach cancer Diseases 0.000 claims description 7
- 201000002510 thyroid cancer Diseases 0.000 claims description 7
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 6
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 6
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 6
- 206010038389 Renal cancer Diseases 0.000 claims description 6
- 239000013068 control sample Substances 0.000 claims description 6
- 201000004101 esophageal cancer Diseases 0.000 claims description 6
- 201000010982 kidney cancer Diseases 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 18
- 238000004458 analytical method Methods 0.000 abstract description 16
- 239000007790 solid phase Substances 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 38
- 230000006870 function Effects 0.000 description 15
- 238000011161 development Methods 0.000 description 13
- 230000018109 developmental process Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 210000002381 plasma Anatomy 0.000 description 13
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 229940079593 drug Drugs 0.000 description 11
- 239000003814 drug Substances 0.000 description 11
- 210000005259 peripheral blood Anatomy 0.000 description 11
- 239000011886 peripheral blood Substances 0.000 description 11
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 10
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 229940044683 chemotherapy drug Drugs 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 9
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 9
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 9
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 9
- 230000002980 postoperative effect Effects 0.000 description 9
- 102100030708 GTPase KRas Human genes 0.000 description 8
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 239000002246 antineoplastic agent Substances 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 238000013399 early diagnosis Methods 0.000 description 7
- 210000005000 reproductive tract Anatomy 0.000 description 7
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 6
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 108010038272 MutS Proteins Proteins 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 238000002512 chemotherapy Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 229940121647 egfr inhibitor Drugs 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 230000036438 mutation frequency Effects 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000008093 supporting effect Effects 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 230000034994 death Effects 0.000 description 4
- 231100000517 death Toxicity 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003211 malignant effect Effects 0.000 description 4
- 238000004393 prognosis Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 239000000439 tumor marker Substances 0.000 description 4
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 3
- 102100039788 GTPase NRas Human genes 0.000 description 3
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 3
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 3
- 108091054455 MAP kinase family Proteins 0.000 description 3
- 102000043136 MAP kinase family Human genes 0.000 description 3
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 3
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 3
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 3
- 101150080074 TP53 gene Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 230000006907 apoptotic process Effects 0.000 description 3
- 101150048834 braF gene Proteins 0.000 description 3
- 230000024245 cell differentiation Effects 0.000 description 3
- 238000003759 clinical diagnosis Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000002651 drug therapy Methods 0.000 description 3
- 239000000833 heterodimer Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108700025694 p53 Genes Proteins 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 102200006539 rs121913529 Human genes 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 102000010400 1-phosphatidylinositol-3-kinase activity proteins Human genes 0.000 description 2
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 2
- 102000000872 ATM Human genes 0.000 description 2
- 102100028914 Catenin beta-1 Human genes 0.000 description 2
- 101000577520 Chlamydomonas reinhardtii Photosystem I reaction center subunit III, chloroplastic Proteins 0.000 description 2
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 2
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 101150016325 EPHA3 gene Proteins 0.000 description 2
- 101150039808 Egfr gene Proteins 0.000 description 2
- 101150025643 Epha5 gene Proteins 0.000 description 2
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 description 2
- 102100021605 Ephrin type-A receptor 5 Human genes 0.000 description 2
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 2
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 2
- 102100031510 Fibrillin-2 Human genes 0.000 description 2
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 2
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 2
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 2
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 2
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 2
- 102100029974 GTPase HRas Human genes 0.000 description 2
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 2
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 2
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 2
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 2
- 101000846890 Homo sapiens Fibrillin-2 Proteins 0.000 description 2
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 2
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 2
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 2
- 101000606537 Homo sapiens Receptor-type tyrosine-protein phosphatase delta Proteins 0.000 description 2
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 2
- 229910015837 MSH2 Inorganic materials 0.000 description 2
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 2
- 102000007530 Neurofibromin 1 Human genes 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 2
- 108091007960 PI3Ks Proteins 0.000 description 2
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 2
- 206010056342 Pulmonary mass Diseases 0.000 description 2
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 2
- 102100039666 Receptor-type tyrosine-protein phosphatase delta Human genes 0.000 description 2
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 2
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 2
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 2
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 230000035578 autophosphorylation Effects 0.000 description 2
- 102220353348 c.1478G>A Human genes 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 230000007783 downstream signaling Effects 0.000 description 2
- 230000001819 effect on gene Effects 0.000 description 2
- 108700021358 erbB-1 Genes Proteins 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 210000002429 large intestine Anatomy 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 230000033607 mismatch repair Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000001959 radiotherapy Methods 0.000 description 2
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 2
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 2
- 102220036459 rs146382972 Human genes 0.000 description 2
- 102220011695 rs200827913 Human genes 0.000 description 2
- 102220060092 rs201719927 Human genes 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 102100040077 A-kinase anchor protein 6 Human genes 0.000 description 1
- 102100040084 A-kinase anchor protein 9 Human genes 0.000 description 1
- 102100024387 AF4/FMR2 family member 3 Human genes 0.000 description 1
- 102100025339 ATP-dependent DNA helicase DDX11 Human genes 0.000 description 1
- 102100030088 ATP-dependent RNA helicase A Human genes 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 102000052567 Anaphase-Promoting Complex-Cyclosome Apc1 Subunit Human genes 0.000 description 1
- 108700004581 Anaphase-Promoting Complex-Cyclosome Apc1 Subunit Proteins 0.000 description 1
- 102000007372 Ataxin-1 Human genes 0.000 description 1
- 108010032963 Ataxin-1 Proteins 0.000 description 1
- 102000007371 Ataxin-3 Human genes 0.000 description 1
- 108010032947 Ataxin-3 Proteins 0.000 description 1
- 102100035682 Axin-1 Human genes 0.000 description 1
- 102100021247 BCL-6 corepressor Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 102100023054 Band 4.1-like protein 4A Human genes 0.000 description 1
- 102100033943 Basic salivary proline-rich protein 2 Human genes 0.000 description 1
- 102100028164 Bestrophin-3 Human genes 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100025401 Breast cancer type 1 susceptibility protein Human genes 0.000 description 1
- 102100028737 CAP-Gly domain-containing linker protein 1 Human genes 0.000 description 1
- 102100021975 CREB-binding protein Human genes 0.000 description 1
- 102100040807 CUB and sushi domain-containing protein 3 Human genes 0.000 description 1
- 102100024158 Cadherin-10 Human genes 0.000 description 1
- 102100024156 Cadherin-12 Human genes 0.000 description 1
- 102100040751 Casein kinase II subunit alpha Human genes 0.000 description 1
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 102100024343 Contactin-5 Human genes 0.000 description 1
- 102100040499 Contactin-associated protein-like 2 Human genes 0.000 description 1
- 102100022053 Contactin-associated protein-like 3B Human genes 0.000 description 1
- 102100038111 Cyclin-dependent kinase 12 Human genes 0.000 description 1
- 102100033270 Cyclin-dependent kinase inhibitor 1 Human genes 0.000 description 1
- 102100025178 DDB1- and CUL4-associated factor 4-like protein 2 Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 230000005971 DNA damage repair Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102100031817 Delta-type opioid receptor Human genes 0.000 description 1
- 102100029792 Dentin sialophosphoprotein Human genes 0.000 description 1
- 108010086291 Deubiquitinating Enzyme CYLD Proteins 0.000 description 1
- 102100028360 Diphosphoinositol polyphosphate phosphohydrolase 3-beta Human genes 0.000 description 1
- 102100022820 Disintegrin and metalloproteinase domain-containing protein 28 Human genes 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 101710146526 Dual specificity mitogen-activated protein kinase kinase 1 Proteins 0.000 description 1
- 208000006402 Ductal Carcinoma Diseases 0.000 description 1
- 102100031637 Dynein axonemal heavy chain 8 Human genes 0.000 description 1
- 102100027418 E3 ubiquitin-protein ligase RNF213 Human genes 0.000 description 1
- 102100026245 E3 ubiquitin-protein ligase RNF43 Human genes 0.000 description 1
- 102100040465 Elongation factor 1-beta Human genes 0.000 description 1
- 101100379079 Emericella variicolor andA gene Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 208000009849 Female Genital Neoplasms Diseases 0.000 description 1
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 1
- 102100027844 Fibroblast growth factor receptor 4 Human genes 0.000 description 1
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 1
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 1
- 102100037740 GRB2-associated-binding protein 1 Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108090000369 Glutamate Carboxypeptidase II Proteins 0.000 description 1
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 1
- 102100032191 Guanine nucleotide exchange factor VAV3 Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100023954 Guanine nucleotide-binding protein subunit alpha-15 Human genes 0.000 description 1
- 102100031561 Hamartin Human genes 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 1
- 102100027755 Histone-lysine N-methyltransferase 2C Human genes 0.000 description 1
- 102100027768 Histone-lysine N-methyltransferase 2D Human genes 0.000 description 1
- 102100029239 Histone-lysine N-methyltransferase, H3 lysine-36 specific Human genes 0.000 description 1
- 101000890611 Homo sapiens A-kinase anchor protein 6 Proteins 0.000 description 1
- 101000890598 Homo sapiens A-kinase anchor protein 9 Proteins 0.000 description 1
- 101000833166 Homo sapiens AF4/FMR2 family member 3 Proteins 0.000 description 1
- 101000722210 Homo sapiens ATP-dependent DNA helicase DDX11 Proteins 0.000 description 1
- 101000864670 Homo sapiens ATP-dependent RNA helicase A Proteins 0.000 description 1
- 101000874566 Homo sapiens Axin-1 Proteins 0.000 description 1
- 101100165236 Homo sapiens BCOR gene Proteins 0.000 description 1
- 101001049968 Homo sapiens Band 4.1-like protein 4A Proteins 0.000 description 1
- 101001068639 Homo sapiens Basic salivary proline-rich protein 2 Proteins 0.000 description 1
- 101000697366 Homo sapiens Bestrophin-3 Proteins 0.000 description 1
- 101000767052 Homo sapiens CAP-Gly domain-containing linker protein 1 Proteins 0.000 description 1
- 101000896987 Homo sapiens CREB-binding protein Proteins 0.000 description 1
- 101000892045 Homo sapiens CUB and sushi domain-containing protein 3 Proteins 0.000 description 1
- 101000762229 Homo sapiens Cadherin-10 Proteins 0.000 description 1
- 101000762238 Homo sapiens Cadherin-12 Proteins 0.000 description 1
- 101000892026 Homo sapiens Casein kinase II subunit alpha Proteins 0.000 description 1
- 101000892015 Homo sapiens Casein kinase II subunit alpha' Proteins 0.000 description 1
- 101000909507 Homo sapiens Contactin-5 Proteins 0.000 description 1
- 101000749877 Homo sapiens Contactin-associated protein-like 2 Proteins 0.000 description 1
- 101000900791 Homo sapiens Contactin-associated protein-like 3B Proteins 0.000 description 1
- 101000884345 Homo sapiens Cyclin-dependent kinase 12 Proteins 0.000 description 1
- 101000721255 Homo sapiens DDB1- and CUL4-associated factor 4-like protein 2 Proteins 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 101000992305 Homo sapiens Delta-type opioid receptor Proteins 0.000 description 1
- 101000865404 Homo sapiens Dentin sialophosphoprotein Proteins 0.000 description 1
- 101000632661 Homo sapiens Diphosphoinositol polyphosphate phosphohydrolase 3-beta Proteins 0.000 description 1
- 101000756727 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 23 Proteins 0.000 description 1
- 101000756756 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 28 Proteins 0.000 description 1
- 101000866323 Homo sapiens Dynein axonemal heavy chain 8 Proteins 0.000 description 1
- 101000650316 Homo sapiens E3 ubiquitin-protein ligase RNF213 Proteins 0.000 description 1
- 101000692702 Homo sapiens E3 ubiquitin-protein ligase RNF43 Proteins 0.000 description 1
- 101000976468 Homo sapiens E3 ubiquitin-protein ligase ZNF598 Proteins 0.000 description 1
- 101000967447 Homo sapiens Elongation factor 1-beta Proteins 0.000 description 1
- 101000917134 Homo sapiens Fibroblast growth factor receptor 4 Proteins 0.000 description 1
- 101001024897 Homo sapiens GRB2-associated-binding protein 1 Proteins 0.000 description 1
- 101000775742 Homo sapiens Guanine nucleotide exchange factor VAV3 Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101000904080 Homo sapiens Guanine nucleotide-binding protein subunit alpha-15 Proteins 0.000 description 1
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 1
- 101001045848 Homo sapiens Histone-lysine N-methyltransferase 2B Proteins 0.000 description 1
- 101001008892 Homo sapiens Histone-lysine N-methyltransferase 2C Proteins 0.000 description 1
- 101001008894 Homo sapiens Histone-lysine N-methyltransferase 2D Proteins 0.000 description 1
- 101000634050 Homo sapiens Histone-lysine N-methyltransferase, H3 lysine-36 specific Proteins 0.000 description 1
- 101000998139 Homo sapiens Interleukin-32 Proteins 0.000 description 1
- 101000971797 Homo sapiens KH homology domain-containing protein 4 Proteins 0.000 description 1
- 101000605522 Homo sapiens Kallikrein-1 Proteins 0.000 description 1
- 101001051730 Homo sapiens Keratin-associated protein 4-11 Proteins 0.000 description 1
- 101001007047 Homo sapiens Keratin-associated protein 4-8 Proteins 0.000 description 1
- 101001007846 Homo sapiens Keratin-associated protein 5-5 Proteins 0.000 description 1
- 101001017859 Homo sapiens Leucine-rich repeat and IQ domain-containing protein 3 Proteins 0.000 description 1
- 101000581803 Homo sapiens Lithostathine-1-beta Proteins 0.000 description 1
- 101000692954 Homo sapiens Lysine-specific demethylase PHF2 Proteins 0.000 description 1
- 101000627860 Homo sapiens Matrix metalloproteinase-27 Proteins 0.000 description 1
- 101000614988 Homo sapiens Mediator of RNA polymerase II transcription subunit 12 Proteins 0.000 description 1
- 101000978418 Homo sapiens Melanocortin receptor 4 Proteins 0.000 description 1
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 description 1
- 101000972278 Homo sapiens Mucin-6 Proteins 0.000 description 1
- 101000589016 Homo sapiens Myomegalin Proteins 0.000 description 1
- 101000637240 Homo sapiens Neurite extension and migration factor Proteins 0.000 description 1
- 101001024606 Homo sapiens Neuroblastoma breakpoint family member 10 Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000582005 Homo sapiens Neuron navigator 3 Proteins 0.000 description 1
- 101000721722 Homo sapiens Neuronal tyrosine-phosphorylated phosphoinositide-3-kinase adapter 2 Proteins 0.000 description 1
- 101000596404 Homo sapiens Neuronal vesicle trafficking-associated protein 1 Proteins 0.000 description 1
- 101001018109 Homo sapiens Nucleotidyltransferase MB21D2 Proteins 0.000 description 1
- 101000594423 Homo sapiens Olfactory receptor 10G8 Proteins 0.000 description 1
- 101001122140 Homo sapiens Olfactory receptor 10Z1 Proteins 0.000 description 1
- 101000594779 Homo sapiens Olfactory receptor 14C36 Proteins 0.000 description 1
- 101000982239 Homo sapiens Olfactory receptor 2B11 Proteins 0.000 description 1
- 101001121141 Homo sapiens Olfactory receptor 2M2 Proteins 0.000 description 1
- 101001137095 Homo sapiens Olfactory receptor 2T2 Proteins 0.000 description 1
- 101000594471 Homo sapiens Olfactory receptor 2T33 Proteins 0.000 description 1
- 101000594474 Homo sapiens Olfactory receptor 2T34 Proteins 0.000 description 1
- 101001122435 Homo sapiens Olfactory receptor 4C15 Proteins 0.000 description 1
- 101001122432 Homo sapiens Olfactory receptor 4C16 Proteins 0.000 description 1
- 101000721113 Homo sapiens Olfactory receptor 4K2 Proteins 0.000 description 1
- 101000611364 Homo sapiens Olfactory receptor 4M2 Proteins 0.000 description 1
- 101000611363 Homo sapiens Olfactory receptor 4N2 Proteins 0.000 description 1
- 101000614002 Homo sapiens Olfactory receptor 4N4 Proteins 0.000 description 1
- 101000982762 Homo sapiens Olfactory receptor 51V1 Proteins 0.000 description 1
- 101000586103 Homo sapiens Olfactory receptor 5D18 Proteins 0.000 description 1
- 101000992275 Homo sapiens Olfactory receptor 5L2 Proteins 0.000 description 1
- 101001137111 Homo sapiens Olfactory receptor 8H2 Proteins 0.000 description 1
- 101000741895 Homo sapiens POTE ankyrin domain family member C Proteins 0.000 description 1
- 101000610209 Homo sapiens Pappalysin-2 Proteins 0.000 description 1
- 101001120056 Homo sapiens Phosphatidylinositol 3-kinase regulatory subunit alpha Proteins 0.000 description 1
- 101000604565 Homo sapiens Phosphatidylinositol glycan anchor biosynthesis class U protein Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000589450 Homo sapiens Poly(ADP-ribose) glycohydrolase Proteins 0.000 description 1
- 101001117245 Homo sapiens Polymerase delta-interacting protein 2 Proteins 0.000 description 1
- 101000997296 Homo sapiens Potassium voltage-gated channel subfamily B member 2 Proteins 0.000 description 1
- 101000610110 Homo sapiens Pre-B-cell leukemia transcription factor 2 Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000918287 Homo sapiens Protein FAM135B Proteins 0.000 description 1
- 101000882215 Homo sapiens Protein FAM47A Proteins 0.000 description 1
- 101000824415 Homo sapiens Protocadherin Fat 3 Proteins 0.000 description 1
- 101000613366 Homo sapiens Protocadherin-11 X-linked Proteins 0.000 description 1
- 101000697601 Homo sapiens Putative STAG3-like protein 2 Proteins 0.000 description 1
- 101000882214 Homo sapiens Putative protein FAM47C Proteins 0.000 description 1
- 101000853457 Homo sapiens Ral GTPase-activating protein subunit beta Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000581815 Homo sapiens Regenerating islet-derived protein 3-alpha Proteins 0.000 description 1
- 101000920971 Homo sapiens Rootletin Proteins 0.000 description 1
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 1
- 101000783404 Homo sapiens Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Proteins 0.000 description 1
- 101000625859 Homo sapiens T-box transcription factor TBX6 Proteins 0.000 description 1
- 101000633632 Homo sapiens Teashirt homolog 3 Proteins 0.000 description 1
- 101000669970 Homo sapiens Thrombospondin type-1 domain-containing protein 4 Proteins 0.000 description 1
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 1
- 101000622236 Homo sapiens Transcription cofactor vestigial-like protein 3 Proteins 0.000 description 1
- 101000891649 Homo sapiens Transcription elongation factor A protein-like 1 Proteins 0.000 description 1
- 101000798707 Homo sapiens Transmembrane protease serine 13 Proteins 0.000 description 1
- 101000611194 Homo sapiens Trinucleotide repeat-containing gene 6A protein Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101000955105 Homo sapiens WAS protein family homolog 2 Proteins 0.000 description 1
- 101000771618 Homo sapiens WD repeat-containing protein 62 Proteins 0.000 description 1
- 101000804908 Homo sapiens Xin actin-binding repeat-containing protein 2 Proteins 0.000 description 1
- 101000785626 Homo sapiens Zinc finger E-box-binding homeobox 1 Proteins 0.000 description 1
- 101000744897 Homo sapiens Zinc finger homeobox protein 4 Proteins 0.000 description 1
- 101000915634 Homo sapiens Zinc finger protein 479 Proteins 0.000 description 1
- 101000976250 Homo sapiens Zinc finger protein 804A Proteins 0.000 description 1
- 101000976244 Homo sapiens Zinc finger protein 804B Proteins 0.000 description 1
- 101000976415 Homo sapiens Zinc finger protein 814 Proteins 0.000 description 1
- 101000825848 Homo sapiens snRNA-activating protein complex subunit 4 Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102100027004 Inhibin beta A chain Human genes 0.000 description 1
- 102100033501 Interleukin-32 Human genes 0.000 description 1
- 102100021449 KH homology domain-containing protein 4 Human genes 0.000 description 1
- 102100038297 Kallikrein-1 Human genes 0.000 description 1
- 108090000484 Kelch-Like ECH-Associated Protein 1 Proteins 0.000 description 1
- 102000004034 Kelch-Like ECH-Associated Protein 1 Human genes 0.000 description 1
- 102100024904 Keratin-associated protein 4-11 Human genes 0.000 description 1
- 102100028331 Keratin-associated protein 4-8 Human genes 0.000 description 1
- 102100027590 Keratin-associated protein 5-5 Human genes 0.000 description 1
- 101150105104 Kras gene Proteins 0.000 description 1
- 102100033286 Leucine-rich repeat and IQ domain-containing protein 3 Human genes 0.000 description 1
- 102100027338 Lithostathine-1-beta Human genes 0.000 description 1
- 201000005027 Lynch syndrome Diseases 0.000 description 1
- 102100026395 Lysine-specific demethylase PHF2 Human genes 0.000 description 1
- 229940124647 MEK inhibitor Drugs 0.000 description 1
- 102100024132 Matrix metalloproteinase-27 Human genes 0.000 description 1
- 102100021070 Mediator of RNA polymerase II transcription subunit 12 Human genes 0.000 description 1
- 102100023724 Melanocortin receptor 4 Human genes 0.000 description 1
- 102000004866 Microtubule-associated protein 1B Human genes 0.000 description 1
- 108090001040 Microtubule-associated protein 1B Proteins 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 102100023123 Mucin-16 Human genes 0.000 description 1
- 102100022493 Mucin-6 Human genes 0.000 description 1
- 102100032966 Myomegalin Human genes 0.000 description 1
- 102100029166 NT-3 growth factor receptor Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 102100031810 Neurite extension and migration factor Human genes 0.000 description 1
- 102100037003 Neuroblastoma breakpoint family member 10 Human genes 0.000 description 1
- 102100030464 Neuron navigator 3 Human genes 0.000 description 1
- 102100025111 Neuronal tyrosine-phosphorylated phosphoinositide-3-kinase adapter 2 Human genes 0.000 description 1
- 102100033052 Nucleotidyltransferase MB21D2 Human genes 0.000 description 1
- 102100035615 Olfactory receptor 10G8 Human genes 0.000 description 1
- 102100027078 Olfactory receptor 10Z1 Human genes 0.000 description 1
- 102100036102 Olfactory receptor 14C36 Human genes 0.000 description 1
- 102100026691 Olfactory receptor 2B11 Human genes 0.000 description 1
- 102100026574 Olfactory receptor 2M2 Human genes 0.000 description 1
- 102100035537 Olfactory receptor 2T2 Human genes 0.000 description 1
- 102100035494 Olfactory receptor 2T33 Human genes 0.000 description 1
- 102100035686 Olfactory receptor 2T34 Human genes 0.000 description 1
- 102100027146 Olfactory receptor 4C15 Human genes 0.000 description 1
- 102100027147 Olfactory receptor 4C16 Human genes 0.000 description 1
- 102100025148 Olfactory receptor 4K2 Human genes 0.000 description 1
- 102100040741 Olfactory receptor 4M2 Human genes 0.000 description 1
- 102100040740 Olfactory receptor 4N2 Human genes 0.000 description 1
- 102100040575 Olfactory receptor 4N4 Human genes 0.000 description 1
- 102100026978 Olfactory receptor 51V1 Human genes 0.000 description 1
- 102100030038 Olfactory receptor 5D18 Human genes 0.000 description 1
- 102100031824 Olfactory receptor 5L2 Human genes 0.000 description 1
- 102100035642 Olfactory receptor 8H2 Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102100038763 POTE ankyrin domain family member C Human genes 0.000 description 1
- 102100040154 Pappalysin-2 Human genes 0.000 description 1
- 102100026169 Phosphatidylinositol 3-kinase regulatory subunit alpha Human genes 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 102100032347 Poly(ADP-ribose) glycohydrolase Human genes 0.000 description 1
- 102100024168 Polymerase delta-interacting protein 2 Human genes 0.000 description 1
- 102100034311 Potassium voltage-gated channel subfamily B member 2 Human genes 0.000 description 1
- 102100040168 Pre-B-cell leukemia transcription factor 2 Human genes 0.000 description 1
- 102100029056 Protein FAM135B Human genes 0.000 description 1
- 102100039011 Protein FAM47A Human genes 0.000 description 1
- 102000009516 Protein Serine-Threonine Kinases Human genes 0.000 description 1
- 108010009341 Protein Serine-Threonine Kinases Proteins 0.000 description 1
- 102000012515 Protein kinase domains Human genes 0.000 description 1
- 108050002122 Protein kinase domains Proteins 0.000 description 1
- 102100022134 Protocadherin Fat 3 Human genes 0.000 description 1
- 102100040913 Protocadherin-11 X-linked Human genes 0.000 description 1
- 102100028010 Putative STAG3-like protein 2 Human genes 0.000 description 1
- 102100039012 Putative protein FAM47C Human genes 0.000 description 1
- 101150040459 RAS gene Proteins 0.000 description 1
- 102000004912 RYR2 Human genes 0.000 description 1
- 108060007241 RYR2 Proteins 0.000 description 1
- 102100035887 Ral GTPase-activating protein subunit beta Human genes 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 102100027336 Regenerating islet-derived protein 3-alpha Human genes 0.000 description 1
- 102100032198 Rootletin Human genes 0.000 description 1
- 108091006258 SLC6A10P Proteins 0.000 description 1
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 1
- 102100036122 Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Human genes 0.000 description 1
- 102100024751 T-box transcription factor TBX6 Human genes 0.000 description 1
- 102100029222 Teashirt homolog 3 Human genes 0.000 description 1
- 102100039309 Thrombospondin type-1 domain-containing protein 4 Human genes 0.000 description 1
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 1
- 102100023476 Transcription cofactor vestigial-like protein 3 Human genes 0.000 description 1
- 102100032467 Transmembrane protease serine 13 Human genes 0.000 description 1
- 102100040241 Trinucleotide repeat-containing gene 6A protein Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100024250 Ubiquitin carboxyl-terminal hydrolase CYLD Human genes 0.000 description 1
- 102100038949 WAS protein family homolog 2 Human genes 0.000 description 1
- 102100029478 WD repeat-containing protein 62 Human genes 0.000 description 1
- 102100036955 Xin actin-binding repeat-containing protein 2 Human genes 0.000 description 1
- 102000006076 ZNF598 Human genes 0.000 description 1
- 102100026457 Zinc finger E-box-binding homeobox 1 Human genes 0.000 description 1
- 102100039968 Zinc finger homeobox protein 4 Human genes 0.000 description 1
- 102100029034 Zinc finger protein 479 Human genes 0.000 description 1
- 102100023875 Zinc finger protein 804A Human genes 0.000 description 1
- 102100023869 Zinc finger protein 804B Human genes 0.000 description 1
- 102100023595 Zinc finger protein 814 Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 101150072346 anapc1 gene Proteins 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 230000010100 anticoagulation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003445 biliary tract Anatomy 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000032677 cell aging Effects 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000000973 chemotherapeutic effect Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229940121657 clinical drug Drugs 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000030944 contact inhibition Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007716 flux method Methods 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 108010019691 inhibin beta A subunit Proteins 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 208000004707 mucinous cystadenoma Diseases 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 201000004228 ovarian endometrial cancer Diseases 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- JMANVNJQNLATNU-UHFFFAOYSA-N oxalonitrile Chemical compound N#CC#N JMANVNJQNLATNU-UHFFFAOYSA-N 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 108700042226 ras Genes Proteins 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 108010014186 ras Proteins Proteins 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 102100022780 snRNA-activating protein complex subunit 4 Human genes 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000004654 survival pathway Effects 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 229960001603 tamoxifen Drugs 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 108010064892 trkC Receptor Proteins 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 230000005186 women's health Effects 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种试剂盒,其包含探针,所述探针固定在固相基质上或者所述探针游离于溶液中,所述探针能够特异性识别表1中的547个基因中的至少10个基因的基因区域。本发明还提供试剂盒的用途、一种构建目标区域测序文库的方法、一种测序方法、一种检测目标区域变异的方法、一种检测目标区域变异的装置、一种对癌症进行早期筛查的方法及装置。利用本发明的试剂盒和/或本发明的方法或装置,能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列,能够准确检测分析这些相关基因序列,使检测分析结果可以辅助用于多种常见癌症的早期筛查判断或监控。
Description
技术领域
本发明涉及生物医学领域,具体的,涉及试剂盒及其用途,更具体的,本发明涉及一种试剂盒、试剂盒的用途、一种构建目标区域测序文库的方法、一种测序方法、一种检测目标区域变异的方法和装置、以及一种对癌症进行早期筛查的方法和装置。
背景技术
肿瘤是严重威胁人类健康的疾病之一,20世纪70年代以来,我国癌症发病及死亡率一直呈上升趋势,至90年代的20年间,癌症死亡率上升29.42%,年龄调整死亡率上升11.56%。2000年癌症发病人数约180-200万,死亡140-150万。恶性肿瘤发病率全国35岁至39岁年龄段为87.07/10万,40岁至44岁年龄段几乎翻番,达到154.53/10万;50岁以上人群发病占全部发病的80%以上,60岁以上癌症发病率超过1%,80岁达到高峰。全国肿瘤死亡率为180.54/10万,每年因癌症死亡病例达270万例。我国居民因癌症死亡的几率是13%[赫捷,陈万青.(2012).2012中国肿瘤登记年报.军事医学科学出版社:18-28.McBride,D.J.andA.K.Orpana,etal.(2010)."Useofcancer-specificgenomicrearrangementstoquantifydiseaseburdeninplasmafrompatientswithsolidtumors."GenesChromosomesCancer49(11):1062-1069.]。癌症不仅严重影响劳动人民的健康,而且成为医疗费用上涨的重要因素。我国每年耗费大量资金用于癌症病人的医疗费用,带来巨大的经济负担。
癌症的发生时一个渐进缓慢的过程,如能够对其做到早期发现,临床有效治疗,到术后复发监测进行全面控制,可有效的降低其发生率和死亡率,将有着巨大的经济效益和社会效益,寻找特异性的肿瘤标志物对早期筛查、术后监控等方面均有重要作用[KayabaH.Tumormarkers:essentialdiagnostictoolsforradiologists[J].NipponLgakuHoshasenGakkaiZasshi,2003,63(4):133-139]。
循环DNA是存在于血液、滑膜液等体液中的细胞外游离DNA,研究发现许多肿瘤患者循环DNA与正常人相比有很大差异,由于肿瘤细胞凋亡,癌症患者循环DNA中含有一定的肿瘤标志物。近年来肿瘤患者血液中循环游离DNA的基因检测诊断已成为研究热点,研究显示血液中循环肿瘤DNA有可能成为一种新的肿瘤早期诊断及预后判断的标志物。检测血液中循环游离DNA中的肿瘤标志物检测具有区别于传统组织肿瘤标志物检测方式,具有无创、随时监控和早期筛查等优势,并且对循环游离DNA的取样检测避免了当前分子诊断需要采集癌组织作为标本来源的困难,是一种很有潜力的肿瘤标志物。同时将血液肿瘤标志物与临床检验结合起来,可以辅助肿瘤的早期诊断和实时监控或者为肿瘤的早期诊断或监控提供重要线索,有可能能成为肿瘤的早期筛查和预后判断提供重要依据。
目前临床上对于这些常见高发癌症的早期诊断和术后监控,拥有许多手段,但大部分方法在特异性和准确性方面尚不足以满足临床检测的要求。如今高通量测序技术已经在肿瘤检测中得到了有效应用,但由于肿瘤发病早期的血浆游离DNA含量较低,而且测序技术本身存在一定的错误率等,采用传统的测序方法将无法分辨测序错误和肿瘤标本中低频率突变,不利于这些癌症的早期诊断和术后监控。因此开发易操作、低损伤、高准确的技术是癌症早期筛查和术后监控所急需的。
发明内容
依据本发明的一方面,本发明提供一种试剂盒,其包含探针,所述探针固定在固相基质上或者游离于溶液中,所述探针能够特异性识别以下表1中547个基因中的至少10个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少100个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少200个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少300个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少400个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少500个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖全部所述547个基因的基因区域。本发明的试剂盒探针能够特异性识别的基因区域组合,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合是常见肿瘤的发生或发育相关区域。所述常见肿瘤包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的方法能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列。
表1
在本发明的一个实施例中,所述探针能够特异性识别所述547个基因中的表2所列的145个基因的基因区域。探针能够特异性识别的表2的145个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与肺癌的发生发展相关。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部肺癌相关基因序列,而且基于检测这些基因序列获取的信息能够辅助肺癌的早期筛查诊断。
表2
KRAS | ALK | ROS1 | ADAM23 | KIAA0907 | KRTAP5-5 | MAP1B |
EGFR | RB1 | FGFR3 | DNMT3B | GAB1 | TSHZ3 | ZNF814 |
TP53 | PDGFRA | FGFR4 | SDHAP2 | OR10Z1 | XIRP2 | ZFHX4 |
BRAF | KDR | JAK3 | DHX9 | CNTNAP3B | NYAP2 | ZNF804A |
PIK3CA | FBXW7 | APC | CSNK2A1 | IL32 | NUDT11 | OR5D18 |
ERBB2 | HRAS | FRG1B | CNTN5 | NAV3 | SNAPC4 | ZNF479 |
CDKN2A | JAK2 | CHEK2 | ATXN3 | TNRC6A | ZNF598 | OR51V1 |
NRAS | ERBB4 | KLK1 | CLIP1 | FAM135B | KIAA2022 | OR4N2 |
STK11 | KIT | NBPF10 | OR4M2 | VGLL3 | DDX11L2 | OR4C15 |
NFE2L2 | SMAD4 | PARG | OR10G8 | KRTAP4-11 | MUC6 | OR14C36 |
CTNNB1 | FGFR2 | FBN2 | PAPPA2 | ANAPC1 | ATXN1 | CROCC |
MET | DDR2 | HSD17B7P2 | OR8H2 | FAM47C | MUC16 | OR2T2 |
PTEN | ATM | WASH2P | PBX2 | AKAP6 | BEST3 | PCDH11X |
AKT1 | RET | POTEC | POLDIP2 | ZNF804B | DSPP | REG3A |
KEAP1 | NOTCH1 | EEF1B2 | SLC6A10P | ZEB1 | MB21D2 | REG1B |
DDX11 | EPB41L4A | TBX6 | PRB2 | OR2T34 | NTRK3 | LRRIQ3 |
DNAH8 | OR2M2 | WDR62 | CNTNAP2 | LPA | NTRK1 | EPHA5 |
OR2B11 | OR4C16 | DCAF4L2 | CDH10 | MMP27 | NF1 | OR5L2 |
OR4K2 | KCNB2 | EPHA3 | CDH12 | VAV3 | INHBA | OR2T33 |
FAM47A | STAG3L2 | PTPRD | RALGAPB | THSD4 | FGFR1 | GNA15 |
RYR2 | KRTAP4-8 | NOTCH2 | FOLH1 | OR4N4 |
在本发明的一个实施例中,所述探针能够特异性结合所述547个基因中的表3所列60个基因的基因区域。探针能够特异性识别的表3的60个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与结直肠癌的发生发展相关。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部结直肠癌相关基因序列,而且基于检测这些基因序列获取的信息能够辅助结直肠癌的早期筛查诊断。
表3
KRAS | SRC | TLR3 | EP300 | TMPRSS13 | EPHA5 |
BRAF | PTEN | MC4R | CYLD | PHF2 | EPHA3 |
APC | AXIN1 | MLH1 | FBN2 | OPRD1 | PTPRD |
TP53 | FLG | AKT1 | NF1 | LILRB5 | NTRK3 |
PIK3CA | LIG1 | CASD1 | ASXL1 | COL18A1 | NTRK1 |
CTNNB1 | MAP2K1 | PTCH1 | SMAD4 | LARP4B | ALK |
NRAS | PIK3R1 | ADAMTS18 | IRF5 | DMKN | ROS1 |
EGFR | ERBB2 | MSH2 | DOCK3 | ROBO2 | RET |
FBXW7 | STK11 | BAP1 | MYOM1 | KCNN3 | PDGFRA |
ARID1A | IL7R | CTNNA1 | NEFH | INHBA | FGFR1 |
在本发明的一个实施例中,所述探针能够特异性识别所述547个基因中的表4所列43个基因的基因区域。探针能够特异性识别的表4的43个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与妇科生殖道肿瘤的发生发展相关。所说的生殖道肿瘤包括卵巢癌、子宫内膜癌和宫颈癌。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部生殖道肿瘤相关基因序列,而且基于检测这些基因序列获取的信息能够辅助生殖道肿瘤的早期筛查诊断。
表4
AFF3 | BRCA2 | FBXW7 | MED12 | PDE4DIP | STK11 |
AKAP9 | CDK12 | FGFR2 | MLL2 | PIK3CA | TP53 |
AKT1 | CDKN2A | FGFR3 | MLL3 | PIK3R1 | |
APC | CREBBP | FOXL2 | MSH6 | PPP2R1A | |
ARID1A | CSMD3 | GNAS | NF1 | PTEN | |
BCOR | CTNNB1 | HRAS | NFE2L2 | RB1 | |
BRAF | EGFR | KIT | NRAS | RNF213 | |
BRCA1 | FAT3 | KRAS | NSD1 | RNF43 |
在本发明的一个实施例中,所述探针的长度为25-300nt,较佳的,为50-250nt,更佳的,为80nt-120nt。为获得能够在同一反应体系中同时特异性捕获所说的基因区域组合的探针,在本发明的一个实施例中,探针是通过先获得初始探针集,再筛选所述初始探针集来确定的。获取所述初始探针集包括:确定所述基因区域的参考序列,从所述参考序列的一端开始,在所述参考序列上依次获取DNA片段直至所述参考序列的另一端,其中,一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,所述DNA片段之间完全重叠、部分重叠或完全不重叠,所述初始探针集能够覆盖所述基因区域至少一次。所说的基因区域的参考序列可以从参考基因组上获取,例如从人参考基因组HG19上获得对应的基因区域,所有的HG19上的对应的基因区域构成所说的基因区域的参考序列,HG19可以从NCBI数据库下载。在本发明的一个实施例中,利用迭代算法设计获取所述初始探针集,包括:确定所述基因区域在参考基因组上的位置,获取所述基因区域的参考序列,从所述参考序列的第一个核苷酸开始拷贝所述参考序列获取第一条DNA片段,从所述参考序列的第二个核苷酸开始拷贝所述参考序列获取第二条DNA片段,从所述参考序列的第三个核苷酸开始拷贝所述参考序列获取第三条DNA片段,这样依次获取后续DNA片段直至第N条DNA片段的一端超出所述参考序列,其中,一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,N为所述初始探针集中包含的初始探针的总数,以获得能够全面覆盖目标基因区域的初始探针集,而且为使最终的探针具高特异性,在本发明的一个实施例中,进一步对所述筛选初始探针集,包括:将所述DNA片段(初始探针集)与所述参考序列比对,获得每一条DNA片段在参考序列上的比对次数,过滤掉比对次数超过1的DNA片段。为使最终的探针能在同一反应体系中捕获所说的基因区域,和/或使捕获的基因区域在同一反应条件下被一起洗脱下来,进一步对所述初始探针集进行筛选,包括:去除掉GC含量不在35-70%的DNA片段。
依据本发明的另一方面,本发明提供一种上述任一试剂盒在获取常见癌症相关基因序列中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的试剂盒能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列。上述对本发明一方面的或者任一具体实施方式中的试剂盒的优点和技术特征的描述,同样适用本发明这一方面的试剂盒的用途,在此不再赘述。
依据本发明的再一方面,提供一种上述任一试剂盒在常见癌症早期筛查中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的试剂盒能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列,检测分析这些相关基因序列,检测分析结果可以用于或者辅助用于多种常见癌症的早期筛查判断,增加人为的早期干预肿瘤的发生发展的可能性和效果。目前大部分癌症如肺癌、肝癌、胃癌等在医院病理确诊时已是晚期,耽误了较早的治疗时间大大的减少治愈的可能性。上述对本发明一方面的或者任一具体实施方式中的试剂盒的优点和技术特征的描述,同样适用本发明这一方面的试剂盒的用途,在此不再赘述。
依据本发明的又一方面,本发明提供一种构建目标区域测序文库的方法,所述方法包括:(a)获取待测样本中的核酸,所述核酸由多个核酸片段组成,所述核酸片段来自断裂的基因组DNA和/或游离的DNA;(b)末端修复所述核酸片段,获得末端修复片段;(c)加碱基A至所述末端修复片段的两端,获得粘性末端片段;(d)连接接头于所述粘性末端片段的两端,获得接头连接片段;(e)对所述接头连接片段进行第一扩增,获得第一扩增产物;(f)利用上述任一试剂盒对所述第一扩增产物进行捕获,获得所述目标区域;以及(g)对所述目标区域进行第二扩增,获得第二扩增产物,所述第二扩增产物构成所述目标区域测序文库;任选地,所述接头末端为T-粘性末端。本发明的这一方面的测序文库构建方法,特别适用于样本含微量核酸的测序文库的构建,在本发明的一个实施例中,样本为含微量游离DNA片段的血浆样本,包含极其微量的目标游离DNA片段,第一扩增使得核酸的量能满足芯片/探针杂交捕获的需求,而因芯片杂交捕获会损耗一定量的核酸,第二扩增能使捕获下的目标片段获得再次扩增以满足上机测序和质控检测的要求。本发明的这一文库构建方法特别适用于总游离核酸不低于10ng或者常规组织基因组DNA不低于1μg的样本的测序文库构建,利用本发明的这一方面的方法构建的目标区域文库,测序后的下机数据质量高,基于高质量的下机数据利于后续的准确检测分析。
依据本发明的一方面,本发明提供一种测序方法,所述方法包括:根据本发明一方面的测序文库构建方法构建目标区域测序文库;对所述目标区域测序文库进行测序,获得测序数据,所述测序数据由多个读段组成。测序可以利用已知平台进行,包括但不限于Illumina的Hiseq2000/2500平台、LifeTechnologies的IonTorrent平台和单分子测序平台。测序方式可以选择单端测序,也可以是双末端测序,在本发明的一个实施例中利用双末端测序,所得的测序数据由多对读段对组成。上述对任一本发明的试剂盒和测序文库构建方法的优点和技术特征的描述,同样适用本发明的这一方面的测序方法,在此不再赘述。
依据本发明的一方面,本发明提供一种检测目标区域变异的方法,所述方法包括:(1)利用前述本发明的任一测序方法,获得目标样本的目标区域测序数据;(2)基于所述测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNP、InDel、SV和CNV至少之一。在本发明的一个实施例中,步骤(2)包括:将所述测序数据与参考序列进行第一比对,获得第一比对结果;将所述第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果;基于所述第一比对结果和所述第二比对结果,同时检测所述目标区域中的SNP、InDel、SV和CNV变异中的至少两种。为使变异检测结果更准确可信,在本发明的一个实施例中,在所述第一比对之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段。并且任选地,在所述第二比对之前,去除掉第一比对结果中的一个读段对中的两个读段相同的读段对。所说的参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列。这里,所说的第二比对为局部比对,第一比对为常规全局比对,可利用但不限于SOAP或BWA等软件依照其默认设置进行,获得第一比对结果,第一比对结果包括读段在参考序列上的匹配位置及匹配情况信息,在本发明的一个实施例中,进行第二比对即基于第一比对结果,对与所捕获的基因区域对应的参考序列中的所有已知INDEL附近的所有序列信息(reads)进行局部重新比对,能够消除第一比对中的错误,提高后续变异检测的准确性,第二比对可利用GATK重比对软件(https://www.broadinstitute.org/gatk/)进行。在本发明的一个实施例中,通过GATKUnifiedGenotyper软件同时检测所说的SNP和INDEL变异。利用本发明的这一方面的变异检测方法,能够准确检测出突变频率为1%的低频突变。
在本发明的一个实施例中,步骤(2)还包括,当所检测出的变异位点中的至少之一满足以下,则判定所测样本为阳性样本:在阴性对照样本中的读段支持数少于2和在阳性对照样本中的突变率大于1%。在本发明的另一个实施例中,步骤(2)还包括,当所检测出的变异位点中的至少之一满足以下,则判定所测样本为阳性样本:测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2,在阳性对照样本中的突变率大于1%,以及变异位点的读段支持量与正常对照样本(阴性对照样本)相同位点的读段支持量具有显著差异。所说的阳性样本指肿瘤样本,两个实施例中的判定条件是发明人结合目前相关数据库信息和大量文献报道信息、检测统计大量阳性样本和大量阴性样本确定下来的,具有统计意义,后者比前者更为严格,较佳的,这里的阳性或者阴性对照样本超过30个,对照样本的数据可以自己对对照样本的核酸进行提取、序列测定来获得,也可以依照他人已公开或公开数据库中的的样本测序数据,多个对照样本数据使统计判定条件/结果具有统计意义,更加可信。依据两个判定条件中的任一判定的结果可以辅助用于临床的肿瘤诊断筛查,可辅助用于了解所测样本个体癌变的可能性及病情发展情况等。需要说明的是,所说的变异位点在待测样本中的读段支持量与正常对照样本(阴性对照样本)相同位点的读段支持量具有显著差异,其中的读段支持量,可以为支持该变异的读段的数目,也可以是支持该变异的读段在比对上该位点读段中的比例,在本发明的一个实施例中,采用后者来比较,所说的具有显著差异指具有实质差异,例如对于待测样本中的变异位点A,多个阳性样本(cancer样本)中的reads支持比例都为5/400(变异5条reads,总400条reads),即阳性样本中该位点的平均变异频率1.25%,而在多个阴性对照样本中的reads支持比例都为1/200(变异1条reads,总200条reads),即阴性对照样本中的平均变异频率0.5%,若待测样本中的该变异位点的变异频率更接近1.25%,例如达到0.9%,则达到所说的显著差异或者所说的实质差异。具有显著差异,也可以指统计学上的对数据差异性的评价——显著性差异,例如对待测样本中的变异位点A进行多次检测,获得该位点的多组比对结果数据,从每组比对结果数据中都可获得一个读段支持比例,所说的读段支持比例=支持该变异位点的读段数/比对上该位点的总读段数,接着比较待测样本的变异位点A的读段支持比例(变异频率)与阴性对照样本中的该位点的突变频率的差异,例如可以利用z检验或t检验,差异具有显著性(p≤0.05),即认为达到所说的具有显著差异。
依据本发明的一方面,本发明还提供一种检测目标区域变异的装置,用以实现或执行上述本发明一方面的或者任一具体实施方式的目标区域变异检测方法,所述装置包括:数据获取单元,用于实现上述本发明一方面的测序方法,获取目标区域的测序数据,所述测序数据由多个读段组成;检测单元,用于基于来自数据获取单元的测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNP、InDel、SV和CNV至少之一。本领域人员可以理解,本发明的装置中的全部或部分单元,可选择的、可拆卸的包含一个或多个子单元以执行或实现前述本发明方法的各个具体实施方式。
例如,在本发明的一个实施例中,如图1所示,装置1000中的检测单元200包括第一比对子单元13、第二比对子单元15和变异识别子单元17,所述第一比对子单元13用以将来自数据获取单元100的测序数据与参考序列进行第一比对,获得第一比对结果,所述第二比对子单元15用以将来自所述第一比对子单元13的第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果,所述变异识别子单元17用以基于来自所述第一比对子单元13的第一比对结果和来自所述第二比对子单元15的第二比对结果,同时检测所述目标区域中的SNV、InDel、SV和CNV变异中的至少两种变异,获得变异位点信息,其中,所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列。在本发明的一个实施例中,如图2所示,所述装置1000的检测单元200还包括第一过滤子单元12,所述第一过滤子单元12与所述第一比对子单元13连接,用于在所述测序数据进入所述第一比对子单13元之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段。任选的,如图3所示,所述检测单元200还包括第二过滤子单元14,所述第二过滤子单元分别14与所述第一比对子单元13和所述第二比对子单元15连接,用于在所述第一比对结果进入所述第二比对子单元15之前,去除掉来自所述第一比对子单元13的第一比对结果中的一个读段对中的两个读段相同的读段对。上述参考序列可以为HG19,所述第一比对单元中进行的第一比对为全局比对,所述第二比对子单元中进行的第二比对为局部比对。在本发明的一个实施例中,如图4所示,所述装置1000中的检测单元200还包括判定子单元19,所述判定子单元19用以判定来自所述变异识别子单元17中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%。在本发明的另一个实施例中,所述检测单元200还包括判定子单元19,所述判定子单元19用以判定来自所述变异识别子单元17中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2条,在阳性对照样本中的突变率大于1%,以及变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。前述对本发明一方面或者任一具体实施方式中的目标区域变异检测方法的技术特征和优点的描述,同样适用于本发明这一方面的检测装置,在此不再赘述。
依据本发明的一方面,本发明还提供一种对癌症进行早期筛查的方法,所述方法包括:获取待测样本中的核酸;利用本发明一方面的或者任一具体实施方式的试剂盒捕获所述核酸,获得目标区域;对所述目标区域进行序列测定,获得测序数据,所述测序数据由多个读段组成;基于所述测序数据,检测所述目标区域中的变异,获得变异位点信息;基于所述变异位点中的至少之一满足以下(i)或者(ii),判定所述待测样本为阳性样本:(i)在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;(ii)测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2条,在阳性对照样本中的突变率大于1%,以及其读段支持量与正常对照样本相同位点的读段支持量具有显著差异。上述对本发明一方面的目标区域变异检测方法和/装置的相应技术特征和优点的描述,同样适用于本发明这一方面的癌症早期筛查方法,在此不再赘述。本领域技术人员可以理解,本发明这一方面的方法中的全部或部分步骤,可以通过包含对应功能单元的装置来实现。
本发明的方法/装置,是一种高灵敏性、高特异性、高通量的方法/装置,能够辅助用于肿瘤早期筛查、术后监控以及多种肿瘤治疗方式(放化疗、靶向药物治疗等)效果监控,适用于辅助检测所有可提供外周血样本的肿瘤类型,包括常见高发肿瘤包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等。通过使用新一代高通量测序技术,结合本发明一方面的试剂盒包含的能特异性捕获特定基因区域的探针,能够在很短的时间内同时进行多例样本检测,并且可以基于相同数据量进行更高深度的数据挖掘,检测出低频变异,而且检测结果特异性高,具较低的假阳性率、假阴性率,能够确保得到的检测结果能够准确的反应受检者的实时外周血状况。对外周血血浆游离DNA(cfDNA)中特异分子标记物进行监控检测,能够辅助应用在相关癌症的早期筛查、手术后监控、化疗/靶向治疗监控等方面,从而利于对肿瘤发病的早期预防、术后预后的随时监控以及多种肿瘤治疗方式的效果监控,大大降低肿瘤发病率并提高患者生存率等。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图2是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图3是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图4是本发明的一个实施例中的目标区域变异检测装置的结构示意图。
具体实施方式
本发明中的“变异”、“核酸变异”、“基因变异”可通用,本发明中的“SNP”(SNV)、“CNV”、“插入缺失”(indel)和“结构变异”(SV)同通常定义,但本发明中对各种变异的大小不作特别限定,这样这几种变异之间有的有交叉,比如当插入/缺失的为大片段甚至整条染色体时,也属于发生拷贝数变异(CNV)或是染色体非整倍性,也属于SV。这些类型变异的大小交叉并不妨碍本领域人员通过上述描述执行实现本发明的方法和/或装置并且达到所描述的结果。
本发明中的“参考序列”为已知基因组序列或者已知基因组序列的至少一部分,本发明中所使用的“第一”、“第二”等仅为方便描述指代,不能理解为指示或暗示相对重要性,也不能理解为有先后顺序关系。本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
获得本发明一方面的试剂盒、实现本发明一方面的方法和/或装置,一般包括目标区域捕获探针/芯片的设计、微量样本建库及杂交上机测序、下机数据的生物信息分析和变异数据解读。
1.目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助用于肿瘤早诊、术后监控以及肿瘤治疗(放化疗、靶向药物治疗等)效果监控的目标区域捕获芯片CANPer,CANPer为液相芯片。CANPer芯片包括了常见高发癌症的相关驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,共计547个基因,300Kb。基因列表详见表1。
2.以下以肺癌结节早期患者样本检测为例进行操作说明,样本来自天津妇幼保健院。
(一)样本制备
1)抽取肺癌结节早期患者外周血5-10mL,存于EDTA抗凝管中,在4-6小时内对外周血进行分离,得到游离DNA,游离DNA(cfDNA)包含肿瘤DNA(ctDNA)游离片段。
2)cfDNA定量检测。
(二)文库制备及超高深度测序
1)对cfDNA片段进行末端修复;
2)对cfDNA片段末端加A;
3)连接Adapter文库接头:文库接头(Adapter)是指经过设计的一段碱基序列,作用在于cfDNA文库扩增时与引物相结合,使DNA扩增进行,并且在上机测序时与测序引物相结合,利于测序引物与待测序位点结合辅助DNA测序进行。
4)文库进行第一轮PCR扩增;
扩增后文库质控并进行肿瘤个体化芯片杂交;
杂交文库进行第二轮PCR扩增;
6)文库定量及质控;
7)IlluminaHiSeq2500/2000上机测序,测序深度达2000X以上。
(三)目标区域捕获测序下机数据进行生物信息分析
获得下机数据后需进行如下生物信息分析,得到最终的变异结果。
SOAPnuke过滤(filter):去除低质量reads;
与reference序列比对,产生bam文件;
标记重复序列;
比对结果不好的序列重新比对,并校正质量值;
去除错配序列;
分析下机数据质控(QC);
寻找变异;
对变异结果进行注释,得到最终数据结果。
(四)变异数据解读
对生物信息分析后的变异数据进行个体化解读,参考构建的肿瘤数据库及相关文献,对受检者检出的变异进行分析,用于辅助判断此肺部结节是否有发展为肿瘤的风险,以及良恶性情况等,用以辅助结合临床检验结果给予最适合的预防及治疗方式。
以下结合具体个体样本对利用本发明的试剂盒、本发明的方法/装置获得的检测结果进行详细的描述。下面示例,仅用于解释本发明,而不能理解为对本发明的限制。除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、软件及仪器,都是常规市售产品或者开源的,比如购自Illumina公司的hiseq2000测序平台建库相关试剂盒来进行文库构建等。
实施例1
以上述肺癌结节早期患者的外周血血浆作为待检样本,内容如下:
(一)外周血样本分离
1.采集受检者外周血1-2管(5mL/管)于EDTA抗凝管中,轻柔上下颠倒(防止细胞破裂)6-8次充分混匀,在采血当天4-6小时内进行以下处理;
2.在4℃条件下1600g离心10分钟,离心后将上清(血浆)分装到多个1.5mL/2mL离心管中,在吸取过程中不能吸到中间层白细胞;
3.在4℃条件下16000g离心10分钟,去除残余细胞,将上清(血浆)转移到新的1.5mL/2mL离心管中,不能吸到管底白细胞,即得到分离后所需血浆;
4.血浆样本处理完后,分离得到的血浆及剩余血细胞均保存到-80℃冰箱中,避免反复冻融。
(二)血浆游离DNA提取(采用QIAampCirculatingNucleicAcidKit)
1.加30μL蛋白酶K至1.5mL离心管中;
2.加入300μL血浆;
3.加入240μLBufferACL和1.68μLCarrierRNA(0.2μg/μL),涡旋振荡30s,60℃温浴30min,温浴期间适当取出振荡;
4.加入540μLBufferACB,涡旋振荡15-30s,冰上或-20℃冰箱放置5min;
5.取700μL血浆混合物加入过滤柱中,7500rpm离心30s;
6.过滤柱空甩8000rpm,1min;
7.加入600μLBufferACW1,8000rpm,1min离心洗涤;
8.加入700μLBufferACW2,8000rpm,1min离心洗涤;
9.加入700μL无水乙醇,8000rpm,1min离心洗涤;
10.过滤柱空甩14000rpm,3min;
11.把过滤柱放入新收集管中,打开盖子,56℃金属浴10min;
12.将柱子放入新离心管汇总,加入60μLBufferAVE回溶3min;
13.14.000rpm离心1min,Qubit(Invitrogen,theQuant-iTTMdsDNAHSAssayKit)定量质控所提取的cfDNA。
(三)文库构建(采用KAPALTPLibraryPreparationKit)
1.末端修复
反应后加入AgencourtAMPureXPreagent120μL,磁珠纯化后,使用42μLddH2O回溶,带磁珠进行下一步反应;
2.末端加A
反应后加入PEG/NaClSPRISolution90μL,充分混合并进行磁珠纯化,下步Adapter连接反应体系中Adapter和ddH2O加入量按照下面公式进行计算:10nM*建库起始DNA量(ng)*Adaper用量(μL)=15μM(Adapter浓度)*50μL,使用ddH2O用量(μL)=35μL-Adapter用量(μL)回溶,进行下一步反应;
3.接头连接
反应后,加入PEG/NaClSPRISolution50μL,进行第一次磁珠纯化,使用50μLTris-HCl(1mM,pH8.0)回溶;
再加入PEG/NaClSPRISolution50μL,进行第二次磁珠纯化,使用25μLTris-HCl(1mM,pH8.0)回溶;
4.第一轮PCR扩增
反应后加入AgencourtAMPureXPreagent90μL,磁珠纯化后,使用31μLddH2O回溶,取上清后质控并进行芯片杂交。
5.目标区域捕获芯片杂交
本实施例中采用委托Roche合成的上述基因芯片CANPer-1.75M,参照芯片制造商提供的说明书进行杂交捕获及洗脱。最后使用21μLddH2O回溶杂交洗脱磁珠。
6.第二轮PCR扩增
反应后加入AgencourtAMPureXPreagent108μL,磁珠纯化后,使用31μLEB回溶,取上清后质控并上机测序。
7.上机测序
本实施例中,采用IlluminaHiSeq2500PE101+8+101程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
(四)下机数据生物信息分析
1.SOAPnukefilter:去除n≥10%和碱基质量值≤5的碱基数目>50%的reads;
2.Bwaaln->sampe|samtoolsview|samtoolssort:与reference序列比对,产生bam文件;
3.MarkDuplicates.jar:将同一个pe的相同的reads标记为重复;
4.GenomeAnalysisTK.jar-TRealignerTargetCreator、IndelRealigner:将比对不好的reads重新比对;
5.GenomeAnalysisTK.jar-TBaseRecalibrator、PrintReads:校正质量值;
6.Filt_bam:去掉mismatch≥3的reads;
7.QC:统计芯片的捕获效率、有效reads数、平均深度、重复率、覆盖度及未被覆盖的区间等信息;
8.识别SNV/InDel/SV/CNV及筛选其中的高频变异位点:
用MuTect(http://www.broadinstitute.org/cancer/cga/mutect)、varScan
(http://massgenomics.org/varscan)流程识别出SNP变异;
用gatk(https://www.broadinstitute.org/gatk/)、varScan、ForestSV
(http://sebatlab.ucsd.edu/index.php/software-data)流程识别出InDel变异;
用contra.py(http://contra-cnv.sourceforge.net/)流程识别出CNV;
用ForestSV(http://sebatlab.ucsd.edu/index.php/software-data)流程识别出SV;
所使用的筛选参数为:测序深度≥10X,在阴性(正常)样本中的变异率≤2%,在阳性样本中的变异率≥1%,在该待测样本数据中支持该变异的reads数≥3,与正常对照(体细胞)的读段支持比例具有显著差异(p≤0.05);
9.注释
注释变异的功能、reads支持数、变异频率、氨基酸变异及数据库Cosmic中的变异等,根据变异情况辅助判断疾病的可能来源。化疗药物对肿瘤细胞的杀伤效应与特定的一种(一组)基因的表达和/或多态性显著相关,通过相关基因的检测,预测化疗药物的疗效,选择合适的药物进行个体化化疗,已经成为提高疗效、减少无效治疗的合理选择。基于化疗药物以上特点,参考PharmGKB数据库,整合目前临床上所有的化疗药物以及与疗效相关的基因及疗效预测评判,形成化疗个体化用药解读数据库。并将化疗数据整合入肿瘤个体化信息流程,完成化疗药物的自动化解读。
靶向药物在肿瘤治疗中具有药效显著、副作用少的特点,但它对靶点(包括蛋白、DNA等)有依赖性,必须先对患者做靶点分析,才能确定患者能否用药。整合目前FDA批准的靶向药物,以及处于临床Ⅲ、Ⅳ的药物。依据NCCN临床指南,临床药物基因研究整理药物靶点基因与靶药疗效关系,形成肿瘤个体化靶药解读数据库。
10.结果分析
该样本检测到EGFR基因第451位氨基酸错义突变,属于12号外显子,该变异位点位于蛋白胞外拓扑结构域内,在COSMIC数据库中暂无记载,但相同位点所产生的p.[R451H]错义突变记载1次,报道与肺癌相关(18948947)。功能预测显示该变异为有害性变异,预测可能对基因功能产生影响。
人表皮生长因子受体,原癌基因c-erbB1的表达产物,属于受体酪氨酸激酶家族成员。EGFR主要位于细胞膜表面,通过与配体的结合激活自身酪氨酸磷酸化,自磷酸化促进下游信号传导途径,包括MPAK,PI3K和JNK通路等,诱导细胞增殖,分化等。在许多实体肿瘤中存在EGFR的突变或异常表达。临床研究表明EGFR突变阳性(18号外显子突变、19号外显子缺失、21号外显子突变)的患者对EGFR-TKI敏感(23344264),而野生型患者基本无效(23883922);20号外显子的突变(T790M为主,插入突变)与EGFR-TKI继发性耐药性相关(22263058)。
实施例2肺癌
1.目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助用于肺癌早筛诊断的目标区域捕获芯片LungPer。LungPer芯片包括了肺癌相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计145个基因,250Kb。基因列表如表2所示。
2.以受检者外周血样本检测为例进行操作说明,样本来自天津妇幼保健院。
同实施例1。
3.测序分析
按照实施例1的方法,测序结果如表5所示,检测结果见表6。
表5
表6
Gene | cHGVS | pHGVS | Function | 阳性样本变异频率(tumor_var_freq,%) |
ALK | c.[334G>A] | p.[A112T] | missense(错义) | 1.22 |
ROS1 | c.[1478G>A] | p.[R493H] | missense | 1.07 |
EGFR | c.[1351C>T] | p.[R451C] | missense | 1.41 |
TSC1 | c.[2066G>A] | p.[R689H] | missense | 1.32 |
ATM | c.[4723C>T] | p.[R1575C] | missense | 1.36 |
该样本检测到EGFR基因第451位氨基酸错义突变,属于12号外显子,该变异位点位于蛋白胞外拓扑结构域内,在COSMIC数据库中暂无记载,但相同位点所产生的p.[R451H]错义突变记载1次,报道与肺癌相关(18948947)。功能预测显示该变异为有害性变异,预测可能对基因功能产生影响。
人表皮生长因子受体,原癌基因c-erbB1的表达产物,属于受体酪氨酸激酶家族成员。EGFR主要位于细胞膜表面,通过与配体的结合激活自身酪氨酸磷酸化,自磷酸化促进下游信号传导途径,包括MPAK,PI3K和JNK通路等,诱导细胞增殖,分化等。在许多实体肿瘤中存在EGFR的突变或异常表达。临床研究表明EGFR突变阳性(18号外显子突变、19号外显子缺失、21号外显子突变)的患者对EGFR-TKI敏感(23344264),而野生型患者基本无效(23883922);20号外显子的突变(T790M为主,插入突变)与EGFR-TKI继发性耐药性相关(22263058)。
从突变分析结果看出该受检者检出与肺癌发生发展相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患结肺癌的风险及良恶性情况。
实施例3结直肠癌相关基因检测
一、芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助结直肠癌早筛诊断的目标区域捕获芯片ColorectalPer。ColorectalPer芯片包括了结直肠癌相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计60个基因,如表3所示,共123Kb。
二、以受检者外周血样本检测为例进行操作说明,样本来自天津妇幼保健院。
同实施例1。
三、测序分析
按照一般方法的步骤进行分析,测序数据统计结果如表7,变异检测结果如表8所示。
表7
表8
Gene | cHGVS | pHGVS | Function | tumor_var_freq(%) |
KRAS | c.[35G>A] | p.[Gly12Asp] | missense | 15.07 |
ARID1A | c.[805C>T] | p.[Gln269*] | nonsense | 1.22 |
ROS1 | c.[5557+750T>G] | . | intron | 1.01 |
NRAS | c.[291-59C>A] | . | intron | 1.09 |
MSH2 | c.[1663C>T] | p.[Arg555*] | nonsense | 9.38 |
该样本检出KRASp.[Gly12Asp]的错义突变,该变异在COSMIC数据库中记载10303次,约60%均报道与大肠癌发病相关。KRAS第12号密码子位于GTP结构域上,是KRAS最常见突变。
KRAS属于Ras基因家族成员,编码P21蛋白,在MAPK信号通路中起作用,是致癌基因,能够与GDP/GTP结合并促进GTP酶活性。当KRAS发生突变时不能被水解酶水解失活,处于持续激活状态,引起RAF/MAPK的上调,传递多种生存通路信号,从而使细胞过度生长、增殖,抵抗EGFR-TKIs的作用。其突变可以导致多种恶性肿瘤,包括肺癌,黏蛋白腺瘤,胰腺导管癌和结肠癌等。KRAS基因被激活最常见的方式是点突变,多发生在N端的第12、13和61、146密码子,其中以第12密码子突变最常见。不同突变位点对P21蛋白的活化机制不同,第12密码子突变可以减弱P21内在的GTP酶活性,并使细胞凋亡减少,细胞间接触抑制减弱。
该样本检出MSH2p.[Arg555*]的无义突变,该变异在COSMIC数据库暂无记载。MSH2第555号密码子所在区域功能研究不详,但此无义突变的发生会导致蛋白编码的提前终止,使得基因主要功能区无法表达,可能使基因功能受到损伤或丧失。
所编码的蛋白是DNA错配修复系统(MMR)的组分之一,形成2种不同的异二聚体:MutSα(MSH2-MSH6异二聚体)以及MutSβ(MSH2-MSH3异二聚体),可与DNA错配部位相结合因此启动DNA的修复功能。在错配结合之后,MutSα或β与MutLα异二聚体形成一个三元复合物,负责指导下游的MMR事件,包括链的识别、切除以及再合成。ATP的结合及水解在错配修复功能上起重要作用,ATP酶活性与MutSα相关。MutSα还可以在DNA同源重组修复功能上起作用。此基因与遗传性非息肉性结直肠癌类型I以及子宫内膜癌相关。
从突变分析结果看出该受检者检出与结直肠癌发生发展相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患结直肠癌的风险及良恶性情况。
实施例4妇科生殖道肿瘤相关基因检测
一、目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助妇科生殖道肿瘤早筛诊断的目标区域捕获芯片WCNPer。WCNPer芯片包括了妇科生殖道肿瘤相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计43个基因,如表4所示,共300Kb。
二、以受检者的外周血血浆作为研究对象,样本来自天津妇幼保健院,参考实施例1进行试验及数据分析。
三、结果分析
测序数据统计结果如表9,变异检测结果如表10所示。
表9
表10
该样本检出BRAFp.[G469V]的错义突变,该变异在COSMIC数据库中记载17次,在肺、大肠、胆道、上呼吸道、食道等肿瘤中检测发现。BRAF第469号密码子位于蛋白激酶结构域的ATP结合区,一项黑色素瘤的研究显示该突变为激活突变,可能导致BRAF从非活性状态变为活性状态或使得BRAF信号通路异常激活,与疾病的发生发展可能相关。
BRAF基因编码MAPK通路中的丝氨酸苏氨酸蛋白激酶,该酶可将信号由Ras转导至MEK1/2,从而参与细胞功能的调控,影响细胞分类、分化和分泌。此基因产生的突变与多种类型的癌症相关,如结直肠癌、肺癌、肝癌、胰腺癌、甲状腺癌、卵巢癌等。在卵巢癌中,BRAF基因突变频率为8%,是卵巢癌发生发展过程中的driver基因。
该样本检出TP53p.[G266V]的错义突变,该变异在COSMIC数据库中记载43次,在肺部、大肠、胰腺、卵巢等肿瘤中检测发现。TP53第266号密码子位于序列特异的DNA结合结构域,是TP53发挥功能的重要结构域,该变异可能使TP53的完整功能受到影响或丧失,TP53是肿瘤发生发展中的Driver基因,完整功能受到影响或丧失,可能与疾病发生发展相关。
TP53基因是迄今发现与肿瘤相关性最高的基因之一。作为重要的抑癌基因,在细胞周期调控,DNA损伤修复、细胞分化、凋亡和衰老等过程中发挥了关键作用。TP53基因与50%以上的人类恶性肿瘤有关。临床研究证实肿瘤中95.1%的p53点突变主要发生在高度保守的175、245、248、249、273和282位点。目前很多肿瘤治疗通过调控TP53蛋白实现。TP53基因在多种癌症中均有临床应用研究。TP53(外显子5-8)发生突变的乳腺癌患者预后较差,他莫昔芬疗效也明显降低。TP53的基因突变与功能丧失是卵巢癌中最常见的基因异常之一。
从突变分析结果看出该受检者检出与妇科疾病相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患妇科肿瘤的风险及良恶性情况。
上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明技术方案所做出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。
Claims (14)
1.一种试剂盒,其包含探针,所述探针固定在固相基质上或者所述探针游离于溶液中,所述探针能够特异性识别表1所列547个基因中的至少10个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表2所列的145个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表3所列的60个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表4所列的43个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少100个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少200个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少300个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少400个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少500个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因的基因区域;
任选地,所述探针的长度为25-300nt。
2.权利要求1的试剂盒,其特征在于,所述探针的获得包括,获得初始探针集以及筛选所述初始探针集。
3.权利要求2的试剂盒,其特征在于,所述获得初始探针集包括:
确定所述基因区域的参考序列,
从所述参考序列的一端开始,在所述参考序列上依次获取DNA片段直至所述参考序列的另一端,其中,
一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,所述DNA片段之间完全重叠、部分重叠或完全不重叠,所述初始探针集能够覆盖所述基因区域至少一次。
4.权利要求2的试剂盒,其特征在于,所述获取初始探针集包括:
确定所述基因区域在参考基因组上的位置,获取所述基因区域的参考序列,
从所述参考序列一端的第一个核苷酸开始拷贝所述参考序列获取第一条DNA片段,
从所述参考序列一端的第二个核苷酸开始拷贝所述参考序列获取第二条DNA片段,
从所述参考序列一端的第三个核苷酸开始拷贝所述参考序列获取第三条DNA片段,
这样依次获取后续DNA片段直至第N条DNA片段的一端超出所述参考序列的另一端,其中,
一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,N为所述初始探针集中包含的初始探针的总数。
5.权利要求3或4的试剂盒,其特征在于,所述筛选初始探针集包括:
将所述DNA片段与所述参考序列比对,获得每一条DNA片段在参考序列上的比对次数,过滤掉比对次数超过1的DNA片段。
6.权利要求5的试剂盒,其特征在于,所述筛选初始探针还包括,去除掉GC含量不在35-70%的DNA片段。
7.权利要求1-6任一试剂盒在获取常见癌症相关基因序列中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。
8.权利要求1-6任一试剂盒在常见癌症早期筛查中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。
9.一种构建目标区域测序文库的方法,其特征在于,包括:
(a)获取待测样本中的核酸,所述核酸由多个核酸片段组成,所述核酸片段来自断裂的基因组DNA和/或游离的DNA;
(b)末端修复所述核酸片段,获得末端修复片段;
(c)加碱基A至所述末端修复片段的两端,获得粘性末端片段;
(d)连接接头于所述粘性末端片段的两端,获得接头连接片段;
(e)对所述接头连接片段进行第一扩增,获得第一扩增产物;
(f)利用权利要求1-6任一试剂盒对所述第一扩增产物进行捕获,获得所述目标区域;以及,
(g)对所述目标区域进行第二扩增,获得第二扩增产物,所述第二扩增产物构成所述目标区域测序文库;
任选地,所述接头末端为T-粘性末端。
10.一种测序方法,其特征在于,包括:
根据权利要求9的方法构建目标区域测序文库;
对所述目标区域测序文库进行测序,获得测序数据,所述测序数据由多个读段组成;
任选地,所述测序为双末端测序,所述测序数据由多对读段对组成。
11.一种检测目标区域变异的方法,其特征在于,包括,
(1)利用权利要求10的方法,获得测序数据;
(2)基于所述测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNV、InDel、SV和CNV至少之一。
12.权利要求11的方法,其特征在于,步骤(2)包括,
将所述测序数据与参考序列进行第一比对,获得第一比对结果;
将所述第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果;
基于所述第一比对结果和所述第二比对结果,同时检测所述目标区域中的SNP、InDel、SV和CNV变异中的至少两种;其中,
所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列;
任选地,在所述第一比对之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段;
任选地,在所述第二比对之前,去除掉第一比对结果中的一个读段对中的两个读段相同的读段对;
任选地,所述参考序列为HG19;
任选地,所述第一比对为全局比对,所述第二比对为局部比对。
13.权利要求11或12的方法,其特征在于,步骤(2)还包括,当所述变异位点中的至少之一满足以下,则判定所述待测样本为阳性样本:
在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;
任选地,步骤(2)还包括,当所述变异位点中的至少之一满足以下,则判定所述待测样本为阳性样本:
测序深度不小于10X,
至少有3个读段的支持,
在阴性对照样本中的读段支持数少于2条,
在阳性对照样本中的突变率大于1%,以及
变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。
14.一种检测目标区域变异的装置,其特征在于,包括,
数据获取单元,用于实现权利要求10的方法,获取所述目标区域的测序数据,所述测序数据由多个读段组成;
检测单元,用于基于来自数据获取单元的测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNV、InDel、SV和CNV至少之一;
任选地,所述检测单元包括第一比对子单元、第二比对子单元和变异识别子单元,
所述第一比对子单元用以将来自数据获取单元的测序数据与参考序列进行第一比对,获得第一比对结果,
所述第二比对子单元用以将来自所述第一比对子单元的第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果,
所述变异识别子单元用以基于来自所述第一比对子单元的第一比对结果和来自所述第二比对子单元的第二比对结果,同时检测所述目标区域中的SNV、InDel、SV和CNV变异中的至少两种,获得变异位点信息,其中,
所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列;
任选地,所述检测单元还包括第一过滤子单元,所述第一过滤子单元与所述第一比对子单元连接,用于在所述测序数据进入所述第一比对子单元之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段;
任选地,所述检测单元还包括第二过滤子单元,所述第二过滤子单元分别与所述第一比对子单元和所述第二比对子单元连接,用于在所述第一比对结果进入所述第二比对子单元之前,去除掉来自所述第一比对子单元的第一比对结果中的一个读段对中的两个读段相同的读段对;
任选地,所述参考序列为HG19;
任选地,所述第一比对单元中的第一比对为全局比对,所述第二比对子单元中的第二比对为局部比对;
任选地,所述检测单元还包括判定子单元,所述判定子单元用以判定来自所述变异识别子单元中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:
在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;
任选地,所述检测单元还包括判定子单元,所述判定子单元用以判定来自所述变异识别子单元中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:
测序深度不小于10X,
至少有3个读段的支持,
在阴性对照样本中的读段支持数少于2条,
在阳性对照样本中的突变率大于1%,以及
变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410778723.4A CN105779434A (zh) | 2014-12-15 | 2014-12-15 | 试剂盒及其用途 |
HK16112046.1A HK1223969A1 (zh) | 2014-12-15 | 2016-10-19 | 試劑盒及其用途 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410778723.4A CN105779434A (zh) | 2014-12-15 | 2014-12-15 | 试剂盒及其用途 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105779434A true CN105779434A (zh) | 2016-07-20 |
Family
ID=56374803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410778723.4A Pending CN105779434A (zh) | 2014-12-15 | 2014-12-15 | 试剂盒及其用途 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105779434A (zh) |
HK (1) | HK1223969A1 (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107723352A (zh) * | 2016-08-12 | 2018-02-23 | 嘉兴允英医学检验有限公司 | 一种循环肿瘤dna肝癌驱动基因高通量检测方法 |
CN107841793A (zh) * | 2017-08-02 | 2018-03-27 | 重庆市肿瘤研究所 | 肺癌多基因突变文库的构建方法 |
CN108148910A (zh) * | 2017-12-18 | 2018-06-12 | 广东省人民医院(广东省医学科学院) | 一种肺癌相关的285基因靶向捕获测序试剂盒及其应用 |
CN108315425A (zh) * | 2018-04-10 | 2018-07-24 | 广东省人民医院(广东省医学科学院) | 甲状腺癌转移相关基因检测用的pcr特异性引物、试剂盒及其使用方法 |
CN108315424A (zh) * | 2018-04-10 | 2018-07-24 | 广东省人民医院(广东省医学科学院) | 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法 |
CN108588201A (zh) * | 2018-05-11 | 2018-09-28 | 浙江省人民医院 | 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置 |
CN109554475A (zh) * | 2018-12-29 | 2019-04-02 | 江苏为真生物医药技术股份有限公司 | 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒 |
CN109609646A (zh) * | 2019-01-23 | 2019-04-12 | 浙江大学 | 一种用于监测上皮性卵巢癌易感性的检测试剂盒 |
CN110878358A (zh) * | 2019-12-19 | 2020-03-13 | 上海宝藤生物医药科技股份有限公司 | 一组甲状腺癌标志物及其应用 |
CN112391455A (zh) * | 2019-08-14 | 2021-02-23 | 宁波爱她基因科技有限公司 | 一种用于同源重组修复缺陷检测的试剂盒 |
WO2021169874A1 (zh) * | 2020-02-25 | 2021-09-02 | 博尔诚(北京)科技有限公司 | 一种检测3种管腔性器官肿瘤的探针组合物 |
CN113481299A (zh) * | 2021-06-30 | 2021-10-08 | 苏州京脉生物科技有限公司 | 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法 |
CN113652484A (zh) * | 2021-08-03 | 2021-11-16 | 苏州京脉生物科技有限公司 | 测序panel的应用、试剂盒及测序文库的制备方法 |
CN117144003A (zh) * | 2023-07-19 | 2023-12-01 | 苏州吉因加生物医学工程有限公司 | 用于mrd检测的癌种特异核心探针组的设计方法及其应用 |
CN117497047A (zh) * | 2023-11-16 | 2024-02-02 | 杭州联川生物技术股份有限公司 | 基于外显子测序筛选肿瘤基因标志物的方法、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030194724A1 (en) * | 2002-04-10 | 2003-10-16 | Sorenson Jon M | Mutation detection and identification |
WO2012031008A2 (en) * | 2010-08-31 | 2012-03-08 | The General Hospital Corporation | Cancer-related biological materials in microvesicles |
WO2013097328A1 (zh) * | 2011-12-29 | 2013-07-04 | 深圳华大基因科技服务有限公司 | 基因组indel位点标记方法和装置 |
WO2013127049A1 (zh) * | 2012-02-27 | 2013-09-06 | 深圳华大基因科技有限公司 | 一种检测染色体sts区域微缺失的方法及其装置 |
CN103290137A (zh) * | 2013-06-26 | 2013-09-11 | 北京迈基诺基因科技有限责任公司 | 一种肿瘤易感基因的筛查方法 |
CN103993069A (zh) * | 2014-03-21 | 2014-08-20 | 深圳华大基因科技服务有限公司 | 病毒整合位点捕获测序分析方法 |
CN104059966A (zh) * | 2014-05-20 | 2014-09-24 | 吴松 | Stag2基因突变序列、其检测方法以及stag2基因突变在检测膀胱癌中的应用 |
-
2014
- 2014-12-15 CN CN201410778723.4A patent/CN105779434A/zh active Pending
-
2016
- 2016-10-19 HK HK16112046.1A patent/HK1223969A1/zh unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030194724A1 (en) * | 2002-04-10 | 2003-10-16 | Sorenson Jon M | Mutation detection and identification |
WO2012031008A2 (en) * | 2010-08-31 | 2012-03-08 | The General Hospital Corporation | Cancer-related biological materials in microvesicles |
WO2013097328A1 (zh) * | 2011-12-29 | 2013-07-04 | 深圳华大基因科技服务有限公司 | 基因组indel位点标记方法和装置 |
WO2013127049A1 (zh) * | 2012-02-27 | 2013-09-06 | 深圳华大基因科技有限公司 | 一种检测染色体sts区域微缺失的方法及其装置 |
CN103290137A (zh) * | 2013-06-26 | 2013-09-11 | 北京迈基诺基因科技有限责任公司 | 一种肿瘤易感基因的筛查方法 |
CN103993069A (zh) * | 2014-03-21 | 2014-08-20 | 深圳华大基因科技服务有限公司 | 病毒整合位点捕获测序分析方法 |
CN104059966A (zh) * | 2014-05-20 | 2014-09-24 | 吴松 | Stag2基因突变序列、其检测方法以及stag2基因突变在检测膀胱癌中的应用 |
Non-Patent Citations (9)
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107723352A (zh) * | 2016-08-12 | 2018-02-23 | 嘉兴允英医学检验有限公司 | 一种循环肿瘤dna肝癌驱动基因高通量检测方法 |
CN107841793A (zh) * | 2017-08-02 | 2018-03-27 | 重庆市肿瘤研究所 | 肺癌多基因突变文库的构建方法 |
CN108148910A (zh) * | 2017-12-18 | 2018-06-12 | 广东省人民医院(广东省医学科学院) | 一种肺癌相关的285基因靶向捕获测序试剂盒及其应用 |
CN108315424B (zh) * | 2018-04-10 | 2021-08-06 | 广东省人民医院(广东省医学科学院) | 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法 |
CN108315425A (zh) * | 2018-04-10 | 2018-07-24 | 广东省人民医院(广东省医学科学院) | 甲状腺癌转移相关基因检测用的pcr特异性引物、试剂盒及其使用方法 |
CN108315424A (zh) * | 2018-04-10 | 2018-07-24 | 广东省人民医院(广东省医学科学院) | 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法 |
CN108588201A (zh) * | 2018-05-11 | 2018-09-28 | 浙江省人民医院 | 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置 |
CN109554475A (zh) * | 2018-12-29 | 2019-04-02 | 江苏为真生物医药技术股份有限公司 | 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒 |
WO2020134950A1 (zh) * | 2018-12-29 | 2020-07-02 | 江苏为真生物医药技术股份有限公司 | 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒 |
CN109609646A (zh) * | 2019-01-23 | 2019-04-12 | 浙江大学 | 一种用于监测上皮性卵巢癌易感性的检测试剂盒 |
CN109609646B (zh) * | 2019-01-23 | 2022-04-26 | 浙江大学 | 一种用于监测上皮性卵巢癌易感性的检测试剂盒 |
CN112391455A (zh) * | 2019-08-14 | 2021-02-23 | 宁波爱她基因科技有限公司 | 一种用于同源重组修复缺陷检测的试剂盒 |
CN110878358B (zh) * | 2019-12-19 | 2020-08-25 | 上海宝藤生物医药科技股份有限公司 | 一组甲状腺癌标志物及其应用 |
CN110878358A (zh) * | 2019-12-19 | 2020-03-13 | 上海宝藤生物医药科技股份有限公司 | 一组甲状腺癌标志物及其应用 |
WO2021169874A1 (zh) * | 2020-02-25 | 2021-09-02 | 博尔诚(北京)科技有限公司 | 一种检测3种管腔性器官肿瘤的探针组合物 |
CN113481299A (zh) * | 2021-06-30 | 2021-10-08 | 苏州京脉生物科技有限公司 | 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法 |
CN113481299B (zh) * | 2021-06-30 | 2022-05-10 | 苏州京脉生物科技有限公司 | 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法 |
CN113652484A (zh) * | 2021-08-03 | 2021-11-16 | 苏州京脉生物科技有限公司 | 测序panel的应用、试剂盒及测序文库的制备方法 |
CN117144003A (zh) * | 2023-07-19 | 2023-12-01 | 苏州吉因加生物医学工程有限公司 | 用于mrd检测的癌种特异核心探针组的设计方法及其应用 |
CN117497047A (zh) * | 2023-11-16 | 2024-02-02 | 杭州联川生物技术股份有限公司 | 基于外显子测序筛选肿瘤基因标志物的方法、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
HK1223969A1 (zh) | 2017-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105779434A (zh) | 试剂盒及其用途 | |
CN105780129B (zh) | 目标区域测序文库构建方法 | |
WO2016095093A1 (zh) | 肿瘤筛查方法、目标区域变异检测方法和装置 | |
CN104745679B (zh) | 一种无创检测egfr基因突变的方法及试剂盒 | |
CN108753967A (zh) | 一种用于肝癌检测的基因集及其panel检测设计方法 | |
AU2013281355B2 (en) | Targeted RNA-seq methods and materials for the diagnosis of prostate cancer | |
CN109637587B (zh) | 检测基因融合突变的方法、装置、存储介质、处理器及转录组数据表达量标准化的方法 | |
CN105779435A (zh) | 试剂盒及其用途 | |
Han et al. | Clinical implications of circulating tumor DNA from ascites and serial plasma in ovarian cancer | |
WO2009021338A1 (en) | Alternative splicing gene variants in cancer detection | |
CN105779432A (zh) | 试剂盒及其用途 | |
WO2017075784A1 (zh) | 肺腺癌生物标记物及其应用 | |
CN110117652A (zh) | 肝癌早期诊断方法 | |
CN107312770A (zh) | 一种用于高通量测序检测的肿瘤brca1/2基因变异文库的构建方法及其应用 | |
US20190256920A1 (en) | Differential Identification of Pancreatic Cysts | |
CN105779433A (zh) | 试剂盒及其用途 | |
CN109161543B (zh) | 用于富集低频dna突变的dna探针及其应用 | |
CN110004229A (zh) | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 | |
WO2014190927A1 (zh) | 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒 | |
US20190352704A1 (en) | Benign thyroid nodule-specific gene | |
Fielding et al. | Evaluation of Endobronchial Ultrasound-Guided Transbronchial Needle Aspiration (EBUS-TBNA) Samples from Advanced Non-Small Cell Lung Cancer for Whole Genome, Whole Exome and Comprehensive Panel Sequencing | |
CN106282366A (zh) | 一种与前列腺癌相关的分子标记物及其应用 | |
CN106498062A (zh) | 一种诊断前列腺癌的产品及其应用 | |
CN106554993A (zh) | 试剂盒及其用途 | |
CN114514327A (zh) | 使用同步标志物检测评估弥漫性神经胶质瘤和对治疗的应答性 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1223969 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160720 |
|
RJ01 | Rejection of invention patent application after publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1223969 Country of ref document: HK |