JP2016185142A - Method for assisting diagnosis of recurrence risk of colon cancer, program, and computer system - Google Patents
Method for assisting diagnosis of recurrence risk of colon cancer, program, and computer system Download PDFInfo
- Publication number
- JP2016185142A JP2016185142A JP2015183024A JP2015183024A JP2016185142A JP 2016185142 A JP2016185142 A JP 2016185142A JP 2015183024 A JP2015183024 A JP 2015183024A JP 2015183024 A JP2015183024 A JP 2015183024A JP 2016185142 A JP2016185142 A JP 2016185142A
- Authority
- JP
- Japan
- Prior art keywords
- risk
- group
- gene
- expression level
- recurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000003745 diagnosis Methods 0.000 title claims abstract description 24
- 208000029742 colonic neoplasm Diseases 0.000 title abstract description 13
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 300
- 230000014509 gene expression Effects 0.000 claims abstract description 250
- 239000012472 biological sample Substances 0.000 claims abstract description 83
- 210000000349 chromosome Anatomy 0.000 claims abstract description 21
- 102100026802 72 kDa type IV collagenase Human genes 0.000 claims abstract description 12
- 102100025672 Angiopoietin-related protein 2 Human genes 0.000 claims abstract description 10
- 102100038597 Calcium homeostasis modulator protein 2 Human genes 0.000 claims abstract description 10
- 102100030149 Complement C1r subcomponent Human genes 0.000 claims abstract description 10
- 102100025406 Complement C1s subcomponent Human genes 0.000 claims abstract description 10
- 102100030146 Epithelial membrane protein 3 Human genes 0.000 claims abstract description 10
- 102100038367 Gremlin-1 Human genes 0.000 claims abstract description 10
- 101000627872 Homo sapiens 72 kDa type IV collagenase Proteins 0.000 claims abstract description 10
- 101000693081 Homo sapiens Angiopoietin-related protein 2 Proteins 0.000 claims abstract description 10
- 101000794279 Homo sapiens Complement C1r subcomponent Proteins 0.000 claims abstract description 10
- 101000934958 Homo sapiens Complement C1s subcomponent Proteins 0.000 claims abstract description 10
- 101001032872 Homo sapiens Gremlin-1 Proteins 0.000 claims abstract description 10
- 101001046677 Homo sapiens Integrin alpha-V Proteins 0.000 claims abstract description 10
- 101001008853 Homo sapiens Kelch-like protein 5 Proteins 0.000 claims abstract description 10
- 101001060852 Homo sapiens Ras-related protein Rab-34 Proteins 0.000 claims abstract description 10
- 101001128094 Homo sapiens Ras-related protein Rab-34, isoform NARR Proteins 0.000 claims abstract description 10
- 102100022337 Integrin alpha-V Human genes 0.000 claims abstract description 10
- 102100027785 Kelch-like protein 5 Human genes 0.000 claims abstract description 10
- 102100023647 Selenoprotein M Human genes 0.000 claims abstract description 10
- 102100037236 Tyrosine-protein kinase receptor UFO Human genes 0.000 claims abstract description 10
- 102100024940 Cathepsin K Human genes 0.000 claims abstract description 9
- 101000761509 Homo sapiens Cathepsin K Proteins 0.000 claims abstract description 9
- 101000807561 Homo sapiens Tyrosine-protein kinase receptor UFO Proteins 0.000 claims abstract description 9
- 101150103877 Selenom gene Proteins 0.000 claims abstract description 9
- 102100035784 Decorin Human genes 0.000 claims abstract 4
- 101000741349 Homo sapiens Calcium homeostasis modulator protein 2 Proteins 0.000 claims abstract 4
- 101001000206 Homo sapiens Decorin Proteins 0.000 claims abstract 4
- 101001011788 Homo sapiens Epithelial membrane protein 3 Proteins 0.000 claims abstract 4
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 87
- 101150105104 Kras gene Proteins 0.000 claims description 46
- 238000005259 measurement Methods 0.000 claims description 35
- 206010064571 Gene mutation Diseases 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 16
- 101000586383 Homo sapiens Putative ribosome-binding factor A, mitochondrial Proteins 0.000 claims description 9
- 102100029728 Putative ribosome-binding factor A, mitochondrial Human genes 0.000 claims description 9
- 102100031921 Ras-related protein Rab-34, isoform NARR Human genes 0.000 claims description 9
- 102100031121 SLIT-ROBO Rho GTPase-activating protein 2C Human genes 0.000 claims description 9
- 102100022617 COMM domain-containing protein 7 Human genes 0.000 claims description 3
- 102100034953 Coiled-coil domain-containing protein 68 Human genes 0.000 claims description 3
- 102100032636 Copine-1 Human genes 0.000 claims description 3
- 102100031655 Cytochrome b5 Human genes 0.000 claims description 3
- 102100031007 Cytosolic non-specific dipeptidase Human genes 0.000 claims description 3
- 102100032501 Death-inducer obliterator 1 Human genes 0.000 claims description 3
- 102100031675 DnaJ homolog subfamily C member 5 Human genes 0.000 claims description 3
- 102100027149 GDP-fucose protein O-fucosyltransferase 1 Human genes 0.000 claims description 3
- 101000899983 Homo sapiens COMM domain-containing protein 7 Proteins 0.000 claims description 3
- 101000946607 Homo sapiens Coiled-coil domain-containing protein 68 Proteins 0.000 claims description 3
- 101000922386 Homo sapiens Cytochrome b5 Proteins 0.000 claims description 3
- 101000845893 Homo sapiens DnaJ homolog subfamily C member 5 Proteins 0.000 claims description 3
- 101001122376 Homo sapiens GDP-fucose protein O-fucosyltransferase 1 Proteins 0.000 claims description 3
- 101001138875 Homo sapiens Kinesin-like protein KIF3B Proteins 0.000 claims description 3
- 101000598199 Homo sapiens Mitochondrial import inner membrane translocase subunit Tim21 Proteins 0.000 claims description 3
- 101001038567 Homo sapiens Nucleolar protein 4-like Proteins 0.000 claims description 3
- 101000728236 Homo sapiens Polycomb group protein ASXL1 Proteins 0.000 claims description 3
- 101000918444 Homo sapiens Protein FAM217B Proteins 0.000 claims description 3
- 101001123080 Homo sapiens Protein phosphatase 1 regulatory subunit 3D Proteins 0.000 claims description 3
- 101001093096 Homo sapiens Signal peptidase complex catalytic subunit SEC11C Proteins 0.000 claims description 3
- 101000796121 Homo sapiens Thioredoxin-like protein 1 Proteins 0.000 claims description 3
- 101000773153 Homo sapiens Thioredoxin-like protein 4A Proteins 0.000 claims description 3
- 101000652707 Homo sapiens Transcription initiation factor TFIID subunit 4 Proteins 0.000 claims description 3
- 101000582993 Homo sapiens Unconventional myosin-Vb Proteins 0.000 claims description 3
- 101000803689 Homo sapiens Vacuolar protein sorting-associated protein 4B Proteins 0.000 claims description 3
- 101000730644 Homo sapiens Zinc finger protein PLAGL2 Proteins 0.000 claims description 3
- 102100020693 Kinesin-like protein KIF3B Human genes 0.000 claims description 3
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 3
- 102100036957 Mitochondrial import inner membrane translocase subunit Tim21 Human genes 0.000 claims description 3
- 102100022929 Nuclear receptor coactivator 6 Human genes 0.000 claims description 3
- 102100040313 Nucleolar protein 4-like Human genes 0.000 claims description 3
- 102100036878 PHD finger protein 20 Human genes 0.000 claims description 3
- 102100029799 Polycomb group protein ASXL1 Human genes 0.000 claims description 3
- 102100029118 Protein FAM217B Human genes 0.000 claims description 3
- 102100028547 Protein phosphatase 1 regulatory subunit 3D Human genes 0.000 claims description 3
- 102100025858 RNA-binding protein 39 Human genes 0.000 claims description 3
- 102100034742 Rotatin Human genes 0.000 claims description 3
- 102100036267 Signal peptidase complex catalytic subunit SEC11C Human genes 0.000 claims description 3
- 102100025806 Solute carrier family 66 member 2 Human genes 0.000 claims description 3
- 102100031373 Thioredoxin-like protein 1 Human genes 0.000 claims description 3
- 102100030272 Thioredoxin-like protein 4A Human genes 0.000 claims description 3
- 102100030833 Transcription initiation factor TFIID subunit 4 Human genes 0.000 claims description 3
- 102100028787 Tumor necrosis factor receptor superfamily member 11A Human genes 0.000 claims description 3
- 102100030366 Unconventional myosin-Vb Human genes 0.000 claims description 3
- 102100035086 Vacuolar protein sorting-associated protein 4B Human genes 0.000 claims description 3
- 102100040832 Zinc finger protein 407 Human genes 0.000 claims description 3
- 102100032571 Zinc finger protein PLAGL2 Human genes 0.000 claims description 3
- 238000002493 microarray Methods 0.000 claims description 3
- 102100023245 Asparagine-tRNA ligase, cytoplasmic Human genes 0.000 claims description 2
- 101150028732 CHMP4B gene Proteins 0.000 claims description 2
- 102100038274 Charged multivesicular body protein 4b Human genes 0.000 claims description 2
- 101100327868 Danio rerio chmp4c gene Proteins 0.000 claims description 2
- 101000624939 Homo sapiens Asparagine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 2
- 101000941754 Homo sapiens Copine-1 Proteins 0.000 claims description 2
- 101000653542 Homo sapiens Transcription factor-like 5 protein Proteins 0.000 claims description 2
- 101000964701 Homo sapiens Zinc finger protein 407 Proteins 0.000 claims description 2
- -1 MBP Proteins 0.000 claims description 2
- 102100030647 Transcription factor-like 5 protein Human genes 0.000 claims description 2
- 101000587743 Homo sapiens SLIT-ROBO Rho GTPase-activating protein 2C Proteins 0.000 claims 3
- 101000803403 Homo sapiens Vimentin Proteins 0.000 claims 3
- 102100035071 Vimentin Human genes 0.000 claims 3
- 230000002596 correlated effect Effects 0.000 claims 2
- 101000919690 Homo sapiens Cytosolic non-specific dipeptidase Proteins 0.000 claims 1
- 101000869896 Homo sapiens Death-inducer obliterator 1 Proteins 0.000 claims 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims 1
- 101000974349 Homo sapiens Nuclear receptor coactivator 6 Proteins 0.000 claims 1
- 101001071230 Homo sapiens PHD finger protein 20 Proteins 0.000 claims 1
- 101000604565 Homo sapiens Phosphatidylinositol glycan anchor biosynthesis class U protein Proteins 0.000 claims 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 claims 1
- 101000657452 Homo sapiens Rotatin Proteins 0.000 claims 1
- 101000693324 Homo sapiens Solute carrier family 66 member 2 Proteins 0.000 claims 1
- 101000652226 Homo sapiens Suppressor of cytokine signaling 6 Proteins 0.000 claims 1
- 101001087394 Homo sapiens Tyrosine-protein phosphatase non-receptor type 1 Proteins 0.000 claims 1
- 102100038725 Phosphatidylinositol glycan anchor biosynthesis class U protein Human genes 0.000 claims 1
- 108010038036 Receptor Activator of Nuclear Factor-kappa B Proteins 0.000 claims 1
- 102100030529 Suppressor of cytokine signaling 7 Human genes 0.000 claims 1
- 102100033001 Tyrosine-protein phosphatase non-receptor type 1 Human genes 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 10
- 101000880044 Homo sapiens SLIT-ROBO Rho GTPase-activating protein 3 Proteins 0.000 abstract 1
- 102100027916 Ras-related protein Rab-34 Human genes 0.000 abstract 1
- 102100037372 SLIT-ROBO Rho GTPase-activating protein 2 Human genes 0.000 abstract 1
- 230000035772 mutation Effects 0.000 description 31
- 238000010200 validation analysis Methods 0.000 description 26
- 210000001519 tissue Anatomy 0.000 description 25
- 238000012549 training Methods 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 150000007523 nucleic acids Chemical class 0.000 description 16
- 239000000523 sample Substances 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 15
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 239000002299 complementary DNA Substances 0.000 description 12
- 108020004394 Complementary RNA Proteins 0.000 description 11
- 239000003184 complementary RNA Substances 0.000 description 11
- 238000004393 prognosis Methods 0.000 description 10
- 230000004083 survival effect Effects 0.000 description 10
- 239000000126 substance Substances 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 108050003263 Calcium homeostasis modulator protein 2 Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 102000004237 Decorin Human genes 0.000 description 6
- 108090000738 Decorin Proteins 0.000 description 6
- 101710143764 Epithelial membrane protein 3 Proteins 0.000 description 6
- 101710130202 SLIT-ROBO Rho GTPase-activating protein 2C Proteins 0.000 description 6
- 108010065472 Vimentin Proteins 0.000 description 6
- 102000013127 Vimentin Human genes 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 229920002477 rna polymer Polymers 0.000 description 6
- 210000005048 vimentin Anatomy 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 102100030708 GTPase KRas Human genes 0.000 description 5
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 5
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000002853 nucleic acid probe Substances 0.000 description 5
- 238000001356 surgical procedure Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 108090001008 Avidin Proteins 0.000 description 4
- 206010069755 K-ras gene mutation Diseases 0.000 description 4
- 108010090804 Streptavidin Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 2
- 101710115436 Cytosolic non-specific dipeptidase Proteins 0.000 description 2
- 101710081796 Death-inducer obliterator 1 Proteins 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101000648503 Homo sapiens Tumor necrosis factor receptor superfamily member 11A Proteins 0.000 description 2
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 2
- 108010016165 Matrix Metalloproteinase 2 Proteins 0.000 description 2
- 101710111879 Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 102000047918 Myelin Basic Human genes 0.000 description 2
- 101710107068 Myelin basic protein Proteins 0.000 description 2
- 102000002072 Non-Receptor Type 1 Protein Tyrosine Phosphatase Human genes 0.000 description 2
- 108010015847 Non-Receptor Type 1 Protein Tyrosine Phosphatase Proteins 0.000 description 2
- 101710115514 Nuclear receptor coactivator 6 Proteins 0.000 description 2
- 101000610549 Oryza sativa subsp. japonica Thioredoxin-like 3-3 Proteins 0.000 description 2
- 108091012461 PHD finger protein 20 Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 101710205955 RNA-binding protein 39 Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 101710200213 Rotatin Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 101710187586 Solute carrier family 66 member 2 Proteins 0.000 description 2
- 102100030530 Suppressor of cytokine signaling 6 Human genes 0.000 description 2
- 101710137416 Suppressor of cytokine signaling 6 Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000002429 large intestine Anatomy 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 238000013517 stratification Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 108050005269 72kDa type IV collagenases Proteins 0.000 description 1
- 102000017304 72kDa type IV collagenases Human genes 0.000 description 1
- 102000003924 Asparagine-tRNA ligases Human genes 0.000 description 1
- 108090000314 Asparagine-tRNA ligases Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108090000625 Cathepsin K Proteins 0.000 description 1
- 102000004171 Cathepsin K Human genes 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 101710125095 Copine-1 Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 101710096325 Heat shock factor-binding protein Proteins 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 101150033052 MAS5 gene Proteins 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101100344462 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YDJ1 gene Proteins 0.000 description 1
- 101710095025 Selenoprotein M Proteins 0.000 description 1
- 101710143649 Zinc finger protein 407 Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 108010023337 axl receptor tyrosine kinase Proteins 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108700042226 ras Genes Proteins 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本発明は、大腸癌の再発リスクの診断を補助する方法に関する。特に、大腸癌患者の組織から得た核酸について、所定の遺伝子群に属する遺伝子の発現量データを取得し、取得した発現量データに基づいて、該患者の大腸癌の再発リスクの診断を補助する方法、プログラムおよびコンピュータシステムに関する。 The present invention relates to a method for assisting diagnosis of recurrence risk of colorectal cancer. In particular, with respect to nucleic acids obtained from tissues of colorectal cancer patients, the expression level data of genes belonging to a predetermined gene group is acquired, and diagnosis of recurrence risk of colorectal cancer of the patient is assisted based on the acquired expression level data The present invention relates to a method, a program, and a computer system.
大腸癌は、盲腸、結腸、直腸に発生する癌腫の総称である。多くの癌と同様に、大腸癌においても早期の発見がその治療にとって重要である。癌の治療においては、強力な副作用を有する抗癌剤が使用される場合があり、この場合には患者は大きな負担を強いられる。このような患者の負担を低減するために、医師が患者にとって最適な治療法を選択することは重要であり、そのためには、医師は、患者の癌の進行度、悪性度、症状などを的確に把握することが必要である。 Colorectal cancer is a general term for carcinomas that occur in the cecum, colon, and rectum. Like many cancers, early detection is important for the treatment of colorectal cancer. In the treatment of cancer, an anticancer agent having a strong side effect may be used, and in this case, the patient is forced to bear a great burden. In order to reduce such a burden on the patient, it is important for the doctor to select the most appropriate treatment method for the patient, and for this purpose, the doctor accurately determines the progression, malignancy, symptoms, etc. of the patient's cancer. It is necessary to grasp.
また、患者の予後を正確に予測することは、患者の予後におけるQOL(Quality of Life)の向上のために重要である。大腸癌の予後予測を行なうための方法として、組織病理学的手法であるデュークス分類が知られている。デュークス分類は、国際的に広く用いられており、癌の浸潤の度合いに応じてデュークスA、B、CおよびDのいずれかに分類する方法である。デュークス分類は、医師が肉眼で行なう分類法であるため、医師によって誤差が生じやすいという問題がある。また、大腸癌組織を取得した施設の違いにより診断の差が生じやすいという問題もある。 In addition, accurately predicting the prognosis of a patient is important for improving the quality of life (QOL) in the prognosis of the patient. Dukes classification, which is a histopathological technique, is known as a method for predicting the prognosis of colorectal cancer. Dukes classification is widely used internationally, and is a method of classifying into Dukes A, B, C, and D according to the degree of cancer invasion. The Dukes classification is a classification method performed by the doctor with the naked eye, and there is a problem that errors are likely to occur by the doctor. In addition, there is also a problem that a difference in diagnosis is likely to occur due to a difference in facilities where colon cancer tissues are acquired.
近年、特定の遺伝子の発現量の増減に着目した、遺伝子マーカーを用いる癌の予後予測のための研究が行なわれている。例えば、特許文献1には、大腸癌と診断されたか、または大腸癌の治療を受けた患者における、大腸癌の再発を予測するための分子的解析が開示されている。特許文献1に開示される技術は、特定の大腸癌に対する再発の予後予測を行なうものであり、全ての大腸癌に適用できないという問題がある。 In recent years, studies for predicting the prognosis of cancer using genetic markers have been conducted, focusing on the increase or decrease in the expression level of a specific gene. For example, Patent Document 1 discloses a molecular analysis for predicting recurrence of colorectal cancer in a patient diagnosed with colorectal cancer or treated for colorectal cancer. The technique disclosed in Patent Document 1 predicts the prognosis of recurrence for a specific colorectal cancer and has a problem that it cannot be applied to all colorectal cancers.
本発明は、種々の症例の大腸癌について、信頼性の高い大腸癌の再発リスクの診断補助方法、プログラムおよびコンピュータシステムを提供することを目的とする。 An object of the present invention is to provide a highly reliable diagnosis assisting method, program, and computer system for recurrence risk of colorectal cancer in various cases of colorectal cancer.
本発明者らは、上記の課題を解決すべく鋭意研究を重ねた結果、クラスタ解析により、大腸癌を3つのタイプに分類できることを見出した。そして、この3つのタイプが大腸癌の予後と関連していること、および、得られる結果が十分に安定していることを見出し、本発明を完成させた。 As a result of intensive studies to solve the above problems, the present inventors have found that colorectal cancer can be classified into three types by cluster analysis. The present inventors have found that these three types are related to the prognosis of colorectal cancer and that the obtained results are sufficiently stable, thereby completing the present invention.
本発明によれば、大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から選択される複数の遺伝子、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から選択される複数の遺伝子、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から選択される複数の遺伝子の発現量をそれぞれ測定する測定工程と、前記測定工程において測定された発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、を含む、大腸癌の再発リスクの診断を補助する方法が提供される。 According to the present invention, in a biological sample collected from a colorectal cancer patient, a plurality of genes selected from the first gene group present in the region from 18q21 to 18q23 on the long chromosome 18 chain, long chromosome 20 chain A plurality of genes selected from the second gene group existing in the region from 20q11 to 20q13 above, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5, MMP2, RAB34 , SELM, SRGAP2P1, and a measurement process for measuring the expression levels of a plurality of genes selected from the third gene group including VIM, and recurrence of colorectal cancer in the patient based on the expression levels measured in the measurement process Determining the risk, and a method for assisting diagnosis of recurrence risk of colorectal cancer is provided.
本発明によれば、信頼性の高い大腸癌再発リスクの診断補助方法を提供することができる。 According to the present invention, it is possible to provide a highly reliable method for assisting diagnosis of colorectal cancer recurrence risk.
本実施形態の大腸癌再発リスクの診断補助方法(以下、「診断補助方法」と記す場合がある。)では、まず、大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から選択される複数の遺伝子、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から選択される複数の遺伝子、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から選択される複数の遺伝子の発現量をそれぞれ測定する。 In the diagnosis assistance method for recurrence risk of colorectal cancer of the present embodiment (hereinafter sometimes referred to as “diagnosis assistance method”), first, 18q21 on the long chain of chromosome 18 in a biological sample collected from a patient with colorectal cancer. A plurality of genes selected from the first gene group existing in the region from 20 to 18q23, a plurality of genes selected from the second gene group present in the region from 20q11 to 20q13 on the long chain of chromosome 20, and Measure the expression level of multiple genes selected from the third gene group including ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5, MMP2, RAB34, SELM, SRGAP2P1 and VIM To do.
「生体試料」としては、大腸癌患者の腫瘍細胞由来の核酸(例えばmRNA)を含むものであれば特に限定されないが、例えば臨床検体を用いることができる。臨床検体として具体的には、血液、血清、手術又は生検により採取した組織などが挙げられる。また、被検者から採取した組織のホルマリン固定パラフィン包埋(FFPE)試料を生体試料として用いてもよい。 The “biological sample” is not particularly limited as long as it contains a nucleic acid (eg, mRNA) derived from a tumor cell of a colorectal cancer patient. For example, a clinical sample can be used. Specific examples of clinical specimens include blood, serum, and tissues collected by surgery or biopsy. Further, a formalin-fixed paraffin-embedded (FFPE) sample of tissue collected from a subject may be used as a biological sample.
本実施形態の方法は、測定工程の前に生体試料からDNAを抽出する工程を含んでいてもよい。生体試料からDNAを抽出する方法は、当該技術において公知の方法により行うことができる。たとえば、生体試料を遠心分離してDNAを含む細胞を沈殿させ、この細胞を物理的手法又は化学的手法によって破壊し、細胞破片を除去することにより、DNA抽出物を得ることができる。この操作は、市販のDNA抽出キットなどを用いて行うこともできる。 The method of this embodiment may include a step of extracting DNA from a biological sample before the measurement step. A method for extracting DNA from a biological sample can be performed by a method known in the art. For example, a DNA extract can be obtained by centrifuging a biological sample to precipitate cells containing DNA, destroying the cells by a physical technique or a chemical technique, and removing cell debris. This operation can also be performed using a commercially available DNA extraction kit or the like.
本明細書において、「第1遺伝子群」とは、18番染色体長鎖上の18q21から18q23までの領域に存在する遺伝子の総称である。具体的には、第1遺伝子群は、遺伝子シンボルにより、C18orf22(chromosome 18 open reading frame 22)、C18orf55(chromosome 18 open reading frame 55)、CCDC68(coiled-coil domain containing 68)、CNDP2(CNDP dipeptidase 2 (metallopeptidase M20 family))、CYB5A(cytochrome b5 type A (microsomal))、LOC400657(hypothetical LOC400657)、LOC440498(heat shock factor binding protein 1-like)、MBD2(methyl-CpG binding domain protein 2)、MBP(myelin basic protein)、MYO5B(myosin VB)、NARS(asparaginyl-tRNA synthetase)、PQLC1(PQ loop repeat containing 1)、RTTN(Rotatin)、SEC11C(SEC11 homolog C (S. cerevisiae))、SOCS6(suppressor of cytokine signaling 6)、TNFRSF11A(tumor necrosis factor receptor superfamily, member 11a, NFKB activator)、TXNL1(thioredoxin-like 1)、TXNL4A(thioredoxin-like 4A)、VPS4B(vacuolar protein sorting 4 homolog B (S. cerevisiae))およびZNF407(zinc finger protein 407)と表される遺伝子を含む。 In the present specification, the “first gene group” is a general term for genes existing in the region from 18q21 to 18q23 on the long chain of chromosome 18. Specifically, the first gene group includes C18orf22 (chromosome 18 open reading frame 22), C18orf55 (chromosome 18 open reading frame 55), CCDC68 (coiled-coil domain containing 68), CNDP2 (CNDP dipeptidase 2). (metallopeptidase M20 family)), CYB5A (cytochrome b5 type A (microsomal)), LOC400657 (hypothetical LOC400657), LOC440498 (heat shock factor binding protein 1-like), MBD2 (methyl-CpG binding domain protein 2), MBP (myelin basic protein), MYO5B (myosin VB), NARS (asparaginyl-tRNA synthetase), PQLC1 (PQ loop repeat containing 1), RTTN (Rotatin), SEC11C (SEC11 homolog C (S. cerevisiae)), SOCS6 (suppressor of cytokine signaling 6), TNFRSF11A (tumor necrosis factor receptor superfamily, member 11a, NFKB activator), TXNL1 (thioredoxin-like 1), TXNL4A (thioredoxin-like 4A), VPS4B (vacuolar protein sorting 4 homolog B (S. cerevisiae)) and ZNF407 (Zinc finger protein 407) and table It is containing the gene.
本明細書において、「第2遺伝子群」とは、20番染色体長鎖上の20q11から20q13までの領域に存在する遺伝子の総称である。具体的には、第2遺伝子群は、遺伝子シンボルにより、ASXL1(additional sex combs like 1 (Drosophila))、C20orf112(chromosome 20 open reading frame 112)、C20orf177(chromosome 20 open reading frame 177)、CHMP4B(chromatin modifying protein 4B)、COMMD7(COMM domain containing 7)、CPNE1(copine I)、DIDO1(death inducer-obliterator 1)、DNAJC5(DnaJ (Hsp40) homolog, subfamily C, member 5)、KIF3B(kinesin family member 3B)、NCOA6(nuclear receptor coactivator 6)、PHF20(PHD finger protein 20)、PIGU(phosphatidylinositol glycan anchor biosynthesis, class U)、PLAGL2(pleiomorphic adenoma gene-like 2)、POFUT1(protein O-fucosyltransferase 1)、PPP1R3D(protein phosphatase 1, regulatory (inhibitor) subunit 3D)、PTPN1(protein tyrosine phosphatase, non-receptor type 1)、RBM39(RNA binding motif protein 39)、TAF4(TAF4 RNA polymerase II, TATA box binding protein (TBP)-associated factor, 135kDa)およびTCFL5(transcription factor-like 5 (basic helix-loop-helix))と表される遺伝子を含む。 In the present specification, the “second gene group” is a general term for genes existing in the region from 20q11 to 20q13 on the long chain of chromosome 20. Specifically, the second gene group consists of ASXL1 (additional sex combs like 1 (Drosophila)), C20orf112 (chromosome 20 open reading frame 112), C20orf177 (chromosome 20 open reading frame 177), CHMP4B (chromatin) modifying protein 4B), COMMD7 (COMM domain containing 7), CPNE1 (copine I), DIDO1 (death inducer-obliterator 1), DNAJC5 (DnaJ (Hsp40) homolog, subfamily C, member 5), KIF3B (kinesin family member 3B) , NCOA6 (nuclear receptor coactivator 6), PHF20 (PHD finger protein 20), PIGU (phosphatidylinositol glycan anchor biosynthesis, class U), PLAGL2 (pleiomorphic adenoma gene-like 2), POFUT1 (protein O-fucosyltransferase 1), PPP1R3D (protein phosphatase 1, regulatory (inhibitor) subunit 3D), PTPN1 (protein tyrosine phosphatase, non-receptor type 1), RBM39 (RNA binding motif protein 39), TAF4 (TAF4 RNA polymerase II, TATA box binding protein (TBP) -associated factor , 135kDa) and TCFL 5 (transcription factor-like 5 (basic helix-loop-helix)) is included.
本明細書において、「第3遺伝子群」とは、生物学的にはストロマ関連遺伝子、EMT関連遺伝子等と呼ばれるものを含む遺伝子の総称である。具体的には、第3遺伝子群は、遺伝子シンボルにより、ANGPTL2(angiopoietin-like 2)、AXL(AXL receptor tyrosine kinase)、C1R(complement component 1, r subcomponent)、C1S(complement component 1, s subcomponent)、CALHM2(calcium homeostasis modulator 2)、CTSK(cathepsin K)、DCN(Decorin)、EMP3(epithelial membrane protein 3)、GREM1(gremlin 1, cysteine knot superfamily, homolog (Xenopus laevis))、ITGAV(integrin, alpha V (vitronectin receptor, alpha polypeptide, antigen CD51))、KLHL5(kelch-like 5 (Drosophila))、MMP2(matrix metallopeptidase 2 (gelatinase A, 72kDa gelatinase, 72kDa type IV collagenase))、RAB34(RAB34, member RAS oncogene family)、SELM(selenoprotein M)、SRGAP2P1(SLIT-ROBO Rho GTPase activating protein 2 pseudogene 1)およびVIM(Vimentin)と表される遺伝子を含む。本明細書において、第3遺伝子群を「ストロマ関連遺伝子群」と記す場合がある。 In the present specification, the “third gene group” is a generic term for genes including those called biologically stroma-related genes, EMT-related genes, and the like. Specifically, the third gene group consists of ANGPTL2 (angiopoietin-like 2), AXL (AXL receptor tyrosine kinase), C1R (complement component 1, r subcomponent), C1S (complement component 1, s subcomponent), depending on the gene symbol. , CALHM2 (calcium homeostasis modulator 2), CTSK (cathepsin K), DCN (Decorin), EMP3 (epithelial membrane protein 3), GREM1 (gremlin 1, cysteine knot superfamily, homolog (Xenopus laevis)), ITGAV (integrin, alpha V (vitronectin receptor, alpha polypeptide, antigen CD51)), KLHL5 (kelch-like 5 (Drosophila)), MMP2 (matrix metallopeptidase 2 (gelatinase A, 72kDa gelatinase, 72kDa type IV collagenase)), RAB34 (RAB34, member RAS oncogene family ), SELM (selenoprotein M), SRGAP2P1 (SLIT-ROBO Rho GTPase activating protein 2 pseudogene 1) and VIM (Vimentin). In the present specification, the third gene group may be referred to as a “stroma-related gene group”.
本実施形態の診断補助方法においては、これら3つの遺伝子群を用いて、大腸癌の再発リスクを判定する。 In the diagnosis assistance method of this embodiment, the risk of recurrence of colorectal cancer is determined using these three gene groups.
本明細書において、「遺伝子の転写産物」とは、遺伝子が転写されることにより得られる産物のことであり、リボ核酸(RNA)、具体的にはメッセンジャーRNA(mRNA)である。
また、本明細書において、「遺伝子の発現量」とは、上記の生体試料中の遺伝子の転写産物の存在量または該存在量を反映する物質の量のことである。よって、本実施形態の診断補助方法では、遺伝子の転写産物(mRNA)の量、またはmRNAから得られる相補デオキシリボ核酸(cDNA)もしくは相補RNA(cRNA)の量を測定できる。通常、生体試料中のmRNAは微量であるので、そこから逆転写およびインビトロ転写(IVT)により得られるcDNAまたはcRNAの量を測定することが好ましい。
In the present specification, the “gene transcription product” is a product obtained by transcription of a gene, and is ribonucleic acid (RNA), specifically, messenger RNA (mRNA).
In the present specification, the “gene expression level” refers to the abundance of a transcription product of a gene in the biological sample or the amount of a substance reflecting the abundance. Therefore, in the diagnosis assisting method of this embodiment, the amount of a gene transcription product (mRNA) or the amount of complementary deoxyribonucleic acid (cDNA) or complementary RNA (cRNA) obtained from mRNA can be measured. Usually, since the amount of mRNA in a biological sample is very small, it is preferable to measure the amount of cDNA or cRNA obtained therefrom by reverse transcription and in vitro transcription (IVT).
生体試料から遺伝子の転写産物を抽出する方法は、当該技術において知られるRNA抽出法を用いて行うことができる。例えば、生体試料を遠心分離して、RNAを含む細胞を沈殿させ、該細胞を物理的手法または酵素的手法によって破壊し、細胞破片を除去することによりRNA抽出物を得ることができる。RNAの抽出は、市販のRNA抽出キットなどを用いて行うこともできる。 A method for extracting a gene transcription product from a biological sample can be performed using an RNA extraction method known in the art. For example, an RNA extract can be obtained by centrifuging a biological sample to precipitate cells containing RNA, destroying the cells by a physical method or an enzymatic method, and removing cell debris. RNA extraction can also be performed using a commercially available RNA extraction kit or the like.
上記のようにして得られた遺伝子の転写産物の抽出物から、遺伝子の発現量の測定時に混入していないことが好ましい生体試料由来の混入成分、例えば、生体試料が血液である場合はグロビンのmRNAなどを除去するための処理を行うこともできる。 From the extract of the transcription product of the gene obtained as described above, it is preferable that the contaminated component derived from the biological sample is not mixed at the time of measuring the expression level of the gene, for example, when the biological sample is blood, A treatment for removing mRNA and the like can also be performed.
上記のようにして得られた遺伝子の転写産物の抽出物について、第1〜第3遺伝子群のそれぞれから複数、好ましくは少なくとも5つ選択される遺伝子の発現量を測定する。5つ以上の遺伝子の発現量を測定することにより、所定の遺伝子の発現が偶然高い又は低い場合等に生じる生物学的なばらつき、および測定誤差を低減させることができるため、より高い信頼性をもって、再発リスク診断を補助することができる。 About the extract of the transcription product of the gene obtained as mentioned above, the expression level of a plurality of genes, preferably at least 5 genes selected from each of the first to third gene groups is measured. By measuring the expression level of five or more genes, it is possible to reduce biological variations and measurement errors that occur when the expression of a given gene is accidentally high or low. Can assist in diagnosis of recurrence risk.
遺伝子の発現量の測定は、それ自体公知の方法に従って行なうことができるが、本実施形態の再発リスク診断補助方法においては、核酸チップを用いる測定方法、いわゆるマイクロアレイを用いる方法が好ましい。
マイクロアレイを用いて遺伝子の発現量を測定する場合、例えば、基板上に固定された20〜25 mer程度の核酸プローブに、遺伝子の転写産物の抽出物または遺伝子の転写産物から作製したcDNAもしくはcRNAを接触させ、ハイブリッドの形成の有無を蛍光、発色、電流などの指標の変化を測定することにより、目的の遺伝子の発現量を測定できる。
上記の核酸プローブは、1つの遺伝子の転写産物に対して少なくとも1つ用いればよく、遺伝子の転写産物の長さなどに応じて、複数のプローブを用いることもできる。プローブの配列は、測定しようとする遺伝子の転写産物の配列に応じて当業者が適宜決定できる。
核酸チップを用いる遺伝子の発現量の測定方法としては、例えば、Affymetrix社により提供されるGeneChipシステムを用いることができる。
The gene expression level can be measured according to a method known per se, but in the method for assisting diagnosis of recurrence risk according to this embodiment, a measurement method using a nucleic acid chip, a method using a so-called microarray is preferable.
When measuring the expression level of a gene using a microarray, for example, a nucleic acid probe of about 20 to 25 mer immobilized on a substrate is used to extract a gene transcript or a cDNA or cRNA prepared from a gene transcript. The expression level of the target gene can be measured by contacting it and measuring the change in indicators such as fluorescence, color development, and current for the presence or absence of hybrid formation.
At least one nucleic acid probe may be used for one gene transcript, and a plurality of probes may be used depending on the length of the gene transcript. The sequence of the probe can be appropriately determined by those skilled in the art according to the sequence of the transcription product of the gene to be measured.
As a method for measuring the expression level of a gene using a nucleic acid chip, for example, a GeneChip system provided by Affymetrix can be used.
核酸チップを用いる場合、遺伝子の転写産物またはそのcDNAもしくはcRNAは、核酸プローブとのハイブリッド形成を容易にするために、断片化してよい。断片化は、当該技術において公知の方法により行うことができ、例えば、リボヌクレアーゼ、デオキシリボヌクレアーゼなどの核酸分解酵素を用いて行うことができる。 When using a nucleic acid chip, the gene transcript or its cDNA or cRNA may be fragmented to facilitate hybridization with the nucleic acid probe. Fragmentation can be performed by a method known in the art, for example, using a nucleolytic enzyme such as ribonuclease or deoxyribonuclease.
測定工程において、複数の遺伝子の発現量の測定は、各々別々に行ってもよいし、一部の遺伝子または全部の遺伝子の測定を同時に行ってもよい。たとえば核酸チップを用いる場合は、複数の遺伝子の発現量の測定を1枚の核酸チップで同時に行うことができる。 In the measurement step, the expression levels of a plurality of genes may be measured separately, or some genes or all genes may be measured simultaneously. For example, when a nucleic acid chip is used, the expression level of a plurality of genes can be measured simultaneously with a single nucleic acid chip.
核酸チップにおいて核酸プローブと接触させる遺伝子の転写産物またはそのcDNAもしくはcRNAは、通常、5〜20μg程度であればよい。接触条件は、通常、45℃にて16時間程度である。 The gene transcription product or its cDNA or cRNA to be contacted with the nucleic acid probe in the nucleic acid chip is usually about 5 to 20 μg. The contact conditions are usually about 16 hours at 45 ° C.
核酸プローブと接触させてハイブリッドを形成した遺伝子の転写産物またはそのcDNAもしくはcRNAは、そのハイブリッド形成の有無およびハイブリッド形成した量について、蛍光物質、色素またはハイブリッド形成したことによる核酸チップ上を流れる電流量の変化などに基づいて検出することができる。
ハイブリッドの形成を、蛍光物質または色素の検出により測定する場合、遺伝子の転写産物またはそのcDNAもしくはcRNAが、蛍光物質または色素の検出のための標識物質で標識されていることが好ましい。このような標識物質は、当該技術において通常用いられるものを用いることができる。通常、ビオチン化ヌクレオチドまたはビオチン化リボヌクレオチドを、cDNAまたはcRNAを合成するときのヌクレオチドまたはリボヌクレオチド基質として混合しておくことにより、得られるcDNAまたはcRNAがビオチンで標識されることができる。cDNAまたはcRNAがビオチン標識されていると、核酸チップ上で、ビオチンに対する結合パートナーであるアビジンまたはストレプトアビジンが結合できる。アビジンまたはストレプトアビジンが、適切な蛍光物質または色素と結合していることにより、ハイブリッドの形成が検出できる。蛍光物質としては、フルオレセインイソチオシアネート(FITC)、グリーン蛍光タンパク質(GFP)、ルシフェリン、フィコエリスリンなどが挙げられる。通常、フィコエリスリン−ストレプトアビジンのコンジュゲートが市販されているので、これを用いることが簡便である。
また、アビジンまたはストレプトアビジンに対する標識抗体を、アビジンまたはストレプトアビジンと接触させ、標識抗体の蛍光物質または色素を検出することもできる。
The transcription product of the gene or its cDNA or cRNA that has hybridized with the nucleic acid probe, whether it is hybridized or not, and the amount of hybridization, the amount of current flowing on the nucleic acid chip due to the fluorescent substance, dye, or hybridization It is possible to detect based on the change of.
When the formation of a hybrid is measured by detecting a fluorescent substance or a dye, it is preferable that the gene transcription product or its cDNA or cRNA is labeled with a labeling substance for detecting the fluorescent substance or the dye. As such a labeling substance, those usually used in the art can be used. Usually, by mixing biotinylated nucleotides or biotinylated ribonucleotides as a nucleotide or ribonucleotide substrate when synthesizing cDNA or cRNA, the resulting cDNA or cRNA can be labeled with biotin. When the cDNA or cRNA is labeled with biotin, avidin or streptavidin, which is a binding partner for biotin, can bind on the nucleic acid chip. Hybrid formation can be detected by avidin or streptavidin binding to an appropriate fluorescent substance or dye. Examples of the fluorescent substance include fluorescein isothiocyanate (FITC), green fluorescent protein (GFP), luciferin, phycoerythrin, and the like. Usually, since a phycoerythrin-streptavidin conjugate is commercially available, it is convenient to use it.
Alternatively, a labeled antibody against avidin or streptavidin can be contacted with avidin or streptavidin to detect the fluorescent substance or dye of the labeled antibody.
この工程で得られる遺伝子の発現量は、生体試料中の各遺伝子の転写産物の存在量を相対的に表す値であれば、特に限定されない。上記の核酸チップにより測定を行う場合、発現量は、蛍光強度、発色強度、電流量などに基づく核酸チップから得られるシグナルであり得る。
これらのシグナルは、核酸チップ用の測定装置を用いて測定できる。
The expression level of the gene obtained in this step is not particularly limited as long as it is a value that relatively represents the abundance of the transcription product of each gene in the biological sample. When measurement is performed using the nucleic acid chip, the expression level can be a signal obtained from the nucleic acid chip based on fluorescence intensity, color intensity, current amount, and the like.
These signals can be measured using a measuring device for a nucleic acid chip.
次いで、本実施形態の判定工程においては、測定工程において得られた遺伝子の発現量のデータに基づいて、大腸癌の再発リスクを判定する。具体的には、以下のようにして大腸癌の再発リスクを判定する。
第3遺伝子群が高発現である場合に、再発リスクは高いと判定される。
第1遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定される。
第1遺伝子群が高発現であり、第2遺伝子群が高発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定される。
第1遺伝子群が高発現であり、第2遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは低いと判定される。
Next, in the determination step of the present embodiment, the recurrence risk of colorectal cancer is determined based on the gene expression level data obtained in the measurement step. Specifically, the recurrence risk of colorectal cancer is determined as follows.
When the third gene group is highly expressed, it is determined that the risk of recurrence is high.
When the first gene group is underexpressed and the third gene group is underexpressed, the risk of recurrence is determined to be moderate.
When the first gene group is highly expressed, the second gene group is highly expressed, and the third gene group is lowly expressed, the risk of recurrence is determined to be moderate.
When the first gene group is highly expressed, the second gene group is low expressed, and the third gene group is low expressed, it is determined that the risk of recurrence is low.
判定工程では、種々の解析方法を用いることができる。例えば、判定対象となる生体試料の遺伝子発現パターンと各患者群の遺伝子発現パターンとに基づいて相関分析(例えば相関係数比較およびクラスタリング等)を行う方法、判定対象となる生体試料の遺伝子の発現量と基準値とを比較する方法等が挙げられる。 In the determination step, various analysis methods can be used. For example, a method of performing correlation analysis (for example, correlation coefficient comparison and clustering) based on the gene expression pattern of the biological sample to be judged and the gene expression pattern of each patient group, expression of the gene of the biological sample to be judged Examples include a method of comparing the amount with a reference value.
1つの好ましい実施形態によると、生体試料の遺伝子発現パターンと各患者群の遺伝子発現パターンとに基づいて相関分析を行うことによって再発リスクが判定される。この方法では、複数の「遺伝子群」を設定するのではなく、再発リスクに応じて複数の患者群を設定する。具体的には、まず、ある患者群を、再発リスクが高いと判定される患者群(以下、「高リスク群」ともいう)、再発リスクが中程度と判定される患者群(以下、「中リスク群」ともいう)および再発リスクが低いと判定される患者群(以下、「低リスク群」ともいう)の3群に分類する。ここで、上記の患者群は、予めクラスタリング解析などにより3群に分類され得る。クラスタリング解析には、各遺伝子群の発現量を用いることができる。たとえば、第3遺伝子群が高発現の群は高リスク群とされる。第1遺伝子群が低発現であり、且つ第3遺伝子群が低発現である群は、中リスク群とされる。第1遺伝子群が高発現であり、第2遺伝子群が高発現であり、且つ第3遺伝子群が低発現である群は、中リスク群であるとされる。第1遺伝子群が高発現であり、第2遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、低リスク群とされる。 According to one preferred embodiment, the risk of recurrence is determined by performing a correlation analysis based on the gene expression pattern of the biological sample and the gene expression pattern of each patient group. In this method, a plurality of “gene groups” are not set, but a plurality of patient groups are set according to the risk of recurrence. Specifically, first, a group of patients determined to have a high risk of recurrence (hereinafter also referred to as a “high risk group”), a group of patients determined to have a moderate risk of recurrence (hereinafter referred to as “medium”). Risk group) and patient group judged to have low risk of recurrence (hereinafter also referred to as “low risk group”). Here, the above patient groups can be classified into three groups by clustering analysis or the like in advance. In the clustering analysis, the expression level of each gene group can be used. For example, a group in which the third gene group is highly expressed is regarded as a high risk group. A group in which the first gene group has a low expression and the third gene group has a low expression is regarded as a medium risk group. A group in which the first gene group is highly expressed, the second gene group is highly expressed, and the third gene group is lowly expressed is considered to be a medium risk group. When the first gene group is highly expressed, the second gene group is lowly expressed, and the third gene group is lowly expressed, it is regarded as a low risk group.
これら各患者群のサンプルから解析対象となる遺伝子の発現量を取得し、平均値を算出する。たとえば、高リスク群に100人の患者が含まれ、C18orf22の発現量の平均値を算出する場合、100人の患者のC18orf22の発現量の総和を100で除した値が、高リスク群のC18orf22の発現量の平均値となる。中リスク群および低リスク群でも同様にC18orf22の発現量の平均値が算出される。また、本実施形態では、複数の遺伝子が解析対象となるため、複数の遺伝子の発現量の平均値がそれぞれ算出される。ここで、このようにして得られた高リスク群における発現量の平均値のデータセットを高リスク群発現パターンといい、中リスク群における発現量の平均値のデータセットを中リスク群発現パターンといい、低リスク群における発現量の平均値のデータセットを低リスク群発現パターンという。55遺伝子の発現量を解析する場合は、高リスク群発現パターンには、55の値が含まれることとなる。 The expression level of the gene to be analyzed is obtained from the samples of each patient group, and the average value is calculated. For example, when 100 patients are included in the high-risk group and the average expression level of C18orf22 is calculated, the value obtained by dividing the sum of the C18orf22 expression levels of 100 patients by 100 is C18orf22 of the high-risk group. It becomes the average value of the expression level. Similarly, the average value of the expression level of C18orf22 is also calculated in the medium risk group and the low risk group. In this embodiment, since a plurality of genes are to be analyzed, the average value of the expression levels of the plurality of genes is calculated. Here, the data set of the average expression level in the high risk group thus obtained is referred to as the high risk group expression pattern, and the data set of the average expression level in the medium risk group is referred to as the medium risk group expression pattern. The data set of the average expression level in the low risk group is called the low risk group expression pattern. When analyzing the expression level of 55 genes, the high risk group expression pattern includes 55 values.
各リスク群の発現パターンは、生体試料の遺伝子発現の測定および再発リスクの判定の前に、予め取得される。 The expression pattern of each risk group is acquired in advance before measuring the gene expression of the biological sample and determining the risk of recurrence.
次に、生体試料における各遺伝子の発現量が測定される。ここで、測定工程において測定された各遺伝子の発現量のデータセットを生体試料の発現パターンという。55遺伝子の発現量を測定する場合は、生体試料の発現パターンには、55の値が含まれることとなる。 Next, the expression level of each gene in the biological sample is measured. Here, the data set of the expression level of each gene measured in the measurement process is referred to as the expression pattern of the biological sample. When measuring the expression level of 55 genes, the expression pattern of the biological sample includes 55 values.
生体試料における各遺伝子の発現パターンと、各リスク群の発現パターンとの相関を分析する。生体試料の発現パターンと最も高い相関を示すリスク群を特定する。特定されたリスク群に対応する再発リスクが、生体試料の再発リスクと判定される。たとえば、生体試料における各遺伝子の発現量が、高リスク群と最も高い相関を示す場合は、この生体試料は再発リスクが高いと判定される。 The correlation between the expression pattern of each gene in the biological sample and the expression pattern of each risk group is analyzed. The risk group that shows the highest correlation with the expression pattern of the biological sample is identified. The recurrence risk corresponding to the identified risk group is determined as the recurrence risk of the biological sample. For example, when the expression level of each gene in the biological sample shows the highest correlation with the high risk group, it is determined that the biological sample has a high recurrence risk.
上記の相関の分析においては、種々の方法を用いることができる。
1つの好ましい実施形態では、たとえば、生体試料の発現パターンと高リスク群発現パターンとの相関係数、生体試料の発現パターンと中リスク群発現パターンとの相関係数、および生体試料の発現パターンと低リスク群発現パターンとの相関係数を算出する。各層間係数を比較し、最も高い相関係数を示すリスク群に生体試料を分類し、再発リスクの判定を行うことができる。たとえば、高リスク群発現パターンとの相関係数が最も高い場合は、生体試料は高リスク群に分類され、再発リスクは高いと判定される。
In the correlation analysis, various methods can be used.
In one preferred embodiment, for example, the correlation coefficient between the expression pattern of the biological sample and the high-risk group expression pattern, the correlation coefficient between the expression pattern of the biological sample and the medium-risk group expression pattern, and the expression pattern of the biological sample The correlation coefficient with the low risk group expression pattern is calculated. The interlaminar coefficients are compared, the biological samples are classified into risk groups that exhibit the highest correlation coefficient, and recurrence risk can be determined. For example, when the correlation coefficient with the high-risk group expression pattern is the highest, the biological sample is classified into the high-risk group, and the recurrence risk is determined to be high.
相関係数の算出は、公知の方法により行うことができる。たとえば、スピアマンの順位相関、ピアソンの積率相関、ケンドールの順位相関などに基づき、相関係数を算出することができる。 The calculation of the correlation coefficient can be performed by a known method. For example, the correlation coefficient can be calculated based on Spearman's rank correlation, Pearson's product-moment correlation, Kendall's rank correlation, and the like.
もう1つの好ましい実施形態では、各リスク群との相関を分析する方法として、例えば最近接距離法のようなクラスタリング方法による、クラスタリング解析を用いることもできる。たとえば、以下のようにして解析を行うことができる。
予め複数の患者において各遺伝子の発現量を取得しておく(なお、この時点では高リスク群、中リスク群および低リスク群の分類は行われていない)。測定工程において、生体試料における各遺伝子の発現量を測定する。各患者の各遺伝子の発現量と生体試料における各遺伝子の発現量とをクラスタリング解析により高リスク群、中リスク群および低リスク群に分類する。生体試料が分類されたリスク群に基づき、生体試料の再発リスクを判定することができる。
In another preferred embodiment, as a method of analyzing the correlation with each risk group, a clustering analysis by a clustering method such as a closest distance method may be used. For example, the analysis can be performed as follows.
The expression level of each gene is acquired in advance in a plurality of patients (note that at this time, the high-risk group, medium-risk group, and low-risk group are not classified). In the measurement step, the expression level of each gene in the biological sample is measured. The expression level of each gene of each patient and the expression level of each gene in the biological sample are classified into a high risk group, a medium risk group, and a low risk group by clustering analysis. Based on the risk group into which the biological sample is classified, the recurrence risk of the biological sample can be determined.
上述の解析手法の他、線形判別、サポートベクターマシンによる判別などを用いることもできる。 In addition to the analysis method described above, linear discrimination, discrimination using a support vector machine, or the like can also be used.
別の実施形態では、たとえば、生体試料における第1遺伝子群から選択される遺伝子の発現量と基準値との比較、生体試料における第2遺伝子群から選択される遺伝子の発現量と基準値との比較、および生体試料における第3遺伝子群から選択される遺伝子の発現量と基準値との比較に基づいて再発リスクの判定が行われる。 In another embodiment, for example, the expression level of a gene selected from the first gene group in the biological sample is compared with a reference value, and the expression level of the gene selected from the second gene group in the biological sample is compared with the reference value. The risk of recurrence is determined based on the comparison and the comparison between the expression level of the gene selected from the third gene group in the biological sample and the reference value.
本実施態様においては、判定工程において、第1および第2遺伝子群からそれぞれ選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合に、再発リスクは高いと判定する。
すなわち、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合には、第1及び第2遺伝子群からそれぞれ選択される遺伝子の発現量がこれらの遺伝子群それぞれの基準値以上であっても、あるいは当該基準値よりも小さくても、再発リスクは高いと判定される。
In this embodiment, in the determination step, the expression level of the gene selected from the third gene group is not less than the reference value of the gene group, regardless of the expression level of the gene selected from each of the first and second gene groups. If it is, it is determined that the risk of recurrence is high.
That is, when the expression level of the gene selected from the third gene group is equal to or higher than the reference value of the gene group, the expression level of the gene selected from each of the first and second gene groups is set to each of these gene groups. Even if the reference value is equal to or greater than the reference value or smaller than the reference value, the risk of recurrence is determined to be high.
本実施態様においては、判定工程において、第2遺伝子群から選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子がその遺伝子群の基準値よりも小さい場合、再発リスクは中程度であると判定する。
すなわち、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、かつ、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の発現量よりも小さい場合には、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であっても、あるいは当該基準値よりも小さくても、再発リスクは中程度であると判定される。
In this embodiment, in the determination step, regardless of the expression level of the gene selected from the second gene group, the expression level of the gene selected from the third gene group is smaller than the reference value of the gene group, When the gene selected from one gene group is smaller than the reference value of the gene group, it is determined that the risk of recurrence is moderate.
That is, when the expression level of the gene selected from the third gene group is smaller than the reference value of the gene group, and the expression level of the gene selected from the first gene group is smaller than the expression level of the gene group For example, even if the expression level of the gene selected from the second gene group is equal to or higher than the reference value of the gene group or smaller than the reference value, it is determined that the risk of recurrence is moderate.
本実施態様においては、判定工程において、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合に、再発リスクは中程度であると判定する。 In this embodiment, in the determination step, the expression level of the gene selected from the third gene group is smaller than the reference value of the gene group, and the expression level of the gene selected from the first gene group is When the expression level is equal to or higher than the reference value and the expression level of the gene selected from the second gene group is equal to or higher than the reference value of the gene group, the recurrence risk is determined to be moderate.
本実施態様においては、判定工程において、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さい場合に、再発リスクは低いと判定する。 In this embodiment, in the determination step, the expression level of the gene selected from the third gene group is smaller than the reference value of the gene group, and the expression level of the gene selected from the first gene group is When the expression level is equal to or higher than the reference value and the expression level of the gene selected from the second gene group is smaller than the reference value of the gene group, it is determined that the risk of recurrence is low.
上記の実施形態において、各遺伝子群の「基準値」は、各遺伝子群が過剰発現をしているか否かを判定することのできる値に設定される。たとえば、第1遺伝子群の「基準値」は以下のように取得される。まず、特定の患者群において、各遺伝子の発現量の平均値を算出する。たとえば、患者群に含まれる各患者のC18orf22発現量をそれぞれ測定し、発現量の総和を患者数で除することにより、患者群のC18orf22発現量の平均値を取得することができる。第1遺伝子群に含まれるその他の遺伝子についても同様に平均値を取得する。これらの遺伝子の平均値の総和を遺伝子数で除することにより、特定の患者群における第1遺伝子群の平均値を取得することができる。この平均値を「基準値」とすることができる。第2遺伝子群および第3遺伝子群についても同様に「基準値」を取得することができる。 In the above embodiment, the “reference value” of each gene group is set to a value that can determine whether or not each gene group is overexpressed. For example, the “reference value” of the first gene group is acquired as follows. First, the average value of the expression level of each gene is calculated in a specific patient group. For example, the average value of the C18orf22 expression level of the patient group can be obtained by measuring the C18orf22 expression level of each patient included in the patient group and dividing the sum of the expression levels by the number of patients. Similarly, average values are obtained for the other genes included in the first gene group. By dividing the sum of the average values of these genes by the number of genes, the average value of the first gene group in a specific patient group can be obtained. This average value can be used as a “reference value”. Similarly, the “reference value” can be obtained for the second gene group and the third gene group.
ここでは、基準値として「平均値」を例示したが、平均値ではなく中央値や最頻値などを用いてもよい。 Here, the “average value” is exemplified as the reference value, but the median value or the mode value may be used instead of the average value.
この基準値は、測定工程および判定工程を実施する前に、予め取得されていることが好ましい。 This reference value is preferably acquired in advance before the measurement process and the determination process.
本実施形態の好ましい実施形態においては、生体試料における各遺伝子の発現量の総和を、遺伝子数で除して、生体試料の遺伝子発現量の平均値を取得し、この生体試料の遺伝子発現量の平均値が上述の基準値と比較される。 In a preferred embodiment of this embodiment, the total expression level of each gene in the biological sample is divided by the number of genes to obtain an average value of the gene expression level of the biological sample, and the gene expression level of the biological sample is calculated. The average value is compared with the reference value described above.
本発明のさらに好ましい実施態様においては、再発リスクが中程度とされた群に対し、KRAS遺伝子に変異を有する場合は再発リスクは高い、KRAS遺伝子に変異を有していない場合は再発リスクは低いと判定する。 In a further preferred embodiment of the present invention, the risk of recurrence is high when the KRAS gene has a mutation, and the risk of recurrence is low when there is no mutation in the KRAS gene. Is determined.
KRAS遺伝子とは、12番染色体上の25.36〜25.4 Mbの位置に存在する遺伝子であり、ras癌遺伝子の一種で、上皮成長因子受容体(EGFR)のシグナルを核に伝達し、細胞増殖を促進する機能を持つとされる。KRASのcDNAの塩基配列を配列番号56として表す。この塩基配列は、ヒトゲノムデータベースGenBankにおいてアクセッション番号AF493917の下公知である。 KRAS gene is located at 25.36-25.4 Mb on chromosome 12 and is a kind of ras oncogene. It transmits epidermal growth factor receptor (EGFR) signal to nucleus and promotes cell proliferation. It is said that it has a function to do. The nucleotide sequence of KRAS cDNA is represented as SEQ ID NO: 56. This nucleotide sequence is known under the accession number AF493917 in the human genome database GenBank.
KRAS遺伝子の変異とは、好ましくは当該遺伝子のエキソン2配列に存在する12及び13番目のコドン(34〜39番目の塩基)にあたるGGTGGCの塩基配列中に起こる変異又はエキソン3配列に存在する61番目のコドン(182〜184番目の塩基)にあたるCAAの塩基配列中に起こる変異を指す。 KRAS gene mutation is preferably a mutation occurring in the base sequence of GGTGGC corresponding to the 12th and 13th codons (bases 34 to 39) present in the exon 2 sequence of the gene or the 61st position present in the exon 3 sequence. Refers to a mutation that occurs in the base sequence of CAA corresponding to the codons (bases 182-184).
KRAS変異の有無の測定方法は特に限定されず、当業者に公知の方法を用いて行なうことができる。本実施形態においては、KRAS変異の有無の測定は、シーケンス解析を用いて行なわれ得る。 The method for measuring the presence or absence of KRAS mutation is not particularly limited, and can be performed using methods known to those skilled in the art. In the present embodiment, the measurement of the presence or absence of a KRAS mutation can be performed using sequence analysis.
KRAS遺伝子の変異の種類は特に限定されず、上記コドン中のいずれかの塩基が変異していれば、変異ありと判定することができる。本実施形態においては、好ましくは、KRASタンパク質のアミノ酸配列の変異を引き起こす塩基配列の変異(即ち、ミスセンス変異、ナンセンス変異、フレームシフト変異など、サイレント変異以外の変異)を対象とする。変異の種類は、ヌクレオチドの置換、欠失、削除および付加が考えられるが、本実施形態においては、好ましくは、置換である。このような置換の具体例としては、34番目のGのAによる置換、35番目のGのA、CまたはTによる置換、38番目のGのAによる置換、182番目のCのAによる置換、184番目のAのCまたはTによる置換等が挙げられる。 The type of mutation in the KRAS gene is not particularly limited, and if any base in the codon is mutated, it can be determined that there is a mutation. In the present embodiment, preferably, nucleotide sequence mutations that cause mutations in the amino acid sequence of the KRAS protein (that is, mutations other than silent mutations such as missense mutations, nonsense mutations, frameshift mutations, etc.) are targeted. As the type of mutation, nucleotide substitution, deletion, deletion and addition can be considered. In the present embodiment, substitution is preferable. Specific examples of such substitution include 34th G substitution with A, 35th G substitution with A, C or T, 38th G substitution with A, 182nd C substitution with A, Examples include substitution of 184th A with C or T.
上記のとおり、KRAS変異の有無を判定基準に加えることによって、中リスク群を高リスク群と低リスク群に分類でき、全体を高低2分類することができる。これにより、中リスク群についても高低いずれかに分類することが可能となり、より多くの症例に対してより有用な情報を提供することができる。 As described above, by adding the presence or absence of a KRAS mutation to the criteria, the medium risk group can be classified into a high risk group and a low risk group, and the whole can be classified into two groups, high and low. As a result, the medium risk group can be classified as either high or low, and more useful information can be provided for more cases.
本発明には、患者の大腸癌再発リスクの判定をコンピュータに実行させるためのコンピュータプログラム製品も含まれる。コンピュータプログラム製品は、インターネット等を介してダウンロード可能なプログラムや、当該プログラムを記録した媒体などが例示される。 The present invention also includes a computer program product for causing a computer to determine the recurrence risk of colorectal cancer in a patient. Examples of the computer program product include a program that can be downloaded via the Internet, a medium that records the program, and the like.
たとえば、以下のような工程をコンピュータに実行させるためのプログラムが例示される。
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程;
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程。
For example, the program for making a computer perform the following processes is illustrated.
In a biological sample collected from a colorectal cancer patient, it receives the expression level of a plurality of genes selected from the first gene group existing in the region from 18q21 to 18q23 on the long chain of chromosome 18, and on the long chain of chromosome 20. Receiving the expression level of a plurality of genes selected from the second gene group present in the region from 20q11 to 20q13, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5 Receiving the expression level of a plurality of genes selected from the third gene group including MMP2, RAB34, SELM, SRGAP2P1 and VIM;
A step of determining a recurrence risk of colorectal cancer in the patient based on the received expression level.
以下に、本実施形態の方法を実施するのに好適な装置の一形態を、図面を参照して説明する。しかし、本発明はこの実施形態のみに限定されるものではない。図1は、患者の大腸癌再発リスクの判定に用いる診断補助装置の一例を示した概略図である。図1に示された診断補助装置1は、測定装置2と、該測定装置2と接続されたコンピュータシステム3とを含んでいる。 Hereinafter, an embodiment of an apparatus suitable for carrying out the method of this embodiment will be described with reference to the drawings. However, the present invention is not limited only to this embodiment. FIG. 1 is a schematic diagram showing an example of a diagnostic assistance device used for determining the recurrence risk of colorectal cancer in a patient. A diagnostic auxiliary device 1 shown in FIG. 1 includes a measuring device 2 and a computer system 3 connected to the measuring device 2.
本実施形態においては、測定装置2は、核酸チップ用の測定装置である。この測定装置2は、遺伝子の発現量そのものおよび核酸チップの発色蛍光の色相や蛍光強度のような遺伝子の発現量に関連する情報を取得する。大腸癌患者から採取された生体試料を測定装置2にセットすると、測定装置2は、該生体試料における遺伝子の発現量に関連する情報を取得し、得られた情報をコンピュータシステム3に送信する。 In the present embodiment, the measuring device 2 is a measuring device for a nucleic acid chip. This measuring device 2 acquires information related to the expression level of the gene itself, such as the expression level of the gene itself and the hue and fluorescence intensity of the colored fluorescence of the nucleic acid chip. When a biological sample collected from a colorectal cancer patient is set in the measuring device 2, the measuring device 2 acquires information related to the gene expression level in the biological sample and transmits the obtained information to the computer system 3.
中リスクと判定された検体についてさらに大腸癌再発リスクの高低判定を行なう場合、診断補助装置1は、測定装置2および該測定装置2と接続されたコンピュータシステム3に加えて、さらに変異測定装置4を含む。
本実施形態においては、この変異測定装置4は、生体試料におけるKRAS遺伝子の変異の有無に関する情報を取得する。大腸癌患者から採取された生体試料を変異測定装置4にセットすると、変異測定装置4は、該生体試料におけるKRAS遺伝子の変異の有無に関する情報を取得し、得られた情報をコンピュータシステム3に送信する。
In the case of further determining whether the colorectal cancer recurrence risk is high or low for the specimen determined to be a medium risk, the diagnostic auxiliary device 1 further includes the mutation measuring device 4 in addition to the measuring device 2 and the computer system 3 connected to the measuring device 2. including.
In the present embodiment, the mutation measuring device 4 acquires information relating to the presence or absence of mutations in the KRAS gene in the biological sample. When a biological sample collected from a colorectal cancer patient is set in the mutation measuring device 4, the mutation measuring device 4 acquires information on the presence or absence of a KRAS gene mutation in the biological sample and transmits the obtained information to the computer system 3. To do.
コンピュータシステム3は、コンピュータ本体3aと、キーボードやマウスからなる入力部3bと、LCDやCRTからなり検体情報や判定結果などを表示する表示部3cとを含む。コンピュータシステム3は、測定装置2および変異測定装置4から、それぞれ遺伝子の発現量に関連する情報および必要に応じてKRAS遺伝子の変異の有無に関する情報を受信する。そして、コンピュータシステム3は、これらの情報に基づいて、被検者の大腸癌再発リスクを判定するプログラムを実行する。なお、入力部3bから、後述する「2群分類が必要」を入力することができる。 The computer system 3 includes a computer main body 3a, an input unit 3b composed of a keyboard and a mouse, and a display unit 3c composed of an LCD and a CRT for displaying sample information and determination results. The computer system 3 receives information relating to the expression level of the gene and information relating to the presence or absence of mutation of the KRAS gene as necessary from the measuring device 2 and the mutation measuring device 4. Then, the computer system 3 executes a program for determining the colorectal cancer recurrence risk of the subject based on such information. Note that “second group classification is necessary” can be input from the input unit 3b.
図2は、診断補助装置1のコンピュータ本体3aのソフトウェアを機能ブロックで示すブロック図である。図2に示されるように、コンピュータは、受信部301と、記憶部302と、算出部303と、判定部304と、出力部305とを備える。受信部301は、測定装置2および必要に応じて変異測定装置4と、ネットワークを介して通信可能に接続されている。判定部304には、入力部3bを介して大腸癌再発リスク判定の実施に必要な情報、具体的には中リスクと判定された検体についてKRAS遺伝子の変異有無の測定(2群分類)を行なうか否かに関する情報を入力することができる。 FIG. 2 is a block diagram showing software of the computer main body 3a of the diagnostic auxiliary device 1 as functional blocks. As illustrated in FIG. 2, the computer includes a reception unit 301, a storage unit 302, a calculation unit 303, a determination unit 304, and an output unit 305. The receiving unit 301 is communicably connected to the measuring device 2 and, if necessary, the mutation measuring device 4 via a network. The determination unit 304 measures the information necessary for carrying out the colorectal cancer recurrence risk determination via the input unit 3b, specifically, the presence or absence of mutation in the KRAS gene (classification of two groups) for the sample determined to be medium risk. Whether or not can be entered.
受信部301は、測定装置2および変異測定装置4から送信された情報を受信する。記憶部302は、判定に必要な基準値および遺伝子の発現量を算出するための式や処理プログラムなどを記憶する。算出部303は、受信部301で取得された情報を用い、記憶された式にしたがって、遺伝子の発現量を算出する。判定部304は、受信部301によって取得されたか、または算出部303によって算出された遺伝子の発現量が、記憶部302に記憶された基準値以上であるか否かを判定する。出力部305は、判定部304による判定結果を、被検者の大腸癌再発リスクの判定結果として表示部3cへ出力する。 The receiving unit 301 receives information transmitted from the measuring device 2 and the mutation measuring device 4. The storage unit 302 stores a reference value necessary for determination, an expression for calculating the gene expression level, a processing program, and the like. The calculating unit 303 uses the information acquired by the receiving unit 301 to calculate the gene expression level according to the stored formula. The determination unit 304 determines whether the gene expression level acquired by the reception unit 301 or calculated by the calculation unit 303 is equal to or greater than a reference value stored in the storage unit 302. The output unit 305 outputs the determination result of the determination unit 304 to the display unit 3c as the determination result of the colorectal cancer recurrence risk of the subject.
中リスクと判定された検体についてさらに大腸癌再発リスクの高低判定を行なう場合、受信部301は、測定装置2から送信された情報に加えて、さらに変異測定装置4から送信された情報も取得する。記憶部302は、判定に必要な基準値および遺伝子の発現量を算出するための式に加えて、さらにKRAS遺伝子の非変異配列を記憶する。算出部303は、受信部301で取得された情報を用い、記憶された式にしたがって、遺伝子の発現量を算出する。判定部304は、受信部301によって取得されたか、または算出部303によって算出された遺伝子の発現量が、記憶部302に記憶された基準値以上であるか否かを判定することに加え、さらに、受信部301で取得されたKRAS遺伝子の配列と記憶部302に記憶されたKRAS遺伝子の非変異配列とが一致するか否かに基づいてKRAS遺伝子における変異の有無を判定する。出力部305は、判定部304による判定結果を、被検者の大腸癌再発リスクの判定結果として表示部3cへ出力する。 When further determining whether the colorectal cancer recurrence risk is high or low for the specimen determined to be a medium risk, the receiving unit 301 further acquires information transmitted from the mutation measuring device 4 in addition to the information transmitted from the measuring device 2. . The storage unit 302 further stores a non-mutated sequence of the KRAS gene in addition to a reference value necessary for determination and an expression for calculating the gene expression level. The calculating unit 303 uses the information acquired by the receiving unit 301 to calculate the gene expression level according to the stored formula. The determination unit 304 determines whether the gene expression level acquired by the reception unit 301 or calculated by the calculation unit 303 is equal to or greater than a reference value stored in the storage unit 302. The presence or absence of a mutation in the KRAS gene is determined based on whether or not the KRAS gene sequence acquired by the receiving unit 301 matches the non-mutated sequence of the KRAS gene stored in the storage unit 302. The output unit 305 outputs the determination result of the determination unit 304 to the display unit 3c as the determination result of the colorectal cancer recurrence risk of the subject.
図3は、図2に示すコンピュータ本体3aのハードウェア構成を示すブロック図である。図3に示されるように、コンピュータ本体3aは、CPU(Central Processing Unit)30と、ROM(Read Only Memory)31と、RAM32と、ハードディスク33と、入出力インターフェイス34と、読出装置35と、通信インターフェイス36と、画像出力インターフェイス37とを備えている。CPU30、ROM31、RAM(Random Access Memory)32、ハードディスク33、入出力インターフェイス34、読出装置35、通信インターフェイス36および画像出力インターフェイス37は、バス38によってデータ通信可能に接続されている。 FIG. 3 is a block diagram showing a hardware configuration of the computer main body 3a shown in FIG. As shown in FIG. 3, the computer main body 3a includes a CPU (Central Processing Unit) 30, a ROM (Read Only Memory) 31, a RAM 32, a hard disk 33, an input / output interface 34, a reading device 35, and a communication. An interface 36 and an image output interface 37 are provided. A CPU 30, a ROM 31, a RAM (Random Access Memory) 32, a hard disk 33, an input / output interface 34, a reading device 35, a communication interface 36 and an image output interface 37 are connected by a bus 38 so that data communication is possible.
CPU30は、ROM31に記憶されているコンピュータプログラムおよびRAM32にロードされたコンピュータプログラムを実行することが可能である。CPU30がコンピュータプログラムを実行することにより、図2に示す各機能が実行される。これにより、コンピュータシステム3が、被検者の大腸癌再発リスクを判定するための診断補助装置として機能する。 The CPU 30 can execute a computer program stored in the ROM 31 and a computer program loaded in the RAM 32. Each function shown in FIG. 2 is executed by the CPU 30 executing the computer program. Thereby, the computer system 3 functions as a diagnosis assisting device for determining a subject's risk of recurrence of colorectal cancer.
ROM31は、マスクROM、PROM、EPROM、EEPROMなどによって構成されている。ROM31には、前述のようにCPU30によって実行されるコンピュータプログラムおよびこれに用いるデータが記録されている。 The ROM 31 is configured by a mask ROM, PROM, EPROM, EEPROM, or the like. The ROM 31 stores a computer program executed by the CPU 30 and data used therefor as described above.
RAM32は、SRAM、DRAMなどによって構成されている。RAM32は、ROM31およびハードディスク33に記録されているコンピュータプログラムの読み出しに用いられる。RAM32はまた、これらのコンピュータプログラムを実行するときに、CPU30の作業領域として利用される。 The RAM 32 is configured by SRAM, DRAM, or the like. The RAM 32 is used for reading out computer programs recorded in the ROM 31 and the hard disk 33. The RAM 32 is also used as a work area for the CPU 30 when executing these computer programs.
ハードディスク33は、CPU30に実行させるためのオペレーティングシステム、アプリケーションプログラム(被検者の大腸癌再発リスクを判定するためのコンピュータプログラム)などのコンピュータプログラムおよび当該コンピュータプログラムの実行に用いるデータがインストールされている。 The hard disk 33 is installed with an operating system to be executed by the CPU 30, a computer program such as an application program (a computer program for determining a recurrence risk of colorectal cancer in a subject), and data used for executing the computer program. .
読出装置35は、フレキシブルディスクドライブ、CD−ROMドライブ、DVD−ROMドライブなどによって構成されている。読出装置35は、可搬型記録媒体40に記録されたコンピュータプログラムまたはデータを読み出すことができる。 The reading device 35 includes a flexible disk drive, a CD-ROM drive, a DVD-ROM drive, and the like. The reading device 35 can read the computer program or data recorded on the portable recording medium 40.
入出力インターフェイス34は、例えば、USB、IEEE1394、RS−232Cなどのシリアルインターフェイスと、SCSI、IDE、IEEE1284などのパラレルインターフェイスと、D/A変換器、A/D変換器などからなるアナログインターフェイスとから構成されている。入出力インターフェイス34には、キーボード、マウスなどの入力部3bが接続されている。操作者は、当該入力部3bにより、コンピュータ本体3aに各種の指令を入力することが可能である。 The input / output interface 34 includes, for example, a serial interface such as USB, IEEE1394, RS-232C, a parallel interface such as SCSI, IDE, IEEE1284, and an analog interface including a D / A converter, an A / D converter, and the like. It is configured. An input unit 3 b such as a keyboard and a mouse is connected to the input / output interface 34. The operator can input various commands to the computer main body 3a through the input unit 3b.
通信インターフェイス36は、例えば、Ethernet(登録商標)インターフェイスなどである。コンピュータ本体3aは、通信インターフェイス36により、プリンタなどへの印刷データの送信も可能である。 The communication interface 36 is, for example, an Ethernet (registered trademark) interface. The computer main body 3a can also transmit print data to a printer or the like via the communication interface 36.
画像出力インターフェイス37は、LCD、CRTなどで構成される表示部3cに接続されている。これにより、表示部3cは、CPU30から与えられた画像データに応じた映像信号を出力することができる。表示部3cは、入力された映像信号にしたがって画像(画面)を表示する。 The image output interface 37 is connected to a display unit 3c configured with an LCD, a CRT, or the like. Thereby, the display part 3c can output the video signal according to the image data given from CPU30. The display unit 3c displays an image (screen) according to the input video signal.
次に、診断補助装置1による、被検者の大腸癌再発リスク判定の処理手順を説明する。図4は、大腸癌再発リスク判定のフローチャートである。ここでは、被検者由来の生体試料を用いて得られた発色蛍光の情報から蛍光強度を算出し、得られた蛍光強度から遺伝子の発現量を算出し、得られた発現量が基準値以上であるか否かの判定を行う場合を例として挙げて説明する。しかし、本発明は、この実施形態のみに限定されるものではない。 Next, the procedure for determining the recurrence risk of the subject's colorectal cancer by the diagnosis assisting apparatus 1 will be described. FIG. 4 is a flowchart of risk determination for recurrence of colorectal cancer. Here, the fluorescence intensity is calculated from the color fluorescence information obtained using the biological sample derived from the subject, the gene expression level is calculated from the obtained fluorescence intensity, and the obtained expression level is equal to or higher than the reference value. The case where it is determined whether or not will be described as an example. However, the present invention is not limited only to this embodiment.
まず、ステップS1−1において、診断補助装置1の受信部301は、測定装置2から第3遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−2において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−3において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。 First, in step S <b> 1-1, the receiving unit 301 of the diagnostic auxiliary device 1 acquires information on the color fluorescence associated with the expression level of the gene selected from the third gene group from the measurement device 2. Next, in step S <b> 1-2, the calculation unit 303 calculates fluorescence intensity from the acquired information and transmits it to the storage unit 302. In step S <b> 1-3, the calculation unit 303 calculates the expression level of the gene according to the stored formula based on the stored fluorescence intensity.
その後、ステップS1−4において、判定部304は、ステップS1−3で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−5に進行し、判定部304は被検者の大腸癌再発リスクが高いこと(高リスク)を示す判定結果を出力部305に送信する。一方、発現量が基準値よりも低いとき、ルーチンはステップS1−6に進行する。 Thereafter, in step S1-4, the determination unit 304 determines whether or not the expression level calculated in step S1-3 is greater than or equal to the reference value stored in the storage unit 302. Here, when the expression level is equal to or higher than the reference value, the routine proceeds to step S1-5, and the determination unit 304 outputs a determination result indicating that the subject has a high risk of recurrence of colorectal cancer (high risk). Send to. On the other hand, when the expression level is lower than the reference value, the routine proceeds to step S1-6.
ステップS1−6において、診断補助装置1の受信部301は、測定装置2から第1遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−7において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−8において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。 In step S1-6, the receiving unit 301 of the diagnostic auxiliary device 1 acquires information on the color fluorescence associated with the expression level of the gene selected from the first gene group from the measurement device 2. Next, in step S <b> 1-7, the calculation unit 303 calculates the fluorescence intensity from the acquired information and transmits it to the storage unit 302. In step S1-8, the calculation unit 303 calculates the gene expression level according to the stored formula based on the stored fluorescence intensity.
その後、ステップS1−9において、判定部304は、算出部303で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−11に進行する。また、発現量が基準値よりも低いとき、ルーチンはステップS1−10に進行し、判定部304は被検者の大腸癌再発リスクが中程度(中リスク)であると判定し、その後ルーチンはステップS1−17に進行する。 Thereafter, in step S <b> 1-9, the determination unit 304 determines whether or not the expression level calculated by the calculation unit 303 is greater than or equal to the reference value stored in the storage unit 302. Here, when the expression level is greater than or equal to the reference value, the routine proceeds to step S1-11. When the expression level is lower than the reference value, the routine proceeds to step S1-10, and the determination unit 304 determines that the colorectal cancer recurrence risk of the subject is intermediate (medium risk), and then the routine Proceed to step S1-17.
ステップS1−11においては、診断補助装置1の受信部301は、測定装置2から第2遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−12において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−13において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。 In step S1-11, the receiving unit 301 of the diagnostic auxiliary device 1 acquires information on the color fluorescence associated with the expression level of the gene selected from the second gene group from the measurement device 2. Next, in step S1-12, the calculation unit 303 calculates the fluorescence intensity from the acquired information and transmits it to the storage unit 302. In step S1-13, the calculation unit 303 calculates the expression level of the gene according to the stored formula based on the stored fluorescence intensity.
その後、ステップS1−14において、判定部304は、算出部303で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−15に進行し、判定部304は被検者の大腸癌再発リスクが中程度(中リスク)であると判定し、その後ステップS1−17に進行する。一方、ステップS1−14において、発現量が基準値よりも低いとき、ルーチンはステップS1−16に進行し、判定部304は被検者の大腸癌再発リスクが低いことを示す判定結果(低リスク)を出力部305に送信する。 Thereafter, in step S <b> 1-14, the determination unit 304 determines whether the expression level calculated by the calculation unit 303 is greater than or equal to the reference value stored in the storage unit 302. Here, when the expression level is equal to or higher than the reference value, the routine proceeds to step S1-15, and the determination unit 304 determines that the subject's colorectal cancer recurrence risk is moderate (medium risk), and then the step Proceed to S1-17. On the other hand, when the expression level is lower than the reference value in step S1-14, the routine proceeds to step S1-16, and the determination unit 304 determines that the subject has a low risk of recurrence of colorectal cancer (low risk). ) To the output unit 305.
ステップS1−10またはS1−15を経て大腸癌再発リスクが中程度であると判定された検体について、ステップS1−17において、入力部3bから「2群分類が必要」と入力された場合には、これらの検体についてKRAS遺伝子変異測定による大腸癌再発リスクの高低判定を行なう。 For a sample that has been determined to have a moderate colorectal cancer recurrence risk through step S1-10 or S1-15, in step S1-17, “requires 2-group classification” is input from the input unit 3b. In these specimens, the risk of colorectal cancer recurrence is determined by measuring the KRAS gene mutation.
「2群分類が必要」と入力されていないとき、ルーチンはステップS1−18に進行し、被検者の大腸癌再発リスクが中程度であることを示す判定結果を出力部305に送信する。 When “2 group classification is necessary” is not input, the routine proceeds to step S1-18, and transmits a determination result indicating that the subject's risk of recurrence of colorectal cancer is moderate to the output unit 305.
一方、2群分類が必要である場合、ルーチンはステップS1−19に進行する。ステップS1−19では、中リスクと判定された検体についてKRAS遺伝子の変異の有無に基づく大腸癌再発リスクの高低判定の処理が行われる。この処理には、変異測定装置4が用いられる。 On the other hand, if the second group classification is necessary, the routine proceeds to step S1-19. In step S1-19, a process for determining whether the colorectal cancer recurrence risk is high or low based on the presence or absence of a mutation in the KRAS gene is performed for the specimen determined to be medium risk. The mutation measuring device 4 is used for this processing.
ステップS1−19において、受信部301は、中リスクと判定された被検者のKRAS遺伝子の配列情報を取得する。次に、ステップS1−20において、判定部304は、取得したKRAS遺伝子の配列と、記憶部302に記憶されたKRAS遺伝子の非変異配列とを比較して、被検者の生体試料中のKRAS遺伝子に変異があるか否かを判定する。KRAS遺伝子に変異がある場合、ルーチンは、ステップS1−21に進行し、判定部304は、被検者の大腸癌再発リスクが高いこと(高リスク)を示す判定結果を出力部305に送信する。一方、KRAS遺伝子に変異がない場合、ルーチンは、ステップS1−22に進行し、判定部304は、被検者の大腸癌再発リスクが低いこと(低リスク)を示す判定結果を出力部305に送信する。 In step S1-19, the receiving unit 301 acquires sequence information of the KRAS gene of the subject determined to be a medium risk. Next, in step S1-20, the determination unit 304 compares the acquired sequence of the KRAS gene with the non-mutated sequence of the KRAS gene stored in the storage unit 302, and determines the KRAS in the biological sample of the subject. Determine if there is a mutation in the gene. If there is a mutation in the KRAS gene, the routine proceeds to step S1-21, and the determination unit 304 transmits a determination result indicating that the subject has a high risk of recurrence of colorectal cancer (high risk) to the output unit 305. . On the other hand, if there is no mutation in the KRAS gene, the routine proceeds to step S1-22, and the determination unit 304 outputs a determination result indicating that the subject has a low risk of recurrence of colorectal cancer (low risk) to the output unit 305. Send.
そして、ステップS1−23において、出力部305は、被検者の大腸癌再発リスクの判定結果を出力し、表示部3cに表示させる。これにより、診断補助装置1は、被検者の大腸癌の再発リスクが高いのか、中程度であるのか、または低いのかについて判定することを補助する情報を医師などに提供することができる。 In step S1-23, the output unit 305 outputs the determination result of the colorectal cancer recurrence risk of the subject and displays the determination result on the display unit 3c. Thereby, the diagnostic assistance apparatus 1 can provide a doctor or the like with information that assists in determining whether the subject has a high, intermediate, or low risk of recurrence of colorectal cancer.
別の実施形態によれば、図1に記載の診断補助装置を用いて、相関係数を算出して再発リスクを判定することもできる。この場合の処理フローを図5に基づいて説明する。なお、この装置の記憶部は、予め高リスク群発現パターン、中リスク群発現パターンおよび低リスク群発現パターンを記憶している。 According to another embodiment, the recurrence risk can also be determined by calculating a correlation coefficient using the diagnostic auxiliary device shown in FIG. A processing flow in this case will be described with reference to FIG. In addition, the memory | storage part of this apparatus has memorize | stored the high risk group expression pattern, the medium risk group expression pattern, and the low risk group expression pattern previously.
ステップS2−1において、診断補助装置1の受信部301は、測定装置2から生体試料における各遺伝子の発現量を示す蛍光情報を取得する。次に、ステップS2−2において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS2−3において、算出部303は、記憶された蛍光強度に基づいて、各遺伝子の発現量を算出する(ここで、生体試料の発現パターンが取得される)。その後、ステップS2−4において、判定部304は、記憶部302に記憶されている高リスク群発現パターン、中リスク群発現パターンおよび低リスク群発現パターンを読み出し、これらとステップS2−3において取得した生体試料の発現パターンとに基づいて、生体試料の発現パターンと高リスク群発現パターンとの相関係数(以下、「相関係数H」ともいう)、生体試料の発現パターンと中リスク群発現パターンとの相関係数(以下、「相関係数M」ともいう)、および生体試料の発現パターンと低リスク群発現パターンとの相関係数(以下、「相関係数L」ともいう)を算出する。 In step S <b> 2-1, the reception unit 301 of the diagnostic assistance device 1 acquires fluorescence information indicating the expression level of each gene in the biological sample from the measurement device 2. Next, in step S <b> 2-2, the calculation unit 303 calculates fluorescence intensity from the acquired information and transmits the fluorescence intensity to the storage unit 302. In step S2-3, the calculation unit 303 calculates the expression level of each gene based on the stored fluorescence intensity (here, the expression pattern of the biological sample is acquired). Thereafter, in step S2-4, the determination unit 304 reads the high risk group expression pattern, the medium risk group expression pattern, and the low risk group expression pattern stored in the storage unit 302, and acquires them in step S2-3. Based on the expression pattern of the biological sample, the correlation coefficient between the expression pattern of the biological sample and the high-risk group expression pattern (hereinafter also referred to as “correlation coefficient H”), the expression pattern of the biological sample, and the medium-risk group expression pattern And a correlation coefficient (hereinafter also referred to as “correlation coefficient L”) between the expression pattern of the biological sample and the low risk group expression pattern (hereinafter also referred to as “correlation coefficient L”). .
ステップS2−5において、相関係数Hが最も高いか否かが判定される。すなわち、相関係数Hが相関係数Mより高く、相関係数Hが相関係数Lより高い場合、相関係数Hが最も高いと判定される。相関係数Hが最も高い場合は、ステップS2−6において生体試料が高リスク群に分類され、生体試料の再発リスクは高いと判定される。 In step S2-5, it is determined whether or not the correlation coefficient H is the highest. That is, when the correlation coefficient H is higher than the correlation coefficient M and the correlation coefficient H is higher than the correlation coefficient L, it is determined that the correlation coefficient H is the highest. When the correlation coefficient H is the highest, the biological sample is classified into a high risk group in step S2-6, and it is determined that the recurrence risk of the biological sample is high.
ステップS2−5において、相関係数Hが最も高い相関係数ではないと判断された場合、ステップS2−7において、相関係数Mが最も高いか否かが判定される。すなわち、相関係数Mが相関係数Hより高く、相関係数Mが相関係数Lより高い場合、相関係数Mが最も高いと判定される。相関係数Mが最も高い場合は、ステップS2−8において生体試料が中リスク群に分類され、生体試料の再発リスクは中程度と判定される。 If it is determined in step S2-5 that the correlation coefficient H is not the highest correlation coefficient, it is determined in step S2-7 whether the correlation coefficient M is the highest. That is, when the correlation coefficient M is higher than the correlation coefficient H and the correlation coefficient M is higher than the correlation coefficient L, it is determined that the correlation coefficient M is the highest. When the correlation coefficient M is the highest, the biological sample is classified into a medium risk group in step S2-8, and the recurrence risk of the biological sample is determined to be moderate.
ステップS2−7において、相関係数Mが最も高い相関係数ではないと判断された場合、ステップS2−9において、相関係数Lが最も高いと判定される。関係数Lが最も高い場合は、ステップS2−9において生体試料が低リスク群に分類され、生体試料の再発リスクは低いと判定される。 If it is determined in step S2-7 that the correlation coefficient M is not the highest correlation coefficient, it is determined in step S2-9 that the correlation coefficient L is the highest. If the relationship number L is the highest, the biological sample is classified into the low risk group in step S2-9, and it is determined that the recurrence risk of the biological sample is low.
ステップS2−10において、出力部305は、被検者の大腸癌再発リスクの判定結果を出力し、表示部3cに表示させる。これにより、診断補助装置1は、被検者の大腸癌の再発リスクが高いのか、中程度であるのか、または低いのかについて判定することを補助する情報を医師などに提供することができる。 In step S2-10, the output unit 305 outputs the determination result of the colorectal cancer recurrence risk of the subject and displays it on the display unit 3c. Thereby, the diagnostic assistance apparatus 1 can provide a doctor or the like with information that assists in determining whether the subject has a high, intermediate, or low risk of recurrence of colorectal cancer.
また、図5のフローチャートでは、相関係数Mが最も高いか否かを判断するステップの代わりに、相関係数Lが最も高いか否かを判断するステップを含んでいてもよい。また、相関係数Hが最も高いか否かを判断するステップの代わりに、相関係数Lが最も高いか否かを判断するステップを含んでいてもよい。いずれであっても、相関係数H、MおよびLの何れが最も高いかを判断することができる。何れの場合でも、判断ステップの実行順序は限定されない。 Further, the flowchart of FIG. 5 may include a step of determining whether or not the correlation coefficient L is the highest instead of the step of determining whether or not the correlation coefficient M is the highest. Further, instead of the step of determining whether or not the correlation coefficient H is the highest, a step of determining whether or not the correlation coefficient L is the highest may be included. In any case, it can be determined which of the correlation coefficients H, M, and L is the highest. In any case, the execution order of the determination steps is not limited.
さらに好ましい実施形態では、図5のフローチャートのステップS2−8において再発リスク中と判定された検体について、さらにKRAS遺伝子変異の有無を測定し、再発リスク高低いずれかに2群分類してもよい。このような2群分類を行う場合のフローチャートは、例えば図4におけるステップS1−17〜S1−22に示したものと同様であり、これらのステップは、例えば図5のフローチャートのステップS2−8の後に行われる。 In a more preferred embodiment, the presence or absence of a KRAS gene mutation may be further measured for the specimen determined to be in recurrence risk in step S2-8 in the flowchart of FIG. The flowchart for performing such two-group classification is the same as that shown in steps S1-17 to S1-22 in FIG. 4, for example. These steps are, for example, those in step S2-8 in the flowchart in FIG. Done later.
本発明には、被検者の大腸癌再発リスクの判定に適するシステムも含まれる。 The present invention also includes a system suitable for determining the risk of recurrence of colorectal cancer in a subject.
なお、記憶部302は、以下の工程をコンピュータシステム3に実行させるためのコンピュータプログラムを記録している:
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程;
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程。
The storage unit 302 stores a computer program for causing the computer system 3 to execute the following steps:
In a biological sample collected from a colorectal cancer patient, it receives the expression level of a plurality of genes selected from the first gene group existing in the region from 18q21 to 18q23 on the long chain of chromosome 18, and on the long chain of chromosome 20. Receiving the expression level of a plurality of genes selected from the second gene group present in the region from 20q11 to 20q13, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5 Receiving the expression level of a plurality of genes selected from the third gene group including MMP2, RAB34, SELM, SRGAP2P1 and VIM;
A step of determining a recurrence risk of colorectal cancer in the patient based on the received expression level.
本実施形態の方法では、上記の解析工程で得られた解析結果に基づいて、被検者の大腸癌再発リスクを判定する。例えば、被検者の大腸癌が再発する可能性が高い、そのような可能性が中程度である、または、そのような可能性が低い、との判定結果を提供することができる。上記の判定結果を医師等に提供することによって、大腸癌の再発可能性についての医師等による診断が補助される。 In the method of the present embodiment, the colorectal cancer recurrence risk of the subject is determined based on the analysis result obtained in the above analysis step. For example, it is possible to provide a determination result that the colorectal cancer of the subject is highly likely to recur, such a possibility is moderate, or such a possibility is low. By providing the determination result to a doctor or the like, diagnosis by the doctor or the like about the possibility of recurrence of colorectal cancer is assisted.
実施例1:大腸癌患者の予後に応じた分類の検討
Affymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE14333(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ )より入手)のうち、大腸癌(結腸癌)患者72症例をトレーニングセットとして使用した。解析ソフトウェアとして、アレイデータ解析用ソフトウェア(Expression Console v1.1(Affymetrix社製))、表計算用ソフトウェア(Office Excel 2002, 2007(Microsoft社製))、クラスタ解析用ソフトウェア(Cluster3.0, Java(登録商標) Treeview(入手先;http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm))、統計解析ソフトウェア(MedCalc(MedCalc社製))を使用して各種解析を行なった。
データの正規化にはMAS5を使用した。GeneChip上の全プローブのうち、遺伝子シンボルが不明のプローブおよび平均発現シグナル値が300未満のプローブは解析から除外した。対応する遺伝子が重複するプローブについては、平均発現シグナル値が最大のプローブを代表とし、残りは除外した。シグナル値をZ変換した後、最近接距離法にて無教師階層クラスタリングを行なった。類似性尺度はピアソン相関係数とした。
クラスタ解析の結果から、(1)重要な生物学的機能を反映する、(2)特徴的な症例クラスタの生成に寄与する、という2条件を満たすと推定される遺伝子クラスタを機能モジュールとして定義・抽出し、機能モジュールの組合せによるクラスタリングを繰り返し行なうことで再発リスク群分類法の構築を行なった。
Example 1: Examination of classification according to prognosis of colorectal cancer patients
Among the Affymetrix GeneChip, Human Genome U133 plus 2.0 Array data set GSE14333 (obtained from NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/)), colorectal cancer (colon cancer) ) 72 patients were used as training set. Analysis software includes array data analysis software (Expression Console v1.1 (Affymetrix)), spreadsheet software (Office Excel 2002, 2007 (Microsoft)), cluster analysis software (Cluster3.0, Java ( (Trademark) Treeview (obtained from http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm)) and statistical analysis software (MedCalc (MedCalc))) It was.
MAS5 was used for data normalization. Among all probes on GeneChip, probes with unknown gene symbols and probes with an average expression signal value of less than 300 were excluded from the analysis. For probes with corresponding gene duplication, the probe with the maximum average expression signal value was represented, and the rest were excluded. After Z-transforming the signal values, unsupervised hierarchical clustering was performed using the closest distance method. The similarity measure was Pearson correlation coefficient.
Based on the results of cluster analysis, gene clusters that are presumed to satisfy the following two conditions: (1) reflecting important biological functions and (2) contributing to the generation of characteristic case clusters are defined as functional modules. A recurrence risk group classification method was constructed by extracting and repeating clustering by combination of functional modules.
図6に、トレーニングセットの症例における再発リスク群分類の結果を示す。以下、全患者症例における遺伝子の発現量の平均値に基づいて、発現量の増減を判断するものとする。例えば、ある遺伝子の発現量が上記した平均値以上である場合には相対的発現量増加と判断され、上記した平均値よりも小さい場合には、相対的発現量減少と判断される。図6に示されるように、トレーニングセットから、18番染色体長鎖上の遺伝子群(以下、「第1遺伝子群」又は「18q Lossモジュール」と記す場合がある。)の相対的発現量減少、および、20番染色体長鎖上の遺伝子群(以下、「第2遺伝子群」又は「20q Ampモジュール」と記す場合がある。)の相対的発現量増加を示す症例を抽出し、これをタイプBと定義した。トレーニングセットから、18q Lossモジュール及び20q Amp モジュールの発現パターンがタイプBと逆の症例を抽出し、これをタイプAと定義した。また、トレーニングセットにおいて、タイプAおよびタイプBにおける遺伝子の発現量とは無関係に、ストロマ関連遺伝子群の強発現で特徴づけられる症例が出現したため、これらの症例を独立したタイプCと定義した。使用した3機能モジュールを構成する遺伝子を表1に示した。 FIG. 6 shows the results of recurrence risk group classification in the training set cases. Hereinafter, the increase / decrease in the expression level is determined based on the average expression level of the gene in all patient cases. For example, when the expression level of a certain gene is equal to or higher than the above average value, it is determined that the relative expression level is increased, and when it is smaller than the above average value, it is determined that the relative expression level is decreased. As shown in FIG. 6, a decrease in the relative expression level of a gene group on the long chain of chromosome 18 (hereinafter sometimes referred to as “first gene group” or “18q Loss module”) from the training set, In addition, a case showing a relative increase in the expression level of a gene group on the long chain of chromosome 20 (hereinafter sometimes referred to as “second gene group” or “20q Amp module”) is extracted, and this is type B Defined. Cases in which the expression pattern of the 18q Loss module and the 20q Amp module was reversed from type B were extracted from the training set and defined as type A. In the training set, cases characterized by strong expression of the stroma-related gene group appeared regardless of the expression levels of the genes in type A and type B, and these cases were defined as independent type C. The genes constituting the three functional modules used are shown in Table 1.
表2に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。 Table 2 shows the number of cases (existence ratio) for each type classified as described above and the recurrence rate of colorectal cancer.
全72症例のうち、タイプAに分類された症例は22症例、タイプBに分類された症例は24症例、タイプCに分類された症例は26症例であった。大腸癌の再発率は、タイプAにおいて4.5%、タイプBにおいて12.5%、タイプCにおいて23.1%であった。 Among all 72 cases, 22 cases were classified as type A, 24 cases were classified as type B, and 26 cases were classified as type C. The recurrence rate of colorectal cancer was 4.5% in type A, 12.5% in type B, and 23.1% in type C.
図7に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。図7に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表2および図7に示される結果から、タイプAを再発リスクの低い低リスク群、タイプBを再発リスクが中程度の中リスク群、タイプCを再発リスクの高い高リスク群として定義できることがわかった。以下、低リスク群、中リスク群、および、高リスク群を総称して、再発リスク群と記す場合がある。
FIG. 7 shows Kaplan-Meier curves created for each classified type. As shown in FIG. 7, it was found that there was a large difference in the recurrence-free survival rate after surgery in each type.
From the results shown in Table 2 and FIG. 7, it can be seen that type A can be defined as a low risk group with low recurrence risk, type B as a medium risk group with moderate recurrence risk, and type C as a high risk group with high recurrence risk. It was. Hereinafter, the low risk group, the medium risk group, and the high risk group may be collectively referred to as a recurrence risk group.
実施例2:再発リスク群分類の信頼性の検証1
Affymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE14333(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ )より入手)のうち、トレーニングセットで使用しなかった患者74症例をバリデーションセット1として使用した。なお、トレーニングセットの症例とバリデーションセット1の症例とは、それぞれ異なる医療施設にて取得された検体となるように選択されている。
トレーニングセットの72症例にバリデーションセット1の74症例を加えた146症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
Example 2: Verification of reliability of recurrence risk group classification 1
Affymetrix GeneChip, Human Genome U133 plus 2.0 Array data set GSE14333 (obtained from NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/)) 74 patients who did not exist were used as validation set 1. Note that the case of the training set and the case of the validation set 1 are selected to be specimens acquired at different medical facilities.
Clustering was performed on the 146 cases obtained by adding 74 cases of validation set 1 to 72 cases of training set using the genes shown in Table 1 in the same manner as in Example 1.
図8に、トレーニングセットおよびバリデーションセット1の症例における再発リスク群分類の結果を示す。図8に示されるように、トレーニングセットとバリデーションセット1とでは生体試料を取得した施設が異なるが、施設の違いに由来するクラスタを形成することなく、全症例が3つの再発リスク群のいずれかに分類されることがわかった。 FIG. 8 shows the results of the recurrence risk group classification in the training set and validation set 1 cases. As shown in FIG. 8, the training set and the validation set 1 are different in the facility from which the biological sample was obtained, but all cases are one of the three recurrence risk groups without forming a cluster derived from the difference in the facility. It was found that it was classified.
実施例3:再発リスク群分類の信頼性の検証2
大腸癌(結腸癌)患者53症例についてのAffymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE18088(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ より入手)をバリデーションセット2として使用した。この53症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
Example 3: Verification of reliability of recurrence risk group classification 2
Affymetrix GeneChip, Human Genome U133 plus 2.0 Array Data Set GSE18088 (from NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/) for 53 patients with colorectal cancer (colon cancer) Obtained) was used as validation set 2. The 53 cases were clustered using the genes in Table 1 in the same manner as in Example 1.
図9に、バリデーションセット2の症例における再発リスク群分類の結果を示す。図9に示されるように、バリデーションセット2は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット2における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表3に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
In FIG. 9, the result of the recurrence risk group classification | category in the case of the validation set 2 is shown. As shown in FIG. 9, the validation set 2 is different from the training set in the facility where the biological sample was obtained and the facility where the GeneChip measurement was performed, but all cases in the validation set 2 are one of the three recurrence risk groups. It was found that it was classified.
Table 3 shows the number of cases (existence ratio) for each type classified as described above and the recurrence rate of colorectal cancer.
全53症例のうち、低リスク群に分類された症例は23症例、中リスク群に分類された症例は25症例、高リスク群に分類された症例は5症例であった。大腸癌の再発率は、低リスク群において8.7%、中リスク群において28.0%、高リスク群において80.0%であった。表3の結果から、バリデーションセット 2は、トレーニングセットとは生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、各再発リスク群は、施設の違いに影響されることなく、実施例1と同様の結果を示すことがわかった。 Of the 53 cases, 23 cases were classified into the low-risk group, 25 cases were classified into the medium-risk group, and 5 cases were classified into the high-risk group. The recurrence rate of colorectal cancer was 8.7% in the low-risk group, 28.0% in the medium-risk group, and 80.0% in the high-risk group. From the results in Table 3, validation set 2 differs from the training set in the facility where the biological sample was obtained and the facility where GeneChip measurement was performed, but each relapse risk group was not affected by the difference in the facility. It turned out that the result similar to 1 is shown.
実施例4:再発リスク群分類の信頼性の検証3
大腸癌(結腸癌)患者258症例についてのAffymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE39582(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ より入手)をバリデーションセット3として使用した。この256症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
Example 4: Verification of reliability of recurrence risk group classification 3
Affymetrix GeneChip, Human Genome U133 plus 2.0 Array data set GSE39582 (from NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/) for 258 patients with colorectal cancer (colon cancer) Obtained) was used as validation set 3. The 256 cases were clustered using the genes in Table 1 in the same manner as in Example 1.
図10に、バリデーションセット3の症例における再発リスク群分類の結果を示す。図10に示されるように、バリデーションセット3は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット3における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表4に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
In FIG. 10, the result of the recurrence risk group classification | category in the case of the validation set 3 is shown. As shown in FIG. 10, the validation set 3 is different from the training set in the facility where the biological sample was obtained and the facility where the GeneChip measurement was performed, but all cases in the validation set 3 are one of the three recurrence risk groups. It was found that it was classified.
Table 4 shows the number of cases (existence ratio) for each type classified as described above and the recurrence rate of colorectal cancer.
全258症例のうち、低リスク群に分類された症例は74症例、中リスク群に分類された症例は123症例、高リスク群に分類された症例は61症例であった。大腸癌の再発率は、低リスク群において12.2%、中リスク群において23.6%、高リスク群において39.3%であった。 Of the 258 cases, 74 cases were classified into the low risk group, 123 cases were classified into the medium risk group, and 61 cases were classified into the high risk group. The recurrence rate of colorectal cancer was 12.2% in the low-risk group, 23.6% in the medium-risk group, and 39.3% in the high-risk group.
図11に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。図11に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表4および図11の結果から、バリデーションセット3は、トレーニングセットとは生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、各再発リスク群は、施設の違いに影響されることなく、実施例1と同様の結果を示すことがわかった。
FIG. 11 shows Kaplan-Meier curves created for each classified type. As shown in FIG. 11, it was found that there was a large difference in the recurrence-free survival rate after surgery in each type.
From the results in Table 4 and FIG. 11, validation set 3 is different from the training set in the facility where the biological sample was obtained and the facility where GeneChip measurement was performed, but each recurrence risk group was not affected by the difference in the facility. It was found that the same results as in Example 1 were shown.
実施例5:再発リスク群分類の信頼性の検証4
バリデーションセット4として、大腸癌(結腸癌)患者85症例から組織を採取し、凍結保存した。この凍結保存組織85検体を用いてAffymetrix社GeneChip, Human Genome U133 plus 2.0 Arrayで発現解析を行った。この85検体について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
Example 5: Verification of reliability of recurrence risk group classification 4
As validation set 4, tissues were collected from 85 cases of colon cancer (colon cancer) patients and stored frozen. Expression analysis was performed using Affymetrix's GeneChip, Human Genome U133 plus 2.0 Array using 85 cryopreserved tissues. The 85 samples were clustered using the genes in Table 1 in the same manner as in Example 1.
図12に、バリデーションセット4の症例における再発リスク群分類の結果を示す。図12に示されるように、バリデーションセット4は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット4における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表5に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
In FIG. 12, the result of the recurrence risk group classification | category in the case of the validation set 4 is shown. As shown in FIG. 12, the validation set 4 is different from the training set in the facility where the biological sample was obtained and the facility where the GeneChip measurement was performed, but all cases in the validation set 4 are one of the three recurrence risk groups. It was found that it was classified.
Table 5 shows the number of cases (existence ratio) for each type classified as described above and the recurrence rate of colorectal cancer.
全85症例のうち、低リスク群に分類された症例は23症例、中リスク群に分類された症例は26症例、高リスク群に分類された症例は36症例であった。大腸癌の再発率は、低リスク群において0%、中リスク群において11.5%、高リスク群において22.2%であった。 Of the 85 cases, 23 cases were classified into the low risk group, 26 cases were classified into the medium risk group, and 36 cases were classified into the high risk group. The recurrence rate of colorectal cancer was 0% in the low-risk group, 11.5% in the medium-risk group, and 22.2% in the high-risk group.
図13に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。図13に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表5の結果から、バリデーションセット4でも実施例1と同様の結果を示すことがわかった。
FIG. 13 shows Kaplan-Meier curves created for each classified type. As shown in FIG. 13, it was found that there was a large difference in the recurrence-free survival rate after surgery in each type.
From the results in Table 5, it was found that validation set 4 also showed the same results as in Example 1.
上記のとおり、機能モジュール解析により、大腸癌の症例を3つの再発リスク群に分類することができた。それぞれの再発リスク群は異なる再発リスクを有していた。また、実施例1〜5の結果より、再発リスク群の分類は、データセットの入手先に影響されない信頼性の高い分類法であることがわかった。したがって、本実施形態の大腸癌の再発リスク群分類を用いた再発リスクの診断補助方法により、十分に安定した信頼性の高い結果を得られることが示された。 As described above, cases of colorectal cancer could be classified into three recurrence risk groups by functional module analysis. Each recurrence risk group had a different recurrence risk. In addition, from the results of Examples 1 to 5, it was found that the classification of the recurrence risk group is a highly reliable classification method that is not affected by the source of the data set. Therefore, it was shown that a sufficiently stable and reliable result can be obtained by the method for assisting diagnosis of recurrence risk using the recurrence risk group classification of colorectal cancer of this embodiment.
比較例:従来法(デュークス分類)による予後予測
予後予測性能の比較対照として、トレーニングセットの72症例について、デュークス分類による生存時間解析を行なった結果を図14に示す。図14において、デュークスAは、癌が大腸壁内にとどまっている状態を示し、デュークスBは、癌が大腸壁を貫いているがリンパ節転移のない状態を示し、デュークスCは、リンパ節転移のある状態を示す。
Comparative Example: Prognosis Prediction by Conventional Method (Dukes Classification) FIG. 14 shows the results of survival time analysis by Dukes classification for 72 cases in the training set as a comparative control of prognostic prediction performance. In FIG. 14, Dukes A shows a state where the cancer stays in the large intestine wall, Dukes B shows a state where the cancer penetrates the large intestine wall but no lymph node metastasis, and Dukes C shows a lymph node metastasis. Indicates a state with
図2および図14に示されるように、本実施形態の診断補助方法により高リスクと判定された症例は26症例であったのに対し、比較例の判定方法により高リスク(デュークスC)と判定された症例は15症例であった。また、比較例の判定方法によりデュークスAと判定された症例と、デュークスBと判定された症例の無再発生存率にはほとんど差が無いのに対し、本実施形態の診断補助方法により低リスク群と判定された症例と中リスク群と判定された症例の無再発生存率には差が認められた。この結果から、本実施形態の再発リスク診断補助方法によれば、従来の病理学的分類よりも精度良く再発リスクを判定できることが示唆された。 As shown in FIG. 2 and FIG. 14, 26 cases were determined to be high risk by the diagnosis support method of the present embodiment, whereas it was determined to be high risk (Dukes C) by the determination method of the comparative example. There were 15 cases. In addition, there is almost no difference in the recurrence-free survival rate between the case determined to be Dukes A by the determination method of the comparative example and the case determined to be Dukes B, whereas the low risk group by the diagnosis assisting method of the present embodiment There was a difference in the recurrence-free survival rate between cases determined to be in the middle risk group and cases determined to be in the medium risk group. From these results, it was suggested that the recurrence risk diagnosis assisting method of the present embodiment can determine the recurrence risk more accurately than the conventional pathological classification.
実施例6:KRAS遺伝子変異による中リスク群の層別による予後予測性能の向上1
実施例4で行った解析結果で中リスク群とされた検体のうちKRAS遺伝子変異を有する検体を高リスク、KRAS遺伝子変異の無い検体を低リスクとし、全検体を2群に分けた(図15参照)。具体的には、下記のようにして検体のDNA中のKRAS変異の有無を測定し、その結果に基づいて全検体を2群に分けた。
まず、以下の表6の組成を有するPCR master Mixを調製した。
Example 6: Improvement of prognosis prediction performance by stratification of medium risk group due to KRAS gene mutation 1
Samples having the KRAS gene mutation among the samples in the analysis result performed in Example 4 were classified as high risk, samples having no KRAS gene mutation were defined as low risk, and all samples were divided into two groups (FIG. 15). reference). Specifically, the presence or absence of a KRAS mutation in the DNA of the specimen was measured as described below, and all specimens were divided into two groups based on the results.
First, a PCR master mix having the composition shown in Table 6 below was prepared.
次いで、ゲノムDNA 10ngを0.5ml PCR tubeへ分注し、全量20μLになるようNuclease free waterを添加した。そして、PCR master Mixを4.8μl/tube添加し、混合した。なお、PCR Master Mixに加えたプライマーは、以下の表7に示したものである。KRAS遺伝子のエキソン2の第12および13コドンを含む領域の増幅には配列番号57および58のプライマー対を、エキソン3の第61コドンを含む領域の増幅には配列番号59および60のプライマー対を用いた。 Next, 10 ng of genomic DNA was dispensed into a 0.5 ml PCR tube, and Nuclease free water was added to a total volume of 20 μL. Then, 4.8 μl / tube of PCR master mix was added and mixed. The primers added to PCR Master Mix are those shown in Table 7 below. To amplify the region containing the 12th and 13th codons of exon 2 of the KRAS gene, use the primer pair of SEQ ID NOs: 57 and 58, and to amplify the region containing the 61st codon of exon 3, use the primer pair of SEQ ID NOs: 59 and 60 Using.
得られたPCR master MixをThermal Cyclerにセットして以下のプログラムを実施し、KRASのエキソン2配列およびエキソン3配列をPCRにより増幅した。KRAS エキソン295℃:10min → (94℃:1min →55℃:1min →72℃:1min)x 38 cycle → 72℃:10min→4℃ holdKRAS エキソン395℃:10min → (94℃:1min →63℃:1min →72℃:1min)x 38 cycle → 72℃:10min→4℃ hold The obtained PCR master mix was set in the Thermal Cycler and the following program was executed to amplify the KRAS exon 2 and exon 3 sequences by PCR. KRAS exon 295 ℃: 10min → (94 ℃: 1min → 55 ℃: 1min → 72 ℃: 1min) x 38 cycle → 72 ℃: 10min → 4 ℃ holdKRAS exon 395 ℃: 10min → (94 ℃: 1min → 63 ℃: 1min → 72 ℃: 1min) x 38 cycle → 72 ℃: 10min → 4 ℃ hold
増幅後、1%アガロースゲル電気泳動を行ない、単一バンドであることを確認した。その後、0.5ml PCR tubeにPCR産物5μlを分注し、ExoSAP-ITを2μl加え混合し、Thermal Cyclerにセットし、以下のプログラムを実施した。37℃15min→80℃ 15min→4℃ hold After amplification, 1% agarose gel electrophoresis was performed to confirm a single band. Thereafter, 5 μl of PCR product was dispensed into a 0.5 ml PCR tube, 2 μl of ExoSAP-IT was added and mixed, set in the Thermal Cycler, and the following program was executed. 37 ℃ 15min → 80 ℃ 15min → 4 ℃ hold
産物2μlに9.6μlの1 pmol/μlのプライマー(F又はR)、9.4μlのNFWを添加し混合した。シーケンス解析をOperon社に委託して行った。解析対象とした塩基配列と、配列番号1の塩基配列とを比較し、1つでも変異が認められた場合は、KRAS遺伝子に変異あり、とした。実施例4において中リスク群と判断された検体につき、KRAS遺伝子に変異が見られた検体を高リスク群に、KRAS遺伝子に変異が見られなかった検体を低リスク群に分類した。 9.6 μl of 1 pmol / μl primer (F or R) and 9.4 μl of NFW were added to 2 μl of the product and mixed. Sequence analysis was commissioned to Operon. The nucleotide sequence to be analyzed was compared with the nucleotide sequence of SEQ ID NO: 1. If even one mutation was found, the KRAS gene was mutated. Regarding samples determined to be in the medium risk group in Example 4, samples in which a mutation was found in the KRAS gene were classified into a high risk group, and samples in which no mutation was found in a KRAS gene were classified into a low risk group.
結果を図15に各群のKaplan-Meier曲線を示す。図15と図11を比較して、KRAS遺伝子変異の有無を判断基準に加えることで、中リスク群の症例を無再発生存率に大きな差異の認められる高低2つのリスク群へと分類できることがわかった。 The results are shown in FIG. 15 for Kaplan-Meier curves for each group. Comparison of FIG. 15 and FIG. 11 shows that by adding the presence or absence of KRAS gene mutation to the criteria, cases in the medium risk group can be classified into two risk groups with high and low relapse-free survival rates. It was.
実施例7:KRAS遺伝子変異による中リスク群の層別による予後予測性能の向上2
実施例5で行った解析結果で中リスク群とされた検体のうちKRAS遺伝子変異を有する検体を高リスク、KRAS遺伝子変異の無い検体を低リスクとし、全検体を2群に分けた。
結果を図16に各群のKaplan-Meier曲線を示す。図16と図13を比較して、KRAS遺伝子変異の有無を判断基準に加えることで、中リスク群の症例を無再発生存率に大きな差異の認められる高低2つのリスク群への分類できることがわかった。
Example 7: Improvement of prognosis prediction performance by stratification of medium risk group due to KRAS gene mutation 2
Of the samples in the analysis results performed in Example 5, the samples having the KRAS gene mutation were classified as high risk, the samples having no KRAS gene mutation were defined as low risk, and all samples were divided into two groups.
The results are shown in FIG. 16 for Kaplan-Meier curves for each group. Comparison of FIG. 16 and FIG. 13 shows that by adding the presence or absence of KRAS gene mutation to the criteria, cases in the medium risk group can be classified into two risk groups with high and low recurrence-free survival rates. It was.
実施例8:ホルマリン固定パラフィン包埋(FFPE)組織を用いた検証
実施例5において使用した凍結保存組織検体85症例のうち18症例からFFPE組織検体を調製した。この18検体を用いて再発リスク群分類を行った。より具体的には、まず、RNAeasy FFPE kit (QIAGEN社)を用いてFFPE組織検体からtotal RNAを抽出した。Sensation Plus FFPE Amplification and 3’ IVT Labeling Kit (Affymetrix社)を用いて核酸チップ前処理を行った。上記で得られたtotal RNAを用いてGene Chip測定を行った。実施例1と同様にして、表1の遺伝子についてクラスタリングを行った。
Example 8: Verification using formalin-fixed paraffin-embedded (FFPE) tissue FFPE tissue samples were prepared from 18 of the 85 cryopreserved tissue samples used in Example 5. These 18 specimens were used to classify recurrence risk groups. More specifically, first, total RNA was extracted from the FFPE tissue specimen using RNAeasy FFPE kit (QIAGEN). Nucleic acid chip pretreatment was performed using Sensation Plus FFPE Amplification and 3 'IVT Labeling Kit (Affymetrix). Gene chip measurement was performed using the total RNA obtained above. In the same manner as in Example 1, clustering was performed for the genes in Table 1.
図17に、上記FFPE組織検体18検体について得られた再発リスク群分類の結果を示す。図17に示されるように、FFPE組織検体を用いた場合にも、表1の遺伝子の発現量に基づいて、大腸癌の症例を3つの再発リスク群に分類できることがわかった。表8に、FFPE組織検体18症例について分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。 FIG. 17 shows the results of recurrence risk group classification obtained for the 18 FFPE tissue specimens. As shown in FIG. 17, even when FFPE tissue specimens were used, it was found that colon cancer cases could be classified into three recurrence risk groups based on the gene expression levels in Table 1. Table 8 shows the number of cases (existence ratio) and the recurrence rate of colorectal cancer for each type classified for 18 FFPE tissue specimens.
全18症例のうち、低リスク群に分類された症例は4症例、中リスク群に分類された症例は6症例、高リスク群に分類された症例は8症例であった。大腸癌の再発率は、低リスク群において0%、中リスク群において0%、高リスク群において37.5%であった。これらの結果は、FFPE組織検体を用いる場合にも、大腸癌の症例を精度よく再発リスク群分類できることを示す。 Of the 18 cases, 4 cases were classified into the low-risk group, 6 cases were classified into the medium-risk group, and 8 cases were classified into the high-risk group. The recurrence rate of colorectal cancer was 0% in the low-risk group, 0% in the medium-risk group, and 37.5% in the high-risk group. These results show that cases of colorectal cancer can be classified with high accuracy even when FFPE tissue specimens are used.
上記のFFPE組織検体について、中リスク群に分類された6症例におけるKRAS遺伝子変異を測定した。その結果、6症例全てにおいて、KRAS遺伝子変異は陰性であり、低リスク群に分類することができた。
図18に、FFPE組織検体に対して実施例6および7で実施した再発リスク群分類を行った際の各群のKaplan-Meier曲線を示す。図18に示されるように、FFPE組織検体を用いる場合にも、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
For the above FFPE tissue samples, KRAS gene mutations in 6 cases classified into the medium risk group were measured. As a result, in all 6 cases, the KRAS gene mutation was negative and could be classified into the low-risk group.
FIG. 18 shows a Kaplan-Meier curve of each group when the recurrence risk group classification performed in Examples 6 and 7 was performed on the FFPE tissue specimen. As shown in FIG. 18, even when FFPE tissue specimens were used, it was found that there was a large difference in the recurrence-free survival rate after surgery in each type.
図17および表8の結果から、FFPE組織検体を用いても、実施例1と同様に、大腸癌の症例を、再発リスク群分類できることがわかった。また、図18の結果から、実施例6及び7と同様に、FFPE組織検体を用いても、KRAS遺伝子変異の有無に基づいて再発リスク群分類の精度を更に高めることができることがわかった。
以下の表9に、凍結保存組織検体での判定結果と、FFPE組織検体での判定結果との相関表を示す。
Table 9 below shows a correlation table between the determination result of the cryopreserved tissue sample and the determination result of the FFPE tissue sample.
一致率は83.3%と非常に高く、この結果からも、FFPE組織検体を用いた場合にも、凍結保存組織検体を用いた場合と同様、再発リスクを判定できることがわかった。 The coincidence rate was very high at 83.3%. From this result, it was found that the risk of recurrence can be determined even when FFPE tissue specimens are used, as in the case of using cryopreserved tissue specimens.
実施例9:相関係数を用いた再発リスク判定方法
実施例1において分類した、低リスク群、中リスク群および高リスク群において、表1に示される55遺伝子の発現量をそれぞれ測定した。この発現量に基づき、低リスク群発現パターン、中リスク群発現パターンおよび高リスク群発現パターンを取得した。各発現パターン内には、各遺伝子の平均値が含まれる。
Example 9: Recurrence risk determination method using correlation coefficient In the low risk group, medium risk group and high risk group classified in Example 1, the expression levels of 55 genes shown in Table 1 were measured. Based on this expression level, a low risk group expression pattern, a medium risk group expression pattern, and a high risk group expression pattern were obtained. Each expression pattern includes an average value of each gene.
検体として、実施例4と同じ検体を用いた。各検体について表1に示される55遺伝子の発現量をそれぞれ測定した。この発現量に基づき、各検体の発現パターンを取得した。 As the sample, the same sample as in Example 4 was used. The expression level of 55 genes shown in Table 1 was measured for each specimen. Based on this expression level, the expression pattern of each specimen was obtained.
検体の発現パターンと、各リスク群の発現パターンとの間の相関係数を、スピアマンの順位相関に基づいて算出した。各検体について最も高い相関係数を示したリスク群を特定した。 The correlation coefficient between the expression pattern of the specimen and the expression pattern of each risk group was calculated based on Spearman's rank correlation. The risk group showing the highest correlation coefficient for each specimen was identified.
実施例4の結果(クラスタリング解析によるリスク分類)と、実施例9の結果との一致率を表10に示す。 Table 10 shows the match rate between the results of Example 4 (risk classification by clustering analysis) and the results of Example 9.
表10に示されるように、実施例9の結果と実施例4の結果との一致率は83%であった。この結果から、相関係数を用いた場合も、検体の再発リスクを判定できることがわかった。 As shown in Table 10, the concordance rate between the results of Example 9 and the results of Example 4 was 83%. From this result, it was found that the risk of recurrence of the specimen can be determined even when the correlation coefficient is used.
実施例10:KRAS遺伝子変異を用いた再発リスク判定
実施例9で再発リスクが中程度と判定された患者群のKRAS遺伝子変異の有無を検出した。中リスク群のうち、KRAS遺伝子変異を有する検体を再発リスク高、KRAS遺伝子変異の無い検体を再発リスク低に分類した。
Example 10: Determination of recurrence risk using KRAS gene mutation The presence or absence of a KRAS gene mutation was detected in the patient group in which the recurrence risk was determined to be moderate in Example 9. Among the medium risk groups, samples with KRAS gene mutation were classified as high recurrence risk, and samples without KRAS gene mutation were classified as recurrence risk low.
実施例6の結果と実施例10の結果との一致率を表11に示す。 Table 11 shows the concordance rate between the results of Example 6 and the results of Example 10.
表11に示されるように、実施例10の結果と実施例6の結果との一致率は85%であった。この結果から、相関係数を用いた場合も、検体の再発リスクを判定できることがわかった。 As shown in Table 11, the concordance rate between the results of Example 10 and the results of Example 6 was 85%. From this result, it was found that the risk of recurrence of the specimen can be determined even when the correlation coefficient is used.
また、図19に、実施例10の結果から作成したKaplan-Meier曲線を示す。図19に示されるように、KRAS遺伝子変異の有無を判断基準に加えることで、各検体を無再発生存率の大きく異なる高低二つのリスク群に分類することができた。 FIG. 19 shows a Kaplan-Meier curve created from the results of Example 10. As shown in FIG. 19, by adding the presence or absence of KRAS gene mutation to the criteria, each specimen could be classified into two risk groups with greatly different recurrence-free survival rates.
1 診断補助装置
2 測定装置
3 コンピュータシステム
3a コンピュータ本体
3b 入力部
3c 表示部
4 変異測定装置
30 CPU
31 ROM
32 RAM
33 ハードディスク
34 入出力インターフェイス
35 読出装置
36 通信インターフェイス
37 画像出力インターフェイス
38 バス
40 記録媒体
301 受信部
302 記憶部
303 算出部
304 判定部
305 出力部
DESCRIPTION OF SYMBOLS 1 Diagnosis assistance apparatus 2 Measuring apparatus 3 Computer system 3a Computer main body 3b Input part 3c Display part 4 Mutation measuring apparatus 30 CPU
31 ROM
32 RAM
33 Hard Disk 34 Input / Output Interface 35 Reading Device 36 Communication Interface 37 Image Output Interface 38 Bus 40 Recording Medium 301 Receiving Unit 302 Storage Unit 303 Calculation Unit 304 Determination Unit 305 Output Unit
Claims (15)
前記測定工程において測定された発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、
を含む、大腸癌の再発リスクの診断を補助する方法。 In a biological sample collected from a colorectal cancer patient, a plurality of genes selected from the first gene group existing in the region from 18q21 to 18q23 on chromosome 18 long chain, from 20q11 to 20q13 on chromosome 20 long chain A plurality of genes selected from the second gene group existing in the region of, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5, MMP2, RAB34, SELM, SRGAP2P1 and VIM A measurement step of measuring the expression levels of a plurality of genes selected from the third gene group including:
Determining the recurrence risk of colorectal cancer of the patient based on the expression level measured in the measurement step;
A method for assisting diagnosis of recurrence risk of colorectal cancer.
前記第3遺伝子群が高発現である場合に、再発リスクは高いと判定し、
前記第1遺伝子群が低発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定し、
前記第1遺伝子群が高発現であり、前記第2遺伝子群が高発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定し、
前記第1遺伝子群が高発現であり、前記第2遺伝子群が低発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは低いと判定する、
請求項1記載の方法。 In the determination step,
When the third gene group is highly expressed, it is determined that the risk of recurrence is high,
When the first gene group is low expression and the third gene group is low expression, the risk of recurrence is determined to be moderate,
When the first gene group is high expression, the second gene group is high expression, and the third gene group is low expression, it is determined that the risk of recurrence is moderate,
When the first gene group is high expression, the second gene group is low expression, and the third gene group is low expression, it is determined that the risk of recurrence is low,
The method of claim 1.
前記測定工程において測定された発現量と、再発リスクが高いと判定された患者群の生体試料から予め測定された高リスク群発現量と、再発リスクが中程度と判定された患者群の生体試料から予め測定された中リスク群発現量と、再発リスクが低いと判定された患者群の生体試料から予め測定された低リスク群発現量に基づき、前記生体試料の再発リスクを、最も相関の高いリスク群に分類する、請求項1記載の方法。 In the determination step,
The expression level measured in the measurement step, the high risk group expression level measured in advance from the biological sample of the patient group determined to have a high recurrence risk, and the biological sample of the patient group determined to have a moderate recurrence risk Based on the pre-measured medium risk group expression level and the low risk group expression level measured in advance from the biological sample of the patient group determined to have a low recurrence risk, the recurrence risk of the biological sample has the highest correlation The method according to claim 1, wherein the method is classified into a risk group.
前記測定工程において測定された発現量と、前記高リスク群発現量との相関係数を算出し、
前記測定工程において測定された発現量と、前記中リスク群発現量との相関係数を算出し、
前記測定工程において測定された発現量と、前記低リスク群発現量との相関係数を算出し、
前記生体試料の再発リスクを、最も相関係数の高いリスク群に分類する、
請求項3記載の方法。 In the determination step,
Calculating a correlation coefficient between the expression level measured in the measurement step and the high-risk group expression level,
Calculating a correlation coefficient between the expression level measured in the measurement step and the medium risk group expression level,
Calculating a correlation coefficient between the expression level measured in the measurement step and the low-risk group expression level,
Classifying the risk of recurrence of the biological sample into a risk group with the highest correlation coefficient;
The method of claim 3.
前記測定工程において測定された発現量と、前記高リスク群の発現量と、前記中リスク群の発現量と、前記低リスク群の発現量とを用いてクラスタリング解析を行うことにより、前記生体試料の再発リスクを、最も相関の高いリスク群に分類する、
請求項3記載の方法。 In the determination step,
By performing clustering analysis using the expression level measured in the measurement step, the expression level of the high-risk group, the expression level of the medium-risk group, and the expression level of the low-risk group, the biological sample Classify risk of recurrence into the most correlated risk group,
The method of claim 3.
第1および第2遺伝子群からそれぞれ選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値以上である場合に、再発リスクは高いと判定し、
第2遺伝子群から選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値よりも小さく、第1遺伝子群から選択される遺伝子がその遺伝子群についての基準値よりも小さい場合、再発リスクは中程度であると判定し、
第3遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値以上である場合に、再発リスクは中程度であると判定し、
第3遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群についての基準値よりも小さい場合に、再発リスクは低いと判定する、請求項1または2に記載の方法。 In the determination step,
Regardless of the expression level of the gene selected from each of the first and second gene groups, the risk of recurrence is high when the expression level of the gene selected from the third gene group is equal to or higher than the reference value for that gene group. And
Regardless of the expression level of the gene selected from the second gene group, the expression level of the gene selected from the third gene group is smaller than the reference value for the gene group, and the gene selected from the first gene group is If it is less than the reference value for that gene group, we determine that the risk of recurrence is moderate,
The expression level of the gene selected from the third gene group is smaller than the reference value for the gene group, the expression level of the gene selected from the first gene group is greater than or equal to the reference value for the gene group, If the expression level of a gene selected from a gene group is greater than or equal to the reference value for that gene group, the risk of recurrence is determined to be moderate,
The expression level of the gene selected from the third gene group is smaller than the reference value for the gene group, the expression level of the gene selected from the first gene group is greater than or equal to the reference value for the gene group, The method according to claim 1 or 2, wherein the recurrence risk is determined to be low when the expression level of a gene selected from the gene group is smaller than a reference value for the gene group.
遺伝子の発現量は、マイクロアレイにより測定される、請求項1〜8のいずれか1項に記載の方法。 In the measuring step,
The method according to any one of claims 1 to 8, wherein the gene expression level is measured by a microarray.
前記コンピュータプログラムは、前記コンピュータに対し、
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程と、
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、
を実行させる、コンピュータプログラム。 A computer program executed by a computer,
The computer program is for the computer.
In a biological sample collected from a colorectal cancer patient, it receives the expression level of a plurality of genes selected from the first gene group existing in the region from 18q21 to 18q23 on the long chain of chromosome 18, and on the long chain of chromosome 20. Receiving the expression level of a plurality of genes selected from the second gene group present in the region from 20q11 to 20q13, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5 Receiving an expression level of a plurality of genes selected from the third gene group including MMP2, RAB34, SELM, SRGAP2P1 and VIM;
Determining the recurrence risk of colorectal cancer in the patient based on the received expression level;
A computer program that executes
プロセッサと、メモリとを含むコンピュータを備え、
前記メモリには、
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程と、
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、
を前記コンピュータに実行させるコンピュータプログラムが記録されている、
コンピュータシステム。 A computer system used to determine the recurrence risk of colorectal cancer,
A computer including a processor and memory;
In the memory,
In a biological sample collected from a colorectal cancer patient, it receives the expression level of a plurality of genes selected from the first gene group existing in the region from 18q21 to 18q23 on the long chain of chromosome 18, and on the long chain of chromosome 20. Receiving the expression level of a plurality of genes selected from the second gene group present in the region from 20q11 to 20q13, and ANGPTL2, AXL, C1R, C1S, CALHM2, CTSK, DCN, EMP3, GREM1, ITGAV, KLHL5 Receiving an expression level of a plurality of genes selected from the third gene group including MMP2, RAB34, SELM, SRGAP2P1 and VIM;
Determining the recurrence risk of colorectal cancer in the patient based on the received expression level;
Is recorded a computer program for causing the computer to execute,
Computer system.
前記第3遺伝子群が高発現である場合に、再発リスクは高いと判定し、
前記第1遺伝子群が低発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定し、
前記第1遺伝子群が高発現であり、前記第2遺伝子群が高発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定し、
前記第1遺伝子群が高発現であり、前記第2遺伝子群が低発現であり、且つ前記第3遺伝子群が低発現である場合に、再発リスクは低いと判定する、
請求項12記載のシステム。 In the determination step,
When the third gene group is highly expressed, it is determined that the risk of recurrence is high,
When the first gene group is low expression and the third gene group is low expression, the risk of recurrence is determined to be moderate,
When the first gene group is high expression, the second gene group is high expression, and the third gene group is low expression, it is determined that the risk of recurrence is moderate,
When the first gene group is high expression, the second gene group is low expression, and the third gene group is low expression, it is determined that the risk of recurrence is low,
The system of claim 12.
前記プロセッサが、
前記測定工程において測定された発現量を受信し、
前記高リスク群の発現量、前記中リスク群の発現量および前記低リスク群の発現量を前記メモリから読み出し、
前記測定工程において測定された発現量と前記高リスク群の発現量とを比較し、
前記測定工程において測定された発現量と前記中リスク群の発現量とを比較し、
前記測定工程において測定された発現量と前記低リスク群の発現量とを比較し、
前記生体試料の再発リスクを、最も相関の高いリスク群に分類し、
前記高リスク群の発現量が、前記第1遺伝子群から選択される複数の遺伝子、前記第2遺伝子群から選択される複数の遺伝子および前記第3遺伝子群から選択される複数の遺伝子の発現量を示す値であり、再発リスクが高いと判定された患者群の生体試料から予め測定された値であり、
前記中リスク群の発現量が、前記第1遺伝子群から選択される複数の遺伝子、前記第2遺伝子群から選択される複数の遺伝子および前記第3遺伝子群から選択される複数の遺伝子の発現量を示す値であり、再発リスクが中程度と判定された患者群の生体試料から予め測定された値であり、
前記低リスク群の発現量が、前記第1遺伝子群から選択される複数の遺伝子、前記第2遺伝子群から選択される複数の遺伝子および前記第3遺伝子群から選択される複数の遺伝子の発現量を示す値であり、再発リスクが低いと判定された患者群の生体試料から予め測定された値である、
請求項12または13記載のシステム。 The memory stores the expression level of the high risk group, the expression level of the medium risk group, and the expression level of the low risk group,
The processor is
Receiving the expression level measured in the measurement step;
Read the expression level of the high risk group, the expression level of the medium risk group and the expression level of the low risk group from the memory,
Compare the expression level measured in the measurement step and the expression level of the high-risk group,
Compare the expression level measured in the measurement step and the expression level of the medium risk group,
Compare the expression level measured in the measurement step and the expression level of the low risk group,
Classifying the recurrence risk of the biological sample into the most correlated risk group;
Expression levels of the plurality of genes selected from the plurality of genes selected from the first gene group, a plurality of genes selected from the second gene group, and a plurality of genes selected from the third gene group. Is a value measured in advance from a biological sample of a patient group determined to have a high risk of recurrence,
The expression level of the medium risk group is expressed by a plurality of genes selected from the first gene group, a plurality of genes selected from the second gene group, and a plurality of genes selected from the third gene group Is a value measured in advance from a biological sample of a patient group determined to have a moderate recurrence risk,
Expression levels of the low risk group are expression levels of a plurality of genes selected from the first gene group, a plurality of genes selected from the second gene group, and a plurality of genes selected from the third gene group Is a value measured in advance from a biological sample of a patient group determined to have a low risk of recurrence,
The system according to claim 12 or 13.
前記測定工程において測定された発現量と、前記高リスク群の発現量との相関係数を算出し、
前記測定工程において測定された発現量と、前記中リスク群の発現量との相関係数を算出し、
前記測定工程において測定された発現量と、前記低リスク群の発現量との相関係数を算出し、
前記生体試料の再発リスクを、最も相関係数の高いリスク群に分類する、
請求項14記載のシステム。 The processor is
Calculating a correlation coefficient between the expression level measured in the measurement step and the expression level of the high-risk group;
Calculating a correlation coefficient between the expression level measured in the measurement step and the expression level of the medium risk group;
Calculating a correlation coefficient between the expression level measured in the measurement step and the expression level of the low-risk group;
Classifying the risk of recurrence of the biological sample into a risk group with the highest correlation coefficient;
The system of claim 14.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510621189.0A CN105468893B (en) | 2014-09-26 | 2015-09-25 | Assist the computer system, program and method for sending out diagnosis of risk again of colorectal cancer |
EP15186777.7A EP3009842B1 (en) | 2014-09-26 | 2015-09-25 | Method for supporting diagnosis of risk of colorectal cancer recurrence, program and computer system |
ES15186777T ES2745718T3 (en) | 2014-09-26 | 2015-09-25 | Method to support the diagnosis of risk of recurrence of colorectal cancer, program and computer system |
US15/266,385 US10900084B2 (en) | 2015-09-16 | 2016-09-15 | Method for supporting diagnosis of risk of colorectal cancer recurrence, treatment of colorectal cancer, and administration of anticancer drug |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014197018 | 2014-09-26 | ||
JP2014197018 | 2014-09-26 | ||
JP2015082645 | 2015-04-14 | ||
JP2015082645 | 2015-04-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016185142A true JP2016185142A (en) | 2016-10-27 |
JP6757560B2 JP6757560B2 (en) | 2020-09-23 |
Family
ID=57202282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015183024A Active JP6757560B2 (en) | 2014-09-26 | 2015-09-16 | Methods, programs and computer systems to assist in diagnosing the risk of recurrence of colorectal cancer |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6757560B2 (en) |
ES (1) | ES2745718T3 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008220299A (en) * | 2007-03-14 | 2008-09-25 | Sysmex Corp | Cancer diagnosis-assisting system |
JP2009528061A (en) * | 2006-02-28 | 2009-08-06 | ファイザー プロダクツ インコーポレイテッド | Gene predictors of response to metastatic colorectal chemotherapy |
JP2011209220A (en) * | 2010-03-30 | 2011-10-20 | Sysmex Corp | Method for determining risk of recurrence of cancer |
JP2012522979A (en) * | 2009-04-03 | 2012-09-27 | ビオメリュー | Prodefensin-A6 assay method for in vitro diagnosis of colorectal cancer |
WO2013079309A1 (en) * | 2011-11-28 | 2013-06-06 | Fundació Privada Institució Catalana De Recerca I Estudis Avançats | Methods and kits for the prognosis of colorectal cancer |
JP2013111021A (en) * | 2011-11-29 | 2013-06-10 | Sysmex Corp | Method of judging risk of cancer recurrence and use thereof |
JP2014503222A (en) * | 2011-01-18 | 2014-02-13 | エバリスト ジェノミックス, インコーポレイテッド | Prognostic signs of colorectal cancer recurrence |
-
2015
- 2015-09-16 JP JP2015183024A patent/JP6757560B2/en active Active
- 2015-09-25 ES ES15186777T patent/ES2745718T3/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009528061A (en) * | 2006-02-28 | 2009-08-06 | ファイザー プロダクツ インコーポレイテッド | Gene predictors of response to metastatic colorectal chemotherapy |
JP2008220299A (en) * | 2007-03-14 | 2008-09-25 | Sysmex Corp | Cancer diagnosis-assisting system |
JP2012522979A (en) * | 2009-04-03 | 2012-09-27 | ビオメリュー | Prodefensin-A6 assay method for in vitro diagnosis of colorectal cancer |
JP2011209220A (en) * | 2010-03-30 | 2011-10-20 | Sysmex Corp | Method for determining risk of recurrence of cancer |
JP2014503222A (en) * | 2011-01-18 | 2014-02-13 | エバリスト ジェノミックス, インコーポレイテッド | Prognostic signs of colorectal cancer recurrence |
WO2013079309A1 (en) * | 2011-11-28 | 2013-06-06 | Fundació Privada Institució Catalana De Recerca I Estudis Avançats | Methods and kits for the prognosis of colorectal cancer |
JP2013111021A (en) * | 2011-11-29 | 2013-06-10 | Sysmex Corp | Method of judging risk of cancer recurrence and use thereof |
Also Published As
Publication number | Publication date |
---|---|
ES2745718T3 (en) | 2020-03-03 |
JP6757560B2 (en) | 2020-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11098372B2 (en) | Gene expression panel for prognosis of prostate cancer recurrence | |
AU2017246318B2 (en) | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free DNA | |
US8349555B2 (en) | Methods and compositions for predicting death from cancer and prostate cancer survival using gene expression signatures | |
CA2585571C (en) | Predicting response to chemotherapy using gene expression markers | |
US8592156B2 (en) | Predicting response to anti-CD20 therapy in DLBCL patients | |
JP7228896B2 (en) | Methods for predicting the prognosis of breast cancer patients | |
KR20140105836A (en) | Identification of multigene biomarkers | |
EP3009842B1 (en) | Method for supporting diagnosis of risk of colorectal cancer recurrence, program and computer system | |
WO2012151212A1 (en) | Multifocal hepatocellular carcinoma microrna expression patterns and uses thereof | |
JP2009528825A (en) | Molecular analysis to predict recurrence of Dukes B colorectal cancer | |
WO2012093821A2 (en) | Gene for predicting the prognosis for early-stage breast cancer, and a method for predicting the prognosis for early-stage breast cancer by using the same | |
JP2011509689A (en) | Molecular staging and prognosis of stage II and III colon cancer | |
US10900084B2 (en) | Method for supporting diagnosis of risk of colorectal cancer recurrence, treatment of colorectal cancer, and administration of anticancer drug | |
WO2016118670A1 (en) | Multigene expression assay for patient stratification in resected colorectal liver metastases | |
WO2014066984A1 (en) | Method for identifying a target molecular profile associated with a target cell population | |
JP5461959B2 (en) | Glioma prognosis prediction method and kit used therefor | |
US20090297506A1 (en) | Classification of cancer | |
JP2024519082A (en) | DNA methylation biomarkers for hepatocellular carcinoma | |
JP6757560B2 (en) | Methods, programs and computer systems to assist in diagnosing the risk of recurrence of colorectal cancer | |
AU2016224709A1 (en) | Method for assisting in prognostic diagnosis of colorectal cancer, recording medium and determining device | |
US11845993B2 (en) | Methods for identifying prostate cancer | |
WO2019145483A1 (en) | Molecular signature and use thereof for the identification of indolent prostate cancer | |
JP5963748B2 (en) | Prognosis prediction method, kit and use of patients with primary malignant lymphoma of central nervous system | |
EP3564665B1 (en) | Ex-vivo method for the prognosis of metastasis in prostate cancer | |
Sciabica et al. | High–throughput, quantitative multiplex gene expression assay accelerates the validation of breast cancer biomarkers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6757560 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |