KR102628872B1 - 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 - Google Patents
세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 Download PDFInfo
- Publication number
- KR102628872B1 KR102628872B1 KR1020177028536A KR20177028536A KR102628872B1 KR 102628872 B1 KR102628872 B1 KR 102628872B1 KR 1020177028536 A KR1020177028536 A KR 1020177028536A KR 20177028536 A KR20177028536 A KR 20177028536A KR 102628872 B1 KR102628872 B1 KR 102628872B1
- Authority
- KR
- South Korea
- Prior art keywords
- cells
- cell
- negative selection
- selection marker
- cdk1
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 230000035755 proliferation Effects 0.000 title claims abstract description 63
- 230000032823 cell division Effects 0.000 title abstract description 75
- 210000004027 cell Anatomy 0.000 claims abstract description 536
- 230000014509 gene expression Effects 0.000 claims abstract description 120
- 210000004102 animal cell Anatomy 0.000 claims abstract description 111
- 230000001939 inductive effect Effects 0.000 claims abstract description 102
- 238000013518 transcription Methods 0.000 claims abstract description 40
- 230000035897 transcription Effects 0.000 claims abstract description 40
- 230000004663 cell proliferation Effects 0.000 claims abstract description 39
- 239000012190 activator Substances 0.000 claims abstract description 37
- 108020004414 DNA Proteins 0.000 claims description 296
- 239000013598 vector Substances 0.000 claims description 149
- 229960003722 doxycycline Drugs 0.000 claims description 111
- 108090000623 proteins and genes Proteins 0.000 claims description 93
- 241000699666 Mus <mouse, genus> Species 0.000 claims description 83
- 239000003550 marker Substances 0.000 claims description 80
- 102000006601 Thymidine Kinase Human genes 0.000 claims description 71
- 108020004440 Thymidine kinase Proteins 0.000 claims description 71
- 239000000411 inducer Substances 0.000 claims description 60
- 102100032857 Cyclin-dependent kinase 1 Human genes 0.000 claims description 58
- 101710106279 Cyclin-dependent kinase 1 Proteins 0.000 claims description 57
- 241000282414 Homo sapiens Species 0.000 claims description 51
- 229960002963 ganciclovir Drugs 0.000 claims description 49
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 claims description 48
- 108700028369 Alleles Proteins 0.000 claims description 44
- 238000012239 gene modification Methods 0.000 claims description 43
- 230000005017 genetic modification Effects 0.000 claims description 43
- 235000013617 genetically modified food Nutrition 0.000 claims description 43
- 101150115146 EEF2 gene Proteins 0.000 claims description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 34
- 230000002062 proliferating effect Effects 0.000 claims description 25
- 230000004048 modification Effects 0.000 claims description 23
- 238000012986 modification Methods 0.000 claims description 23
- 210000000130 stem cell Anatomy 0.000 claims description 22
- 210000004962 mammalian cell Anatomy 0.000 claims description 20
- 241000700584 Simplexvirus Species 0.000 claims description 18
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 17
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 17
- 102100033587 DNA topoisomerase 2-alpha Human genes 0.000 claims description 17
- 108010046308 Type II DNA Topoisomerases Proteins 0.000 claims description 17
- 241000283690 Bos taurus Species 0.000 claims description 14
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 claims description 14
- 102100031334 Elongation factor 2 Human genes 0.000 claims description 14
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 claims description 14
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 claims description 14
- 238000010348 incorporation Methods 0.000 claims description 14
- 238000006471 dimerization reaction Methods 0.000 claims description 13
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 claims description 13
- 229960004413 flucytosine Drugs 0.000 claims description 13
- 108010051152 Carboxylesterase Proteins 0.000 claims description 12
- 102000013392 Carboxylesterase Human genes 0.000 claims description 12
- 230000002441 reversible effect Effects 0.000 claims description 12
- 108010002687 Survivin Proteins 0.000 claims description 11
- 108010076303 Centromere Protein A Proteins 0.000 claims description 10
- 102000011682 Centromere Protein A Human genes 0.000 claims description 10
- UWKQSNNFCGGAFS-XIFFEERXSA-N irinotecan Chemical compound C1=C2C(CC)=C3CN(C(C4=C([C@@](C(=O)OC4)(O)CC)C=4)=O)C=4C3=NC2=CC=C1OC(=O)N(CC1)CCC1N1CCCCC1 UWKQSNNFCGGAFS-XIFFEERXSA-N 0.000 claims description 10
- 239000003446 ligand Substances 0.000 claims description 10
- 241000271566 Aves Species 0.000 claims description 8
- 210000001778 pluripotent stem cell Anatomy 0.000 claims description 8
- 241000282979 Alces alces Species 0.000 claims description 7
- 235000002198 Annona diversifolia Nutrition 0.000 claims description 7
- 241000283726 Bison Species 0.000 claims description 7
- 241000282836 Camelus dromedarius Species 0.000 claims description 7
- 241000283707 Capra Species 0.000 claims description 7
- 241000700199 Cavia porcellus Species 0.000 claims description 7
- 241000282994 Cervidae Species 0.000 claims description 7
- 241000699800 Cricetinae Species 0.000 claims description 7
- 241000283073 Equus caballus Species 0.000 claims description 7
- 241000282326 Felis catus Species 0.000 claims description 7
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 7
- 241001494479 Pecora Species 0.000 claims description 7
- 241000009328 Perro Species 0.000 claims description 7
- 241000700159 Rattus Species 0.000 claims description 7
- 241000282898 Sus scrofa Species 0.000 claims description 7
- 229960004768 irinotecan Drugs 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 7
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 230000002103 transcriptional effect Effects 0.000 claims description 6
- 230000001413 cellular effect Effects 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 5
- 230000034994 death Effects 0.000 claims description 4
- 108091006106 transcriptional activators Proteins 0.000 claims 31
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 claims 8
- 102100021663 Baculoviral IAP repeat-containing protein 5 Human genes 0.000 claims 4
- 241000282842 Lama glama Species 0.000 claims 3
- 230000003833 cell viability Effects 0.000 claims 1
- 230000008685 targeting Effects 0.000 description 111
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 103
- 101150012716 CDK1 gene Proteins 0.000 description 101
- 108091034117 Oligonucleotide Proteins 0.000 description 88
- 108091033409 CRISPR Proteins 0.000 description 51
- 108020003589 5' Untranslated Regions Proteins 0.000 description 37
- 238000003780 insertion Methods 0.000 description 35
- 230000037431 insertion Effects 0.000 description 35
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 34
- 238000010354 CRISPR gene editing Methods 0.000 description 33
- 230000010261 cell growth Effects 0.000 description 32
- 230000001276 controlling effect Effects 0.000 description 31
- 101150053833 Cenpa gene Proteins 0.000 description 30
- 101150115284 BIRC5 gene Proteins 0.000 description 28
- 238000003205 genotyping method Methods 0.000 description 28
- 238000004132 cross linking Methods 0.000 description 26
- 239000013612 plasmid Substances 0.000 description 26
- 230000012010 growth Effects 0.000 description 25
- 238000002744 homologous recombination Methods 0.000 description 23
- 230000006801 homologous recombination Effects 0.000 description 23
- 238000001890 transfection Methods 0.000 description 21
- 206010043276 Teratoma Diseases 0.000 description 20
- 101150107801 Top2a gene Proteins 0.000 description 20
- 238000002679 ablation Methods 0.000 description 20
- 238000010276 construction Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 20
- 238000011282 treatment Methods 0.000 description 20
- 229950010131 puromycin Drugs 0.000 description 19
- 230000007246 mechanism Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 239000002609 medium Substances 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 230000000694 effects Effects 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 238000000338 in vitro Methods 0.000 description 15
- 238000010367 cloning Methods 0.000 description 14
- 239000012634 fragment Substances 0.000 description 14
- 238000001727 in vivo Methods 0.000 description 14
- 230000022131 cell cycle Effects 0.000 description 12
- 230000008030 elimination Effects 0.000 description 12
- 238000003379 elimination reaction Methods 0.000 description 12
- 230000001225 therapeutic effect Effects 0.000 description 12
- 108020005345 3' Untranslated Regions Proteins 0.000 description 11
- 239000003814 drug Substances 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- 230000014616 translation Effects 0.000 description 11
- 229940079593 drug Drugs 0.000 description 10
- 230000002147 killing effect Effects 0.000 description 10
- 238000002560 therapeutic procedure Methods 0.000 description 10
- 101000868336 Mus musculus Cyclin-dependent kinase 1 Proteins 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 210000005260 human cell Anatomy 0.000 description 9
- 101000984236 Homo sapiens Carbonic anhydrase 1 Proteins 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 238000011529 RT qPCR Methods 0.000 description 8
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 8
- 238000004113 cell culture Methods 0.000 description 8
- 229940002612 prodrug Drugs 0.000 description 8
- 239000000651 prodrug Substances 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 108020005004 Guide RNA Proteins 0.000 description 7
- 102000000763 Survivin Human genes 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 206010006187 Breast cancer Diseases 0.000 description 6
- 230000004543 DNA replication Effects 0.000 description 6
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 6
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 6
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 6
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 6
- 101150063416 add gene Proteins 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000002659 cell therapy Methods 0.000 description 6
- 102000015694 estrogen receptors Human genes 0.000 description 6
- 108010038795 estrogen receptors Proteins 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 238000007747 plating Methods 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 238000010839 reverse transcription Methods 0.000 description 6
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 102100036725 Epithelial discoidin domain-containing receptor 1 Human genes 0.000 description 5
- 101100384399 Mus musculus C2 gene Proteins 0.000 description 5
- 108090000028 Neprilysin Proteins 0.000 description 5
- 102000034527 Retinoid X Receptors Human genes 0.000 description 5
- 108010038912 Retinoid X Receptors Proteins 0.000 description 5
- 102000003566 TRPV1 Human genes 0.000 description 5
- 239000004098 Tetracycline Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 238000001000 micrograph Methods 0.000 description 5
- 108700030515 omomyc Proteins 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 210000001082 somatic cell Anatomy 0.000 description 5
- 229960002180 tetracycline Drugs 0.000 description 5
- 229930101283 tetracycline Natural products 0.000 description 5
- 235000019364 tetracycline Nutrition 0.000 description 5
- 150000003522 tetracyclines Chemical class 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000002054 transplantation Methods 0.000 description 5
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 4
- 108010085238 Actins Proteins 0.000 description 4
- 244000303258 Annona diversifolia Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 230000004568 DNA-binding Effects 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 4
- 238000002105 Southern blotting Methods 0.000 description 4
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 4
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 208000027418 Wounds and injury Diseases 0.000 description 4
- 230000031016 anaphase Effects 0.000 description 4
- 239000005557 antagonist Substances 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 230000030833 cell death Effects 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 239000012091 fetal bovine serum Substances 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 208000014674 injury Diseases 0.000 description 4
- 230000022558 protein metabolic process Effects 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 210000001988 somatic stem cell Anatomy 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 229960001603 tamoxifen Drugs 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000005740 tumor formation Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- FJHBVJOVLFPMQE-QFIPXVFZSA-N 7-Ethyl-10-Hydroxy-Camptothecin Chemical compound C1=C(O)C=C2C(CC)=C(CN3C(C4=C([C@@](C(=O)OC4)(O)CC)C=C33)=O)C3=NC2=C1 FJHBVJOVLFPMQE-QFIPXVFZSA-N 0.000 description 3
- 208000005623 Carcinogenesis Diseases 0.000 description 3
- 102000004039 Caspase-9 Human genes 0.000 description 3
- 108090000566 Caspase-9 Proteins 0.000 description 3
- 108010051219 Cre recombinase Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000008857 Ferritin Human genes 0.000 description 3
- 108050000784 Ferritin Proteins 0.000 description 3
- 238000008416 Ferritin Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000036952 cancer formation Effects 0.000 description 3
- 231100000504 carcinogenesis Toxicity 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000003797 essential amino acid Substances 0.000 description 3
- 235000020776 essential amino acid Nutrition 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- -1 loxP-TK) Proteins 0.000 description 3
- 230000031864 metaphase Effects 0.000 description 3
- 229960004927 neomycin Drugs 0.000 description 3
- 229940054269 sodium pyruvate Drugs 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 101100407152 Arabidopsis thaliana PBL7 gene Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091007914 CDKs Proteins 0.000 description 2
- 206010010144 Completed suicide Diseases 0.000 description 2
- 102000016736 Cyclin Human genes 0.000 description 2
- 108050006400 Cyclin Proteins 0.000 description 2
- 102000002428 Cyclin C Human genes 0.000 description 2
- 108010068155 Cyclin C Proteins 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 239000012981 Hank's balanced salt solution Substances 0.000 description 2
- 101000868333 Homo sapiens Cyclin-dependent kinase 1 Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 2
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229960001169 brivudine Drugs 0.000 description 2
- 230000000711 cancerogenic effect Effects 0.000 description 2
- 230000006369 cell cycle progression Effects 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000447 dimerizing effect Effects 0.000 description 2
- 238000002224 dissection Methods 0.000 description 2
- 239000003651 drinking water Substances 0.000 description 2
- 235000020188 drinking water Nutrition 0.000 description 2
- 108010057988 ecdysone receptor Proteins 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- ODZBBRURCPAEIQ-PIXDULNESA-N helpin Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(\C=C\Br)=C1 ODZBBRURCPAEIQ-PIXDULNESA-N 0.000 description 2
- 102000056838 human CDK1 Human genes 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 210000005075 mammary gland Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 108010082117 matrigel Proteins 0.000 description 2
- 230000010534 mechanism of action Effects 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 229960004857 mitomycin Drugs 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000008672 reprogramming Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- IQFYYKKMVGJFEH-CSMHCCOUSA-N telbivudine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1O[C@@H](CO)[C@H](O)C1 IQFYYKKMVGJFEH-CSMHCCOUSA-N 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- 241000283725 Bos Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 238000011814 C57BL/6N mouse Methods 0.000 description 1
- 108010034798 CDC2 Protein Kinase Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 240000005589 Calophyllum inophyllum Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000005483 Cell Cycle Proteins Human genes 0.000 description 1
- 108010031896 Cell Cycle Proteins Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000002554 Cyclin A Human genes 0.000 description 1
- 108010068192 Cyclin A Proteins 0.000 description 1
- 102000002427 Cyclin B Human genes 0.000 description 1
- 108010068150 Cyclin B Proteins 0.000 description 1
- 102000003910 Cyclin D Human genes 0.000 description 1
- 108090000259 Cyclin D Proteins 0.000 description 1
- 102000003909 Cyclin E Human genes 0.000 description 1
- 108090000257 Cyclin E Proteins 0.000 description 1
- 102000002495 Cyclin H Human genes 0.000 description 1
- 108010068237 Cyclin H Proteins 0.000 description 1
- 102000002435 Cyclin T Human genes 0.000 description 1
- 108010068106 Cyclin T Proteins 0.000 description 1
- 108010024986 Cyclin-Dependent Kinase 2 Proteins 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 108010025454 Cyclin-Dependent Kinase 5 Proteins 0.000 description 1
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 1
- 102100038254 Cyclin-F Human genes 0.000 description 1
- 102100033145 Cyclin-dependent kinase 19 Human genes 0.000 description 1
- 102100036239 Cyclin-dependent kinase 2 Human genes 0.000 description 1
- 102100036329 Cyclin-dependent kinase 3 Human genes 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 1
- 102100026810 Cyclin-dependent kinase 7 Human genes 0.000 description 1
- 102100024456 Cyclin-dependent kinase 8 Human genes 0.000 description 1
- 102100024457 Cyclin-dependent kinase 9 Human genes 0.000 description 1
- 102000003903 Cyclin-dependent kinases Human genes 0.000 description 1
- 108090000266 Cyclin-dependent kinases Proteins 0.000 description 1
- 102100026805 Cyclin-dependent-like kinase 5 Human genes 0.000 description 1
- 229940123780 DNA topoisomerase I inhibitor Drugs 0.000 description 1
- 108010033174 Deoxycytidine kinase Proteins 0.000 description 1
- 102100029588 Deoxycytidine kinase Human genes 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 101000983523 Homo sapiens Caspase-9 Proteins 0.000 description 1
- 101000884183 Homo sapiens Cyclin-F Proteins 0.000 description 1
- 101000944345 Homo sapiens Cyclin-dependent kinase 19 Proteins 0.000 description 1
- 101000715946 Homo sapiens Cyclin-dependent kinase 3 Proteins 0.000 description 1
- 101000911952 Homo sapiens Cyclin-dependent kinase 7 Proteins 0.000 description 1
- 101000980937 Homo sapiens Cyclin-dependent kinase 8 Proteins 0.000 description 1
- 101000980930 Homo sapiens Cyclin-dependent kinase 9 Proteins 0.000 description 1
- 101000917383 Homo sapiens Deoxycytidine kinase Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 1
- 206010064912 Malignant transformation Diseases 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 238000011789 NOD SCID mouse Methods 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 102100034404 Nuclear factor of activated T-cells, cytoplasmic 1 Human genes 0.000 description 1
- 101710151542 Nuclear factor of activated T-cells, cytoplasmic 1 Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 101150071661 SLC25A20 gene Proteins 0.000 description 1
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 1
- 239000000365 Topoisomerase I Inhibitor Substances 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000035508 accumulation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010076089 accutase Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000005441 aurora Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000036815 beta tubulin Diseases 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 101150102633 cact gene Proteins 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 231100000024 genotoxic Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 230000036212 malign transformation Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 230000008880 microtubule cytoskeleton organization Effects 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 108700024542 myc Genes Proteins 0.000 description 1
- 230000021616 negative regulation of cell division Effects 0.000 description 1
- 230000011999 negative regulation of cell killing Effects 0.000 description 1
- 230000035407 negative regulation of cell proliferation Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000016273 neuron death Effects 0.000 description 1
- 230000009701 normal cell proliferation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 108020002447 serine esterase Proteins 0.000 description 1
- 102000005428 serine esterase Human genes 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 210000001626 skin fibroblast Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960002197 temoporfin Drugs 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 231100000588 tumorigenic Toxicity 0.000 description 1
- 230000000381 tumorigenic effect Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 231100000747 viability assay Toxicity 0.000 description 1
- 238000003026 viability measurement method Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0603—Embryonic cells ; Embryoid bodies
- C12N5/0606—Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Developmental Biology & Embryology (AREA)
- Gynecology & Obstetrics (AREA)
- Reproductive Health (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 개시는 동물 세포에서 세포 증식을 제어하기 위해 세포 분열 좌위(CDL)를 사용하기 위한 분자 도구, 방법 및 키트를 제공한다. 본 명세서에서 제공되는 바와 같이, CDL은, 그 전사 산물(들)이 세포 분열 동안 발현되는 좌위들이다. CDL은 음성 선택 마커 및/또는 유도성 활성인자 기반 유전자 발현 시스템을 포함하도록, 본 명세서에 기재된 바와 같이 유전적으로 변형될 수 있으며, 이는 사용자로 하여금 적절한 유도인자의 부가 또는 제거에 의해, 상기 유전적으로 변형된 세포(들)의 증식을 허용하고, 어블레이션하고/하거나, 억제할 수 있도록 한다.
Description
이전 출원과의 상호 참조
본 출원은, 각각이 본 명세서에서 그 전문이 제공되는 바와 같이 참고로 포함되는 것으로, 2015년 3월 9일자로 출원된 미국 가출원 제 62/130,258호 및 2015년 3월 9일자로 출원된 미국 가출원 제 62/130,270호에 대한 파리 협약하의 우선권을 주장한다.
본 명세서는 일반적으로 세포 및 분자 생물학 분야에 관한 것이다. 더욱 구체적으로, 본 명세서는 동물 세포의 분열을 제어하기 위한 분자 도구, 방법 및 키트 및 이와 관련된 유전적으로 변형된 세포에 관한 것이다.
인간 만능성 줄기(hPS) 세포는 정상적인 세포 발생, 질병 발생을 이해하고, 현재의 난치성 장애, 예를 들어 유전적 장애, 퇴행성 질병 및/또는 다양한 손상을 치료하기 위한 세포 치료법에 사용하기 위한 도구로서 사용될 수 있다. 이들 세포의 만능성 특성은 줄기세포 상태에서 자가 재생 기간 후에 이들을 임의의 세포 유형으로 분화할 수 있도록 한다(문헌[Rossant and Nagy, 1999]). hPS 세포의 절대 표준은, 1998년에 보고된 인간 배아 줄기(hES) 세포이다(문헌[Thomson et al., 1998]). 2006년과 2007년에, 피부 섬유아세포와 같은 분화된 체세포를 ES 세포와 유사한 "유도된 만능성 줄기"(iPS) 세포로 재프로그래밍하는 방법이 보고되었고, 만능성 세포의 유형이 확장되었다(문헌[Takahashi and Yamanaka, 2006; Takahashi et al., 2007]). iPS 세포를 생성하는 방법 및 질병과 생리적 이상 질환을 치료하기 위한 세포 기반 치료법을 포함한 다방면으로의 응용이 이후 수년 동안 더욱 발전되어 왔다.
만능성 세포 기반 치료법에 관한 한 가지 우려 사항은 안전성이다. 예를 들어, 세포 이식으로부터 기인한 악성 성장이 우려된다. 재프로그래밍 방법이, iPS 세포 유래 세포의 악성 형질전환 위험이 있을 수 있는 게놈 손상 및 비정상적인 후성 변화를 야기할 수 있다고 보고된 바와 같이, 분화된 세포를 iPS 세포로 재프로그래밍하는 과정은 안전성과 관련된다(문헌[Hussein et al., 2011; Laurent et al., 2011; Lister et al., 2011]).
시험관내에서 확장된 만능성 세포를 포함하는 세포 기반 치료법의 한 가지 과제는 세포 자체의 만능성 특성이다. 예를 들어, 만능성 세포가 분화된 치료 세포 사이에 남아 있는 경우, 만능성 세포는 기형종으로 진행될 수 있다(문헌[Yoshida and Yamanaka, 2010]). 만능성 세포 유래 제품 및 치료법의 안전성을 높이기 위한 시도에는 시험관내 분화 후에 세포 배양물로부터 만능성 세포를 제거하려는 노력이 포함된다. 예를 들어: 만능성 특이적 항원을 갖는 세포를 제거하기 위해, 세포독성 항체를 사용하였고(문헌[Choo et al., 2008; Tan et al., 2009]); 세포를 만능성 세포 표면 마커를 기반으로 분류하였으며(문헌[Ben-David et al., 2013a; Fong et al., 2009; Tang et al., 2011]); 종양 진행 유전자를 세포에서 유전적으로 변형시켰고(문헌[Blum et al., 2009; Menendez et al., 2012]); 분화된 세포의 분리를 돕기 위한 전이유전자를 세포 내로 도입하였으며(문헌[Chung et al., 2006; Eiges et al., 2001; Huber et al., 2007]); 자살 유전자를 세포로 도입시켜, 분화 후 잔존하는 만능성 줄기세포를 제거하는데 사용하였고(문헌[Rong et al., 2012; Schuldiner et al., 2003]); 원치 않는 만능성 세포를, 화학 물질을 사용함으로써 어블레이션(ablation)하였다(문헌[Ben-David et al., 2013b; Dabir et al., 2013; Tohyama et al., 2013]). 잔존하는 만능성 세포가 분화된 배양물로부터 제거되더라도, 만능성 세포의 분화 유도체는 발암 성질을 가질 수 있다(문헌[Ghosh et al., 2011]). 관련 발암 현상은 i) 시험관내에서 세포를 제조하는 동안; 또는 ii) 세포를 숙주로 이식한 후, 치료 세포에서 발생될 수 있다.
원치 않는 세포 성장 및/또는 분화를 제거 또는 방지하기 위한 가장 최근의 전략은, 악성종양이 생성된 경우, 이식편을 완전히 제거하거나(문헌[Schuldiner et al., 2003]), 또는 의도된 분화 유도체를 '오염시키는' 만능성 세포만을 제거하는데(문헌[Ben-David and Benvenisty, 2014; Lim et al., 2013]) 사용될 수 있는 단순 포진 바이러스 티미딘 키나제(herpes simplex virus-thymidine kinase)(HSV-TK)/간사이클로비르(ganciclovir)(GCV) 음성 선택 시스템을 기반으로 한다. GCV 유도 세포 사멸 및 아폽토시스(apoptosis)의 메커니즘은 잘 알려져 있다. 이는 DNA 이중 가닥 파열의 복제 의존적 유발을 야기하며(문헌[Halloran and Fenton, 1998]), 이는 아폽토시스로 이어진다(문헌[Tomicic et al., 2002]). 그러나, 많은 HSV-TK/GCV 기반 시스템은, 최소한, HSV-TK의 무작위적 혼입 또는 일과성 발현에 의존하므로, 신뢰할 수 없는 수준으로 발현된다. 예를 들어, 카스파제 9(문헌[Di Stasi et al., 2011])와 같은 상이한 사멸 메커니즘을 갖는 음성 선택 마커를 포함하는 전략이 시험되었으나, 음성 선택 마커의 신뢰할 만한 발현은 나타나지 않았다. 세포 기반 치료법은 수백만 또는 수십억 개의 세포를 필요로 할 수 있으며, 이는 원치 않는 세포 성장 및/또는 분화에 의해 야기되는 모든 문제를 증폭시킬 수 있다.
본 발명의 목적은 상기 결점 중 하나 이상을 완화 및/또는 방지하는 것이다.
일 양태에서, 동물 세포의 증식을 제어하는 방법이 제공된다. 상기 방법은 동물 세포를 제공하는 단계; 상기 동물 세포에서 세포 분열 좌위(CDL)를 유전적으로 변형시키는 단계로서, CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이며, CDL의 유전적 변형은: a) 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ablation link)(ALINK) 시스템; 및 b) 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 유도성 외인성 활성인자 조절(EARC) 시스템 중 하나 이상을 포함하는 것인 단계; 상기 음성 선택 마커의 유도인자에 의해, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 제어하는 단계; 및/또는 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 제어하는 단계를 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 구현예에서, ALINK 변형된 동물 세포의 제어는: ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포를 상기 음성 선택 마커의 유도인자의 부재하에 유지시킴으로써, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 허용하는 단계; 및 ALINK 시스템을 포함하는 동물 세포를 상기 음성 선택 마커의 유도인자에 노출시킴으로써, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 어블레이션 또는 억제하는 단계 중 하나 이상을 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 일 구현예에서, EARC 변형된 동물 세포의 제어는 EARC 시스템을 포함하는 유전적으로 변형된 동물 세포를 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 노출시킴으로써, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 허용하는 단계; 및 EARC 시스템을 포함하는 동물 세포를 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 부재하에 유지시킴으로써, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포의 증식을 방지 또는 억제하는 단계 중 하나 이상을 포함한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL의 유전적 변형은 다음 중 하나 이상에 의한 CDL의 표적화된 대체를 수행하는 단계를 포함한다: a) ALINK 시스템을 포함하는 DNA 벡터; b) EARC 시스템을 포함하는 DNA 벡터; 및 c) ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL의 ALINK 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성이고/이거나, EARC 유전적 변형은, 기능적 CDL 변형이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장한다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, 상기 CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, 상기 CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제(cytosine deaminase)/5-플루오로시토신(5-fluorocytosine) 시스템, 카르복실 에스테라제(carboxyl esterase)/이리노테칸(irinotecan) 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템(dox-bridge system), 큐메이트 스위치 유도성 시스템(cumate switch inducible system), 엑디손 유도성 시스템(ecdysone inducible system), 전파 유도성 시스템(radio wave inducible system) 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 포유류 세포 또는 조류 세포이다. 다양한 구현예에서, 상기 포유류 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소(cow), 말, 사슴, 엘크, 들소, 소(oxen), 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포이며, 바람직하게는 상기 포유류 세포는 인간 세포이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포이다.
본 명세서에서 제공되는 동물 세포의 증식을 제어하는 방법의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포로부터 유래된다.
일 양태에서, 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포가 제공된다. 상기 유전적으로 변형된 동물 세포는 하나 이상의 세포 분열 좌위(CDL)의 유전적 변형을 포함하며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 유전적 변형은: a) 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템; 및 b) 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CEDL의 외인성 활성인자 조절(EARC) 시스템 중 하나 이상이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 구현예에서, CDL의 유전적 변형은 다음 중 하나 이상에 의한 CDL의 표적화된 대체를 수행하는 단계를 포함한다: a) ALINK 시스템을 포함하는 DNA 벡터; b) EARC 시스템을 포함하는 DNA 벡터; 및 c) ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, CDL의 ALINK 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성이고/이거나, EARC 유전적 변형은, 기능적 CDL 변형이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장한다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 포유류 세포 또는 조류 세포이다. 다양한 구현예에서, 상기 포유류 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포이며, 바람직하게는 상기 포유류 세포는 인간 세포이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포이다.
본 명세서에서 제공되는 세포 증식을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 유전적으로 변형된 동물 세포의 다양한 구현예에서, 상기 동물 세포는 만능성 줄기세포, 다능성 세포, 단능성 전구세포 또는 최종 분화된 세포로부터 유래된다.
일 양태에서, 세포 분열 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 음성 선택 마커의 유도인자에 노출되는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
일 양태에서, 세포 분열 필수 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 유도성 활성인자 상기 기반 유전자 발현 시스템의 유도인자에 노출되지 않는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
일 양태에서, 세포 분열 필수 좌위(CDL)의 발현을 변형시키기 위한 DNA 벡터가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 DNA 벡터는 상기 CDL에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열인 어블레이션 연결(ALINK) 시스템; 및 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하며, 상기 DNA 벡터가 하나 이상의 숙주 세포 내로 삽입된다면, 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 음성 선택 마커의 유도인자에 노출되는 경우, 및 상기 DNA 벡터를 포함하는 증식 숙주 세포가 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 노출되지 않는 경우, 상기 DNA 벡터를 포함하는 증식 숙주 세포는 사멸될 것이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 DNA 벡터의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
일 양태에서, 하나 이상의 세포 분열 필수 좌위/좌위들(CDL)의 유전적 변형에 의해, 동물 세포의 증식을 제어하기 위한 키트가 제공되며, 상기 CDL은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 하나 이상의 좌위들이다. 상기 키트는 상기 CDL을 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열을 포함하는 어블레이션 연결(ALINK) 시스템을 포함하는 DNA 벡터; 및/또는 상기 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하는 CDL의 외인성 활성인자 조절(EARC) 시스템을 포함하는 DNA 벡터; 및/또는 각각 CDL에 작동 가능하게 연결된 ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터; 및 하나 이상의 DNA 벡터를 사용하는 동물 세포에서 CDL의 표적화된 대체를 위한 지침서를 포함한다.
본 명세서에서 제공되는 키트의 일 구현예에서, CDL은 표 2에 나열된 하나 이상의 좌위들이다. 다양한 구현예에서, CDL은 세포 주기, DNA 복제, RNA 전사, 단백질 번역 및 대사작용 중 하나 이상에 관여하는 기능을 갖는 유전자 산물을 인코딩한다. 다양한 구현예에서, CDL은 Cdk1/CDK1, Top2A/TOP2A, Cenpa/CENPA, Birc5/BIRC5, 및 Eef2/EEF2 중 하나 이상이며, 바람직하게는 상기 CDL은 Cdk1 또는 CDK1이다.
본 명세서에서 제공되는 키트의 다양한 구현예에서, ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템을 포함하며, 바람직하게는 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템이다.
본 명세서에서 제공되는 키트의 다양한 구현예에서, EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이며, 바람직하게는 EARC 시스템은 dox 가교 시스템이다.
본 특허 또는 출원 파일은 적어도 하나의 컬러 도면을 포함한다. 컬러 도면이 첨부된 본 특허 또는 특허 출원 공보의 사본은 요청 및 필요한 수수료의 지불 시에 국제사무국에 의해 제공될 것이다.
본 개시 내용의 이러한 특징 및 다른 특징은 첨부된 도면을 참고로 하는 다음의 상세한 설명에서 더욱 명백해질 것이다:
도 1a 내지 도 1g는 본 명세서에서 제공되는 방법 및 도구에서 사용하기 위해 고려되는 증식의 유도된 음성 효과기(iNEP)의 개념 및 iNEP 시스템의 예를 설명하는 개략도를 도시한다. 도 1a는 CDL1에서의 동형접합성 변형, CDL1 및 CDL2에서의 동형접합성 삽입, 세포 분열에 함께 필수적인 2개의 별도의 좌위를 포함하는 CDL(CDL3)을 포함하는 iNEP 변형된 CDL의 상이한 예를 나타내는 개략도를 도시한다. 도 1b는 상이한 구성으로 어블레이션 연결(ALINK) 및 CDL의 외인성 활성인자 조절(EARC)을 포함하는 iNEP의 예를 나타내는 개략도를 도시한다. 도 1c는 이량체화제 조절된 발현 유도와 조합된 전사 활성인자 유사 효과기(TALE) 기법을 설명하는 개략도를 도시한다. 도 1d는 역 큐메이트 트랜스활성인자(reverse-cumate-Trans-Activator)(rcTA) 시스템을 설명하는 개략도를 도시한다. 도 1e는 레티노이드 X 수용체(RXR) 및 Vp16(VpEcR)의 활성화 도메인에 융합된 엑디손 수용체(EcR)의 N-말단 절두(N-terminal truncation)을 설명하는 개략도를 도시한다. 도 1f는 본 명세서에 제시된 바와 같은 iNEP 시스템의 일례인 일과성 수용체 전위 바닐로이드-1(transient receptor potential vanilloid-1)(TRPV1)을 페리틴(ferritin)과 함께 설명하는 개략도를 도시한다. 도 1g는 IRES 및 이량체화제가 iNEP로서 어떻게 사용될 수 있는지를 설명하는 개략도를 도시한다.
도 2의 A 내지 도 2의 F는 분열 중인 변형된 CDK1 발현 세포의 제거를 가능하게 하는 ALINK를 생성하기 위해, Cdk1 좌위의 3'UTR 내로 HSV-TK를 표적화하는 것을 설명하는 개략도를 도시한다. 도 2의 A는 마우스 Cdk1 좌위의 개략도를 도시한다. 도 2의 B는 마우스 표적 벡터 I의 개략도를 도시한다. 도 2의 C는 Cdk1TC 대립유전자의 개략도를 도시한다. 도 2의 D는 마우스 표적 벡터 II의 개략도를 도시한다. 도 2의 E는 Cdk1TClox 대립유전자의 개략도를 도시한다. 도 2의 F는 CRISPR 안내 RNA의 위치를 도시하며; 황색 박스의 서열은 Cdk1의 8번째 엑손이다.
도 3ab 내지 도 3g는 ALINK 예로서, 마우스 ES 세포주에서 ALINK를 생성하기 위해 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 3ab의 A는 마우스 C2 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 3ab의 B는 Cdk1(TK/+), Cdk1(TK, loxP-TK) 및 Cdk1(TK/TK)의 올바른 유전자형 분석의 서던 블롯팅(southern blotting) 결과를 도시한다. 도 3c는 마우스 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 3d는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 포함한다. 도 3e는 HSV-TK-mCherry의 발현을 활성화하기 위해, 표적화 벡터 I로 이미 올바르게하게 표적화된 마우스 ES 세포주에서 선택 마커의 절개 상황(excision event)을 설명하는 PCR 결과를 도시한다. 도 3f는 표적화 벡터 II의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시한다. 도 3g는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화시킴으로써, Cdk1(TK/TK)를 생성하는 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시한다.
도 4a 내지 도 4jk는 ALINK 변형으로서, 인간 ES 세포주에서 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 4a는 인간 CA1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4b는 인간 CA1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4c는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4d는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 Cdk1(PB-TK/+) ES 세포주에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측법을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4e는 표적화 벡터 II(puro-버전)의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시하며; 상단 패널은 5' 상동성 아암(arm)에 플랭킹된 프라이머를 사용하는 PCR이고; 하단 패널은 5' 및 3' 상동성 아암 내부의 프라이머를 사용하는 PCR이며, 0.7kb 밴드가 부재하고, 클론이 ALINK에서 동형접합성임을 의미하는 2.8kb 밴드가 존재하며, 클론이 ALINK에서 이형접합성이거나, 집단이 클론이 아니라는 것을 의미하는 0.7kb 밴드가 존재한다. 도 4f는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화하기 위한 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측 분석을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4g는 인간 H1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4h는 인간 H1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4i는 표적화 벡터 II의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4jk의 J는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 H1 Cdk1(loxP-TK/+)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4jk의 K는 Cdk1(TK/+) 세포 내로의 표적화 벡터 Ⅲ(GFP-버전)의 표적화의 형광 활성화 세포 분류(FACS)를 도시한다. FACS 분류 후, 밀집도가 낮은 플레이트에서 채취한 클론을 mCherry 대립유전자 특이적 프라이머, eGFP 대립유전자 특이적 프라이머 및 5' 및 3' 상동성 아암의 프라이머로 유전자형을 분석하였으며; 주황색 별표로 표시된 클론은 mCherry의 하나의 대립유전자 및 eGFP의 하나의 대립유전자를 갖는 동형접합성 ALINK이고; 녹색 별표로 표시된 하나의 클론은 eGFP의 2개의 대립유전자를 갖는 동형접합성 ALINK이다.
도 5a 내지 도 5c는 기형종 조직학(기형종의 내배엽, 중배엽 및 외배엽 부분이 각각 좌측에서 우측으로 도시됨)을 도시한다. 도 5a는 마우스 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5b는 마우스 ES Cdk1earc/earc, alink / alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5c는 인간 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다.
도 6a 내지 도 6b는 CDK1 좌위의 3'UTR로의 HSV-TK mCherry 녹인(knock-in)을 갖는 마우스 ES 세포의 시험관내 기능 분석을 도시한다. 도 6a는 세포를 상이한 농도의 GCV에 3일 동안 노출시킨 후, TK.007 유전자에 의해 제공되는 사멸 효율을 도시한다. 콜로니 크기 및 수는 GCV 농도에 정비례한다. 두 번째 저농도인 0.01 μM은 콜로니 수에 영향을 미치지 않았으나, 세포 성장을 둔화시켰으며, 이는 감소된 콜로니 크기(n=5)에 의해 입증된 바와 같다. 도 6b는 네오-카세트의 PB 매개된 제거 전(Cdk1ㆍHSV-TKㆍNeoIN)과 후(Cdk1ㆍHSV-TK), mCherry의 발현을 설명한다.
도 7a 내지 도 7def는 ALINK 변형된 세포를 사용한 세포 실험의 결과를 도시한다. 도 7a는 ALINK 변형된 마우스 C2 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7b는 ALINK 변형된 H1 ES 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7c는 ALINK 변형된 세포를 포함하는 유선 종양의 GCV 처리 결과를 그래프로 도시한다. 도 7def의 D는 신경 분석의 실험적 설계를 개략적으로 도시한다. 도 7def의 E는 Cdk1+/+, alink 인간 CA1 ES 세포로부터 유래된 신경 상피 전구세포(NEP) 세포의 현미경 이미지이다. 도 7def의 F는 분열 중인 ALINK 변형된 NEP의 GCV 유도된 사멸 및 비분열 뉴런의 비사멸을 설명하는 현미경 이미지를 도시한다.
도 8은 집단이 이형접합성(청색선) 및 동형접합성(적색선) ALINK 세포로부터 확장됨에 따라, HSV-TK 유전자에서 자연발생 돌연변이를 포함하는 추정 세포 수를 나타내는 그래프를 도시한다.
도 9a 내지 도 9b는, EARC를 생성하기 위한 마우스 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화 및 Cdk1 내로의 삽입 후 가교의 거동을 도시한다. 도 9a는 마우스 Cdk1 좌위의 구조, 표적 벡터 및 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 설명하는 개략도이다. 도 9b는 dox 가교가 Cdk1 5'UTR에 혼입된 것들을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 10은, 동형접합성 dox 가교 녹인을 갖는 ES 세포가 독시사이클린(또는, 독시사이클린 중복 기능을 갖는 약물)의 존재하에서만 생존하고, 분열하는 것을 설명하는 흐름도를 도시한다.
도 11은, 동형접합성 dox 가교 녹인 ES 세포가 독시사이클린 농도 의존적 생존 및 성장을 나타내는 것을 설명하는 대표적인 현미경 사진을 도시한다.
도 12는, ES 세포의 독시사이클린 의존적 생존을 복구하는 Cre 재조합효소 매개된 절개에 의한 dox 가교 제거를 도시한다.
도 13a 및 도 13b는 dox 가교 ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 13a는 독시사이클린의 존재하에 세포가 기하급수적으로 성장하며(원형이 포함된 적색 선), 이는 그의 정상적인 성장을 나타내는 것임을 나타내는 그래프를 도시한다. 1일째에 독시사이클린 회수 시에, 세포는 2일 동안만 성장하였으며, 그 후, 플레이트들로부터 세포들이 사라지기 시작하여, 9일째에는 세포가 존재하지 않았다(사각형이 포함된 어두운 청색 선). 처음 3일의 성장 후에 20배 더 낮은 독시사이클린 농도(50ng/ml)는 플레이트 상에 적어도 5일 동안 일정한 수의 세포를 유지시켰다(도 13, 삼각형이 포함된 밝은 청색 선). 정상 농도의 독시사이클린을 10일째에 플레이트에 다시 부가하였으며, 세포는 정상 ES 세포와 같이 다시 성장하기 시작하였다. 도 13b는 Dox 제거 0일, 1일 및 2일 후, Cdk1 mRNA의 수준(정량적 PCR에 의해 측정된 바와 같음)을 나타내는 막대 그래프를 도시한다. 발현 수준은 베타 액틴으로 정상화한다.
도 14는 dox 가교 ES 세포의 성장 과정을 도시하며, 독시사이클린이 배지로부터 제거된 경우, 100,000,000개의 dox 가교된 ES 세포 중에서 회피 세포가 존재하지 않는 것으로 나타났으나, 센티넬(sentinel)(야생형, GFP 양성) 세포는 고효율로 생존한 것을 설명한다.
도 15는 dox 가교 ES 세포에 대한 독시사이클린 고농도(10 μg/ml)의 효과를 나타내는 그래프를 도시하며: 고 독시사이클린의 존재하에, 세포는 저 독시사이클린에서와 유사한 그의 성장 속도로 둔화되며(고 dox는 10 μg/ml이고, 정상 dox는 1 μg/ml이며, 저 dox는 0.05 μg/ml임), 이는 세포 증식을 위한 CDK1 발현의 최적 수준을 정의하는 Dox 농도에 대한 창(window)이 존재한다는 것을 나타낸다.
도 16a 및 도 16b는 ALINK 변형을 포함하는 마우스 세포(즉, Cdk1(TK/TK) 세포; 도 3ab 내지 도 3g에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 16a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 16b는 마우스 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 마우스 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 17a 내지 도 17b는 ALINK 변형을 포함하는 인간 세포(즉, Cdk1(TK/TK) 세포; 도 4a 내지 도 4f에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 17a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 17b는 인간 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 인간 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 18a 및 도 18b는 Top2a로의 EARC 삽입을 생성하기 위한 Top2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 18a는 Top2a 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. TOP2a_5scrF, rttaRev, CMVforw 및 TOP2a_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 나타낸다. 도 18b는, Top2a 5'UTR로 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개는 상동성 재조합에 의해 Top2a의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 19a 및 도 19b는 Top2a-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 19a는, 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 나타낸다. 도 19b는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 2일 후에는, 세포 성장이 완전히 저지되었다.
도 20a 및 도 20b는 Cenpa로의 EARC 삽입을 생성하기 위한 Cenpa 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 20a는 Cenpa 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Cenpa_5scrF, rttaRev, CMVforw 및 Cenpa_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 20b는, Cenpa 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포들 중 6개는 5' 및 3'에 올바른 삽입을 갖는 것으로 밝혀졌으며, 적어도 하나의 클론(Cenpa # 4)은 상동성 재조합에 의해 Cenpa의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 21a 및 도 21b는 Cenpa-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 21a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 21b는 Dox를 갖는 Cenpa-EARC 세포 및 Dox 제거 2일 후의 Cenpa 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Cenpa 발현 수준은 Dox의 부재하에 Cenpa-EARC 세포에서 2일 동안 크게 감소한다.
도 22는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Cenpa-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 80시간 후에는, 세포 성장이 완전히 저지되었다.
도 23a 및 도 23b는 Birc5로의 EARC 삽입을 생성하기 위한 Birc5 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 23a는 Birc5 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Birc_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 23b는, Birc5 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 5개의 클론은 재조합에 의해 Birc5의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 올바르게 표적화된 것으로 밝혀졌다. 이들 클론 중 하나는 Birc#3이었으며, Dox의 부재하에 성장이 중지되거나 사멸된 것으로 밝혀졌다.
도 24a 및 도 24b는 Birc5-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 24a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 24b는 Dox를 갖는 Birc5-EARC 세포에서 Dox 제거 2일 후의 Birc5 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Birc5 발현 수준은 Dox의 부재하에 Birc5-EARC 세포에서 2일 동안 크게 감소한다.
도 25는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Birc5-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 50시간 후에는, 세포 성장이 완전히 저지되었다. 흥미롭게도, 더 저농도 Dox(0.5 및 0.05 μg/ml)가 더 고농도(1 μg/ml)보다 더 양호한 세포 성장을 촉진하는 것으로 나타난다.
도 26a 및 도 26b는 Eef2로의 EARC 삽입을 생성하기 위한 Eef2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 26a는 Eef2 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Eef2_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 26b는, Eef2 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개가 올바르게 표적화된 것으로 밝혀졌으며, 적어도 하나의 클론은 Dox-배지에서만 성장하였다.
도 27은 Eef2-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한다.
도 28은 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Eef2-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 부재 시에 세포는 성장에 완전히 실패한다.
본 개시 내용의 이러한 특징 및 다른 특징은 첨부된 도면을 참고로 하는 다음의 상세한 설명에서 더욱 명백해질 것이다:
도 1a 내지 도 1g는 본 명세서에서 제공되는 방법 및 도구에서 사용하기 위해 고려되는 증식의 유도된 음성 효과기(iNEP)의 개념 및 iNEP 시스템의 예를 설명하는 개략도를 도시한다. 도 1a는 CDL1에서의 동형접합성 변형, CDL1 및 CDL2에서의 동형접합성 삽입, 세포 분열에 함께 필수적인 2개의 별도의 좌위를 포함하는 CDL(CDL3)을 포함하는 iNEP 변형된 CDL의 상이한 예를 나타내는 개략도를 도시한다. 도 1b는 상이한 구성으로 어블레이션 연결(ALINK) 및 CDL의 외인성 활성인자 조절(EARC)을 포함하는 iNEP의 예를 나타내는 개략도를 도시한다. 도 1c는 이량체화제 조절된 발현 유도와 조합된 전사 활성인자 유사 효과기(TALE) 기법을 설명하는 개략도를 도시한다. 도 1d는 역 큐메이트 트랜스활성인자(reverse-cumate-Trans-Activator)(rcTA) 시스템을 설명하는 개략도를 도시한다. 도 1e는 레티노이드 X 수용체(RXR) 및 Vp16(VpEcR)의 활성화 도메인에 융합된 엑디손 수용체(EcR)의 N-말단 절두(N-terminal truncation)을 설명하는 개략도를 도시한다. 도 1f는 본 명세서에 제시된 바와 같은 iNEP 시스템의 일례인 일과성 수용체 전위 바닐로이드-1(transient receptor potential vanilloid-1)(TRPV1)을 페리틴(ferritin)과 함께 설명하는 개략도를 도시한다. 도 1g는 IRES 및 이량체화제가 iNEP로서 어떻게 사용될 수 있는지를 설명하는 개략도를 도시한다.
도 2의 A 내지 도 2의 F는 분열 중인 변형된 CDK1 발현 세포의 제거를 가능하게 하는 ALINK를 생성하기 위해, Cdk1 좌위의 3'UTR 내로 HSV-TK를 표적화하는 것을 설명하는 개략도를 도시한다. 도 2의 A는 마우스 Cdk1 좌위의 개략도를 도시한다. 도 2의 B는 마우스 표적 벡터 I의 개략도를 도시한다. 도 2의 C는 Cdk1TC 대립유전자의 개략도를 도시한다. 도 2의 D는 마우스 표적 벡터 II의 개략도를 도시한다. 도 2의 E는 Cdk1TClox 대립유전자의 개략도를 도시한다. 도 2의 F는 CRISPR 안내 RNA의 위치를 도시하며; 황색 박스의 서열은 Cdk1의 8번째 엑손이다.
도 3ab 내지 도 3g는 ALINK 예로서, 마우스 ES 세포주에서 ALINK를 생성하기 위해 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 3ab의 A는 마우스 C2 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 3ab의 B는 Cdk1(TK/+), Cdk1(TK, loxP-TK) 및 Cdk1(TK/TK)의 올바른 유전자형 분석의 서던 블롯팅(southern blotting) 결과를 도시한다. 도 3c는 마우스 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 3d는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 포함한다. 도 3e는 HSV-TK-mCherry의 발현을 활성화하기 위해, 표적화 벡터 I로 이미 올바르게하게 표적화된 마우스 ES 세포주에서 선택 마커의 절개 상황(excision event)을 설명하는 PCR 결과를 도시한다. 도 3f는 표적화 벡터 II의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시한다. 도 3g는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화시킴으로써, Cdk1(TK/TK)를 생성하는 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시한다.
도 4a 내지 도 4jk는 ALINK 변형으로서, 인간 ES 세포주에서 CDK1 좌위의 3'UTR로의 HSV-TK-mCherry의 생성을 도시한다. 도 4a는 인간 CA1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4b는 인간 CA1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4c는 표적화 벡터 I의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4d는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 Cdk1(PB-TK/+) ES 세포주에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측법을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4e는 표적화 벡터 II(puro-버전)의 Cdk1(TK/+) 세포 내로의 표적화를 설명하는 PCR 결과를 도시하며; 상단 패널은 5' 상동성 아암(arm)에 플랭킹된 프라이머를 사용하는 PCR이고; 하단 패널은 5' 및 3' 상동성 아암 내부의 프라이머를 사용하는 PCR이며, 0.7kb 밴드가 부재하고, 클론이 ALINK에서 동형접합성임을 의미하는 2.8kb 밴드가 존재하며, 클론이 ALINK에서 이형접합성이거나, 집단이 클론이 아니라는 것을 의미하는 0.7kb 밴드가 존재한다. 도 4f는 HSV-TK-mCherry의 제2 대립유전자 발현을 활성화하기 위한 Cdk1(TK, loxP-TK)에서의 선택 마커의 절개 상황을 설명하는 유동 세포계측 분석을 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4g는 인간 H1 ES 세포에서 ALINK를 생성하는 전체 단계를 도시한다. 도 4h는 인간 H1 세포에서 ALINK 유전자형 분석에 사용된 프라이머의 위치를 도시한다. 도 4i는 표적화 벡터 II의 CDK1 좌위의 3'UTR로의 표적화를 설명하는 PCR 결과를 도시한다. 도 4jk의 J는 HSV-TK-mCherry의 발현을 활성화시키기 위한 인간 H1 Cdk1(loxP-TK/+)에서의 선택 마커의 절개 상황을 설명하는 PCR 결과를 도시하며; Y 축은 mCherry 발현 수준을 나타내고, X 축은 자가 형광 채널이다. 도 4jk의 K는 Cdk1(TK/+) 세포 내로의 표적화 벡터 Ⅲ(GFP-버전)의 표적화의 형광 활성화 세포 분류(FACS)를 도시한다. FACS 분류 후, 밀집도가 낮은 플레이트에서 채취한 클론을 mCherry 대립유전자 특이적 프라이머, eGFP 대립유전자 특이적 프라이머 및 5' 및 3' 상동성 아암의 프라이머로 유전자형을 분석하였으며; 주황색 별표로 표시된 클론은 mCherry의 하나의 대립유전자 및 eGFP의 하나의 대립유전자를 갖는 동형접합성 ALINK이고; 녹색 별표로 표시된 하나의 클론은 eGFP의 2개의 대립유전자를 갖는 동형접합성 ALINK이다.
도 5a 내지 도 5c는 기형종 조직학(기형종의 내배엽, 중배엽 및 외배엽 부분이 각각 좌측에서 우측으로 도시됨)을 도시한다. 도 5a는 마우스 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5b는 마우스 ES Cdk1earc/earc, alink / alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다. 도 5c는 인간 ES Cdk1+/+, alink/alink 세포로부터 유래된 기형종의 현미경 사진을 도시한다.
도 6a 내지 도 6b는 CDK1 좌위의 3'UTR로의 HSV-TK mCherry 녹인(knock-in)을 갖는 마우스 ES 세포의 시험관내 기능 분석을 도시한다. 도 6a는 세포를 상이한 농도의 GCV에 3일 동안 노출시킨 후, TK.007 유전자에 의해 제공되는 사멸 효율을 도시한다. 콜로니 크기 및 수는 GCV 농도에 정비례한다. 두 번째 저농도인 0.01 μM은 콜로니 수에 영향을 미치지 않았으나, 세포 성장을 둔화시켰으며, 이는 감소된 콜로니 크기(n=5)에 의해 입증된 바와 같다. 도 6b는 네오-카세트의 PB 매개된 제거 전(Cdk1ㆍHSV-TKㆍNeoIN)과 후(Cdk1ㆍHSV-TK), mCherry의 발현을 설명한다.
도 7a 내지 도 7def는 ALINK 변형된 세포를 사용한 세포 실험의 결과를 도시한다. 도 7a는 ALINK 변형된 마우스 C2 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7b는 ALINK 변형된 H1 ES 세포를 포함하는 피하 기형종의 GCV 처리 결과를 그래프로 도시한다. 도 7c는 ALINK 변형된 세포를 포함하는 유선 종양의 GCV 처리 결과를 그래프로 도시한다. 도 7def의 D는 신경 분석의 실험적 설계를 개략적으로 도시한다. 도 7def의 E는 Cdk1+/+, alink 인간 CA1 ES 세포로부터 유래된 신경 상피 전구세포(NEP) 세포의 현미경 이미지이다. 도 7def의 F는 분열 중인 ALINK 변형된 NEP의 GCV 유도된 사멸 및 비분열 뉴런의 비사멸을 설명하는 현미경 이미지를 도시한다.
도 8은 집단이 이형접합성(청색선) 및 동형접합성(적색선) ALINK 세포로부터 확장됨에 따라, HSV-TK 유전자에서 자연발생 돌연변이를 포함하는 추정 세포 수를 나타내는 그래프를 도시한다.
도 9a 내지 도 9b는, EARC를 생성하기 위한 마우스 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화 및 Cdk1 내로의 삽입 후 가교의 거동을 도시한다. 도 9a는 마우스 Cdk1 좌위의 구조, 표적 벡터 및 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 설명하는 개략도이다. 도 9b는 dox 가교가 Cdk1 5'UTR에 혼입된 것들을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 10은, 동형접합성 dox 가교 녹인을 갖는 ES 세포가 독시사이클린(또는, 독시사이클린 중복 기능을 갖는 약물)의 존재하에서만 생존하고, 분열하는 것을 설명하는 흐름도를 도시한다.
도 11은, 동형접합성 dox 가교 녹인 ES 세포가 독시사이클린 농도 의존적 생존 및 성장을 나타내는 것을 설명하는 대표적인 현미경 사진을 도시한다.
도 12는, ES 세포의 독시사이클린 의존적 생존을 복구하는 Cre 재조합효소 매개된 절개에 의한 dox 가교 제거를 도시한다.
도 13a 및 도 13b는 dox 가교 ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 13a는 독시사이클린의 존재하에 세포가 기하급수적으로 성장하며(원형이 포함된 적색 선), 이는 그의 정상적인 성장을 나타내는 것임을 나타내는 그래프를 도시한다. 1일째에 독시사이클린 회수 시에, 세포는 2일 동안만 성장하였으며, 그 후, 플레이트들로부터 세포들이 사라지기 시작하여, 9일째에는 세포가 존재하지 않았다(사각형이 포함된 어두운 청색 선). 처음 3일의 성장 후에 20배 더 낮은 독시사이클린 농도(50ng/ml)는 플레이트 상에 적어도 5일 동안 일정한 수의 세포를 유지시켰다(도 13, 삼각형이 포함된 밝은 청색 선). 정상 농도의 독시사이클린을 10일째에 플레이트에 다시 부가하였으며, 세포는 정상 ES 세포와 같이 다시 성장하기 시작하였다. 도 13b는 Dox 제거 0일, 1일 및 2일 후, Cdk1 mRNA의 수준(정량적 PCR에 의해 측정된 바와 같음)을 나타내는 막대 그래프를 도시한다. 발현 수준은 베타 액틴으로 정상화한다.
도 14는 dox 가교 ES 세포의 성장 과정을 도시하며, 독시사이클린이 배지로부터 제거된 경우, 100,000,000개의 dox 가교된 ES 세포 중에서 회피 세포가 존재하지 않는 것으로 나타났으나, 센티넬(sentinel)(야생형, GFP 양성) 세포는 고효율로 생존한 것을 설명한다.
도 15는 dox 가교 ES 세포에 대한 독시사이클린 고농도(10 μg/ml)의 효과를 나타내는 그래프를 도시하며: 고 독시사이클린의 존재하에, 세포는 저 독시사이클린에서와 유사한 그의 성장 속도로 둔화되며(고 dox는 10 μg/ml이고, 정상 dox는 1 μg/ml이며, 저 dox는 0.05 μg/ml임), 이는 세포 증식을 위한 CDK1 발현의 최적 수준을 정의하는 Dox 농도에 대한 창(window)이 존재한다는 것을 나타낸다.
도 16a 및 도 16b는 ALINK 변형을 포함하는 마우스 세포(즉, Cdk1(TK/TK) 세포; 도 3ab 내지 도 3g에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 16a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 16b는 마우스 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 마우스 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 17a 내지 도 17b는 ALINK 변형을 포함하는 인간 세포(즉, Cdk1(TK/TK) 세포; 도 4a 내지 도 4f에 기재된 세포 산물)의 Cdk1 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 17a는 Cdk1(TK/TK) 세포에서의 Cdk1 좌위의 구조, 가교 표적 벡터 및 유전자형 분석 프라이머의 위치를 설명하는 개략도이다. 도 17b는 인간 Cdk1(TK/TK) 세포에서 Cdk1 5'UTR에 dox 가교가 혼입됨으로써, 인간 세포 산물 Cdk1earc/earc, alink / alink이 생성된 것을 확인하기 위해, 퓨로마이신 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다.
도 18a 및 도 18b는 Top2a로의 EARC 삽입을 생성하기 위한 Top2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 18a는 Top2a 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. TOP2a_5scrF, rttaRev, CMVforw 및 TOP2a_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용되는 프라이머의 위치를 나타낸다. 도 18b는, Top2a 5'UTR로 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개는 상동성 재조합에 의해 Top2a의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 19a 및 도 19b는 Top2a-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 19a는, 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 나타낸다. 도 19b는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 2일 후에는, 세포 성장이 완전히 저지되었다.
도 20a 및 도 20b는 Cenpa로의 EARC 삽입을 생성하기 위한 Cenpa 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 20a는 Cenpa 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Cenpa_5scrF, rttaRev, CMVforw 및 Cenpa_3scrR은 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 20b는, Cenpa 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포들 중 6개는 5' 및 3'에 올바른 삽입을 갖는 것으로 밝혀졌으며, 적어도 하나의 클론(Cenpa # 4)은 상동성 재조합에 의해 Cenpa의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것으로 밝혀졌다.
도 21a 및 도 21b는 Cenpa-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 21a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 21b는 Dox를 갖는 Cenpa-EARC 세포 및 Dox 제거 2일 후의 Cenpa 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Cenpa 발현 수준은 Dox의 부재하에 Cenpa-EARC 세포에서 2일 동안 크게 감소한다.
도 22는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Cenpa-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 80시간 후에는, 세포 성장이 완전히 저지되었다.
도 23a 및 도 23b는 Birc5로의 EARC 삽입을 생성하기 위한 Birc5 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 23a는 Birc5 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Birc_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 23b는, Birc5 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 5개의 클론은 재조합에 의해 Birc5의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 올바르게 표적화된 것으로 밝혀졌다. 이들 클론 중 하나는 Birc#3이었으며, Dox의 부재하에 성장이 중지되거나 사멸된 것으로 밝혀졌다.
도 24a 및 도 24b는 Birc5-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 도 24a는 독시사이클린의 회수가 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한 것을 도시한다. 도 24b는 Dox를 갖는 Birc5-EARC 세포에서 Dox 제거 2일 후의 Birc5 유전자 발현 수준(q-PCR에 의해 결정됨)이며, 야생형 마우스 ES 세포(C2)의 발현 수준과 비교한 것이다. 추정된 바와 같이, Birc5 발현 수준은 Dox의 부재하에 Birc5-EARC 세포에서 2일 동안 크게 감소한다.
도 25는 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Birc5-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 50시간 후에는, 세포 성장이 완전히 저지되었다. 흥미롭게도, 더 저농도 Dox(0.5 및 0.05 μg/ml)가 더 고농도(1 μg/ml)보다 더 양호한 세포 성장을 촉진하는 것으로 나타난다.
도 26a 및 도 26b는 Eef2로의 EARC 삽입을 생성하기 위한 Eef2 좌위의 5'UTR로의 dox 가교의 표적화를 도시한다. 도 26a는 Eef2 좌위 및 표적 벡터의 구조를 설명하는 개략도이다. Eef2_5scrF 및 rttaRev는 상동성 재조합 상황에 대한 유전자형 분석에 사용된 프라이머의 위치를 나타낸다. 도 26b는, Eef2 5'UTR에 dox 가교가 혼입된 것을 확인하기 위한 puro 저항성 콜로니의 유전자형 분석을 나타내는 PCR 결과를 도시한다. 이들 세포주 중 9개가 올바르게 표적화된 것으로 밝혀졌으며, 적어도 하나의 클론은 Dox-배지에서만 성장하였다.
도 27은 Eef2-EARC ES 세포의 성장에 대한 독시사이클린 회수의 효과를 도시한다. 독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기한다.
도 28은 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 Eef2-EARC ES 세포의 증식에 어떻게 영향을 주었는지를 도시한다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 부재 시에 세포는 성장에 완전히 실패한다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및 과학 용어는, 본 개시 내용이 속하는 기술 분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
정의
본 명세서에 사용되는 바와 같이, 용어 "세포 분열 좌위", "세포 분열 좌위들", 및 "CDL"은, 그 전사 산물(들)이 분열 세포에 의해 발현되는 게놈 좌위(또는, 좌위들)를 지칭한다. CDL이 단일 좌위를 포함하는 경우, CDL 발현의 부재 시에 세포(들)가 어블레이션되거나, CDL 발현의 부재 시에 세포(들)의 증식이 차단 또는 훼손될 것이므로, 세포(또는, 그의 유도체)에서 CDL 발현의 부재는 종양 개시 및/또는 형성이 금지된다는 것을 의미한다. CDL이 다수 좌위들을 포함하는 경우, CDL 발현의 부재 시에 세포(들)가 어블레이션되거나, CDL 발현의 부재 시에 세포(들)의 증식이 차단 또는 훼손될 것이므로, 세포(또는, 그의 유도체)에서 상기 좌위들의 전부 또는 그의 하위세트에 의한 발현의 부재는 종양 개시 및/또는 형성이 금지된다는 것을 의미한다. CDL은 비분열성 및/또는 비증식성 세포에서 발현될 수 있거나, 발현되지 않을 수 있다. CDL은 숙주 세포에 대해 내인성이거나, 전이유전자일 수 있다. CDL이 전이유전자인 경우, 숙주 세포와 동일하거나 상이한 종으로부터 유래될 수 있거나, 합성 유래의 것일 수 있다. 일 구현예에서, CDL은 세포 분열 동안 전사되는 단일 좌위이다. 예를 들어, 일 구현예에서, 단일 좌위 CDL은 CDK1이다. 일 구현예에서, CDL은 세포 분열 동안 전사되는 2개 이상의 좌위들을 포함한다. 예를 들어, 일 구현예에서, 다좌위 CDL은 2개의 MYC 유전자(c-Myc 및 N-myc)를 포함한다(문헌[Scognamiglio et al., 2016]). 일 구현예에서, 다좌위 CDL은 중복 기능을 가질 수 있는 AURORA B 및 C 키나제를 포함한다(문헌[Fernandez-Miranda et al., 2011]). 세포 분열 및 세포 증식은 본 명세서에서 상호교환적으로 사용될 수 있는 용어이다.
본 명세서에 사용되는 바와 같이, 용어 "세포 분열의 정상 속도", "정상 세포 분열 속도", "세포 증식의 정상 속도" 및 "정상 세포 증식 속도"는 비암성의 건강한 세포의 전형적인 세포 분열 및/또는 증식의 속도를 지칭한다. 세포 분열 및/또는 증식의 정상 속도는 세포 유형에 특이적일 수 있다. 예를 들어, 표피, 장, 폐, 혈액, 골수, 흉선, 고환, 자궁 및 유선의 세포 수가 고속 세포 분열 및 고속 사멸에 의해 유지된다는 것이 광범위하게 인정되고 있다. 반대로, 췌장, 신장, 각막, 전립선, 골, 심장 및 뇌의 세포 수는 저속 세포 분열 및 저속 세포 사멸에 의해 유지된다(문헌[Pellettieri and Saenchez Alvarado, 2007]).
본 명세서에 사용되는 바와 같이, 용어 "증식의 유도성 음성 효과기" 및 "iNEP"는: i) CDL 발현을 유도적으로 중지시키거나 차단함으로써, 세포 분열 및 증식을 금지하거나; ii) CDL 발현 세포의 적어도 일부를 유도적으로 어블레이션하거나(즉, 증식 세포의 적어도 일부를 사멸시킴); 또는 iii) 세포 분열 속도가 종양 형성에 기여할 만큼 충분히 빠르지 않도록, 세포 분열 속도를 세포의 정상 세포 분열 속도에 비해 유도적으로 둔화시킴으로써, 세포 분열 및/또는 증식을 제어하기 위한 CDL 발현의 사용을 용이하게 하는 유전적 변형을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "어블레이션 연결" 및 "ALINK"은 CDL과 음성 선택 마커를 인코딩하는 서열 사이의 전사 연결을 포함하는 iNEP의 예를 지칭한다. ALINK 변형은 사용자로 하여금, 음성 선택 마커의 유도인자에 ALINK 변형된 세포를 노출시킴으로써, 증식 세포의 적어도 일부를 사멸시킴으로써, ALINK를 포함하는 증식 숙주 세포를 유도적으로 사멸시키거나, 상기 숙주 세포의 증식을 억제할 수 있도록 한다. 예를 들어, CDL에 ALINK를 포함하도록 변형된 세포는, 증식 세포의 적어도 일부를 사멸시킴으로써, 증식 세포를 어블레이션하거나, 세포 증식을 억제하기 위해, 음성 선택 마커의 유도인자(예를 들어, 전구약물)에 의해 치료될 수 있다(도 1b).
본 명세서에 사용되는 바와 같이, 용어 "CDL의 외인성 활성인자 조절" 및 "EARC"는, 활성인자를 통한 비코딩 또는 코딩 DNA 전사 또는 상응하는 번역의 외인성 변경을 용이하게 하는 메커니즘 또는 시스템을 포함하는 iNEP의 예를 지칭한다. EARC 변형은 사용자로 하여금, EARC 변형된 CDL의 전사 및/또는 번역을 허용하는 유도인자를 EARC 변형된 세포로부터 제거함으로써, EARC를 포함하는 세포의 분열을 유도적으로 중지 또는 억제할 수 있도록 한다. 예를 들어, 유도성 활성인자 기반 유전자 발현 시스템은 CDL에 작동 가능하게 연결될 수 있으며, 약물 유도성 활성인자 및 상응하는 유도인자 약물의 존재가 CDL 전사 및/또는 번역을 위해 요구되도록, CDL의 발현 또는 CDL 번역을 외인적으로 제어하는데 사용될 수 있다. 유도인자 약물의 부재하에, 세포 분열 및/또는 증식은 중지 또는 억제될 것이다(예를 들어, 정상 세포 분열 속도로 둔화됨). 예를 들어, Cdk1/CDK1의 발현, 그리고 세포 분열 및 증식이 유도인자(예를 들어, 독시사이클린)의 존재하에서만 가능할 수 있도록, CDL Cdk1/CDK1은 dox 가교를 포함하도록 변형될 수 있다(도 1b).
본 명세서에 사용되는 바와 같이, 용어 "증식 길항제 시스템"는, 그의 존재가 세포의 증식을 (완전히 또는 부분적으로) 억제하는 천연 또는 조작된 화합물(들)을 지칭한다.
도구 및 방법에 대한 일반적인 설명
본 명세서에 기재된 바와 같이, 본 발명자들은, 사용자에 의해 세포 분열 및/또는 증식이 하나 이상의 iNEP를 통해 제어될 수 있는 유전적으로 변형된 세포를 생성하기 위해, 동물 세포에서 하나 이상의 세포 분열 좌위들(CDL)을 사용하기 위한 분자 도구, 방법 및 키트를 제공하였다(도 1a). 예를 들어, 본 명세서에서 제공되는 하나 이상의 도구 및/또는 방법을 사용함으로써 생성된 세포의 분열은, 세포 분열 속도가 종양 형성에 기여할 만큼 충분히 빠르지 않도록, 사용자에 의해 중지, 차단 또는 억제될 수 있다. 예를 들어, 본 명세서에서 제공되는 하나 이상의 도구 및/또는 방법을 사용함으로써 생성된 세포의 증식은, 세포의 증식 속도 또는 체적이 각각 사용자가 원하는 속도 또는 크기로 유지될 수 있도록, 증식 세포의 적어도 일부를 사멸 또는 중지시킴으로써, 사용자에 의해 중지, 차단 또는 억제될 수 있다.
세포 분열 및/또는 증식을 제어하기 위한 도구 및 방법은, 예를 들어 (정상 세포 분열 속도에 비해) 더 빠른 세포 분열 속도가 바람직하지 않은 경우에, 바람직하다. 예를 들어, 정상 속도보다 더 빠르게 분열하는 세포는 그 위치에서 종양을 형성할 수 있으며, 이는 숙주에 유해할 수 있다. 일 구현예에서, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는, 바람직하지 않은 세포 분열 및/또는 증식이 사용자에 의해 제어될 수 있도록, 정상 세포 분열 및/또는 증식을 허용하고, 세포 분열 및/또는 증식을 중지, 어블레이션, 차단 및/또는 둔화시키기 위한 하나 이상의 메커니즘을 포함한다(도 1b). 도 1b와 관련하여, 실시예(I)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 3'UTR에 삽입되며, 그 전사 산물은, 2개의 단백질로 가공되는 이중 시스트론(bi-cistronic) mRNA이다. 실시예(II)에서, EARC 및 ALINK 둘 모두는 CDL의 5'UTR에 삽입되며, 그 전사 산물은, 2개의 단백질로 가공되는 이중 시스트론 mRNA이다. 실시예(Ⅲ)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 CDL 코딩 서열 내에 삽입되며, 그 전사 산물은, 특이적으로 설계된 절단 서열의 절단 시에 2개의 개별 단백질을 생성할 것인 전구체 단백질로 가공되는 mRNA이다. 실시예(IV)에서, EARC 및 ALINK 둘 모두는 CDL의 5'UTR에 삽입되며, 그 전사 산물은 CDL 및 ALINK 기능 둘 모두를 유지하는 융합 단백질로 가공되는 mRNA이다. 실시예(V)에서, EARC는 CDL의 5'UTR에 삽입되고, ALINK는 3'UTR에 삽입되며, 그 전사 산물은 CDL 및 ALINK 기능 둘 모두를 유지하는 융합 단백질로 가공되는 mRNA이다.
예를 들어, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는 대상체에게 적용되는 세포 치료적 처리에 사용될 수 있다. 대상체에 제공되는 하나 이상의 유전적으로 변형된 동물 세포가 바람직하지 않은 속도(예를 들어, 정상보다 더 빠름)로 분열하기 시작하는 경우, 그 후, 사용자는, i) 바람직하지 않은 속도로 분열하는 세포에 상기 세포의 유전적 변형에 상응하는 유도인자를 적용하거나; ii) 바람직하지 않은 속도로 분열하는 세포의 상기 세포의 유전적 변형에 상응하는 유도인자에 대한 접근을 제한함으로써, 바람직하지 않은 속도로 분열하는 세포의 분열을 중지 또는 둔화시킬 수 있거나, 바람직하지 않은 속도로 증식하는 세포를 차단, 둔화 또는 중지시킬 수 있으며, i) 또는 ii)는 유전적으로 변형된 동물 세포에 제공되는 iNEP(들)의 유형을 기반으로 하여 결정된다.
일 구현예에서, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는 "페일 세이프 세포"(fail-safe cell)로서 지칭될 수 있다. 페일 세이프 세포는 하나 이상의 CDL에 하나 이상의 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK를 포함한다. 일 구현예에서, 페일 세이프 세포는 하나 이상의 CDL에 하나 이상의 EARC를 추가로 포함한다. 일 구현예에서, 페일 세이프 세포는 ALINK 및 EARC 변형 둘 모두를 포함하는 CDL을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "페일 세이프"는, 세포 수를 정의하는 확률(pFS로서 지정됨)을 지칭한다. 예를 들어, 모든 ALINK를 상실한 세포를 포함하는 클론을 얻을 확률인, 단일 페일 세이프 세포로부터 성장할 수 있는 세포의 수(클론 용적)는 임의의 값(pFS)보다 작다. 예를 들어, pFS=0.01은, 클론이 ALINK 변형된 CDL을 포함하는 단일 세포로부터 100배 성장한 경우, 하나의 클론만이 ALINK 기능(음성 선택 마커의 발현)을 상실하여, 여전히 세포 분열할 수 있는 세포를 가질 것으로 예상되는 시나리오를 지칭한다. 페일 세이프 용적은 ALINK 수 및 ALINK 표적 CDL의 수에 의존적일 것이다. 페일 세이프 성질은 표 1에 추가로 기재되어 있다.
페일 세이프 세포 용적과 인체의 관계는 수학적 모델링을 사용함으로써 계산하였다. 상기 모델은, CDL 발현이 음성 선택 마커 활성의 상실과 함께 공동 상실되어, 세포 증식이 훼손된 상황은 계수하지 않았다. 따라서, 상기 값은 과소 평가되며, 음성 선택 마커의 경우, 10 내지 6의 전향 돌연변이율(forward mutation rate)을 가정하여 계산하였다. 인체에서의 추정 세포 수는 3.72x1013으로서 산정되었다(문헌[Bianconi et al., 2013]).
CDL # | ALINK # | CDL의 유전자형 | 페일 세이프 용적(#세포) | 인체에 대한 상대값 (x)=3.72x1013 세포 | 클론의 추정 중량 |
1 | 1 | het | 512 | 0.0000000000137 | 1 μg |
1 | 2 | hom | 16777216 | 0.000000451 | 31 mg |
2 | 3 | het, hom | 1.374E+11 | 0.004 | 0.26 kg |
2 | 4 | hom, hom | 1.13E+15 | 30 | 2100 kg |
본 명세서에서, 페일 세이프 세포는, 세포를 숙주 내로 이식하기 전 또는 후에 이러한 세포의 생성 여부에 관계없이, 바람직하지 않은 성장 속도를 나타내는 세포를 제거하는 것이 바람직할 수 있는 세포 기반 치료법에 유용할 수 있는 것으로 고려될 수 있다.
세포 분열
좌위들(CDL
)
본 명세서에서 제공되는 시스템, 방법 및 조성물은, 예를 들어 표 2에 제시된 CDL과 같은 하나 이상의 CDL의 확인을 기반으로 한다. 본 명세서에서 제공되는 방법을 사용함으로써, 다양한 CDL이 표적화될 수 있다는 것이 본 명세서에서 고려된다.
다양한 구현예에서, CDL은, 본 명세서에서 그 전문이 제시된 것과 같이, 참조로서 포함되는 문헌[Wang et al., 2015]에 제시된 바와 같이, "필수 유전자"로서 확인된 좌위이다. 문헌[Wang et al., 2015]에서의 필수 유전자는, 상기 유전자의 불활성화에 의해 부여되는 적합도 값(fitness cost)을 반영하는 각 유전자에 대한 점수(즉, CRISPR 점수)를 계산함으로써, 확인하였다. 일 구현예에서, CDL은 약 -1.0 미만의 CRISPR 점수를 갖는다(표 2, 5열).
다양한 구현예에서, CDL은, 세포 분열 및/또는 복제에 관련되는 유전자 산물을 인코딩하는 좌위/좌위들이다(표 2, 6열). 예를 들어, 다양한 구현예에서, CDL은: i) 세포 주기; ii) DNA 복제; iii) RNA 전사 및/또는 단백질 번역; 및 iv) 대사작용 중 하나 이상에 관련되는 유전자 산물을 인코딩하는 좌위/좌위들이다(표 2, 7열).
일 구현예에서, CDL은, 세포 주기 진행의 조절(예를 들어, G1/S G2/M 및 중기로부터 후기로의 전이의 제어)과 관련된 하나 이상의 사이클린 의존성 키나제, 예를 들어 CDK1, CDK2, CDK3, CDK4, CDK5, CDK6, CDK7, CDK8, CDK9 및/또는 CDK11이다(문헌[Morgan, 2007]). 일 구현예에서, CDL은, 하나 이상의 CDK를 활성화시킴으로써, 세포 주기의 진행을 제어하는 것과 관련된 하나 이상의 사이클린, 예를 들어, 사이클린B, 사이클린E, 사이클린A, 사이클린C, 사이클린D, 사이클린H, 사이클린C, 사이클린T, 사이클린L 및/또는 사이클린F이다(문헌[FUNG and POON, 2005]). 일 구현예에서, CDL은, 세포 주기의 M기에서 중기로부터 후기로의 전이의 진행을 제어하는 후기 촉진 복합체에 포함되는 하나 이상의 좌위들이다(문헌[Peters, 2002]). 일 구현예에서, CDL은, 세포 주기의 M기에서 중기로부터 후기로의 전이의 진행을 제어하는 방추사부착점 구성요소와 관련된 하나 이상의 좌위들이다(문헌[Fukagawa, 2007]). 일 구현예에서, CDL은, 세포 주기에 요구되는 미소관 역학을 제어하는 미소관 구성요소와 관련된 하나 이상의 좌위들이다(문헌[Cassimeris, 1999]).
다양한 구현예에서, CDL은 세포유지(housekeeping)와 관련된 좌위/좌위들이다. 본 명세서에 사용되는 바와 같이, 용어 "세포유지 유전자" 또는 "세포유지 좌위"는 기본 세포 기능의 유지에 요구되는 하나 이상의 유전자를 지칭한다. 세포유지 유전자는 정상 조건 및 병리학적 조건하에서 유기체의 모든 세포에서 발현된다.
다양한 구현예에서, CDL은, 세포 분열 및/또는 증식에 관련되는 유전자 산물을 인코딩하고, 약 -1.0 미만의 CRISPR 점수를 갖는 좌위/좌위들이다. 예를 들어, 일 구현예에서, CDL은, i) 세포 주기; ii) DNA 복제; iii) RNA 전사 및/또는 단백질 번역; 및 iv) 대사작용 중 하나 이상에 관련되는 유전자 산물을 인코딩하고, 약 -1.0 미만의 CRISPR 점수를 갖는 좌위/좌위들이다. 일 구현예에서, CDL은 또한 세포유지 유전자일 수 있다.
일 구현예에서, 잠재적인 CDL을 확인하기 위해, 본 발명자들은, 유전자 녹아웃(KO; 표 2, 8열)의 초기 마우스 배아 치사 표현형(embryonic lethal phenotype)을 시험하였다. 예를 들어, 본 발명자들은 Cdk1(사이클린 의존성 키나제 1, 세포 분열 주기 단백질 2 상동체(CDC2)로도 지칭됨) 눌 돌연변이에 대해 동형접합성 눌인 마우스 배아가 2 세포기(E1.5)에 사멸한다는 것을 발견하였다(문헌[Santamariea et al., 2007]). Cdk1(인간에서 CDK1으로도 지칭됨)은 세포 주기를 조절하는 데 중요한 기능을 하는 고도로 보존된 세린/트레오닌 키나제이다. Cdk1의 단백질 복합체는 많은 수의 표적 기질을 인산화시킴으로써, 세포 주기의 진행을 야기한다. Cdk1 발현의 부재 시에, 세포는 세포 주기의 G2기에서 M기로 전이할 수 없다.
Cdk1/CDK1은 단일 좌위 CDL의 일례이다. 상기 좌위의 전사가 ALINK 변형의 삽입에 의해 어블레이션되고/되거나, EARC 변형의 삽입에 의해 외인적으로 제어되는 Cdk1/CDK1의 유전적 변형이 실시예 1, 2 및 3에 제시된 바와 같이 본 명세서에서 시험된다. Top2A/TOP2A는 CDL의 일례이다. Cenpa/CEPNA는 CDL의 일례이다. Birc5/BIRC5는 CDL의 일례이다. Eef2/EEF2는 CDL의 일례이다. 상기 좌위의 전사가 EARC 변형의 삽입에 의해 외인적으로 제어될 수 있는 Top2a, Cenpa, Birc5 및 Eef2의 유전적 변형은 각각 실시예 4 내지 7에 제시된 바와 같이 본 명세서에서 시험된다.
대안적 및/또는 추가적 좌위들이 본 명세서에서 제공되는 방법을 사용함으로써 표적화될 수 있는 CDL인 구현예가 본 명세서에서 고려된다.
예를 들어, 인간 세포주의 RNAi 스크리닝에서 세포 증식에 필수적인 다수의 유전자가 확인되었다(문헌[Harborth et al., 2001; Kittler et al., 2004]). 본 발명자들은, 오르소로그(orthologue)가 결핍된 마우스의 상기 좌위들의 초기 배아 치사 표현형을 확인하고/하거나, 상기 좌위들의 GO 기간 및/또는 진카드(genecard)를 확인한 후에, 이들 좌위들의 하위세트가 CDL이었음을 추정하였다(표 2, 8열).
어블레이션 연결(
ALINK
) 유전적 변형에 의한
CDL의
표적화
일 양태에서, 본 개시는, 음성 선택 마커를 인코딩하는 DNA 서열의 발현과 CDL의 발현을 연결시킴으로써, 결과적으로 CDL 및 음성 선택 마커를 발현하는 유사분열 활성 세포의 약물 유도된 어블레이션을 허용하도록 CDL을 변형시키기 위한 분자 도구, 방법 및 키트를 제공한다. 예를 들어, 세포 증식이 세포의 정상 분열 속도에 비해 비제어 및/또는 가속화되는 경우(예를 들어, 암종 세포에 의해 나타나는 비제어 세포 분열), 증식 세포의 어블레이션이 바람직할 수 있다. 증식 세포의 어블레이션은, 음성 선택 마커를 인코딩하는 DNA 서열의 발현을 CDL의 발현과 연결시킴으로써, 결과적으로 CDL 좌위를 발현하는 ALINK 변형된 증식 세포의 제거 또는 충분한 억제(충분한 억제란, 너무 저속이어서, 종양 형성에 기여할 수 없는 속도로 세포 확장 속도가 억제되는 것임)를 허용하는, 본 명세서에서 "어블레이션 연결"(ALINK)로 지칭되는 세포에 대한 유전적 변형을 통해 달성될 수 있다. 음성 선택 시스템의 전구약물 또는 다른 유도인자의 존재하에, 음성 마커를 발현하는 세포는 선택 마커의 작용 메커니즘에 따라 증식을 중지하거나, 사멸할 것이다. 세포는 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK를 포함하도록 변형될 수 있다. 일 구현예에서, 어블레이션의 정확도를 향상시키기 위해, 음성 선택 마커는 CDL의 모든 기능적 대립유전자에 도입될 수 있다. 바람직한 일 구현예에서, 음성 선택 마커는 CDL의 모든 기능적 대립유전자에 도입될 수 있다.
ALINK는, CDL 및 음성 선택 마커의 공동 발현을 허용하는 CDL의 임의의 위치에 삽입될 수 있다.
하기 실시예 1에서 추가로 논의되는 바와 같이, 음성 선택 마커(예를 들어, HSV-TK)를 인코딩하는 DNA를 숙주 세포의 CDL(예를 들어, CDK1) 내로 삽입함으로써, 음성 선택 마커의 발현이, 음성 선택 마커 및 필연적으로 CDL을 발현하는 숙주 세포를 음성 선택 마커(예를 들어, 간사이클로비르(GCV))의 유도인자(예를 들어, 전구약물)의 존재하에 사멸될 수 있도록 할 수 있다. 이 실시예에서, ALINK에 의해 변형된 숙주 세포는 티미딘 키나제(TK)를 생성할 것이고, TK 단백질은 GCV를 GCV 일인산염으로 전환시키며, 이어서, 세포 키나제에 의해 GCV 삼인산염으로 전환된다. GCV 삼인산염은 S기 동안 복제 DNA 내로 혼입됨으로써, DNA 연장의 종결 및 세포 아폽토시스를 야기한다(문헌[Halloran and Fenton, 1998]).
바람직하지 않은 세포 분열 속도를 포함하는 세포를 선택적으로 어블레이션하기 위해, ALINK 유전적 변형에 사용될 수 있는 음성 선택 마커를 인코딩하는 DNA의 일례로서 변형된 HSV-TK 유전자(문헌[Preuß et al., 2010])가 본 명세서에 개시되어 있다.
대안적 및/또는 추가적 음성 선택 시스템이 본 명세서에서 제공되는 도구 및/또는 방법에 사용될 수 있음이 본 명세서에서 고려된다. 다양한 음성 선택 마커 시스템이 당 업계에 공지되어 있다(예를 들어, dCK.DM(문헌[Neschadim et al., 2012])).
예를 들어, 부작용 없이 또는 최소화하여, 기존의 암 치료법의 치료적 효능을 향상시키는 것을 목표로 하는, 임상적 관련성을 갖는 다양한 음성 선택 시스템이 "유전자 직접 효소/전구약물 치료법"(GEPT) 분야에서 활발히 개발되어 왔다(문헌[Hedley et al., 2007; Nawa et al., 2008]). 종종, GEPT는, 포유류 세포에서 발견되지 않고, 상대적으로 무독성인 전구약물을 독성 제제로 전환시킬 수 있는 효소를 생성하는 암세포의 영역에서 암세포 또는 암세포의 근처에 유전자를 전달하기 위해, 바이러스 벡터의 사용을 포함한다.
HSV-TK/GCV, 시토신 데아미나제/5-플루오로시토신(CD/5-FC) 및 카르복시 에스테라제/이리노테칸(CE/CPT-11)이 GEPT 전임상 시험 및 임상 시험에서 평가되는 음성 선택 마커 시스템의 예이다(문헌[Danks et al., 2007; Shah, 2012]).
단순 포진 바이러스 1형 티미딘 키나제/간사이클로비르(TK/GCV) 시스템의 잠재적인 면역원성 문제를 극복하기 위해, 인간 데옥시시티딘 키나제 효소를 티미딘 활성이 되도록 하고, 비독성 전구약물에 의한 음성 선택(자살) 시스템으로서 작용하도록 조작함으로써, "인간화된" 자살 시스템이 개발되어 왔다: 브로모비닐-데옥시우리딘(BVdU), L-데옥시티미딘(LdT) 또는 L-데옥시우리딘(LdU)(문헌[Neschadim et al., 2012]).
CD/5-FC 음성 선택 마커 시스템은 광범위하게 사용되는 "자살 유전자" 시스템이다. 시토신 데아미나제(CD)는 박테리아 또는 효모(예를 들어, 각각 에세리키아 콜라이(Escherichia coli) 또는 사카로마이세스 세레비시아에(Saccharomyces cerevisiae)로부터 얻을 수 있는 비포유류 효소이다(문헌[Ramnaraine et al., 2003]). CD는 시토신의 우라실로의 전환을 촉매하고, 원핵생물 및 진균류에서 피리미딘 회수 경로의 중요한 구성원이나, 포유류 세포에는 존재하지 않는다. 5-플루오로시토신(5-FC)은 인간에게 저수준의 세포독성을 야기하는 항진균성 전구약물이다(문헌[Denny, 2003]). CD는 5-FC의 인간에서 고수준의 독성을 갖는 유전자 독성 물질 5-FU로의 전환을 촉매한다(문헌[Ireton et al., 2002]).
CE/CPT-11 시스템은 포유류 종의 상이한 조직들에서 발견되는 세린 에스테라아제인 카르복시 에스테라제 효소를 기반으로 한다(문헌[Humerickhouse et al., 2000]). 항암제 CPT-11은, CE에 의해 활성화됨으로써, 강력한 포유류 토포아이소머라제 I 억제제인 7-에틸-10-하이드록시캄토테신(SN-38)으로 불리는 활성을 생성하는 전구약물이다(문헌[Wierdl et al., 2001]). SN-38은 분열 세포에서 이중 가닥 DNA 파열의 축적을 유도한다(문헌[Kojima et al., 1998]).
음성 선택 마커 시스템의 또 다른 예는 iCasp9/AP1903 자살 시스템이며, 이는 인간 FK506 결합 단백질(FKBP)에 융합된 변형된 인간 카스파제 9를 기반으로 하고, 소분자 AP1903을 사용한 화학적 이량체화를 허용하며, 인간에서 안전하게 시험되었다. 이량체화 약물의 투여는 조작된 카스파제 9 구성요소를 발현하는 세포의 아폽토시스를 유도한다. 이 시스템은, 예를 들어, 인간 유전자 산물로 구성되어 있으며, 이 이량체화 약물이, 조작된 카스파제 9 구성요소를 발현하는 세포에만 영향을 미침으로 인한 잠재적 저면역원성을 포함하는 몇 가지 이점을 가진다(문헌[Straathof et al., 2005]). iCasp/AP1903 자살 시스템은 임상 환경에서 시험되고 있다(문헌[Di Stasi et al., 2011]).
본 명세서에서, ALINK 시스템의 음성 선택 마커 시스템이 증식 길항제 시스템으로 대체될 수 있음이 고려된다. 본 명세서에 사용되는 바와 같이, 용어 "증식 길항제"는, 그 존재가 세포 분열을 (완전히 또는 부분적으로) 억제하는 천연 또는 조작된 화합물(들)을 지칭한다. 예를 들어, OmomycER는 돌연변이 쥣과동물 에스트로겐 수용체(ER) 도메인을 갖는 MYC 우성 음성 Omomyc의 융합 단백질이다. 타목시펜(tamoxifen)(TAM)으로 유도되는 경우, 융합 단백질 OmomycER는 핵에 국소화되며, 여기서, 우성 음성 Omomyc는 C-Myc, L-Myc 및 N-Myc와 이량체함으로써, Myc DNA 결합 공통 서열과 결합할 수 없는 복합체 내로 이들을 격리시킨다(문헌[Soucek et al., 2002]). Myc 활성의 결여의 결과로서, 세포는 분열할 수 없다(문헌[Oricchio et al., 2014]). 증식 길항제의 또 다른 예는, 등몰농도 경쟁에서 DNA 결합을 억제하는 활성화 단백질-1(AP1)에 대해 우성 음성인 A-Fos(종양 유전자 Fos와 Jun의 이종이량체)이다(문헌[Olive et al., 1997]). A-Fos는 또한 ER 도메인에 융합됨으로써, TAM에 의해 핵 국소화가 유도되도록 할 수 있다. OmomycER/타목시펜 또는 A-FosER/타목시펜은 TK/GCV를 ALINK로 대체할 수 있다.
EARC
유전적 변형에 의한
CDL의
표적화
일 양태에서, 본 개시는, EARC, 예를 들어 유도성 활성인자 기반 유전자 발현 시스템과 CDL을 작동 가능하게 연결시킴으로써, CDL을 외인적으로 제어하기 위한 분자 도구, 방법 및 키트를 제공한다. 이러한 조건하에서, CDL은 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 존재하에서만 발현될 것이다(그리고, 세포는 분열할 수 있음). 이러한 조건하에서, EARC 변형된 세포는, 유도성 활성인자 기반 유전자 발현 시스템 및 CDL 기능의 작용 메커니즘에 따라, 유도인자의 부재 시에, 분열을 중지하거나, 유의하게 둔화되거나, 사멸된다. 세포는 동형접합성 또는 복합 이형접합성 EARC를 포함하도록 변형되거나, EARC 변형된 대립유전자만이 기능적 CDL을 생성할 수 있도록 변경될 수 있다. 일 구현예에서, EARC 변형은 CDL의 모든 대립유전자에 도입되어, 예를 들어, 세포 분열 제어를 위한 메커니즘을 제공할 수 있다.
EARC는, 유도인자의 존재하에 CDL 및 유도성 시스템의 활성인자 구성요소의 공동 발현을 허용하는 CDL의 임의의 위치에 삽입될 수 있다.
일 구현예에서, "활성인자" 기반 유전자 발현 시스템은 "리프레서"(repressor) 기반 유전자 발현 시스템보다 바람직하다. 예를 들어, 리프레서가 CDL을 억제하는데 사용되는 경우, 리프레서의 기능 돌연변이의 상실은 CDL 발현을 해제함으로써, 세포 증식을 허용할 수 있다. 활성화에 기반한 세포 분열 억제의 경우, 활성인자 기능(돌연변이)의 상실은 CDL 발현을 폐쇄시킴으로써, 세포 증식을 불허할 수 있다.
하기 실시예 2 내지 6에서 추가로 논의되는 바와 같이, dox 가교를 숙주 세포의 CDL(예를 들어, CDK1) 내로 삽입하여, 유도인자(예를 들어, 독시사이클린 또는 "DOX")의 존재하에, dox 가교가 CDL 발현을 허용함으로써, 세포 분열 및 증식이 허용될 수 있도록 할 수 있다. dox 가교 EARC에 의해 변형된 숙주 세포는, 분열 세포(예를 들어, CDL)에서 활성인 프로모터의 전사적 제어 하의 역 테트라사이클린 트랜스활성인자(rtTA) 유전자(문헌[Urlinger et al., 2000])를 포함할 수 있다. 이러한 표적 삽입은 CDL 프로모터가 CDL 전사에 더 이상 사용될 수 없도록 한다. CDL 전사를 재획득하기 위해, 테트라사이클린 반응자 요소 프로모터(예를 들어, TRE(문헌[Agha-Mohammadi et al., 2004]))를 CDL 전사체 앞에 삽입하면, rtTA가 발현되고, 독시사이클린이 존재하는 경우에만, CDL 유전자가 발현될 것이다. CDL 발현의 유일한 원천이 dox 가교 대립유전자인 경우, 독시사이클린의 부재 시에, CDL 유전자 발현은 존재하지 않는다. CDL 발현의 결여는, 사멸되거나, 세포 분열이 중지되거나, EARC 변형된 세포가 종양 형성에 기여할 수 없도록 세포 유사분열 속도가 둔화되도록 함으로써, EARC 변형된 세포에서 그의 증식이 훼손되도록 야기한다.
본 명세서에 사용되는 바와 같이, 용어 "dox 가교"는, 내인성 또는 외인성 프로모터에 의해 rtTA(문헌[Gossen et al., 1995])를 발현시키고, TRE의 제어하에 표적 영역이 전사되도록 함으로써, 표적 전사 영역으로부터 프로모터의 활성을 분리시키는 메커니즘을 지칭한다. 본 명세서에 사용되는 바와 같이, "rtTA"는 테트라사이클린 유도성 시스템의 역 테트라사이클린 트랜스활성인자 요소(문헌[Gossen et al., 1995])를 지칭하고, "TRE"는 최소 프로모터의 상류에 TetO 오퍼레이터 서열로 이루어진 프로모터를 지칭한다. 독시사이클린의 존재하에 rtTA가 TRE 프로모터와 결합하는 경우, TRE 프로모터 하류의 좌위들의 전사가 증가한다. rtTA 서열은, 표적 영역의 전사 발현의 허용 또는 불허 상태가 독시사이클에 의해 제어되는 한, CDL과 동일한 전사 단위 또는 게놈의 다른 위치에 삽입될 수 있다. dox 가교는 EARC의 일례이다.
EARC 시스템을 CDL의 5' 조절 영역에 도입하는 것이 또한 본 명세서에서 고려된다.
대안적 및/또는 추가적 유도성 활성인자 기반 유전자 발현 시스템이 EARC 변형을 생성하기 위해, 본 명세서에서 제공되는 도구 및/또는 방법에 사용될 수 있음이 본 명세서에서 고려된다. 다양한 유도성 활성인자 기반 유전자 발현 시스템이 당 업계에 공지되어 있다.
예를 들어, 코딩 CDL의 작용 단백질 산물과 융합된 불안정화 단백질 도메인(문헌[Banaszynski et al., 2006])은, 세포 분열 및/또는 증식이 바람직한 경우, CDL 융합 단백질을 안정화시키기 위해, 소분자 합성 리간드와 함께 사용될 수 있다. 안정화제의 부재 시에, 불안정화된 CDL 단백질은 세포에 의해 분해됨으로써, 이어서 증식이 중지될 것이다. 안정화제 화합물이 부가되는 경우, 이는 불안정화된 CDL 단백질과 결합하고, 분해되지 않음으로써, 세포의 증식이 허용될 것이다.
예를 들어, 전사 활성인자 유사 효과기(TALE) 기법(문헌[Maeder et al., 2013])은 이량체화제 조절된 발현 유도(문헌[Pollock and Clackson, 2002])와 조합될 수 있다. TALE 기법은 CDL의 프로모터를 대체하는 최소 프로모터와 함께 배치된 서열 특이적으로 설계된 DNA 결합 도메인을 생성하는데 사용될 수 있다. TALE DNA 결합 도메인은 또한 약물 이량체화 도메인으로 확장되었다. 후자는 상응하는 이량체화 도메인 및 전사 활성화 도메인을 갖는 또 다른 조작 단백질과 결합할 수 있다(도 1c).
예를 들어, 도 1d를 참조하면, 역 큐메이트 트랜스활성인자(rcTA)는 CDL의 5' 비번역 영역에 삽입됨으로써, 이는 내인성 CDL 프로모터에 의해 발현될 수 있다. 큐메이트 오퍼레이터(6xCuO)의 6회 반복체가 CDL의 번역 시작(ATG) 직전에 삽입될 수 있다. 상기 시스템에 큐메이트가 부재하는 경우, rcTA는 6xCuO와 결합할 수 없고, 따라서, 6xCuO가 활성화되지 않으므로, CDL이 전사되지 않을 것이다. 큐메이트가 부가되는 경우, rcTA와 복합체를 형성함으로써, 6xCuO와의 결합을 가능하게 하고, CDL 전사를 가능하게 한다(문헌[Mullick et al., 2006]).
예를 들어, 도 1e를 참조하면, Vp16(VpEcR)의 활성화 도메인에 융합된 레티노이드 X 수용체(RXR) 및 엑디손 수용체(EcR)의 N-말단 절두가 CDL의 5' 비번역 영역에 삽입됨으로써, 이들이 내인성 CDL 프로모터에 의해 공동 발현될 수 있다. 하류의 최소 프로모터를 갖는 엑디손 반응성 요소(EcRE)는 또한 개시 코돈 바로 상류의 CDL에 삽입될 수 있다. 공동 발현된 RXR 및 VpEcR은 서로 이종이량체화될 수 있다. 엑디손 또는 합성 약물 유사체 무리스테론 A가 부재하는 경우, 이량체화된 RXR/VpEcR은 EcRE와 결합할 수 없으므로, CDL은 전사되지 않는다. 엑디손 또는 무리스테론 A가 존재하는 경우, 이량체화된 RXR/VpEcR은 EcRE에 결합할 수 있음으로써, CDL이 전사된다(문헌[No et al., 1996]).
예를 들어, 도 1f를 참조하면, 일과성 수용체 전위 바닐로이드-1(TRPV1)은 페리틴과 함께 CDL의 5' 비번역 영역에 삽입되어, 내인성 CDL 프로모터에 의해 공동 발현될 수 있다. NFAT에 의한 유도성 프로모터(NFATre)는 개시 코돈의 바로 상류의 CDL에 삽입될 수 있다. 정상 환경에서는, NFAT 프로모터는 활성이 아니다. 그러나, TRPV1 및 페리틴이 저주파 전파에 노출되는 경우, 세포로 유입되는 Ca++ 파(wave)가 생성되고, 이어서, 세포질-NFAT(NFATc)가 핵-NFAT(NFATn)로 전환되며, 궁극적으로는 NFATre이 활성화되고, CDL이 전사될 것이다(문헌[Stanley et al., 2015]).
예를 들어, 도 1g를 참조하면, CDL은 일부분/도메인: 5' CDL 및 3' CDL로 기능적으로 분열될 수 있으며, FKBP 펩티드 서열은 각각의 도메인에 삽입될 수 있다. IRES(내부 리보솜 유입 부위) 서열은 2개의 도메인 사이에 배치됨으로써, CDL 프로모터에 의해 동시에 전사되나, 2개의 별도의 단백질을 생성할 수 있다. 유도인자의 부재 하에, 2개의 별도의 CDL 도메인은 기능적으로 비활성이다. 이량체화제, 예를 들어 라파마이신 또는 AP20187이 도입되는 경우, FKBP 펩티드는 이량체화되고, 5' 및 3' CDL 일부분을 함께 취합하여, 활성 단백질을 재구성한다(문헌[Rollins et al., 2000]).
동물 세포의 분열을 제어하는 방법
일 양태에서, 동물 세포의 분열을 제어하는 방법이 본 명세서에서 제공된다.
상기 방법은 동물 세포를 제공하는 단계를 포함한다. 예를 들어, 동물 세포는 조류 또는 포유류 세포일 수 있다. 예를 들어, 포유류 세포는, 만능성(예를 들어, 배아 줄기세포 또는 iPS 세포), 다능성, 단능성 전구세포, 또는 최종 분화된 단리된 인간 또는 비인간 세포일 수 있다. 상기 포유류 세포는 만능성, 다능성, 단능성 전구세포 또는 최종 분화된 세포로부터 유래될 수 있다. 상기 포유류 세포는 체세포 줄기세포, 다능성 또는 단능성 전구세포, 다능성 체세포 또는 체세포 줄기세포, 다능성 전구세포 또는 체세포로부터 유래된 세포일 수 있다. 바람직하게는, 상기 동물 세포는 유전적으로 변형되도록 처리될 수 있다. 바람직하게는, 상기 동물 세포는 사용자에 의해 치료적 가치를 갖는 것으로 고려되며, 이는 상기 세포가 질병, 장애, 결함 또는 손상을 치료할 필요가 있는 대상체에서 이를 치료하는데 사용될 수 있음을 의미한다. 다양한 구현예에서, 상기 비인간 포유류 세포는 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포일 수 있다. 바람직한 구현예에서, 상기 동물 세포는 인간 세포이다.
상기 방법은 동물 세포에서 CDL을 유전적으로 변형시키는 단계를 추가로 포함한다. CDL을 유전적으로 변형시키는 단계는 iNEP, 예를 들어 하나 이상의 ALINK 시스템 또는 ALINK 시스템 및 EARC 시스템 중 하나 이상을 숙주 동물 세포에 도입하는 단계를 포함한다. 다양한 유전적 변형, 예를 들어 음성 선택 마커 시스템 및 유도성 활성인자 기반 유전자 발현 시스템을 동물 세포에 도입하기 위한 기법은 그의 표적화(즉, 비무작위), 복합 이형접합성 및 동형접합성 도입 기법을 포함하여, 당 업계에 공지되어 있다. EARC 변형의 사용을 포함하는 경우, 상기 변형은, 기능적 CDL 발현이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장해야 한다. 예를 들어, 하나 이상의 ALINK를 단독으로 또는 하나 이상의 EARC 시스템과 함께 포함하는 DNA 벡터에 의한 CDL 또는 CDL의 표적화된 대체를 숙주 동물 세포의 유전적 변형을 위해, 수행할 수 있다.
상기 방법은 iNEP 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열을 허용하는 단계를 추가로 포함한다.
예를 들어, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포를 상응하는 ALINK 음성 선택 마커의 유도인자의 부재 하에 유지시킴으로써, ALINK 변형된 세포의 분열을 허용한다. 세포 분열 및 증식은 시험관내 및/또는 생체내에서 수행될 수 있다. 예를 들어, 유전적으로 변형된 세포는, 치료용으로 충분히 큰 세포 집단이 생성될 때까지, 시험관내에서 증식 및 확장이 허용될 수 있다. 예를 들어, 증식 및 확장된 하나 이상의 유전적으로 변형된 동물 세포(들)는 (예를 들어, 이식에 의해) 숙주 내로 도입될 수 있고, 생체내에서 추가로 증식하도록 허용될 수 있다. 다양한 구현예에서, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열의 어블레이션 및/또는 억제는, ALINK 시스템을 포함하는 유전적으로 변형된 동물 세포(들)을 상응하는 음성 선택 마커의 유도인자에 노출시킴으로써, 시험관내 및/또는 생체내에서 수행될 수 있다. 이러한 노출은 증식 세포를 어블레이션하고/하거나, 증식 세포의 적어도 일부를 사멸시킴으로써, 유전적으로 변형된 동물 세포의 증식 속도를 억제할 것이다. 예를 들어, 세포가 시험관내 또는 생체내에서 정상보다 더 빠른 속도로 분열되기 시작함으로써, 종양 형성 및/또는 바람직하지 않은 세포 성장을 유도할 수 있는 경우, 유전적으로 변형된 세포의 어블레이션 및/또는 유전적으로 변형된 동물 세포의 세포 증식의 억제가 바람직할 수 있다.
예를 들어, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포를 유도성 활성인자 기반 유전자 발현 시스템의 유도인자의 존재하에 유지시킴으로써, EARC 변형된 세포의 분열을 허용한다. 세포 분열 및 증식은 시험관내 및/또는 생체내에서 수행될 수 있다. 예를 들어, 유전적으로 변형된 세포는, 치료용으로 충분히 큰 세포 집단이 생성될 때까지, 시험관내에서 증식 및 확장이 허용될 수 있다. 예를 들어, 증식 및 확장된 하나 이상의 유전적으로 변형된 동물 세포(들)는 (예를 들어, 이식에 의해) 숙주 내로 도입될 수 있고, 생체내에서 추가로 증식하도록 허용될 수 있다. 다양한 구현예에서, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 분열의 어블레이션 및/또는 억제는, EARC 시스템을 포함하는 유전적으로 변형된 동물 세포(들)의 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 대한 노출을 방지 또는 억제함으로써, 시험관내 및/또는 생체내에서 수행될 수 있다. 상기 유도인자의 부재는 증식 세포를 어블레이션하고/하거나, 너무 느려서, 종양 형성에 기여할 수 없도록, 상기 유전적으로 변형된 동물 세포의 증식에 의한 확장을 억제할 것이다. 예를 들어, 세포가 시험관내 또는 생체내에서 정상보다 더 빠른 속도로 분열되기 시작함으로써, 종양 형성 및/또는 바람직하지 않은 세포 성장을 유도할 수 있는 경우, 상기 유전적으로 변형된 동물 세포의 세포 분열의 어블레이션 및/또는 억제가 바람직할 수 있다.
예를 들어, 하기 다양한 실시예에 제시된 본 명세서에서 제공되는 방법의 다양한 구현예에서, 상기 유도인자는 독시사이클린 및 간사이클로비르이다.
일 구현예에서, 독시사이클린은, 예를 들어, 약 1 mg/ml의 Dox를 물에 용해시키고, 성장 배지의 최종 농도가 약 1 μg/ml가 되도록 한 상기 유도인자의 농축액을 세포 성장 배지에 부가함으로써, 시험관내에서 세포로 전달될 수 있다. 생체내에서, 독시사이클린은, 예를 들어, 주사(예를 들어, 약 50 mg/kg의 투여량으로 IV 또는 IP) 또는 정제(약 1 내지 4 mg/kg의 투여량)에 의해, 음용수(예를 들어, 약 5 내지 10 mg/kg의 투여량) 또는 먹는 음식(예를 들어, 약 100 mg/kg의 투여량)을 통해 대상체에 경구 투여될 수 있다.
일 양태에서, 간사이클로비르는, 예를 들어, 약 10 mg/ml의 GCV를 물에 용해시키고, 성장 배지의 최종 농도가 약 0.25 내지 25 μg/ml가 되도록 한 상기 유도인자의 농축액을 세포 성장 배지에 부가함으로써, 시험관내에서 세포로 전달될 수 있다. 생체내에서, GCV는, 예를 들어, 주사(예를 들어, 약 IV 또는 IP 50 mg/kg의 투여량) 또는 정제(약 4 내지 20 mg/kg의 투여량)에 의해, 음용수(예를 들어, 약 4 내지 20 mg/kg의 투여량) 또는 먹는 음식(예를 들어, 약 4 내지 20 mg/kg의 투여량)을 통해 대상체에 경구 투여될 수 있다.
일 구현예에서, 시험관내에서 상기 유도인자가 작용하는지를 평가하기 위해, 예를 들어, 처리 개시 후, 24시간마다 (예를 들어, 세포 계수 및 생존율 검정에 의해) 세포 성장 및 세포 사멸을 측정할 수 있다. 생체내에서 상기 유도인자가 작용하는지를 평가하기 위해, 예를 들어, 처리 개시 후, 1 내지 2일마다, 유전적 변형된 만능성 세포로부터 생성된 기형종의 크기를 측정할 수 있다.
본 명세서에서 제공되는 방법의 특히 바람직한 구현예에서, 상기 동물 세포는 ALINK 및 EARC 시스템 둘 모두를 포함하도록 유전적으로 변형될 수 있다. ALINK 및 EARC 시스템은 동일하거나 상이한 CDL을 표적화할 수 있다. 이러한 세포는, 예를 들어, 세포 분열의 어블레이션 및/또는 억제, 및/또는 증식 세포의 적어도 일부의 사멸에 의한 증식의 어블레이션 및/또는 억제를 위한 적어도 2개의 메커니즘을 사용자에 제공하므로, 특정 용도를 위해 바람직할 수 있다.
본 명세서에서 제공되는 방법이 조류 세포, 예를 들어 닭 세포의 분열 및/또는 증식을 제어하는데 사용될 수 있다는 것이 본 명세서에서 고려된다.
세포 분열을 제어하기 위한 적어도 하나의 메커니즘을 포함하도록 조작된 세포
일 양태에서, 세포 분열 및/또는 증식을 제어하기 위한 적어도 하나의 메커니즘 및 이의 집단을 포함하도록 유전적으로 변형된 동물 세포가 본 명세서에서 제공된다. 예를 들어, 포유류 세포는, 만능성(예를 들어, 배아 줄기세포 또는 iPS 세포), 다능성, 단능성 전구세포, 또는 최종 분화된 단리된 인간 또는 비인간 세포일 수 있다. 상기 포유류 세포는 만능성, 다능성, 단능성 전구세포 또는 최종 분화된 세포로부터 유래될 수 있다. 상기 포유류 세포는 체세포 줄기세포, 다능성, 단능성 전구세포, 전구세포 또는 체세포 또는, 체세포 줄기세포, 다능성 또는 단능성 전구세포 또는 체세포로부터 유래된 세포일 수 있다. 바람직하게는, 상기 동물 세포는 유전적으로 변형되도록 처리될 수 있다. 바람직하게는, 상기 동물 세포는 사용자에 의해 치료적 가치를 갖는 것으로 고려되며, 이는 상기 세포가 질병, 장애, 결함 또는 손상을 치료할 필요가 있는 대상체에서 이를 치료하는데 사용될 수 있음을 의미한다. 일부 구현예에서, 상기 비인간 포유류 세포는 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 또는 비인간 영장류 세포일 수 있다.
본 명세서에서 제공되는 유전적으로 변형된 세포는 하나 이상의 CDL의 하나 이상의 유전적 변형을 포함한다. ALINK 시스템인 하나의 CDL의 유전적 변형 및 복수의 CDL의 경우, ALINK 시스템 및 EARC 시스템 중 하나 이상, 예를 들어 ALINK 및/또는 EARC 시스템 중 하나 이상인 복수의 CDL의 유전적 변형이 본 명세서에 기재된다. 예를 들어, 본 명세서에서 제공되는 유전적으로 변형된 동물 세포는: 하나 이상의 CDL의 ALINK 시스템; 하나 이상의 CDL의 EARC 시스템; 또는 하나 이상의 CDL의 ALINK 및 EARC 시스템을 포함할 수 있으며, ALINK 및 EARC 시스템은 동일하거나 상이한 CDL에 상응한다. 상기 유전적으로 변형된 세포는 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 ALINK 유전적 변형을 포함할 수 있다. EARC 변형의 경우, 상기 변형은, 기능적 CDL 발현이 EARC 변형된 대립유전자를 통해서만 생성될 수 있도록 보장해야 한다.
본 명세서에서 제공되는 유전적으로 변형된 세포는 질병, 장애 또는 손상의 치료와 관련된 세포 치료법 및/또는, 화합물 및/또는 조성물(예를 들어, 천연 또는 조작된 생물학적 제제)의 제어된 세포 전달을 포함하는 세포 치료법에 유용할 수 있다는 것이 고려된다. 전술된 바와 같이, 환자 안전성은 특히 치료용 세포 이식편에서 발생하는 악성 성장 가능성과 관련된, 세포 치료법에서의 관심사이다. 치료용 세포 이식편의 집중적인 증식이 요구되지 않는 세포 기반 치료법에서, 본 명세서에 기재된 바와 같은 하나 이상의 iNEP 변형을 포함하는 유전적으로 변형된 세포는 치료 및 안전성 요구를 처리하기에 적합할 것으로 고려된다. 치료용 세포 이식편의 집중적인 증식이 요구되는 세포 기반 치료법에서, 본 명세서에 기재된 바와 같은 2개 이상의 iNEP 변형을 포함하는 유전적 변형된 세포가 치료 및 안전성 요구를 처리하기에 적합할 것으로 고려된다.
본 명세서에서는 조류 세포, 예를 들어 닭 세포가 제공될 수 있으며, 상기 조류 세포는 상기 유전적 변형을 포함하는 것으로 고려된다.
CDL을
표적화하기
위한 분자 도구
일 양태에서, CDL의 발현을 변형시키기 위한 다양한 DNA 벡터가 본 명세서에서 제공된다.
일 구현예에서, 상기 DNA 벡터는 ALINK 시스템을 포함하고, ALINK 시스템은 음성 선택 마커를 인코딩하는 DNA 서열을 포함한다. 상기 음성 선택 마커의 발현은 CDL의 발현과 연결된다.
일 구현예에서, 상기 DNA 벡터는 EARC 시스템을 포함하고, EARC 시스템은 CDL에 작동 가능하게 연결된 유도성 활성인자 기반 유전자 발현 시스템을 포함하며, CDL의 발현은 상기 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해 유도될 수 있다.
일 구현예에서, 상기 DNA 벡터는 본 명세서에 기재된 바와 같은 ALINK 시스템 및 본 명세서에 기재된 바와 같은 EARC 시스템을 포함한다. 이러한 카세트가 숙주 세포 내로 삽입되는 경우, CDL 전사 산물의 발현은 ALINK 시스템의 음성 선택 마커의 유도인자에 의해 방지 및/또는 억제될 수 있고, CDL의 발현은 EARC 시스템의 유도성 활성인자 기반 유전자 발현 시스템의 유도인자에 의해 유도될 수 있다.
다양한 구현예에서, DNA 벡터 내의 CDL은 표 2에 나열된 CDL이다.
다양한 구현예에서, DNA 벡터 내의 ALINK 시스템은 단순 포진 바이러스 티미딘 키나제/간사이클로비르 시스템, 시토신 데아미나제/5-플루오로시토신 시스템, 카르복실 에스테라제/이리노테칸 시스템 또는 iCasp9/AP1903 시스템이다.
다양한 구현예에서, DNA 벡터 내의 EARC 시스템은 dox 가교 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템이다.
키트
본 개시는 본 명세서에 개시된 방법을 수행하기 위한 키트를 고려한다. 이러한 키트는 전형적으로 세포 증식을 제어하기 위해 CDL들 및/또는 CDL들을 사용하기 위해 요구되는 2개 이상의 구성요소를 포함한다. 키트의 구성요소에는 화합물, 시약, 용기, 장비 및 키트 사용 지침서 중 하나 이상이 포함되지만, 이에 제한되지 않는다. 따라서, 본 명세서에 기재된 방법은 본 명세서에서 제공되는 사전 포장된 키트를 사용함으로써, 수행될 수 있다. 일 구현예에서, 상기 키트는 하나 이상의 DNA 벡터 및 지침서를 포함한다. 일부 구현예에서, 상기 지침서는 하나 이상의 DNA 벡터를 숙주 세포로 도입하기 위한 하나 이상의 프로토콜을 포함한다. 일부 구현예에서, 상기 키트는 하나 이상의 제어를 포함한다.
일 구현예에서, 상기 키트는 본 명세서에 기재된 바와 같이, CDL의 발현을 변형시키기 위한 하나 이상의 DNA 벡터를 포함한다. 예로서, 상기 키트는 ALINK 시스템을 포함하는 DNA 벡터; 및/또는 EARC 시스템을 포함하는 DNA 벡터; 및/또는 ALINK 시스템 및 EARC 시스템을 포함하는 DNA 벡터; 및 하나 이상의 DNA 벡터를 사용함으로써, 동물 세포에서 하나의 CDL 및/또는 CDL의 표적화된 대체를 위한 지침서를 함유할 수 있다. 바람직한 구현예에서, 상기 키트는 상기 키트의 DNA 벡터(들)에 제공되는 ALINK 및/또는 EARC 시스템에 상응하는 하나 이상의 유도인자(예를 들어, 약물 유도인자)를 추가로 포함할 수 있다.
본 개시의 실례가 되는 하기의 비제한 실시예가 제공된다.
실시예
1:
ALINK
변형된 세포(마우스 및 인간)의 생성
실시예 1에서, Cdk1/CDK1을 표적화하는 ALINK(HSV-TK) 벡터의 작제 및 증식 세포의 적어도 일부를 사멸시키는 방식에 의해, 마우스 및 인간 ES 세포에서 세포 증식을 제어하기 위한 그의 용도가 기재된다. 이 실시예에서, CDL은 Cdk1/CDK1이고, 음성 선택 마커는 HSV-TK이다.
Cdk1/CDK1은 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. CDK1 좌위와 HSV-TK 사이에 동형접합성 ALINK를 포함하도록 변형된 세포에서, 모든 유사분열 활성 세포는 CDK1 및 HSV-TK를 발현한다. 따라서, ALINK 변형된 유사분열 활성 세포는 GCV(HSV-TK의 전구약물)의 처리에 의해 제거될 수 있다. 모든 기능적 CDK1 발현 대립유전자가 ALINK 변형되고, 세포에서 HSV-TK 발현이 사일런싱(silencing)된 경우, 이어서, CDK1 발현 가능성이 또한 사일런싱되고, 세포는 더 이상 분열할 수 없게 된다. 휴지기(quiescence)(즉, 비분열) 세포는 Cdk1/CDK1을 발현하지 않는다. 따라서, ALINK 변형된 휴지기 세포는 Cdk1/CDK1-HSV-TK 연결을 발현하지 않을 것이다.
실시예 1에서, Cdk1/CDK1과 HSV-TK 사이의 전사 연결은 상동성 재조합 기반 녹인에 의해 달성하였다.
방법
표적 벡터의 생성
마우스 표적 벡터 I: 마우스 Cdk1 게놈 좌위가 도 2의 A에 도시되어 있다. 도 2의 B를 참조하면, 2개의 DNA 단편: 5TK(SEQ ID NO: 1) 및 3TK(SEQ ID NO: 2)(SalI-F2A-5'TK.007-PB 5'LTR-NotI-SacII 및 SalI-SacII-3'TK.007-PB 3'LTR-3'TK.007-T2A-XhoI-mCherry-NheI)를 pUC57 벡터(GenScript)에서 유전자 합성에 의해 획득하였다. 단편 5TK를 SalI+SacII에 의해 분해하고, 동일한 분해에 의해 3TK로 클로닝함으로써, pUC57-5TK-3TK를 생성시켰다. NotI+HindⅢ에 의해 플라스미드 pBluescript-M214(SEQ ID NO: 3)를 절단함으로써, PGK-네오마이신 카세트를 획득하고, pUC57-5TK-3TK의 NotI+SacII 부위에 결찰시킴으로써, Cdk1(즉, CDL)의 3' 말단에 삽입되는 ALINK 카세트를 생성시켰다.
CDL의 3' 말단에서의 삽입 ALINK를 위한 상동성 아암: Cdk1 DNA 코딩 서열을: The Center for Applied Genomics(TCAG)에서 구입한 Cdk1의 게놈 서열(SEQ ID NO: 4)과 박테리아 인공 염색체(BAC)를 함유하는 DH10B E. 콜라이(E. coli) 세포 균주를 재조합조작(recombineering)함으로써 클로닝하였다. 재조합조작 과정은 플라스미드 pSC101-BAD-γβα Red/ET(pRET)(GeneBridges, Heidelberg Germany)에 의해 매개되었다. pRET는 1.8 kV, 25 μF, 400Ohms(BioRad GenePulserI/II 시스템, BioRad, ON, CA)에서 BAC- 함유 DH10B E. 콜라이에 우선 전기천공한 다음, 콜로람페니콜 및 테트라사이클린 저항성에 대해 선택하였다. ALINK 삽입 지점(Cdk1 종결 코돈의 5' 및 3')에 걸쳐있는 짧은 상동성 아암(50bp)(각각 SEQ ID NO: 5 및 6)을 PCR에 의해 카세트 F2A-5'TK-PB-PGKneo-PB-3'TK-T2A-cherry에 부가하였다. 이어서, 이 PCR 산물을 상기 기재된 조건하에 Bac+pRET DH10B E. 콜라이에 전기천공한 후, 카나마이신 저항성에 대해 선택하였다. 755bp 및 842 염기 쌍(bp) 상동성 아암(각각 SEQ ID NO: 7 및 8)으로 이루어진 최종 표적화 카세트를 프라이머(각각 SEQ ID NO: 9 및 10)에 의한 PCR에 의해 회수하고, pGemT-Easy 벡터에 클로닝함으로써, 마우스 표적 벡터 I를 생성시켰다. 상기 벡터의 주요 접합 영역을 TCAG에서 서열분석하고, 확인하였다.
마우스 표적 벡터 II: 도 2의 D를 참조하면, F2A-loxP-PGK-neo-pA-loxP-AscI(SEQ ID NO: 11)를 pLoxPNeo1 벡터로부터 PCR 증폭시키고, TA를 pDrive 벡터(Qiagen)에 클로닝하였다. AscI-TK-T2A-mCherry-EcoRI(SEQ ID NO: 12)를 절개된 TC 대립유전자 I로부터 PCR 증폭시키고, TA를 pDrive 벡터에 클로닝하였다. 이어서, 후자의 단편을 BamHI+AscI 제한 부위에 의해 전자의 벡터에 클로닝하였다. 이 F2A-loxP-PGK-neo-pA-loxP-TK-T2A-mCherry 카세트를 GeneArt® Seamless Cloning and Assembly Kit(Life Technologies)에 의해 마우스 Cdk1 상동성 아암 사이에 삽입하였다. 퓨로마이신(puro) 버전 벡터를 생성하기 위해, PGN-puro-pA 단편(SEQ ID NO: 13)을 BamHI+NotI에 의해 pNewDockZ로부터 절단하고, T4로 평활화하였다. neo 버전 벡터를 AscI+ClaI에 의해 절단하고, T4로 평활화하였으며, PGK-puro-pA에 의해 결찰시켰다.
인간 표적 벡터 I: 마우스 표적 벡터 I과 유사하게, 인간 CDK1 종결 코돈(SEQ ID NO: 14)의 상류의 847 bp + F2A-5'TK-PB-PGKneo-PB-3'TK-T2A-cherry(SEQ ID NO: 15) + 인간 CDK1 종결 코돈(SEQ ID NO: 16)의 하류의 831 bp를 재조합조작 기법에 의해 생성시켰다. 동종접합성 표적화의 원샷(one-shot) 생성을 용이하게 하기 위해, 선택을 위해 퓨로마이신 저항성 카세트를 함유하는 상이한 버전의 벡터를 생성하고: AgeI-PGK-puro-pA-FseI(SEQ ID NO: 17)를 pNewDockZ 벡터로부터 증폭시키고, 분해하여, AgeI+FseI에 의해 절단된 neo 버전 벡터로 클로닝하였다.
인간 표적화 벡터 II: BamHI-F2A-loxP-PGK-neo-pA-loxP-TK-T2A-mCherry(SEQ ID NO: 18) 및 BamHI-F2A-loxP-PGK-puro-pA-loxP-TK-T2A-mCherry(SEQ ID NO: 19)를 상응하는 마우스 표적 벡터 II로부터 증폭시키고, BamHI+SgrAI에 의해 분해하였다. mCherry(3' 30bp)-hCDK13'HA-pGemEasy-hCDK15'HA-BamHI(SEQ ID NO: 20)를 PCR 증폭시키고, 또한 BamHI+SgrAI로 분해하였다. 인간 표적 벡터 II의 neo 및 퓨로마이신 버전을 상기 상동성 아암 골격 및 neo 또는 퓨로마이신 버전 ALINK 카세트의 결찰에 의해 생성시켰다.
인간 표적 벡터 Ⅲ: FACS에 의한 형광 표지(mCherry 또는 eGFP)로 표적화하고, 선택 카세트의 절개 단계를 피하기 위해, 선택 카세트가 없는 표적 벡터를 제조하였다. BamHI-F2A-TK-T2A-mCherry-SgrAI(SEQ ID NO: 58)를 절개된 TC 대립유전자 I로부터 PCR 증폭시키고, BamHI+SgrAI에 의해 분해하고, 분해된 mCherry(3' 30bp)-hCDK13'HA-pGemEasy-hCDK15'HA-BamHI(SEQ ID NO: 20)에 의해 결찰시켰다. 표적 벡터의 CRISPR PAM 부위를 부위 유도 PCR 기반 돌연변이유발 프로토콜을 사용함으로써, 프라이머 PAM_fwd(SEQ ID NO: 59) 및 PAM_rev(SEQ ID NO: 60)에 의해, 돌연변이유발시켰다. NEBuiler HiFi DNA 어셈블리 클로닝 키트(New England Biolabs Inc.)에 의해, GFP 버전 벡터를 PCR 증폭된 XhoI-GFP(SEQ ID NO: 61) 및 pGemT-hCdk1-TK-PAMmut(SEQ ID NO: 62)의 융합에 의해 생성시켰다.
CRISPR
/
Cas9
플라스미드의 생성
고효율 표적화를 달성하기 위해, CRISPR/Cas9-지원 유전자 표적화를 사용 하였다(문헌[Cong et al., 2013]). CRISPR/Cas9의 안내 서열을 온라인 CRISPR 설계 도구(http://crispr.mit.edu)를 사용함으로써, 분석하였다(문헌[Hsu et al., 2013]).
SEQ ID NO: 23의 마우스 Cdk1을 표적화하기 위해, CRISPR/Cas9 플라스미드 pX335-mCdkTK-A(SEQ ID NO: 21) 및 pX335-mCdkTK-B(SEQ ID NO: 22)를 설계하였다.
SEQ ID NO: 26의 인간 Cdk1을 표적화하기 위해, CRISPR/Cas9 플라스미드 pX330-hCdkTK-A(SEQ ID NO: 24) 및 pX459-hCdkTK-A(SEQ ID NO: 25)를 설계하였다.
제안된 프로토콜에 따라 Addgene으로부터 구입한 골격 플라스미드에 의해 CRISPR을 생성시켰다(문헌[Ran et al., 2013]).
ALINK
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 마우스 ES 세포를 15% 소 태아 혈청(Invitrogen), 1 mM 피루브산나트륨(Invitrogen), 0.1 mM MEM 비필수 아미노산(Invitrogen), 2 mM GlutaMAX(Invitrogen), 0.1 mM 2-mEARCaptoethanol(Sigma), 50 U/ml 각 페니실린/스트렙토마이신(Invitrogen) 및 1000 U/ml 백혈병 억제 인자(LIF)(Chemicon)로 보충된 둘베코 변형 이글 배지(DMEM)(고 글루코오스, 4500 mg/l)(Invitrogen)에서 배양하였다. 마우스 ES 세포를 0.25% 트립신 및 0.1% EDTA에 의해 통과시킨다.
표적화: 5x105 마우스 C57BL/6 C2 ES 세포(문헌[Gertsenstein et al., 2010])를 JetPrime 형질감염(Polyplus)에 의해 2 ug DNA(표적 벡터:0.5 μg, CRISPR 벡터: 1.5 μg)로 형질감염시켰다. 형질감염 48시간 후, 세포를 G418 또는/및 퓨로마이신 저항성에 대해 선택하였다. 저항성 클론을 독립적으로 채취하여, 96-웰 플레이트로 이동시켰다. 96-웰 플레이트를 동결 및 유전자형 분석(SEQ ID NO: 27, 28, 29 및 30)을 위해 복제하였다. PCR 양성 클론을 확장시키고, 다수의 바이알에 동결시키고, 서던 블롯팅에 의해 유전자형을 분석하였다.
선택 카세트의 절개: 올바르게 표적화된 ES 클론을 Episomal-hyPBase(표적 벡터 I)(SEQ ID NO: 34) 또는 pCAGGs-NLS-Cre-Ires-퓨로마이신(표적 벡터 II)(SEQ ID NO: 35)에 의해 형질감염시켰다. 형질감염 2 내지 3일 후에, 세포를 트립신 처리하고, 클론(10 cm 플레이트당 1000 내지 2000개의 세포)으로 플레이팅하였다. mCherry 양성 클론을 채취하여, 96-웰 플레이트에 독립적으로 운반하고, PCR(SEQ ID NO: 31 및 36) 및 서던 블롯에 의해 유전자형을 분석함으로써, 절개 상황을 확인하였다. 제거 영역의 접합부를 PCR 증폭시키고, 서열분석하고, 구조 이동(frame shift) 없이, 온전하고 이음부(seam)가 없는지를 확인하였다.
동형접합성 표적화: 이미 neo 버전 표적 벡터로 올바르게 표적화되고, 선택 카세트로 절개된 ES 클론을 표적 벡터의 퓨로마이신 저항성 버전으로 다시 형질감염시켰다. 형질감염 48시간 후, 퓨로마이신의 선택을 부가한 후, 상기에 기재된 바와 같이 콜로니를 채취하여, 분석하였다(SEQ ID NO: 31 및 32). 독립적인 puro 저항성 클론을 젤라틴 상에서 성장시킨 후, PCR을 위해 DNA를 추출하여, 야생형 대립유전자 밴드가 없음을 확인하였다(SEQ ID NO: 31, 33).
ALINK
변형된 인간
ES
세포의 생성
인간 ES 세포 배양: 인간 CA1 또는 H1(문헌[Adewumi et al., 2007]) ES 세포를 Geltrex(Life Technologies) 배양보조세포 무함유(feeder-free) 조건하에서, mTeSR1 배지(STEMCELL Technologies) + 페니실린-스트렙토마이신(Life Technologies의 Gibco)으로 배양하였다. 세포를 TryplE Express(Life Technologies) 또는 Accutase(STEMCELL Technologies)에 의해 통과시키고, 처음 24시간 동안 mTeSR 배지 + ROCK 억제제(STEMCELL Technologies)에 플레이팅한 후, mTeSR 배지로 교체하였다. 완전한 컨플루언스(confluence)의 6-웰 플레이트의 절반의 세포를 1ml 90% FBS(Life Technologies) + 10% DMSO(Sigma)에서 동결시켰다.
표적화: 6x106 CA1 hES 세포를 24 ug DNA(표적 벡터: pX330-hCdkTK-A=18 ug:6 ug)으로 Neon 프로토콜 14에 의해 형질감염시켰다. 형질감염 후, 세포를 4개의 10 cm 플레이트에 플레이팅하였다. G418 및/또는 퓨로마이신 선택을 형질감염 48시간 후에 시작하였다. 독립적인 콜로니를 채취하여, 96-웰 플레이트로 옮겼다. 각 플레이트를 추가의 성장 및 유전자형 분석(SEQ ID NO: 37, 38, 39 및 40)을 위해 복제하였다. PCR 양성 클론을 확장시키고, 다수의 바이알에 동결시키고, 서던 블롯팅에 의해 유전자형을 분석하였다.
선택 카세트의 절개: ALINK 표적화된 ES 클론을 hyPBase 또는 pCAGGs-NLS-Cre-IRES-퓨로마이신으로 형질감염시키고, 6-웰 플레이트에 플레이팅하였다. 세포가 6-웰 플레이트에서 컨플루언스에 도달한 경우, 세포를 항크스 평형 염류 용액(Hanks Balanced Salt Solution)(HBSS)(Ca2+/ Mg2+ 무함유)(25 mM HEPES pH7.0, 1% 소 태아 혈청)에 현탁시키고, mCherry 양성 세포를 ASTRIOS EQ 세포 분류기(Beckman Coulter)를 사용하여, 96-웰 플레이트에 분류하였다.
동형접합성 표적화: 마우스 시스템에서와 동일한 방식에 의해, 또는 mCherry 및 eGFP 인간 표적 벡터 Ⅲ + pX330-hCdkTK-A 또는 pX459-hCdkTK-A를 형질감염시킨 후, mCherry 및 eGFP 이중 양성 세포에 대한 FACS 분류에 의해, 동형접합성 표적화를 달성할 수 있다.
기형종 검정
Matrigel Matrix High Concentration(Corning)을 얼음 상에서 저온의 DMEM 배지에 의해 1:3으로 희석하였다. 5x106 내지 10x106 세포를 100 ul의 66% DMEM + 33% Matrigel 배지에 현탁시키고, B6N 마우스(마우스 C2 ES 세포) 및 NOD-SCID 마우스(인간 ES 세포) 중 어느 하나 또는 둘 모두의 등쪽 측복부에 피하 주사하였다. 주사 후 2 내지 4주 후에 기형종이 형성되었다. 기형종 크기를 캘리퍼(caliper)로 측정하고, 기형종 체적을 V=(LxWxH)π/6을 사용하여 계산하였다. 상이한 처리 기간으로 50 mg/kg을 복강 내로 매일 주사하여, GCV/PBS 처리를 수행하였다. 처리 종료시, 마우스를 희생시키고, 조직학 분석을 위해 종양을 해부하고, 4% 파라포름알데하이드로 고정시켰다.
유선 종양 검정
Cdk1+/+, +/ loxp - alink 마우스 C2 ES 및 CD-1 배경의 키메라를 배수체 응집을 통해 생성한 후, B6N WT 마우스와 교배시켜, 생식선 전달(germline transmission)을 통해 Cdk1+/+, +/ loxp - alink 마우스를 생성시켰다. Cdk1+/+, +/ loxp - alink 마우스를 EIIa-Cre 마우스와 교배시켜, Cdk1+/+, +/ alink 마우스를 생성시켰다. 이어서, Cdk1+/+, +/ alink 마우스를 MMTV-PyMT 마우스(문헌[Guy et al., 1992])와 교배시켜, 유선 종양 및 ALINK 변형을 가진 이중 양성 자손을 획득하였다. 페일 세이프 변형을 가진 유선 종양을 분리하고, 1 mm3 조각으로 절단하고, 야생형 B6N 암컷의 제4 유선에 이식하였다. GCV/PBS 치료를 상이한 처리 기간으로 50 mg/kg의 투여량에서 복강 내로 격일로 주사하였다. 유선 종양 크기를 캘리퍼로 측정하고, 식 V=길이*너비*높이*π/6으로 계산하였다.
신경
전구세포
대 뉴런 사멸 검정
Cdk1+/+, +/ alink 인간 CA1 ES 세포를 신경 상피 전구세포(NEP)로 분화시켰다. 후속하여, NEP를 뉴런으로의 분화를 위한 조건하에서 배양함으로써, DAPI, Ki67 및 Sox2의 면역염색을 특징으로 하는 비분열 뉴런과 분열 NEP의 혼합 배양물을 생성시켰다. GCV(10uM)를 20일 동안 격일로 상기 혼합 배양물에 제공하였다. 그런 다음, GCV를 4일 동안 배양물로부터 회수한 후, 세포를 4% PFA로 고정시켰다. 모든 잔여 세포의 세포 주기 이탈 여부를 조사하기 위해, 고정된 세포를 증식 마커 Ki67로 면역염색하고, 성숙 뉴런 마커 베타-튜블린Ⅲ로 면역염색하였다.
결과
마우스 Cdk1 게놈 좌위가 도 2의 A에 도시되어 있다. T2A(문헌[Szymczak et al., 2004]) 서열을 갖는 mCherry 리포터와 연결된 증대된 HSV -TK(TK.007(Preuß et al., 2010)) 유전자에 선행하는 F2A(문헌[Szymczak et al., 2004]) 서열에 의해 마지막 엑손의 종결 코돈을 대체함으로써, 각각 Cdk1 유전자(도 2의 A)의 3'UTR이 변형되도록 구성된 쥣과동물 Cdk1을 표적화하는 2개의 벡터를 생성시켰다(도 2의 B 및 도 2의 D).
도 2의 B 및 마우스 표적 벡터 I를 참조하면, PGK-neo-pA 선택 마커(표적화에 필요함)를 piggyBac 전이인자(transposon)에 의해 TK.007 개방형 판독 프레임 내로 삽입함으로써, TK 발현을 저지시켰다. piggyBac 전이인자 삽입은 전이인자 제거가 TK.007의 정상 ORF를 복원함으로써, 기능적 티미딘 키나제의 발현이 유도되도록 설계하였다(도 2의 C).
도 2의 D 및 마우스 표적 벡터 II를 참조하면, neo 카세트는 loxP-플랭킹되며, F2A와 TK.007 사이에 삽입하였다.
표적 벡터 I 및 II는 짧은(약 800 bp) 상동성 아암을 가졌으며, 이는, CRISPR이 상동성 재조합 표적화를 지원하고, 표적화 상황을 확인하기 위한 PCR 유전자형 분석을 쉽고 신뢰할 수 있도록 하기에 충분한 것이었다. CRISPR은 약물 저항성 클론의 40% PCR 양성으로 고빈도 표적화를 용이하게 하였다(도 3d).
piggyBac-삽입된 neo 카세트 및 loxP-플랭킹된 neo 카세트 둘 모두를 각각 piggyBac 전이효소 및 Cre 재조합효소의 일과성 발현에 의해 제거함으로써, 각각 도 2의 C 및 도 2의 E에 도시된 대립유전자를 포함하는 세포주를 생성시켰다. 도 2의 E를 참조하면, 나머지 loxP 부위는 TK와 프레임 내에 존재하고, TK의 N-말단에 13개의 아미노산이 부가되어 있다. TK 기능성 시험(GCV 사멸)은, 이 N-말단 삽입이 TK 기능을 방해하지 않는다는 것을 증명하였다.
도 4를 참조하면, CRISPR-Cas9 기법의 지원하에, 동형접합성 ALINK는 또한 2개의 상이한 인간 ES 세포주인 CA1 및 H1(문헌[Adewumi et al., 2007])에서 효율적으로 생성될 수 있다.
도 5a 및 도 5c를 참조하면, 데이터는 다음을 나타낸다: i) Cdk1의 3'UTR로의 TK.007 삽입은 Cdk1 발현을 방해하지 않으며; ii) ALINK 변형된 동형접합성 마우스 C2 ES 세포는 ES 세포 조건하에서 적절하게 자체 재생되고, 생체내에서 분화되고, 복합 기형종을 형성하고; iii) ALINK 변형된 동형접합성 인간 CA1 ES 세포는 ES 세포 조건하에서 적절하게 자체 재생되고, 생체내에서 분화되고, 복합 기형종을 형성한다.
도 6을 참조하면, 데이터는 다음을 나타낸다: i) TK.007이 적절하게 발현되며; 미분화된 ES 세포의 GCV 처리는 동형접합성 및 이형접합성 변형된 세포 둘 모두를 어블레이션하고(도 6a); 그리고, ii) T2A-연결된 mCherry는 ES 세포에서 지속적으로 발현된다(도 6b).
도 7a를 참조하면, 데이터는, ALINK 변형된 세포 이식편을 포함하는 숙주에서, ALINK 변형된 ES 세포를 포함하는 피하 기형종의 GCV 처리는 분열 세포를 어블레이션함으로써, 기형종의 성장을 중지시킨다는 것을 나타낸다. GCV 처리는 기형종의 휴지기 세포에는 영향을 주지 않았다. 수용체의 단기간(3주)의 GCV 처리 기간은 기형종을 휴면기(dormant)가 되도록 하는데 충분하였다. 도 7b를 참조하면, ALINK 변형된 인간 세포 이식편을 포함하는 NOD scid 감마 마우스 숙주에서, 2회의 GCV 처리(제1 회 15일 + 제2 회 40일)는 기형종을 휴면기가 되도록 하였다.
도 7c를 참조하면, ALINK 변형된 MMTV-PyMT-형질전환된 유방 상피 종양 형성 세포 이식편을 포함하는 B6N 숙주에서, GCV 처리는 유선 종양을 휴면기가 되도록 할 수 있다.
도 7def의 D 내지 도 7def의 F를 참조하면, 모든 세포가 Cdk1+/+, +/ alink 인간 CA1 ES 세포로부터 유래된, 비분열 뉴런과 분열 NEP의 혼합 배양물에서, GCV는 분열 NEP를 사멸시켰으나, 비분열 뉴런은 사멸시키지 않았다.
일 구현예에서, 불활성화 돌연변이가 CDL-HSV-TK 전사 연결의 HSV-TK 구성요소에서 발생된 경우, 하나 이상의 분열 세포가 GCV 매개된 어블레이션을 회피할 수 있다고 고려된다. 세포 회피의 가능성을 처리하기 위해, 본 발명자는 세포 분열당 대체적인 돌연변이율(즉, 10-6)을 고려하여, 1개의 돌연변이 세포를 생성하는데 필요한 것으로 추정되는 세포 분열 횟수는 이형접합성 Cdk1 HSV-TK 전사 연결을 포함하는 세포의 경우, 16회, 동형접합성 Cdk1 HSV-TK 전사 연결을 포함하는 세포의 경우, 30회의 세포 분열인 것으로 결정하였다. 이는, 하나의 이형접합성 ALINK 변형된 세포가 216개(즉, 65,000개의 세포)로 확장되고, 단일 동형접합성 ALINK 변형된 세포가 230개(즉, 10억 개의 세포)로 확장되는 경우, 그 후, 이형접합성 및 동형접합성 세포 집단당 상실된 HSV-TK 활성을 포함하는 평균 하나의 돌연변이 세포가 생성될 것이라는 것을 의미한다(도 8). 따라서, 본 발명자들은, 동형접합성 ALINK 변형된 세포가 세포 기반 치료법용으로 매우 안전할 것이라고 결정하였다. 세포 치료법의 안전성 수준을 계산하는 또 다른 방법은 상기에 제시되어 있다.
실시예
2:
Cdk1
좌위에서의
EARC
변형된 마우스
ES
세포의 생성
실시예 2에, Cdk1을 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Cdk1/CDK1이다.
상기에 기재된 바와 같이, Cdk1/CDK1은 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Cdk1 좌위에 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Cdk1의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재 시에 제거될 수 있다.
실시예 2에서, Cdk1 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는
EARC
표적화
벡터의
작제
3x SV40 pA 신호에 선행하는 rTTA 코딩 서열(SEQ ID NO: 41)을 함유하는 단편을 rTTA의 5'에 부가된 lox71 부위를 함유하는 프라이머(rtta3xpaFrw1(SEQ ID NO: 63), rtta3xpaRev1(SEQ ID NO: 64))를 사용하여, PCR에 의해 pPB-CAGG-rtta 플라스미드로부터 증폭시켰다. 이 단편을 pGemT 플라스미드에 서브클로닝함으로써, pGem-가교-단계1을 생성시켰다. 후속하여, TetO 프로모터(SEQ ID NO: 42)(pPB-TetO-IRES-mCherry로부터 유래됨)를 함유하는 SacII 단편을 pGem-가교-단계1의 SacII 부위에 클로닝함으로써, pGem-가교-단계2를 생성시켰다. 상기 가교의 최종 요소를 pGem-가교-단계2의 BamHI 부위에 BamHI IRES-퓨로마이신 단편(SEQ ID NO: 43)을 삽입하여 클로닝함으로써, pGem-가교-단계3을 생성시켰다. C57/B6 게놈 DNA로부터 900 bp 단편(SEQ ID NO: 44)을 PCR 증폭시키고(프라이머 cdk5FrwPst(SEQ ID NO: 45) 및 cdk5RevSpe(SEQ ID NO: 46)), 이를 pGem-가교-단계3의 SbfI 및 SpeI에 클로닝함으로써, 5' 상동성 아암을 클로닝하였다. 유사하게, 프라이머 dkex3_5'FSpe(SEQ ID NO: 48), cdkex3_3lox(SEQ ID NO: 49)를 사용하여, PCR에 의해 3' 상동성 아암(900bp)(SEQ ID NO: 47)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge(SEQ ID NO: 148)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR
/
Cas9
플라스미드의
작제
표적외 돌연변이의 가능성을 최소화하기 위해, 이중 닉카아제(nickase) 전략을 선택하였다. 안내 RNA 서열(SEQ ID NO: 50, 51, 52 및 53)을 pX335(제안된 프로토콜에 따라 Addgene으로부터 획득됨)에 클로닝하였다(문헌[Ran et al., 2013]).
EARC
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 모든 유전적 조작은 종래에 특성화된 C57BL/6N 마우스 ES 세포주(C2)(문헌[Gertsenstein et al., 2010])에서 수행하였다. 마우스 ES 세포를, 15% ES 세포 등급 FBS(Gibco), 0.1 mM 2-mEARCaptophenol, 2 mM L-글루타민, 1 mM 피루브산나트륨, 0.1 mM 비필수 아미노산 및 2,000 단위/ml 백혈병 억제 인자(LIF)가 보충된 고 글루코스 DMEM(Invitrogen)을 기반으로 한 배지에서 성장시켰다. 세포를, 미토마이신 C 처리된 마우스 배아 섬유아세포(MEF)에서 5% CO2로 37℃에서 유지시켰다.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-cdk-ex3A(SEQ ID NO: 151) 및 px335-cdk-ex3B(SEQ ID NO: 152)) 및 표적화 플라스미드(pBridge; SEQ ID NO: 148)를 제조사의 지침에 따라, FuGENE HD(Clontech)를 사용하고, 8:2의 FuGENE:DNA 비(2 μg 총 DNA: 각 pX330의 경우 250 ng 및 pBridge의 경우 1500 ng)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다. 전형적인 형질감염을 3x105개의 세포에서 수행하고, 35 mm 플레이트에 플레이팅하였다. 형질감염 시에, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml가 되도록 하였다. 형질감염 2일 후에, 세포를 100 mm 플레이트에 플레이팅하고, 선택을 1 μg/ml의 퓨로마이신에 의해 적용하였다. 퓨로마이신 저항성 콜로니를 선택 시작 후 8 내지 10일 후에 채취하고, PCR 스크리닝시까지 96 웰 플레이트에 유지하였다.
유전자형 분석: 문헌[Nagy et al., 2003]에 따라 96 웰 플레이트에서 ES 세포로부터 DNA를 직접 추출하였다. Cdk1 유전자의 5'에서 pBridge의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), ex3_5scr(SEQ ID NO: 55), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 56), ex3_3scr(SEQ ID NO: 57))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: F3-가교 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 각 조건에 대해 3개의 웰을 트립신 처리하고, Countess 자동 세포 계수기(Life Technologies)를 사용하여, 생존 세포를 계수함으로써, 세포 계수를 수행하였다. 플레이팅 2일 후에, 독시사이클린을 제거하거나, 0.05 ng/ml로 감소시켰으며, 생존 세포를 상이한 조건에서 매일 최대 18일 동안 계수하였다.
Cre-절개: F3-가교 세포(Dox+ 배지에서 성장함)를 트립신 처리하고, Cre(pCAGG-NLS-Cre)를 발현하는 2 μg의 플라스미드로 형질감염시켰다. 형질감염은 JetPrime(Polyplus)을 사용하여, 제조사의 프로토콜에 따라 수행하였다. 형질감염 후, 독시사이클린을 제거하고, 콜로니를 트립신 처리하고, 풀(pool)로 확장시켰다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기(thermocycler)에서 설정하였다. 사용된 프라이머는: qpcrcdk1_F(SEQ ID NO: 65), qpcrcdk1_R(SEQ ID NO:66) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화(normalization)하였다.
결과
도 9를 참조하면, 도 9a에 도시된 dox 가교 표적 벡터를 사용함으로써, 3개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 9b). 이들 세포주 중 하나는, 상동성 재조합에 의해 Cdk1의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 세포주(도 9b의 3F)인 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Cdk1 프로모터 활성 생성된 rtTA는 TRE와 결합하고, Cdk1의 전사를 개시시킨다. 3' 변형과 유사하게, CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Cdk1의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 5일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 10). doc 가교 세포주의 유도 및 유지에 사용된 농도에 비해, 독시사이클린 농도를 20배(50 ng/ml) 감소시킨 경우, 일부 세포/콜로니의 5일의 기간의 생존이 허용되었다(도 11).
도 12를 참조하면, dox 가교는, 2개의 lox71 부위 사이의 절편의 Cre 재조합효소 매개된 절개에 의해 제거될 수 있으며, 이는, 상기 대립유전자의 본래의 내인성 발현 조절을 복원시키고, 독시사이클린의 결여로부터 세포 치사율을 복구시킨다. 이러한 데이터는 dox 가교가 추정된 바와 같이, 세포에 작용하고 있음을 나타낸다.
도 13을 참조하면, 본 발명자들은, 독시사이클린의 존재 및 부재하에서 세포 성장을 측정함으로써, 독시사이클린 회수가 dox 가교 ES 세포의 제거에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린의 회수 시(1일째)에, 세포는 2일 동안만 성장하였으며, 그 후, 세포 사멸이 시작되어, 9일째에는 생존 세포가 존재하지 않았다. 처음 3일의 세포 성장 후에 제공된 20배 더 저농도 독시사이클린(50ng/ml)은 플레이트 상에 적어도 5일 동안 일정한 수의 세포를 유지하기에 충분하였다(도 13, 밝은 청색 선). 정상 농도의 독시사이클린을 10일째에 플레이트에 다시 부가하는 경우, 세포는 정상 ES 세포와 같이 다시 성장하기 시작하였다.
독시사이클린이 결여된 배지에서 성장한 경우, 분열 세포는 Cdk1의 EARC(dox 가교) 변형을 회피할 수 있을 것으로 고려된다. 세포 회피 가능성을 처리하기 위해, EARC(dox 가교) 변형된 마우스 ES 세포를 독시사이클린을 함유하는 배지에서 10개의 플레이트에 100,000,000 세포/플레이트까지 성장시켰다. 이어서, 변형된 ES 세포의 10개의 플레이트 각각에 300개의 GFP 양성 야생형 ES 세포(센티넬)를 혼합하고, 독시사이클린을 배양 배지로부터 회수하였다. GFP 양성 콜로니만이 회복되었고(도 14), 이는, 배양 중의 100,000,000개의 세포 중에 회피된 dox 가교 ES 세포가 존재하지 않음을 나타낸다. 따라서, 본 발명자들은, 돌연변이에 의해, dox 가교의 상실이 발생할 개연성이 낮고, CDL 발현의 차단으로 인해, 유도인자(독시사이클린)의 부재하에 세포 분열이 가능하지 않기 때문에, EARC(dox 가교) 변형된 ES 세포는 특정 세포 치료 적용을 위해 ALINK 변형에 추가적 수준의 안전성을 부가할 것으로 결정하였다.
도 15를 참조하면, dox 가교 ES 세포의 성장에 대한 고농도 독시사이클린(10 μg/ml)의 영향을 조사하였다. 고농도 독시사이클린의 존재하에, dox 가교 ES 세포의 성장 속도는 저농도 독시사이클린에서 성장한 세포와 유사한 속도로 둔화되었다. 이러한 데이터는 야생형 세포 유사 증식을 위한 최적의 Cdk1 발현을 허용할 수 있는 독시사이클린 농도의 범위가 존재함을 나타낸다.
실시예
3:
CDK1
좌위에서
EARC
-
ALINK
변형된 세포의 생성(마우스 및 인간)
실시예 3에서, CDK1을 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 및 인간 ALINK 변형된 ES 세포 둘 모두에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, CDL은 Cdk1/CDK1이고, EARC는 dox 가교이며, ALINK는 HSV-TK이다. CDL Cdk1은 동형접합성 형태로 EARC 및 ALINK 시스템 둘 모두에 의해 변형되고, 여기서, CDL의 발현을 유도하기 위해 독시사이클린이 요구되며, 독시사이클린 및 GCV는 함께, 변형된 증식 세포를 사멸시키는 방법을 제공한다.
실시예 3에서, CDK1 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
마우스 표적화를 위한 마우스 EARC 표적화 벡터, CRISPR/Cas9 플라스미드의 작제는 실시예 2에서와 동일하다. 표적화 및 유전자형 분석 방법은 또한, C2 WT 세포 대신에, 실시예 1(도 3ab 내지 도 3g)에서 생성된 Cdk1(TK/TK) 세포를 형질감염을 위해 사용하였다는 것을 제외하고, 실시예 2에 기재된 바와 동일하다.
인간
CDK1에
대한 dox 가교를 포함하는
EARC
표적화
벡터의
작제
CA1 게놈 DNA로부터의 981 bp 단편을 PCR 증폭시키고(프라이머 hcdk5'F(SEQ ID NO: 70) 및 hcdk5'R(SEQ ID NO: 71)), 이를 pGem-가교-단계3의 SbfI에 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 69)을 클로닝하였다. 유사하게, 프라이머 hcdk3'F(SEQ ID NO: 73) 및 hcdk3'R(SEQ ID NO: 74)를 사용하여, PCR에 의해 3' 상동성 아암(943 bp; SEQ ID NO: 72)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge-hCdk1(SEQ ID NO: 75)로 지칭되는 최종 표적화 벡터를 생성시켰다.
인간
표적화를
위한
CRISPR
/
Cas9
플라스미드의
작제
안내 RNA(hCdk1A_up(SEQ ID NO: 76), hCdk1A_low(SEQ ID NO: 77), hCdk1B_up(SEQ ID NO: 78), hCdk1B_low(SEQ ID NO: 79))를 pX335(SEQ ID NO: 149) 및 pX330(SEQ ID NO: 150)에 클로닝하여, pX335-1A(SEQ ID NO: 80), pX335-1B(SEQ ID NO: 81) 및 pX330-1B(SEQ ID NO: 82)를 생성시켰다.
EARC
변형된 인간
ES
세포의 생성
표적화: 2x106 CA1 Cdk1(TK/TK)(즉, 도 4a 내지 도 4f에 기재된 세포 산물) hES 세포를 Neon 프로토콜 14에 의해 8 ug의 DNA(표적 벡터: pX330-hCdkTK-A=6 ug: 2 ug)로 형질감염시켰다. 형질감염 후, 세포를 4개의 10 cm 플레이트에 플레이팅하였다. 형질감염 시, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml이 되도록 하였다. 형질감염 2일 후에, 0.75 μg/ml의 퓨로마이신에 의한 선택을 적용하였다. 퓨로마이신 저항성 콜로니를 96-웰 플레이트에 채취하고, 추가적 성장 및 프라이머(hCdk1Br-5HAgen_F1(SEQ ID NO: 83), rtTA_rev_1(SEQ ID NO: 84), mCMV_F(SEQ ID NO:85), hCdk1Br-3HAgen_R1(SEQ ID NO: 86))에 의한 유전자형 분석을 위해 복제하였다.
결과
도 16a를 참조하면, 실시예 1에서 생성된 마우스 세포 산물, Cdk1(TK/TK)를 표적화하기 위해, 마우스 dox 가교 표적 벡터, pBridge를 사용함으로써, 마우스 Cdk1earc/earc,alink/alink 세포를 생성시켰다. 9개의 Cdk1earc / earc,alink / alink 클론이 원샷 형질감염에 의해 생성되었다(도 16b).
도 5b를 참조하면, 데이터는, EARC-및-ALINK-변형된 동형접합성 마우스 C2 ES Cdk1 earc / earc,alink / alink 세포가 ES 세포 조건하에서 적절하게 자가 재생되고, 생체내에서 분화되고, 복합 기형종을 형성하였다는 것을 나타낸다.
도 17a를 참조하면, 인간 dox 가교 표적 벡터인 pBridge-hCdk1을 사용하여, 실시예 1에서 생성된 인간 CA1 세포 산물, Cdk1(TK/TK)를 표적화함으로써, 인간 Cdk1 earc / earc,alink / alink 세포를 생성시켰다. 원샷 형질감염에 의해 적어도 Cdk1 earc/earc,alink/alink CA1 클론이 생성되었다(도 17b).
실시예
4:
Top2a
좌위에서
EARC
변형된 마우스
ES
세포의 생성
실시예 4에서, Top2a를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템에 의해 표적화되는 CDL은 Top2a/TOP2A이다.
상기에서 기재된 바와 같이, Top2a/TOP2A는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Top2a 좌위에 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Top2a의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에 제거될 수 있다.
실시예 4에서, Top2a 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
Top2a에
대한 dox 가교를 포함하는
EARC
표적화
벡터의
작제
C57/B6 게놈 DNA로부터의 870 bp 단편을 PCR 증폭시키고(프라이머 Top5F(SEQ ID NO: 88) 및 Top5R(SEQ ID NO: 89)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 87)을 클로닝하였다. 유사하게, 프라이머 Top3F(SEQ ID NO: 91), Top3R(SEQ ID NO: 92)를 사용하여, PCR에 의해 3' 상동성 아암(818 bp; SEQ ID NO: 90)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge-Top2a(SEQ ID NO: 93)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR
/
Cas9
플라스미드의
작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고(oligos): TOP2A1BF(SEQ ID NO: 94), TOP2A1BR(SEQ ID NO: 95), TOP2A1AF(SEQ ID NO: 96), TOP2A1AR(SEQ ID NO: 97)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Top2aA(SEQ ID NO: 98) 및 px335-Top2aB(SEQ ID NO: 99)를 생성시켰다.
EARC
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 모든 유전적 조작은 종래에 특성화된 C57/B6 마우스 ES 세포주(C2)(문헌[Gertsenstein et al., 2010])에서 수행하였다. 마우스 ES 세포를, 15% ES 세포 등급 FBS(Gibco), 0.1 mM 2-mEARCaptophenol, 2 mM L-글루타민, 1 mM 피루브산나트륨, 0.1 mM 비필수 아미노산 및 2,000 단위/ml 백혈병 억제 인자(LIF)가 보충된 고 글루코스 DMEM(Invitrogen)을 기반으로 한 배지에서 성장시켰다. 세포를, 미토마이신 C 처리된 마우스 배아 섬유아세포(MEF)에서 5% CO2로 37℃에서 유지시켰다.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Top2aA(SEQ ID NO: 98) 및 px335-Top2aB(SEQ ID NO: 99)) 및 표적화 플라스미드(pBridge-Top2a(SEQ ID NO: 93)를 제조사의 지침에 따라, FuGENE HD(Clontech)를 사용하고, 8:2의 FuGENE:DNA 비(2 μg 총 DNA: 각 pX335의 경우 250 ng 및 pBridge-Top2a의 경우 1500 ng)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다. 전형적인 형질감염을 3x105개의 세포에서 수행하고, 35 mm 플레이트에 플레이팅하였다. 형질감염 시에, 독시사이클린을 배지에 부가하여, 최종 농도가 1 μg/ml가 되도록 하였다. 형질감염 2일 후에, 세포를 100 mm 플레이트에 플레이팅하고, 선택을 1 μg/ml의 퓨로마이신에 의해 적용하였다. 퓨로마이신 저항성 콜로니를 선택 시작 후 8 내지 10일째에 채취하고, PCR 스크리닝시까지 96 웰 플레이트에 유지하였다.
유전자형 분석: 문헌[Nagy et al., 2003]에 따라 96 웰 플레이트에서 ES 세포로부터 DNA를 직접 추출하였다. Top2a 유전자의 5'에서 pBridge-Top2a의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), top2a_5scrF(SEQ ID NO: 55), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 56), top2a_3scrR(SEQ ID NO: 57)를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Top2a 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
결과
도 18을 참조하면, 도 18a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 18b). 이들 세포주 중 9개는, 상동성 재조합에 의해 Top2a의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화된 것(도 18b)으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Top2a 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Top2a 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Top2a의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 19a).
도 19b를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 2일 후에는, EARC 변형된 세포의 세포 성장이 완전히 저지되었다.
실시예
5:
Cenpa
좌위에서
EARC
변형된 마우스
ES
세포의 생성
실시예 5에서, Cenpa를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Cenpa/CENPA이다.
상기에서 기재된 바와 같이, Cenpa/CENPA는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Cenpa 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Cenpa의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 5에서, Cenpa 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는
EARC
표적화
벡터의
작제
C57/B6 게놈 DNA로부터의 874 bp 단편을 PCR 증폭시키고(프라이머 Cenpa5F(SEQ ID NO: 101) 및 Cenpa5R(SEQ ID NO: 102)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암(SEQ ID NO: 100)을 클로닝하였다. 유사하게, 프라이머 Cenpa3F(SEQ ID NO: 104), Cenpa3R(SEQ ID NO: 105)를 사용하여, PCR에 의해 3' 상동성 아암(825 bp; SEQ ID NO: 103)을 증폭시키고, SphI 및 NcoI에 클로닝함으로써, pBridge-Cenpa(SEQ ID NO: 106)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR
/
Cas9
플라스미드의
작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 CenpaAF(SEQ ID NO: 107), CenpaAR(SEQ ID NO: 108), CenpaBF(SEQ ID NO: 109), CenpaBR(SEQ ID NO: 110)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-CenpaA(SEQ ID NO: 111) 및 px335-CenpaB(SEQ ID NO: 112)를 생성시켰다.
EARC
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-CenpaA; SEQ ID NO: 111, 및 px335-CenpaB; SEQ ID NO: 112) 및 표적화 플라스미드(pBridge-Cenpa; SEQ ID NO: 106)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Cenpa 유전자의 5'에서 pBridge-Cenpa의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 및 3' 상동성 아암에 걸친 프라이머(5' 아암의 경우, 프라이머 rttaRev(SEQ ID NO: 54), Cenpa_5scr(SEQ ID NO: 113), 3' 아암의 경우, 프라이머 CMVforw(SEQ ID NO: 114), Cenpa_3scr(SEQ ID NO: 115))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Cenpa 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기에서 설정하였다. 사용된 프라이머는: qpcrcenpa_F(SEQ ID NO: 116), qpcrcenpa_R(SEQ ID NO: 117) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화하였다.
결과
도 20을 참조하면, 도 20a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 20b). 이들 세포주 중 6개는 5' 및 3'에 올바른 삽입을 갖는 것으로 밝혀졌으며, 적어도 하나의 클론(Cenpa#4)은, 상동성 재조합에 의해 Cenpa의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 동형접합성 표적화(도 20b)를 갖는 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Cenpa 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Cenpa 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Cenpa의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 21a).
도 21b를 참조하면, 본 발명자들은 qPCR에 의해 Dox를 갖는 Cenpa-EARC 세포에서 Dox 제거 2일 후에, Cenpa 유전자 발현 수준을 결정하고, 야생형 마우스 ES 세포(C2)에서의 발현 수준과 비교하였다. 추정된 바와 같이, Cenpa 발현 수준은 Dox의 부재하에 Cenpa-EARC 세포에서 2일 동안 크게 감소한다.
도 22를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 80시간 후에는, 세포 성장이 완전히 저지되었다.
실시예
6:
Birc5
좌위에서
EARC
변형된 마우스
ES
세포의 생성
실시예 6에서, Birc5를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Birc5/BIRC5이다.
상기에서 기재된 바와 같이, Birc5/BIRC5는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Birc5 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Birc5의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 6에서, Birc5 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 775 bp 단편을 PCR 증폭시키고(프라이머 Birc3F(SEQ ID NO: 119), Birc3R(SEQ ID NO: 120)), pGem-가교-단계3의 SbfI 및 NcoI로 클로닝함으로써, 3' 상동성 아암(SEQ ID NO: 118)을 클로닝하였다. 유사하게, 프라이머 Birc5F(SEQ ID NO: 122) 및 Birc5R PstI(SEQ ID NO: 123)를 사용하여, PCR에 의해 5' 상동성 아암(617 bp; SEQ ID NO: 121)을 증폭시키고, SpeI에 클로닝함으로써, pBridge-Birc5(SEQ ID NO: 124)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR/Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 Birc5AF(SEQ ID NO: 125), Birc5AR(SEQ ID NO: 126), Birc5BF(SEQ ID NO: 127), Birc5BR(SEQ ID NO: 128)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Birc5A(SEQ ID NO: 129) 및 px335-Birc5B(SEQ ID NO: 130)를 생성시켰다.
EARC
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Birc5A 및 px335-Birc5B) 및 표적화 플라스미드(pBridge-Birc5)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Birc5 유전자의 5'에서 pBridge-Birc5의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 상동성 아암에 걸친 프라이머(프라이머 rttaRev(SEQ ID NO: 54), Birc_5scrF(SEQ ID NO: 131))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Birc5 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
정량적 PCR: 제조사의 프로토콜에 따라 GeneElute 총 RNA 미니프렙 키트(Sigma)를 사용하여, 1 μg/ml 및 0 μg/ml의 Dox로 2일 동안 처리한 세포로부터 총 RNA를 추출하였다. 제조사의 프로토콜에 따라 QuantiTect 역전사 키트(Qiagen)를 사용하여, 1 μg의 RNA의 역전사에 의해 cDNA를 생성시켰다. 실시간 qPCR을 SensiFast-SYBR qPCR 믹스(Bioline)를 사용하여, BioRad CFX 유전자증폭기에서 설정하였다. 사용된 프라이머는: qpcrbirc_F(SEQ ID NO: 132), qpcrbirc_R(SEQ ID NO: 133) 및 actBf(SEQ ID NO: 67), actBr(SEQ ID NO: 68)이었다. 결과를 ΔΔCT 방법으로 분석하고, 베타 액틴에 대하여 정상화하였다.
결과
도 23을 참조하면, 도 23a에 도시된 dox 가교 표적 벡터를 사용함으로써, 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 23b). 5개의 클론은, 재조합에 의해 Birc5의 대립유전자 둘 모두의 5'UTR에 삽입된 dox 가교를 포함하는 올바르게 표적화된 것(도 23b)으로 밝혀졌다. 이들 클론 중 하나는 Birc#3이었으며, Dox의 부재하에 성장이 중지되거나 사멸되는 것으로 밝혀졌다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Birc5 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Birc5 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Birc5의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 24a).
도 24b를 참조하면, 본 발명자들은 qPCR에 의해 Dox를 갖는 Birc5-EARC 세포에서 Dox 제거 2일 후에, Birc5 유전자 발현 수준을 결정하고, 야생형 마우스 ES 세포(C2)에서의 발현 수준과 비교하였다. 추정된 바와 같이, Birc5 발현 수준은 Dox의 부재하에 Birc5-EARC 세포에서 2일 동안 크게 감소한다.
도 25를 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린 제거 50시간 후에는, 세포 성장이 완전히 저지되었다. 흥미롭게도, 더 저농도 Dox(0.5 및 0.05 μg/ml)가 더 고농도(1 μg/ml)보다 더 양호한 세포 성장을 촉진하는 것으로 나타난다.
실시예
7:
Eef2
좌위에서
EARC
변형된 마우스
ES
세포의 생성
실시예 7에서, Eef2를 표적화하는 EARC(dox 가교) 벡터의 작제 및 마우스 ES 세포에서 세포 분열을 제어하기 위한 그의 용도가 기재되어 있다. 이 실시예에서, dox 가교가 삽입되고, 독시사이클린이 CDL의 발현을 유도하는 유도성 유전자 발현 시스템으로 표적화되는 CDL은 Eef2/EEF2이다.
상기에서 기재된 바와 같이, Eef2/EEF2는 모든 유사분열 활성(즉, 분열) 세포에서 발현된다. Eef2 좌위에서 EARC(dox 가교) 삽입을 포함하도록 변형된 세포에서, 세포 분열은, Eef2의 발현을 허용하는 유도인자(독시사이클린)의 존재하에서만 가능하다. 따라서, EARC 변형된 유사분열 활성 세포의 세포 분열은 독시사이클린의 부재하에서 제거될 수 있다.
실시예 7에서, Eef2 유전자의 5'UTR로의 dox 가교 삽입은 상동성 재조합 녹인 기법에 의해 달성하였다.
방법
dox 가교를 포함하는 EARC 표적화 벡터의 작제
C57/B6 게놈 DNA로부터의 817 bp 단편(SEQ ID NO: 134)을 PCR 증폭시키고(프라이머 Eef2_5F(SEQ ID NO: 135) 및 Eef2_5R(SEQ ID NO: 136)), pGem-가교-단계3의 SbfI 및 SpeI로 클로닝함으로써, 5' 상동성 아암을 클로닝하였다. 유사하게, 프라이머 Eef2_3F(SEQ ID NO: 138), Eef2_3R(SEQ ID NO: 139)를 사용하여, PCR에 의해 3' 상동성 아암(826 bp; SEQ ID NO: 137)을 증폭시키고, SphI to에 클로닝함으로써, pBridge-Eef2(SEQ ID NO: 140)로 지칭되는 최종 표적화 벡터를 생성시켰다.
CRISPR/Cas9 플라스미드의 작제
표적외 돌연변이의 가능성을 최소화하기 위해 이중 닉카아제 전략을 선택하였다. 안내 RNA 서열을, 제안된 프로토콜에 따라 올리고 Eef2aFWD(SEQ ID NO: 141), Eef2aREV(SEQ ID NO: 142), Eef2bFWD(SEQ ID NO: 143), Eef2bREV(SEQ ID NO: 144)를 사용하여, pX335(Addgene)에 클로닝함으로써(문헌[Ran et al., 2013]), CRISPR 벡터 pX335-Eef2A(SEQ ID NO: 145) 및 px335-Eef2B(SEQ ID NO: 146)를 생성시켰다.
EARC
변형된 마우스
ES
세포의 생성
마우스 ES 세포 배양: 실시예 4에서와 같음.
표적화: CRISPR/Cas9 구성요소를 함유하는 플라스미드(pX335-Eef2A 및 px335-Eef2B) 및 표적화 플라스미드(pBridge-Eef2)를 실시예 4에서와 같이, FuGENE HD(Clontech)를 사용하여, 마우스 ES 세포에 공동 형질감염시켰다.
유전자형 분석: 실시예 4에서와 같이 DNA를 추출하였다. Eef2 유전자의 5'에서 pBridge-Eef2의 상동성 재조합에 의한 올바른 삽입에 대해 양성인 클론을 5' 상동성 아암에 걸친 프라이머(프라이머 rttaRev(SEQ ID NO: 54), Eef2_5scrF(SEQ ID NO: 147))를 사용하여, PCR에 의해 스크리닝하였다.
표적화된 세포 성장: Eef2 동형접합성 표적화된 세포를 트립신 처리하고, 젤라틴화된 24 웰 플레이트에 웰당 5x104개의 세포의 밀도로 플레이팅하였다. 플레이팅 1일 후에 개시하여, 세포를 상이한 Dox 농도(1 μg/ml, 0.5 μg/ml, 0.05 μg/ml 및 0 μg/ml)에 노출시키고, 상기 플레이트를 IncucyteZoom 시스템(Essen Bioscience)에서 3 내지 4일 동안 2시간마다 사진을 촬영하고, 컨플루언스를 측정함으로써, 분석하였다.
결과
도 26을 참조하면, 도 26a에 도시된 dox 가교 표적 벡터를 사용함으로써, 여러 개의 표적화된 C2 마우스 ES 세포주를 생성시켰다(도 26b). 이들 세포주 중 9개는 올바르게 표적화된 것(도 26b)으로 밝혀졌으며, 적어도 하나의 클론은 Dox-배지에서만 성장하였다.
추정된 바와 같이, 이 ES 세포주는 독시사이클린의 존재하에서만 성장한다. 독시사이클린의 존재하에서, Eef2 프로모터에 의해 생성된 rtTA는 TRE와 결합하고, Eef2 코딩 서열의 전사를 개시시킨다. CDL 발현이 EARC를 통해서만 발생될 수 있도록 보장하기 위해, dox 가교가 Eef2의 대립유전자 둘 모두에 5'UTR로 삽입될 수 있다. 대안적 방법은 CDL의 모든 나머지 EARC 비변형된 대립유전자에 눌 돌연변이를 생성시키는 것이다.
독시사이클린의 회수는 4일 이내에 유사분열 활성 ES 세포의 완전한 제거를 야기하였다(도 27).
도 28을 참조하면, 본 발명자들은, 4일 동안 세포 성장을 측정함으로써, 상이한 농도의 독시사이클린이 dox 가교 ES 세포의 증식에 어떻게 영향을 주는지를 결정하였다. 독시사이클린의 존재하의 ES 세포는 기하급수적으로 성장하였으며, 이는 그의 정상적인 성장을 나타낸다. 반대로, 독시사이클린의 부재 시에, 세포는 성장에 완전히 실패하였다.
본 개시는 특정의 구체적인 구현예를 참조하여 기재되었으나, 그의 다양한 변형이 당업자에게 명백할 것이다. 본 명세서에서 제공되는 임의의 실시예는 본 개시를 설명하기 위한 목적으로만 포함되며, 어떤 방식으로든 본 개시를 제한하려는 의도가 아니다. 본 명세서에서 제공되는 임의의 도면은 본 개시의 다양한 양태를 설명하기 위한 목적일 뿐이며, 어떤 방식으로든 본 개시의 규모를 도출하거나, 제한하려는 의도가 아니다. 본 명세서에 첨부된 청구범위의 범위는 상기 설명에서 제시된 바람직한 구현예들에 의해 제한되어서는 안되며, 전체적으로 본 명세서와 일치하는 가장 넓은 해석이 주어져야 한다. 본 명세서에 나열된 모든 선행 기술의 개시는 그 전문이 본 명세서에 참조로 포함된다.
표 2: 추정 CDL(ID는 EntrezGene 식별 번호를 지칭하고; CS 점수는 문헌[Wang et al., 2015]에 제공되는 CRISPR 점수 평균을 지칭하며; 기능은 공지되었거나, 추정된 좌위의 기능을 지칭하고, 추정은 GO 기간을 기반으로 하며, Gene Ontology Consortium 웹 사이트 http://geneontology.org/에서 제시된 바와 같고; 기능 범주는 GO 기간 추정된 기능을 기반으로 한 4가지 범주의 세포 기능을 지칭하며; CDL(기준)은, 본 발명자들이 유전자가 CDL이라는 것을 추정하는데 사용했던 정보를 지칭하며, 추정은 CS 점수, 이용 가능한 유전자 녹아웃(KO) 데이터, 유전자 기능 및 본 명세서에서 제공되는 실험 데이터를 기반으로 함).
인용 문헌
Rossant J, Nagy A. Nature Biotechnology, Jan., pp. 23. (1999)
Thomson JA et al. Science. 282(5391):1145. (1998)
Takahashi K, Yamanaka S. Cell. 126(4):663. (2006)
Takahashi K et al. Cell. 131(5):861. (2007)
Hussein SM et al. Nature. 471(7336):58. (2011)
Laurent LC et al. Stem Cell. 8(1):106. (2011)
Lister R et al. Nature. 471(7336):68. (2011)
Yoshida Y, Yamanaka S. Circulation. 122(1):80. (2010)
Choo AB et al. STEM CELLS. 26(6):1454. (2008)
Tan HL et al. STEM CELLS. 27(8):1792. (2009)
Ben-David U, Nudel N, Benvenisty N. Nature Communications. 4:. (2013a)
Fong CY, Peh GSL, Gauthaman K, Bongso A. Stem Cell Rev and Rep. 5(1):72. (2009)
Tang C et al. Nature Biotechnology. 29(9):829. (2011)
Blum B, Bar-Nur O, Golan-Lev T, Benvenisty N. Nature Biotechnology. 27(3):281. (2009)
Menendez S et al. Aging Cell. 11(1):41. (2012)
Chung S et al. J Neurochem. 97(5):1467. (2006)
Eiges R et al. Current Biology. 11(7):514. (2001)
Huber I et al. The FASEB Journal. 21(10):2551. (2007)
Rong Z, Fu X, Wang M, Xu Y. Journal of Biological Chemistry. 287(39):32338. (2012)
Schuldiner M, Itskovitz-Eldor J, Benvenisty N. STEM CELLS. 21(3):257. (2003)
Ben-David U et al. Cell Stem Cell. 12(2):167. (2013b)
Dabir DV et al. Developmental Cell. 25(1):81. (2013)
Tohyama S et al. Stem Cell. 12(1):127. (2013)
Ghosh Z et al. Cancer Research. 71(14):5030. (2011)
Ben-David U, Benvenisty N. Nat Protoc. 9(3):729. (2014)
Lim T-T et al. PLoS ONE. 8(7):e70543. (2013)
Halloran PJ, Fenton RG. Cancer Research. 58(17):3855. (1998)
Tomicic MT, Thust R, Kaina B. Oncogene. 21(14):2141. (2002)
Di Stasi A et al. N Engl J Med. 365(18):1673. (2011)
Santamaria D et al. Nature. 448(7155):811. (2007)
Diril MK et al. Proceedings of the National Academy of Sciences. 109(10):3826. (2012)
Scognamiglio R et al. Cell. 164(4):668. (2016)
Fernandez-Miranda G et al. Development. 138(13):2661. (2011)
Pellettieri J, Sanchez Alvarado A. Annu. Rev. Genet. 41:83. (2007)
Bianconi E et al. Ann. Hum. Biol. 40(6):463. (2013)
Wang T et al. Science. 350(6264):1096. (2015)
Morgan DO. (2007)
FUNG T, POON R. Seminars in Cell and Developmental Biology. 16(3):335. (2005)
Peters J-M. Mol Cell. 9(5):931. (2002)
Fukagawa T. Front Biosci. 13(13):2705. (2007)
Cassimeris L. Current Opinion in Cell Biology. 11(1):134. (1999)
Satyanarayana A et al. Development. 135(20):3389. (2008)
Kittler R et al. Nature. 432(7020):1036. (2004)
Harborth J et al. J. Cell. Sci. 114(Pt 24):4557. (2001)
Silk AD, Holland AJ, Cleveland DW. The Journal of Cell Biology. 184(5):677. (2009)
Oda H et al. Molecular and Cellular Biology. 29(8):2278. (2009)
Liu Q et al. Genes & Development. 14(12):1448. (2000)
Martin-McCaffrey L et al. Developmental Cell. 7(5):763. (2004)
Uren AG et al. Curr. Biol. 10(21):1319. (2000)
Leung CG et al. J Exp Med. 204(7):1603. (2007)
Cutts SM et al. Human Molecular Genetics. 8(7):1145. (1999)
Howman EV et al. Proceedings of the National Academy of Sciences. 97(3):1148. (2000)
Chauviere M, Kress C, Kress M. Biochem Biophys Res Commun. 372(4):513. (2008)
Miura K et al. Biochem Biophys Res Commun. 341(1):132. (2006)
Magnaghi P et al. Nat Chem Biol. 9(9):548. (2013)
Smith ED et al. Molecular and Cellular Biology. 24(3):1168. (2004)
Morham SG, Kluckman KD, Voulomanos N, Smithies O. Molecular and Cellular Biology. 16(12):6804. (1996)
Akimitsu N et al. Genes Cells. 8(4):393. (2003)
Jeganathan K et al. The Journal of Cell Biology. 179(2):255. (2007)
Ono T et al. Cell. 115(1):109. (2003)
Bharadwaj R, Qi W, Yu H. J. Biol. Chem. 279(13):13076. (2004)
Parisi G, Fornasari MS, Echave J. FEBS Lett. 562(1-3):1. (2004)
Harborth J, Weber K, Osborn M. J. Biol. Chem. 275(41):31979. (2000)
Krull S et al. Mol. Biol. Cell. 15(9):4261. (2004)
Topper LM et al. Cell Cycle. 1(4):282. (2002)
Zhang Y-W et al. J. Biol. Chem. 284(27):18085. (2009)
Simmons AD et al. Human Molecular Genetics. 8(12):2155. (1999)
Plate M et al. Mol Cells. 29(4):355. (2010)
Franco M et al. Proceedings of the National Academy of Sciences. 95(17):9926. (1998)
Ohno M, Shimura Y. Genes & Development. 10(8):997. (1996)
Achsel T et al. EMBO J. 18(20):5789. (1999)
Shichijo S et al. J Exp Med. 187(3):277. (1998)
Jurica MS et al. RNA. 8(4):426. (2002)
Chari A et al. Cell. 135(3):497. (2008)
Xu C et al. J. Biol. Chem. 281(23):15900. (2006)
Yeh H et al. Genomics. 23(2):443. (1994)
Kokkola T et al. FEBS Lett. 585(17):2665. (2011)
Chan CC et al. RNA. 10(2):200. (2004)
Zhou M et al. Proceedings of the National Academy of Sciences. 105(47):18139. (2008)
Takatsu H et al. J. Biol. Chem. 273(38):24693. (1998)
Chen Y et al. Cell Research. 22(2):333. (2012)
Mansfeld J et al. Nat. Cell Biol. 13(10):1234. (2011)
He F, Wang C-T, Gou L-T. Genet. Mol. Res. 8(4):1466. (2009)
Lieu A-S et al. Int J Oncol. 37(2):429. (2010)
Preuß E et al. Human Gene Therapy. 21(8):929. (2010)
Neschadim A et al. Molecular Therapy. 20(5):1002. (2012)
Hedley D, Ogilvie L, Springer C. Nat Rev Cancer. 7(11):870. (2007)
Nawa A et al. Anticancer Agents Med Chem. 8(2):232. (2008)
Danks MK et al. Cancer Research. 67(1):22. (2007)
Shah K. Adv. Drug Deliv. Rev. 64(8):739. (2012)
Ramnaraine M et al. Cancer Research. 63(20):6847. (2003)
Denny WA. J. Biomed. Biotechnol. 2003(1):48. (2003)
Ireton GC, McDermott G, Black ME, Stoddard BL. J. Mol. Biol. 315(4):687. (2002)
Humerickhouse R et al. Cancer Research. 60(5):1189. (2000)
Wierdl M et al. Cancer Research. 61(13):5078. (2001)
Kojima A, Hackett NR, Ohwada A, Crystal RG. J. Clin. Invest. 101(8):1789. (1998)
Straathof KC et al. Blood. 105(11):4247. (2005)
Soucek L et al. Cancer Research. 62(12):3507. (2002)
Oricchio E et al. CellReports, pp. 1. (2014)
Olive M et al. J. Biol. Chem. 272(30):18586. (1997)
Urlinger S et al. Proceedings of the National Academy of Sciences. 97(14):7963. (2000)
Agha-Mohammadi S et al. J Gene Med. 6(7):817. (2004)
Gossen M et al. Science. 268(5218):1766. (1995)
Banaszynski LA et al. Cell. 126(5):995. (2006)
Maeder ML et al. Nature Methods. 10(3):243. (2013)
Pollock R, Clackson T. Current Opinion in Biotechnology. 13(5):459. (2002)
Mullick A et al. BMC Biotechnology. 6(1):43. (2006)
No D, Yao TP, Evans RM. Proceedings of the National Academy of Sciences. 93(8):3346. (1996)
Stanley SA et al. Nature Medicine. 21(1):92. (2015)
Rollins CT et al. Proceedings of the National Academy of Sciences. 97(13):7096. (2000)
Cong L et al. Science. 339(6121):819. (2013)
Hsu PD et al. Nature Biotechnology. 31(9):827. (2013)
Ran FA et al. Nat Protoc. 8(11):2281. (2013)
Gertsenstein M et al. PLoS ONE. 5(6):e11260. (2010)
Adewumi O et al. Nature Biotechnology. 25(7):803. (2007)
Guy CT, Cardiff RD, Muller WJ. Molecular and Cellular Biology. 12(3):954. (1992)
Szymczak AL et al. Nature Biotechnology. 22(5):589. (2004)
Nagy A. et al. Manipulating the Mouse Embryo. (2003)
SEQUENCE LISTING
<110> Mount Sinai Hospital
Nagy, Andras
Monetti, Claudio
Liang, Qin
<120> TOOLS AND METHODS FOR USING CELL DIVISION LOCI TO CONTROL
PROLIFERATION OF CELLS
<130> 35941-2013
<150> US 62/130,258
<151> 2015-03-09
<150> US 62/130,270
<151> 2015-03-09
<160> 152
<170> PatentIn version 3.5
<210> 1
<211> 562
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA
<400> 1
gtcgacggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60
gtggagtcca acccagggcc catggccagc tacccctgtc accagcacgc cagcgccttc 120
gaccaggccg ccagaagcag gggccacagc aaccggcgga ccgccctgag acccaggcgg 180
cagcaggaag ccaccgaagt ccggctggaa cagaagatgc ccaccctgtt aaccctagaa 240
agatagtctg cgtaaaattg acgcatgcat tcttgaaata ttgctctctc tttctaaata 300
gcgcgaatcc gtcgctgtgc atttaggaca tctcagtcgc cgcttggagc tcccgtgagg 360
cgtgcttgtc aatgcggtaa gtgtcactga ttttgaacta taacgaccgc gtgagtcaaa 420
atgacgcatg attatctttt acgtgacttt taagatttaa ctcatacgat aattatattg 480
ttatttcatg ttctacttac gtgataactt attatatata tattttcttg ttatagatat 540
cgtggcggcc gcattaccgc gg 562
<210> 2
<211> 2031
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA
<400> 2
gtcgacatta ccgcgggttt tgttacttta tagaagaaat tttgagtttt tgtttttttt 60
taataaataa ataaacataa ataaattgtt tgttgaattt attattagta tgtaagtgta 120
aatataataa aacttaatat ctattcaaat taataaataa acctcgatat acagaccgat 180
aaaacacatg cgtcaatttt acgcatgatt atctttaacg tacgtcacaa tatgattatc 240
tttctagggt taagggtgta catcgacggc ccccacggca tgggcaagac caccaccacc 300
cagctgctgg tggccctggg cagccgggac gacatcgtgt acgtgcccga gcccatgacc 360
tactggcagg tgctgggcgc cagcgagacc atcgccaaca tctacaccac acagcacagg 420
ctggaccagg gcgagatctc tgccggcgac gccgccgtgg tgatgaccag cgcccagatc 480
acaatgggca tgccctacgc cgtgaccgac gccgtgctgg cccctcacgt gggcggcgag 540
gccggctcta gccacgcccc tccccctgcc ctgaccctga tcttcgaccg gcaccccatc 600
gcccacctgc tgtgctaccc tgccgccaga tacctgatgg gcagcatgac cccccaggcc 660
gtgctggcct tcgtggccct gatccccccc accctgcccg gcaccaacat cgtgctggga 720
gccctgcccg aggaccggca catcgaccgg ctggccaagc ggcagagacc cggcgagcgg 780
ctggacctgg ccatgctggc cgccatccgg cgggtgtacg gcctgctggc caacaccgtg 840
agatacctgc agggcggagg gtcttggtgg gaggactggg gccagctgtc cggcaccgcc 900
gtgccacctc agggcgccga gccccagagc aatgccggcc ctcggcccca catcggcgac 960
accctgttta ccctgttcag agcccccgag ctgctggccc ccaacggcga cctgtacaac 1020
gtgttcgcct gggccctgga cgtgctggcc aagaggctgc ggcccatgca cgtgttcatc 1080
ctggactacg accagagccc tgccggctgc agggacgccc tgctgcagct gaccagcggc 1140
atggtgcaga cccacgtgac cacccccggc agcatcccca ccatctgcga cctggcccgg 1200
accttcgccc gggagatggg cgaggccaac ggctccggag agggcagagg aagtctgcta 1260
acatgcggtg acgtcgagga gaatcctggc ccactcgaga tggccacaac catggtgagc 1320
aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcacatg 1380
gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac 1440
gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg 1500
gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca ccccgccgac 1560
atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac 1620
ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc 1680
atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag 1740
aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag 1800
ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc tgaggtcaag 1860
accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt caacatcaag 1920
ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag 1980
ggccgccact ccaccggcgg catggacgag ctgtacaagg ctagcaagct t 2031
<210> 3
<211> 1848
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid DNA
<400> 3
gcggccgcat ccaggcggcc gagatccgaa gttcctatac tatttgaaga ataggaactt 60
cagatccccc gggctgcagg atctaccggg taggggaggc gcttttccca aggcagtctg 120
gagcatgcgc tttagcagcc ccgctgggca cttggcgcta cacaagtggc ctctggcctc 180
gcacacattc cacatccacc ggtaggcgcc aaccggctcc gttctttggt ggccccttcg 240
cgccaccttc tactcctccc ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt 300
gcaggacgtg acaaatggaa gtagcacgtc tcactagtct cgtgcagatg gacagcaccg 360
ctgagcaatg gaagcgggta ggcctttggg gcagcggcca atagcagctt tgctccttcg 420
ctttctgggc tcagaggctg ggaaggggtg ggtccggggg cgggctcagg ggcgggctca 480
ggggcggggc gggcgcccga aggtcctccg gaggcccggc attctgcacg cttcaaaagc 540
gcacgtctgc cgcgctgttc tcctcttcct catctccggg cctttcgacc tgcagcaatt 600
aatcatcggc atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg 660
gatcggccat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 720
tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 780
tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 840
aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 900
ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 960
ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 1020
caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 1080
atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 1140
acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 1200
ccgacggcga tgatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 1260
aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 1320
aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 1380
gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 1440
ttcttgacga gttcttctga tcgagaaatt gatgatctat taaacaataa agatgtccac 1500
atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac ctacattttg 1560
aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa tgcctgctct 1620
ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat atcataattt 1680
aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc tatagatccg 1740
gtcgacgaag ttcctatact atttgaagaa taggaacttc ggatctggcc ggcctaggga 1800
taacagggta atggatcccc cgggctgcag gaattcgata tcaagctt 1848
<210> 4
<211> 8003
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 4
ggtctacctt aagccaaggt agaaatactt ggttgaaaaa tgtttctgct gccaggcagt 60
ggcagcacac accagcactt ggggggacag aggcaggcag atctcttgag tttaaggcca 120
gcctagtcta tagagcaagt cctggaacac ccagggctac acagagaaac cttgtctcag 180
aaaaccaaac aaaaagttct gttctggtag tgttggctaa ctgctttttt attgccactt 240
cactcttgtt tgtgtggtct gtgaaaagga agacagaccc tttggcatct ttgtcagggg 300
agattgatgg cctgggggga cctccaggaa ggggcttatt gtagttttag gggttctcgt 360
ttctctgtgt tgaacttccg cagagctgtg cttcctcctg attggacctg ctgtgctcat 420
tcagatcaat taaaaggcag gttttgctgt gtgagggaga ttattgtgaa agatttagga 480
gccagcctac tctagctggg ggagggagca ctagggattg aaccccagtc tttggcccct 540
gttgcttggg tgtcctgtca ctgagctgtg cccttggccc tgtcatcagg ctttgtcagt 600
ggattcccat gtggttgtct gttttattat tttcctctgc aatggggctt gaaccatggg 660
ccacacacac acactcacac actctgctcc ttgttttgag aacgtctcac tgacttgccc 720
tggttggccc tgaggtcact ggcgtagata gactttggac ctgggactcc tacagcggcc 780
ttcccagtag taggtctaca gcaccagact aggttcctct ggtatttctg aaagggcatt 840
ggcttgtata atacaggaac attggcatct tgggaggtgt gagcctggag tctacagtgt 900
cggtcccctg tgtgtcattt ggattttgag gcagggtctc ctgtagccct gactggcctc 960
attctctggg tgctaagatt acacagatgt gtgccctgct ggggccctgg tcctgctcgt 1020
tttgcctgat agggaagcta gccacccact gagcagcctt ctcagtcctg tcttgtttat 1080
tcttttttat tttttcacag tttatgatat gactcgtctt taatggctgt aactgctgct 1140
gacctcattg cattgttcat tgaggtcatt cactattttg ataaataaac tgtagttcta 1200
aatcactaat catttgaatc ccctcctacc gctttggctt agatttcttt tcatttttct 1260
tttttttctt tttttttggt ttttttgaga cagggtttct ctgtgtagct ctggctgtcc 1320
tggaactcac tttgtagacc aggctggcct caaactctgc ctccagagtg ctggtattaa 1380
agttgtatgc cagccaggta tatgccaccc aggtatatgc cagccaggat atggctgctt 1440
tggtcctttg actttagaga tctgaaaagc aagaggtcta tggtacttac ccactaatga 1500
gcagaaatca gaaataaaat aggttcaact tagtaatttg catatagcta attgtctgaa 1560
gttcttggtg acacctgcac agcttcctaa aagacaaccg tgtgtggtct gtcctgtgcc 1620
aggtagtgac gctgtggtac cgatctccag aagtgttgct gggctcggct cgttactcca 1680
ctccggttga catctggagt atagggacca tatttgcaga actggccacc aagaagccgc 1740
ttttccacgg cgactcagag attgaccagc tcttcaggat cttcaggtaa ttgtgtttta 1800
tacctaagct gttaaaagcc tgtatggtta aaataataaa ggcaccgtgt atgtgatagg 1860
acttttgctt cctttcagag ctctgggcac tcctaacaac gaagtgtggc cagaagtcga 1920
gtccctgcag gactacaaga acacctttcc caagtggaag ccggggagcc tcgcatccca 1980
cgtcaagaac ctggacgaga acggcttgga tttgctctca gtaagtgagc tgttctttat 2040
ggttcgagcg tggtgccctt gggtgtcagt agtgacaggt aagggtgact ggatgtactc 2100
agtcctggac ttgtcagcac gaagacacag cagctgagtc ggatgcccgg taatcctgta 2160
gtgacagcga gctgcctttg aggtgtgaag tgcctggtgg tctgaggagc ctctggtgtt 2220
ggactttgtc atttacttct catccggtag gagaggctgg actcacacac cttcttgctt 2280
gagagtatgt tgatgagtta caatgactca ctcctctctg tttgctactg agccctcagt 2340
tcatcggttt acactgttga ctgcttagga tactgagctg ttcaggcttt tgacagcata 2400
actccattgc tcaggtctgg ccttgtttcc tcagaaaagc tagcaaagac taattaattc 2460
tgattttctt cagttgtctt ggtgcacaat attagcaatg caaagaacaa aattactgtt 2520
caggattaat aaaggtctcc tttaggaaat ttgctgtagg tagagcaggg tttaaaatct 2580
gagtttgtag aaggaatcaa gtagacgatt cagttggtct ttccgctccc ttgcaatcta 2640
taaacgatgc caccaaatgg ggctcagatt tgtccagacc cctacagctg tcacatagtt 2700
tgttacatat tggtattggc taacttagaa gccttcccgt agcctgggtc caatctgctg 2760
gtattatcta aagttattag ctctgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2820
gtgtgtgtgt tgctgggggc tatggacaga aggcagagct ttcttgaggt ggtgtaggaa 2880
ggttggtcat tgactgttga ggcgcagccc tacttctcag tctttaaaca aaggacttca 2940
cttaacagac atcagttctg ggcaccaatt tcctctgttg agccaacacc ctgcaatagc 3000
taagcttgcc gtggccctgc tgcctgctga gcactgtggc tatcactgcc ctgtccccca 3060
ctccagcggc agactgctga gttagcaggg cctgtgtcta tcgcaggacc ccagaagcaa 3120
actgccccag ttggagacca ctggattatt gatgagactt ggcttcagtt tattttctcc 3180
cacattgatg gattcgggca agtttcttgc tgtccttgaa agacttggtg tcttaagcca 3240
aacagtgtgg cacatctttc tcatatgtct gtgcggactg acagacatat cctcaaggcc 3300
ttcatattta tttgtttgcc tttttaaaaa tttacttatt tattttacat atgcaaatac 3360
actgttgctg tcctcagaca cagtagaaga gggcatcgga tcccattaca gatggttgtg 3420
agccaccatg tggttgctgg gagttgaact caggacttct ggaagagtag tcatcgctct 3480
taattgctga gccatctctc cacctcctta atctattttc tctgaagata atatgcatga 3540
tcagatttaa gatctggagt atttaaatta gtttacaata attagtccat ctattataac 3600
tgtgtttata aaaatgctat ggggtttttc ctttgttggc ttgacgaagg ggttgtgtgg 3660
acactatcat gaaacactat aactgattgc tactttttca gttgtgaata acagatggac 3720
atttaatttc tagggtagat ataattagct agataatgtg aagatttatg ttttggtttt 3780
aagctgtctg ggtgcttatc ttataattta taacaggtta ccaaggtgtc tgtgtgtgat 3840
ttaagtatct tggagaggta aatagagggc aggcttctaa atttatttcc ctttttctct 3900
ctagaaaatg ctagtctatg atcctgccaa acgaatctct ggcaaaatgg ccctgaagca 3960
cccgtacttt gatgacttgg acaatcagat taagaagatg tagccctctg gatggatgtc 4020
cctgtctgct ggtcgtaggg gaagatcgtg ttgtttaccg ttggctctct tcctgtcttg 4080
tatagttttc tttgtttgta aactgtcatc tggacttttc ttaatttcct acgtataact 4140
taattaacat gtaaatatta ttccatatga atttaaatat aattctgtat atgtgcagat 4200
gtcactgtgg tggctgttaa ttactataac acaagtgtta attactacaa cataagactt 4260
gagtctccct agacttccca gcagccattc ctgcagctcg gagcacagtt gaaggagctg 4320
agctcaggcc tcgtgatgct ttcaagtgcc tccgtgttct ggatatatat gattcctggt 4380
cagtttcttg ccatttggaa actacaaccc acctacggac agtgtttttc tacttgtgct 4440
taagcagttg ggatgagaag gccaaagacc cgaggatgtc tagagtaatg acccccagat 4500
ggaagtgcac caaagctggc tgggtttcac agctagagat caggggctgt ccagagcagg 4560
acagcttaga acatttatga agactcccta tttttaggtt tgttgtaaag ctgttgtcta 4620
gttggattcc tgtgctctgc atggtcagag gtaggttaga ggatttgcct tggcttctaa 4680
atccaatttg aaaactgctt aaaatctcct gtcctctctt agcagtgtct aaaaatgtcc 4740
ttgtccaaat atttagctga gattcctcac tttggaaaag gagccgtatc gctgtgctgc 4800
ttagtgtaat tcttagaagc agcctgactt atctgctagc agtcaaaggg atgcctgaga 4860
cgactgctcc tcttagaact aaaggctggg atgcttaagt ttgtctactg tttggaggat 4920
ctcggtaaga ctgagcccct gttcctgtgg ccacctcagt ttaccagtac ctcagcctca 4980
gcctcctgca tttgctggag tcagggaagg tccccagccc tgagccctga cgctcctgat 5040
tgtagagact gtcagttgga ggtaaaacgt tcattgaagt agtcagcagc cacatgcatt 5100
tagggcactc cagtgtcaga gaccatcctg gaggtttcta accctgccgc tggcagtcta 5160
ctcccaagac agatcagtta gagtggtcag caaacaccaa ctgctgcaga aacctgtgtt 5220
ggtgtggttc cctgctgctg ctgggaactg ggcccaagac tagagagctt ggggctgcgg 5280
ttgatcatgg gttctgttcc tgcattacac cttgaaatcc aagccttcta atatctccct 5340
tcggatcata agttgtgaat ttggtcctcc gcccccgcca ggttttctat acttgggttt 5400
gtcttgctga cattttcaag agtcctgact aagacggtga ttagtgtgac atgacttgag 5460
aactaccgat ttgaagcaca cttgaagtta acaaattctc tcatgattat acttttaact 5520
ttttataaga ttgcttgagc tcacccagat ctctgttggg aagtaactgg gtaacaaaag 5580
ccgttgcact ggtttgacag ctaacaactg ttggtacttt gtattcagaa ggaatgaggt 5640
agcgattgaa tggctggggt gttgtttcca cagtttatac actaaaaatt tgggtagcca 5700
ggaggtagtg gcgcgcaatc tttaatctca gcagaggcag tcctatctct tgagttggag 5760
gccagcctgc ctgagttcca gaccagccag ggctacagga agaagtctta aaaaaatttt 5820
ttttccctgt ggatgtaaac ccatgagaat gactgctgta tctatcactt tctgtataat 5880
agaggtttct tccgccgcag cgctccattg gtctcagccc ctcatgttgg gggcgggaag 5940
gaggggcaag cgtccccaag cacaggaagg cctgctgaag agttggcggc tttgagggtt 6000
caaatcctgc ttgggtctga ggagtccccc aaacgatctt ggactgtaaa aacctgccag 6060
gaacaagcgc taagggatgg ttctcaacct gtgggtcgcg accccctggg gagttggaca 6120
gccctttcct gaggatcaga acaaacatcc tgcatatcag atattaacgt ggcatttcat 6180
aactgcaaac ttacagttag gaagtagcag tgacaaagaa ttttatgggt ggggtggggt 6240
gggggctcac caccatatta aagggttaca gcattaggag ggttgacaac agaaccatcg 6300
cactgaggga aagtgagtta gcacgaagag atgagcattt cccagaacac agaataagac 6360
acgtttaacc aacatcagtc tgtaacccca gcggactgtg acaagctctc acccatgccg 6420
tggagctcag aactagcatt gcacgctttt accccatctt tggttgcctc actccctttg 6480
agtagtaagt ccctcttcaa agtaatagcc tctaaacagc ctgctgcgca tgctctagtc 6540
ctttgctttc ctccacgggt aggccacagg cttaagcagc agttggaaat ggaacttggg 6600
ctttctggct cctggtttag aaaactcttg aaatggacaa gatttagtcc taggcaagtt 6660
ctgtgtagtc agcaatggaa gcaaaggggg gtggggcaaa cattccagtc aggtggaatc 6720
tgagcccttg agagtgtgag gcaggaggat cactaggcag gagttctcaa ccagcctaga 6780
cgacagcttg gaacccatcg cactccacaa tgaggacccc tcagcttctg aagagaggag 6840
agctgctagc tctgagaagg gtgtataaaa tgggcttttg gttcccagac atcagacttg 6900
aagaggcaac cgagtaagcc agctatagac taagtaagat tgtcgtacct agcctactcc 6960
ttgggagctc attcttcaga gtatgttgat ggatgaccta acgccatctc agatgctgga 7020
gcattttgct ggaaaggctc tcagcactag cgaggctgcc tcaatgtaat cctgcctcag 7080
cctgagaact gattatgagt taccgtttgg tactttatgt atttttctct cttcctagta 7140
accaaggaca aacctgcttc cttccagcca cgtggcagac actagctgta ctaaagtatt 7200
attacacacc ggtcccctgc tgccagaaca aagaactcag cctcgagaaa tttctcctat 7260
tatatttggg atccagcatg tcccaagaca gggacgactc aataatttaa tgtgcctaat 7320
ggcacggaat aaaaggatta ttcacaaaca gaaaaccgga cttaagcaga tgtttatttg 7380
aacacaaata ccataaccct ccttctcatg atgttcccaa ttacacgttg caacattttc 7440
acgaagaagc tctttctaaa acggccttct agggagcgaa taaacaggac tatatttggc 7500
taacagctgc ttctgaaaac tgagatgtca gcaaagcaag ctgttgttta aagaaaacta 7560
attacccagc taccttgggc ttggatgggg gtaaataacg ccctcccgtt tcttggcagt 7620
gatttgtctg ggattttaat actgttaaga ttttatttct cttcctccac ttctcctttg 7680
gatcaaatgg tttttaaagg attccttgtg ttcctgctgc caatggcgag tcctttgcgt 7740
ttgccgcccc tgcttcgtca ccaactgcta ttttgtttag tgcaaagcag tgtgtttaag 7800
gacacactaa actttagatg acccagtgac acagtgatcc gtatttgcaa gcgtctggtt 7860
atgcagatgt cattgtgttg tttatcagca atgtcagcaa tgtctttttt tttttttttt 7920
tatgcacagg ctttgaaact tattttggaa attcattcat tttgagggga ggcagtgagc 7980
tgggagttat acaatctctc ttt 8003
<210> 5
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA
<400> 5
ccctgaagca cccgtacttt gatgacttgg acaatcagat taagaagatg 50
<210> 6
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA
<400> 6
tagccctctg gatggatgtc cctgtctgct ggtcgtaggg gaagatcgtg 50
<210> 7
<211> 755
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 7
tgtggcacat ctttctcata tgtctgtgcg gactgacaga catatcctca aggccttcat 60
atttatttgt ttgccttttt aaaaatttac ttatttattt tacatatgca aatacactgt 120
tgctgtcctc agacacagta gaagagggca tcggatccca ttacagatgg ttgtgagcca 180
ccatgtggtt gctgggagtt gaactcagga cttctggaag agtagtcatc gctcttaatt 240
gctgagccat ctctccacct ccttaatcta ttttctctga agataatatg catgatcaga 300
tttaagatct ggagtattta aattagttta caataattag tccatctatt ataactgtgt 360
ttataaaaat gctatggggt ttttcctttg ttggcttgac gaaggggttg tgtggacact 420
atcatgaaac actataactg attgctactt tttcagttgt gaataacaga tggacattta 480
atttctaggg tagatataat tagctagata atgtgaagat ttatgttttg gttttaagct 540
gtctgggtgc ttatcttata atttataaca ggttaccaag gtgtctgtgt gtgatttaag 600
tatcttggag aggtaaatag agggcaggct tctaaattta tttccctttt tctctctaga 660
aaatgctagt ctatgatcct gccaaacgaa tctctggcaa aatggccctg aagcacccgt 720
actttgatga cttggacaat cagattaaga agatg 755
<210> 8
<211> 842
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 8
ccctctggat ggatgtccct gtctgctggt cgtaggggaa gatcgtgttg tttaccgttg 60
gctctcttcc tgtcttgtat agttttcttt gtttgtaaac tgtcatctgg acttttctta 120
atttcctacg tataacttaa ttaacatgta aatattattc catatgaatt taaatataat 180
tctgtatatg tgcagatgtc actgtggtgg ctgttaatta ctataacaca agtgttaatt 240
actacaacat aagacttgag tctccctaga cttcccagca gccattcctg cagctcggag 300
cacagttgaa ggagctgagc tcaggcctcg tgatgctttc aagtgcctcc gtgttctgga 360
tatatatgat tcctggtcag tttcttgcca tttggaaact acaacccacc tacggacagt 420
gtttttctac ttgtgcttaa gcagttggga tgagaaggcc aaagacccga ggatgtctag 480
agtaatgacc cccagatgga agtgcaccaa agctggctgg gtttcacagc tagagatcag 540
gggctgtcca gagcaggaca gcttagaaca tttatgaaga ctccctattt ttaggtttgt 600
tgtaaagctg ttgtctagtt ggattcctgt gctctgcatg gtcagaggta ggttagagga 660
tttgccttgg cttctaaatc caatttgaaa actgcttaaa atctcctgtc ctctcttagc 720
agtgtctaaa aatgtccttg tccaaatatt tagctgagat tcctcacttt ggaaaaggag 780
ccgtatcgct gtgctgctta gtgtaattct tagaagcagc ctgacttatc tgctagcagt 840
ca 842
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 9
tgtggcacat ctttctcata tgtctgtgcg 30
<210> 10
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 10
gaagcagcct gacttatctg ctagcagtca 30
<210> 11
<211> 2034
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 11
ggttctggcg tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaacccag ggcccataac ttcgtataat gtatgctata cgaagttatt aggtctgaag 120
aggagtttac gtccagccaa gctagcttgg ctgcaggtcg tcgacggtat cgataagctt 180
gatatcgaat ttcgagggcc cctgcaggtc aattctaccg ggtaggggag gcgcttttcc 240
caaggcagtc tggagcatgc gctttagcag ccccgctggc acttggcgct acacaagtgg 300
cctctggcct cgcacacatt ccacatccac cggtagcgcc aaccggctcc gttctttggt 360
ggccccttcg cgccaccttc tactcctccc ctagtcagga agttcccccc cgccccgcag 420
ctcgcgtcgt gcaggacgtg acaaatggaa gtagcacgtc tcactagtct cgtgcagatg 480
gacagcaccg ctgagcaatg gaagcgggta ggcctttggg gcagcggcca atagcagctt 540
tgctccttcg ctttctgggc tcagaggctg ggaaggggtg ggtccggggg cgggctcagg 600
ggcgggctca ggggcggggc gggcgcgaag gtcctcccga ggcccggcat tctcgcacgc 660
ttcaaaagcg cacgtctgcc gcgctgttct cctcttcctc atctccgggc ctttcgacct 720
gcagccaata tgggatcggc cattgaacaa gatggattgc acgcaggttc tccggccgct 780
tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 840
gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 900
ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 960
gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 1020
ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 1080
atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 1140
caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 1200
caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 1260
aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc ctgcttgccg 1320
aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 1380
gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 1440
gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 1500
gccttctatc gccttcttga cgagttcttc tgaggggatc gatccgtcct gtaagtctgc 1560
agaaattgat gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca 1620
tactttgtta agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta 1680
cgggggtggg ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact 1740
attgctttat gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt 1800
aagggccagc tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca 1860
ttgtttttct cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag 1920
tttcatagcc tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta 1980
ttgttttgcc aagttctaat tccatcagaa gctgactcta gagcttggcg cgcc 2034
<210> 12
<211> 1971
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 12
ggcgcgccat aacttcgtat aatgtatgct atacgaagtt atctatggcc agctacccct 60
gtcaccagca cgccagcgcc ttcgaccagg ccgccagaag caggggccac agcaaccggc 120
ggaccgccct gagacccagg cggcagcagg aagccaccga agtccggctg gaacagaaga 180
tgcccaccct gttaagggtg tacatcgacg gcccccacgg catgggcaag accaccacca 240
cccagctgct ggtggccctg ggcagccggg acgacatcgt gtacgtgccc gagcccatga 300
cctactggca ggtgctgggc gccagcgaga ccatcgccaa catctacacc acacagcaca 360
ggctggacca gggcgagatc tctgccggcg acgccgccgt ggtgatgacc agcgcccaga 420
tcacaatggg catgccctac gccgtgaccg acgccgtgct ggcccctcac gtgggcggcg 480
aggccggctc tagccacgcc cctccccctg ccctgaccct gatcttcgac cggcacccca 540
tcgcccacct gctgtgctac cctgccgcca gatacctgat gggcagcatg accccccagg 600
ccgtgctggc cttcgtggcc ctgatccccc ccaccctgcc cggcaccaac atcgtgctgg 660
gagccctgcc cgaggaccgg cacatcgacc ggctggccaa gcggcagaga cccggcgagc 720
ggctggacct ggccatgctg gccgccatcc ggcgggtgta cggcctgctg gccaacaccg 780
tgagatacct gcagggcgga gggtcttggt gggaggactg gggccagctg tccggcaccg 840
ccgtgccacc tcagggcgcc gagccccaga gcaatgccgg ccctcggccc cacatcggcg 900
acaccctgtt taccctgttc agagcccccg agctgctggc ccccaacggc gacctgtaca 960
acgtgttcgc ctgggccctg gacgtgctgg ccaagaggct gcggcccatg cacgtgttca 1020
tcctggacta cgaccagagc cctgccggct gcagggacgc cctgctgcag ctgaccagcg 1080
gcatggtgca gacccacgtg accacccccg gcagcatccc caccatctgc gacctggccc 1140
ggaccttcgc ccgggagatg ggcgaggcca acggctccgg agagggcaga ggaagtctgc 1200
taacatgcgg tgacgtcgag gagaatcctg gcccactcga gatggccaca accatggtga 1260
gcaagggcga ggaggataac atggccatca tcaaggagtt catgcgcttc aaggtgcaca 1320
tggagggctc cgtgaacggc cacgagttcg agatcgaggg cgagggcgag ggccgcccct 1380
acgagggcac ccagaccgcc aagctgaagg tgaccaaggg tggccccctg cccttcgcct 1440
gggacatcct gtcccctcag ttcatgtacg gctccaaggc ctacgtgaag caccccgccg 1500
acatccccga ctacttgaag ctgtccttcc ccgagggctt caagtgggag cgcgtgatga 1560
acttcgagga cggcggcgtg gtgaccgtga cccaggactc ctccctgcag gacggcgagt 1620
tcatctacaa ggtgaagctg cgcggcacca acttcccctc cgacggcccc gtaatgcaga 1680
agaagaccat gggctgggag gcctcctccg agcggatgta ccccgaggac ggcgccctga 1740
agggcgagat caagcagagg ctgaagctga aggacggcgg ccactacgac gctgaggtca 1800
agaccaccta caaggccaag aagcccgtgc agctgcccgg cgcctacaac gtcaacatca 1860
agttggacat cacctcccac aacgaggact acaccatcgt ggaacagtac gaacgcgccg 1920
agggccgcca ctccaccggc ggcatggacg agctgtacaa gatctgaatt c 1971
<210> 13
<211> 1726
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 13
gcggccgcat ctagagtcga ccagcttctg atggaattag aacttggcaa aacaatactg 60
agaatgaagt gtatgtggaa cagaggctgc tgatctcgtt cttcaggcta tgaaactgac 120
acatttggaa accacagtac ttagaaccac aaagtgggaa tcaagagaaa aacaatgatc 180
ccacgagaga tctatagatc tatagatcat gagtgggagg aatgagctgg cccttaattt 240
ggttttgctt gtttaaatta tgatatccaa ctatgaaaca ttatcataaa gcaatagtaa 300
agagccttca gtaaagagca ggcatttatc taatcccacc ccacccccac ccccgtagct 360
ccaatccttc cattcaaaat gtaggtactc tgttctcacc cttcttaaca aagtatgaca 420
ggaaaaactt ccattttagt ggacatcttt attgtttaat agatcatcaa tttctgcatc 480
ccggggatct gatatcatcg atgcatgggg tcgtgcgctc ctttcggtcg ggcgctgcgg 540
gtcgtggggc gggcgtcagg caccgggctt gcgggtcatg caccaggtgc gcggtccttc 600
gggcacctcg acgtcggcgg tgacggtgaa gccgagccgc tcgtagaagg ggaggttgcg 660
gggcgcggag gtctccagga aggcgggcac cccggcgcgc tcggccgcct ccactccggg 720
gagcacgacg gcgctgccca gacccttgcc ctggtggtcg ggcgagacgc cgacggtggc 780
caggaaccac gcgggctcct tgggccggtg cggcgccagg aggccttcca tctgttgctg 840
cgcggccagc cgggaaccgc tcaactcggc catgcgcggg ccgatctcgg cgaacaccgc 900
ccccgcttcg acgctctccg gcgtggtcca gaccgccacc gcggcgccgt cgtccgcgac 960
ccacaccttg ccgatgtcga gcccgacgcg cgtgaggaag agttcttgca gctcggtgac 1020
ccgctcgatg tggcggtccg gatcgacggt gtggcgcgtg gcggggtagt cggcgaacgc 1080
ggcggcgagg gtgcgtacgg ccctggggac gtcgtcgcgg gtggcgaggc gcaccgtggg 1140
cttgtactcg gtcatggtaa gcttcagctg ctcgagatct agatggatgc aggtcgaaag 1200
gcccggagat gaggaagagg agaacagcgc ggcagacgtg cgcttttgaa gcgtgcagaa 1260
tgccgggcct ccggaggacc ttcgggcgcc cgccccgccc ctgagcccgc ccctgagccc 1320
gcccccggac ccaccccttc ccagcctctg agcccagaaa gcgaaggagc aaagctgcta 1380
ttggccgctg ccccaaaggc ctacccgctt ccattgctca gcggtgctgt ccatctgcac 1440
gagactagtg agacgtgcta cttccatttg tcacgtcctg cacgacgcga gctgcggggc 1500
gggggggaac ttcctgacta ggggaggagt agaaggtggc gcgaaggggc caccaaagaa 1560
cggagccggt tggcgcctac cggtggatgt ggaatgtgtg cgaggccaga ggccacttgt 1620
gtagcgccaa gtgcccagcg gggctgctaa agcgcatgct ccagactgcc ttgggaaaag 1680
cgcctcccct acccggtaga atttcgaggt cgacgaattc ggatcc 1726
<210> 14
<211> 847
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 14
gttacttccc ttcgagcctc aatgtcctca tttgtaaaat gacattaata cctactttta 60
gctgtgggaa ttgagtacca tgatttatac aaagcagttt gtatggtgct ggttacatga 120
gagttcagat ggtaactagt tagtaaaaaa tctctagtgt gcttgttgat tttattttat 180
tttagtattt cttaaagatc aaatttaaca tcaatcctaa actttattta gctttttctg 240
gcgcgtaaac taacatacta agttgtgtga ctataattca tttagtgact catttttagc 300
tatttttata acacattgtg ctatgggggg ttttggaact tgctggaagc tacatcagaa 360
actgccatag ttaattgcca tttcaagaat gttgtaaata actcaggtgg ccgtttaatt 420
ctcaatgtaa atataattaa ctagacgtct ttcctatatt tgtgtctcag ttttaaagct 480
atttctggat gcttgagtct taccgtaatt gataacaaaa agaggttatt gagaatatct 540
atgatttaca gagtaagtta ttctagacct caagagtgaa atgtagggga ggagacattt 600
gtgtgttaaa ctaatggaaa tgctcattta atagatattc actgaaagta ttagttttgg 660
tttattgcta gaaaagttga ggttttatgg agatttttgt aaaaaatggt ttatttccta 720
aataaatatc tctttttctt ttttctccca gaaaatgtta atctatgatc cagccaaacg 780
aatttctggc aaaatggcac tgaatcatcc atattttaat gatttggaca atcagattaa 840
gaagatg 847
<210> 15
<211> 4382
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 15
ggttctggcg tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaacccag ggcccatggc cagctacccc tgtcaccagc acgccagcgc cttcgaccag 120
gccgccagaa gcaggggcca cagcaaccgg cggaccgccc tgagacccag gcggcagcag 180
gaagccaccg aagtccggct ggaacagaag atgcccaccc tgttaaccct agaaagatag 240
tctgcgtaaa attgacgcat gcattcttga aatattgctc tctctttcta aatagcgcga 300
atccgtcgct gtgcatttag gacatctcag tcgccgcttg gagctcccgt gaggcgtgct 360
tgtcaatgcg gtaagtgtca ctgattttga actataacga ccgcgtgagt caaaatgacg 420
catgattatc ttttacgtga cttttaagat ttaactcata cgataattat attgttattt 480
catgttctac ttacgtgata acttattata tatatatttt cttgttatag atatcgtggc 540
ggccgcagat ccgaagttcc tatactattt gaagaatagg aacttcagat cccccgggct 600
gcaggatcta ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag 660
cagccccgct gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat 720
ccaccggtag gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc 780
ctcccctagt caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa 840
tggaagtagc acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc 900
gggtaggcct ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga 960
ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg 1020
cccgaaggtc ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc 1080
tgttctcctc ttcctcatct ccgggccttt cgacctgcag caattaatca tcggcatagt 1140
atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 1200
aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 1260
gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 1320
gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 1380
cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 1440
tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 1500
catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 1560
atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 1620
cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 1680
ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 1740
tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 1800
ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 1860
ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 1920
acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 1980
tctgatcgag aaattgatga tctattaaac aataaagatg tccacatgga agtttttcct 2040
gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 2100
gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 2160
tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 2220
aattaagggc cagctcattc ctcccactca tgatctatag atccggtcga cgaagttcct 2280
attcttcaaa tagtatagga acttcggatc tggccggcct agggataaca gggtaatgga 2340
tcccccgggc tgcaggaatt cgatatcaag ctgcgggttt tgttacttta tagaagaaat 2400
tttgagtttt tgtttttttt taataaataa ataaacataa ataaattgtt tgttgaattt 2460
attattagta tgtaagtgta aatataataa aacttaatat ctattcaaat taataaataa 2520
acctcgatat acagaccgat aaaacacatg cgtcaatttt acgcatgatt atctttaacg 2580
tacgtcacaa tatgattatc tttctagggt taagggtgta catcgacggc ccccacggca 2640
tgggcaagac caccaccacc cagctgctgg tggccctggg cagccgggac gacatcgtgt 2700
acgtgcccga gcccatgacc tactggcagg tgctgggcgc cagcgagacc atcgccaaca 2760
tctacaccac acagcacagg ctggaccagg gcgagatctc tgccggcgac gccgccgtgg 2820
tgatgaccag cgcccagatc acaatgggca tgccctacgc cgtgaccgac gccgtgctgg 2880
cccctcacgt gggcggcgag gccggctcta gccacgcccc tccccctgcc ctgaccctga 2940
tcttcgaccg gcaccccatc gcccacctgc tgtgctaccc tgccgccaga tacctgatgg 3000
gcagcatgac cccccaggcc gtgctggcct tcgtggccct gatccccccc accctgcccg 3060
gcaccaacat cgtgctggga gccctgcccg aggaccggca catcgaccgg ctggccaagc 3120
ggcagagacc cggcgagcgg ctggacctgg ccatgctggc cgccatccgg cgggtgtacg 3180
gcctgctggc caacaccgtg agatacctgc agggcggagg gtcttggtgg gaggactggg 3240
gccagctgtc cggcaccgcc gtgccacctc agggcgccga gccccagagc aatgccggcc 3300
ctcggcccca catcggcgac accctgttta ccctgttcag agcccccgag ctgctggccc 3360
ccaacggcga cctgtacaac gtgttcgcct gggccctgga cgtgctggcc aagaggctgc 3420
ggcccatgca cgtgttcatc ctggactacg accagagccc tgccggctgc agggacgccc 3480
tgctgcagct gaccagcggc atggtgcaga cccacgtgac cacccccggc agcatcccca 3540
ccatctgcga cctggcccgg accttcgccc gggagatggg cgaggccaac ggctccggag 3600
agggcagagg aagtctgcta acatgcggtg acgtcgagga gaatcctggc ccactcgaga 3660
tggccacaac catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca 3720
tgcgcttcaa ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg 3780
agggcgaggg ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg 3840
gccccctgcc cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct 3900
acgtgaagca ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca 3960
agtgggagcg cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct 4020
ccctgcagga cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg 4080
acggccccgt aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc 4140
ccgaggacgg cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc 4200
actacgacgc tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg 4260
cctacaacgt caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg 4320
aacagtacga acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt 4380
ag 4382
<210> 16
<211> 931
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 16
ctttctgaca aaaagtttcc atatgttata tcaacagata gttgtgtttt tattgttaac 60
tcttgtctat ttttgtctta tatatatttc tttgttatca aacttcagct gtacttcgtc 120
ttctaatttc aaaaatataa cttaaaaatg taaatattct atatgaattt aaatataatt 180
ctgtaaatgt gtgtaggtct cactgtaaca actatttgtt actataataa aactataata 240
ttgatgtcag gaatcaggaa aaaatttgag ttggcttaaa tcatctcagt ccttatggca 300
gttttatttt cctgtagttg gaactactaa aatttaggaa aatgctaagt tcaagtttcg 360
taatgctttg aagtattttt atgctctgaa tgtttaaatg ttctcatcag tttcttgcca 420
tgttgttaac tatacaacct ggctaaagat gaatattttt ctactggtat tttaattttt 480
gacctaaatg tttaagcatt cggaatgaga aaactataca gatttgagaa atgatgctaa 540
atttatagga gttttcagta acttaaaaag ctaacatgag agcatgccaa aatttgctaa 600
gtcttacaaa gatcaagggc tgtccgcaac agggaagaac agttttgaaa atttatgaac 660
tatcttattt ttaggtaggt tttgaaagct ttttgtctaa gtgaattctt atgccttggt 720
cagagtaata actgaaggag ttgcttatct tggctttcga gtctgagttt aaaactacac 780
attttgacat agtgtttatt agcagccatc taaaaaggct ctaatgtata tttaactaaa 840
attactagct ttgggaatta aactgtttaa caaataatgc tgctcattgt gattcttacc 900
tataagcagc ctaatttgaa ttatttgctg c 931
<210> 17
<211> 1623
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 17
accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct 60
cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg 120
gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg 180
gtaggccttt ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg 240
ctgggaaggg gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc 300
cgaaggtcct ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg 360
ttctcctctt cctcatctcc gggcctttcg acctgcatcc atctagatct cgagcagctg 420
aagcttacca tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 480
agggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 540
gatccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 600
gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 660
acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 720
ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 780
cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 840
ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 900
gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 960
gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 1020
ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg aaaggagcgc acgaccccat 1080
gcatcgatga tatcagatcc ccgggatgca gaaattgatg atctattaaa caataaagat 1140
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 1200
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 1260
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 1320
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 1380
tatagatcta tagatctctc gtgggatcat tgtttttctc ttgattccca ctttgtggtt 1440
ctaagtactg tggtttccaa atgtgtcagt ttcatagcct gaagaacgag atcagcagcc 1500
tctgttccac atacacttca ttctcagtat tgttttgcca agttctaatt ccatcagaag 1560
ctggtcgact ctagatgcgg cgaagttcct attcttcaaa tagtatagga acttcggccg 1620
gcc 1623
<210> 18
<211> 3990
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 18
ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60
gtggagtcca acccagggcc cataacttcg tataatgtat gctatacgaa gttattaggt 120
ctgaagagga gtttacgtcc agccaagcta gcttggctgc aggtcgtcga cggtatcgat 180
aagcttgata tcgagggccc ctgcaggtca attctaccgg gtaggggagg cgcttttccc 240
aaggcagtct ggagcatgcg ctttagcagc cccgctgggc acttggcgct acacaagtgg 300
cctctggcct cgcacacatt ccacatccac cggtaggcgc caaccggctc cgttctttgg 360
tggccccttc gcgccacctt ctactcctcc cctagtcagg aagttccccc ccgccccgca 420
gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt ctcactagtc tcgtgcagat 480
ggacagcacc gctgagcaat ggaagcgggt aggcctttgg ggcagcggcc aatagcagct 540
ttgctccttc gctttctggg ctcagaggct gggaaggggt gggtccgggg gcgggctcag 600
gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc cgaggcccgg cattctgcac 660
gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac 720
ctgcagccaa tatgggatcg gccattgaac aagatggatt gcacgcaggt tctccggccg 780
cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 840
ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 900
ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 960
gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 1020
tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 1080
ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 1140
accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 1200
atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 1260
tcaaggcgcg catgcccgac ggcgatgatc tcgtcgtgac ccatggcgat gcctgcttgc 1320
cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 1380
tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 1440
gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 1500
tcgccttcta tcgccttctt gacgagttct tctgagggga tcgatccgct gtaagtctgc 1560
agaaattgat gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca 1620
tactttgtta agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta 1680
cgggggtggg ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact 1740
attgctttat gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt 1800
aagggccagc tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca 1860
ttgtttttct cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag 1920
tttcatagcc tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta 1980
ttgttttgcc aagttctaat tccatcagaa gctgactcta gagcttggcg cgccataact 2040
tcgtataatg tatgctatac gaagttatct atggccagct acccctgtca ccagcacgcc 2100
agcgccttcg accaggccgc cagaagcagg ggccacagca accggcggac cgccctgaga 2160
cccaggcggc agcaggaagc caccgaagtc cggctggaac agaagatgcc caccctgtta 2220
agggtgtaca tcgacggccc ccacggcatg ggcaagacca ccaccaccca gctgctggtg 2280
gccctgggca gccgggacga catcgtgtac gtgcccgagc ccatgaccta ctggcaggtg 2340
ctgggcgcca gcgagaccat cgccaacatc tacaccacac agcacaggct ggaccagggc 2400
gagatctctg ccggcgacgc cgccgtggtg atgaccagcg cccagatcac aatgggcatg 2460
ccctacgccg tgaccgacgc cgtgctggcc cctcacgtgg gcggcgaggc cggctctagc 2520
cacgcccctc cccctgccct gaccctgatc ttcgaccggc accccatcgc ccacctgctg 2580
tgctaccctg ccgccagata cctgatgggc agcatgaccc cccaggccgt gctggccttc 2640
gtggccctga tcccccccac cctgcccggc accaacatcg tgctgggagc cctgcccgag 2700
gaccggcaca tcgaccggct ggccaagcgg cagagacccg gcgagcggct ggacctggcc 2760
atgctggccg ccatccggcg ggtgtacggc ctgctggcca acaccgtgag atacctgcag 2820
ggcggagggt cttggtggga ggactggggc cagctgtccg gcaccgccgt gccacctcag 2880
ggcgccgagc cccagagcaa tgccggccct cggccccaca tcggcgacac cctgtttacc 2940
ctgttcagag cccccgagct gctggccccc aacggcgacc tgtacaacgt gttcgcctgg 3000
gccctggacg tgctggccaa gaggctgcgg cccatgcacg tgttcatcct ggactacgac 3060
cagagccctg ccggctgcag ggacgccctg ctgcagctga ccagcggcat ggtgcagacc 3120
cacgtgacca cccccggcag catccccacc atctgcgacc tggcccggac cttcgcccgg 3180
gagatgggcg aggccaacgg ctccggagag ggcagaggaa gtctgctaac atgcggtgac 3240
gtcgaggaga atcctggccc actcgagatg gccacaacca tggtgagcaa gggcgaggag 3300
gataacatgg ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg 3360
aacggccacg agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag 3420
accgccaagc tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc 3480
cctcagttca tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac 3540
ttgaagctgt ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc 3600
ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg gcgagttcat ctacaaggtg 3660
aagctgcgcg gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc 3720
tgggaggcct cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag 3780
cagaggctga agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag 3840
gccaagaagc ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc 3900
tcccacaacg aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc 3960
accggcggca tggacgagct gtacaagtag 3990
<210> 19
<211> 3860
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 19
ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60
gtggagtcca acccagggcc cataacttcg tataatgtat gctatacgaa gttattaggt 120
ctgaagagga gtttacgtcc agccaagcta gcttggctgc aggtcgtcga cggtatcggc 180
cgcatctaga gtcgaccagc ttctgatgga attagaactt ggcaaacaat actgagaatg 240
aagtgtatgt ggaacagagg ctgctgatct cgttcttcag gctatgaaac tgacacattt 300
ggaaaccaca gtacttagaa ccacaaagtg ggaatcaaga gaaaaacaat gatcccacga 360
gagatctata gatctataga tcatgagtgg gaggaatgag ctggccctta atttggtttt 420
gcttgtttaa attatgatat ccaactatga aacattatca taaagcaata gtaaagagcc 480
ttcagtaaag agcaggcatt tatctaatcc caccccaccc ccacccccgt agctccaatc 540
cttccattca aaatgtaggt actctgttct cacccttctt aacaaagtat gacaggaaaa 600
acttccattt tagtggacat ctttattgtt taatagatca tcaatttctg catcccgggg 660
atctgatatc atcgatgcat ggggtcgtgc gctcctttcg gtcgggcgct gcgggtcgtg 720
gggcgggcgt caggcaccgg gcttgcgggt catgcaccag gtgcgcggtc cttcgggcac 780
ctcgacgtcg gcggtgacgg tgaagccgag ccgctcgtag aaggggaggt tgcggggcgc 840
ggaggtctcc aggaaggcgg gcaccccggc gcgctcggcc gcctccactc cggggagcac 900
gacggcgctg cccagaccct tgccctggtg gtcgggcgag acgccgacgg tggccaggaa 960
ccacgcgggc tccttgggcc ggtgcggcgc caggaggcct tccatctgtt gctgcgcggc 1020
cagccgggaa ccgctcaact cggccatgcg cgggccgatc tcggcgaaca ccgcccccgc 1080
ttcgacgctc tccggcgtgg tccagaccgc caccgcggcg ccgtcgtccg cgacccacac 1140
cttgccgatg tcgagcccga cgcgcgtgag gaagagttct tgcagctcgg tgacccgctc 1200
gatgtggcgg tccggatcga cggtgtggcg cgtggcgggg tagtcggcga acgcggcggc 1260
gagggtgcgt acggccctgg ggacgtcgtc gcgggtggcg aggcgcaccg tgggcttgta 1320
ctcggtcatg gtaagcttca gctgctcgag atctagatgg atgcaggtcg aaaggcccgg 1380
agatgaggaa gaggagaaca gcgcggcaga cgtgcgcttt tgaagcgtgc agaatgccgg 1440
gcctccggag gaccttcggg cgcccgcccc gcccctgagc ccgcccctga gcccgccccc 1500
ggacccaccc cttcccagcc tctgagccca gaaagcgaag gagcaaagct gctattggcc 1560
gctgccccaa aggcctaccc gcttccattg ctcagcggtg ctgtccatct gcacgagact 1620
agtgagacgt gctacttcca tttgtcacgt cctgcacgac gcgagctgcg gggcgggggg 1680
gaacttcctg actaggggag gagtagaagg tggcgcgaag gggccaccaa agaacggagc 1740
cggttggcgc ctaccggtgg atgtggaatg tgtgcgaggc cagaggccac ttgtgtagcg 1800
ccaagtgccc agcggggctg ctaaagcgca tgctccagac tgccttggga aaagcgcctc 1860
ccctacccgg tagaatttcg aggtcgacga attcggatcg cgccataact tcgtataatg 1920
tatgctatac gaagttatct atggccagct acccctgtca ccagcacgcc agcgccttcg 1980
accaggccgc cagaagcagg ggccacagca accggcggac cgccctgaga cccaggcggc 2040
agcaggaagc caccgaagtc cggctggaac agaagatgcc caccctgtta agggtgtaca 2100
tcgacggccc ccacggcatg ggcaagacca ccaccaccca gctgctggtg gccctgggca 2160
gccgggacga catcgtgtac gtgcccgagc ccatgaccta ctggcaggtg ctgggcgcca 2220
gcgagaccat cgccaacatc tacaccacac agcacaggct ggaccagggc gagatctctg 2280
ccggcgacgc cgccgtggtg atgaccagcg cccagatcac aatgggcatg ccctacgccg 2340
tgaccgacgc cgtgctggcc cctcacgtgg gcggcgaggc cggctctagc cacgcccctc 2400
cccctgccct gaccctgatc ttcgaccggc accccatcgc ccacctgctg tgctaccctg 2460
ccgccagata cctgatgggc agcatgaccc cccaggccgt gctggccttc gtggccctga 2520
tcccccccac cctgcccggc accaacatcg tgctgggagc cctgcccgag gaccggcaca 2580
tcgaccggct ggccaagcgg cagagacccg gcgagcggct ggacctggcc atgctggccg 2640
ccatccggcg ggtgtacggc ctgctggcca acaccgtgag atacctgcag ggcggagggt 2700
cttggtggga ggactggggc cagctgtccg gcaccgccgt gccacctcag ggcgccgagc 2760
cccagagcaa tgccggccct cggccccaca tcggcgacac cctgtttacc ctgttcagag 2820
cccccgagct gctggccccc aacggcgacc tgtacaacgt gttcgcctgg gccctggacg 2880
tgctggccaa gaggctgcgg cccatgcacg tgttcatcct ggactacgac cagagccctg 2940
ccggctgcag ggacgccctg ctgcagctga ccagcggcat ggtgcagacc cacgtgacca 3000
cccccggcag catccccacc atctgcgacc tggcccggac cttcgcccgg gagatgggcg 3060
aggccaacgg ctccggagag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga 3120
atcctggccc actcgagatg gccacaacca tggtgagcaa gggcgaggag gataacatgg 3180
ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg aacggccacg 3240
agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag accgccaagc 3300
tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc cctcagttca 3360
tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac ttgaagctgt 3420
ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga 3480
ccgtgaccca ggactcctcc ctgcaggacg gcgagttcat ctacaaggtg aagctgcgcg 3540
gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct 3600
cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag cagaggctga 3660
agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag gccaagaagc 3720
ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc tcccacaacg 3780
aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc accggcggca 3840
tggacgagct gtacaagtag 3860
<210> 20
<211> 4848
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 20
tccaccggcg gcatggacga gctgtacaag tagctttctg acaaaaagtt tccatatgtt 60
atgtcaacag atagttgtgt ttttattgtt aactcttgtc tatttttgtc ttatatatat 120
ttctttgtta tcaaacttca gctgtacttc gtcttctaat ttcaaaaata taacttaaaa 180
atgtaaatat tctatatgaa tttaaatata attctgtaaa tgtgtgtagg tctcactgta 240
acaactattt gttactataa taaaactata atattgatgt caggaatcag gaaaaaattt 300
gagttggctt aaatcatctc agtccttatg gcagttttat tttcctgtag ttggaactac 360
taaaatttag gaaaatgcta agttcaagtt tcgtaatgct ttgaagtatt tttatgctct 420
gaatgtttaa atgttctcat cagtttcttg ccatgttgtt aactatacaa cctggctaaa 480
gatgaatatt tttctactgg tattttaatt tttgacctaa atgtttaagc attcggaatg 540
agaaaactat acagatttga gaaatgatgc taaatttata ggagttttca gtaacttaaa 600
aagctaacat gagagcatgc caaaatttgc taagtcttac aaagatcaag ggctgtccgc 660
aacagggaag aacagttttg aaaatttatg aactatctta tttttaggta ggttttgaaa 720
gctttttgtc taagtgaatt cttatgcctt ggtcagagta ataactgaag gaggtgctta 780
tcttggcttt cgagtctgag tttaaaacta cacattttga catagtgttt attagcagcc 840
atctaaaaag gctctaatgt atatttaact aaaattacta gctttgggaa ttaaactgtt 900
taacaaataa tgctgctcat tgtgattctt acctataagc agcctaattt gaattatttg 960
ctgcaatcga attcccgcgg ccgccatggc ggccgggagc atgcgacgtc gggcccaatt 1020
cgccctatag tgagtcgtat tacaattcac tggccgtcgt tttacaacgt cgtgactggg 1080
aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc 1140
gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg 1200
aatggacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 1260
gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 1320
cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 1380
atttagtgct ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag 1440
tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 1500
tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga 1560
tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 1620
atttaacgcg aattttaaca aaatattaac gcttacaatt tcctgatgcg gtattttctc 1680
cttacgcatc tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg 1740
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 1800
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 1860
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 1920
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 1980
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2040
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2100
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2160
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2220
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2280
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2340
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 2400
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2460
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2520
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 2580
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2640
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2700
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 2760
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 2820
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 2880
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 2940
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 3000
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 3060
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 3120
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 3180
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 3240
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 3300
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 3360
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 3420
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 3480
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 3540
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 3600
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa 3660
accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga 3720
ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc 3780
ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca 3840
atttcacaca ggaaacagct atgaccatga ttacgccaag ctatttaggt gacactatag 3900
aatactcaag ctatgcatcc aacgcgttgg gagctctccc atatggtcga cctgcaggcg 3960
gccgcgaatt cactagtgat tgttacttcc cttcgagcct caatgtcctc atttgtaaaa 4020
tgacattaat acctactttt agctgtggga attgagtacc atgatttata caaagcagtt 4080
tgtatggtgc tggttacatg agagttcaga tggtaactag ttagtaaaaa atctctagtg 4140
tgcttgttga ttttatttta ttttagtatt tcttaaagat caaatttaac atcaatccta 4200
aactttattt agctttttct ggcgtgtaaa ctaacatact aagttgtgtg actataattc 4260
atttagtgac tcatttttag ctatttttat aacacattgt gctatggggg gttttggaac 4320
ttgctggaag ctacatcaga aactgccata gttaattgcc atttcaagaa tgttgtaaat 4380
aactcaggtg gccgtttaat tctcaatgta aatataatta actagacatc tttcctatat 4440
ttgtgtctca gttttaaagc tatttctgga tgcttgagtc ttaccgtaat tgataacaaa 4500
aagaggttat tgagaatatc tatgatttac agagtaagtt attctagacc tcaagagtga 4560
aatgtagggg aggagacatt tgtgtgttaa actaatggaa atgctcattt aatagatatt 4620
cactgaaagt attagttttg gtttattgct agaaaagttg aggttttatg gagatttttg 4680
taaaaaatgg tttatttcct aaataaatat ctctttttct tttttctccc agaaaatgtt 4740
aatctatgat ccagccaaac gaatttctgg caaaatggca ctgaatcatc catattttaa 4800
tgatttggac aatcagatta agaagatggg atccggttct ggcgtgaa 4848
<210> 21
<211> 8507
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 21
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg taagaagatg tagccctcgt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360
tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420
caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480
cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140
gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200
cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catggactat 1260
aaggaccacg acggagacta caaggatcat gatattgatt acaaagacga tgacgataag 1320
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 1380
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 1440
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 1500
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 1560
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 1620
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 1680
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 1740
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 1800
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 1860
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 1920
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1980
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 2040
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 2100
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 2160
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 2220
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 2280
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 2340
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 2400
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 2460
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 2520
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 2580
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 2640
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 2700
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 2760
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 2820
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 2880
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 2940
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 3000
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 3060
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 3120
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 3180
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 3240
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 3300
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 3360
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 3420
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 3480
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 3540
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 3600
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 3660
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 3720
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 3780
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 3840
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 3900
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 3960
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 4020
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 4080
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 4140
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 4200
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 4260
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 4320
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 4380
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 4440
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 4500
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 4560
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 4620
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 4680
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 4740
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 4800
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 4860
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 4920
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4980
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 5040
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 5100
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 5160
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 5220
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 5280
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 5340
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 5400
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 5460
ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 5520
taagaattcc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg 5580
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 5640
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 5700
gtggggtggg gcaggacagc aagggggagg attgggaaga gaatagcagg catgctgggg 5760
agcggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 5820
tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 5880
tgagcgagcg agcgcgcagc tgcctgcagg ggcgcctgat gcggtatttt ctccttacgc 5940
atctgtgcgg tatttcacac cgcatacgtc aaagcaacca tagtacgcgc cctgtagcgg 6000
cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 6060
cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 6120
ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 6180
cgaccccaaa aaacttgatt tgggtgatgg ttcacgtagt gggccatcgc cctgatagac 6240
ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 6300
tggaacaaca ctcaacccta tctcgggcta ttcttttgat ttataaggga ttttgccgat 6360
ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 6420
aatattaacg tttacaattt tatggtgcac tctcagtaca atctgctctg atgccgcata 6480
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6540
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6600
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6660
ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt 6720
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 6780
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 6840
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 6900
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 6960
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 7020
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 7080
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 7140
agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 7200
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 7260
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 7320
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 7380
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 7440
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 7500
tggctggttt attgctgata aatctggagc cggtgagcgt ggaagccgcg gtatcattgc 7560
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 7620
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 7680
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 7740
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 7800
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 7860
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 7920
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 7980
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 8040
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 8100
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 8160
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 8220
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 8280
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 8340
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 8400
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 8460
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgt 8507
<210> 22
<211> 8507
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 22
catatacgat acaaggctgt tagagagata attggaatta atttgactgt aaacacaaag 60
atattagtac aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta 120
aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc 180
ttggctttat atatcttgtg gaaaggacga aacaccgaca gggacatcca tccaggtttt 240
agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 300
cgagtcggtg cttttttgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 360
ttttagcgcg tgcgccaatt ctgcagacaa atggctctag aggtacccgt tacataactt 420
acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaatagta 480
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 540
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 600
aaatggcccg cctggcattg tgcccagtac atgaccttat gggactttcc tacttggcag 660
tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc 720
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 780
ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg 840
ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg 900
ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc 960
gcgcggcggg cgggagtcgc tgcgacgctg ccttcgcccc gtgccccgct ccgccgccgc 1020
ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga gcgggcggga 1080
cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta agggatggtt 1140
ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca 1200
ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa ggatcatgat 1260
attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa ggtcggtatc 1320
cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg caccaactct 1380
gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt caaggtgctg 1440
ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct gttcgacagc 1500
ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata caccagacgg 1560
aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa ggtggacgac 1620
agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa gcacgagcgg 1680
caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta ccccaccatc 1740
taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg gctgatctat 1800
ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg cgacctgaac 1860
cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta caaccagctg 1920
ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct gtctgccaga 1980
ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga gaagaagaat 2040
ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt caagagcaac 2100
ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga cgacgacctg 2160
gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc cgccaagaac 2220
ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat caccaaggcc 2280
cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct gaccctgctg 2340
aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt cgaccagagc 2400
aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt ctacaagttc 2460
atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa gctgaacaga 2520
gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca ccagatccac 2580
ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt cctgaaggac 2640
aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt gggccctctg 2700
gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac catcaccccc 2760
tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat cgagcggatg 2820
accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag cctgctgtac 2880
gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga gggaatgaga 2940
aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct gttcaagacc 3000
aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat cgagtgcttc 3060
gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg cacataccac 3120
gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa cgaggacatt 3180
ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat cgaggaacgg 3240
ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa gcggcggaga 3300
tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga caagcagtcc 3360
ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa cttcatgcag 3420
ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca ggtgtccggc 3480
cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc cattaagaag 3540
ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg ccggcacaag 3600
cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa gggacagaag 3660
aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg cagccagatc 3720
ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta cctgtactac 3780
ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg gctgtccgac 3840
tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat cgacaacaag 3900
gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc cgaagaggtc 3960
gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat tacccagaga 4020
aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga taaggccggc 4080
ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc acagatcctg 4140
gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga agtgaaagtg 4200
atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt ttacaaagtg 4260
cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt cgtgggaacc 4320
gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga ctacaaggtg 4380
tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc taccgccaag 4440
tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct ggccaacggc 4500
gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat cgtgtgggat 4560
aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt gaatatcgtg 4620
aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc caagaggaac 4680
agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg cggcttcgac 4740
agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg caagtccaag 4800
aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag cagcttcgag 4860
aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa ggacctgatc 4920
atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag aatgctggcc 4980
tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata tgtgaacttc 5040
ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa tgagcagaaa 5100
cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca gatcagcgag 5160
ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc cgcctacaac 5220
aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct gtttaccctg 5280
accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga ccggaagagg 5340
tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat caccggcctg 5400
tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc ggccacgaaa 5460
aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga tcagcctcga 5520
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 5580
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 5640
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 5700
gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg atggagttgg 5760
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 5820
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc 5880
gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atacgtcaaa 5940
gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 6000
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 6060
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 6120
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg gtgatggttc 6180
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 6240
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cgggctattc 6300
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 6360
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat ggtgcactct 6420
cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 6480
tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 6540
ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa 6600
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 6660
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 6720
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 6780
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 6840
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 6900
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 6960
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 7020
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 7080
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 7140
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 7200
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 7260
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 7320
tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 7380
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 7440
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 7500
tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 7560
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 7620
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 7680
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 7740
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7800
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7860
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7920
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt 7980
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 8040
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 8100
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 8160
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 8220
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 8280
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 8340
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 8400
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 8460
ttttgctcac atgtgagggc ctatttccca tgattccttc atatttg 8507
<210> 23
<211> 35
<212> DNA
<213> Mus musculus
<400> 23
acagggacat ccatccagag ggctacatct tctta 35
<210> 24
<211> 8509
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 24
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ctatctgttg acataacata gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttgttttaga 360
gctagaaata gcaagttaaa ataaggctag tccgttttta gcgcgtgcgc caattctgca 420
gacaaatggc tctagaggta cccgttacat aacttacggt aaatggcccg cctggctgac 480
cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc aatagggact ttccattgac 540
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 600
tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattgtgccc 660
agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 720
ttaccatggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 780
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 840
gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc 900
ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga 960
ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcga 1020
cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga 1080
ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat 1140
tagctgagca agaggtaagg gtttaaggga tggttggttg gtggggtatt aatgtttaat 1200
tacctggagc acctgcctga aatcactttt tttcaggttg gaccggtgcc accatggact 1260
ataaggacca cgacggagac tacaaggatc atgatattga ttacaaagac gatgacgata 1320
agatggcccc aaagaagaag cggaaggtcg gtatccacgg agtcccagca gccgacaaga 1380
agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg atcaccgacg 1440
agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg cacagcatca 1500
agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag gccacccggc 1560
tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc tatctgcaag 1620
agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga ctggaagagt 1680
ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc aacatcgtgg 1740
acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag aaactggtgg 1800
acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac atgatcaagt 1860
tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac gtggacaagc 1920
tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc atcaacgcca 1980
gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga cggctggaaa 2040
atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac ctgattgccc 2100
tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag gatgccaaac 2160
tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc cagatcggcg 2220
accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc ctgctgagcg 2280
acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct atgatcaaga 2340
gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc 2400
ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc ggctacattg 2460
acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg gaaaagatgg 2520
acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg aagcagcgga 2580
ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac gccattctgc 2640
ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc gagaagatcc 2700
tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc agattcgcct 2760
ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa gtggtggaca 2820
agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag aacctgccca 2880
acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg tataacgagc 2940
tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg agcggcgagc 3000
agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 3060
tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg 3120
aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt atcaaggaca 3180
aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg ctgaccctga 3240
cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc cacctgttcg 3300
acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc 3360
ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg gatttcctga 3420
agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac agcctgacct 3480
ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg cacgagcaca 3540
ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca gtgaaggtgg 3600
tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg atcgaaatgg 3660
ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga 3720
tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc gtggaaaaca 3780
cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg gatatgtacg 3840
tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat atcgtgcctc 3900
agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc gacaagaacc 3960
ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag aactactggc 4020
ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg accaaggccg 4080
agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag ctggtggaaa 4140
cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac actaagtacg 4200
acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc aagctggtgt 4260
ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac taccaccacg 4320
cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc 4380
tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag atgatcgcca 4440
agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc aacatcatga 4500
actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg cctctgatcg 4560
agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt gccaccgtgc 4620
ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg 4680
gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc gccagaaaga 4740
aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc tattctgtgc 4800
tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg aaagagctgc 4860
tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac tttctggaag 4920
ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag tactccctgt 4980
tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg cagaagggaa 5040
acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc cactatgaga 5100
agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa cagcacaagc 5160
actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg atcctggccg 5220
acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag cccatcagag 5280
agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc cctgccgcct 5340
tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa gaggtgctgg 5400
acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc gacctgtctc 5460
agctgggagg cgacaaaagg ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa 5520
agtaagaatt cctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc 5580
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 5640
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 5700
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gagaatagca ggcatgctgg 5760
ggagcggccg caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 5820
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 5880
agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt ttctccttac 5940
gcatctgtgc ggtatttcac accgcatacg tcaaagcaac catagtacgc gccctgtagc 6000
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 6060
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 6120
ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 6180
ctcgacccca aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag 6240
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 6300
actggaacaa cactcaaccc tatctcgggc tattcttttg atttataagg gattttgccg 6360
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 6420
aaaatattaa cgtttacaat tttatggtgc actctcagta caatctgctc tgatgccgca 6480
tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 6540
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 6600
ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 6660
taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 6720
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 6780
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 6840
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 6900
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 6960
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 7020
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 7080
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 7140
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 7200
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 7260
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 7320
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 7380
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 7440
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 7500
gctggctggt ttattgctga taaatctgga gccggtgagc gtggaagccg cggtatcatt 7560
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 7620
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 7680
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 7740
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 7800
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 7860
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 7920
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 7980
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 8040
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 8100
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 8160
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 8220
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 8280
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 8340
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 8400
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 8460
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgt 8509
<210> 25
<211> 9177
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 25
ctggcctttt gctcacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac 60
gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag 120
tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat 180
gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt 240
tatatatctt gtggaaagga cgaaacaccg ctatctgttg acataacata gttttagagc 300
tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 360
cggtgctttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgttttta 420
gcgcgtgcgc caattctgca gacaaatggc tctagaggta cccgttacat aacttacggt 480
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc 540
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 600
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 660
gcccgcctgg cattgtgccc agtacatgac cttatgggac tttcctactt ggcagtacat 720
ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc cccacgttct gcttcactct 780
ccccatctcc cccccctccc cacccccaat tttgtattta tttatttttt aattattttg 840
tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 900
ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 960
aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 1020
gcgggcggga gtcgctgcga cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 1080
gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 1140
cttctcctcc gggctgtaat tagctgagca agaggtaagg gtttaaggga tggttggttg 1200
gtggggtatt aatgtttaat tacctggagc acctgcctga aatcactttt tttcaggttg 1260
gaccggtgcc accatggact ataaggacca cgacggagac tacaaggatc atgatattga 1320
ttacaaagac gatgacgata agatggcccc aaagaagaag cggaaggtcg gtatccacgg 1380
agtcccagca gccgacaaga agtacagcat cggcctggac atcggcacca actctgtggg 1440
ctgggccgtg atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa 1500
caccgaccgg cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga 1560
aacagccgag gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa 1620
ccggatctgc tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt 1680
cttccacaga ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc 1740
catcttcggc aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca 1800
cctgagaaag aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc 1860
cctggcccac atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga 1920
caacagcgac gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga 1980
ggaaaacccc atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag 2040
caagagcaga cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct 2100
gttcggaaac ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga 2160
cctggccgag gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa 2220
cctgctggcc cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc 2280
cgacgccatc ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct 2340
gagcgcctct atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc 2400
tctcgtgcgg cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa 2460
cggctacgcc ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa 2520
gcccatcctg gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga 2580
cctgctgcgg aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg 2640
agagctgcac gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg 2700
ggaaaagatc gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag 2760
gggaaacagc agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa 2820
cttcgaggaa gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa 2880
cttcgataag aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta 2940
cttcaccgtg tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc 3000
cgccttcctg agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg 3060
gaaagtgacc gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc 3120
cgtggaaatc tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct 3180
gctgaaaatt atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga 3240
agatatcgtg ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa 3300
aacctatgcc cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac 3360
cggctggggc aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa 3420
gacaatcctg gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat 3480
ccacgacgac agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg 3540
cgatagcctg cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat 3600
cctgcagaca gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga 3660
gaacatcgtg atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag 3720
ccgcgagaga atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa 3780
agaacacccc gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca 3840
gaatgggcgg gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga 3900
tgtggaccat atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct 3960
gaccagaagc gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa 4020
gaagatgaag aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt 4080
cgacaatctg accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat 4140
caagagacag ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc 4200
ccggatgaac actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac 4260
cctgaagtcc aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga 4320
gatcaacaac taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct 4380
gatcaaaaag taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga 4440
cgtgcggaag atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt 4500
cttctacagc aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat 4560
ccggaagcgg cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg 4620
ccgggatttt gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa 4680
gaccgaggtg cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga 4740
taagctgatc gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc 4800
caccgtggcc tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact 4860
gaagagtgtg aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa 4920
tcccatcgac tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa 4980
gctgcctaag tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc 5040
cggcgaactg cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta 5100
cctggccagc cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct 5160
gtttgtggaa cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc 5220
caagagagtg atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca 5280
ccgggataag cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa 5340
tctgggagcc cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac 5400
cagcaccaaa gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga 5460
gacacggatc gacctgtctc agctgggagg cgacaaaagg ccggcggcca cgaaaaaggc 5520
cggccaggca aaaaagaaaa aggaattcgg cagtggagag ggcagaggaa gtctgctaac 5580
atgcggtgac gtcgaggaga atcctggccc aatgaccgag tacaagccca cggtgcgcct 5640
cgccacccgc gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta 5700
ccccgccacg cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca 5760
agaactcttc ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg 5820
cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga 5880
gatcggcccg cgcatggccg agttgagcgg ttcccggctg gccgcgcagc aacagatgga 5940
aggcctcctg gcgccgcacc ggcccaagga gcccgcgtgg ttcctggcca ccgtcggagt 6000
ctcgcccgac caccagggca agggtctggg cagcgccgtc gtgctccccg gagtggaggc 6060
ggccgagcgc gccggggtgc ccgccttcct ggagacctcc gcgccccgca acctcccctt 6120
ctacgagcgg ctcggcttca ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac 6180
ctggtgcatg acccgcaagc ccggtgcctg agaattctaa ctagagctcg ctgatcagcc 6240
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 6300
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 6360
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 6420
gattgggaag agaatagcag gcatgctggg gagcggccgc aggaacccct agtgatggag 6480
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 6540
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag 6600
gggcgcctga tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt 6660
caaagcaacc atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta 6720
cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc 6780
cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt 6840
tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg 6900
gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca 6960
cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct 7020
attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga 7080
tttaacaaaa atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca 7140
ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac 7200
ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga 7260
ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac 7320
gaaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 7380
agacgtcagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct 7440
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 7500
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 7560
cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 7620
aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 7680
ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat 7740
gtggcgcggt attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact 7800
attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca 7860
tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact 7920
tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg 7980
atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg 8040
agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg 8100
aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg 8160
caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag 8220
ccggtgagcg tggaagccgc ggtatcattg cagcactggg gccagatggt aagccctccc 8280
gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga 8340
tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat 8400
atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc 8460
tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 8520
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 8580
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 8640
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 8700
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 8760
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 8820
tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 8880
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 8940
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 9000
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 9060
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 9120
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gcctttt 9177
<210> 26
<211> 21
<212> DNA
<213> Homo sapiens
<400> 26
ccatatgtta tatcaacaga t 21
<210> 27
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 27
ggttggtcat tgactgttga gg 22
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 28
gtgctggtga caggggtagc 20
<210> 29
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 29
atggccacaa ccatggtgag caag 24
<210> 30
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 30
cctcctgcat ttgctggagt caggg 25
<210> 31
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 31
tgatggattc gggcaagttt ct 22
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 32
acatcggcaa ggtgtgggtc 20
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 33
accgagatcc tccaaacagt agaca 25
<210> 34
<211> 14437
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<220>
<221> misc_feature
<222> (8819)..(8821)
<223> n is a, c, g, or t
<400> 34
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 60
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 120
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 180
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 240
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 300
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 360
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 420
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 480
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 540
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 600
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 660
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 720
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 780
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 840
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 900
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 960
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 1020
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 1080
gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 1140
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 1200
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 1260
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 1320
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 1380
gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag 1440
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 1500
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 1560
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 1620
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 1680
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1740
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 1800
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa gaattctcat 1860
gtttgacagc ttatcatcga taagctgatc ctcacaggcc gcacccagct tttcttccgt 1920
tgccccagta gcatctctgt ctggtgacct tgaagaggaa gaggaggggt cccgagaatc 1980
cccatcccta ccgtccagca aaaaggggga cgaggaattt gaggcctggc ttgaggctca 2040
ggacgcaaat cttgaggatg ttcagcggga gttttccggg ctgcgagtaa ttggtgatga 2100
ggacgaggat ggttcggagg atggggaatt ttcagacctg gatctgtctg acagcgacca 2160
tgaaggggat gagggtgggg gggctgttgg agggggcagg agtctgcact ccctgtattc 2220
actgagcgtc gtctaataaa gatgtctatt gatctctttt agtgtgaatc atgtctgacg 2280
aggggccagg tacaggacct ggaaatggcc taggagagaa gggagacaca tctggaccag 2340
aaggctccgg cggcagtgga cctcaaagaa gagggggtga taaccatgga cgaggacggg 2400
gaagaggacg aggacgagga ggcggaagac caggagcccc gggcggctca ggatcagggc 2460
caagacatag agatggtgtc cggagacccc aaaaacgtcc aagttgcatt ggctgcaaag 2520
ggacccacgg tggaacagga gcaggagcag gagcgggagg ggcaggagca ggaggggcag 2580
gagcaggagg aggggcagga gcaggaggag gggcaggagg ggcaggaggg gcaggagggg 2640
caggagcagg aggaggggca ggagcaggag gaggggcagg aggggcagga ggggcaggag 2700
caggaggagg ggcaggagca ggaggagggg caggaggggc aggagcagga ggaggggcag 2760
gaggggcagg aggggcagga gcaggaggag gggcaggagc aggaggaggg gcaggagggg 2820
caggagcagg aggaggggca ggaggggcag gaggggcagg agcaggagga ggggcaggag 2880
caggaggggc aggaggggca ggaggggcag gagcaggagg ggcaggagca ggaggagggg 2940
caggaggggc aggaggggca ggagcaggag gggcaggagc aggaggggca ggagcaggag 3000
gggcaggagc aggaggggca ggaggggcag gagcaggagg ggcaggaggg gcaggagcag 3060
gaggggcagg aggggcagga gcaggaggag gggcaggagg ggcaggagca ggaggagggg 3120
caggaggggc aggagcagga ggggcaggag gggcaggagc aggaggggca ggaggggcag 3180
gagcaggagg ggcaggaggg gcaggagcag gaggaggggc aggagcagga ggggcaggag 3240
caggaggtgg aggccggggt cgaggaggca gtggaggccg gggtcgagga ggtagtggag 3300
gccggggtcg aggaggtagt ggaggccgcc ggggtagagg acgtgaaaga gccagggggg 3360
gaagtcgtga aagagccagg gggagaggtc gtggacgtgg agaaaagagg cccaggagtc 3420
ccagtagtca gtcatcatca tccgggtctc caccgcgcag gccccctcca ggtagaaggc 3480
catttttcca ccctgtaggg gaagccgatt attttgaata ccaccaagaa ggtggcccag 3540
atggtgagcc tgacgtgccc ccgggagcga tagagcaggg ccccgcagat gacccaggag 3600
aaggcccaag cactggaccc cggggtcagg gtgatggagg caggcgcaaa aaaggagggt 3660
ggtttggaaa gcatcgtggt caaggaggtt ccaacccgaa atttgagaac attgcagaag 3720
gtttaagagc tctcctggct aggagtcacg tagaaaggac taccgacgaa ggaacttggg 3780
tcgccggtgt gttcgtatat ggaggtagta agacctccct ttacaaccta aggcgaggaa 3840
ctgcccttgc tattccacaa tgtcgtctta caccattgag tcgtctcccc tttggaatgg 3900
cccctggacc cggcccacaa cctggcccgc taagggagtc cattgtctgt tatttcatgg 3960
tctttttaca aactcatata tttgctgagg ttttgaagga tgcgattaag gaccttgtta 4020
tgacaaagcc cgctcctacc tgcaatatca gggtgactgt gtgcagcttt gacgatggag 4080
tagatttgcc tccctggttt ccacctatgg tggaaggggc tgccgcggag ggtgatgacg 4140
gagatgacgg agatgaagga ggtgatggag atgagggtga ggaagggcag gagtgatgta 4200
acttgttagg agacgccctc aatcgtatta aaagccgtgt attcccccgc actaaagaat 4260
aaatccccag tagacatcat gcgtgctgtt ggtgtatttc tggccatctg tcttgtcacc 4320
attttcgtcc tcccaacatg gggcaattgg gcatacccat gttgtcacgt cactcagctc 4380
cgcgctcaac accttctcgc gttggaaaac attagcgaca tttacctggt gagcaatcag 4440
acatgcgacg gctttagcct ggcctcctta aattcaccta agaatgggag caaccagcag 4500
gaaaaggaca agcagcgaaa attcacgccc ccttgggagg tggcggcata tgcaaaggat 4560
agcactccca ctctactact gggtatcata tgctgactgt atatgcatga ggatagcata 4620
tgctacccgg atacagatta ggatagcata tactacccag atatagatta ggatagcata 4680
tgctacccag atatagatta ggatagccta tgctacccag atataaatta ggatagcata 4740
tactacccag atatagatta ggatagcata tgctacccag atatagatta ggatagccta 4800
tgctacccag atatagatta ggatagcata tgctacccag atatagatta ggatagcata 4860
tgctatccag atatttgggt agtatatgct acccagatat aaattaggat agcatatact 4920
accctaatct ctattaggat agcatatgct acccggatac agattaggat agcatatact 4980
acccagatat agattaggat agcatatgct acccagatat agattaggat agcctatgct 5040
acccagatat aaattaggat agcatatact acccagatat agattaggat agcatatgct 5100
acccagatat agattaggat agcctatgct acccagatat agattaggat agcatatgct 5160
atccagatat ttgggtagta tatgctaccc atggcaacat tagcccaccg tgctctcagc 5220
gacctcgtga atatgaggac caacaaccct gtgcttggcg ctcaggcgca agtgtgtgta 5280
atttgtcctc cagatcgcag caatcgcgcc cctatcttgg cccgcccacc tacttatgca 5340
ggtattcccc ggggtgccat tagtggtttt gtgggcaagt ggtttgaccg cagtggttag 5400
cggggttaca atcagccaag ttattacacc cttattttac agtccaaaac cgcagggcgg 5460
cgtgtggggg ctgacgcgtg cccccactcc acaatttcaa aaaaaagagt ggccacttgt 5520
ctttgtttat gggccccatt ggcgtggagc cccgtttaat tttcgggggt gttagagaca 5580
accagtggag tccgctgctg tcggcgtcca ctctctttcc ccttgttaca aatagagtgt 5640
aacaacatgg ttcacctgtc ttggtccctg cctgggacac atcttaataa ccccagtatc 5700
atattgcact aggattatgt gttgcccata gccataaatt cgtgtgagat ggacatccag 5760
tctttacggc ttgtccccac cccatggatt tctattgtta aagatattca gaatgtttca 5820
ttcctacact agtatttatt gcccaagggg tttgtgaggg ttatattggt gtcatagcac 5880
aatgccacca ctgaaccccc cgtccaaatt ttattctggg ggcgtcacct gaaaccttgt 5940
tttcgagcac ctcacataca ccttactgtt cacaactcag cagttattct attagctaaa 6000
cgaaggagaa tgaagaagca ggcgaagatt caggagagtt cactgcccgc tccttgatct 6060
tcagccactg cccttgtgac taaaatggtt cactaccctc gtggaatcct gaccccatgt 6120
aaataaaacc gtgacagctc atggggtggg agatatcgct gttccttagg acccttttac 6180
taaccctaat tcgatagcat atgcttcccg ttgggtaaca tatgctattg aattagggtt 6240
agtctggata gtatatacta ctacccggga agcatatgct acccgtttag ggttaacaag 6300
ggggccttat aaacactatt gctaatgccc tcttgagggt ccgcttatcg gtagctacac 6360
aggcccctct gattgacgtt ggtgtagcct cccgtagtct tcctgggccc ctgggaggta 6420
catgtccccc agcattggtg taagagcttc agccaagagt tacacataaa ggcaatgttg 6480
tgttgcagtc cacagactgc aaagtctgct ccaggatgaa agccactcag tgttggcaaa 6540
tgtgcacatc catttataag gatgtcaact acagtcagag aacccctttg tgtttggtcc 6600
ccccccgtgt cacatgtgga acagggccca gttggcaagt tgtaccaacc aactgaaggg 6660
attacatgca ctgccccgcg aagaaggggc agagatgtcg tagtcaggtt tagttcgtcc 6720
ggggcgggga tcgatcctct agagtcgact agtaacggcc gccagtgtgc tggaattcgg 6780
cttacaagtt tgtacaaaaa agcaggctag ctcactcatt aggcacccca ggctttacac 6840
tttatgcttc cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga 6900
aacagctatg accatgatta cgccaagctt gcatgcctgc aggtcgacat tgattattga 6960
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 7020
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 7080
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 7140
aatgggtgga ctatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 7200
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 7260
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 7320
ccatgggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 7380
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 7440
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 7500
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 7560
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgttgcc 7620
ttcgccccgt gccccgctcc gcgccgcctc gcgccgcccg ccccggctct gactgaccgc 7680
gttactccca caggtgagcg ggcgggacgg cccttctcct ccgggctgta attagcgctt 7740
ggtttaatga cggctcgttt cttttctgtg gctgcgtgaa agccttaaag ggctccggga 7800
gggccctttg tgcggggggg agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga 7860
gcgccgcgtg cggcccgcgc tgcccggcgg ctgtgagcgc tgcgggcgcg gcgcggggct 7920
ttgtgcgctc cgcgtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 7980
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 8040
gtgtgggcgc ggcggtcggg ctgtaacccc cccctgcacc cccctccccg agttgctgag 8100
cacggcccgg cttcgggtgc ggggctccgt gcggggcgtg gcgcggggct cgccgtgccg 8160
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 8220
ggctcggggg aggggcgcgg cggccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 8280
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 8340
tctggcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc gcgggcgaag 8400
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 8460
cgtccccttc tccatctcca gcctcggggc tgccgcaggg ggacggctgc cttcgggggg 8520
gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta 8580
accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttgttgtgc 8640
tgtctcatca ttttggcaaa gaattccttc tagaggatcc ccgggtaccg agctcgaccc 8700
aacttttcta tactctatac aaagttggtc agtcagaaac aactttggca catatcaata 8760
ttatgctctc gttaattaac tcgaggtaaa acttaagctt ggtaccgagc tcggatccnn 8820
natgggtagt tctttagacg atgagcatat cctctctgct cttctgcaaa gcgatgacga 8880
gcttgttggt gaggattctg acagtgaaat atcagatcac gtaagtgaag atgacgtcca 8940
gagcgataca gaagaagcgt ttatagatga ggtacatgaa gtgcagccaa cgtcaagcgg 9000
tagtgaaata ttagacgaac aaaatgttat tgaacaacca ggttcttcat tggcttctaa 9060
cagaatcttg accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac 9120
ttcaaagtcc acgaggcgta gccgagtctc tgcactgaac attgtcagat ctcaaagagg 9180
tccgacgcgt atgtgccgca atatatatga cccactttta tgcttcaaac tattttttac 9240
tgatgagata atttcggaaa ttgtaaaatg gacaaatgct gagatatcat tgaaacgtcg 9300
ggaatctatg acaggtgcta catttcgtga cacgaatgaa gatgaaatct atgctttctt 9360
tggtattctg gtaatgacag cagtgagaaa agataaccac atgtccacag atgacctctt 9420
tgatcgatct ttgtcaatgg tgtacgtctc tgtaatgagt cgtgatcgtt ttgatttttt 9480
gatacgatgt cttagaatgg atgacaaaag tatacggccc acacttcgag aaaacgatgt 9540
atttactcct gttagaaaaa tatgggatct ctttatccat cagtgcatac aaaattacac 9600
tccaggggct catttgacca tagatgaaca gttacttggt tttagaggac ggtgtccgtt 9660
taggatgtat atcccaaaca agccaagtaa gtatggaata aaaatcctca tgatgtgtga 9720
cagtggtacg aagtatatga taaatggaat gccttatttg ggaagaggaa cacagaccaa 9780
cggagtacca ctcggtgaat actacgtgaa ggagttatca aagcctgtgc acggtagttg 9840
tcgtaatatt acgtgtgaca attggttcac ctcaatccct ttggcaaaaa acttactaca 9900
agaaccgtat aagttaacca ttgtgggaac cgtgcgatca aacaaacgcg agataccgga 9960
agtactgaaa aacagtcgct ccaggccagt gggaacatcg atgttttgtt ttgacggacc 10020
ccttactctc gtctcatata aaccgaagcc agctaagatg gtatacttat tatcatcttg 10080
tgatgaggat gcttctatca acgaaagtac cggtaaaccg caaatggtta tgtattataa 10140
tcaaactaaa ggcggagtgg acacgctaga ccaaatgtgt tctgtgatga cctgcagtag 10200
gaagacgaat aggtggccta tggcattatt gtacggaatg ataaacattg cctgcataaa 10260
ttcttttatt atatacagcc ataatgtcag tagcaaggga gaaaaggttc aaagtcgcaa 10320
aaaatttatg agaaaccttt acatgagcct gacgtcatcg tttatgcgta agcgtttaga 10380
agctcctact ttgaagagat atttgcgcga taatatctct aatattttgc caaatgaagt 10440
gcctggtaca tcagatgaca gtactgaaga gccagtaatg aaaaaacgta cttactgtac 10500
ttactgcccc tctaaaataa ggcgaaaggc aaatgcatcg tgcaaaaaat gcaaaaaagt 10560
tatttgtcga gagcataata ttgatatgtg ccaaagttgt ttctgactgc ggccgcacta 10620
gtctagagcg atcgcccggg tttaaacgct agcaacaagc tcgtcatcgc tttgcagaag 10680
agcacaactt tgtataataa agttgagcta aaacgcggcc tcgaatcgaa ttccgccccc 10740
ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 10800
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 10860
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 10920
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 10980
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 11040
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 11100
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 11160
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 11220
gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 11280
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat gaccgagtac 11340
aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg caccctcgcc 11400
gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg ccacatcgag 11460
cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat cggcaaggtg 11520
tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag cgtcgaagcg 11580
ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc ccggctggcc 11640
gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc cgcgtggttc 11700
ctggccaccg tcggcgtctc gcccgaccac cagggcaagg gtctgggcag cgccgtcgtg 11760
ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga gacctccgcg 11820
ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga cgtcgaggtg 11880
cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg cccgccccac 11940
gacccgcagc gcccgaccga aaggagcgca cgaccccatg catcgatgat ctagagctcg 12000
ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 12060
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 12120
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 12180
caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 12240
ttctgaggcg gaaagaatac ccagctttct tgtacaaagt ggtaagccga attctgcaga 12300
ttcgactagc ttggcacgcc agaaatccgc gcggtggttt ttgggggtcg ggggtgtttg 12360
gcagccacag acgcccggtg ttcgtgtcgc gccagtacat gcggtccatg cccaggccat 12420
ccaaaaacca tgggtctgtc tgctcagtcc agtcgtggac ctgaccccac gcaacgccca 12480
aaataataac ccccacgaac cataaaccat tccccatggg ggaccccgtc cctaacccac 12540
ggggccagtg gctatggcag ggcctgccgc cccgacgttg gctgcgagcc ctgggccttc 12600
acccgaactt ggggggtggg gtggggaaaa ggaagaaacg cgggcgtatt ggccccaatg 12660
gggtctcggt ggggtatcga cagagtgcca gccctgggac cgaaccccgc gtttatgaac 12720
aaacgaccca acacccgtgc gttttattct gtctttttat tgccgtcata gcgcgggttc 12780
cttccggtat tgtctccttc cgtgtttcag ttagcctccc ccatctcccg atccggacga 12840
gtgctggggc gtcggtttcc actatcggcg agtacttcta cacagccatc ggtccagacg 12900
gccgcgcttc tgcgggcgat ttgtgtacgc ccgacagtcc cggctccgga tcggacgatt 12960
gcgtcgcatc gaccctgcgc ccaagctgca tcatcgaaat tgccgtcaac caagctctga 13020
tagagttggt caagaccaat gcggagcata tacgcccgga gccgcggcga tcctgcaagc 13080
tccggatgcc tccgctcgaa gtagcgcgtc tgctgctcca tacaagccaa ccacggcctc 13140
cagaagaaga tgttggcgac ctcgtattgg gaatccccga acatcgcctc gctccagtca 13200
atgaccgctg ttatgcggcc attgtccgtc aggacattgt tggagccgaa atccgcgtgc 13260
acgaggtgcc ggacttcggg gcagtcctcg gcccaaagca tcagctcatc gagagcctgc 13320
gcgacggacg cactgacggt gtcgtccatc acagtttgcc agtgatacac atggggatca 13380
gcaatcgcgc atatgaaatc acgccatgta gtgtattgac cgattccttg cggtccgaat 13440
gggccgaacc cgctcgtctg gctaagatcg gccgcagcga tcgcatccat ggcctccgcg 13500
accggctgca gaacagcggg cagttcggtt tcaggcaggt cttgcaacgt gacaccctgt 13560
gcacggcggg agatgcaata ggtcaggctc tcgctgaatt ccccaatgtc aagcacttcc 13620
ggaatcggga gcgcggccga tgcaaagtgc cgataaacat aacgatcttt gtagaaacca 13680
tcggcgcagc tatttacccg caggacatat ccacgccctc ctacatcgaa gctgaaagca 13740
cgagattctt cgccctccga gagctgcatc aggtcggaga cgctgtcgaa cttttcgatc 13800
agaaacttct cgacagacgt cgcggtgagt tcaggctttt tcatatctca ttgccccccg 13860
ggatctgcgg cacgctgttg acgctgttaa gcgggtcgct gcagggtcgc tcggtgttcg 13920
aggccacacg cgtcacctta atatgcgaag tggacctcgg accgcgccgc cccgactgca 13980
tctgcgtgtt cgaattcgcc aatgacaaga cgctgggcgg ggtttgtgtc atcatagaac 14040
taaagacatg caaatatatt tcttccgggg acaccgccag caaacgcgag caacgggcca 14100
cggggatgaa gcagggcggc acctcgctaa cggattcacc actccaagaa ttggagccaa 14160
tcaattcttg cggagaactg tgaatgcgca aaccaaccct tggcagaaca tatccatcgc 14220
gtccgccatc tccagcagcc gcacgcggcg catctcgggg ccgacgcgct gggctacgtc 14280
ttgctggcgt tcgcgacgcg aggctggatg gccttcccca ttatgattct tctcgcttcc 14340
ggcggcatcg ggatgcccgc gttgcaggcc atgctgtcca ggcaggtaga tgacgaccat 14400
cagggacagc ttcaaggcca gcaaaaggcc aggaacc 14437
<210> 35
<211> 7602
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 35
actcttcctt tttcaatgac cgctttggaa aaacaaagac tgtatttcct ggaaattaat 60
gtttattcaa taaactgtgt attcagctat atcacatagt ggtgaggctg aaatgaggcg 120
ggaagaggcg gttggggctt aattatatca atttgggtgg ccccacagcg cctccaaggc 180
gccagtcctg ttttgacaag ttgcctctgg aagcctctac aatgcctctc ttctttttct 240
ccagagtaag cggaggccag gggcccccgg cctctgctta atactaaaaa aaacagctgt 300
tgtcatagta atgattgggt ggaaacattc caggcctggg tggagaggct ttttgcttcc 360
tcttgcaaaa ccacactgac attccaggcc tgggtggaga ggctttttgc ttcctcttgc 420
aaaaccacac tgccctctgg agggcagttg cctagcaact aactaaaaga ggatgtcgca 480
cggccagctg cggtcagtta gtcacttcct gcttaactga cttgacattt tctattttaa 540
gagtcgggag gaaaattact gtgttggagg ccctccgcca tcttctgaag ctgaatcgaa 600
ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 660
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 720
cttatcatgt ctggatctga tatcatcgtc gacattgatt attgactagt tattaatagt 780
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 840
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 900
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 960
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta 1020
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg 1080
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtcgaggtga 1140
gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca attttgtatt 1200
tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc 1260
caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag 1320
ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 1380
cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc 1440
cccgctccgc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt tactcccaca 1500
ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg tttaatgacg 1560
gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg gccctttgtg 1620
cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg 1680
ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg 1740
cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg ggggctgcga 1800
ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc 1860
gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1920
ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1980
gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 2040
ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 2100
ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 2160
gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 2220
cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 2280
tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 2340
cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 2400
tcatgccttc ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca 2460
tcattttggc aaagaatttc gacctgcagc ccaagctgta ccccctcgaa actgacagga 2520
gaaccaccat gggcccaaag aagaagagaa aggtttcgaa tttactgacc gtacaccaaa 2580
atttgcctgc attaccggtc gatgcaacga gtgatgaggt tcgcaagaac ctgatggaca 2640
tgttcaggga tcgccaggcg ttttctgagc atacctggaa aatgcttctg tccgtttgcc 2700
ggtcgtgggc ggcatggtgc aagttgaata accggaaatg gtttcccgca gaacctgaag 2760
atgttcgcga ttatcttcta tatcttcagg cgcgcggtct ggcagtaaaa actatccagc 2820
aacatttggg ccagctaaac atgcttcatc gtcggtccgg gctgccacga ccaagtgaca 2880
gcaatgctgt ttcactggtt atgcggcgga tccgaaaaga aaacgttgat gccggtgaac 2940
gtgcaaaaca ggctctagcg ttcgaacgca ctgatttcga ccaggttcgt tcactcatgg 3000
aaaatagcga tcgctgccag gatatacgta atctggcatt tctggggatt gcttataaca 3060
ccctgttacg tatagccgaa attgccagga tcagggttaa agatatctca cgtactgacg 3120
gtgggagaat gttaatccat attggcagaa cgaaaacgct ggttagcacc gcaggtgtag 3180
agaaggcact tagcctgggg gtaactaaac tggtcgagcg atggatttcc gtctctggtg 3240
tagctgatga tccgaataac tacctgtttt gccgggtcag aaaaaatggt gttgccgcgc 3300
catctgccac cagccagcta tcaactcgcg ccctggaagg gatttttgaa gcaactcatc 3360
gattgattta cggcgctaag gatgactctg gtcagagata cctggcctgg tctggacaca 3420
gtgcccgtgt cggagccgcg cgagatatgg cccgcgctgg agtttcaata ccggagatca 3480
tgcaagctgg tggctggacc aatgtaaata ttgtcatgaa ctatatccgt aacctggata 3540
gtgaaacagg ggcaatggtg cgcctgctgg aagatggcga ttagccatta acgcgcgacc 3600
agcttgatat cgaattaatt cactcctcag gtgcaggctg cctatcagaa ggtggtggct 3660
ggtgtggcca atgccctggc tcacaaatac cactgaatta agaattccgc ccctctccct 3720
cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 3780
atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 3840
ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 3900
tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 3960
tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 4020
agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 4080
ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 4140
atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 4200
catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt 4260
cctttgaaaa acacgatgat aatatggcca caaccatgac cgagtacaag cccacggtgc 4320
gcctcgccac ccgcgacgac gtcccccggg ccgtacgcac cctcgccgcc gcgttcgccg 4380
actaccccgc cacgcgccac accgtcgacc cggaccgcca catcgagcgg gtcaccgagc 4440
tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg gtcgcggacg 4500
acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg gcggtgttcg 4560
ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg cagcaacaga 4620
tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg gccaccgtcg 4680
gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc cccggagtgg 4740
aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc cgcaacctcc 4800
ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc gaaggaccgc 4860
gcacctggtg catgacccgc aagcccggtg cctgacgccc gccccacgac ccgcagcgcc 4920
cgaccgaaag gagcgcacga ccccatgcat ggatcgatag cctcgactgt gccttctagt 4980
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 5040
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 5100
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 5160
aggcatgctg gggatgcggt gggctctatc ttctgaggcg gaaagaacct gcagcccaag 5220
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 5280
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 5340
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 5400
gcggatccgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 5460
cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 5520
tatgcagagg ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt 5580
tttggaggcc taggcttttg caaaaagcta acttgtttat tgcagcttat aatggttaca 5640
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 5700
gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccgctgc attaatgaat 5760
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 5820
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5880
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5940
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 6000
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 6060
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 6120
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg 6180
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 6240
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 6300
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6360
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6420
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6480
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6540
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6600
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6660
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6720
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6780
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6840
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 6900
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6960
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 7020
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 7080
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 7140
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 7200
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 7260
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 7320
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 7380
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7440
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7500
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7560
aaaaaaggga ataagggcga cacggaaatg ttgaatactc at 7602
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 36
gtatctggcg gcagggtagc 20
<210> 37
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 37
tttgttgctg gcattgttct g 21
<210> 38
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 38
tggacgtaaa ctcctcttca gacc 24
<210> 39
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 39
gaggactaca ccatcgtgga acag 24
<210> 40
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 40
ggcttccacc aaagaccaca g 21
<210> 41
<211> 2041
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 41
taccgttcgt atagcataca ttatacgaag ttataccatg tctagactgg acaagagcaa 60
agtcataaac ggcgctctgg aattactcaa tggagtcggt atcgaaggcc tgacgacaag 120
gaaactcgct caaaagctgg gagttgagca gcctaccctg tactggcacg tgaagaacaa 180
gcgggccctg ctcgatgccc tgccaatcga gatgctggac aggcatcata cccacttctg 240
ccccctggaa ggcgagtcat ggcaagactt tctgcggaac aacgccaagt cattccgctg 300
tgctctcctc tcacatcgcg acggggctaa agtgcatctc ggcacccgcc caacagagaa 360
acagtacgaa accctggaaa atcagctcgc gttcctgtgt cagcaaggct tctccctgga 420
gaacgcactg tacgctctgt ccgccgtggg ccactttaca ctgggctgcg tattggagga 480
acaggagcat caagtagcaa aagaggaaag agagacacct accaccgatt ctatgccccc 540
acttctgaga caagcaattg agctgttcga ccggcaggga gccgaacctg ccttcctttt 600
cggcctggaa ctaatcatat gtggcctgga gaaacagcta aagtgcgaaa gcggcgggcc 660
ggccgacgcc cttgacgatt ttgacttaga catgctccca gccgatgccc ttgacgactt 720
tgaccttgat atgctgcctg ctgacgctct tgacgatttt gaccttgaca tgctccccgg 780
gtaactaagt aaggatccag acatgataag atacattgat gagtttggac aaaccacaac 840
tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt 900
aaccattata agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca 960
ggttcagggg gaggtgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtat 1020
ggctgattat gatcctctag agtcgcagat ccagacatga taagatacat tgatgagttt 1080
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 1140
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 1200
cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc 1260
tacaaatgtg gtatggctga ttatgatcct ctagagtcgc agatccagac atgataagat 1320
acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 1380
aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 1440
acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa 1500
gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tcctctagag tcgcagatcc 1560
tctagagtcg cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt 1620
gagcatctga cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat 1680
tttttgtgtc tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat 1740
gagtatttgg tttagagttt ggcaacatat gccatatgct ggctgccatg aacaaaggtg 1800
gctataaaga ggtcatcagt atatgaaaca gccccctgct gtccattcct tattccatag 1860
aaaagccttg acttgaggtt agattttttt tatattttgt tttgtgttat ttttttcttt 1920
aacatcccta aaattttcct tacatgtttt actagccaga tttttcctcc tctcctgact 1980
actcccagtc atagctgtcc ctcttctctt atgaagatcc ctcgacctgc agcccaagct 2040
t 2041
<210> 42
<211> 413
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 42
ccgcggtggc ggccgcacgt ctccctatca gtgatagaga agtcgacacg tctcgagctc 60
cctatcagtg atagagaagg tacgtctaga acgtctccct atcagtgata gagaagtcga 120
cacgtctcga gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt 180
gatagagaag tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac 240
gtctccctat cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa 300
ggtaccccct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 360
ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg cgg 413
<210> 43
<211> 1224
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 43
ggatcccaaa taccactgaa ttaagaattc cgcccctctc cctccccccc ccctaacgtt 60
actggccgaa gccgcttgga ataaggccgg tgtgcgtttg tctatatgtt attttccacc 120
atattgccgt cttttggcaa tgtgagggcc cggaaacctg gccctgtctt cttgacgagc 180
attcctaggg gtctttcccc tctcgccaaa ggaatgcaag gtctgttgaa tgtcgtgaag 240
gaagcagttc ctctggaagc ttcttgaaga caaacaacgt ctgtagcgac cctttgcagg 300
cagcggaacc ccccacctgg cgacaggtgc ctctgcggcc aaaagccacg tgtataagat 360
acacctgcaa aggcggcaca accccagtgc cacgttgtga gttggatagt tgtggaaaga 420
gtcaaatggc tctcctcaag cgtattcaac aaggggctga aggatgccca gaaggtaccc 480
cattgtatgg gatctgatct ggggcctcgg tgcacatgct ttacatgtgt ttagtcgagg 540
ttaaaaaacg tctaggcccc ccgaaccacg gggacgtggt tttcctttga aaaacacgat 600
gataatatgg ccacaaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 660
gacgtccccc gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 720
cacaccgtcg acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 780
acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 840
gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 900
atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 960
ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac 1020
cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 1080
ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 1140
ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 1200
cgcaagcccg gtgcctgagg atcc 1224
<210> 44
<211> 1044
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 44
actagttaat taagaaactg acctaaagac ttgcctccag ccccatccta tgggagcatt 60
ttcttaactg aggttctctc ctctcaagat gacttcagct tgtgacaatg tgacctggcc 120
taaagctagc cagcacagca caacaccttc cattctttct tctaaggtgc ttatggacat 180
ttctttctct ttgagtacct tgagtgggat tgtctgtggc tgcttttggg aagcattcaa 240
ttgaatgatt tttgtttttt gtttatttcc cccgagacag ggtttctctg tgtagccctg 300
gctgtcctgg aactcacttt gtagacctcg aactcagaaa tccgcctgcc tctgcctccc 360
aagtgctggg attaatggca tgtgccacca ctgcctggag aattgaatgc ttataaggta 420
aacagatgct tttattaaaa acaacaacaa caactgttat tcctagtggt tggactttac 480
agttgtactt tgtttccttt tgaaacagtg ttgcagcgaa cgaggccaca ggttggcctt 540
gaacttgttc ttccctgtgc taggattaca tcgtgcacaa cttccttctc gcagactctt 600
attattttaa gaaaaactaa aacagtacac cattttagta cggtagtagt gtgctgaaat 660
tcagccctgg ggatcagggc cttttgcttt ttttggtaaa ttttgagaca tagtgtcact 720
aagttgcttt agctagctgt gtatcagtct ccacagtggc cggcttgaca ggcctgcttg 780
ctttgtgcat gtgaaggggc taagcccttg gctgtgtaga atatacaaac gcagtgtctg 840
agaaggctca gaatggctca cttgcaagaa cagctaaacc ctaacaagac catctgacca 900
tctgggatga ctgacgtttg ccggctacgc gggaggccct ggaaaagatg tcttccagat 960
gatgcttaga ctgtttttga gttagtagca cggaatcaca gcactgtttc ccctcatttt 1020
agggtccgtc gtaacctgac tagt 1044
<210> 45
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 45
actagttaat taagaaactg acctaaagac ttgcct 36
<210> 46
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 46
actagtcagg ttacgacgga ccctaaaatg agggg 35
<210> 47
<211> 682
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 47
ccatggtacc gttcgtatag catacattat acgaagttat ttgagtaact atggaagact 60
atatcaaaat agagaaaatt ggagaaggta agtggtttta gcagaatgtt ttttgaaaag 120
aagataacaa tgctactgtg gaacacagaa acctttactg agtgcagtcg tagatgcatc 180
tgtacgcgtg cgcatgagtg tgctgtgaga gttggtgttt gtggcctcct agacaggatc 240
tgggatcact ctgagcacac ctgtagggga ttgtctttga ctctattaat tgacgtgggc 300
aggaacctcc cccagtgtgg gtgccttcct tgcctgagat cctggactgt gtgactggag 360
aagggtgtca agccacagtg aacctcactc tcccactgcc tgtgctcttg ctgctgctgc 420
tgctggactc taaccccgat cctgagtgca aacaaaccct tccttgggct acttttgtct 480
gggtgtttct cacagcacca gcaaaaggaa ggcacgcagc tgggcgtggt ggcacacacc 540
tttaatccca gcacttggga ggcagaggca ggcggatttc tgagttcgag gccagcctgg 600
tctacaaagt tccaggatag ccagggctat acagagaaac cctgtctcga aaaacagaaa 660
agaaaaaaaa aagaaagcat gc 682
<210> 48
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 48
gcatgctttc tttttttttt cttttctgtt tttcgagaca gggtttctct g 51
<210> 49
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 49
ccatggtacc gttcgtatag catacattat acgaagttat ttgagtaact atggaagact 60
atatcaaaat ag 72
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 50
caccgacgac ggaccctaaa atga 24
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 51
aaactcattt tagggtccgt cgtc 24
<210> 52
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 52
caccgatatc aaaatagaga aaat 24
<210> 53
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 53
aaacattttc tctattttga tatc 24
<210> 54
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 54
ccaggccaca tatgattagt tcc 23
<210> 55
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 55
gtgagccaag aaattgtttc tcc 23
<210> 56
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 56
ttgacctcca tagaagacac cg 22
<210> 57
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 57
gctaagtccc ctgccttgg 19
<210> 58
<211> 1978
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 58
ggatccggtt ctggcgtgaa acagactttg aattttgacc ttctcaagtt ggcgggagac 60
gtggagtcca acccagggcc catggccagc tacccctgtc accagcacgc cagcgccttc 120
gaccaggccg ccagaagcag gggccacagc aaccggcgga ccgccctgag acccaggcgg 180
cagcaggaag ccaccgaagt ccggctggaa cagaagatgc ccaccctgtt aagggtgtac 240
atcgacggcc cccacggcat gggcaagacc accaccaccc agctgctggt ggccctgggc 300
agccgggacg acatcgtgta cgtgcccgag cccatgacct actggcaggt gctgggcgcc 360
agcgagacca tcgccaacat ctacaccaca cagcacaggc tggaccaggg cgagatctct 420
gccggcgacg ccgccgtggt gatgaccagc gcccagatca caatgggcat gccctacgcc 480
gtgaccgacg ccgtgctggc ccctcacgtg ggcggcgagg ccggctctag ccacgcccct 540
ccccctgccc tgaccctgat cttcgaccgg caccccatcg cccacctgct gtgctaccct 600
gccgccagat acctgatggg cagcatgacc ccccaggccg tgctggcctt cgtggccctg 660
atccccccca ccctgcccgg caccaacatc gtgctgggag ccctgcccga ggaccggcac 720
atcgaccggc tggccaagcg gcagagaccc ggcgagcggc tggacctggc catgctggcc 780
gccatccggc gggtgtacgg cctgctggcc aacaccgtga gatacctgca gggcggaggg 840
tcttggtggg aggactgggg ccagctgtcc ggcaccgccg tgccacctca gggcgccgag 900
ccccagagca atgccggccc tcggccccac atcggcgaca ccctgtttac cctgttcaga 960
gcccccgagc tgctggcccc caacggcgac ctgtacaacg tgttcgcctg ggccctggac 1020
gtgctggcca agaggctgcg gcccatgcac gtgttcatcc tggactacga ccagagccct 1080
gccggctgca gggacgccct gctgcagctg accagcggca tggtgcagac ccacgtgacc 1140
acccccggca gcatccccac catctgcgac ctggcccgga ccttcgcccg ggagatgggc 1200
gaggccaacg gctccggaga gggcagagga agtctgctaa catgcggtga cgtcgaggag 1260
aatcctggcc cactcgagat ggccacaacc atggtgagca agggcgagga ggataacatg 1320
gccatcatca aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac 1380
gagttcgaga tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag 1440
ctgaaggtga ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc 1500
atgtacggct ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg 1560
tccttccccg agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg 1620
accgtgaccc aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc 1680
ggcaccaact tcccctccga cggccccgta atgcagaaga agaccatggg ctgggaggcc 1740
tcctccgagc ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg 1800
aagctgaagg acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag 1860
cccgtgcagc tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac 1920
gaggactaca ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcg 1978
<210> 59
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 59
gctttctgac aaaaagtttc aatatgttat gtcaacagat ag 42
<210> 60
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 60
ctatctgttg acataacata ttgaaacttt ttgtcagaaa gc 42
<210> 61
<211> 758
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 61
ggagaatcct ggcccactcg aggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc 60
catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg 120
cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct 180
gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg 240
ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt 300
ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa 360
gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga 420
cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat 480
ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga 540
cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt 600
gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga 660
gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat 720
ggacgagctg tacaagtagc tttctgacaa aaagtttc 758
<210> 62
<211> 6080
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 62
tagctttctg acaaaaagtt tcaatatgtt atgtcaacag atagttgtgt ttttattgtt 60
aactcttgtc tatttttgtc ttatatatat ttctttgtta tcaaacttca gctgtacttc 120
gtcttctaat ttcaaaaata taacttaaaa atgtaaatat tctatatgaa tttaaatata 180
attctgtaaa tgtgtgtagg tctcactgta acaactattt gttactataa taaaactata 240
atattgatgt caggaatcag gaaaaaattt gagttggctt aaatcatctc agtccttatg 300
gcagttttat tttcctgtag ttggaactac taaaatttag gaaaatgcta agttcaagtt 360
tcgtaatgct ttgaagtatt tttatgctct gaatgtttaa atgttctcat cagtttcttg 420
ccatgttgtt aactatacaa cctggctaaa gatgaatatt tttctactgg tattttaatt 480
tttgacctaa atgtttaagc attcggaatg agaaaactat acagatttga gaaatgatgc 540
taaatttata ggagttttca gtaacttaaa aagctaacat gagagcatgc caaaatttgc 600
taagtcttac aaagatcaag ggctgtccgc aacagggaag aacagttttg aaaatttatg 660
aactatctta tttttaggta ggttttgaaa gctttttgtc taagtgaatt cttatgcctt 720
ggtcagagta ataactgaag gaggtgctta tcttggcttt cgagtctgag tttaaaacta 780
cacattttga catagtgttt attagcagcc atctaaaaag gctctaatgt atatttaact 840
aaaattacta gctttgggaa ttaaactgtt taacaaataa tgctgctcat tgtgattctt 900
acctataagc agcctaattt gaattatttg ctgcaatcga attcccgcgg ccgccatggc 960
ggccgggagc atgcgacgtc gggcccaatt cgccctatag tgagtcgtat tacaattcac 1020
tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 1080
ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 1140
cttcccaaca gttgcgcagc ctgaatggcg aatggacgcg ccctgtagcg gcgcattaag 1200
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 1260
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 1320
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 1380
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 1440
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 1500
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 1560
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 1620
gcttacaatt tcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 1680
atcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 1740
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 1800
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 1860
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 1920
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 1980
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2040
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 2100
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2160
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2220
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 2280
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 2340
tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 2400
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 2460
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 2520
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 2580
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 2640
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 2700
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 2760
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 2820
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 2880
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 2940
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3000
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3060
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3120
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3180
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3240
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 3300
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 3360
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 3420
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 3480
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 3540
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 3600
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 3660
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 3720
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 3780
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 3840
ttacgccaag ctatttaggt gacactatag aatactcaag ctatgcatcc aacgcgttgg 3900
gagctctccc atatggtcga cctgcaggcg gccgcgaatt cactagtgat tgttacttcc 3960
cttcgagcct caatgtcctc atttgtaaaa tgacattaat acctactttt agctgtggga 4020
attgagtacc atgatttata caaagcagtt tgtatggtgc tggttacatg agagttcaga 4080
tggtaactag ttagtaaaaa atctctagtg tgcttgttga ttttatttta ttttagtatt 4140
tcttaaagat caaatttaac atcaatccta aactttattt agctttttct ggcgtgtaaa 4200
ctaacatact aagttgtgtg actataattc atttagtgac tcatttttag ctatttttat 4260
aacacattgt gctatggggg gttttggaac ttgctggaag ctacatcaga aactgccata 4320
gttaattgcc atttcaagaa tgttgtaaat aactcaggtg gccgtttaat tctcaatgta 4380
aatataatta actagacatc tttcctatat ttgtgtctca gttttaaagc tatttctgga 4440
tgcttgagtc ttaccgtaat tgataacaaa aagaggttat tgagaatatc tatgatttac 4500
agagtaagtt attctagacc tcaagagtga aatgtagggg aggagacatt tgtgtgttaa 4560
actaatggaa atgctcattt aatagatatt cactgaaagt attagttttg gtttattgct 4620
agaaaagttg aggttttatg gagatttttg taaaaaatgg tttatttcct aaataaatat 4680
ctctttttct tttttctccc agaaaatgtt aatctatgat ccagccaaac gaatttctgg 4740
caaaatggca ctgaatcatc catattttaa tgatttggac aatcagatta agaagatggg 4800
atccggttct ggcgtgaaac agactttgaa ttttgacctt ctcaagttgg cgggagacgt 4860
ggagtccaac ccagggccca tggccagcta cccctgtcac cagcacgcca gcgccttcga 4920
ccaggccgcc agaagcaggg gccacagcaa ccggcggacc gccctgagac ccaggcggca 4980
gcaggaagcc accgaagtcc ggctggaaca gaagatgccc accctgttaa gggtgtacat 5040
cgacggcccc cacggcatgg gcaagaccac caccacccag ctgctggtgg ccctgggcag 5100
ccgggacgac atcgtgtacg tgcccgagcc catgacctac tggcaggtgc tgggcgccag 5160
cgagaccatc gccaacatct acaccacaca gcacaggctg gaccagggcg agatctctgc 5220
cggcgacgcc gccgtggtga tgaccagcgc ccagatcaca atgggcatgc cctacgccgt 5280
gaccgacgcc gtgctggccc ctcacgtggg cggcgaggcc ggctctagcc acgcccctcc 5340
ccctgccctg accctgatct tcgaccggca ccccatcgcc cacctgctgt gctaccctgc 5400
cgccagatac ctgatgggca gcatgacccc ccaggccgtg ctggccttcg tggccctgat 5460
cccccccacc ctgcccggca ccaacatcgt gctgggagcc ctgcccgagg accggcacat 5520
cgaccggctg gccaagcggc agagacccgg cgagcggctg gacctggcca tgctggccgc 5580
catccggcgg gtgtacggcc tgctggccaa caccgtgaga tacctgcagg gcggagggtc 5640
ttggtgggag gactggggcc agctgtccgg caccgccgtg ccacctcagg gcgccgagcc 5700
ccagagcaat gccggccctc ggccccacat cggcgacacc ctgtttaccc tgttcagagc 5760
ccccgagctg ctggccccca acggcgacct gtacaacgtg ttcgcctggg ccctggacgt 5820
gctggccaag aggctgcggc ccatgcacgt gttcatcctg gactacgacc agagccctgc 5880
cggctgcagg gacgccctgc tgcagctgac cagcggcatg gtgcagaccc acgtgaccac 5940
ccccggcagc atccccacca tctgcgacct ggcccggacc ttcgcccggg agatgggcga 6000
ggccaacggc tccggagagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa 6060
tcctggccca ctcgaggtga 6080
<210> 63
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 63
taccgttcgt atagcataca ttatacgaag ttataccatg tctagactgg acaagagc 58
<210> 64
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 64
gcagagggaa aaagatctgc gactctagag g 31
<210> 65
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 65
acgagtgtac acacacgagg tag 23
<210> 66
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 66
tgtcaaccgg agtggagtaa cg 22
<210> 67
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 67
atggagggga atacagccc 19
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 68
ttctttgcag ctccttcgtt 20
<210> 69
<211> 982
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 69
aagatacatc tctgcttctt tctggattga tttttctttg aagatgaatg tgagaaatag 60
aacttaaagg tctattctga gtgtgcttta taaatgattt tatcatcagt gatgggtgtt 120
agaaaaatct aggtaattat gcctggagtt ctgacgtttc attggcaaac ttcagaggaa 180
gtcttgaact tctggttgtc agcttttttt tttaacccat tcattgtgat tcaagtatac 240
cgtttttctg cttagtcctt gacattgttt aggttataat tagaatttta tctgtggaat 300
tgcacttttc attcttttgt tttacggtgc ttaagtgata tttcctactc ttggaaaaag 360
taccttgaaa gtcttgagca tgtttgtctg tgacctcagc aagcagagga aaaagattaa 420
aattgtcacg tgggcaactg taaacactta aaatgttttt gtcgttttaa acaaaatttt 480
cctaatgaac agtctgaaca cattttagtt ctgtcctcat aactttaaaa aataatgttt 540
tgaataaaat taggagtatc ataaagcggt ataaatttgt tgaaatattt gggtataact 600
ttggcacacg caggtactac tttaaagtgt cacaaaaagg gaacataatt ctggtttttg 660
tttggaaaga atagacaagt tgatacctga atttgagggt tattttgatt ggaagaagct 720
aaatactaca ctagtataga atatacacgt ttccaatgtc tcaggagtca agaaggatgg 780
aaagttattg taggagtcct tacccttgta aatattgttt gaatgtaatt aatatttatg 840
gaatacttat gctgcagtag gcactgtgga aaatgcttta catatagtgt ttcattaatg 900
cttaaaacta ctcgagttag tggcatgtaa ttaagtcagt ttttccttca ctttaggatc 960
taccataccc attgactaac tc 982
<210> 70
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 70
aaatcctgca ggaagataca tctctgcttc tttctggatt g 41
<210> 71
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 71
aaatcctgca ggagttagtc aatgggtatg gtagatccta aagtg 45
<210> 72
<211> 943
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 72
aagattatac caaaatagag aaaattggag aaggtgagtg gttttagtaa aataaatttt 60
atggaatgat ttaacaatgc tacaacttct gtaatatgaa cacatttaaa tatttattaa 120
aattcaacca ttaagttgtc ttgtagtacc agtgtgcatt aacatatgtt ctttacttaa 180
taaacgcaaa tttgctcaca tttcaagaga attgaaatta ccgaatccct aatgaccgtt 240
cgcctcaccc ccatagtctt acagtcttct gatactaaac acttatagta gtacttgtat 300
tttgaagaca ctattgataa cttgcatgtg tgttgagggg cagaggttag ggctgcagaa 360
ttatgctaac ttcataatat atttttagtt ttagtctctt tcaattgttt ttaggatgat 420
aaatattttt atccagactt tatagactgg ttacaataat tgacttaatc taatttaaat 480
aaaatttcta tttagttacc ctaagtataa atgacctgtc atatagacat gtttaagcta 540
ttctaaaatt ataacttatg tatataatcc ttccctttct gtggtacttg aaggaatgtt 600
tagatctata tatggcacaa atgaggggta tatcccttcg cctgttcctc gactccagca 660
gaacattctc gattctccag gtacaaaata atttgctaat agaatccagt ttatataggt 720
tctgccagaa gaaaattccc aactatattt ttaatgtgat caaagacccc acttgacaag 780
aaatagtgaa aaacaagggg gaatactgga gggaatttag tggaatagga gtgacaagtt 840
agtgtggtgt tcgattggag gtgtgtgtgt gtatacatat atatatatat ttttttttta 900
aatcacttaa atacctcata cccattctac taaacaaatt ttg 943
<210> 73
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 73
ttaaccatgg aagattatac caaaatagag aaaattgg 38
<210> 74
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 74
tttagcatgc caaaatttgt ttagtagaat gggtatgagg 40
<210> 75
<211> 8604
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 75
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggaagatac 2940
atctctgctt ctttctggat tgatttttct ttgaagatga atgtgagaaa tagaacttaa 3000
aggtctattc tgagtgtgct ttataaatga ttttatcatc agtgatgggt gttagaaaaa 3060
tctaggtaat tatgcctgga gttctgacgt ttcattggca aacttcagag gaagtcttga 3120
acttctggtt gtcagctttt ttttttaacc cattcattgt gattcaagta taccgttttt 3180
ctgcttagtc cttgacattg tttaggttat aattagaatt ttatctgtgg aattgcactt 3240
ttcattcttt tgttttacgg tgcttaagtg atatttccta ctcttggaaa aagtaccttg 3300
aaagtcttga gcatgtttgt ctgtgacctc agcaagcaga ggaaaaagat taaaattgtc 3360
acgtgggcaa ctgtaaacac ttaaaatgtt tttgtcgttt taaacaaaat tttcctaatg 3420
aacagtctga acacatttta gttctgtcct cataacttta aaaaataatg ttttgaataa 3480
aattaggagt atcataaagc ggtataaatt tgttgaaata tttgggtata actttggcac 3540
acgcaggtac tactttaaag tgtcacaaaa agggaacata attctggttt ttgtttggaa 3600
agaatagaca agttgatacc tgaatttgag ggttattttg attggaagaa gctaaatact 3660
acactagtat agaatataca cgtttccaat gtctcaggag tcaagaagga tggaaagtta 3720
ttgtaggagt ccttaccctt gtaaatattg tttgaatgta attaatattt atggaatact 3780
tatgctgcag taggcactgt ggaaaatgct ttacatatag tgtttcatta atgcttaaaa 3840
ctactcgagt tagtggcatg taattaagtc agtttttcct tcactttagg atctaccata 3900
cccattgact aactcctgca ggcggccgcg aattcactag tgattaccgt tcgtatagca 3960
tacattatac gaagttatac catgtctaga ctggacaaga gcaaagtcat aaacggcgct 4020
ctggaattac tcaatggagt cggtatcgaa ggcctgacga caaggaaact cgctcaaaag 4080
ctgggagttg agcagcctac cctgtactgg cacgtgaaga acaagcgggc cctgctcgat 4140
gccctgccaa tcgagatgct ggacaggcat catacccact tctgccccct ggaaggcgag 4200
tcatggcaag actttctgcg gaacaacgcc aagtcattcc gctgtgctct cctctcacat 4260
cgcgacgggg ctaaagtgca tctcggcacc cgcccaacag agaaacagta cgaaaccctg 4320
gaaaatcagc tcgcgttcct gtgtcagcaa ggcttctccc tggagaacgc actgtacgct 4380
ctgtccgccg tgggccactt tacactgggc tgcgtattgg aggaacagga gcatcaagta 4440
gcaaaagagg aaagagagac acctaccacc gattctatgc ccccacttct gagacaagca 4500
attgagctgt tcgaccggca gggagccgaa cctgccttcc ttttcggcct ggaactaatc 4560
atatgtggcc tggagaaaca gctaaagtgc gaaagcggcg ggccggccga cgcccttgac 4620
gattttgact tagacatgct cccagccgat gcccttgacg actttgacct tgatatgctg 4680
cctgctgacg ctcttgacga ttttgacctt gacatgctcc ccgggtaact aagtaaggat 4740
cccaaatacc actgaattaa gaattccgcc cctctccctc ccccccccct aacgttactg 4800
gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 4860
tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 4920
ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 4980
cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 5040
ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 5100
ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 5160
aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 5220
gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 5280
aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata 5340
atatggccac aaccatgacc gagtacaagc ccacggtgcg cctcgccacc cgcgacgacg 5400
tcccccgggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc acgcgccaca 5460
ccgtcgaccc ggaccgccac atcgagcggg tcaccgagct gcaagaactc ttcctcacgc 5520
gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg gtggcggtct 5580
ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc ccgcgcatgg 5640
ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc ctggcgccgc 5700
accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc gaccaccagg 5760
gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag cgcgccgggg 5820
tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag cggctcggct 5880
tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc atgacccgca 5940
agcccggtgc ctgaggatcc agacatgata agatacattg atgagtttgg acaaaccaca 6000
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 6060
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 6120
caggttcagg gggaggtgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 6180
atggctgatt atgatcctct agagtcgcag atccagacat gataagatac attgatgagt 6240
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 6300
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 6360
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 6420
tctacaaatg tggtatggct gattatgatc ctctagagtc gcagatccag acatgataag 6480
atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg 6540
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 6600
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 6660
aagcaagtaa aacctctaca aatgtggtat ggctgattat gatcctctag agtcgcagat 6720
cctctagagt cgcagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 6780
ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 6840
attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 6900
atgagtattt ggtttagagt ttggcaacat atgccatatg ctggctgcca tgaacaaagg 6960
tggctataaa gaggtcatca gtatatgaaa cagccccctg ctgtccattc cttattccat 7020
agaaaagcct tgacttgagg ttagattttt tttatatttt gttttgtgtt atttttttct 7080
ttaacatccc taaaattttc cttacatgtt ttactagcca gatttttcct cctctcctga 7140
ctactcccag tcatagctgt ccctcttctc ttatgaagat ccctcgacct gcagcccaag 7200
cttatcgaat tcccgcggtg gcggccgcac gtctccctat cagtgataga gaagtcgaca 7260
cgtctcgagc tccctatcag tgatagagaa ggtacgtcta gaacgtctcc ctatcagtga 7320
tagagaagtc gacacgtctc gagctcccta tcagtgatag agaaggtacg tctagaacgt 7380
ctccctatca gtgatagaga agtcgacacg tctcgagctc cctatcagtg atagagaagg 7440
tacgtctaga acgtctccct atcagtgata gagaagtcga cacgtctcga gctccctatc 7500
agtgatagag aaggtacccc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 7560
tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg atccagcctc 7620
cgcggccgcc atggaagatt ataccaaaat agagaaaatt ggagaaggtg agtggtttta 7680
gtaaaataaa ttttatggaa tgatttaaca atgctacaac ttctgtaata tgaacacatt 7740
taaatattta ttaaaattca accattaagt tgtcttgtag taccagtgtg cattaacata 7800
tgttctttac ttaataaacg caaatttgct cacatttcaa gagaattgaa attaccgaat 7860
ccctaatgac cgttcgcctc acccccatag tcttacagtc ttctgatact aaacacttat 7920
agtagtactt gtattttgaa gacactattg ataacttgca tgtgtgttga ggggcagagg 7980
ttagggctgc agaattatgc taacttcata atatattttt agttttagtc tctttcaatt 8040
gtttttagga tgataaatat ttttatccag actttataga ctggttacaa taattgactt 8100
aatctaattt aaataaaatt tctatttagt taccctaagt ataaatgacc tgtcatatag 8160
acatgtttaa gctattctaa aattataact tatgtatata atccttccct ttctgtggta 8220
cttgaaggaa tgtttagatc tatatatggc acaaatgagg ggtatatccc ttcgcctgtt 8280
cctcgactcc agcagaacat tctcgattct ccaggtacaa aataatttgc taatagaatc 8340
cagtttatat aggttctgcc agaagaaaat tcccaactat atttttaatg tgatcaaaga 8400
ccccacttga caagaaatag tgaaaaacaa gggggaatac tggagggaat ttagtggaat 8460
aggagtgaca agttagtgtg gtgttcgatt ggaggtgtgt gtgtgtatac atatatatat 8520
atattttttt tttaaatcac ttaaatacct catacccatt ctactaaaca aattttggca 8580
tgcgacgtcg ggcccaattc gccc 8604
<210> 76
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 76
caccgatacc aaaatagaga aaat 24
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 77
aaacattttc tctattttgg tac 23
<210> 78
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 78
caccgcatag ttagtcaatg ggta 24
<210> 79
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 79
aaactaccca ttgactaact atgc 24
<210> 80
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 80
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ataccaaaat agagaaaatg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 81
<211> 8440
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 81
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccc accgcatagt tagtcaatgg gtagttttag agctagaaat agcaagttaa 300
aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct tttttgtttt 360
agagctagaa atagcaagtt aaaataaggc tagtccgttt ttagcgcgtg cgccaattct 420
gcagacaaat ggctctagag gtacccgtta cataacttac ggtaaatggc ccgcctggct 480
gaccgcccaa cgacccccgc ccattgacgt caatagtaac gccaataggg actttccatt 540
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattgtg 660
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720
ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780
ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840
gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900
ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960
cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020
cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 1080
tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 1140
aattagctga gcaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1200
aattacctgg agcacctgcc tgaaatcact ttttttcagg ttggaccggt gccaccatgt 1260
acccatacga tgttccagat tacgcttcgc cgaagaaaaa gcgcaaggtc gaagcgtccg 1320
acaagaagta cagcatcggc ctggccatcg gcaccaactc tgtgggctgg gccgtgatca 1380
ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gaccggcaca 1440
gcatcaagaa gaacctgatc ggagccctgc tgttcgacag cggcgaaaca gccgaggcca 1500
cccggctgaa gagaaccgcc agaagaagat acaccagacg gaagaaccgg atctgctatc 1560
tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg 1620
aagagtcctt cctggtggaa gaggataaga agcacgagcg gcaccccatc ttcggcaaca 1680
tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac 1740
tggtggacag caccgacaag gccgacctgc ggctgatcta tctggccctg gcccacatga 1800
tcaagttccg gggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg 1860
acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca 1920
acgccagcgg cgtggacgcc aaggccatcc tgtctgccag actgagcaag agcagacggc 1980
tggaaaatct gatcgcccag ctgcccggcg agaagaagaa tggcctgttc ggcaacctga 2040
ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg 2100
ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga 2160
tcggcgacca gtacgccgac ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc 2220
tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga 2280
tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc 2340
agctgcctga gaagtacaaa gagattttct tcgaccagag caagaacggc tacgccggct 2400
acattgacgg cggagccagc caggaagagt tctacaagtt catcaagccc atcctggaaa 2460
agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgcggaagc 2520
agcggacctt cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcca 2580
ttctgcggcg gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 2640
agatcctgac cttccgcatc ccctactacg tgggccctct ggccagggga aacagcagat 2700
tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg 2760
tggacaaggg cgcttccgcc cagagcttca tcgagcggat gaccaacttc gataagaacc 2820
tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtata 2880
acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg 2940
gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caaccggaaa gtgaccgtga 3000
agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg 3060
gcgtggaaga tcggttcaac gcctccctgg gcacatacca cgatctgctg aaaattatca 3120
aggacaagga cttcctggac aatgaggaaa acgaggacat tctggaagat atcgtgctga 3180
ccctgacact gtttgaggac agagagatga tcgaggaacg gctgaaaacc tatgcccacc 3240
tgttcgacga caaagtgatg aagcagctga agcggcggag atacaccggc tggggcaggc 3300
tgagccggaa gctgatcaac ggcatccggg acaagcagtc cggcaagaca atcctggatt 3360
tcctgaagtc cgacggcttc gccaacagaa acttcatgca gctgatccac gacgacagcc 3420
tgacctttaa agaggacatc cagaaagccc aggtgtccgg ccagggcgat agcctgcacg 3480
agcacattgc caatctggcc ggcagccccg ccattaagaa gggcatcctg cagacagtga 3540
aggtggtgga cgagctcgtg aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg 3600
aaatggccag agagaaccag accacccaga agggacagaa gaacagccgc gagagaatga 3660
agcggatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg 3720
aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat gggcgggata 3780
tgtacgtgga ccaggaactg gacatcaacc ggctgtccga ctacgatgtg gaccatatcg 3840
tgcctcagag ctttctgaag gacgactcca tcgacaacaa ggtgctgacc agaagcgaca 3900
agaaccgggg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact 3960
actggcggca gctgctgaac gccaagctga ttacccagag aaagttcgac aatctgacca 4020
aggccgagag aggcggcctg agcgaactgg ataaggccgg cttcatcaag agacagctgg 4080
tggaaacccg gcagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta 4140
agtacgacga gaatgacaag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc 4200
tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc 4260
accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc 4320
ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga 4380
tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca 4440
tcatgaactt tttcaagacc gagattaccc tggccaacgg cgagatccgg aagcggcctc 4500
tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggccgg gattttgcca 4560
ccgtgcggaa agtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga 4620
caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgataag ctgatcgcca 4680
gaaagaagga ctgggaccct aagaagtacg gcggcttcga cagccccacc gtggcctatt 4740
ctgtgctggt ggtggccaaa gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag 4800
agctgctggg gatcaccatc atggaaagaa gcagcttcga gaagaatccc atcgactttc 4860
tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact 4920
ccctgttcga gctggaaaac ggccggaaga gaatgctggc ctctgccggc gaactgcaga 4980
agggaaacga actggccctg ccctccaaat atgtgaactt cctgtacctg gccagccact 5040
atgagaagct gaagggctcc cccgaggata atgagcagaa acagctgttt gtggaacagc 5100
acaagcacta cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc 5160
tggccgacgc taatctggac aaagtgctgt ccgcctacaa caagcaccgg gataagccca 5220
tcagagagca ggccgagaat atcatccacc tgtttaccct gaccaatctg ggagcccctg 5280
ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg 5340
tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca cggatcgacc 5400
tgtctcagct gggaggcgac agccccaaga agaagagaaa ggtggaggcc agctaagaat 5460
tcctagagct cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 5520
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 5580
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 5640
ggggcaggac agcaaggggg aggattggga agagaatagc aggcatgctg gggagcggcc 5700
gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 5760
ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 5820
gcgagcgcgc agctgcctgc aggggcgcct gatgcggtat tttctcctta cgcatctgtg 5880
cggtatttca caccgcatac gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta 5940
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6000
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6060
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6120
aaaaaacttg atttgggtga tggttcacgt agtgggccat cgccctgata gacggttttt 6180
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 6240
acactcaacc ctatctcggg ctattctttt gatttataag ggattttgcc gatttcggcc 6300
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 6360
acgtttacaa ttttatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 6420
cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 6480
tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 6540
tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 6600
gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 6660
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 6720
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 6780
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 6840
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 6900
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 6960
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 7020
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 7080
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 7140
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 7200
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 7260
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 7320
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 7380
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 7440
tttattgctg ataaatctgg agccggtgag cgtggaagcc gcggtatcat tgcagcactg 7500
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 7560
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 7620
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 7680
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 7740
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 7800
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 7860
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 7920
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 7980
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 8040
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 8100
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 8160
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 8220
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 8280
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 8340
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 8400
ttacggttcc tggccttttg ctggcctttt gctcacatgt 8440
<210> 82
<211> 8509
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 82
cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 60
caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 120
cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 180
gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 240
cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 300
cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 360
ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 420
cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 480
gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 540
gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 600
caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 660
cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 720
ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 780
ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 840
caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 900
cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 960
gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 1020
aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 1080
gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 1140
ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 1200
cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 1260
cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 1320
aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 1380
cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 1440
aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 1500
catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 1560
gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 1620
taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 1680
agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 1740
catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 1800
agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 1860
cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 1920
gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 1980
ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 2040
gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 2100
caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 2160
tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 2220
caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 2280
ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 2340
caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt aagaattcct 2400
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 2460
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 2520
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 2580
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 2640
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 2700
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 2760
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 2880
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 2940
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 3000
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 3060
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 3120
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 3180
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 3240
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 3300
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 3360
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 3420
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 3480
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 3540
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 3600
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 3660
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 3720
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 3780
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 3840
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 3900
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 3960
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4020
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4080
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4140
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4200
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4260
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4320
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4380
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 4440
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 4500
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 4560
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 4620
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 4680
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 4740
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 4800
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 4860
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 4920
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 4980
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5040
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5100
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5160
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5220
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5280
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5340
ggttcctggc cttttgctgg ccttttgctc acatgtgagg gcctatttcc catgattcct 5400
tcatatttgc atatacgata caaggctgtt agagagataa ttggaattaa tttgactgta 5460
aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct tgggtagttt 5520
gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac ttgaaagtat 5580
ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccgccat agttagtcaa 5640
tgggtagttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 5700
aaaagtggca ccgagtcggt gcttttttgt tttagagcta gaaatagcaa gttaaaataa 5760
ggctagtccg tttttagcgc gtgcgccaat tctgcagaca aatggctcta gaggtacccg 5820
ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 5880
cgtcaatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 5940
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 6000
tcaatgacgg taaatggccc gcctggcatt gtgcccagta catgacctta tgggactttc 6060
ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 6120
cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 6180
ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 6240
gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 6300
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 6360
aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc 6420
tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg 6480
agcgggcggg acggcccttc tcctccgggc tgtaattagc tgagcaagag gtaagggttt 6540
aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc 6600
actttttttc aggttggacc ggtgccacca tggactataa ggaccacgac ggagactaca 6660
aggatcatga tattgattac aaagacgatg acgataagat ggccccaaag aagaagcgga 6720
aggtcggtat ccacggagtc ccagcagccg acaagaagta cagcatcggc ctggacatcg 6780
gcaccaactc tgtgggctgg gccgtgatca ccgacgagta caaggtgccc agcaagaaat 6840
tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc ggagccctgc 6900
tgttcgacag cggcgaaaca gccgaggcca cccggctgaa gagaaccgcc agaagaagat 6960
acaccagacg gaagaaccgg atctgctatc tgcaagagat cttcagcaac gagatggcca 7020
aggtggacga cagcttcttc cacagactgg aagagtcctt cctggtggaa gaggataaga 7080
agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac cacgagaagt 7140
accccaccat ctaccacctg agaaagaaac tggtggacag caccgacaag gccgacctgc 7200
ggctgatcta tctggccctg gcccacatga tcaagttccg gggccacttc ctgatcgagg 7260
gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg gtgcagacct 7320
acaaccagct gttcgaggaa aaccccatca acgccagcgg cgtggacgcc aaggccatcc 7380
tgtctgccag actgagcaag agcagacggc tggaaaatct gatcgcccag ctgcccggcg 7440
agaagaagaa tggcctgttc ggaaacctga ttgccctgag cctgggcctg acccccaact 7500
tcaagagcaa cttcgacctg gccgaggatg ccaaactgca gctgagcaag gacacctacg 7560
acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac ctgtttctgg 7620
ccgccaagaa cctgtccgac gccatcctgc tgagcgacat cctgagagtg aacaccgaga 7680
tcaccaaggc ccccctgagc gcctctatga tcaagagata cgacgagcac caccaggacc 7740
tgaccctgct gaaagctctc gtgcggcagc agctgcctga gaagtacaaa gagattttct 7800
tcgaccagag caagaacggc tacgccggct acattgacgg cggagccagc caggaagagt 7860
tctacaagtt catcaagccc atcctggaaa agatggacgg caccgaggaa ctgctcgtga 7920
agctgaacag agaggacctg ctgcggaagc agcggacctt cgacaacggc agcatccccc 7980
accagatcca cctgggagag ctgcacgcca ttctgcggcg gcaggaagat ttttacccat 8040
tcctgaagga caaccgggaa aagatcgaga agatcctgac cttccgcatc ccctactacg 8100
tgggccctct ggccagggga aacagcagat tcgcctggat gaccagaaag agcgaggaaa 8160
ccatcacccc ctggaacttc gaggaagtgg tggacaaggg cgcttccgcc cagagcttca 8220
tcgagcggat gaccaacttc gataagaacc tgcccaacga gaaggtgctg cccaagcaca 8280
gcctgctgta cgagtacttc accgtgtata acgagctgac caaagtgaaa tacgtgaccg 8340
agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa aaaggccatc gtggacctgc 8400
tgttcaagac caaccggaaa gtgaccgtga agcagctgaa agaggactac ttcaagaaaa 8460
tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga tcggttcaa 8509
<210> 83
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 83
ggcccacctg gagctgttaa 20
<210> 84
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 84
cgccgtttat gactttgctc tt 22
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 85
agacgccatc cacgctgttt 20
<210> 86
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 86
gccaaaactc ataggccaaa 20
<210> 87
<211> 870
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 87
ccacagggag tgttagtgct gctcgcgatt ttgctggcat ctctatactc ttcgtgtgtg 60
gcagcctaag accgcaagca gaagaacttg ccagaacttt gccagcatta actcagcgct 120
tctcaacttc ctaaggttgc gacccttcaa catagcgtct catgttgtga tgccctgcta 180
ccataattat tccattgcta cttcataact gtaatttttt tgctgctgtt atgagttgta 240
aggtaaacta tctgatatgc gacccccaag agtcacgacc cacaggctga gaaccgctgc 300
cttggccagc cttgagggag ggatggcgtt gtttcctcgg tcaggaaaaa aaaaggaaaa 360
ctcatcgcag gattaagact ctgtaatctc aacagatctg aaataaagaa tgagcatccg 420
ttttctagtt atattcagaa ggacggctta gtcaaccact ttgcacttcc aaaatgcctt 480
ccctctcttc agagtgtctc tcagagcaca tggaccttcc tcattggtca gattttctgt 540
cagtaccacc aacaattgct attggtccat tttgaagatt ctcccgcctt cttttaccta 600
attggtttat tcgaaaaggc ggtcttttgt tcgaataaaa gacgatctac gattggttac 660
tgcaaacaga gccaatgaga gcgagtcggt gattggttcc tctgatttgg gcgggctaga 720
taaaggttca aatgaaacta gggaagctct cctaaccgac aagcgtctgt gaggggagcg 780
tccaggtccc gcgtcgcgcg tcgcgggtcg cctagcgttt cccgctggtt ttgtcgcttt 840
ccggattctc gagcctcttc aggaccgtca 870
<210> 88
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 88
aattcctgca ggccacaggg agtgttagtg ctgctcg 37
<210> 89
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 89
ttactagttg acggtcctga agaggctcga gaatcc 36
<210> 90
<211> 818
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 90
agttgtcacc gctgcaggta cagctcgcgg atggggccgg gtagtagagc ctttacgtgg 60
cctctgcgtt catggctgac ggcgagagtt gaggttccag ggccgagcgc tggccggcga 120
ccggctggat ccggtcagcc ccatcttctg ggccttgagg ggtcgtggac tgggtgaagc 180
tctttccgaa atgatatcta taatctaatc tgggttcttg agtgttgtgt ttttattgtt 240
tgtgggagca ggttcaacta gtcctgcgat cggtctgtag tctaatggct tctgtgtgac 300
ttccagccgg cttatactcg aattcagtgg ccctcttccc ttccctgggt gatttgaata 360
actcatcacg gaaggtgcag agcatggcag ttcccattga ggagctggcc gaccgagtgg 420
ctcaaaaaaa gtccagtttc gggatgtgaa tgtagccaag ggtttgcatt gctagcatcc 480
caactgctac gggtggatac catctgtaat cggcacgagc ctatgtcggc actcactaaa 540
tattttccca ttagatggaa gaagttgagt gtagtttatc gatgacataa aaaatattac 600
tcaaggcaga aatgtccata cttgcagaac taaaatacct atttaaacgg gcatctgtag 660
ccagacctag tggggcaggc ctgaaatggc agctgctcca gagactgagg caagaggatg 720
ccttaagcta tttaatggga ctctcaaaaa cagcaacagg gggtgaaaaa aatggtctgg 780
gaattttgct cagtggtcag agcatttgcc tagcatgt 818
<210> 91
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 91
ccgtcaccat ggagttgtca ccgctgc 27
<210> 92
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 92
cccttgcatg cacatgctag gcaaatgctc 30
<210> 93
<211> 8347
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 93
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggccacagg 2940
gagtgttagt gctgctcgcg attttgctgg catctctata ctcttcgtgt gtggcagcct 3000
aagaccgcaa gcagaagaac ttgccagaac tttgccagca ttaactcagc gcttctcaac 3060
ttcctaaggt tgcgaccctt caacatagcg tctcatgttg tgatgccctg ctaccataat 3120
tattccattg ctacttcata actgtaattt ttttgctgct gttatgagtt gtaaggtaaa 3180
ctatctgata tgcgaccccc aagagtcacg acccacaggc tgagaaccgc tgccttggcc 3240
agccttgagg gagggatggc gttgtttcct cggtcaggaa aaaaaaagga aaactcatcg 3300
caggattaag actctgtaat ctcaacagat ctgaaataaa gaatgagcat ccgttttcta 3360
gttatattca gaaggacggc ttagtcaacc actttgcact tccaaaatgc cttccctctc 3420
ttcagagtgt ctctcagagc acatggacct tcctcattgg tcagattttc tgtcagtacc 3480
accaacaatt gctattggtc cattttgaag attctcccgc cttcttttac ctaattggtt 3540
tattcgaaaa ggcggtcttt tgttcgaata aaagacgatc tacgattggt tactgcaaac 3600
agagccaatg agagcgagtc ggtgattggt tcctctgatt tgggcgggct agataaaggt 3660
tcaaatgaaa ctagggaagc tctcctaacc gacaagcgtc tgtgagggga gcgtccaggt 3720
cccgcgtcgc gcgtcgcggg tcgcctagcg tttcccgctg gttttgtcgc tttccggatt 3780
ctcgagcctc ttcaggaccg tcaactagtg attaccgttc gtatagcata cattatacga 3840
agttatacca tgtctagact ggacaagagc aaagtcataa acggcgctct ggaattactc 3900
aatggagtcg gtatcgaagg cctgacgaca aggaaactcg ctcaaaagct gggagttgag 3960
cagcctaccc tgtactggca cgtgaagaac aagcgggccc tgctcgatgc cctgccaatc 4020
gagatgctgg acaggcatca tacccacttc tgccccctgg aaggcgagtc atggcaagac 4080
tttctgcgga acaacgccaa gtcattccgc tgtgctctcc tctcacatcg cgacggggct 4140
aaagtgcatc tcggcacccg cccaacagag aaacagtacg aaaccctgga aaatcagctc 4200
gcgttcctgt gtcagcaagg cttctccctg gagaacgcac tgtacgctct gtccgccgtg 4260
ggccacttta cactgggctg cgtattggag gaacaggagc atcaagtagc aaaagaggaa 4320
agagagacac ctaccaccga ttctatgccc ccacttctga gacaagcaat tgagctgttc 4380
gaccggcagg gagccgaacc tgccttcctt ttcggcctgg aactaatcat atgtggcctg 4440
gagaaacagc taaagtgcga aagcggcggg ccggccgacg cccttgacga ttttgactta 4500
gacatgctcc cagccgatgc ccttgacgac tttgaccttg atatgctgcc tgctgacgct 4560
cttgacgatt ttgaccttga catgctcccc gggtaactaa gtaaggatcc caaataccac 4620
tgaattaaga attccgcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 4680
tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 4740
gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 4800
cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 4860
aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 4920
ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 4980
cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 5040
caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 5100
atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 5160
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 5220
ccatgaccga gtacaagccc acggtgcgcc tcgccacccg cgacgacgtc ccccgggccg 5280
tacgcaccct cgccgccgcg ttcgccgact accccgccac gcgccacacc gtcgacccgg 5340
accgccacat cgagcgggtc accgagctgc aagaactctt cctcacgcgc gtcgggctcg 5400
acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt ggcggtctgg accacgccgg 5460
agagcgtcga agcgggggcg gtgttcgccg agatcggccc gcgcatggcc gagttgagcg 5520
gttcccggct ggccgcgcag caacagatgg aaggcctcct ggcgccgcac cggcccaagg 5580
agcccgcgtg gttcctggcc accgtcggcg tctcgcccga ccaccagggc aagggtctgg 5640
gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg cgccggggtg cccgccttcc 5700
tggagacctc cgcgccccgc aacctcccct tctacgagcg gctcggcttc accgtcaccg 5760
ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat gacccgcaag cccggtgcct 5820
gaggatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 5880
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 5940
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 6000
gaggtgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtat ggctgattat 6060
gatcctctag agtcgcagat ccagacatga taagatacat tgatgagttt ggacaaacca 6120
caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 6180
ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 6240
ttcaggttca gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg 6300
gtatggctga ttatgatcct ctagagtcgc agatccagac atgataagat acattgatga 6360
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 6420
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 6480
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 6540
cctctacaaa tgtggtatgg ctgattatga tcctctagag tcgcagatcc tctagagtcg 6600
cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga 6660
cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc 6720
tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat gagtatttgg 6780
tttagagttt ggcaacatat gccatatgct ggctgccatg aacaaaggtg gctataaaga 6840
ggtcatcagt atatgaaaca gccccctgct gtccattcct tattccatag aaaagccttg 6900
acttgaggtt agattttttt tatattttgt tttgtgttat ttttttcttt aacatcccta 6960
aaattttcct tacatgtttt actagccaga tttttcctcc tctcctgact actcccagtc 7020
atagctgtcc ctcttctctt atgaagatcc ctcgacctgc agcccaagct tatcgaattc 7080
ccgcggtggc ggccgcacgt ctccctatca gtgatagaga agtcgacacg tctcgagctc 7140
cctatcagtg atagagaagg tacgtctaga acgtctccct atcagtgata gagaagtcga 7200
cacgtctcga gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt 7260
gatagagaag tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac 7320
gtctccctat cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa 7380
ggtaccccct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 7440
ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgccat 7500
ggagttgtca ccgctgcagg tacagctcgc ggatggggcc gggtagtaga gcctttacgt 7560
ggcctctgcg ttcatggctg acggcgagag ttgaggttcc agggccgagc gctggccggc 7620
gaccggctgg atccggtcag ccccatcttc tgggccttga ggggtcgtgg actgggtgaa 7680
gctctttccg aaatgatatc tataatctaa tctgggttct tgagtgttgt gtttttattg 7740
tttgtgggag caggttcaac tagtcctgcg atcggtctgt agtctaatgg cttctgtgtg 7800
acttccagcc ggcttatact cgaattcagt ggccctcttc ccttccctgg gtgatttgaa 7860
taactcatca cggaaggtgc agagcatggc agttcccatt gaggagctgg ccgaccgagt 7920
ggctcaaaaa aagtccagtt tcgggatgtg aatgtagcca agggtttgca ttgctagcat 7980
cccaactgct acgggtggat accatctgta atcggcacga gcctatgtcg gcactcacta 8040
aatattttcc cattagatgg aagaagttga gtgtagttta tcgatgacat aaaaaatatt 8100
actcaaggca gaaatgtcca tacttgcaga actaaaatac ctatttaaac gggcatctgt 8160
agccagacct agtggggcag gcctgaaatg gcagctgctc cagagactga ggcaagagga 8220
tgccttaagc tatttaatgg gactctcaaa aacagcaaca gggggtgaaa aaaatggtct 8280
gggaattttg ctcagtggtc agagcatttg cctagcatgt gcatgcgacg tcgggcccaa 8340
ttcgccc 8347
<210> 94
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 94
caccgcatgg tgacggtcct gaag 24
<210> 95
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 95
aaaccttcag gaccgtcacc atgc 24
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 96
caccgccgct gcaggtacag ctcg 24
<210> 97
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 97
aaaccgagct gtacctgcag cggc 24
<210> 98
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 98
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ccgctgcagg tacagctcgg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 99
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 99
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg catggtgacg gtcctgaagg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 100
<211> 874
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 100
catttcagat tcgaaccatg acacatttcc atagcagctg tgccatttta caccacccac 60
cccaatgttc caccaggctt ctatgaaacc actgattata taagtatttt cctgattaga 120
gtacacgttc atgatagatc atttagaaaa ctcaaaaaag caaaatgacg aaattctctt 180
tattctaatt acggagccat gacctgaatt catattactc ccgggagaaa aggaaaagcc 240
ggtttttttc tcaggcaatt ctgtcattgt gtttgatagc atggtccaat aatagtgctg 300
gcgcctgccc tgcctggacc ttgtcctcag attcctccgt cctggctgtc cccacgaccc 360
tatcttctga aaaggtcatg cagttaacca ggcttctgaa tcatatttgc tggttgcttt 420
caggagtgtc acgggtgctg tgtggagctg tcacattctt gggcatctgt ttccgtattt 480
ttaaagccac ctcaacgttt gatagaaaag cataaaactt ttgaggaagt gagctctaca 540
aacccaccac ccacgtaaga actgagccgt cctgcccaga gggcatctga aaaagagatc 600
aacaggaaaa gggtggggaa atcctgcctt ccttcccgtc ttcaagtacc cattggcttc 660
agacctttat tctcattggt ttatctggat gtcgctccac gctggctttc cagaaccagc 720
cactgagagt cacaaagttg ggatttaaaa gatgcggtgg gaggggcggg tgattttttg 780
aactgctggc gaccgagttc tggcggtcct gacgcgcacc ttgggcttgc tcgcgttcgg 840
tttcggcagc aggaccaaga aggcttaggg aagg 874
<210> 101
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 101
aattcctgca ggcatttcag attcgaacca tgacacattt cc 42
<210> 102
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 102
ttactagtcc ttccctaagc cttcttggtc ctgctgc 37
<210> 103
<211> 825
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 103
gcccgcgtcg caaaccgcag accccaagga ggagaccctc cagcccggcg cctggaccct 60
cgcgacagag ctccagtgta ggtaagcgag cctgccctgc acctccgagg ccggtgcggt 120
catcctgtgg ggccgggcct gtagagggac ggttcctggt cacggcttgc cgctaacctc 180
gcgtaggggt aatggttttt ttgtttattt gtttgtttgt ttgcttgttt gttcctgacc 240
ggtttacagc agggagaaaa acgaaatgca gacaagacaa ggagttggag caaagacaaa 300
ctcattctga cggacacggg gtcttttttt gcatttattt actttgcatg tattttgcat 360
ttattttgtg ttcgtgctct ggcgacggcc agaagagagc gtcggaaccc cggggccgga 420
gttacagttg tgagctgccc ttttttttag agtgctagga agagaactcg gcccccctgg 480
aagagcagcc tgggctatta acagctgaac cagctttcta actcctactc tttattattt 540
atttgcagca ctagagatgg aacccaggac tccgtgtatg ttaggcaagg gttctactac 600
agaactatat ccccaaccct ctccccgacc cttttttttt taagacggga actcggtatg 660
tatcggtgtg tagccttggc ttgctgacct gaaacgtgct atgtagacta ggctagccta 720
gagctcacag atctctgcct gtgttgggga tggttgtatg cagtgtgtat tcaggaacta 780
tttctgagat ctggttacaa tccagacact gcctcaatgt gatgt 825
<210> 104
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 104
agccatgggc ccgcgtcgca aac 23
<210> 105
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 105
aattgcatgc acatcacatt gaggcagtgt ctgg 34
<210> 106
<211> 8358
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 106
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcatttca 2940
gattcgaacc atgacacatt tccatagcag ctgtgccatt ttacaccacc caccccaatg 3000
ttccaccagg cttctatgaa accactgatt atataagtat tttcctgatt agagtacacg 3060
ttcatgatag atcatttaga aaactcaaaa aagcaaaatg acgaaattct ctttattcta 3120
attacggagc catgacctga attcatatta ctcccgggag aaaaggaaaa gccggttttt 3180
ttctcaggca attctgtcat tgtgtttgat agcatggtcc aataatagtg ctggcgcctg 3240
ccctgcctgg accttgtcct cagattcctc cgtcctggct gtccccacga ccctatcttc 3300
tgaaaaggtc atgcagttaa ccaggcttct gaatcatatt tgctggttgc tttcaggagt 3360
gtcacgggtg ctgtgtggag ctgtcacatt cttgggcatc tgtttccgta tttttaaagc 3420
cacctcaacg tttgatagaa aagcataaaa cttttgagga agtgagctct acaaacccac 3480
cacccacgta agaactgagc cgtcctgccc agagggcatc tgaaaaagag atcaacagga 3540
aaagggtggg gaaatcctgc cttccttccc gtcttcaagt acccattggc ttcagacctt 3600
tattctcatt ggtttatctg gatgtcgctc cacgctggct ttccagaacc agccactgag 3660
agtcacaaag ttgggattta aaagatgcgg tgggaggggc gggtgatttt ttgaactgct 3720
ggcgaccgag ttctggcggt cctgacgcgc accttgggct tgctcgcgtt cggtttcggc 3780
agcaggacca agaaggctta gggaaggact agtgattacc gttcgtatag catacattat 3840
acgaagttat accatgtcta gactggacaa gagcaaagtc ataaacggcg ctctggaatt 3900
actcaatgga gtcggtatcg aaggcctgac gacaaggaaa ctcgctcaaa agctgggagt 3960
tgagcagcct accctgtact ggcacgtgaa gaacaagcgg gccctgctcg atgccctgcc 4020
aatcgagatg ctggacaggc atcataccca cttctgcccc ctggaaggcg agtcatggca 4080
agactttctg cggaacaacg ccaagtcatt ccgctgtgct ctcctctcac atcgcgacgg 4140
ggctaaagtg catctcggca cccgcccaac agagaaacag tacgaaaccc tggaaaatca 4200
gctcgcgttc ctgtgtcagc aaggcttctc cctggagaac gcactgtacg ctctgtccgc 4260
cgtgggccac tttacactgg gctgcgtatt ggaggaacag gagcatcaag tagcaaaaga 4320
ggaaagagag acacctacca ccgattctat gcccccactt ctgagacaag caattgagct 4380
gttcgaccgg cagggagccg aacctgcctt ccttttcggc ctggaactaa tcatatgtgg 4440
cctggagaaa cagctaaagt gcgaaagcgg cgggccggcc gacgcccttg acgattttga 4500
cttagacatg ctcccagccg atgcccttga cgactttgac cttgatatgc tgcctgctga 4560
cgctcttgac gattttgacc ttgacatgct ccccgggtaa ctaagtaagg atcccaaata 4620
ccactgaatt aagaattccg cccctctccc tccccccccc ctaacgttac tggccgaagc 4680
cgcttggaat aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct 4740
tttggcaatg tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt 4800
ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct 4860
ctggaagctt cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc 4920
ccacctggcg acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag 4980
gcggcacaac cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc 5040
tcctcaagcg tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga 5100
tctgatctgg ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc 5160
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc 5220
acaaccatga ccgagtacaa gcccacggtg cgcctcgcca cccgcgacga cgtcccccgg 5280
gccgtacgca ccctcgccgc cgcgttcgcc gactaccccg ccacgcgcca caccgtcgac 5340
ccggaccgcc acatcgagcg ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg 5400
ctcgacatcg gcaaggtgtg ggtcgcggac gacggcgccg cggtggcggt ctggaccacg 5460
ccggagagcg tcgaagcggg ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg 5520
agcggttccc ggctggccgc gcagcaacag atggaaggcc tcctggcgcc gcaccggccc 5580
aaggagcccg cgtggttcct ggccaccgtc ggcgtctcgc ccgaccacca gggcaagggt 5640
ctgggcagcg ccgtcgtgct ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc 5700
ttcctggaga cctccgcgcc ccgcaacctc cccttctacg agcggctcgg cttcaccgtc 5760
accgccgacg tcgaggtgcc cgaaggaccg cgcacctggt gcatgacccg caagcccggt 5820
gcctgaggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 5880
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 5940
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 6000
gggggaggtg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtatggctga 6060
ttatgatcct ctagagtcgc agatccagac atgataagat acattgatga gtttggacaa 6120
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 6180
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 6240
atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa 6300
tgtggtatgg ctgattatga tcctctagag tcgcagatcc agacatgata agatacattg 6360
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 6420
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 6480
attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt taaagcaagt 6540
aaaacctcta caaatgtggt atggctgatt atgatcctct agagtcgcag atcctctaga 6600
gtcgcagatc tttttccctc tgccaaaaat tatggggaca tcatgaagcc ccttgagcat 6660
ctgacttctg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg gaattttttg 6720
tgtctctcac tcggaaggac atatgggagg gcaaatcatt taaaacatca gaatgagtat 6780
ttggtttaga gtttggcaac atatgccata tgctggctgc catgaacaaa ggtggctata 6840
aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc 6900
cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc 6960
cctaaaattt tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc 7020
agtcatagct gtccctcttc tcttatgaag atccctcgac ctgcagccca agcttatcga 7080
attcccgcgg tggcggccgc acgtctccct atcagtgata gagaagtcga cacgtctcga 7140
gctccctatc agtgatagag aaggtacgtc tagaacgtct ccctatcagt gatagagaag 7200
tcgacacgtc tcgagctccc tatcagtgat agagaaggta cgtctagaac gtctccctat 7260
cagtgataga gaagtcgaca cgtctcgagc tccctatcag tgatagagaa ggtacgtcta 7320
gaacgtctcc ctatcagtga tagagaagtc gacacgtctc gagctcccta tcagtgatag 7380
agaaggtacc ccctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg 7440
ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg 7500
ccatgggccc gcgtcgcaaa ccgcagaccc caaggaggag accctccagc ccggcgcctg 7560
gaccctcgcg acagagctcc agtgtaggta agcgagcctg ccctgcacct ccgaggccgg 7620
tgcggtcatc ctgtggggcc gggcctgtag agggacggtt cctggtcacg gcttgccgct 7680
aacctcgcgt aggggtaatg gtttttttgt ttatttgttt gtttgtttgc ttgtttgttc 7740
ctgaccggtt tacagcaggg agaaaaacga aatgcagaca agacaaggag ttggagcaaa 7800
gacaaactca ttctgacgga cacggggtct ttttttgcat ttatttactt tgcatgtatt 7860
ttgcatttat tttgtgttcg tgctctggcg acggccagaa gagagcgtcg gaaccccggg 7920
gccggagtta cagttgtgag ctgccctttt ttttagagtg ctaggaagag aactcggccc 7980
ccctggaaga gcagcctggg ctattaacag ctgaaccagc tttctaactc ctactcttta 8040
ttatttattt gcagcactag agatggaacc caggactccg tgtatgttag gcaagggttc 8100
tactacagaa ctatatcccc aaccctctcc ccgacccttt tttttttaag acgggaactc 8160
ggtatgtatc ggtgtgtagc cttggcttgc tgacctgaaa cgtgctatgt agactaggct 8220
agcctagagc tcacagatct ctgcctgtgt tggggatggt tgtatgcagt gtgtattcag 8280
gaactatttc tgagatctgg ttacaatcca gacactgcct caatgtgatg tgcatgcgac 8340
gtcgggccca attcgccc 8358
<210> 107
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 107
caccgtcgca aaccgcagac ccca 24
<210> 108
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 108
aaactggggt ctgcggtttg cgac 24
<210> 109
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 109
caccgtggct ggcctcgagg ggcc 24
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 110
aaacggcccc tcgaggccag ccac 24
<210> 111
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 111
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg tcgcaaaccg cagaccccag ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 112
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 112
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg tggctggcct cgaggggccg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 113
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 113
tctggaactc actatgtagg tctactggc 29
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 114
ttgacctcca tagaagacac cg 22
<210> 115
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 115
ctcttcttct cacctggtct cttcaggacc 30
<210> 116
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 116
acctcctctc cttacatgct ggtc 24
<210> 117
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 117
tacattccac tggcagctta ggg 23
<210> 118
<211> 617
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 118
ggagctccgg cgctgcccca gatctggcag ctgtacctca agaactaccg catcgccacc 60
ttcaagaact ggcccttcct ggaggactgc gcctgcaccc cagagcgagt gagtcccagc 120
ttccagcgac tccaccctgg gcccgacggt gccttagttg tgtgacccgg gatcagaacc 180
cgctatcccc accctcgctt cgtactgtta gccaggctgc tttgctctgc tctgtcctcc 240
acgaggccac cccccccccc cgctctcccc accctctgcc tgaaccactg ttagcctccg 300
ggcctcttcc cactgtcctc agttctcggc ccggaacgat ctctgggaat catgggataa 360
ggtcagactg ttgatcccgc tcacgagctg tcattttcag atggcggagg ctggcttcat 420
ccactgccct accgagaacg agcctgattt ggcccagtgt tttttctgct ttaaggaatt 480
ggaaggctgg gaacccgatg acaacccgat gtaagtccca caggctactc tcggtgggtt 540
tcctggtgtt ccccttccat tgagagcctt ttgggttgaa ctggagttgg gacaaaccat 600
ttgtatttag tagaaga 617
<210> 119
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 119
caccatggga gctccggcgc tgccccagat c 31
<210> 120
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 120
taactggaac acttgagcaa gaagcatgct cttc 34
<210> 121
<211> 775
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 121
cagtgtgaag ctctttagaa gccactgcaa ccacaggccg cccgacagga acagagacac 60
tgaaaacggg cccgcagcaa ggcaggctca gcagccaaca gtcacaccca ggaagcagta 120
tttttcttct gctcctggac tctcttgcgg tgtatggctg cttccctttg gtctgagcca 180
ggccgatggt ctcagaaata gacacccatt gactttcttt tccagcgctg ggacatacag 240
accccgcctc catcccaggg tgtctatagg aaggatggcg gctgctgcag ggaggagggt 300
ctcctgtctt cctaagggcg cccctccacc agcctgtggg tgggtccgag gcacttccat 360
tccgatatct agctggccaa atcctgcaaa ccttgaggca ggaagaacct gcagagcaca 420
tgggacttgc agcggacatg ctttaaagag gtgccccagg cccgtccacc gccctcggcc 480
accctccgtg tcctctgggg agcagctgcg gaagattcga gtcagaatag caagaaggaa 540
ccgcagcaga aggtacaact cccagcatgc cctgcgcccg ccacgcccac aaggccaggc 600
gcagatgggc gtggggcggg actttcccgg ctcgcctcgc gccgtccact cccagaaggc 660
agcgggcgag ggcgtggggc cggggctctc ccggcatgct ctgcggcgcg cctccgcccg 720
cgcgatttga atcctgcgtt tgagtcgtct tggcggaggt tgtggtgacg ccatc 775
<210> 122
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 122
aattcctgca ggcagtgtga agctctttag aagccactg 39
<210> 123
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 123
ttactagtga tggcgtcacc acaacctccg ccaag 35
<210> 124
<211> 8050
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 124
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcagtgtg 2940
aagctcttta gaagccactg caaccacagg ccgcccgaca ggaacagaga cactgaaaac 3000
gggcccgcag caaggcaggc tcagcagcca acagtcacac ccaggaagca gtatttttct 3060
tctgctcctg gactctcttg cggtgtatgg ctgcttccct ttggtctgag ccaggccgat 3120
ggtctcagaa atagacaccc attgactttc ttttccagcg ctgggacata cagaccccgc 3180
ctccatccca gggtgtctat aggaaggatg gcggctgctg cagggaggag ggtctcctgt 3240
cttcctaagg gcgcccctcc accagcctgt gggtgggtcc gaggcacttc cattccgata 3300
tctagctggc caaatcctgc aaaccttgag gcaggaagaa cctgcagagc acatgggact 3360
tgcagcggac atgctttaaa gaggtgcccc aggcccgtcc accgccctcg gccaccctcc 3420
gtgtcctctg gggagcagct gcggaagatt cgagtcagaa tagcaagaag gaaccgcagc 3480
agaaggtaca actcccagca tgccctgcgc ccgccacgcc cacaaggcca ggcgcagatg 3540
ggcgtggggc gggactttcc cggctcgcct cgcgccgtcc actcccagaa ggcagcgggc 3600
gagggcgtgg ggccggggct ctcccggcat gctctgcggc gcgcctccgc ccgcgcgatt 3660
tgaatcctgc gtttgagtcg tcttggcgga ggttgtggtg acgccatcac tagtgattac 3720
cgttcgtata gcatacatta tacgaagtta taccatgtct agactggaca agagcaaagt 3780
cataaacggc gctctggaat tactcaatgg agtcggtatc gaaggcctga cgacaaggaa 3840
actcgctcaa aagctgggag ttgagcagcc taccctgtac tggcacgtga agaacaagcg 3900
ggccctgctc gatgccctgc caatcgagat gctggacagg catcataccc acttctgccc 3960
cctggaaggc gagtcatggc aagactttct gcggaacaac gccaagtcat tccgctgtgc 4020
tctcctctca catcgcgacg gggctaaagt gcatctcggc acccgcccaa cagagaaaca 4080
gtacgaaacc ctggaaaatc agctcgcgtt cctgtgtcag caaggcttct ccctggagaa 4140
cgcactgtac gctctgtccg ccgtgggcca ctttacactg ggctgcgtat tggaggaaca 4200
ggagcatcaa gtagcaaaag aggaaagaga gacacctacc accgattcta tgcccccact 4260
tctgagacaa gcaattgagc tgttcgaccg gcagggagcc gaacctgcct tccttttcgg 4320
cctggaacta atcatatgtg gcctggagaa acagctaaag tgcgaaagcg gcgggccggc 4380
cgacgccctt gacgattttg acttagacat gctcccagcc gatgcccttg acgactttga 4440
ccttgatatg ctgcctgctg acgctcttga cgattttgac cttgacatgc tccccgggta 4500
actaagtaag gatcccaaat accactgaat taagaattcc gcccctctcc ctcccccccc 4560
cctaacgtta ctggccgaag ccgcttggaa taaggccggt gtgcgtttgt ctatatgtta 4620
ttttccacca tattgccgtc ttttggcaat gtgagggccc ggaaacctgg ccctgtcttc 4680
ttgacgagca ttcctagggg tctttcccct ctcgccaaag gaatgcaagg tctgttgaat 4740
gtcgtgaagg aagcagttcc tctggaagct tcttgaagac aaacaacgtc tgtagcgacc 4800
ctttgcaggc agcggaaccc cccacctggc gacaggtgcc tctgcggcca aaagccacgt 4860
gtataagata cacctgcaaa ggcggcacaa ccccagtgcc acgttgtgag ttggatagtt 4920
gtggaaagag tcaaatggct ctcctcaagc gtattcaaca aggggctgaa ggatgcccag 4980
aaggtacccc attgtatggg atctgatctg gggcctcggt gcacatgctt tacatgtgtt 5040
tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg ggacgtggtt ttcctttgaa 5100
aaacacgatg ataatatggc cacaaccatg accgagtaca agcccacggt gcgcctcgcc 5160
acccgcgacg acgtcccccg ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 5220
gccacgcgcc acaccgtcga cccggaccgc cacatcgagc gggtcaccga gctgcaagaa 5280
ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 5340
gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 5400
ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 5460
ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 5520
cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 5580
gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac 5640
gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 5700
tgcatgaccc gcaagcccgg tgcctgagga tccagacatg ataagataca ttgatgagtt 5760
tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc 5820
tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat 5880
tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca agtaaaacct 5940
ctacaaatgt ggtatggctg attatgatcc tctagagtcg cagatccaga catgataaga 6000
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 6060
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 6120
aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa 6180
agcaagtaaa acctctacaa atgtggtatg gctgattatg atcctctaga gtcgcagatc 6240
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 6300
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 6360
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 6420
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg tatggctgat tatgatcctc 6480
tagagtcgca gatcctctag agtcgcagat ctttttccct ctgccaaaaa ttatggggac 6540
atcatgaagc cccttgagca tctgacttct ggctaataaa ggaaatttat tttcattgca 6600
atagtgtgtt ggaatttttt gtgtctctca ctcggaagga catatgggag ggcaaatcat 6660
ttaaaacatc agaatgagta tttggtttag agtttggcaa catatgccat atgctggctg 6720
ccatgaacaa aggtggctat aaagaggtca tcagtatatg aaacagcccc ctgctgtcca 6780
ttccttattc catagaaaag ccttgacttg aggttagatt ttttttatat tttgttttgt 6840
gttatttttt tctttaacat ccctaaaatt ttccttacat gttttactag ccagattttt 6900
cctcctctcc tgactactcc cagtcatagc tgtccctctt ctcttatgaa gatccctcga 6960
cctgcagccc aagcttatcg aattcccgcg gtggcggccg cacgtctccc tatcagtgat 7020
agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtacgt ctagaacgtc 7080
tccctatcag tgatagagaa gtcgacacgt ctcgagctcc ctatcagtga tagagaaggt 7140
acgtctagaa cgtctcccta tcagtgatag agaagtcgac acgtctcgag ctccctatca 7200
gtgatagaga aggtacgtct agaacgtctc cctatcagtg atagagaagt cgacacgtct 7260
cgagctccct atcagtgata gagaaggtac cccctatata agcagagctc gtttagtgaa 7320
ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 7380
ccgatccagc ctccgcggcc gccatgggag ctccggcgct gccccagatc tggcagctgt 7440
acctcaagaa ctaccgcatc gccaccttca agaactggcc cttcctggag gactgcgcct 7500
gcaccccaga gcgagtgagt cccagcttcc agcgactcca ccctgggccc gacggtgcct 7560
tagttgtgtg acccgggatc agaacccgct atccccaccc tcgcttcgta ctgttagcca 7620
ggctgctttg ctctgctctg tcctccacga ggccaccccc cccccccgct ctccccaccc 7680
tctgcctgaa ccactgttag cctccgggcc tcttcccact gtcctcagtt ctcggcccgg 7740
aacgatctct gggaatcatg ggataaggtc agactgttga tcccgctcac gagctgtcat 7800
tttcagatgg cggaggctgg cttcatccac tgccctaccg agaacgagcc tgatttggcc 7860
cagtgttttt tctgctttaa ggaattggaa ggctgggaac ccgatgacaa cccgatgtaa 7920
gtcccacagg ctactctcgg tgggtttcct ggtgttcccc ttccattgag agccttttgg 7980
gttgaactgg agttgggaca aaccatttgt atttagtaga agagcatgcg acgtcgggcc 8040
caattcgccc 8050
<210> 125
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 125
caccggacgc catcatggga gctc 24
<210> 126
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 126
aaacgagctc ccatgatggc gtcc 24
<210> 127
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 127
caccggccaa gacgactcaa acgc 24
<210> 128
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 128
aaacgcgttt gagtcgtctt ggcc 24
<210> 129
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 129
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gacgccatca tgggagctcg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 130
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 130
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gccaagacga ctcaaacgcg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 131
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 131
cactcgtttg caacgccaac ctgg 24
<210> 132
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 132
gaacccgatg acaacccgat ag 22
<210> 133
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 133
tccatctgct tcttgacagt gagg 24
<210> 134
<211> 817
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 134
gattaaaggc gtgcaccact actgtctgcc ttttgttttg gttttatcat aattgttgca 60
tttttgcccg caggaggatc aggaattcaa ggacaacctc tacagccaac ccagttgagg 120
gccagcctgt tctatcgaga tcctgtctcc ggacaaaaaa agtttcatga gagcgtggtg 180
tgttggcaca gtcttttagt ccgagcactg acgcagtaga ttaaggcaga tcttcatgat 240
ttggtgcggt cctgggctgc atccaaagac cttgtttcca aaacaaacaa acgaaaaagt 300
gtaataaaaa tacaagcaag gttttgcaga aataaatctg tggcctcaag ggtccctttc 360
tccagctttt cccagaggtg tcaaattaca taacagtctc aaacccagga aattgaactt 420
tggcacaacc cactgaccgg tccgaatttc aaagtctttt tcctattgac ctacaaggtt 480
ttcaagaatc atgttgtaag caactgtgtt ctgaggaatc tatgtttaaa aacccatccg 540
tggatcttgg cccagggtcc agagactgag ctagccacgc cccggccgcg ccgcagccac 600
tcccacggca gttcaagtgt taagtcccaa agaccgcgct ctgtgcatgc gcagacccgt 660
ccacagctgg ctcctagcca acccggccgg acgagcaccc ggcgccgtca cgtgacgcac 720
ccaaccggcg tcgacctata aaaggccggg cgttgacgtc agcggtctct tccgccgcag 780
ccgccgccat cgtcggcgcg cttccctgtt cacctct 817
<210> 135
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 135
tttaacctgc agggattaaa ggcgtgcacc actactg 37
<210> 136
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 136
tatataacta gtagaggtga acagggaagc gcgccg 36
<210> 137
<211> 826
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 137
gactctgaga atccgtcgcc atccgccacc atggtgagtc tcctcggctc cgctagactc 60
ggggaccgag acgaatctct ggggcagcgg gacgtggctg tagcgggacg ctgagaggga 120
cgggaggaag agacatggct gccctggccc gggcggcagg acgtggtcgg gccgcggcgc 180
catatctgcg cgtccctgag ggccttggga gtgtcaactg ccgaggtcgg ggtgttttct 240
tgaagtcctt caactccccg cggccgccgg ggtgactgcg ggaggggttg tgcttggtga 300
tgtggcagcg ggcaaagcgc cgtccccgcg cccctggtga cgggcggagg gtgtcctcgg 360
gaggtgacag cctgtagggc tggcttcctt ggacacctcc agtgggctga acgccttccg 420
ggccctttcc ggtagccccc gtctctgttt tctatctgag ttcacacgtg agcaccggtc 480
cccataatct aagaaagtgg ctcactgggc ctagtggcgc attgtggcct ttgatccggg 540
ctttgacctt ggcgcacagc acccagtggt ttggggaaga ggtgtgtgta gcagaggagg 600
ttttttcgtg ctttggtccc aatcaatccg gcatctttgc agtgccgagg tggccgtgca 660
ccttggcttt gaattcttgt gctgaggtta tgtgacttga gcctcaagat agggtcttct 720
agcacaggct tgctcttaag tgtcgcagtt gtcggtttcg gcgtttgttt agagctgtgg 780
acacatctgt gaacttttga tgcttatttc agaggtcctg ggttgt 826
<210> 138
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 138
ttatagcatg cgactctgag aatccgtcgc catccg 36
<210> 139
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 139
ttatagcatg cacaacccag gacctctgaa ataagc 36
<210> 140
<211> 8317
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 140
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc agggattaaa 2940
ggcgtgcacc actactgtct gccttttgtt ttggttttat cataattgtt gcatttttgc 3000
ccgcaggagg atcaggaatt caaggacaac ctctacagcc aacccagttg agggccagcc 3060
tgttctatcg agatcctgtc tccggacaaa aaaagtttca tgagagcgtg gtgtgttggc 3120
acagtctttt agtccgagca ctgacgcagt agattaaggc agatcttcat gatttggtgc 3180
ggtcctgggc tgcatccaaa gaccttgttt ccaaaacaaa caaacgaaaa agtgtaataa 3240
aaatacaagc aaggttttgc agaaataaat ctgtggcctc aagggtccct ttctccagct 3300
tttcccagag gtgtcaaatt acataacagt ctcaaaccca ggaaattgaa ctttggcaca 3360
acccactgac cggtccgaat ttcaaagtct ttttcctatt gacctacaag gttttcaaga 3420
atcatgttgt aagcaactgt gttctgagga atctatgttt aaaaacccat ccgtggatct 3480
tggcccaggg tccagagact gagctagcca cgccccggcc gcgccgcagc cactcccacg 3540
gcagttcaag tgttaagtcc caaagaccgc gctctgtgca tgcgcagacc cgtccacagc 3600
tggctcctag ccaacccggc cggacgagca cccggcgccg tcacgtgacg cacccaaccg 3660
gcgtcgacct ataaaaggcc gggcgttgac gtcagcggtc tcttccgccg cagccgccgc 3720
catcgtcggc gcgcttccct gttcacctct actagtgatt accgttcgta tagcatacat 3780
tatacgaagt tataccatgt ctagactgga caagagcaaa gtcataaacg gcgctctgga 3840
attactcaat ggagtcggta tcgaaggcct gacgacaagg aaactcgctc aaaagctggg 3900
agttgagcag cctaccctgt actggcacgt gaagaacaag cgggccctgc tcgatgccct 3960
gccaatcgag atgctggaca ggcatcatac ccacttctgc cccctggaag gcgagtcatg 4020
gcaagacttt ctgcggaaca acgccaagtc attccgctgt gctctcctct cacatcgcga 4080
cggggctaaa gtgcatctcg gcacccgccc aacagagaaa cagtacgaaa ccctggaaaa 4140
tcagctcgcg ttcctgtgtc agcaaggctt ctccctggag aacgcactgt acgctctgtc 4200
cgccgtgggc cactttacac tgggctgcgt attggaggaa caggagcatc aagtagcaaa 4260
agaggaaaga gagacaccta ccaccgattc tatgccccca cttctgagac aagcaattga 4320
gctgttcgac cggcagggag ccgaacctgc cttccttttc ggcctggaac taatcatatg 4380
tggcctggag aaacagctaa agtgcgaaag cggcgggccg gccgacgccc ttgacgattt 4440
tgacttagac atgctcccag ccgatgccct tgacgacttt gaccttgata tgctgcctgc 4500
tgacgctctt gacgattttg accttgacat gctccccggg taactaagta aggatcccaa 4560
ataccactga attaagaatt ccgcccctct ccctcccccc cccctaacgt tactggccga 4620
agccgcttgg aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg 4680
tcttttggca atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg 4740
ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt 4800
cctctggaag cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac 4860
cccccacctg gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca 4920
aaggcggcac aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg 4980
ctctcctcaa gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg 5040
ggatctgatc tggggcctcg gtgcacatgc tttacatgtg tttagtcgag gttaaaaaac 5100
gtctaggccc cccgaaccac ggggacgtgg ttttcctttg aaaaacacga tgataatatg 5160
gccacaacca tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 5220
cgggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 5280
gacccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 5340
gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 5400
acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 5460
ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 5520
cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 5580
ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 5640
gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 5700
gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 5760
ggtgcctgag gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag 5820
aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 5880
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 5940
tcagggggag gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc 6000
tgattatgat cctctagagt cgcagatcca gacatgataa gatacattga tgagtttgga 6060
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 6120
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 6180
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta aaacctctac 6240
aaatgtggta tggctgatta tgatcctcta gagtcgcaga tccagacatg ataagataca 6300
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 6360
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 6420
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 6480
agtaaaacct ctacaaatgt ggtatggctg attatgatcc tctagagtcg cagatcctct 6540
agagtcgcag atctttttcc ctctgccaaa aattatgggg acatcatgaa gccccttgag 6600
catctgactt ctggctaata aaggaaattt attttcattg caatagtgtg ttggaatttt 6660
ttgtgtctct cactcggaag gacatatggg agggcaaatc atttaaaaca tcagaatgag 6720
tatttggttt agagtttggc aacatatgcc atatgctggc tgccatgaac aaaggtggct 6780
ataaagaggt catcagtata tgaaacagcc ccctgctgtc cattccttat tccatagaaa 6840
agccttgact tgaggttaga ttttttttat attttgtttt gtgttatttt tttctttaac 6900
atccctaaaa ttttccttac atgttttact agccagattt ttcctcctct cctgactact 6960
cccagtcata gctgtccctc ttctcttatg aagatccctc gacctgcagc ccaagcttat 7020
cgaattcccg cggtggcggc cgcacgtctc cctatcagtg atagagaagt cgacacgtct 7080
cgagctccct atcagtgata gagaaggtac gtctagaacg tctccctatc agtgatagag 7140
aagtcgacac gtctcgagct ccctatcagt gatagagaag gtacgtctag aacgtctccc 7200
tatcagtgat agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtacgt 7260
ctagaacgtc tccctatcag tgatagagaa gtcgacacgt ctcgagctcc ctatcagtga 7320
tagagaaggt accccctata taagcagagc tcgtttagtg aaccgtcaga tcgcctggag 7380
acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca gcctccgcgg 7440
ccgccatggc ggccgggagc atgcgactct gagaatccgt cgccatccgc caccatggtg 7500
agtctcctcg gctccgctag actcggggac cgagacgaat ctctggggca gcgggacgtg 7560
gctgtagcgg gacgctgaga gggacgggag gaagagacat ggctgccctg gcccgggcgg 7620
caggacgtgg tcgggccgcg gcgccatatc tgcgcgtccc tgagggcctt gggagtgtca 7680
actgccgagg tcggggtgtt ttcttgaagt ccttcaactc cccgcggccg ccggggtgac 7740
tgcgggaggg gttgtgcttg gtgatgtggc agcgggcaaa gcgccgtccc cgcgcccctg 7800
gtgacgggcg gagggtgtcc tcgggaggtg acagcctgta gggctggctt ccttggacac 7860
ctccagtggg ctgaacgcct tccgggccct ttccggtagc ccccgtctct gttttctatc 7920
tgagttcaca cgtgagcacc ggtccccata atctaagaaa gtggctcact gggcctagtg 7980
gcgcattgtg gcctttgatc cgggctttga ccttggcgca cagcacccag tggtttgggg 8040
aagaggtgtg tgtagcagag gaggtttttt cgtgctttgg tcccaatcaa tccggcatct 8100
ttgcagtgcc gaggtggccg tgcaccttgg ctttgaattc ttgtgctgag gttatgtgac 8160
ttgagcctca agatagggtc ttctagcaca ggcttgctct taagtgtcgc agttgtcggt 8220
ttcggcgttt gtttagagct gtggacacat ctgtgaactt ttgatgctta tttcagaggt 8280
cctgggttgt gcatgcgacg tcgggcccaa ttcgccc 8317
<210> 141
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 141
caccgtcggc tccgctagac tcg 23
<210> 142
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 142
aaaccgagtc tagcggagcc gac 23
<210> 143
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 143
caccgactca ccatggtggc gga 23
<210> 144
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 144
aaactccgcc accatggtga gtc 23
<210> 145
<211> 8435
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 145
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg tcggctccgc tagactcggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360
tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420
caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480
cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140
gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200
cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260
tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320
aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380
gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440
aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500
ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560
gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680
gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740
gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800
ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860
ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920
agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980
aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040
ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160
gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220
gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280
agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340
cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400
gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520
accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640
ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700
tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760
aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820
aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880
ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940
cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000
ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060
gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120
aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180
acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240
gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300
cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360
aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420
tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480
attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540
gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600
gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660
atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720
acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780
gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840
cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900
cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960
cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020
gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080
acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140
gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200
tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260
gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320
ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380
aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440
aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500
gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560
cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620
ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680
aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740
ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800
ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860
gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920
ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980
aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040
aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100
cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160
gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220
gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280
ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340
gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400
cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460
gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640
aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820
cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880
tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120
acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240
caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360
tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540
accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600
gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720
ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440
tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620
agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680
gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740
gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920
accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040
gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100
ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160
atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220
gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280
cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340
gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400
gttcctggcc ttttgctggc cttttgctca catgt 8435
<210> 146
<211> 8435
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 146
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg actcaccatg gtggcggagt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360
tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420
caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480
cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140
gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200
cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260
tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320
aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380
gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440
aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500
ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560
gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680
gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740
gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800
ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860
ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920
agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980
aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040
ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160
gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220
gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280
agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340
cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400
gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520
accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640
ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700
tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760
aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820
aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880
ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940
cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000
ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060
gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120
aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180
acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240
gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300
cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360
aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420
tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480
attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540
gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600
gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660
atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720
acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780
gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840
cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900
cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960
cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020
gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080
acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140
gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200
tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260
gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320
ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380
aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440
aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500
gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560
cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620
ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680
aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740
ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800
ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860
gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920
ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980
aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040
aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100
cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160
gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220
gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280
ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340
gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400
cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460
gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640
aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820
cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880
tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120
acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240
caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360
tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540
accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600
gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720
ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440
tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620
agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680
gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740
gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920
accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040
gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100
ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160
atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220
gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280
cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340
gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400
gttcctggcc ttttgctggc cttttgctca catgt 8435
<210> 147
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 147
agaccaggtt agccttgaac aaagatctcc 30
<210> 148
<211> 6681
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 148
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcggccgc 2940
gaattcacta gtgattaccg ttcgtatagc atacattata cgaagttata ccatgtctag 3000
actggacaag agcaaagtca taaacggcgc tctggaatta ctcaatggag tcggtatcga 3060
aggcctgacg acaaggaaac tcgctcaaaa gctgggagtt gagcagccta ccctgtactg 3120
gcacgtgaag aacaagcggg ccctgctcga tgccctgcca atcgagatgc tggacaggca 3180
tcatacccac ttctgccccc tggaaggcga gtcatggcaa gactttctgc ggaacaacgc 3240
caagtcattc cgctgtgctc tcctctcaca tcgcgacggg gctaaagtgc atctcggcac 3300
ccgcccaaca gagaaacagt acgaaaccct ggaaaatcag ctcgcgttcc tgtgtcagca 3360
aggcttctcc ctggagaacg cactgtacgc tctgtccgcc gtgggccact ttacactggg 3420
ctgcgtattg gaggaacagg agcatcaagt agcaaaagag gaaagagaga cacctaccac 3480
cgattctatg cccccacttc tgagacaagc aattgagctg ttcgaccggc agggagccga 3540
acctgccttc cttttcggcc tggaactaat catatgtggc ctggagaaac agctaaagtg 3600
cgaaagcggc gggccggccg acgcccttga cgattttgac ttagacatgc tcccagccga 3660
tgcccttgac gactttgacc ttgatatgct gcctgctgac gctcttgacg attttgacct 3720
tgacatgctc cccgggtaac taagtaagga tcccaaatac cactgaatta agaattccgc 3780
ccctctccct cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt 3840
gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg 3900
aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga 3960
atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa 4020
acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc 4080
tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac 4140
gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag 4200
gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc 4260
acatgcttta catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg 4320
acgtggtttt cctttgaaaa acacgatgat aatatggcca caaccatgac cgagtacaag 4380
cccacggtgc gcctcgccac ccgcgacgac gtcccccggg ccgtacgcac cctcgccgcc 4440
gcgttcgccg actaccccgc cacgcgccac accgtcgacc cggaccgcca catcgagcgg 4500
gtcaccgagc tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg 4560
gtcgcggacg acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg 4620
gcggtgttcg ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg 4680
cagcaacaga tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg 4740
gccaccgtcg gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc 4800
cccggagtgg aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc 4860
cgcaacctcc ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc 4920
gaaggaccgc gcacctggtg catgacccgc aagcccggtg cctgaggatc cagacatgat 4980
aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 5040
ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 5100
taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt 5160
ttaaagcaag taaaacctct acaaatgtgg tatggctgat tatgatcctc tagagtcgca 5220
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 5280
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 5340
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 5400
gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat 5460
cctctagagt cgcagatcca gacatgataa gatacattga tgagtttgga caaaccacaa 5520
ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 5580
taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 5640
aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta 5700
tggctgatta tgatcctcta gagtcgcaga tcctctagag tcgcagatct ttttccctct 5760
gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg ctaataaagg 5820
aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact cggaaggaca 5880
tatgggaggg caaatcattt aaaacatcag aatgagtatt tggtttagag tttggcaaca 5940
tatgccatat gctggctgcc atgaacaaag gtggctataa agaggtcatc agtatatgaa 6000
acagccccct gctgtccatt ccttattcca tagaaaagcc ttgacttgag gttagatttt 6060
ttttatattt tgttttgtgt tatttttttc tttaacatcc ctaaaatttt ccttacatgt 6120
tttactagcc agatttttcc tcctctcctg actactccca gtcatagctg tccctcttct 6180
cttatgaaga tccctcgacc tgcagcccaa gcttatcgaa ttcccgcggt ggcggccgca 6240
cgtctcccta tcagtgatag agaagtcgac acgtctcgag ctccctatca gtgatagaga 6300
aggtacgtct agaacgtctc cctatcagtg atagagaagt cgacacgtct cgagctccct 6360
atcagtgata gagaaggtac gtctagaacg tctccctatc agtgatagag aagtcgacac 6420
gtctcgagct ccctatcagt gatagagaag gtacgtctag aacgtctccc tatcagtgat 6480
agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtaccc cctatataag 6540
cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc catccacgct gttttgacct 6600
ccatagaaga caccgggacc gatccagcct ccgcggccgc catggcggcc gggagcatgc 6660
gacgtcgggc ccaattcgcc c 6681
<210> 149
<211> 8434
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 149
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140
ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200
ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atgtacccat 1260
acgatgttcc agattacgct tcgccgaaga aaaagcgcaa ggtcgaagcg tccgacaaga 1320
agtacagcat cggcctggcc atcggcacca actctgtggg ctgggccgtg atcaccgacg 1380
agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg cacagcatca 1440
agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag gccacccggc 1500
tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc tatctgcaag 1560
agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga ctggaagagt 1620
ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc aacatcgtgg 1680
acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag aaactggtgg 1740
acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac atgatcaagt 1800
tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac gtggacaagc 1860
tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc atcaacgcca 1920
gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga cggctggaaa 1980
atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggcaac ctgattgccc 2040
tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag gatgccaaac 2100
tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc cagatcggcg 2160
accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc ctgctgagcg 2220
acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct atgatcaaga 2280
gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc 2340
ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc ggctacattg 2400
acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg gaaaagatgg 2460
acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg aagcagcgga 2520
ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac gccattctgc 2580
ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc gagaagatcc 2640
tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc agattcgcct 2700
ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa gtggtggaca 2760
agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag aacctgccca 2820
acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg tataacgagc 2880
tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg agcggcgagc 2940
agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc 3000
tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg 3060
aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt atcaaggaca 3120
aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg ctgaccctga 3180
cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc cacctgttcg 3240
acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc aggctgagcc 3300
ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg gatttcctga 3360
agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac agcctgacct 3420
ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg cacgagcaca 3480
ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca gtgaaggtgg 3540
tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg atcgaaatgg 3600
ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga atgaagcgga 3660
tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc gtggaaaaca 3720
cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg gatatgtacg 3780
tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat atcgtgcctc 3840
agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc gacaagaacc 3900
ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag aactactggc 3960
ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg accaaggccg 4020
agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag ctggtggaaa 4080
cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac actaagtacg 4140
acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc aagctggtgt 4200
ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac taccaccacg 4260
cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc 4320
tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag atgatcgcca 4380
agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc aacatcatga 4440
actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg cctctgatcg 4500
agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt gccaccgtgc 4560
ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg 4620
gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc gccagaaaga 4680
aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc tattctgtgc 4740
tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg aaagagctgc 4800
tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac tttctggaag 4860
ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag tactccctgt 4920
tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg cagaagggaa 4980
acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc cactatgaga 5040
agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa cagcacaagc 5100
actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg atcctggccg 5160
acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag cccatcagag 5220
agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc cctgccgcct 5280
tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa gaggtgctgg 5340
acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc gacctgtctc 5400
agctgggagg cgacagcccc aagaagaaga gaaaggtgga ggccagctaa gaattcctag 5460
agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 5520
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 5580
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 5640
ggacagcaag ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga 5700
acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 5760
gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 5820
gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 5880
ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg 5940
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 6000
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 6060
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 6120
cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 6180
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 6240
aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc ggcctattgg 6300
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt 6360
acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc 6420
cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 6480
tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 6540
ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 6600
ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct 6660
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 6720
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 6780
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 6840
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 6900
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 6960
tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc 7020
ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 7080
catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 7140
aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 7200
ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 7260
gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 7320
aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 7380
gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 7440
gctgataaat ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca 7500
gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 7560
gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 7620
gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 7680
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 7740
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 7800
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 7860
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 7920
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 7980
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 8040
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 8100
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 8160
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 8220
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 8280
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 8340
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 8400
ttcctggcct tttgctggcc ttttgctcac atgt 8434
<210> 150
<211> 8506
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 150
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140
ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200
ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atggactata 1260
aggaccacga cggagactac aaggatcatg atattgatta caaagacgat gacgataaga 1320
tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt 1380
acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt 1440
acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga 1500
agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga 1560
agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga 1620
tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct 1680
tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg 1740
aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca 1800
gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc 1860
ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt 1920
tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 1980
gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc 2040
tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga 2100
gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc 2160
agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc 2220
agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca 2280
tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat 2340
acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg 2400
agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg 2460
gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg 2520
gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct 2580
tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc 2640
ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga 2700
ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga 2760
tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2820
gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg 2880
agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2940
ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga 3000
aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga 3060
aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag 3120
atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg 3180
acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac 3240
tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg 3300
acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga 3360
agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt 3420
ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta 3480
aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg 3540
ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg 3600
acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca 3660
gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg 3720
aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc 3780
agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg 3840
accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga 3900
gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg 3960
gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc 4020
agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga 4080
gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc 4140
ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg 4200
agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg 4260
atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc 4320
acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg 4380
aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga 4440
gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact 4500
ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga 4560
caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga 4620
aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct 4680
tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg 4740
actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg 4800
tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg 4860
ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca 4920
agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg 4980
agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg 5040
aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc 5100
tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact 5160
acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg 5220
ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc 5280
aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca 5340
agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg 5400
ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc 5460
tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt 5520
aagaattcct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 5580
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 5640
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 5700
tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 5760
gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 5820
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 5880
gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 5940
tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 6000
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 6060
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 6120
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 6180
gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 6240
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 6300
ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 6360
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 6420
atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 6480
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 6540
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 6600
tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 6660
gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 6720
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 6780
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 6840
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 6900
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 6960
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 7020
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 7080
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 7140
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 7200
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 7260
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 7320
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 7380
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 7440
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 7500
ggctggttta ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca 7560
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 7620
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 7680
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 7740
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 7800
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 7860
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 7920
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 7980
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 8040
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 8100
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 8160
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 8220
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 8280
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 8340
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 8400
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 8460
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 8506
<210> 151
<211> 8436
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 151
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gatcccggga gctttaccgg ttttagagct agaaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tgttttagag 360
ctagaaatag caagttaaaa taaggctagt ccgtttttag cgcgtgcgcc aattctgcag 420
acaaatggct ctagaggtac ccgttacata acttacggta aatggcccgc ctggctgacc 480
gcccaacgac ccccgcccat tgacgtcaat agtaacgcca atagggactt tccattgacg 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 600
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attgtgccca 660
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac 1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 1140
agctgagcaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt 1200
acctggagca cctgcctgaa atcacttttt ttcaggttgg accggtgcca ccatgtaccc 1260
atacgatgtt ccagattacg cttcgccgaa gaaaaagcgc aaggtcgaag cgtccgacaa 1320
gaagtacagc atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga 1380
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 1440
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 1500
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 1560
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 1620
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 1680
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 1740
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 1800
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1860
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1920
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1980
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggca acctgattgc 2040
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 2100
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 2160
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 2220
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 2280
gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 2340
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 2400
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 2460
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 2520
gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 2580
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 2640
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 2700
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 2760
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 2820
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2880
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2940
gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 3000
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 3060
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 3120
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 3180
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 3240
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 3300
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 3360
gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 3420
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 3480
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 3540
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 3600
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 3660
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 3720
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 3780
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3840
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3900
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3960
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 4020
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 4080
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 4140
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 4200
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 4260
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 4320
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 4380
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 4440
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 4500
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 4560
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 4620
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 4680
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 4740
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 4800
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4860
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4920
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 4980
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 5040
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 5100
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 5160
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 5220
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 5280
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 5340
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 5400
tcagctggga ggcgacagcc ccaagaagaa gagaaaggtg gaggccagct aagaattcct 5460
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5520
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5580
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5640
caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga gcggccgcag 5700
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 5760
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5820
gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5880
atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 5940
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6000
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6060
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6120
aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6180
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6240
tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6300
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 6360
ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6480
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6540
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 6600
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 6660
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 6720
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 6780
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 6840
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 6900
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 6960
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 7020
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 7080
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 7140
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 7200
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 7260
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 7320
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 7380
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 7440
ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 7500
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 7560
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 7620
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 7680
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 7740
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 7800
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 7860
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 7920
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 7980
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 8040
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 8100
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 8160
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 8220
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 8280
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 8340
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 8400
ggttcctggc cttttgctgg ccttttgctc acatgt 8436
<210> 152
<211> 8435
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 152
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccc tcgccgcggt aaagctccgt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt gttttagagc 360
tagaaatagc aagttaaaat aaggctagtc cgtttttagc gcgtgcgcca attctgcaga 420
caaatggctc tagaggtacc cgttacataa cttacggtaa atggcccgcc tggctgaccg 480
cccaacgacc cccgcccatt gacgtcaata gtaacgccaa tagggacttt ccattgacgt 540
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 600
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag 660
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 720
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 780
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 840
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 1020
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1080
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1140
gctgagcaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 1200
cctggagcac ctgcctgaaa tcactttttt tcaggttgga ccggtgccac catgtaccca 1260
tacgatgttc cagattacgc ttcgccgaag aaaaagcgca aggtcgaagc gtccgacaag 1320
aagtacagca tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac 1380
gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 1440
aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 1500
ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 1560
gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 1620
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 1680
gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 1740
gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 1800
ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 1860
ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 1920
agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 1980
aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc 2040
ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 2100
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 2160
gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 2220
gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 2280
agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 2340
cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 2400
gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 2460
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 2520
accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 2580
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 2640
ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 2700
tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 2760
aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 2820
aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 2880
ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 2940
cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 3000
ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 3060
gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 3120
aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 3180
acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 3240
gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 3300
cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 3360
aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 3420
tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 3480
attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 3540
gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 3600
gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 3660
atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 3720
acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 3780
gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 3840
cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 3900
cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 3960
cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 4020
gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 4080
acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 4140
gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 4200
tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 4260
gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 4320
ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 4380
aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 4440
aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 4500
gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 4560
cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 4620
ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 4680
aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 4740
ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 4800
ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 4860
gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 4920
ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 4980
aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 5040
aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 5100
cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 5160
gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 5220
gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 5280
ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 5340
gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 5400
cagctgggag gcgacagccc caagaagaag agaaaggtgg aggccagcta agaattccta 5460
gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 5520
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 5580
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 5640
aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag cggccgcagg 5700
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 5760
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 5820
cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 5880
tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc 5940
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6000
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6060
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6120
acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6180
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6240
caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6300
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 6360
tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540
accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 6600
gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6660
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6720
ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 6780
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6840
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6900
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6960
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 7020
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7080
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7140
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7200
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7260
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 7320
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7380
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7440
tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag cactggggcc 7500
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7560
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7620
agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 7680
gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 7740
gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 7800
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 7860
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 7920
accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 7980
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 8040
gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 8100
ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 8160
atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 8220
gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 8280
cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 8340
gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 8400
gttcctggcc ttttgctggc cttttgctca catgt 8435
Claims (42)
- CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 유전적 변형을 포함하는, 단리되고 유전적으로 변형된 동물 세포로서, 상기 유전적 변형은:
a) 음성 선택 마커 및 적어도 하나의 상기 유전자가 공동 발현되도록, 적어도 하나의 상기 유전자를 인코딩하는 DNA 서열에 전사적으로 연결된 음성 선택 마커를 인코딩하는 DNA 서열; 및
b) 적어도 하나의 상기 유전자에 작동 가능하게 연결된 외인성 유도성 전사 활성인자
중 하나 이상을 포함하는, 단리되고 유전적으로 변형된 동물 세포. - 제1항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
a) 음성 선택 마커를 포함하는 DNA 벡터;
b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것에 의해 생성된 것인, 단리되고 유전적으로 변형된 동물 세포. - 제1항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인, 단리되고 유전적으로 변형된 동물 세포.
- 제1항에 있어서,
상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인, 단리되고 유전적으로 변형된 동물 세포. - 제4항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인, 단리되고 유전적으로 변형된 동물 세포.
- 제1항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템(doxycycline inducible system), 큐메이트 스위치 유도성 시스템(cumate switch inducible system), 엑디손 유도성 시스템(ecdysone inducible system), 전파 유도성 시스템(radio wave inducible system) 또는 리간드 가역성 이량체화 시스템(ligand reversible dimerization system)인, 단리되고 유전적으로 변형된 동물 세포. - 제6항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
b) 시스템은 독시사이클린 유도성 시스템인, 단리되고 유전적으로 변형된 동물 세포. - 제7항에 있어서, 유전자는 CDK1인, 단리되고 유전적으로 변형된 동물 세포.
- 제7항에 있어서, 유전자는 CDK1 및 TOP2A인, 단리되고 유전적으로 변형된 동물 세포.
- 제1항에 있어서,
a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인, 단리되고 유전적으로 변형된 동물 세포. - 제1항 내지 제10항 중 어느 한 항에 따른 하나 이상의 유전적으로 변형된 동물 세포를 포함하는 조성물.
- 제11항에 있어서, 대상체를 치료하는 데 사용하기 위한 조성물.
- 제1항의 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 방법으로서,
a) 음성 선택 마커를 포함하는 단리되고 유전적으로 변형된 동물 세포를, 상기 음성 선택 마커의 유도인자와 접촉시켜 세포의 증식을 제어하거나; 또는
b) 외인성 유도성 전사 활성인자를 포함하는 단리되고 유전적으로 변형된 동물 세포를, 상기 외인성 유도성 전사 활성인자의 유도인자와 접촉시켜 세포의 증식을 제어하는 것
을 포함하는 방법. - 제13항에 있어서,
a) 음성 선택 마커를 포함하는 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 것이
i) 세포를 상기 음성 선택 마커의 유도인자의 부재 하에 유지시킴으로써, 상기 세포의 증식을 허용하거나; 또는
ii) 상기 세포를 상기 음성 선택 마커의 유도인자에 노출시킴으로써, 상기 세포의 증식을 어블레이션 또는 억제하는 것
중 하나 이상을 포함하거나; 또는
b) 외인성 유도성 전사 활성인자를 포함하는 단리되고 유전적으로 변형된 동물 세포의 증식을 제어하는 것이
i) 상기 세포를 상기 외인성 유도성 전사 활성인자의 유도인자에 노출시킴으로써, 상기 세포의 증식을 허용하거나; 또는
ii) 상기 세포를 상기 외인성 유도성 전사 활성인자의 유도인자의 부재 하에 유지시킴으로써, 상기 세포의 증식을 방지 또는 억제하는 것
중 하나 이상을 포함하는 것인 방법. - 제13항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
a) 음성 선택 마커를 포함하는 DNA 벡터;
b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것에 의해 생성된 것인 방법. - 제13항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인 방법.
- 제13항에 있어서,
상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인, 방법. - 제17항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인, 방법.
- 제13항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 방법. - 제19항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
b) 시스템은 독시사이클린 유도성 시스템인 방법. - 제20항에 있어서, 유전자는 CDK1인 방법.
- 제20항에 있어서, 유전자는 CDK1 및 TOP2A인 방법.
- 제19항에 있어서,
i) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하고, 유도인자는 간사이클로비르를 포함하거나;
ii) 음성 선택 마커는 시토신 데아미나제를 포함하고, 유도인자는 5-플루오로시토신을 포함하거나;
iii) 음성 선택 마커는 카르복실 에스테라제를 포함하고, 유도인자는 이리노테칸을 포함하거나; 또는
iv) 음성 선택 마커는 iCasp9를 포함하고, 유도인자는 AP1903을 포함하는 것인 방법. - 제13항에 있어서,
a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인 방법. - 제13항 내지 제24항 중 어느 한 항의 방법에 따라 동물 세포 집단의 증식을 제어하는 방법.
- 유전적으로 변형된 동물 세포를 제조하는 방법으로서,
a) 동물 세포에서 음성 선택 마커를 인코딩하는 DNA 서열을, CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 좌위에 삽입함으로써, 음성 선택 마커를 인코딩하는 DNA 서열이 적어도 하나의 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되도록 함으로써, 음성 선택 마커 및 적어도 하나의 상기 유전자가 공동 발현되도록 하고/하거나;
b) 동물 세포에서 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열을, CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자의 좌위에 삽입함으로써, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 적어도 하나의 상기 유전자에 작동 가능하게 연결되도록 하는 것
을 포함하는 방법. - 제26항에 있어서, 적어도 하나의 상기 유전자의 유전적 변형이:
a) 음성 선택 마커를 포함하는 DNA 벡터;
b) 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터; 및
c) 음성 선택 마커 및 외인성 유도성 전사 활성인자를 포함하는 DNA 벡터
중 하나 이상에 의해 적어도 하나의 상기 유전자의 표적화된 변형을 수행하는 것을 포함하는 것인 방법. - 제26항에 있어서, 음성 선택 마커를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 동형접합성, 이형접합성, 반접합성 또는 복합 이형접합성 유전적 변형이고/이거나, 외인성 유도성 전사 활성인자를 포함하는 적어도 하나의 상기 유전자의 유전적 변형은 외인성 유도성 전사 활성인자를 포함하는 대립유전자만 적어도 하나의 상기 유전자를 발현할 수 있도록 보장하는 것인 방법.
- 제26항에 있어서,
상기 내인성 유전자 중 2개 이상은 유전적 변형을 포함하는 것인 방법. - 제29항에 있어서, 2개 이상의 내인성 유전자는 CDK1 및 TOP2A 또는 CDK1 및 EEF2인 방법.
- 제26항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 방법. - 제31항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
b) 시스템은 독시사이클린 유도성 시스템인 방법. - 제32항에 있어서, 유전자는 CDK1인 방법.
- 제32항에 있어서, 유전자는 CDK1 및 TOP2A인 방법.
- 제26항에 있어서,
a) 동물 세포는 인간, 마우스, 래트, 햄스터, 기니피그, 고양이, 개, 암소, 말, 사슴, 엘크, 들소, 소, 낙타, 라마, 토끼, 돼지, 염소, 양 및 비인간 영장류 세포로 이루어진 군으로부터 선택되는 포유류 세포 또는 조류 세포이고/이거나;
b) 동물 세포는 만능성 줄기세포, 다능성 세포 또는 단능성 전구세포이거나, 이들 세포로부터 유래되거나, 또는 최종 분화된 세포인 방법. - 동물 세포에서 CDK1, TOP2A, CENPA, BIRC5 및 EEF2로 이루어진 군으로부터 선택된 적어도 하나의 내인성 유전자를 변형시키기 위한 DNA 벡터로서,
a) 음성 선택 마커를 인코딩하는 DNA 서열의 세포 혼입 시에, 음성 선택 마커를 인코딩하는 DNA 서열이 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되고, 음성 선택 마커가 내인성 유전자와 공동 발현되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 음성 선택 마커를 인코딩하는 DNA 서열;
b) 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열의 세포 혼입 시에, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 상기 내인성 유전자에 작동 가능하게 연결되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열; 또는
c) 음성 선택 마커를 인코딩하는 DNA 서열의 세포 혼입 시에, 음성 선택 마커를 인코딩하는 DNA 서열이 상기 내인성 유전자를 인코딩하는 DNA 서열에 전사적으로 연결되고, 음성 선택 마커가 내인성 유전자와 공동 발현되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 음성 선택 마커를 인코딩하는 DNA 서열; 및
외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열의 세포 혼입 시에, 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열이 내인성 유전자에 작동 가능하게 연결되도록 하는, 상기 내인성 유전자를 유전적으로 변형시키기 위한 외인성 유도성 전사 활성인자를 인코딩하는 DNA 서열
을 포함하는 DNA 벡터. - 제36항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제, 시토신 데아미나제, 카르복실 에스테라제 또는 iCasp9를 포함하거나; 또는
b) 외인성 유도성 전사 활성인자는 유도인자와 함께 시스템을 형성하고, 상기 시스템은 독시사이클린 유도성 시스템, 큐메이트 스위치 유도성 시스템, 엑디손 유도성 시스템, 전파 유도성 시스템 또는 리간드 가역성 이량체화 시스템인 DNA 벡터. - 제37항에 있어서,
a) 음성 선택 마커는 단순 포진 바이러스 티미딘 키나제를 포함하거나;
b) 시스템은 독시사이클린 유도성 시스템인 DNA 벡터. - 제38항에 있어서, 유전자는 CDK1인 DNA 벡터.
- 제36항에 있어서,
a) 음성 선택 마커를 포함하는 DNA 서열의 하나 이상의 숙주 세포로의 혼입은, 음성 선택 마커의 유도인자에 대한 숙주 세포의 노출 시에 증식하는 숙주 세포의 사멸을 촉진하거나; 또는
b) 외인성 유도성 전사 활성인자를 포함하는 DNA 서열의 하나 이상의 숙주 세포로의 혼입은, 외인성 유도성 전사 활성인자의 유도인자에 대한 숙주 세포의 노출 시에 숙주 세포의 증식을 촉진 또는 허용하는 것인 DNA 벡터. - 그 발현이 세포 생존력 또는 세포 증식에 필요한 동물 세포의 적어도 하나의 유전자를 유전적으로 변형시켜 유전적으로 변형된 동물 세포의 증식을 제어하기 위한 키트로서,
제36항 내지 제40항 중 어느 한 항의 DNA 벡터 및
상기 DNA 벡터 중 하나 이상을 사용한, 동물 세포에서의 상기 내인성 유전자의 표적화된 변형을 위한 지침서
를 포함하는 키트. - 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247002264A KR20240013291A (ko) | 2015-03-09 | 2016-03-09 | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562130258P | 2015-03-09 | 2015-03-09 | |
US201562130270P | 2015-03-09 | 2015-03-09 | |
US62/130,270 | 2015-03-09 | ||
US62/130,258 | 2015-03-09 | ||
PCT/CA2016/050256 WO2016141480A1 (en) | 2015-03-09 | 2016-03-09 | Tools and methods for using cell division loci to control proliferation of cells |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002264A Division KR20240013291A (ko) | 2015-03-09 | 2016-03-09 | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170136528A KR20170136528A (ko) | 2017-12-11 |
KR102628872B1 true KR102628872B1 (ko) | 2024-01-26 |
Family
ID=56879714
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002264A KR20240013291A (ko) | 2015-03-09 | 2016-03-09 | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 |
KR1020177028536A KR102628872B1 (ko) | 2015-03-09 | 2016-03-09 | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002264A KR20240013291A (ko) | 2015-03-09 | 2016-03-09 | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 |
Country Status (12)
Country | Link |
---|---|
US (2) | US20180044686A1 (ko) |
EP (2) | EP3268480B1 (ko) |
JP (3) | JP6938380B2 (ko) |
KR (2) | KR20240013291A (ko) |
CN (2) | CN115323000A (ko) |
AU (1) | AU2016228914B2 (ko) |
CA (1) | CA2978633A1 (ko) |
DK (1) | DK3268480T3 (ko) |
HU (1) | HUE055500T2 (ko) |
IL (1) | IL254385B (ko) |
LT (1) | LT3268480T (ko) |
WO (1) | WO2016141480A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7099967B2 (ja) * | 2016-07-01 | 2022-07-12 | リサーチ ディベロップメント ファウンデーション | 幹細胞由来移植片からの増殖性細胞の排除 |
IL270835B1 (en) * | 2017-06-12 | 2024-09-01 | Sinai Health Sys | Allograft tolerance without the need for systemic immunosuppression |
CN108048405A (zh) * | 2018-01-15 | 2018-05-18 | 上海市东方医院 | 稳定表达人内源性INav的细胞模型及其制备方法和用途 |
WO2020118447A1 (en) * | 2018-12-13 | 2020-06-18 | Sinai Health System | Immunomodulatory cells and uses thereof |
JP7502805B2 (ja) * | 2019-03-21 | 2024-06-19 | ザ ユーエイビー リサーチ ファウンデイション | 補体媒介性溶解に対する細胞感受性を増加させる方法 |
CN112921052B (zh) * | 2019-12-06 | 2023-07-21 | 中国科学院分子细胞科学卓越创新中心 | 体内细胞增殖标记与示踪系统及其应用 |
US11661459B2 (en) | 2020-12-03 | 2023-05-30 | Century Therapeutics, Inc. | Artificial cell death polypeptide for chimeric antigen receptor and uses thereof |
AR124414A1 (es) | 2020-12-18 | 2023-03-22 | Century Therapeutics Inc | Sistema de receptor de antígeno quimérico con especificidad de receptor adaptable |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009139921A2 (en) | 2008-05-16 | 2009-11-19 | Genelux Corporation | Microorganisms for preventing and treating neoplasms accompanying cellular therapy |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9703633D0 (en) * | 1997-02-21 | 1997-04-09 | Imp Cancer Res Tech | Cancer therapy |
JP5242161B2 (ja) * | 2004-05-21 | 2013-07-24 | プレジデント アンド フェローズ オブ ハーバード カレッジ | テトラサイクリンおよびそれらの類似物の合成 |
CA2725953A1 (en) * | 2007-05-29 | 2008-12-11 | Christopher B. Reid | Methods for production and uses of multipotent cell populations, pluripotent cell populations, neuronal cell populations, and muscle cell populations |
EP3028707A1 (en) * | 2009-05-01 | 2016-06-08 | Ophthotech Corporation | Methods for treating or preventing ophthalmological diseases |
WO2011030329A1 (en) * | 2009-09-10 | 2011-03-17 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Method of treating tumors |
-
2016
- 2016-03-09 EP EP16760977.5A patent/EP3268480B1/en active Active
- 2016-03-09 KR KR1020247002264A patent/KR20240013291A/ko not_active Application Discontinuation
- 2016-03-09 KR KR1020177028536A patent/KR102628872B1/ko active Application Filing
- 2016-03-09 JP JP2017547568A patent/JP6938380B2/ja active Active
- 2016-03-09 EP EP21174106.1A patent/EP3929298A1/en active Pending
- 2016-03-09 LT LTEP16760977.5T patent/LT3268480T/lt unknown
- 2016-03-09 HU HUE16760977A patent/HUE055500T2/hu unknown
- 2016-03-09 CN CN202111608016.7A patent/CN115323000A/zh active Pending
- 2016-03-09 CN CN201680026489.7A patent/CN107849583B/zh active Active
- 2016-03-09 CA CA2978633A patent/CA2978633A1/en active Pending
- 2016-03-09 US US15/556,146 patent/US20180044686A1/en active Pending
- 2016-03-09 AU AU2016228914A patent/AU2016228914B2/en active Active
- 2016-03-09 WO PCT/CA2016/050256 patent/WO2016141480A1/en active Application Filing
- 2016-03-09 DK DK16760977.5T patent/DK3268480T3/da active
-
2017
- 2017-09-07 IL IL254385A patent/IL254385B/en active IP Right Grant
-
2021
- 2021-06-23 JP JP2021103910A patent/JP7284213B2/ja active Active
-
2022
- 2022-05-26 US US17/825,784 patent/US20220325289A1/en active Pending
-
2023
- 2023-05-18 JP JP2023081942A patent/JP2023103412A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009139921A2 (en) | 2008-05-16 | 2009-11-19 | Genelux Corporation | Microorganisms for preventing and treating neoplasms accompanying cellular therapy |
Non-Patent Citations (3)
Title |
---|
J Biol Chem.,287(39):32338-32345(2012.8.4.)* |
PLOS ONE.,8(7):e70543(2013.7.30.) |
Stem Cells Dev.,17(4):619-627(2008.8.) |
Also Published As
Publication number | Publication date |
---|---|
EP3268480A1 (en) | 2018-01-17 |
US20180044686A1 (en) | 2018-02-15 |
HUE055500T2 (hu) | 2021-11-29 |
JP2021166529A (ja) | 2021-10-21 |
CN107849583A (zh) | 2018-03-27 |
EP3268480A4 (en) | 2018-07-04 |
AU2016228914B2 (en) | 2022-04-21 |
JP2023103412A (ja) | 2023-07-26 |
IL254385A0 (en) | 2017-11-30 |
DK3268480T3 (da) | 2021-07-26 |
EP3268480B1 (en) | 2021-05-19 |
AU2016228914A1 (en) | 2017-09-21 |
CN115323000A (zh) | 2022-11-11 |
WO2016141480A1 (en) | 2016-09-15 |
KR20170136528A (ko) | 2017-12-11 |
CN107849583B (zh) | 2022-01-14 |
KR20240013291A (ko) | 2024-01-30 |
EP3929298A1 (en) | 2021-12-29 |
US20220325289A1 (en) | 2022-10-13 |
CA2978633A1 (en) | 2016-09-15 |
JP2018507701A (ja) | 2018-03-22 |
JP6938380B2 (ja) | 2021-09-22 |
IL254385B (en) | 2021-04-29 |
JP7284213B2 (ja) | 2023-05-30 |
LT3268480T (lt) | 2021-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
KR102628872B1 (ko) | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 | |
KR102451510B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
AU774643B2 (en) | Compositions and methods for use in recombinational cloning of nucleic acids | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
US20230364266A1 (en) | Methods and compositions for genomic integration | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
JP2023036921A (ja) | 蝸牛および前庭細胞に核酸を送達するための物質および方法 | |
KR20180097631A (ko) | 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법 | |
KR20200032174A (ko) | 강화된 키메라 항원 수용체 및 이의 용도 | |
CN111733174B (zh) | 一种分离的核酸分子及其用途 | |
US20200188531A1 (en) | Single-vector gene construct comprising insulin and glucokinase genes | |
CN112041334A (zh) | 人foxp3在经基因编辑的t细胞中的表达 | |
KR20220130093A (ko) | 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
KR20240022575A (ko) | 아머링된 키메라 수용체 및 이의 사용 방법 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
KR20210151785A (ko) | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
CN115768890A (zh) | 通过分子和物理启动对t细胞免疫疗法的热控制 | |
EP1395612A2 (en) | Modified recombinase | |
CN116323942A (zh) | 用于基因组编辑的组合物及其使用方法 | |
RU2812852C2 (ru) | Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii) | |
CN113260704B (zh) | CYP4V2和RdCVF在制备药物中的用途 | |
NL2027815B1 (en) | Genomic integration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent |