CN107937432B - 一种基于crispr系统的基因组编辑方法及其应用 - Google Patents
一种基于crispr系统的基因组编辑方法及其应用 Download PDFInfo
- Publication number
- CN107937432B CN107937432B CN201711194336.6A CN201711194336A CN107937432B CN 107937432 B CN107937432 B CN 107937432B CN 201711194336 A CN201711194336 A CN 201711194336A CN 107937432 B CN107937432 B CN 107937432B
- Authority
- CN
- China
- Prior art keywords
- intron
- gene
- cas9
- artificial sequence
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000010362 genome editing Methods 0.000 title claims abstract description 49
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 41
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 131
- 230000014509 gene expression Effects 0.000 claims abstract description 71
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 45
- 230000004927 fusion Effects 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 120
- 101710163270 Nuclease Proteins 0.000 claims description 28
- 102000004169 proteins and genes Human genes 0.000 claims description 21
- 238000003776 cleavage reaction Methods 0.000 claims description 18
- 230000007017 scission Effects 0.000 claims description 18
- 238000013518 transcription Methods 0.000 claims description 15
- 230000035897 transcription Effects 0.000 claims description 15
- 210000003370 receptor cell Anatomy 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 12
- 238000010367 cloning Methods 0.000 claims description 12
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 6
- 108700024394 Exon Proteins 0.000 claims description 6
- 108091026890 Coding region Proteins 0.000 claims description 5
- 239000013604 expression vector Substances 0.000 claims description 5
- 238000003209 gene knockout Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000037429 base substitution Effects 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims description 4
- 108020004999 messenger RNA Proteins 0.000 abstract description 5
- 230000001360 synchronised effect Effects 0.000 abstract description 3
- 108020004414 DNA Proteins 0.000 description 157
- 210000001938 protoplast Anatomy 0.000 description 68
- 239000012634 fragment Substances 0.000 description 49
- 241000209094 Oryza Species 0.000 description 46
- 235000007164 Oryza sativa Nutrition 0.000 description 45
- 235000009566 rice Nutrition 0.000 description 43
- 108091079001 CRISPR RNA Proteins 0.000 description 38
- 241000196324 Embryophyta Species 0.000 description 25
- 101150113964 MPK5 gene Proteins 0.000 description 22
- 108091092195 Intron Proteins 0.000 description 19
- 108020004566 Transfer RNA Proteins 0.000 description 19
- 230000009261 transgenic effect Effects 0.000 description 18
- 101000976897 Xenopus laevis Mitogen-activated protein kinase 14 Proteins 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 17
- 101150024075 Mapk1 gene Proteins 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 101001094048 Homo sapiens Pendrin Proteins 0.000 description 12
- 101100095907 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SLT2 gene Proteins 0.000 description 12
- 101100345685 Xenopus laevis mapk1 gene Proteins 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 238000001976 enzyme digestion Methods 0.000 description 11
- 238000003757 reverse transcription PCR Methods 0.000 description 11
- 239000006228 supernatant Substances 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 238000005520 cutting process Methods 0.000 description 10
- 238000011534 incubation Methods 0.000 description 10
- 239000012528 membrane Substances 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 239000002033 PVDF binder Substances 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 7
- 238000000246 agarose gel electrophoresis Methods 0.000 description 7
- 239000001110 calcium chloride Substances 0.000 description 7
- 229910001628 calcium chloride Inorganic materials 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 6
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 6
- 229930195725 Mannitol Natural products 0.000 description 6
- 102000006382 Ribonucleases Human genes 0.000 description 6
- 108010083644 Ribonucleases Proteins 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000000594 mannitol Substances 0.000 description 6
- 235000010355 mannitol Nutrition 0.000 description 6
- 239000013641 positive control Substances 0.000 description 6
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 101000878253 Homo sapiens Peptidyl-prolyl cis-trans isomerase FKBP5 Proteins 0.000 description 5
- 102100037026 Peptidyl-prolyl cis-trans isomerase FKBP5 Human genes 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 238000012257 pre-denaturation Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 3
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 101150108119 PDS gene Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000007857 nested PCR Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 101710135281 DNA polymerase III PolC-type Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241001112693 Lachnospiraceae Species 0.000 description 2
- 101150048155 MPK2 gene Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003198 gene knock in Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 238000000751 protein extraction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- -1 25-50ng) Substances 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101710088172 HTH-type transcriptional regulator RipA Proteins 0.000 description 1
- 101000979001 Homo sapiens Methionine aminopeptidase 2 Proteins 0.000 description 1
- 101000969087 Homo sapiens Microtubule-associated protein 2 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 102100023174 Methionine aminopeptidase 2 Human genes 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 101100537364 Oryza sativa subsp. japonica Os12g0628600 gene Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108050002700 Protein phosphatase 1 regulatory subunit 3B Proteins 0.000 description 1
- 108050002705 Protein phosphatase 1 regulatory subunit 3C Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 102000002150 RNase Z Human genes 0.000 description 1
- 108010001294 RNase Z Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 239000006180 TBST buffer Substances 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 241000746966 Zizania Species 0.000 description 1
- 235000002636 Zizania aquatica Nutrition 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000010814 radioimmunoprecipitation assay Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
本发明提供了一种基于CRISPR系统的基因组编辑方法,属于基因编辑技术领域,本发明所述的方法利用内含子来表达CRISPR基因组编辑系统中的引导RNA分子,其原理是将一个或多个tRNA‑gRNA或crRNA串联单元置于编码基因的内含子中,并且可以将该内含子与Cas9或Cpf1形成融合基因后用一个启动子驱动。所述方法巧妙利用了细胞内源的mRNA剪接系统和tRNA加工系统,不需要添加其他元件,不仅安全性更高,而且可以更加简单;而利用一个启动子实现多个引导RNA与Cas9或Cpf1的同步表达,简化了已有的CRISPR编辑系统,同时提高了CRISPR编辑系统的同时编辑多个靶位点的效率和能力。
Description
技术领域
本发明属于基因组编辑技术领域,具体涉及一种基于CRISPR系统的基因 组编辑方法。
背景技术
基因组编辑技术是利用人工设计和改造的核酸酶对基因组进行精确地定 点修饰,包括对基因组进行靶向基因敲入(Knock-in)、基因功能敲除(Knock-out) 以及有目的地片段替换。
CRISPR/Cas9(Clustered,Regularly Interspaced,Short Palindromic Repeat/CRISPR Associated Protein 9System)系统的发现和应用为生物学的基 础理论研究和转化应用提供了简单、强大的基因组编辑平台,因此迅速成为 遗传操作的主流工具,并广泛地用于基础研究、疾病治疗、作物遗传改良等 不同的领域。
CRISPR/Cas是细菌和古细菌中的一种适应性免疫系统,能特异地降解入 侵噬菌体或外源质粒的DNA,其中CRISPR是“成簇和规律间隔的短回文序列” 的简称,而Cas是指与CRISPR RNA结合的蛋白。在2012年,Jinek等解开 了化脓链球菌Streptococcus pyogenes的II型CRISPR/Cas9系统作用机制,并 证明Cas9核酸酶(本文专指Strepcococcuspyogenes的Cas9)可以在一个人 造的小RNA分子(称为gRNA,即Guide RNA)的引导下去靶向切割DNA 双链。利用Cas9/gRNA标靶特定的DNA位点需要满足2个条件:(1)gRNA 的5’端20nt(Nucleotides)的引导序列(称为Spacer或Guide sequence)与靶 DNA位点的序列(称为Protospacer)互补匹配;(2)靶位点必需存在PAM (Protospacer-adjacentmotif),其中使用最广的化脓链球菌Cas9的PAM序列为 5’-NGG-3’。在使用CRISPR/Cas9进行基因组编辑时,一般用Pol II(RNA Polymerase II,II型RNA聚合酶)启动子表达含核定位信号的Cas9,用Pol III(RNA Polymerase III)启动子表达gRNA,Cas9/gRNA复合体识别靶DNA后 在PAM前面的第3个和第4个脱氧核酸之间切割DNA双链,形成DSB(Double stranded DNAbreak,双链DNA断裂)。
除CRISPR/Cas9外,CRISPR/Cpf1也被开发为一个DNA编辑的平台。2015 年美国麻省理工大学的Zhang Feng实验室首先发现了II类CRISPR系统第5 亚家族的成员Cpf1核酸内切酶,并证实了来自氨基酸球菌属 Acidaminococcus、毛螺科菌属Lachnospiraceae和弗朗西斯氏菌属Franisella novicida的AsCpf1、LbCpf1和FnCpf1三个高度同源蛋白都具有RNA引导的 DNA内切酶的活性,而且AsCpf1和LbCpf1用于动物的基因组编辑效率接近 原来的CRISPR/Cas9系统。与Cas9不同,Cpf1通过CRISPR RNA(crRNA) 的引导去靶向切割DNA序列,其中靶序列位于crRNA的3’-端。与Cas9比 较,Cpf1的引导RNA更短,但引导序列(即DNA靶位点)更长(~24nt);特 异性高、容易实现多位点编辑,基因组编辑的范围大;更易于引入的indel, 从而提高knock-out的效率。
基于CRISPR的基因组编辑载体都需要两个组分,一是CRISPR系统的核 酸酶,比如常用的Cas9和Cpf1;二是引导RNA,如gRNA(用于引导Cas9) 和crRNA(用于引导Cpf1)。在一般的载体系统中,Cas9和Cpf1可以用常 见的RNA聚合酶II型的启动子表达(Pol II);而gRNA和crRNA用Pol III 型的启动子表达。在已有的CRISPR技术中,引导RNA的表达采用PolIII启 动子,Pol III启动子数量有限而且表达引导RNA的第一个碱基是固定的;Pol III启动子为组成型表达的,无法构建诱导表达或时空特异表达的基因组编辑 技术;Cas9和gRNA用不同的启动子表达,无法同步控制两者的表达量。
发明内容
有鉴于此,本发明的目的在于提供一种基于CRISPR系统利用内含子表达 gRNA和Cas9核酸酶的高效率的多重基因编辑方法。
为了实现上述发明目的,本发明提供以下技术方案:
一种基于CRISPR系统CRISPR/Cas9的基因组编辑方法,包括以下步骤: 1)将1个或多个重复的tRNA-gRNA串联单元置于编码基因的内含子中获得 inPTG内含子;2)将获得的inPTG内含子与含Cas9核酸酶基因的外显子融 合成一个inPTG-Cas9基因;3)利用单个启动子来驱动inPTG-Cas9融合基因 的表达,获得表达载体;4)将所述含inPTG-Cas9融合基因表达元件的载体 导入受体细胞进行转录表达,获得Cas9核酸酶和多个gRNA;5)所述gRNA 与Cas9核酸酶共同作用编辑受体细胞基因组序列。
优选的,步骤3)中所述启动子为Pol II型启动子。
优选的,所述Pol II型启动子为UBI10启动子、PR5启动子或PR1启动 子。
优选的,步骤4)中所述载体为pRGEB33载体,所述pRGEB33载体的 内含子的序列如SEQ ID NO.7所示.
优选的,步骤4)中所述载体为pRGEB34载体,所述pRGEB34载体的 内含子的序列如SEQ ID NO.8所示。
优选的,所述内含子中插入BsaⅠ酶切位点用于PTG片段的克隆。
本发明还提供了一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法, 包括以下步骤:1)将一个或多个重复的tRNA-crRNA串联单元(polycistronic tRNA-crRNA,简称PTC)置于编码基因的内含子中获得intron(PTC)内含子; 2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形 成一个intron(PTC)-Cpf1融合基因;3)在所述intron(PTC)-Cpf1融合基因序 列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;4)将所述启动 子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得 Cpf1核酸酶和多个crRNA;5)所述crRNA与Cpf1核酸酶共同作用编辑受 体细胞基因组序列。
优选的,所述转录表达Cpf1的过程中,利用剪接复合体剪切所述 intron(PTC)-Cpf1融合基因中的包含PTC的内含子,然后利用tRNA加工系统 切割其中的tRNA元件,释放多个crRNA。
优选的,步骤1)中所述多个重复的tRNA-crRNA串联单元可替换为多个 crRNA串联单元。
优选的,所述替换后利用表达的Cpf1蛋白切割crRNA串联单元,释放多 个crRNA。
优选的,所述编辑包括为基因敲除、靶向基因激活/抑制、单碱基替换。
本发明的有益效果:本发明所述的方法将多个tRNA-gRNA/crRNA串联单 元置于编码基因的内含子中,并且将inPTG与Cas9/Cpf1形成融合基因,巧妙 利用了细胞内源的mRNA剪接系统和tRNA加工系统,不需要添加其他元件, 安全性更高;利用一个启动子实现多个gRNA/crRNA与Cas9/Cpf1的同步表达, 简化了已有的CRISPR编辑系统,提高了CRISPR编辑系统的编辑效率和编辑能 力,可以同时高效率的编辑多个靶位点。
附图说明
图1为PTG结构产生多个gRNA示意图;
图2为内含子剪接示意图;
图3为利用内含子表达gRNA示意图;
图4为UBI10基因,U3p::PTG-UBI10p::Cas9(pRGEB32)和 UBI10p::inPTG-Cas9(pRGEB33andpRGEB34)的结构示意图;
图5为pRGEB33载体示意图;
图6为pRGEB34载体示意图;
图7为实施例1中UBI10p::Cas9和UBI10p::inPTG-Cas9的RT-PCR结果
图8为实施例1中RT-PCR产物测序结果;
图9为实施例1中WesternBlotting检测UBI10p::Cas9和 UBI10p::inPTG-Cas9在水稻原生质体中Cas9的表达水平;
图10为实施例1中在水稻原生质体中表达inPTG4/10-Cas9后,PCR检 测靶基因DNA片段被剪切的效率;
图11为实施例1中在水稻原生质体中表达inPTG3/6-Cas9后,PCR检测 靶基因DNA片段被剪切的效率;
图12为实施例1中在水稻原生质体中表达inPTG7-Cas9后,PCR检测靶 基因DNA片段被剪切的效率;
图13实施例2中inPTG10-Cas9转基因植株出现白化表型(T0代);
图14为实施例2中敲除MPK1和MPK5的inPTG7-Cas9转基因株系的突 变情况;
图15为为实施例2中inPTG3/6/7/10-Cas9转基因植株突变频率;
图16为实施例3中pRGEB33T载体结构示意图;
图17为实施例3中PTG和PTGt结构的表达载体编辑MPK1、MPK2和 MPK5的效率;
图18为实施例3中pRGEB33T与其他载体在水稻原生质体中编辑MPK1 和MPK5的效率;
图19为实施例4中PR1p::inPTG-Cas9和PR5p::inPTG-Cas9载体结构图;
图20为实施例4中在水稻原生质体中用PR1p和PR5p驱动inPTG4-Cas9 的表达,比较MPK2被编辑效率;
图21为实施例5中CRISPR-Cpf1介导的基因组编辑结构示意图;
图22为实施例5中表达Cpf1和crRNAs的载体结构图;
图23为实施例5中设计两个crRNAs靶向敲除水稻PDS基因;
图24为实施例5中PTCPDS和CAPDS结构示意图;
图25为实施例5中UBI10p::intron(CAPDS)-Cpf1内含子剪切示意图;
图26为实施例5中比较FnCpf1和LbCpf1(分别表示为Fn和Lb)以两 种crRNA表达结构(PTC和CA)分别由U3p表达或在内含子中表达时,靶 基因被编辑剪切的效率;
图27为实施例5中Westernblotting检测U3p::crRNA-UBI10p::Cpf1和 UBI10p::intron(crRNA)-Cpf1在水稻原生质体中Cpf1蛋白水平的差异;
图28为实施例6中设计crRNAs敲除MPK2和MPK5示意图;
图29为实施例6中比较FnCpf1和LbCpf1利用不同的CAMPK表达结构, 在水稻原生质体中编辑MPK1和MPKI5的效率。
具体实施方式
CRISPR系统用于基因组编辑的原理
CRISPR靶向编辑基因组序列的原理是利用Cas9(或Cpf1)和靶位点特 异的gRNA(或crRNA)切割基因组,在设计的靶位点处形成DSB(Double strandbreak),然后利用生物体内的DSB修复过程来对DNA序列进行不同的 修改。(1)通过NHEJ(Non-homologousendjoining)的DSB修复在靶位点会 引入小的核酸插入或缺失(Insertion and deletion,indel)。Indel的引入造成靶基 因蛋白翻译产生移码,从而破坏基因功能。除了通过引入indel外来敲除基因 功能外,CRISPR/Cas9还可以用来对染色体进行其他的遗传操作。比如,用 Cas9和一对gRNA来精确地删除一段染色体DNA。基于CRISPR/Cas9的靶 向基因敲除技术最早在拟南芥、水稻、烟草、小麦、大麦、玉米、大豆、马 铃薯、番茄等模式植物和重要农作物中建立,随后在多种不同的植物中都得 到了验证。(2)靶向基因敲入/替换(Knock-in)。Knock-in依赖的是DSB的同 源重组修复(Homology-directed repair,HDR)修复途径:当Cas9/gRNA切割 靶位点后,如果细胞中有与靶位点序列同源的DNA供体(DNAdonor)片段时,位于供体DNA上的基因片段会通过HDR重组整合到DSB的位置。
如图1所示,在已有的PTG(polycistronic-tRNA-gRNA)技术中,PTG 用Pol III启动子表达后,细胞内的核糖核酸酶P和Z能识别和精确切割其中 的tRNA序列,(所述tRNA序列如SEQ ID No.10所示),从而释放出多个 gRNA,引导Cas9靶向不同的基因位点。
真核生物的基因一般由内含子和外显子组成,其中内含子在基因转录过 程中或转录后由细胞内的剪接(splicing)复合体精确剪切。如图2所示,内 含子含保守的5’剪接位点(Donorsite)、分支位点(branch site)和3’剪接位 点(Acceptor site),在剪接复合体的作用下,形成套索结构的RNA,内含子 部分从而被剪切掉。基于上述特点,本发明提供了一种基于CRISPR系统 CRISPR/Cas9的基因组编辑方法,如图3所示,设计思路如下:将多个 tRNA-gRNA串联单元(polycistronic tRNA-gRNA,简称PTG)置于编码基因 的内含子中,当插入了PTG的内含子(intronic PTG,简称为inPTG)被剪接 复合体从mRNA前体中切割下来以后,细胞内的核糖核酸酶P和Z能识别并 精确切割inPTG中的tRNA元件,从而释放出位于tRNA之间的gRNA,而内 含子中的tRNA-gRNA不会影响基因外显子的表达和翻译。为了进一步简化 CRISPR载体系统,可以将包含有inPTG的内含子与编码Cas9的外显子融合 为一个基因,这样的融合基因可以同时表达出Cas9蛋白和gRNA。
本发明提供的基于CRISPR系统CRISPR/Cas9的基因组编辑方法具体的 包括以下步骤:1)将一个或多个重复的tRNA-gRNA串联单元置于编码基因 的内含子中获得inPTG内含子;2)将获得的inPTG内含子与含Cas9核酸酶 基因的外显子融合成一个inPTG-Cas9基因;3)利用单个启动子来驱动 inPTG-Cas9融合基因的表达,获得表达载体;4)将所述含inPTG-Cas9融合 基因表达元件的载体导入受体细胞进行转录表达,获得Cas9核酸酶和多个 gRNA;5)所述gRNA与Cas9核酸酶共同作用编辑受体细胞基因组序列。
在本发明中,将一个或多个重复的tRNA-gRNA串联单元置于编码基因的 内含子中获得inPTG。所述多个重复的tRNA-gRNA串联单元的种类数根据需 要编辑的基因个数确定。在本发明中,所述inPTG可插入载体基因的不同位 置。
本发明在获得inPTG后,将获得的inPTG与Cas9核酸酶基因的编码区融 合形成inPTG-Cas9融合基因。本发明对所述的融合基因的制备方法没有特殊 限定,采用本领域常规方法即可。
本发明在获得inPTG-Cas9融合基因后,在所述inPTG-Cas9融合基因序 列前添加启动子获得启动子-inPTG-Cas9融合基因序列。在本发明中所述的启 动子优选的为Pol II型启动子;所述为Pol II型启动子优选的为UBI10启动子、 PR5启动子或PR1启动子。所述启动子的添加采用本领域常规的方法即可, 无其他特殊要求。
本发明将所述获得的启动子-inPTG-Cas9融合基因置于载体中,导入受体 细胞进行转录表达,获得多个gRNA和Cas9核酸酶;在所述转录过程中,利 用剪接复合体将所述inPTG-Cas9融合基因切割,然后利用tRNA加工系统切 割其中的tRNA元件,释放多个gRNA,所述Cas9核酸酶基因正常转录表达。 在本发明中所述tRNA加工系统包括核糖核酸酶P和Z,所述核糖核酸酶P 和Z能够精确识别和切割其中的tRNA序列,从而释放gRNA。
在本发明中,所述载体优选的为pRGEB33载体或pRGEB34载体。所述 pRGEB33载体或pRGEB34载体是在pRGEB32载体的基础上进行改进获得 的;所述pRGEB32载体的U3p序列如Seq ID No.1所示;所述pRGEB33载 体或pRGEB34载体的UBI10p(Seq ID No.2)、exon1(Seq ID No.3)、exon2(Seq ID No.5)以及Cas9序列(Seq ID No.6)同pRGEB32相同;所述pRGEB33载体或 pRGEB34载体内含子序列与pRGEB32不同,所述pRGEB32载体的序列内含 子如SEQ ID NO.4所示,所述pRGEB33载体的序列如SEQ ID No.7所示,所 述pRGEB34载体的序列如SEQ ID No.8所示。在本发明中所述的pRGEB33 载体的内含子中插入两个BsaⅠ酶切位点用于PTG片段的克隆。本发明中另 外一个方案是由UBI10内源的内含子(序列如SEQ IDNo.4)替换加入了BsaI 酶切位点的内含子,同时在重组Cas9基因的3’-UTR区插入含有两个BsaI 酶切位点的内含子,以利于PTG的克隆。
在本发明中,所述表达的gRNA与Cas9核酸酶共同作用编辑受体细胞基 因组。所述编辑优选的包括为基因敲除、靶向基因激活/抑制和单碱基替换。 在本发明中,所述的受体细胞包括微生物、动物和植物细胞。
本发明还提供了一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法, 包括以下步骤1)将一个或多个重复的tRNA-crRNA串联单元(polycistronic tRNAcrRNA,简称为PTC)置于编码基因的内含子中获得intron(PTC)内含子; 2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形 成一个intron(PTC)-Cpf1融合基因;3)在所述intron(PTC)-Cpf1融合基因序 列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;4)将所述启动 子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得 Cpf1核酸酶和多个crRNA;5)所述crRNA与Cpf1核酸酶共同作用编辑受 体细胞基因组序列。
在本发明中,将一个或多个重复的tRNA-crRNA串联单元置于编码基因 的内含子中获得intron(PTC)。所述多个重复的tRNA-crRNA串联单元的种类 数根据需要编辑的基因个数确定,优选的为1~6个,更优选的为2~3个。在 本发明中,所述intron(PTC)可插入载体基因的不同位置。在本发明中,所述 的多个tRNA-crRNA串联单元可替换为多个crRNA串联单元。
本发明在获得intron(PTC)后,将获得的intron(PTC)与Cpf1核酸酶基因的 编码区融合形成intron(PTC)-Cas9融合基因。本发明对所述的融合基因的制备 方法没有特殊限定,采用本领域常规方法即可。
本发明在获得intron(PTC)-Cpf1融合基因后,在所述intron(PTC)-Cpf1融 合基因序列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列。在本发 明中所述的启动子优选的为Pol II型启动子;所述为Pol II型启动子优选的为 UBI10启动子。
本发明将所述获得的启动子-intron(PTC)-Cpf1融合基因置于载体中,导入 受体细胞进行转录表达,获得多个crRNA和Cpf1核酸酶。在本发明中,所述 的多个tRNA-crRNA串联单元在转录过程中,优选的利用剪接复合体剪切所 述intron(PTC)-Cpf1融合基因的内含子,然后利用tRNA加工系统切割其中的 tRNA元件,释放多个crRNA。在本发明中,所述tRNA加工系统包括核糖核 酸酶P和Z,所述核糖核酸酶P和Z能够精确识别和切割其中的tRNA序列, 从而释放crRNA。在本发明中将多个tRNA-crRNA串联单元替换为多个crRNA 串联单元后,所述转录表达过程中,利用Cpf1核酸酶切割inCA-Cpf1融合基 因内含子中的crRNAarray,获得多个crRNA。
在本发明中,所述表达的crRNA与Cpf1核酸酶共同作用编辑受体细胞基 因组。所述编辑优选的包括为基因敲除、靶向基因激活/抑制和单碱基替换。 在本发明中,所述的受体细胞优选的为植物细胞。
下面结合实施例对本发明提供的一种基于CRISPR系统的基因组编辑方 法进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
inPTG-Cas9用于水稻多位点编辑
设计如下:将多个tRNA-gRNA串联单元(polycistronic tRNA-gRNA,简 称PTG)置于编码基因的内含子中。将包含有inPTG的内含子与编码Cas9 的外显子融合为一个基因,这样的融合基因可以同时表达出Cas9蛋白和 gRNA。当inPTG-Cas9系统在植物中表达时,剪切下来的内含子中的PTG片 段被RNase P和Z识别和加工,将单个的gRNA释放出来,而内含子的剪接 并不影响Cas9基因的转录和翻译,这样一个inPTG-Cas9的融合基因可以同 时高效率的编辑多个靶位点。
1.载体说明
为了实现inPTG的表达,我们对水稻的UBI10基因进行改造,将PTG序 列结构插入到UBI 10的内含子中(如图3所示)。UBI10基因的5’-UTR后 有一个962bp的intron(序列如SEQ ID No.4),具有内含子的标志序列 5’-GU…A…AG-3’。根据内含子的特点,可以将PTG片段克隆到内含子剪接 的Donor site和branch site之间,从而不会影响内含子的剪切。
根据UBI10基因的特点,我们构建了pRGEB33和pRGEB34载体。UBI10 基因,传统的U3p::PTG-UBI10p::Cas9(pRGEB32)和UBI10p::inPTG-Cas9 (pRGEB33andpRGEB34)的结构示意图如图4和图5所示;图4中方框代表 外显子,线代表内含子,角形代表Bsa I双酶切位点。红色字体的碱基 (GGTCTC)代表Bsa I识别位点,小箭头表示RT-PCR引物的位置。其中pRGEB33和pRGEB34载体利用水稻UBI10p(UBI10启动子)来表达融合了 UBI10的5’-UTR(exon1)(SEQ ID No.33)、intron以及部分exon2(SEQ ID No.5) 序列的Cas9,并在其内含子中插入两个BsaⅠ酶切位点用于PTG片段的克隆。 这样就可以利用UBI10p同时驱动inPTG与Cas9的表达 (UBI10p::inPTG-Cas9)。pRGEB33和pRGEB34两个载体的区别在于 pRGEB33的内含子为982bp的全长内含子(SEQ ID:7),pRGEB34是在 pRGEB33的基础上将内含子截短为146bp(SEQ ID:8)。
2.PTG片段合成和克隆。
以MPK1、MPK2、MPK5、PDS为靶基因,分别在每个基因上设计两个 靶位点(靶位点序列见表2),并依次构建了PTG3(SEQ ID No.11)、PTG4(SEQ ID No.12)、PTG6(SEQ IDNo.13)、PTG10(SEQ ID No.15)分别用于四个基因的 敲除。另构建了包含4个gRNA的PTG7(SEQ IDNo.14),用于同时敲除MPK1 和MPK5。
PTG构建过程如下:
(1)根据表1所示(引物序列见表3),利用PCR扩增出每个PTG所 需用于组装的初级片段,以1ngpGTR为模板,加入2μl 10μM F/R引物,25μl 2x Hi-Fi MIX(MCLAB),补足水至50μl。PCR程序为:98℃预变性3mi;98℃ 变性15s,60℃退火20s,72℃延伸20s,共35个循环;最后72℃延伸5min。
表1.PCR反应配制表
表2.Cas9靶位点信息(Seq ID No.25~Seq ID No.38)
表3:构建CRISPR-Cas9gRNA所用引物(Seq ID No.39~Seq ID No.59)
(2)将PCR产物用PCR产物纯化试剂盒(OMEGA)纯化后,测定浓 度。然后利用GoldenGate克隆的方法将每个PTG所包含的初级片段连接起 来。连接反应如下:20ul的反应体系包含10μl 2xT7DNAligase buffer(NEB), 2μl BSA(1mg/ml),0.5μl T7DNAligase(3000U/μl,NEB),0.5μl Bsa I(10U/μl, NEB),用于组装的初级片段(每个片段相同的量,25-50ng),补水至20μl。 反应条件为:37℃,5min,然后20℃,10min,30个循环;最后20℃孵育1 小时。
(3)PCR扩增连接产物。将上一步Golden Gate反应的产物稀释10倍后 取1μl作为模板,50μl的PCR体系分别加入1μl S5AD5-F/R(10uM),25μl 2x Taq Mix(Tsingke),补水至50μl。PCR程序为:94℃预变性2min,94℃变性 30s,60℃退火30s,72℃延伸30s,共35个循环,最后72℃延伸5min。
(4)纯化PCR扩增的连接产物。PCR产物中加入1/10体积NaAc(3M) 和2.5倍体积的无水乙醇,充分混匀后-20度保存30min,接着4度12000rpm 离心10min;加入1ml 75%乙醇,4度12000rpm离心10min;弃上清,沉淀 晾干后加水溶解。
(5)纯化后的产物FokI(NEB)酶切并回收目的片段
用FokI酶切纯化后的DNA,37℃孵育10h左右;接着用1%的琼脂糖凝 胶电泳分离酶切后的DNA,回收目的片段,并用凝胶回收试剂盒(OMEGA) 纯化。
(6)pRGEB32、pRGEB33、pRGEB34载体BsaI酶切并纯化。
(7)用T4DNA连接酶连接酶切后的载体骨架与PTG片段,连接产物 转化DH5α
(9)提取质粒后,测序确定插入正确的片段。
表5:载体构建所用引物(Seq ID No.60~Seq ID No.79)
PTG插入到内含子中(inPTG)对于内含子剪接的影响
为了检测PTG插入内含子后,内含子能否被正确的剪接并且不影响Cas9 的翻译,我们将PTG6和PTG10分别插入到pRGEB33和pRGEB34载体中, 构建四个载体用于接下来的检测。
利用PEG法将上述四个载体(UBI10p::inPTG6/10-Cas9)质粒与原有的 pRGEB32-PTG10(U3p::PTG10-UBI10p::Cas9)质粒转化水稻原生质体,GFP质 粒作为原生质体转化的阳性对照和基因编辑的阴性对照。25℃培养20小时后 观察GFP的转化效率,24h后收集原生质体。原生质体制备及转化的步骤如 下:
水稻原生质体制备步骤:
(1)水稻种子经消毒,在MS培养基中28℃,16h光照8h黑暗培养8-9d。
(2)配制10ml Digestion Solution(1.5%Cellulase R10,0.75%MacerozymeR10,10mM PH5.7MES,0.6M Mannitol),55℃水浴10min后置于冰上冷却 至室温,加入10μlCaCl2(1M),3μlβ-ME,100μl BSA(10%)。
(3)用刀片将水稻茎部切成0.5mm左右长的小段,立即转入10ml Mannitol(0.6M)中,黑暗放置10min后弃去Mannitol。
(4)加入配好的10ml Digestion Solution,锡箔纸包裹避光,置于摇床上(40rpm)酶解7h左右。
(5)加入10mlW5(2mM PH5.7MES,154mM NaCl,5mM KCl,125mM CaCl2)终止酶解反应,然后置于摇床上60rpm孵育20min。
(6)孔径为50μm的细胞筛过滤上述酶解液
(7)300g离心3min,弃上清;加入10mlW5,重悬原生质体。
(8)将重悬的原生质体黑暗放置1h,之后100g离心3min,弃上清。
(9)加入MMG Solution(4mM PH5.7MES,0.6M Mannitol,15mM MgCl2) 使原生质体浓度达到0.5x107/ml。
质粒转化:
(1)在圆底管中依次加入5-10μg中提质粒(加水补足10μl),100μl原 生质体(0.5x107/ml),110μl PEG-CaCl2(0.6M Mannitol,100mM CaCl2,40% PEG4000),轻弹混匀,静置20min。
(2)在静置后加入440μlW5,300g离心3min。
(3)弃上清,加入400μlWI Solution(4mM PH5.7MES,0.6M Mannitol, 4mMKCl2),重悬原生质体,转入24孔细胞培养板,25℃左右避光培养。
(4)培养20~36h后收集原生质体用于RNA、DNA或蛋白抽提。
提取原生质体RNA:
(1)原生质体培养24h后收集到1.5ml RNase-Free EP管中,300g离心 3min,弃上清。
(2)总RNA抽提使用TRIzol试剂(Life Technologies)按厂家说明书操 作完成。
RNA反转录步骤:
(1)去除RNA中DNA:在1.5ml RNase Free管中加入100ng从原生质 体中提取的RNA,加入1.5μl 10x DNase I buffer,0.25μl DNase I(Takara,5U/μl),补足DEPC-H2O至15μl,室温静置10min
(2)加入1.5μl RNase-Free EDTA(25mM),70℃处理10min。
(3)cDNA第一条链的合成:处理后的RNA加入1μl dNTP(10mM),1μl oligo-dT(100μM),70℃水浴5min后,立即置于冰上。待冷却后中加入2μl 10x RTbuffer(NEB),0.5μl M-Mulv反转录酶(NEB,200U/μl),0.5μl RNase Inhibitor(neb,40U/μl),42℃反应1h
(4)最后90℃,10min失活反转录酶。
以pRGEB32-PTG6/PTG10以及pRGEB33/34-PTG6/PTG10转化的原生质 体的cDNA为模板,利用内含子两侧外显子上的引物,通过RT-PCR扩增跨 内含子的片段,PCR体系:以1μlcDNA为模板,exon1-qF/exon2-qR(10uM) 各0.5μl(引物序列见表6),10μl 2x Hi-Fi MIX(MCLAB),补水至20μl。PCR 反应程序:98℃预变性2min,98℃变性10s,60℃退火10s,72℃延伸20min, 共35个循环,最后72℃延伸5min。
表6:RT-PCR所用引物(Seq ID No.80~Seq ID No.83)
RT-PCR反应产物经琼脂糖凝胶检测,结果见图7,阴性对照正常,且无 非特异扩增;图7中RT:反转录;“-”代表未加反转录酶的阴性对照;“+ “代表加了反转录酶的RT-PCR结果。产物经测序结果见图8,图8表明四个 载体的内含子都被完全剪切掉。红色字体为内含子的供体位点和受体位点, 证明了内含子在mRNA的加工过程中都能够被正确剪接,表明inPTG片段插 入到内含子中不会影响基因内含子的正常剪接。
PTG插入到内含子中(inPTG)对于Cas9表达的影响
在确定内含子能够被正确剪接之后,我们还需要验证inPTG结构是否会影 响Cas9蛋白的表达。
利用PEG法将pRGEB32-PTG10、pRGEB33-PTG10、pRGEB34-PTG10载 体质粒分别转化水稻原生质体,24h后收集原生质体。提取原生质体中的总蛋 白,通过WesternBlotting比较pRGEB32,pRGEB33和pRGEB34三个不同载 体Cas9蛋白的表达水平。提取原生质体中的总蛋白步骤如下:
提取原生质体中的总蛋白
(1)将培养24h后的原生质体收集到1.5ml EP管中,300g离心3min,弃上 清。
(2)原生质体沉淀中加入50μl RIPA(50mM Tris pH7.6,150mM NaCl,1% TritonX-100,0.1%SDS,10%glycerol,1mM PMSF),短暂涡旋后4℃, 14000rpm离心10min后,将上清液转入新EP管中。
Western Blotting:
(1)15μl原生质体中提取的总蛋白,加入4μl 5x SDS sample buffer,2μl DTT(1M),混匀。混匀后95℃处理5min
(2)将20μl处理后的样品用7.5%SDS-PAGE电泳分离,电流15-30mA,电 泳1h。(3)电泳完成后,根据厂家说明书,利用Bio-rad的蛋白转膜系统将 蛋白转到PVDF膜。
(4)转膜结束后,将PVDF膜转入H2O中清洗2次,每次5min。
(5)封闭:将PVDF膜转入含5%脱脂奶粉的TBST溶液中(10mM Tris pH7.6,150mMNaCl,0.1%Tween20),室温孵育1h。
(5)用1xTBST清洗PVDF膜3遍,每次10min。
(6)一抗孵育:在蛋白孵育盒中加入12ml 1xTBST,1:1000加入FLAG抗体 (Sigma-Aldrich),室温孵育1h。
(12)用1xTBST洗PVDF膜3次,每次10min。
(13)二抗孵育:在蛋白孵育盒中加入12ml 1xTBST,1:10000加入HRP标 记的二抗(Sigma-Aldrich),将PVDF膜转入室温孵育1h。
(14)用1xTBST清洗PVDF膜3次,每次10min。
(15)最后使用SuperSignalTMWest Femto Maximum Sensitivity Substrate(Pierce)检测特异蛋白条带。
经WesternBlotting检测,检测结果见图9,inPTG-Cas9结构的 pRGEB33/34-inPTG10都检测到了Cas9的表达,说明PTG插入到内含子中, Cas9依然能正常表达。但从表达量上来看,两个inPTG的载体相比较于 pRGEB32-PTG10,Cas9的表达量有一定的下降,但Cas9表达量的下降是否 会影响到载体的编辑效率,有待于检测。
不同载体的基因编辑效率比较
为了比较pRGEB32、pRGEB33、pRGEB34三个载体间基因编辑效率,我 们将PTG3/4/6/7/10分别插入到三个载体骨架中。
利用PEG法将UBI10p::inPTG3/4/6/7/10-Cas9质粒载体与原有的 U3p::PTG3/4/6/7/10-UBI10p::Cas9质粒载体以及GFP质粒转化水稻原生质体, GFP质粒作为原生质体转化的阳性对照。原生质体在室温培养20小时后观察 GFP的转化效率,36h后收集原生质体,用CTAB法提取原生质体的DNA, 步骤如下:(1)将原生质体转入1.5ml EP管中,300g离心3min,弃上清。
(2)将收集的原生质体细胞中加入500μl 65℃预热的2x CTAB,颠倒混匀。 然后65℃水浴20min。
(3)加入500μl苯酚:氯仿:异戊醇(25:24:1),40rpm旋转混合30min。
(4)12000rpm离心5min,将上清转入新EP管中。
(5)加入1/10体积的3MNaAc和等体积的异丙醇,充分颠倒混匀,放入-20℃ 1h。
(6)12000rpm离心5min,弃上清。
(7)加入1ml 75%乙醇,12000rpm离心2min,弃上清。
(8)沉淀晾干后加入30μl H2O,溶解DNA。
接下来,用野生型水稻的基因组DNA作为阴性对照,PCR扩增包含每个 基因两个靶位点的DNA片段,引物见表7,PCR反应体系:以200ng基因组 DNA为模板,加入5μl 5x GreenGO Buffer(Fermentas),2μl dNTP(2.5mM, Takara),0.5μl F/R,0.1μl Ex Taq(5U/μl,Takara),补水至25μl。PCR反应程序: 98℃预变性20s,98℃变性10s,60℃退火30s,72℃延伸1min/Kb,共35个 循环,最后72℃延伸5min。
表7:基因型鉴定所用引物(Seq ID No.84~Seq ID No.97)
通常我们对一个基因设计两个靶位点,这样可以利用Cas9和一对gRNA 切除基因中的一段序列,因此通过PCR扩增包含两个靶位点的片段,就可以 检测基因组编辑的效率:利用琼脂糖凝胶电泳检测,能够直接观测到两条DNA 条带:没有被编辑的DNA条带以及被成功编辑的DNA条带。
通过Image J软件计算成功被编辑的条带占总DNA量(没有被基因编辑的 条带和成功被基因编辑的条带的DNA量的总和)的百分比,即编辑效率(在 原生质体转化效率相同的情况下,为方便分析,暂不把转化效率计算在内)。 结果见图10,在水稻原生质体中表达inPTG4/10-Cas9后,PCR检测靶基因 DNA片段被剪切的效率(Del%),以原有的U3p::PTG-UBI10p::Cas9载体和 野生型基因组DNA作为对照。经计算,PTG10和inPTG10的编辑效率分别 为1.4%和1.6%,PTG4和inPTG4的编辑效率分别为25%和30.9%;即PDS 和MPK2在inPTG-Cas9载体中的编辑效率优于U3::PTG-UBI10p::Cas9的载 体。但是PTG3和inPTG3的编辑效率分别为21.3%和11%,PTG6和inPTG6 的编辑效率分别为6%和4.4%(见图11),表明MPK1和MPK5在inPTG-Cas9 载体中的编辑效率略低于U3::PTG-UBI10p::Cas9的载体。在包含4个gRNA 的PTG7/inPTG7片段中,MPK1靶基因的编辑效率在inPTG-Cas9载体中略低 于U3::PTG-UBI10p::Cas9的载体,而在inPTG-Cas9载体中MPK5靶基因的 编辑效率高于U3::PTG-UBI10p::Cas9载体(见图12)。
因此,综上所述,inPTG-Cas9载体结构与U3::PTG-UBI10p::Cas9同样具 有高效的多基因编辑能力,两者效率相差不大。此外,pRGEB33和pRGEB34 两个载体间的编辑效率没有明显区别,表明缩短内含子的长度并不影响 inPTG-Cas9的编辑效率。
实施例2 在水稻中验证inPTG-Cas9编辑效率
我们进一步在水稻植株中验证inPTG-Cas9的编辑效率。用农杆菌介导转 化的方法分别将pRGEB33-inPTG3/6/7/10载体转入到中花11水稻植株中。
pRGEB33-inPTG10用于PDS基因的敲除,当PDS基因被敲除时,水稻 植株会出现白化现象。在转基因植株中,在27株敲除PDS的T0代转基因植 株中,有12株植株出现了白化苗(见图13),结果表明inPTG10-Cas9具有 较高的编辑效率。
利用PCR/RE的方法检测转基因水稻中MPK1,MPK5,PDS编辑情况。 用CTAB法提取转基因水稻叶片的基因组DNA,以野生型水稻的基因组DNA 作为对照,用引物(见引物序列表7)扩增包含靶位点的基因组DNA,利用限制 性内切酶酶切PCR产物。因为Cas9剪切位点位于PAM前第三和第四个碱基 之间,如果这个区域有限制性内切酶识别序列,当靶位点被编辑之后,酶切 位点就会被破坏,利用限制性内切酶酶切时无法切开被破坏的位点,而未被 编辑的则会被切开,通过琼脂糖凝胶电泳即可检测出目的基因是否被编辑。
水稻为二倍体植物,转基因植株会出现单等位基因突变、双等位基因突变 和没有突变三种情况。若酶切后只存在一条条带,且该条带大小与未被酶切 的野生型DNA扩增条带相同,则该植株为双等位基因突变;若酶切后只有两 条条带,两条条带大小与酶切后的野生型DNA片段相同,则该植株没有突变; 若酶切后出现三条条带,既存在与未被酶切的野生型DNA条带大小相同的条 带,也存在与酶切后的野生型DNA条带大小相同的条带,该植株为单等位基 因突变。
MPK1用Blp I酶切检测(图15),MPK5用Sac I和Kpn I酶切检测(图 15),PDS用EcoRI酶切检测。酶切结果显示,77%(17/22)的inPTG3-Cas9 转基因植株发生了突变,其中73%(16/22)为双等位基因突变,4%(1/22)为 单等位基因突变。inPTG6-Cas9转基因植株中,由Sac I酶切的靶位点71% (22/31)发生了突变,其中13%(4/31)为双等位基因突变,58%(18/31)为 单等位基因突变,由Kpn I酶切的靶位点84%(26/31)发生了突变,其中61%(19/31)为双等位基因突变,23%(7/31)为单等位基因突变;敲除PDS的 转基因植株中,85%(23/27)发生了突变,其中11%(3/27)为双等位基因 突变,74%(20/27)为单等位基因突变;inPTG7-Cas9转基因植株中,敲除 MPK1基因的效率为50%(4/8),且均为双等位基因突变,敲除MPK5基因 的效率为62.5%(5/8)(图14)。
图14中a为通过PCR酶切检测gRNA1/2/3靶位点的突变情况。红 色箭头表示靶位点产生突变未被酶切的DNA,黑色箭头表示被酶切的 野生型DNA。
图14中b为inPTG7-Cas9部分转基因株系的靶位点被编辑的情况。
综上所述,50%-84%的inPTG-Cas9转基因植株发生了突变, inPTG3/6/7/10-Cas9转基因植株突变频率结果见图15,其中73%为双等位基 因突变,而原有的U3p::PTG-UBI10p::Cas9转基因植株的突变效率为 47%-100%。这两者之间的微小差别可能是由于水稻转化的不同引起的。根据 inPTG-Cas9在水稻中的编辑效率,表明inPTG-Cas9能够在水稻中高效稳定地 进行多位点编辑。
实施例3 inPTG的内含子可以放在基因的不同位置
设计inPTG-Cas9使用的是水稻内源UBI10基因的结构来表达Cas9和内含 子中的gRNA。由于基因的内含子位置并不是固定的,因此inPTG是可以在 重组基因的不同位置表达的。为了验证我们的设想,我们构建了新的结构将 inPTG插入到Cas9基因的3’-UTR区(UBI10p::Cas9-inPTG)。同时,在PTG 最后一个gRNA后加入tRNA(inPTG-tRNA),以提高最后一个靶位点从内含 子中剪切下来效率。
1、载体说明
在载体pRGEB33基础上,用UBI10内源的内含子(SEQ ID:4)替换加入了 BsaⅠ酶切位点的内含子,同时在重组Cas9基因的3’-UTR区插入含有两个 BsaⅠ酶切位点的内含子(SEQ ID:9),用于PTG的克隆,载体命名为 pRGEB33T,pRGEB33T载体结构示意图见图16。
用Golden Gate克隆方法在PTG3/4/6最后一个gRNA后加入一个tRNA,分 别命名为PTG3t(SEQ ID:16),PTG4t(SEQ ID:17),PTG3t(SEQ ID:18)并构 建到载体pRGEB33中,同时PTG7构建到pRGEB33T中 (UBI10p::Cas9-inPTG7)。
2、不同载体的基因编辑效率比较
首先比较PTG和PTGt对于编辑效率的影响,以MPK1、MPK2、MPK5 为靶基因,对应的PTG(t)名称分别为PTG3(t),PTG4(t),PTG6(t),PTG和PTGt 结构的表达载体编辑MPK1、MPK2和MPK5的效率见图17;另外为比较 pRGEB33与pRGEB33T,以PTG7分别构建在pRGEB32、pRGEB33T、 pRGEB33、pRGEB34的载体进行基因编辑效率比较(结果见图19)。
利用PEG法将UBI10p::inPTG3/4/6/3t/4t/6t-Cas9、UBI10p::Cas9-inPTG7以 及GFP质粒转化水稻原生质体,GFP质粒作为原生质体转化的阳性对照。原 生质体25℃培养20小时后观察GFP的转化效率,36h后收集原生质体。
提取水稻原生质体的基因组DNA,用野生型水稻的基因组DNA作为阴性 对照,扩增包含靶序列的DNA片段,并用琼脂糖凝胶进行电泳(PCR反应同 前,引物见表7)。
通过Image J计算编辑效率发现,inPTG3t的编辑效率为14.4%略高于PTG3 的编辑效率为14.1%;inPTG4t的编辑效率为30.7%高于inPTG4的编辑效率 为24%;而inPTG6t(4.2%)和inPTG6(7%)效率都较低,inPTG6效率略 高于inPTG6t(图17)。因此总体而言,inPTGt的编辑效率要好于inPTG。
比较pRGEB33T与pRGEB33载体的编辑效率我们发现(图18),检测 MPK1基因的编辑效率,pRGEB33T的编辑效率(6.9%)高于pRGEB32/33/34; 检测MPK5基因的编辑效率,pRGEB33T的编辑效率(7.1%)也高于 pRGEB32/33/34。因此,结果表明pRGEB33T载体的编辑效率比pRGEB33载 体。
因此,结果验证了inPTG可以在基因的不同位置表达,并且本实验中inPTG 在重组Cas9基因的3’-UTR区表达的结构比在内含子中表达效率更高。
实施例4:利用inPTG-Cas9可以选择不同的PolⅡ启动子来同时表达Cas9和 gRNAs
inPTG-Cas9系统的优势在于,来自于一个基因的PolⅡ启动子可以同时驱 动Cas9和gRNAs的表达,因此可以根据需要很简便地更换不同用途的PolⅡ 启动子。本实验以MAP2为靶基因,设计两个用于敲除MPK2的gRNA构建 PTG4,并使用两个病原菌诱导性基因PR1(Os01g0382000)和PR5 (Os12g0628600)的启动子驱动inPTG4-Cas9的表达,通过对MPK2基因的 编辑情况的检测,验证了不同的PolⅡ启动子可以用于inPTG-Cas9的表达。
1.载体说明
pRGEB3341载体和pRGEB3345载体(结构示意图见图19)分别由PR1 启动子(PR1p)和PR5启动子(PR5p)驱动inPTG-Cas9的表达,两个载体中含 有两个BsaⅠ酶切位点的内含子以及Cas9序列相同,载体详述如下:
pRGEB3341载体表达框元件包括:PR1启动子(Seq ID No.19)、来源 于水稻Ubiquitin10(UBI10)基因的部分5’-UTR外显子序列,以及内含子和第 二个外显子部分序列,其中内含子经过改造含有两个BsaⅠ酶切位点用于PTG 序列的克隆(同pRGEB33内含子)、Cas9基因序列与pRGEB32相同。PR1 启动子从Kitaake水稻基因组中PCR扩增获得,引物为Pro-PR1b-F和 Pro-PR1b-R,通过HindⅢ和NruⅠ酶切后构建到载体中。
pRGEB3345载体表达框元件包括PR5启动子(Seq ID No.20),其他部 分与pRGEB3341载体除启动子之外的序列相同。PR5启动子从Kitaake水稻 基因组中PCR扩增获得,引物为Pro-PR5-F和Pro-PR5-R,并利用overlap extension PCR将启动子中的一个BsaⅠ酶切位点突变,最后通过HindⅢ和 NruⅠ酶切后构建到载体中。
PTG4(Seq ID No.12)是由tRNA(SEQ ID:10)分别和两个用于敲除MPK2 的gRNA5和gRNA6串联构成的。通过用BsaⅠ酶切pRGEB3341和 pRGEB3345,将PTG4分别插入到两个载体的内含子中,构建成 pRGEB3341-inPTG4和pRGEB3345-inPTG4。
2.不同载体基因编辑效率的比较
利用PEG-CaCl2转化法将pRGEB33-inPTG4、pRGEB3341-inPTG4和 pRGEB3345-inPTG4转化水稻原生质体,GFP质粒作为原生质体转化的阳性 对照,25℃培养36h后收集原生质体。由于在MPK2上设计了两个靶位点, 当两个位点都被编辑后,可能出现中间片段丢失的情况,因此可以通过PCR 从两个靶位点外侧相向扩增,被编辑的DNA扩增的片段会比野生型的DNA 扩增的片段小。利用PCR对不同载体的基因编辑效率进行检测和比较,具体 步骤如下:
首先,利用CTAB法提取原生质体的基因组DNA,用引物MPK2-F和 MPK2-R2(表7)扩增包含靶序列的目的片段,经琼脂糖凝胶电泳检测,结 果如图20所示:野生型“WT”扩增的目的条带单一,没有非特异扩增;三个 不同启动子驱动inPTG4-Cas9的载体转化原生质体后都检测到了编辑后被切 除了507bp后的条带。通过Image J软件计算被剪切后的DNA片段占总DNA 量的百分比,即反映了该样品被编辑的效率。pRGEB33-inPTG4、 pRGEB3341-inPTG4和pRGEB3345-inPTG4转化的原生质体目的基因剪切的 频率依次是33%、29%、31%。三者的编辑效率比较一致,说明利用inPTG-Cas9 系统可以根据需求很简便地选择不同目的的PolⅡ启动子来同时表达Cas9和 gRNAs。
实施例5:利用内含子表达crRNA,使Cpf1具有高效的多位点编辑能力 1.CRISPR/Cpf1说明
CRISPR/Cpf1是一种比CRISPR/Cas9更为简单的CRISPR系统,与Cas9 不同的是,Cpf1能够独立地将前体CRISPR RNA(pre-crRNA)剪切加工,然后 利用加工后产生的成熟crRNA特异地靶向和切割DNA双链,因而也就不需 要来自宿主细胞的核糖核酸酶和tracrRNA。
CRISPR-Cpf1介导的基因组编辑结构示意图见图21:左图表示Cpf1在 crRNA的引导下靶向目标DNA位点,并对靶基因进行剪切。crRNA由5’端 的直接重复序列(DR,茎环区域)和3’端的引导序列组成。右图表示Cpf1 具有切割前体crRNA的活性。图中剪刀所示位置为Cpf1的剪切位点。
2.载体说明
利用Lachnospiraceae bacteriumND2006(LbCpf1)(Seq ID No.21)和密码 子优化的Francisellanovicida(FnCpf1)(Seq ID No.22)构建用于植物中基因 编辑的载体,表达Cpf1和crRNAs的载体结构图见图22;用U3启动子(p32Lb 和p32Fn)表达crRNAs或在内含子中(p33Lb和p33Fn)表达crRNAs。多个 crRNAs能够以polycistronic tRNA-crRNA(PTC)或者crRNAarray(CA)结 构被识别加工。图中三角形表示crRNAs插入到双Bsa I的克隆位点中。
其中p32Fn/p32Lb是由水稻U3启动子(同pRGEB32)驱动crRNA的表 达,由UBI10启动子(同pRGEB32)驱动Cpf1(Fn/Lb)的表达。载体中使用 的UBI10启动子,包括UBI10的启动子片段、5’-UTR的外显子和内含子以及 第二个外显子部分序列。
p33Fn/p33Lb是由UBI10启动子同时驱动位于内含子中的crRNA和 Cpf1(Fn/Lb)的表达。载体中的UBI10启动子(同pRGEB33)是在p32Fn/p32Lb 的UBI10启动子基础上在内含子中加上两个BsaⅠ酶切位点,用于crRNA的 克隆。
为了比较不同的载体的编辑效率,如图23所示,以水稻PDS为靶基因, 设计两个靶位点crRNA1和crRNA2,并且以polycistronic tRNA-crRNA(PTC) 和crRNAarray(CA)两种构建策略(图24)使Cpf1具有同时编辑多个位点能 力。其中,PTCPDS(Seq ID No.23)的结构是tRNA-crRNA1-tRNA-crRNA2, 利用内源tRNA加工使多个crRNA被剪切释放出来;而CAPDS(SeqID No.24) 的结构是crRNA1-crRNA2-DR(direct repeat),它是利用Cpf1的能够剪切 pre-crRNA的能力,从而产生多个crRNA,实现多位点编辑。PTCPDS由引物 PDS-OLF1、PDS-OLR1、PDS-OLF2、PDS-OLR2通过overlap extension PCR 构建,CAPDS由引物M1、M2、M3、M4、M5通过overlap extensionPCR构建, 将两种crRNA表达的序列分别构建到p32Fn/p32Lb和p33Fn/p33Lb中,即U3p:: (PTCPDS/CAPDS)-UBI10p::Cpf1(Fn/Lb)和UBI10p::intron(PTCPDS/CAPDS)-Cpf1 (Fn/Lb),共8个载体。
3.crRNAarray插入到内含子中对于内含子剪接的影响
为了确定crRNAarray插入到载体内含子中,是否会对内含子的正常剪接 造成影响,从而影响到下游Cpf1的表达。实验通过对p33Fn-CAPDS(即 UBI10p::intron(CAPDS)-FnCpf1)和p33Lb-CAPDS(即UBI10p::intron (CAPDS)-LbCpf1)转录的mRNA进行分析,利用reverse transcription PCR (RT-PCR)检测内含子是否正常剪接。详述如下:
将p33Fn-CAPDS和p33Lb-CAPDS质粒分别转化到水稻原生质体中,25℃培 养24h后收集原生质体。利用TRIzol法提取原生质体的总RNA,总RNA经 DNaseⅠ(NEB)处理后,使用iScriptTM cDNA Synthesis Kit(Bio-Rad)以及 oligo-dT引物合成cDNA。以转p33Fn-CAPDS原生质体的cDNA为模板,用引 物exon1-qF和33Fn-qR扩增跨5‘-UTR内含子的片段,正常剪接后的片段大 小为228bp;以转p33Lb-CAPDS原生质体的cDNA为模板,用引物exon1-qF 和33Lb-qR(表6)扩增跨5‘-UTR内含子的片段,正常剪接后的片段大小为 201bp。扩增的片段通过琼脂糖凝胶电泳检测,结果如图25所示,其中a为 在(CAPDS)-Cpf1内含子两端的外显子上设计引物进行RT-PCR,扩增内含子 被剪切后的mRNA。其中b为RT-PCR产物的测序结果,内含子被正确剪接。 红色字体表示RNA剪接时内含子的供体为点和受体位点。
图25a所示,片段大小和预期一致。接下来用pEASY-Blunt克隆载体克 隆PCR扩增的目的片段。目的片段克隆后经测序分析(图25b),CAPDS插入 到p33Fn和p33Lb的内含子中都未影响到内含子的正常剪接。
4.不同crRNA表达方式编辑效率的比较
利用PEG-CaCl2转化法,将2中所述的8个载体转化到水稻原生质体中, GFP质粒作为原生质体转化的阳性对照,25℃培养36h后收集原生质体。利 用CTAB法提取原生质体的基因组DNA,通过引物OsPDSC-F和OsPDSC-R (表7)扩增含有两个靶位点的目的片段,经琼脂糖凝胶电泳检测,结果如图 26所示:野生型“WT”扩增的目的条带单一,没有非特异扩增。被编辑的DNA 扩增的片段会比野生型的DNA扩增的片段小1277bp左右。通过Image J软件 计算编辑后的DNA片段占总DNA量的百分比,比较8个载体的编辑效率。
通过琼脂糖凝胶电泳检测,八个载体都能够使PDS产生编辑,其中CAPDS结构的载体产生的目的基因的剪切频率(约19-39%)明显高于PTCPDS结构的 (约2-5%),而CAPDS在内含子中表达产生的剪切频率(FnCpf139%,LbCpf1 21%)与用U3启动子表达CAPDS所产生的剪切频率(FnCpf119%,LbCpf1 33%)差异不大,都有较高的剪切效率。
5.crRNA表达方式不同的载体,Cpf1表达量的比较
为了进一步分析在内含子中表达crRNA是否会影响到Cpf1的表达,使用WesternBlot分析了p32Fn-CAPDS和p33Fn-CAPDS中FnCpf1的表达情况,以及 p32Lb-CAPDS和p33Lb-CAPDS中LbCpf1的表达情况,详述如下:
首先,以PEG-CaCl2转化法,将用于分析的四个载体质粒转化到水稻原 生质体中,25℃培养12h后收集原生质体,使用RIPAbuffer(50mM Tris pH 7.5, 100mM NaCl,1%SDS,1%Triton X-100,10%glycerol)提取原生质体的总蛋 白,2μg左右提取的蛋白使用7%的SDS-PAGE电泳分离,然后将蛋白转移至 PVDF膜上。FnCp1融合了FLAG标签,LbCpf1融合的是HA的标签,因此FnCpf1用anti-FLAG抗体(Sigma-Aldrich)孵育,LbCpf1用anti-HA抗体(Sigma-Aldrich)孵育,一抗孵育后,接着用辣根过氧化物酶标记的anti-mouse 二抗(Sigma-Aldrich)进行孵育。在孵育结束后,使用SuperSignalTMWestFemto MaximumSensitivity Substrate(Pierce)检测特异蛋白条带。
Western blotting检测U3p::crRNA-UBI10p::Cpf1和 UBI10p::intron(crRNA)-Cpf1在水稻原生质体中Cpf1蛋白水平的差异结果如 图27所示,“loading“表示蛋白上样量对照。CAPDS由U3p驱动表达或插入 内含子中表达时,FnCpf1以及LbCpf1的表达量在两种情况下差异不大。因 此,crRNAarray在内含子中表达并不影响Cpf1的表达。
实施例6:验证intron(CA)-Cpf1高效的多基因编辑能力
intron(CA)-Cpf1具有在多个位点高效编辑的能力,前边的研究验证了在 一个基因的多个位点可以同时产生高效编辑,因此,接下来我们以MPK2和 MPK5为靶基因,验证intron(CA)-Cpf1多基因多位点编辑的能力。
1.载体说明
分别在MPK2和MPK5上设计两个靶位点,
设计crRNAs敲除MPK2和MPK5示意图见图28,其中a为每一个基因 设计了两个crRNAs靶向敲除,红色部分表明Cpf1的PAM序列。B为同时敲 除MPK2和MPK5的多个crRNA表达结构crRNAarray(CAMPK)结构示意 图。
MPK2的两个靶位点为crRNA3和crRNA4,MPK5的两个靶位点为 crRNA5和crRNA6。将两个基因的四个crRNA构建成crRNAarray串联的形 式CAMPK,即crRNA3-crRNA4-crRNA5-crRNA6-DR。接着将CAMPK分别构建 到p32Fn/p32Lb和p33Fn/p33Lb中,即U3p::CAMPK-UBI10p::Cpf1(Fn/Lb)和 UBI10p::intron(CAMPK)-Cpf1(Fn/Lb),共4个载体。
2.不同crRNA表达方式编辑效率的比较
利用PEG-CaCl2转化法,将上述的4个载体转化到水稻原生质体 中,GFP质粒作为原生质体转化的阳性对照,25℃培养36h后收集原 生质体。利用CTAB法提取原生质体的基因组DNA,通过引物MPK2-CF 和MPK2-CR(表7)扩增MPK2基因中包含靶位点的片段,通过引物MPK5-CF和MPK5-CR(表7)扩增MPK5基因中包含靶位点的片段。 经琼脂糖凝胶电泳检测,结果如图29所示:两个基因野生型“WT”扩 增的目的条带单一,没有非特异扩增。MPK2被编辑的DNA扩增的片 段会比野生型的DNA扩增的片段小436bp左右,MPK5被编辑的DNA 扩增的片段会比野生型的DNA扩增的片段小522bp左右。通过Image J软件计算编辑后的DNA片段占总DNA量的百分比,分别比较两个 基因的两种crRNA表达方式的编辑效率。
CAMPK在4种载体中表达时都可以使MPK2和MPK5同时被编辑(图29), 不过LbCPf1(9-32%)的剪切效率明显高于FnCpf1(2-9%),而对比两种LbCpf1 表达结构,CAMPK在内含子中表达时两个基因的剪切效率都明显高于用U3p 表达CAMPK,其中MPK2(32%VS 12%),MPK5(18%VS 9%)。因此,对于 Cpf1来说,在内含子中表达crRNAarray的方式是一种更高效的多基因编辑策 略。
由上述实施例可知,本发明提供的基于CRISPR系统的基因组编辑方法不 需要添加其他元件,安全性更高;利用一个启动子实现多个gRNA/crRNA与 Cas9/Cpf1的同步表达,简化了已有的CRISPR编辑系统,可采用不同的启动子, 扩大了启动子的选择范围,增强了在该方法植物中的通用性;提高了CRISPR 编辑系统的编辑效率和编辑能力,可以同时高效率的编辑多个靶位点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润 饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 华中农业大学
<120> 一种基于CRISPR系统的基因组编辑方法及其应用
<160> 97
<170> SIPOSequenceListing 1.0
<210> 1
<211> 381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc a 381
<210> 2
<211> 671
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
acaaattcgg gtcaaggcgg aagccagcgc gccaccccac gtcagcaaat acggaggcgc 60
ggggttgacg gcgtcacccg gtcctaacgg cgaccaacaa accagccaga agaaattaca 120
gtaaaaaaaa agtaaattgc actttgatcc accttttatt acctaagtct caatttggat 180
cacccttaaa cctatctttt caatttgggc cgggttgtgg tttggactac catgaacaac 240
ttttcgtcat gtctaacttc cctttcagca aacatatgaa ccatatatag aggagatcgg 300
ccgtatacta gagctgatgt gtttaaggtc gttgattgca cgagaaaaaa aaatccaaat 360
cgcaacaata gcaaatttat ctggttcaaa gtgaaaagat atgtttaaag gtagtccaaa 420
gtaaaactta tagataataa aatgtggtcc aaagcgtaat tcactcaaaa aaaatcaacg 480
agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 540
ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 600
agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 660
ctcctctcct c 671
<210> 3
<211> 81
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gcatcagctc cacccccgaa aaatttctcc ccaatctcgc gaggctctcg tcgtcgaatc 60
gaatcctctc gcgtcctcaa g 81
<210> 4
<211> 962
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt 60
ttgttgctag atccgattgg tggttagggt tgtcgatgtg attatcgtga gatgtttagg 120
ggttgtagat ctgatggttg tgatttgggc acggttggtt cgataggtgg aatcgtggtt 180
aggttttggg attggatgtt ggttctgatg attgggggga atttttacgg ttagatgaat 240
tgttggatga ttcgattggg gaaatcggtg tagatctgtt ggggaattgt ggaactagtc 300
atgcctgagt gattggtgcg atttgtagcg tgttccatct tgtaggcctt gttgcgagca 360
tgttcagatc tactgttccg ctcttgattg agttattggt gccatgggtt ggtgcaaaca 420
caggctttaa tatgttatat ctgttttgtg tttgatgtag atctgtaggg tagttcttct 480
tagacatggt tcaattatgt agcttgtgcg tttcgatttg atttcatatg ttcacagatt 540
agataatgat gaactctttt aattaattgt caatggtaaa taggaagtct tgtcgctata 600
tctgtcataa tgatctcatg ttactatctg ccagtaattt atgctaagaa ctatattaga 660
atatcatgtt acaatctgta gtaatatcat gttacaatct gtagttcatc tatataatct 720
attgtggtaa tttcttttta ctatctgtgt gaagattatt gccactagtt cattctactt 780
atttctgaag ttcaggatac gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc 840
ctgttactat ctttttgaat acatgtatgt tctgttggaa tatgtttgct gtttgatccg 900
ttgttgtgtc cttaatcttg tgctagttct taccctatct gtttggtgat tatttcttgc 960
ag 962
<210> 5
<211> 2
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
at 2
<210> 6
<211> 4312
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagt aagaattcgc ggccgcactc gagatatcta gacccagctt tc 4312
<210> 7
<211> 982
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt 60
ttgttgctag atccgattgg tggttagggt tgtcgatgtg attatcgtga gatgtttagg 120
ggttgtagat ctgatggttg tgatttgggc acggttggtt cgataggtgg aatcgtggtt 180
aggttttggg attggatgtt ggttctgatg attgggggga atttttacgg ttagatgaat 240
tgttggatga ttcgattggg gaaatcggtg tagatctgtt ggggaattgt ggaactagtc 300
atgcctgagt gattggtgcg atttgtagcg tgttccatct tgtaggcctt gttgcgagca 360
tgttcagatc tactgttccg ctcttgattg agttattggt gccatgggtt ggtgcaaaca 420
caggctttaa tatgttatat ctgttttgtg tttgatgtag atctgtaggg tagttcttct 480
tagacatggt tcaattatgt agcttgtgcg tttcgatttg atttcatatg ttcacagatt 540
agataatgat gaactctttt aattaattgt caatggtaaa taggaagtct tgtcgctata 600
tctgtcataa tgatctcatg ttactatctg ccagtaattt atgctaagaa ctatattaga 660
atatcatgtt acaatctgta gtaatatcat gttacaatct gtagttcatc tatataatct 720
attgtggtaa tttcttttta ctatctgtgt gaagattatt gccactagtt cattctactt 780
atttctgaag ttcaggatac gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc 840
ctgttactat ctttttgaat acatgtatgt tctgttggaa tatggcagga gaccgaggtc 900
tcggtttgct gtttgatccg ttgttgtgtc cttaatcttg tgctagttct taccctatct 960
gtttggtgat tatttcttgc ag 982
<210> 8
<211> 146
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggc aggagaccga 60
ggtctcggtt tgctgtttga tccgttgttg tgtccttaat cttgtgctag ttcttaccct 120
atctgtttgg tgattatttc ttgcag 146
<210> 9
<211> 1084
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cagctgggag gcgacaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 60
aagtaagaat tcgcggccgc actcgagata ttcaaggtac gctgcttctc ctctcctcgc 120
ttcgtttcga ttcgatttcg gacgggtgag gttgttttgt tgctagatcc gattggtggt 180
tagggttgtc gatgtgatta tcgtgagatg tttaggggtt gtagatctga tggttgtgat 240
ttgggcacgg ttggttcgat aggtggaatc gtggttaggt tttgggattg gatgttggtt 300
ctgatgattg gggggaattt ttacggttag atgaattgtt ggatgattcg attggggaaa 360
tcggtgtaga tctgttgggg aattgtggaa ctagtcatgc ctgagtgatt ggtgcgattt 420
gtagcgtgtt ccatcttgta ggccttgttg cgagcatgtt cagatctact gttccgctct 480
tgattgagtt attggtgcca tgggttggtg caaacacagg ctttaatatg ttatatctgt 540
tttgtgtttg atgtagatct gtagggtagt tcttcttaga catggttcaa ttatgtagct 600
tgtgcgtttc gatttgattt catatgttca cagattagat aatgatgaac tcttttaatt 660
aattgtcaat ggtaaatagg aagtcttgtc gctatatctg tcataatgat ctcatgttac 720
tatctgccag taatttatgc taagaactat attagaatat catgttacaa tctgtagtaa 780
tatcatgtta caatctgtag ttcatctata taatctattg tggtaatttc tttttactat 840
ctgtgtgaag attattgcca ctagttcatt ctacttattt ctgaagttca ggatacgtgt 900
gctgttacta cctatctgaa tacatgtgtg atgtgcctgt tactatcttt ttgaatacat 960
gtatgttctg ttggaatatg gcaggagacc gaggtctcgg tttgctgttt gatccgttgt 1020
tgtgtcctta atcttgtgct agttcttacc ctatctgttt ggtgattatt tcttgcagat 1080
tcta 1084
<210> 10
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 11
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaatc caggcgacgc tgagccagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tggcccaccg gggtataaaa gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 12
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcagaa cccggtcgcc tcaaggagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca gaatgcgcag actcgtcagg gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 13
<211> 357
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttttt 357
<210> 14
<211> 703
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcaac aaagcaccag 360
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 420
tgcaatccag gcgacgctga gccagtttta gagctagaaa tagcaagtta aaataaggct 480
agtccgttat caacttgaaa aagtggcacc gagtcggtgc aacaaagcac cagtggtcta 540
gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcatgg 600
cccaccgggg tataaaagtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 660
tatcaacttg aaaaagtggc accgagtcgg tgcttttttt ttt 703
<210> 15
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaca agccaggaga attcagcgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca cactgcatgg ataactcatc gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 16
<211> 432
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaatc caggcgacgc tgagccagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tggcccaccg gggtataaaa gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 360
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 420
gcattttttt tt 432
<210> 17
<211> 433
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcagaa cccggtcgcc tcaaggagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca gaatgcgcag actcgtcagg gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 360
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 420
gcattttttt ttt 433
<210> 18
<211> 434
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcaac aaagcaccag 360
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 420
tgcatttttt tttt 434
<210> 19
<211> 1443
<212> DNA
<213> Oryza sativa
<400> 19
gcttgggcag ctggaggaga aagaagacat atatatatag gggtgggact ttagtcccgg 60
ttggtgttac caaccaggac taaagatcac gggggggggg gggggggggc gacaggccct 120
agtagcattt gaaccaggac taaagattaa atatgtcaaa catggtcaaa catgttatac 180
catgttgatc atgcatgtag ctaagtgcga tttatatctt atacatttgc ataaaatttt 240
tgaataagac gaatggttaa acatatgaga aaaagtcaac ggcgttttct attaaaaaac 300
ggaggtagta ttacttagta ttcatgcatg tatgcatgga catgcagcct tcgagtgcac 360
agcgagtttt tgtatagtga aaaaaaaatg atgagatgga aggaaaggat ggcatacgtt 420
cggtggggag gggaattcgg aggttttatt ttttttttgg taagtacacg cgcgcacgta 480
catactactg aaggagaaga ggtggggccc tggtgtcttg ttagttttaa ggttaatcta 540
atctaacggt ttataatatt ggattcacca acttaaatga aaacgaaggg acacatgttt 600
tgcttttttc tcagaatttt ttgaatttct ctaatttatt agaacgccac atgacggctt 660
gagagtgttt gtaggaagtt taatggacgt ttagtatata ataatagata gaatttcttg 720
gatttctcta atttattaga gcgccacatg acggcttgag agcgtttgta tgaagtttaa 780
tgtactttta gtatataata gatagataga tagatagata gaagatagtt tttgtatgag 840
ttgttcgatg ttttacgctc ccaaatatat taatacattg gatcaccatt ttaaatttat 900
tatagataag tttaatacga aaatttcaga tttgttttct taatttttat gaacaacatt 960
tgcatacaac atctggtcgt aataactacg ttgaatatta ccctcttgat gacttgacta 1020
attttagaca aaagatggtc acccacccag cttttcattg aaagtataag agttcataca 1080
gtgcaaaaag gaacaaaggt aaaataaaag gaaagtaaaa atcccaagtc ctgcgtacaa 1140
atctatagtt caagacatac acatcgcctt ccaaccgagg tcgagttgcc ccggtgccat 1200
gtcttattcg tggaattcta tgtccaagtg catactttgc gggggtaaaa ttttctacac 1260
gtatgttgcc aaaatttctg ctaagttttt cgtggccaac tcgagaaaat tcttacacag 1320
ccagtctata aatactcaca catttcacaa aaaaatactt gcaacatcaa agctacacag 1380
gtagaatcat cgaccgtaag taagtactac tcctacgtac attaagtgtg agcttgatta 1440
act 1443
<210> 21
<211> 1637
<212> DNA
<213> Oryza sativa
<400> 21
ggaagttata ttacgtctac caacctattt tacccgtcat ttaattaatt tggtcgtctt 60
cttctggcga ccgatcggat cgatcacatc tcgcgtatct atttccacac atgttttgca 120
caaaactaca agggatcgat tggccagcca gccggaaatt gaagactatt ctgcagagga 180
ctcatcctct aagtcgaggc atgcaaaact aaaacaaagt gaattaaaaa aaaggaagtt 240
gtagtcaaga aaatttctag acaactacta acaaacaaca aaactttttt tatagggaaa 300
caaacaacaa aactaactaa atgaaacaga ttatgtgtct tagatacatt aatttagaac 360
tattcaacat gcctgataac actgttttgc agtgaattaa ttacgaacca ttcaacattt 420
ctttaaccaa tataaataac atggcaattc tagctagtat gtattctgca cgcacgtatg 480
catcacgtat gtgctcccct ttaaaaaaat tgatgcttga aaaaaagttc ggtgaaattt 540
ttaaaatttt aacaatctat aatttttcaa atagttagtt aatttaaata cgaaagaata 600
gtgcacatat atttgcctta aatcataata tcatatcata aacttaaact tattatatta 660
ggttttataa ataatttaaa atataggtaa aattttggcc aaatctcctc aacgcatcaa 720
atcaaataat tatgaacaga tggaaatgga caatttgtag ttaggtatgg acacacacct 780
ccagataact atatatactt tactcggtca gaatctgtca tactgatgtg gtcatcgaga 840
aggtcttaaa aacataatta ggaataaata gcgtggtgac cttcatgcac ccagttctga 900
atactgcata ataggaataa aaatcatgac tgtagtacca tgaatacact ggctagtaaa 960
aatctgagct aactagtagt attaattgat tggattggtt gtgtgcatta tttcatctaa 1020
acgtagtact ctgaatcaag tttttgcatg cggtatggcg ccgcctatga tcaaaggcgt 1080
gaaaatagat gattttcgtt agcggtccca catccgcatg taaaactcgg ttttatgcgg 1140
gactctaaac cacgtacaaa aatcaatttt cataaaagga gcctagcaag tgacctgcat 1200
gcaaataccc ttttaggcga acaaaatgaa aatcaagtcc aacttaccct atcacagatc 1260
atggattcac aaaccacgaa aaaaaacata gatttaaata attggtcctc tttaatacct 1320
tcctgttaag atctctagat aaaaccgctt gcaaaagtaa aggttttcgc aggatgtcct 1380
ctttagatgt cctgcttgta aatagatacc tcccattatg tttacatatg gggttttaag 1440
tagctagtga ttaaatctct ctctctcaca catctccatc tagattaatt tgcacacaat 1500
tatctactag ctaaaaagaa gagaattttc aacactatag catctataaa tacgcatgcc 1560
ccttcatccc ttctccttcc aaagcatctc gatcctacca catcgttaag aaagtcgtat 1620
agtagagtaa attgtta 1637
<210> 21
<211> 3822
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
atgagcaagc tggagaagtt tacaaactgc tactccctgt ctaagaccct gaggttcaag 60
gccatccctg tgggcaagac ccaggagaac atcgacaata agcggctgct ggtggaggac 120
gagaagagag ccgaggatta taagggcgtg aagaagctgc tggatcgcta ctatctgtct 180
tttatcaacg acgtgctgca cagcatcaag ctgaagaatc tgaacaatta catcagcctg 240
ttccggaaga aaaccagaac cgagaaggag aataaggagc tggagaacct ggagatcaat 300
ctgcggaagg agatcgccaa ggccttcaag ggcaacgagg gctacaagtc cctgtttaag 360
aaggatatca tcgagacaat cctgccagag ttcctggacg ataaggacga gatcgccctg 420
gtgaacagct tcaatggctt taccacagcc ttcaccggct tctttgataa cagagagaat 480
atgttttccg aggaggccaa gagcacatcc atcgccttca ggtgtatcaa cgagaatctg 540
acccgctaca tctctaatat ggacatcttc gagaaggtgg acgccatctt tgataagcac 600
gaggtgcagg agatcaagga gaagatcctg aacagcgact atgatgtgga ggatttcttt 660
gagggcgagt tctttaactt tgtgctgaca caggagggca tcgacgtgta taacgccatc 720
atcggcggct tcgtgaccga gagcggcgag aagatcaagg gcctgaacga gtacatcaac 780
ctgtataatc agaaaaccaa gcagaagctg cctaagttta agccactgta taagcaggtg 840
ctgagcgatc gggagtctct gagcttctac ggcgagggct atacatccga tgaggaggtg 900
ctggaggtgt ttagaaacac cctgaacaag aacagcgaga tcttcagctc catcaagaag 960
ctggagaagc tgttcaagaa ttttgacgag tactctagcg ccggcatctt tgtgaagaac 1020
ggccccgcca tcagcacaat ctccaaggat atcttcggcg agtggaacgt gatccgggac 1080
aagtggaatg ccgagtatga cgatatccac ctgaagaaga aggccgtggt gaccgagaag 1140
tacgaggacg atcggagaaa gtccttcaag aagatcggct ccttttctct ggagcagctg 1200
caggagtacg ccgacgccga tctgtctgtg gtggagaagc tgaaggagat catcatccag 1260
aaggtggatg agatctacaa ggtgtatggc tcctctgaga agctgttcga cgccgatttt 1320
gtgctggaga agagcctgaa gaagaacgac gccgtggtgg ccatcatgaa ggacctgctg 1380
gattctgtga agagcttcga gaattacatc aaggccttct ttggcgaggg caaggagaca 1440
aacagggacg agtccttcta tggcgatttt gtgctggcct acgacatcct gctgaaggtg 1500
gaccacatct acgatgccat ccgcaattat gtgacccaga agccctactc taaggataag 1560
ttcaagctgt attttcagaa ccctcagttc atgggcggct gggacaagga taaggagaca 1620
gactatcggg ccaccatcct gagatacggc tccaagtact atctggccat catggataag 1680
aagtacgcca agtgcctgca gaagatcgac aaggacgatg tgaacggcaa ttacgagaag 1740
atcaactata agctgctgcc cggccctaat aagatgctgc caaaggtgtt cttttctaag 1800
aagtggatgg cctactataa ccccagcgag gacatccaga agatctacaa gaatggcaca 1860
ttcaagaagg gcgatatgtt taacctgaat gactgtcaca agctgatcga cttctttaag 1920
gatagcatct cccggtatcc aaagtggtcc aatgcctacg atttcaactt ttctgagaca 1980
gagaagtata aggacatcgc cggcttttac agagaggtgg aggagcaggg ctataaggtg 2040
agcttcgagt ctgccagcaa gaaggaggtg gataagctgg tggaggaggg caagctgtat 2100
atgttccaga tctataacaa ggacttttcc gataagtctc acggcacacc caatctgcac 2160
accatgtact tcaagctgct gtttgacgag aacaatcacg gacagatcag gctgagcgga 2220
ggagcagagc tgttcatgag gcgcgcctcc ctgaagaagg aggagctggt ggtgcaccca 2280
gccaactccc ctatcgccaa caagaatcca gataatccca agaaaaccac aaccctgtcc 2340
tacgacgtgt ataaggataa gaggttttct gaggaccagt acgagctgca catcccaatc 2400
gccatcaata agtgccccaa gaacatcttc aagatcaata cagaggtgcg cgtgctgctg 2460
aagcacgacg ataaccccta tgtgatcggc atcgataggg gcgagcgcaa tctgctgtat 2520
atcgtggtgg tggacggcaa gggcaacatc gtggagcagt attccctgaa cgagatcatc 2580
aacaacttca acggcatcag gatcaagaca gattaccact ctctgctgga caagaaggag 2640
aaggagaggt tcgaggcccg ccagaactgg acctccatcg agaatatcaa ggagctgaag 2700
gccggctata tctctcaggt ggtgcacaag atctgcgagc tggtggagaa gtacgatgcc 2760
gtgatcgccc tggaggacct gaactctggc tttaagaata gccgcgtgaa ggtggagaag 2820
caggtgtatc agaagttcga gaagatgctg atcgataagc tgaactacat ggtggacaag 2880
aagtctaatc cttgtgcaac aggcggcgcc ctgaagggct atcagatcac caataagttc 2940
gagagcttta agtccatgtc tacccagaac ggcttcatct tttacatccc tgcctggctg 3000
acatccaaga tcgatccatc taccggcttt gtgaacctgc tgaaaaccaa gtataccagc 3060
atcgccgatt ccaagaagtt catcagctcc tttgacagga tcatgtacgt gcccgaggag 3120
gatctgttcg agtttgccct ggactataag aacttctctc gcacagacgc cgattacatc 3180
aagaagtgga agctgtactc ctacggcaac cggatcagaa tcttccggaa tcctaagaag 3240
aacaacgtgt tcgactggga ggaggtgtgc ctgaccagcg cctataagga gctgttcaac 3300
aagtacggca tcaattatca gcagggcgat atcagagccc tgctgtgcga gcagtccgac 3360
aaggccttct actctagctt tatggccctg atgagcctga tgctgcagat gcggaacagc 3420
atcacaggcc gcaccgacgt ggattttctg atcagccctg tgaagaactc cgacggcatc 3480
ttctacgata gccggaacta tgaggcccag gagaatgcca tcctgccaaa gaacgccgac 3540
gccaatggcg cctataacat cgccagaaag gtgctgtggg ccatcggcca gttcaagaag 3600
gccgaggacg agaagctgga taaggtgaag atcgccatct ctaacaagga gtggctggag 3660
tacgcccaga ccagcgtgaa gcacaaaagg ccggcggcca cgaaaaaggc cggccaggca 3720
aaaaagaaaa agggatccta cccatacgat gttccagatt acgcttatcc ctacgacgtg 3780
cctgattatg catacccata tgatgtcccc gactatgcct aa 3822
<210> 22
<211> 4065
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gattataagg atcatgatgg agattacaag gatcacgata ttgattataa ggatgatgat 60
gataagatgg ctcctaagaa gaagagaaag gttggcattc atggtgtgcc ggctgcctct 120
atctaccagg agttcgttaa taagtactct ttgtcaaaga ccctcaggtt tgagcttatt 180
cctcaaggca agactttgga aaacatcaag gccagaggtc ttattttgga tgatgagaag 240
agggctaagg attacaagaa ggccaagcag atcattgata agtaccacca attctttatc 300
gaggaaattc tttcttcagt gtgcatctca gaagatctcc ttcagaatta ctctgatgtc 360
tatttcaagt tgaagaagtc agatgatgat aacctccaga aggattttaa gtctgctaag 420
gatactatca agaagcaaat ttcagagtac atcaaggatt ctgaaaagtt taagaatttg 480
ttcaaccaga atctcattga tgccaagaag ggccaagagt cagatctcat cctttggttg 540
aagcaatcta aggataatgg tatcgaactt ttcaaggcta actcagatat cacagatatt 600
gatgaggcct tggaaatcat taagtctttt aagggctgga ctacatattt taagggtttc 660
catgagaaca gaaagaatgt ctactcttca aacgatattc ctacttctat catctacagg 720
atcgttgatg ataatttgcc aaagttcctc gagaacaagg ctaagtacga atctctcaag 780
gataaggctc cagaggccat taattacgaa cagatcaaga aggatcttgc cgaggaattg 840
acattcgata ttgattacaa gacctcagag gttaaccaga gagtgttttc tttggatgag 900
gtgttcgaaa tcgctaactt caacaattat ctcaaccaat caggcattac caagttcaat 960
actatcattg gtggcaagtt tgtcaacgga gagaatacaa agaggaaggg cattaacgaa 1020
tacatcaatt tgtactctca gcaaattaac gataagacac tcaagaagta caagatgtca 1080
gtgcttttca agcagatctt gtctgatacc gagtctaagt catttgtcat tgataagctc 1140
gaagatgatt cagatgttgt gaccactatg cagtcttttt acgagcaaat cgctgccttc 1200
aagacagttg aggaaaagtc aattaaggaa accctttctt tgctcttcga tgatttgaag 1260
gctcaaaagc tcgatctttc aaagatctat ttcaagaacg ataagtcact taccgatttg 1320
tctcagcaag tgtttgatga ttactctgtc attggtactg ctgttcttga gtatattaca 1380
cagcaaatcg ccccgaagaa ccttgataat ccttcaaaga aggagcagga attgatcgct 1440
aagaagactg agaaggccaa gtacttgtct ctcgaaacta tcaagctcgc tttggaggag 1500
ttcaacaagc atagagatat tgataagcaa tgcaggtttg aggaaatcct cgccaacttc 1560
gctgccatcc cgatgatttt tgatgagatc gctcagaaca aggataatct tgcccaaatc 1620
tcaattaagt atcagaacca aggaaagaag gatcttttgc aggcttctgc cgaagatgat 1680
gttaaggcta ttaaggatct ccttgatcag accaacaatt tgctccataa gctcaagatc 1740
ttccacattt ctcaatcaga ggataaggct aacatccttg ataaggatga acacttctac 1800
ttggttttcg aggaatgtta tttcgagctt gccaacattg tgccgttgta caacaagatc 1860
agaaactaca tcactcagaa gccttactca gatgagaagt ttaagctcaa cttcgaaaat 1920
tctacccttg ctaacggttg ggataagaat aaggagccag ataacactgc catcctcttc 1980
attaaggatg ataagtacta tcttggagtg atgaataaga agaacaataa gatcttcgat 2040
gataaggcta ttaaggagaa caagggcgaa ggttacaaga agatcgttta caagctcttg 2100
cctggagcta ataagatgtt gccaaaggtg ttcttttcag ccaagtctat taagttctac 2160
aacccatctg aggatatcct cagaattagg aatcattcaa cacacaccaa gaacggatct 2220
ccgcagaagg gctacgagaa gtttgagttc aacatcgagg attgcagaaa gtttattgat 2280
ttctataagc aatctatctc aaagcatcct gagtggaagg attttggctt cagattttca 2340
gatactcaga ggtacaactc tattgatgag ttctataggg aggttgaaaa tcaaggttac 2400
aagctcacat tcgagaacat ctctgaatca tacattgatt ctgtcgttaa ccagggaaag 2460
ctctaccttt tccaaatcta caacaaggat ttttcagctt actctaaggg cagaccaaat 2520
ctccacactc tttattggaa ggccctcttc gatgagagga atcttcagga tgtggtctac 2580
aagttgaacg gagaggctga actcttttat agaaagcaat caattccaaa gaagatcaca 2640
catccggcca aggaggctat cgccaacaag aataaggata atcctaagaa ggagtctgtg 2700
ttcgaatacg atcttattaa ggataagagg tttacagagg ataagttctt tttccactgt 2760
ccaatcacca ttaacttcaa gtcttcaggc gctaacaagt ttaatgatga gatcaatctc 2820
cttttgaagg aaaaggccaa cgatgttcat atcctctcta ttgatagagg agagaggcac 2880
ctcgcttact atacacttgt ggatggaaag ggcaatatca ttaagcagga tactttcaac 2940
atcattggca atgataggat gaagacaaac taccatgata agctcgctgc cattgaaaag 3000
gatagagatt cagccaggaa ggattggaag aagatcaaca atattaagga gatgaaggaa 3060
ggctacctct ctcaagttgt gcacgagatt gctaagctcg ttatcgaata taatgccatt 3120
gtcgttttcg aggatctcaa tttcggtttt aagagaggaa ggtttaaggt cgaaaagcag 3180
gtttaccaaa agctcgagaa gatgcttatc gaaaagttga actatctcgt ctttaaggat 3240
aacgagttcg ataagaccgg tggagttttg agggcttacc agctcacagc cccgtttgaa 3300
accttcaaga agatgggcaa gcaaactgga atcatctact atgtcccggc tggattcacc 3360
tctaagatct gccctgtgac tggctttgtc aatcagctct accctaagta tgagtctgtt 3420
tcaaagtctc aagaattttt ctcaaagttc gataagatct gttacaatct tgataagggt 3480
tacttcgagt tttctttcga ttacaagaac ttcggagata aggctgccaa gggaaagtgg 3540
actattgctt cattcggatc tagacttatc aacttcagaa actctgataa gaaccataac 3600
tgggatacca gagaggtcta tccaactaag gagttggaaa agctccttaa ggattactct 3660
atcgagtatg gtcacggaga atgcattaag gctgccatct gtggagagtc agataagaag 3720
tttttcgcta agttgacttc tgtgctcaat acaatccttc agatgagaaa ctcaaagact 3780
ggtacagaac ttgattactt gatttctccg gtggctgatg tcaacggaaa cttcttcgat 3840
tctaggcagg cccctaagaa tatgccacaa gatgctgatg ccaacggcgc ctaccacatc 3900
ggactcaagg gccttatgtt gctcggtagg attaagaaca atcaagaggg aaagaagttg 3960
aatctcgtga ttaagaacga ggaatatttt gagttcgtcc agaacagaaa caataagagg 4020
cctgctgcca caaagaaggc tggtcaagct aagaagaaga agtga 4065
<210> 23
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaat ttctactgtt gtagatgagt gaaatctctt gtcttaagga 120
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 180
gattcccggc tggtgcaaat ttctactgtt gtagatccat gccaaacaag ccaggagaat 240
tttttttttt 250
<210> 24
<211> 115
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aatttctact gttgtagatg agtgaaatct cttgtcttaa ggaaatttct actgttgtag 60
atccatgcca aacaagccag gagaataatt tctactgttg tagatttttt ttttt 115
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atccaggcga cgctgagcca 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tggcccaccg gggtataaaa 20
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ttgggcggcg atcgatcgat gcgc 24
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
atctgcagtg cggttgtgaa tgcg 24
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gaacccggtc gcctcaagga 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gaatgcgcag actcgtcagg 20
<210> 31
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
agacgaggga gatggtggcg ataa 24
<210> 32
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ctgtaccaga tcctgcgggg gctc 24
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
agatgtcgta gagcaggtac 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tctacatcgc cacggagctc a 21
<210> 35
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gagtgaaatc tcttgtctta agga 24
<210> 36
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccatgccaaa caagccagga gaat 24
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acaagccagg agaattcagc 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cactgcatgg ataactcatc 20
<210> 39
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
taggtctccg acgctgagcc agttttagag ctagaa 36
<210> 40
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atggtctcac gtcgcctgga ttgcaccagc cgggaa 36
<210> 41
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
taggtctcca ccggggtata aaagttttag agctagaa 38
<210> 42
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgggtctcac ggtgggccat gcaccagccg gg 32
<210> 43
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
taggtctccg tcgcctcaag gagttttaga gctagaa 37
<210> 44
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cgggtctcac gaccgggttc tgcaccagcc ggg 33
<210> 45
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
taggtctccc agactcgtca gggttttaga gctagaa 37
<210> 46
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cgggtctcat ctgcgcattc tgcaccagcc ggg 33
<210> 47
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
taggtctcct agagcaggta cgttttagag ctagaa 36
<210> 48
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
atggtctcat ctacgacatc ttgcaccagc cgggaa 36
<210> 49
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
taggtctccc cacggagctc agttttagag ctagaa 36
<210> 50
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
atggtctcag tggcgatgta gatgcaccag ccgggaa 37
<210> 51
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
taggtctccc aggagaattc agcgttttag agctagaa 38
<210> 52
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
cgggtctcac ctggcttgtt gcaccagccg gg 32
<210> 53
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
taggtctcca tggataactc atcgttttag agctagaa 38
<210> 54
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
cgggtctcac catgcagtgt gcaccagccg gg 32
<210> 55
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
cgggtctcag gcaggatggg cagtctgggc aacaaagcac cagtgg 46
<210> 56
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
taggtctcca aacggatgag cgacagcaaa caaaaaaaaa agcaccgact cg 52
<210> 57
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
taggtctcca aacggatgag cgacagcaaa caaaaaaaaa atgcaccagc cggg 54
<210> 58
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
cgggtctcag gcaggatggg cagtctgggc a 31
<210> 59
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
taggtctcca aacggatgag cgacagcaaa c 31
<210> 60
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gaccatgatt acgccaagct tacaaattcg ggtcaaggcg g 41
<210> 61
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
cgagacctcg gtctcctgcc gtccgaaatc gaatcg 36
<210> 62
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ggagaccgag gtctcggttt gctgtttgat ccgttg 36
<210> 63
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
cgagacctcg gtctcctgcc atattccaac agaacataca 40
<210> 64
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
caaacttgtt gataactatc tgcaagaaat aatcaccaaa c 41
<210> 65
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ttgaagcttg cttgggcagc 20
<210> 66
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
cctcgcgaag ttaatcaagc tcacactt 28
<210> 67
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ccaaagcttg gaagttatat tacgtctac 29
<210> 68
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
cctcgcgata acaatttact ctactata 28
<210> 69
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gccgcactcg agatattcaa ggtacgctgc ttctcct 37
<210> 70
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tacaagaaag ctgggttaga atctgcaaga aataatcacc aaac 44
<210> 71
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
agctaagaag aagaagtgag aattcgcggc cgcac 35
<210> 72
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ctccatcatg atccttataa tccatggtta agtatttcct tag 43
<210> 73
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
tgtccccgac tatgcctaag aattcgcggc cgcactc 37
<210> 74
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tgctcatggt ggcggtaccc atggttaagt atttccttag ag 42
<210> 75
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
agtaccacct cggctatcca ca 22
<210> 76
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ggacctgcag gcatgcacgc gctaaaaacg gactagc 37
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
acttctagaa tctgcaagaa ataatcacca aac 33
<210> 78
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
tacgtgtgct gttactacct atctg 25
<210> 79
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
aatcctctcg cgtcctcaag 20
<210> 80
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ctcgtcgtcg aatcgaatcc tc 22
<210> 81
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
cccagcccac agagttggtg 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
gcacaccatg aatgccaacc 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
cagggatggc cttgaacctc 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
tttccatttg acgactggac 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tctggccaag ttagcatttc 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
tgatacgcgt cgatgagtgg 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
gtgatgaggc gcatctggtg 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
gcaaccaact aactctcccg 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
tgtgaacatc ccctcaggac 20
<210> 90
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
gttagggtcg gcacagcatc tcca 24
<210> 91
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
ctgcgcctaa aaatcgaggg tgggt 25
<210> 92
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
agggtagtga agagcaaacc g 21
<210> 93
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
tatgccagcc aatgagccaa 20
<210> 94
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
gccaccttcc ttcctcatcc g 21
<210> 95
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
gttgctcggc ttcaggtcgc 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ggtagaaatg ccatgcggga 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
attcagccga acctcaccac 20
Claims (11)
1.一种基于CRISPR系统CRISPR/Cas9的基因组编辑方法,包括以下步骤:
1)将1个或多个重复的tRNA-gRNA串联单元置于编码基因的内含子中获得inPTG内含子;
2)将获得的inPTG内含子与含Cas9核酸酶基因的外显子融合成一个inPTG-Cas9基因;
3)利用单个启动子来驱动inPTG-Cas9融合基因的表达,获得表达载体;
4)将含inPTG-Cas9融合基因表达元件的载体导入受体细胞进行转录表达,获得Cas9核酸酶和多个gRNA;
5)所述gRNA与Cas9核酸酶共同作用编辑受体细胞基因组序列。
2.根据权利要求1所述的基因组编辑方法,其特征在于,步骤3)中所述启动子为Pol II型启动子。
3.根据权利要求2所述的基因组编辑方法,其特征在于,所述Pol II型启动子为UBI10启动子、PR5启动子或PR1启动子。
4.根据权利要求1所述的基因组编辑方法,其特征在于,所述步骤4)中载体为pRGEB33载体,所述pRGEB33载体的内含子的序列如SEQ ID NO.7所示。
5.根据权利要求1所述的基因组编辑方法,其特征在于,所述步骤4)中载体为pRGEB34载体,所述pRGEB34载体的内含子的序列如SEQ ID NO.8所示。
6.根据权利要求4或5所述的基因组编辑方法,其特征在于,所述内含子中插入BsaI酶切位点用于PTG片段的克隆。
7.一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法,包括以下步骤:
1)将1个或多个重复的tRNA-crRNA串联单元置于编码基因的内含子中获得intron(PTC)内含子;
2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形成一个intron(PTC)-Cpf1融合基因;
3)在所述intron(PTC)-Cpf1融合基因序列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;
4)将所述启动子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得Cpf1核酸酶和多个crRNA;
5)所述crRNA与Cpf1核酸酶共同作用编辑受体细胞基因组序列。
8.根据权利要求7所述的基因组编辑方法,其特征在于,所述转录表达外显子的Cpf1核酸酶的过程中,利用剪接复合体剪切所述intron(PTC)-Cpf1融合基因中的包含tRNA-crRNA的内含子,然后利用tRNA加工系统切割其中的tRNA元件,释放多个crRNA。
9.根据权利要求7所述的基因组编辑方法,其特征在于,步骤1)中所述多个tRNA-crRNA串联单元替换为多个crRNA串联单元。
10.根据权利要求9所述的基因组编辑方法,其特征在于,所述替换后利用表达的Cpf1蛋白切割crRNA串联单元,释放多个crRNA。
11.权利要求1~5、7~10任意一项所述的基因组编辑方法,其特征在于,所述编辑包括为基因敲除、靶向基因激活/抑制、单碱基替换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711194336.6A CN107937432B (zh) | 2017-11-24 | 2017-11-24 | 一种基于crispr系统的基因组编辑方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711194336.6A CN107937432B (zh) | 2017-11-24 | 2017-11-24 | 一种基于crispr系统的基因组编辑方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107937432A CN107937432A (zh) | 2018-04-20 |
CN107937432B true CN107937432B (zh) | 2020-05-01 |
Family
ID=61948795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711194336.6A Active CN107937432B (zh) | 2017-11-24 | 2017-11-24 | 一种基于crispr系统的基因组编辑方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107937432B (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP3177718B1 (en) | 2014-07-30 | 2022-03-16 | President and Fellows of Harvard College | Cas9 proteins including ligand-dependent inteins |
EP3365356B1 (en) | 2015-10-23 | 2023-06-28 | President and Fellows of Harvard College | Nucleobase editors and uses thereof |
CN110214183A (zh) | 2016-08-03 | 2019-09-06 | 哈佛大学的校长及成员们 | 腺苷核碱基编辑器及其用途 |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
CA3039928A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
CN110914310A (zh) | 2017-03-10 | 2020-03-24 | 哈佛大学的校长及成员们 | 胞嘧啶至鸟嘌呤碱基编辑器 |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
EP3676376A2 (en) | 2017-08-30 | 2020-07-08 | President and Fellows of Harvard College | High efficiency base editors comprising gam |
WO2019079347A1 (en) | 2017-10-16 | 2019-04-25 | The Broad Institute, Inc. | USES OF BASIC EDITORS ADENOSINE |
CN109652378B (zh) * | 2018-12-29 | 2020-04-24 | 广州百暨基因科技有限公司 | 一种功能增强的通用型car-t细胞及其制备方法和用途 |
WO2020191248A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Method and compositions for editing nucleotide sequences |
CN112442512A (zh) * | 2019-08-30 | 2021-03-05 | 华中农业大学 | 基于tRNA-gRNA-cRNA进行日本青鳉胚胎和细胞的基因编辑系统 |
CN111518839B (zh) * | 2020-05-07 | 2022-12-09 | 上海市第一妇婴保健院 | 一种等位特异性位点编辑方法 |
WO2021226558A1 (en) | 2020-05-08 | 2021-11-11 | The Broad Institute, Inc. | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
CN111979258B (zh) * | 2020-08-04 | 2022-04-19 | 华中农业大学 | 一种高通量的基因编辑方法 |
CN112359057B (zh) * | 2020-10-23 | 2022-11-22 | 浙江大学 | CRISPR/Cas12a基因编辑系统在84K杨树基因编辑中的应用 |
CN114672513B (zh) * | 2022-04-12 | 2024-04-02 | 北京大学现代农业研究院 | 一种基因编辑系统及其应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015138855A1 (en) * | 2014-03-14 | 2015-09-17 | The Regents Of The University Of California | Vectors and methods for fungal genome engineering by crispr-cas9 |
CN105255937A (zh) * | 2015-08-14 | 2016-01-20 | 西北农林科技大学 | 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用 |
CN106318947A (zh) * | 2016-10-17 | 2017-01-11 | 北京大北农科技集团股份有限公司 | 基因组编辑系统及其用途 |
CN107012164A (zh) * | 2017-01-11 | 2017-08-04 | 电子科技大学 | CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用 |
CN107027313A (zh) * | 2014-10-17 | 2017-08-08 | 宾州研究基金会 | 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物 |
-
2017
- 2017-11-24 CN CN201711194336.6A patent/CN107937432B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015138855A1 (en) * | 2014-03-14 | 2015-09-17 | The Regents Of The University Of California | Vectors and methods for fungal genome engineering by crispr-cas9 |
CN107027313A (zh) * | 2014-10-17 | 2017-08-08 | 宾州研究基金会 | 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物 |
CN105255937A (zh) * | 2015-08-14 | 2016-01-20 | 西北农林科技大学 | 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用 |
CN106318947A (zh) * | 2016-10-17 | 2017-01-11 | 北京大北农科技集团股份有限公司 | 基因组编辑系统及其用途 |
CN107012164A (zh) * | 2017-01-11 | 2017-08-04 | 电子科技大学 | CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用 |
Non-Patent Citations (6)
Title |
---|
Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system;Kabin Xie等;《PNAS》;20150317;第112卷(第11期);第3570-3575页 * |
Discovery of rice essential genes by characterizing a CRISPR-edited mutation of closely related rice MAP kinase genes;Bastian Minkenberg等;《The Plant Journal》;20161016;第89卷;第636-648页 * |
High-efficiency CRISPR/Cas9 multiplex gene editing using the glycine tRNA-processing system-based strategy in maize;Weiwei Qi等;《BMC Biotechnology》;20161231;第16卷(第58期);第1-8页 * |
Optimizing multiplex CRISPR/Cas9-based genome editing for wheat;Wei Wang等;《bioRxiv》;20160502;第1-27页 * |
Recent Advances in Genome Editing Using CRISPR/Cas9;Yuduan Ding等;《Frontiers in Plant Science》;20160524;第7卷;第1-12页 * |
植物CRISPR基因组编辑技术的新进展;李红,谢卡斌;《生物工程学报》;20171025;第33卷(第10期);第1700-1711页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107937432A (zh) | 2018-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107937432B (zh) | 一种基于crispr系统的基因组编辑方法及其应用 | |
US20230049124A1 (en) | Improved methods for modification of target nucleic acids | |
JP6960951B2 (ja) | 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング | |
US11702667B2 (en) | Methods and compositions for multiplex RNA guided genome editing and other RNA technologies | |
CN108513579B (zh) | 新颖的rna导向性核酸酶及其用途 | |
KR102127418B1 (ko) | 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법 | |
JP2021166513A (ja) | 配列操作のためのCRISPR−Cas成分系、方法および組成物 | |
CN115216459A (zh) | 新型crispr相关转座酶及其用途 | |
WO2015052231A2 (en) | Multiplex editing system | |
EP3676378A1 (en) | Methods and compositions comprising crispr-cpf1 and paired guide crispr rnas for programmable genomic deletions | |
US20210348179A1 (en) | Compositions and methods for regulating gene expression for targeted mutagenesis | |
CN111373041A (zh) | 用于基因组编辑和调节转录的crispr/cas系统和方法 | |
Zhong et al. | Intron-based single transcript unit CRISPR systems for plant genome editing | |
CN113811612A (zh) | 用于通过基因沉默的有害生物防治的数个植物细胞中的dsRNA的产生 | |
CN111902541A (zh) | 增加细胞中感兴趣的核酸分子表达水平的方法 | |
CN114045303B (zh) | 一套用于水稻的人工基因编辑系统 | |
Koltun et al. | CRISPR-transient expression in soybean for simplified gRNA screening in planta | |
JP7452884B2 (ja) | Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット | |
CN114891791B (zh) | 特异性靶向犬Rosa26基因的sgRNA及其应用 | |
US20240271164A1 (en) | Synthetic genomic safe harbors and methods thereof | |
Koltun et al. | Expressão transiente de CRISPR em soja para triagem simplificada de gRNA na planta | |
He et al. | * National Key Laboratory of Crop Genetic Improvement and National Center of Plant Gene Research (Wuhan), Huazhong Agricultural University, Wuhan, China | |
Bi | Gene editing of rice miRNA and argonaute genes | |
CN112997966A (zh) | 一种基于CRISPR/Cas9技术敲入miRNA-125a的小鼠模型及构建方法 | |
Kim et al. | A Co-CRISPR Strategy for Efficient Genome Editing in C. elegans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |