KR20240107373A - C2c9 뉴클레아제 기반의 신규 게놈 편집 시스템 및 이의 응용 - Google Patents
C2c9 뉴클레아제 기반의 신규 게놈 편집 시스템 및 이의 응용 Download PDFInfo
- Publication number
- KR20240107373A KR20240107373A KR1020247021149A KR20247021149A KR20240107373A KR 20240107373 A KR20240107373 A KR 20240107373A KR 1020247021149 A KR1020247021149 A KR 1020247021149A KR 20247021149 A KR20247021149 A KR 20247021149A KR 20240107373 A KR20240107373 A KR 20240107373A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- nuclease
- gene
- dna
- nucleic acid
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 312
- 238000010362 genome editing Methods 0.000 title claims abstract description 92
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 212
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 130
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 96
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 77
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 67
- 230000001580 bacterial effect Effects 0.000 claims abstract description 40
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 23
- 238000005520 cutting process Methods 0.000 claims abstract description 21
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 10
- 210000004027 cell Anatomy 0.000 claims description 169
- 230000000694 effects Effects 0.000 claims description 105
- 102000040430 polynucleotide Human genes 0.000 claims description 101
- 108091033319 polynucleotide Proteins 0.000 claims description 101
- 239000002157 polynucleotide Substances 0.000 claims description 101
- 230000008685 targeting Effects 0.000 claims description 61
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 53
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 52
- 229920001184 polypeptide Polymers 0.000 claims description 51
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 47
- 238000012986 modification Methods 0.000 claims description 43
- 230000014509 gene expression Effects 0.000 claims description 40
- 230000004048 modification Effects 0.000 claims description 39
- 238000000338 in vitro Methods 0.000 claims description 38
- 239000012634 fragment Substances 0.000 claims description 30
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 25
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 21
- 230000027455 binding Effects 0.000 claims description 20
- 150000001413 amino acids Chemical class 0.000 claims description 16
- 238000010363 gene targeting Methods 0.000 claims description 13
- 230000035772 mutation Effects 0.000 claims description 13
- 238000001727 in vivo Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 238000003780 insertion Methods 0.000 claims description 12
- 230000001404 mediated effect Effects 0.000 claims description 12
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 7
- 210000004102 animal cell Anatomy 0.000 claims description 7
- 230000002538 fungal effect Effects 0.000 claims description 6
- 241000187362 Actinomadura Species 0.000 claims description 5
- 230000001413 cellular effect Effects 0.000 claims description 5
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 5
- 230000037426 transcriptional repression Effects 0.000 claims description 5
- 238000012224 gene deletion Methods 0.000 claims description 4
- 230000005714 functional activity Effects 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- 230000003612 virological effect Effects 0.000 claims description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 8
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 19
- 229960000074 biopharmaceutical Drugs 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 171
- 102000053602 DNA Human genes 0.000 description 169
- 239000013612 plasmid Substances 0.000 description 97
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 66
- 229920002401 polyacrylamide Polymers 0.000 description 66
- 238000003776 cleavage reaction Methods 0.000 description 57
- 230000007017 scission Effects 0.000 description 57
- 238000006243 chemical reaction Methods 0.000 description 55
- 125000003729 nucleotide group Chemical group 0.000 description 54
- 239000002773 nucleotide Substances 0.000 description 52
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 36
- 239000000758 substrate Substances 0.000 description 33
- 230000000295 complement effect Effects 0.000 description 31
- 239000000047 product Substances 0.000 description 30
- 239000013604 expression vector Substances 0.000 description 28
- 229920002477 rna polymer Polymers 0.000 description 28
- 108091033409 CRISPR Proteins 0.000 description 25
- 102000004169 proteins and genes Human genes 0.000 description 24
- 235000018102 proteins Nutrition 0.000 description 23
- 239000000243 solution Substances 0.000 description 22
- 239000013598 vector Substances 0.000 description 21
- 239000002609 medium Substances 0.000 description 20
- 239000000203 mixture Substances 0.000 description 20
- 238000010354 CRISPR gene editing Methods 0.000 description 19
- 238000003259 recombinant expression Methods 0.000 description 19
- 239000011780 sodium chloride Substances 0.000 description 18
- 238000013518 transcription Methods 0.000 description 18
- 230000035897 transcription Effects 0.000 description 18
- 241000894006 Bacteria Species 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 16
- 102100031780 Endonuclease Human genes 0.000 description 15
- 241000588747 Klebsiella pneumoniae Species 0.000 description 15
- 239000000499 gel Substances 0.000 description 15
- 239000007787 solid Substances 0.000 description 15
- 241000702421 Dependoparvovirus Species 0.000 description 14
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 14
- 238000010276 construction Methods 0.000 description 14
- 108020004705 Codon Proteins 0.000 description 13
- 230000002255 enzymatic effect Effects 0.000 description 13
- 210000005260 human cell Anatomy 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 13
- XZNUGFQTQHRASN-XQENGBIVSA-N apramycin Chemical compound O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O XZNUGFQTQHRASN-XQENGBIVSA-N 0.000 description 12
- 229950006334 apramycin Drugs 0.000 description 12
- 239000007795 chemical reaction product Substances 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- -1 rRNA Proteins 0.000 description 12
- 241000700605 Viruses Species 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 241000196324 Embryophyta Species 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 230000005782 double-strand break Effects 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 210000001236 prokaryotic cell Anatomy 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- 125000006850 spacer group Chemical group 0.000 description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 9
- 102000012410 DNA Ligases Human genes 0.000 description 9
- 108010061982 DNA Ligases Proteins 0.000 description 9
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 9
- 108010033040 Histones Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 239000013613 expression plasmid Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 230000006780 non-homologous end joining Effects 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 8
- 241000233866 Fungi Species 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000035484 reaction time Effects 0.000 description 8
- 230000010474 transient expression Effects 0.000 description 8
- 108700004991 Cas12a Proteins 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 230000007018 DNA scission Effects 0.000 description 7
- 235000011187 glycerol Nutrition 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 241000894007 species Species 0.000 description 7
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 6
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 241000203069 Archaea Species 0.000 description 5
- 241000606125 Bacteroides Species 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 5
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 5
- 108091029865 Exogenous DNA Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 238000002715 modification method Methods 0.000 description 5
- 239000002105 nanoparticle Substances 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 241000228212 Aspergillus Species 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 4
- 241000186226 Corynebacterium glutamicum Species 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 102100030011 Endoribonuclease Human genes 0.000 description 4
- 108010093099 Endoribonucleases Proteins 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 102000006947 Histones Human genes 0.000 description 4
- 101001045440 Homo sapiens Beta-hexosaminidase subunit alpha Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 241000191938 Micrococcus luteus Species 0.000 description 4
- 241000203719 Rothia dentocariosa Species 0.000 description 4
- 206010039491 Sarcoma Diseases 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 4
- 229960003669 carbenicillin Drugs 0.000 description 4
- 210000004671 cell-free system Anatomy 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 210000001082 somatic cell Anatomy 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 3
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 3
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 3
- 230000005778 DNA damage Effects 0.000 description 3
- 231100000277 DNA damage Toxicity 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 3
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 3
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 3
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 3
- 230000004570 RNA-binding Effects 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000011065 in-situ storage Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000015788 innate immune response Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 108091008023 transcriptional regulators Proteins 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000034512 ubiquitination Effects 0.000 description 3
- 238000010798 ubiquitination Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000714230 Avian leukemia virus Species 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 2
- SRBFZHDQGSBBOR-SOOFDHNKSA-N D-ribopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@@H]1O SRBFZHDQGSBBOR-SOOFDHNKSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000991587 Enterovirus C Species 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 2
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 230000010718 Oxidation Activity Effects 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 206010055047 Splenic necrosis Diseases 0.000 description 2
- 241001147691 Staphylococcus saprophyticus Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 101150030763 Vegfa gene Proteins 0.000 description 2
- 241000192351 [Candida] oleophila Species 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 230000029936 alkylation Effects 0.000 description 2
- 238000005804 alkylation reaction Methods 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 230000027832 depurination Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000002308 embryonic cell Anatomy 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000006195 histone acetylation Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 244000000010 microbial pathogen Species 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000003285 pharmacodynamic effect Effects 0.000 description 2
- 238000002205 phenol-chloroform extraction Methods 0.000 description 2
- 239000002504 physiological saline solution Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 239000013635 pyrimidine dimer Substances 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 229960002920 sorbitol Drugs 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000228197 Aspergillus flavus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000203233 Aspergillus versicolor Species 0.000 description 1
- 241000606124 Bacteroides fragilis Species 0.000 description 1
- 241001135228 Bacteroides ovatus Species 0.000 description 1
- 241000606123 Bacteroides thetaiotaomicron Species 0.000 description 1
- 241000186012 Bifidobacterium breve Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000222173 Candida parapsilosis Species 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 230000007035 DNA breakage Effects 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101150007297 Dnmt1 gene Proteins 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 101150113358 FANCE gene Proteins 0.000 description 1
- 241000272186 Falco columbarius Species 0.000 description 1
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 1
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 241000605986 Fusobacterium nucleatum Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 241000218588 Lactobacillus rhamnosus Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282320 Panthera leo Species 0.000 description 1
- 241000160321 Parabacteroides Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235645 Pichia kudriavzevii Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 101150080074 TP53 gene Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000222126 [Candida] glabrata Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 208000032343 candida glabrata infection Diseases 0.000 description 1
- 229940055022 candida parapsilosis Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000002616 endonucleolytic effect Effects 0.000 description 1
- 229940032049 enterococcus faecalis Drugs 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 239000012216 imaging agent Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 239000000644 isotonic solution Substances 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229940021222 peritoneal dialysis isotonic solution Drugs 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000001044 red dye Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 생물의약 분야에 속하고, RNA-가이드된 엔도뉴클레아제로서의 C2C9 뉴클레아제의 용도 및 극소형 게놈 편집 시스템을 개시하며, 상기 게놈 편집 시스템은 C2C9 뉴클레아제 및/또는 상기 C2C9 뉴클레아제를 코딩하는 핵산, 및 가이드 RNA 또는 상기 가이드 RNA를 코딩하는 핵산을 포함한다. 본 발명에 따른 극소형 게놈 편집 시스템은 원핵 박테리아 및 진핵 세포 게놈의 적어도 하나의 표적 서열을 유전자 편집할 수 있다. 본 발명은 또한 상기 게놈 편집 시스템의 응용 및 편집 방법을 개시한다. 본 발명의 유전자 편집 시스템 또는 방법을 이용하여 표적 유전자를 정확하게 녹아웃 또는 절단하여 절단 효율이 높고, 표적 유전자를 정확하게 편집할 수 있다.
Description
본 발명은 생물의약 분야에 속하고, 극소형 C2C9 뉴클레아제 기반의 신규 게놈 편집 시스템, 및 원핵 박테리아 및 진핵 세포에서 상기 시스템의 게놈 편집 방법 및 응용에 관한 것이다.
CRISPR/Cas(클러스터링된 규칙적인 간격을 둔 짧은 회문 반복/CRISPR 관련 단백질(Clustered regularly interspaced short palindromic repeats/CRISPR-associated protein))은 최근 몇 년 동안 개발된 신규 유전자 편집 시스템이다. 상기 시스템은 주로 Cas 엔도뉴클레아제에 대응되는 가이드 RNA로 구성된다. Cas 엔도뉴클레아제는 가이드 RNA에 특이적으로 결합하고, 상보성 염기쌍을 이용하여 게놈 특정 부위를 표적으로 하여 인식하고 절단하여 게놈 DNA의 이중 사슬 파손을 일으킬 수 있다. 그런 다음 상동성 재조합 및 비상동성 재조합 말단 연결 복구 메커니즘과 같은 유기체의 내인성 또는 외부 DNA 복구 메커니즘을 이용하여 파손된 게놈 DNA를 복구함으로써 복구 과정에서 게놈 특정 부위의 편집을 구현한다.
CRISPR/Cas 시스템를 이용하여 세포 또는 종을 유전학 조작하는 것은 생명과학, 의학, 농학 등 분야의 기초 연구, 생명공학 개발, 및 질병 치료 수단 연구 및 개발에 광범위하게 응용될 수 있다. 예를 들어, 유전병이나 암과 같은 질병에 대한 돌연변이 유전자를 교정하고; 농작물을 유전 공학 변형하여 성능을 향상시키며; 미생물 게놈을 정확하게 변형하여 고부가가치 화합물 생산을 촉진하고; 감염 치료를 위해 병원성 미생물 게놈을 절단하여 병원성 미생물을 사멸시키는 등이다. CRISPR/Cas 시스템의 용이성과 효율성으로 인해 의학, 생물, 농학 등 분야에서 광범위하게 응용되어 왔다.
현재 널리 사용되는 CRISPR/Cas 게놈 편집 시스템은 주로 CRISPR/Cas9 및 CRISPR/Cas12a 두 가지 유형을 포함한다. 이러한 두 가지 유형의 게놈 편집 시스템에서 CRISPR 이펙터 단백질 뉴클레아제 Cas9 및 Cas12a는 모두 1000개 이상의 아미노산을 포함하는 대형 단백질이므로 CRISPR/Cas9 또는 CRISPR/Cas12a를 세포에 전달하는 과정에서 큰 문제가 발생한다. 예를 들어, 생체 유전자 치료 과정에서, CRISPR/Cas9 또는 CRISPR/Cas12a 시스템은 종종 사용을 위해 렌티바이러스 벡터에 패키징되어야 한다. 그러나 렌티바이러스 벡터의 패키징 용량은 제한되어 있어 CRISPR/Cas9 및 CRISPR/Cas12a 시스템의 거대 분자 크기로 인해 렌티바이러스 벡터의 패키징 효율성을 크게 제한하고 패키징의 어려움이 증가하며 유전자 치료와 같은 분야에서 이러한 시스템의 광범위한 응용을 크게 제한한다. 또한, CRISPR/Cas 시스템에서 인식하는 프로토스페이서-인접 모티브(PAM, PAM 서열 또는 PAM 부위)의 제한성으로 인해 선택할 수 있는 게놈 부위가 제한되어 의학 및 생물학과 같은 분야에서의 심층적 응용에 영향을 미친다. 따라서, 효율적이고 작은 분자량의 신규 게놈 편집 시스템을 발견하고 개발하는 것이 특히 시급하다.
본 발명은 극소형 게놈 편집 시스템(CRISPR/C2C9 시스템 포함) 및 방법을 제공한다. 본 발명의 게놈 편집 시스템을 이용하여 원핵 박테리아 및 진핵 세포의 표적 부위를 정확하게 절단함으로써 유전자의 정확한 녹아웃 또는 편집을 구현할 수 있다. 본 발명은 또한 새로운 RNA-프로그램 가능한 엔도뉴클레아제를 제공한다. 본 발명은 또한 가이드 RNA(gRNA) 및/또는 표적 서열을 포함하는 다른 구성요소, 및 다양한 응용에서 이를 생성하고 사용하는 방법에 관한 것이다. 이러한 응용의 예는 전사를 조절하는 방법, 및 새로운 뉴클레아제 및 핵산 및/또는 폴리펩티드와 같은 다른 구성요소를 사용하여 유전자(예: DNA 또는 RNA)를 표적화, 편집 및/또는 조작하는 방법을 포함한다. 본 발명은 또한 상기 편집 시스템 요소를 포함하는 재조합 세포 및 키트 등에 관한 것이다.
본 발명의 일 양태는 게놈의 적어도 하나의 표적 서열의 유전자 편집을 위한 게놈 편집 시스템을 제공하고, 상기 게놈 편집 시스템은,
(a) C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산; 및
(b) 가이드 RNA(gRNA) 또는 상기 gRNA를 코딩하는 핵산을 포함한다.
상기 C2C9 뉴클레아제는 일치하는 가이드 RNA와 복합체를 형성한다.
바람직한 일 실시형태에서, 상기 게놈 편집 시스템은 CRISPR-C2C9 게놈 편집 시스템이다.
바람직한 일 실시형태에서, 상기 CRISPR-C2C9 게놈 편집 시스템은,
(1) C2C9 뉴클레아제의 발현 작제물;
(2) 완전 가이드 RNA의 발현 작제물을 포함하고;
상기 완전 가이드 RNA는 가이드 RNA 골격, 및 상기 가이드 RNA 골격의 3' 말단에 추가된 표적화 서열에 대응되는 RNA 서열을 포함하며; 상기 표적화 서열은 PAM 서열 이후 길이가 12~40bp인 핵산 단편, 바람직하게는 PAM 서열 이후 길이가 20bp인 핵산 단편이다. 본 발명에 따른 C2C9 뉴클레아제는 본 분야의 일반적인 C2C9 뉴클레아제일 수 있다. 바람직하게는, 상기 C2C9 뉴클레아제의 크기는 바람직하게는 800개의 아미노산을 초과하지 않는다. 더 바람직하게는, 상기 C2C9 뉴클레아제는 서열번호 3-117의 아미노산 서열 중 어느 하나에서 유래되거나 서열번호 3-117의 아미노산 서열 중 어느 하나와 적어도 80% 서열 상동성을 갖는다. 일부 실시형태에서, 상기 C2C9 뉴클레아제는 악티노마두라 크라니엘라에(Actinomadura craniellae) C2C9(AcC2C9), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) C2C9(CgC2C9), 로티아 덴토카리오사(Rothia dentocariosa) C2C9(RdC2C9) 및 마이크로코쿠스 루테우스(Micrococcus luteus) C2C9(MilC2C9) 등으로 이루어진 군으로부터 선택된다.
본 발명의 바람직한 실시예에서, 상기 C2C9 뉴클레아제는 서열목록의 서열번호 3으로 표시되는 AcC2C9 뉴클레아제이다.
일부 실시형태에서, 상기 AcC2C9 뉴클레아제를 코딩하는 핵산은 데옥시리보핵산(DNA)이다. 일부 실시형태에서, AcC2C9 뉴클레아제의 DNA 코딩 서열은 서열목록의 서열번호 121로 표시되거나 서열번호 121과 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 서열 상동성을 갖는 변이체이다.
일부 실시형태에서, 상기 AcC2C9 뉴클레아제를 코딩하는 핵산은 리보핵산(RNA)이다. 일부 실시형태에서, 상기 C2C9 뉴클레아제를 코딩하는 RNA는 mRNA이다.
일부 실시형태에서, 상기 AcC2C9 뉴클레아제를 코딩하는 서열은 인간 코돈에 대해 최적화된 코딩 서열이고, 바람직하게는 서열목록의 서열번호 122로 표시되거나 서열번호 122와 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 서열 상동성을 갖는 변이체이다.
일부 실시형태에서, 상기 C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산을 리포솜 또는 지질 나노입자로 조제한다. 일부 실시형태에서, 상기 리포솜 또는 지질 나노입자도 상기 gRNA 또는 상기 gRNA를 코딩하는 핵산을 포함한다.
일부 실시형태에서, 상기 시스템은 gRNA와 사전 복합체화된 C2C9 뉴클레아제를 포함함으로써 표적 유전자(예: 표적 DNA) 서열에서의 PAM 서열을 인식하는 리보핵단백질(RNP) 복합체를 형성하는데; 즉 측면에 C2C9 뉴클레아제 및 가이드 RNA를 포함하는 DNA 서열을 정확하게 위치 지정시켜 형성된 복합체는 표적 유전자의 PAM 서열을 인식한다.
여기서, 상기 AcC2C9 뉴클레아제의 가이드 RNA 골격 서열은 서열목록의 서열번호 120으로 표시된다.
일부 실시형태에서, 상기 완전 가이드 RNA 발현 작제물은 RNA 골격을 가이드하는 발현 DNA 서열, 및 상기 발현 DNA 서열의 3' 말단에 추가된 표적화 서열에 대응되는 RNA 서열의 발현 DNA 서열에 포함되되; 상기 표적화 서열은 PAM 서열 이후 길이가 20bp인 단편이다.
여기서, 상기 CRISPR-C2C9 게놈 편집 시스템에 의해 바람직하게 인식되는 PAM 부위는 AAN 및/또는 GAN이다.
일부 실시형태에서, 본 발명에 따른 시스템은 또한 이종 폴리뉴클레오티드 서열을 포함하는 공여자 주형을 더 포함할 수 있되, 상기 이종 폴리뉴클레오티드 서열은 상기 표적 폴리뉴클레오티드 서열에 삽입될 수 있다. 일부 실시형태에서, 이종 폴리뉴클레오티드 공여자 주형은 gRNA에 물리적으로 연결된다.
다른 하나의 양태에서, 본 발명은 표적 유전자좌에서 이중 사슬 DNA를 표적화, 편집, 변형 또는 조작하는 방법을 제공하고, 상기 방법은, 상술한 바와 같은 시스템 중의 C2C9 뉴클레아제, 완전 가이드 RNA 및 상기 이중 사슬 DNA를 혼합하는 단계를 포함하되; 상기 완전 가이드 RNA는 5'- 및 상기 C2C9 뉴클레아제에 대응되는 가이드 RNA 골격+상기 이중 사슬 DNA의 표적화 서열에 대응되는 RNA 서열-3'이다. 일부 실시형태에서, 상기 방법은 이중 사슬 DNA를 절단하는 데 사용된다.
일부 실시형태에서, 본 발명은 세포에서 위와 같이 표적 유전자좌에서 이중 사슬 DNA를 표적화, 편집, 변형 또는 조작하는 방법을 제공한다. 일부 실시형태에서, 상기 방법은 폴리뉴클레오티드 공여자 주형을 세포에 도입하는 단계를 더 포함할 수 있되, 상기 공여자 주형은 공여자 단일 사슬 또는 이중 사슬 폴리뉴클레오티드 공여자 주형일 수 있다.
본 발명의 일부 실시형태에서, 상동성 지시 복구, 비상동성 말단 연결 또는 미세 상동성 매개 말단이 DSBs에 연결되어 DNA를 복구한다.
상술한 바와 같고, 상기 AcC2C9 뉴클레아제에 대응되는 바람직한 가이드 RNA 골격은 서열목록의 서열번호 120으로 표시된다. 이의 3' 말단에 상이한 표적 서열에 대한 표적화 RNA 서열을 추가하면 완전 가이드 RNA를 형성할 수 있다.
상기 C2C9 뉴클레아제의 바람직한 한정은 상술한 바와 같고, 바람직하게는 서열번호 3-117 등으로 이루어진 군에서 유래되고; 바람직하게는, 악티노마두라 크라니엘라에(Actinomadura craniellae) C2C9(AcC2C9), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) C2C9(CgC2C9), 로티아 덴토카리오사(Rothia dentocariosa) C2C9(RdC2C9) 및 마이크로코쿠스 루테우스(Micrococcus luteus) C2C9(MiC2C9)에서 선택되며; 보다 바람직하게는 서열목록의 서열번호 3 또는 이의 변이체로 표시된다. 상기 AcC2C9 뉴클레아제의 인간 코돈에 대해 최적화된 보다 바람직한 코딩 서열은 서열목록의 서열번호 122로 표시된다. 상기 변이체는 서열번호 3의 아미노산 잔기와 적어도 20%(예: 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%)의 서열 상동성을 갖고 RNA-가이드된 DNA 결합 활성 및/또는 이중 사슬 DNA 절단 활성을 유지한다.
본 발명에 따른 절단 방법은 본 분야의 일반적인 것일 수 있고, 예를 들어, 본 발명의 바람직한 실시예에서, 상기 절단 방법은 50~200mM NaCl 및/또는 5~20mM MgCl2의 조건 하에서 수행된다. 예를 들어 NaCl의 농도는 50~100mM, 100~150mM, 150~200mM이다. 예를 들어 MgCl2의 농도는 5~10mM, 10~15mM, 15~20mM이다. 바람직하게는, 150mM NaCl, 10mM MgCl2, 10mM Tris-HCl,pH=7.5, 1mM DTT의 완충용액에서 수행된다.
상기 절단 방법의 반응온도는 34~43℃이고, 예를 들어 34~37℃, 37~40℃, 40~43℃이며, 바람직하게는 37℃이고, 반응시간은 바람직하게는 30~60분이다.
다른 하나의 양태에서, 본 발명은 게놈 편집 방법을 제공하고, 상기 게놈 편집 방법은 상술한 바와 같은 게놈 편집 시스템을 표적 서열을 포함하는 원핵 박테리아 또는 진핵 세포에 도입하여 게놈 편집을 수행하는 단계를 포함한다.
본 발명에 따른 원핵 박테리아는 대장균, 클렙시엘라 뉴모니아와 같은 원핵 미생물을 포함하지만 이에 한정되지 않는다.
본 발명에 따른 진핵 세포는 포유동물 세포, 효모와 같은 진핵 생물세포를 포함하지만 이에 한정되지 않는다.
상술한 바와 같은 게놈 편집 방법 중의 "유전자 편집”은 예를 들어 유전자 절단, 유전자 삭제, 유전자 삽입, 점 돌연변이, 전사 억제, 전사 활성화, 염기 편집 및 가이드 편집과 같은 본 분야의 일반적인 것일 수 있으나 이에 한정되지 않는다.
다른 하나의 양태에서, 본 발명은 게놈 편집에서 C2C9 뉴클레아제의 응용을 제공한다.
상기 C2C9 뉴클레아제 및 상기 유전자 편집에 대한 추가 한정은 상술한 바와 같다.
상기 게놈 편집 시스템의 뉴클레아제의 크기는 800개의 아미노산을 초과하지 않는다.
다른 하나의 양태에서, 본 발명은 상기 어느 하나의 시스템 또는 방법에 의해 세포의 게놈을 편집하여 얻은 변형을 거친 세포를 제공한다. 일 실시형태에서, 상기 변형을 거친 세포는, (a) 상기에 따른 C2C9 뉴클레아제 또는 상기 C2C9 뉴클레아제를 코딩하는 핵산; 및 (b) 가이드 RNA(gRNA) 또는 상기 gRNA를 코딩하는 핵산을 포함하되, 상기 gRNA는 상기 C2C9 뉴클레아제 또는 이의 변이체를 표적 폴리뉴클레오티드 서열로 지시할 수 있다. 일부 실시형태에서, 상기 변형을 거친 세포는 이종 폴리뉴클레오티드 서열을 포함하는 공여자 주형을 더 포함하되, 상기 이종 폴리뉴클레오티드 서열은 상기 표적 폴리뉴클레오티드 서열에 삽입될 수 있다.
본 발명의 긍정적인 진보적 효과는 다음을 포함한다.
CRISPR/C2C9는 출원인이 발견한 아주 새로운 게놈 편집 시스템이고, C2C9 뉴클레아제 및 gRNA를 포함하며, 상기 시스템은 크기가 작고(C2C9 뉴클레아제는 일반적으로 800개의 아미노산을 초과하지 않거나 심지어 미만임), 복잡한 PAM(PAM 부위를 AAN로 인식하는 등 특점)이 필요하지 않다. 완전 가이드 RNA의 안내 및 위치 지정 기능을 통해 C2C9 뉴클레아제는 체내, 체외 세포 또는 무세포 환경에서 게놈 DNA를 정확하게 위치 지정하고, 표적화하며, 절단하여 게놈 DNA 이중 사슬 파손을 구현할 수 있다. 숙주 세포 자체 또는 외인성적으로 보충된 복구 메커니즘을 이용하여 상기 시스템은 생체 내 또는 체외 세포 또는 무세포 환경에서 효율적이고 정확하게 게놈 편집을 구현할 수 있다.
도 1은 AcC2C9의 PAM의 동정 과정 및 결과 차트이다. 결과는, AcC2C9는 5'-AAN 유형의 PAM 서열 및 소수의 5'-GAN 서열(여기서 N은 A, T, C 또는 G 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있는 것으로 나타났다. 여기서, 횡좌표-1, -2, -3, -4, -5, -6은 각각 NTS 사슬(비표적 사슬)에서 표적화-DNA 세그먼트 서열의 5' 말단의 상류에 위치한 1번째, 2번째, 3번째, 4번째, 5번째 및 6번째 DNA 염기를 나타내고; 위의 문자는 DNA 서열에 대한 AcC2C9 뉴클레아제의 선호도를 나타내며, 문자가 차지하는 비중이 클수록 상기 염기에 대한 AcC2C9의 선호도가 더 강함을 나타낸다.
도 2는 CgC2C9, RdC2C9 및 MiC2C9의 PAM 동정 결과 차트이다. 결과는, CgC2C9(A)는 5'-AAS 유형의 PAM 서열(여기서 S는 C 또는 G 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있고, RdC2C9(B) 및 MiC2C9(C)는 5'-AAH 유형의 PAM 서열(여기서 N은 A, T또는 C 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있는 것으로 나타났다.
도 3은 CRISPR-AcC2C9 시스템을 사용하여 클렙시엘라 뉴모니아 살아있는 세포에서 유전자 녹아웃을 수행한 PCR 결과 차트이다. 결과는, 선택된 dha 유전자가 CRISPR-AcC2C9 시스템에 의해 정확하게 녹아웃될 수 있는 것으로 나타났다.
도 4는 AcC2C9 뉴클레아제을 사용하여 기질 DNA를 절단한 결과 차트이다. 결과는, 기질 DNA가 AcC2C9에 의해 두 개의 DNA 단편으로 정확하게 절단된 것으로 나타났다.
도 5는 상이한 온도(A), 상이한 NaCl 농도(B), 상이한 MgCl2 농도(C) 및 상이한 2가 이온(D) 조건 하에서의 AcC2C9 뉴클레아제의 반응 활성 다이어그램이다. 결과는, 40℃, 100mM NaCl, 10mM MgCl2의 조건 하에서 AcC2C9의 활성이 가장 높은 것으로 나타났다.
도 6의 (A) 부분은 AcC2C9 완전 가이드 RNA의 서열 모식도이다. (b)부분은 tracrRNA 및 crRNA 조건 하에서 AcC2C9 뉴클레아제로 기질 DNA를 절단한 결과 차트이다.
도 7은 AcC2C9 뉴클레아제를 사용하여 4개의 58bp 형광 표지된 DNA 기질을 절단한 결과 차트이다. 결과는, 표적화 사슬에서 AcC2C9의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 21-22nt이고, 비표적 사슬에서의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 15-16nt인 것으로 나타났다.
도 8은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서의 유전자 편집 결과 차트이다. (A) 부분은 결손(Indel) 실험의 TBE-PAGE 겔 이미지이다. 선택된 5개의 상이한 유전자 부위에서 AcC2C9 뉴클레아제는 VEGFA, HEXA 및 DNMT1의 3개의 유전자의 효율적인 유전자 편집을 성공적으로 구현하였다. (B) 부분은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서 VEGFA 유전자 편집 후 고처리량 시퀀싱의 통계 결과 차트이다. 도면에 도시된 바와 같이, AcC2C9 뉴클레아제는 표적 서열에 삽입 또는 결실 돌연변이를 정확하게 도입할 수 있다.
도 9는 HEK293T 세포의 47개 부위에서 AcC2C9 일시적 발현 플라스미드의 유전자 편집 효율 그래프이다.
도 10은 인간 세포 HEK293T, HLEA, U-2 OS, Huh-7 및 HepG 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율 그래프이다.
도 2는 CgC2C9, RdC2C9 및 MiC2C9의 PAM 동정 결과 차트이다. 결과는, CgC2C9(A)는 5'-AAS 유형의 PAM 서열(여기서 S는 C 또는 G 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있고, RdC2C9(B) 및 MiC2C9(C)는 5'-AAH 유형의 PAM 서열(여기서 N은 A, T또는 C 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있는 것으로 나타났다.
도 3은 CRISPR-AcC2C9 시스템을 사용하여 클렙시엘라 뉴모니아 살아있는 세포에서 유전자 녹아웃을 수행한 PCR 결과 차트이다. 결과는, 선택된 dha 유전자가 CRISPR-AcC2C9 시스템에 의해 정확하게 녹아웃될 수 있는 것으로 나타났다.
도 4는 AcC2C9 뉴클레아제을 사용하여 기질 DNA를 절단한 결과 차트이다. 결과는, 기질 DNA가 AcC2C9에 의해 두 개의 DNA 단편으로 정확하게 절단된 것으로 나타났다.
도 5는 상이한 온도(A), 상이한 NaCl 농도(B), 상이한 MgCl2 농도(C) 및 상이한 2가 이온(D) 조건 하에서의 AcC2C9 뉴클레아제의 반응 활성 다이어그램이다. 결과는, 40℃, 100mM NaCl, 10mM MgCl2의 조건 하에서 AcC2C9의 활성이 가장 높은 것으로 나타났다.
도 6의 (A) 부분은 AcC2C9 완전 가이드 RNA의 서열 모식도이다. (b)부분은 tracrRNA 및 crRNA 조건 하에서 AcC2C9 뉴클레아제로 기질 DNA를 절단한 결과 차트이다.
도 7은 AcC2C9 뉴클레아제를 사용하여 4개의 58bp 형광 표지된 DNA 기질을 절단한 결과 차트이다. 결과는, 표적화 사슬에서 AcC2C9의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 21-22nt이고, 비표적 사슬에서의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 15-16nt인 것으로 나타났다.
도 8은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서의 유전자 편집 결과 차트이다. (A) 부분은 결손(Indel) 실험의 TBE-PAGE 겔 이미지이다. 선택된 5개의 상이한 유전자 부위에서 AcC2C9 뉴클레아제는 VEGFA, HEXA 및 DNMT1의 3개의 유전자의 효율적인 유전자 편집을 성공적으로 구현하였다. (B) 부분은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서 VEGFA 유전자 편집 후 고처리량 시퀀싱의 통계 결과 차트이다. 도면에 도시된 바와 같이, AcC2C9 뉴클레아제는 표적 서열에 삽입 또는 결실 돌연변이를 정확하게 도입할 수 있다.
도 9는 HEK293T 세포의 47개 부위에서 AcC2C9 일시적 발현 플라스미드의 유전자 편집 효율 그래프이다.
도 10은 인간 세포 HEK293T, HLEA, U-2 OS, Huh-7 및 HepG 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율 그래프이다.
이하에서는 구체적인 실시예를 결합하여 본 발명을 추가로 설명한다. 이러한 실시예는 본 발명을 설명하기 위한 것일 뿐 본 발명의 범위를 한정하려는 것이 아님을 이해해야 한다. 이 밖에, 본 발명의 교시 내용을 열독한 후, 당업자는 본 발명에 대해 다양한 변경 또는 수정을 가할 수 있으며, 이러한 등가 형태도 본 발명의 첨부된 특허청구범위에 의해 한정된 범위 내에 속함을 이해해야 한다.
용어 "C2C9", "C2C9 뉴클레아제”, "C2C9폴리펩티드”, "C2C9 단백질”, "C2C9 단백질”은 호환하여 사용할 수 있다.
용어 "가이드 RNA", "gRNA", "단일 gRNA" 및 "키메라 gRNA"는 호환하여 사용할 수 있다.
상기 발명에서 용어 "일” 또는 "하나”의 개체는 하나 이상의 상기 개체을 의미하고; 따라서, 용어 "일”(또는 "하나”), "하나 이상” 및 "적어도 하나”는 본 명세서에서 호환하여 사용할 수 있는 점에 유의해야 한다.
용어 "상동성” 또는 "동일성” 또는 "유사성”은 2개의 펩티드 사이 또는 2개의 핵산 분자 사이의 서열 유사성을 의미한다. 상동성은 상이한 폴리펩티드 또는 핵산 분자에 대응되는 위치를 대조함으로써 결정될 수 있고, 상이한 서열에서 비교 분자 서열의 동일한 위치가 동일한 염기 또는 아미노산에 의해 점유될 경우, 상기 분자는 상기 위치에서 상동한 것이다. 서열 사이의 상동 정도는 서열이 공유 결합하는 일치 또는 상동 위치의 수의 함수에 따라 결정된다. "관된되지 않은” 또는 "비상동적인” 서열은 본 발명에 개시된 서열 중 하나와 20% 미만의 상동성을 가져야 한다.
폴리뉴클레오티드 또는 폴리뉴클레오티드 영역(또는 폴리펩티드 또는 폴리펩티드 영역)은 다른 폴리뉴클레오티드 또는 폴리뉴클레오티드 영역(또는 폴리펩티드 또는 폴리펩티드 영역)과 특정 백분율의 서열 상동성(예를 들어, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98% 또는 99%)을 갖는 것은 대조 시 대조된 2개의 서열이 갖는 상기 백분율의 염기(또는 아미노산)은 동일함을 의미한다. 상기 대조 및 백분율 상동성 또는 서열 동일성은 본 분야에 공지된 소프트웨어 프로그램 및 방법을 사용하여 결정될 수 있다. 예를 들어 Ausubel et al.eds.(2007) Current Protocols in Molecular Biology에 기재된 바와 같다. 바람직하게는, 서열 대조 시 기본 매개변수를 사용해야 한다. 여기서 대안적 정렬 프로그램 중 하나는 기본 매개변수를 사용하는 BLAST이다. 특히, 프로그램 BLASTN 및 BLASTP를 사용하여 대조할 경우, 다음과 같은 기본 매개변수를 사용한다. Genetic code=standard; filter=none; strand=both; cutoff=60; expect=10; Matrix=BLOSUM62; Descriptions=50sequences; sort by=HIGH SCORE; Databases=non-redundant, GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein+SPupdate+PIR. 생물학적 의미에서 등가적인 것으로 간주되는 폴리뉴클레오티드는 상기 한정된 백분율 상동성을 갖고 동일하거나 유사한 생물학적 활성을 갖는 폴리펩티드를 코딩하는 이러한 폴리뉴클레오티드를 의미한다.
폴리뉴클레오티드가 DNA인 경우, 상기 폴리뉴클레오티드의 서열은 아데닌(A), 시토신(C), 구아닌(G) 및 티민(T)의 4개의 뉴클레오티드 염기의 대표 문자로 구성된다. 폴리뉴클레오티드가 RNA인 경우, 상기 폴리뉴클레오티드의 서열은 아데닌(A), 시토신(C), 구아닌(G) 및 우라실(U)의 4개의 뉴클레오티드 염기의 대표 문자로 구성된다. 따라서, 용어 "폴리뉴클레오티드 서열”은 폴리뉴클레오티드 분자의 문자로 표시된다. 상기 문자 표시는 중앙 처리 장치를 갖는 컴퓨터의 데이터베이스에 입력될 수 있고, 기능 유전체학 및 상동성 검색과 같은 생물 정보학 응용에 사용될 수 있다. 용어 "다형성”은 하나 이상의 형태의 유전자 또는 이의 일부가 공존하는 것을 의미하고, "유전자의 다형성 영역”은 동일한 위치에서 상이한 뉴클레오티드 발현 형태(즉 상이한 뉴클레오티드 서열)를 갖는 유전자를 의미한다. 유전자 다형성 영역은 상이한 대립유전자에서 상이한 단일 뉴클레오티드일 수 있다.
본 발명에서, 용어 "폴리뉴클레오티드” 및 "올리고뉴클레오타이드”는 호환하여 사용할 수 있고, 이들은 데옥시리보뉴클레오타이드이든 또는 리보뉴클레오타이드 또는 이들의 유사체이든 임의의 길이의 뉴클레오티드의 중합체 형태를 의미한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수있고 공지되거나 공지되지 않은 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드의 구현예는, 유전자 또는 유전자 단편(프로브, 프라이머, EST또는 SAGE 태그 포함), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA, 리보솜 RNA, 리보자임, cDNA, dsRNA, siRNA, miRNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머를 포함하지만 이에 한정되지 않는다. 폴리뉴클레오티드도 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체와 같은 변형을 거친 뉴클레오티드를 포함한다. 변형이 폴리뉴클레오티드에 존재하면, 상기 변형은 폴리뉴클레오티드 조립 전 또는 후에 부여될 수 있다. 뉴클레오티드 서열은 비뉴클레오티드 구성요소에 의해 중단될 수 있다. 폴리뉴클레오티드는 중합 후에 추가로 변형될 수 있으며, 예를 들어 접합을 통해 표지 구성요소에 의해 표지될 수 있다. 상기 용어는 이중 사슬 및 단일 사슬 폴리뉴클레오티드 분자를 동시에 의미한다. 다른 설명이나 요구가 없는 한, 본 발명에 개시된 폴리뉴클레오티드의 임의의 실시형태는 그의 이중 사슬 형태 및 이중 사슬 형태를 구성하는 것으로 공지되거나 예측되는 2개의 상보성 단일 사슬 형태 중 어느 하나를 포함한다.
이가 폴리뉴클레오티드에 응용되는 경우, 용어 "코딩”은 폴리뉴클레오티드가 폴리펩티드를 "코딩”한다는 것을 의미하며, 즉 천연 상태에서 또는 당업자에게 공지된 방법에 의해 조작될 경우 이는 전사 및/또는 번역을 통해 타깃 폴리펩티드 및/또는 이의 단편을 생성하거나 상기 타깃 폴리펩티드 및/또는 이의 단편을 코딩할 수 있는 mRNA를 생성할 수 있다. 안티센스 사슬은 상기 폴리뉴클레오티드에 상보성 서열이고 코딩 서열이 추론될 수 있는 서열을 의미한다.
용어 "게놈 DNA"는 박테리아, 고세균, 진균, 원생생물, 바이러스, 식물 또는 동물의 게놈의 DNA를 포함하는 생물학적 게놈의 DNA를 나타낸다.
용어 DNA에 대한 "조작”은 결합하거나, 하나의 사슬에 닉을 생성하거나 DNA의 두 사슬을 절단하는 것을 포함하거나 DNA 또는 DNA에 결합하는 폴리펩티드를 변형 또는 편집하는 것을 포함한다. DNA를 조작하여 상기 DNA에 의해 코딩된 RNA 또는 폴리펩티드의 발현을 침묵, 활성화 또는 조절할 수 있거나(전사되지 않거나 전사 활성이 감소되거나 번역되지 않거나 번역 수준이 감소됨), DNA에 대한 폴리펩티드의 결합을 방지하거나 강화한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해와 같은 다양한 방법에 의해 수행될 수 있고, 절단은 단일 사슬 절단 또는 이중 사슬 절단 일 수 있으며; DNA 절단으로 인해 평활 말단 또는 엇갈린 말단이 생성된다.
용어 "혼서화할 수 있는” 또는 "상보적” 또는 "기본적으로 상보적”은, 핵산(예를 들어 RNA)은 뉴클레오티드 서열을 포함하고, 상기 서열은 체외 및/또는 체내 적절한 온도 및 용액 이온 강도 조건 하에서 서열 특이적, 역평행 방식으로 다른 핵산에 비공유 결합적으로 결합할 수 있도록 하는데, 즉, 왓슨-크릭(Watson-Crick) 염기쌍 및/또는 G/U 염기쌍을 형성하고, "어닐링” 또는 "혼성화”하는 것을 의미한다.
본 분야에서는 폴리뉴클레오티드의 서열은 이가 특이적으로 혼성화할 수 있는 표적 핵산의 서열에 100% 상보적일 필요는 없다는 것을 이해할 수 있다. 폴리뉴클레오티드는 하나 이상의 세그먼트에 혼성화할 수 있다. 폴리뉴클레오티드는 이가 표적으로 하는 표적 핵산 서열 내의 표적 영역에 대해 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100%의 서열 상보성을 포함할 수 있다. 본 분야에서는 공지된 BLAST 프로그램 및 PowerBLAST 프로그램을 사용하여 핵산 내의 특정 핵산 서열 세그먼트 사이의 백분율 상보성을 통상적으로 결정할 수 있다.
용어 "펩티드”, "폴리펩티드” 및 "단백질”은 본 발명에서 호환하여 사용할 수 있고, 코딩된 아미노산과 코딩되지 않은 아미노산, 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산, 및 변형된 펩티드 주 사슬을 갖는 폴리펩티드을 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 나타낸다.
용어 "결합 도메인”은 다른 분자에 비공유 결합적으로 결합할 수 있는 단백질 도메인을 의미한다. 결합 도메인은 예를 들어 DNA 분자(DNA-결합 단백질), RNA 분자(RNA-결합 단백질) 및/또는 단백질 분자(단백질-결합 단백질)에 결합할 수 있다. 단백질 도메인-결합 단백질인 경우, 이는 그 자체(동종이량체, 동종삼량체 등을 형성하기 위함)에 결합할 수 있고 및/또는 이는 하나 이상의 상이한 단백질의 하나 이상의 분자에 결합할 수 있다.
용어 "보존적인 아미노산 치환”은 단백질에서 유사한 측쇄를 갖는 아미노산 잔기의 호환 가능성을 나타낸다. 예시적인 보존적 아미노산 치환 그룹은, 발린-류신-이소류신, 페닐알라닌-티로신, 라이신-아르기닌, 알라닌-발린 및 아스파라긴 글루타민이다.
용어 특정 RNA에 대한 DNA 서열을 "코딩”한다는 RNA로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오티드는 단백질로 번역되는 RNA(mRNA)를 코딩할 수 있거나, DNA 폴리뉴클레오티드는 단백질로 번역되지 않은 RNA(예를 들어, tRNA, rRNA 또는 gRNA; "비코딩” RNA 또는 "ncRNA"라고도 함)를 코딩할 수 있다. "단백질 코딩 서열” 또는 특정 단백질 또는 폴리펩티드를 코딩하는 서열은 적절한 조절 서열의 제어 하에서, 체내 또는 체외 mRNA(DNA의 경우)로 전사되고 폴리펩티드로 번역되는(mRNA의 경우) 핵산 서열이다.
용어 "벡터” 또는 "발현 벡터”는 플라스미드, 파지, 바이러스 또는 코스미드와 같은 레플리콘이고, 여기에 다른 DNA 세그먼트, 즉, "삽입 단편”이 부착되어 세포에서 부착된 세그먼트의 복제를 구현하도록 한다.
용어 "발현 카세트”는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 포함한다. "작동 가능하게 연결되는”은 각 구성요소가 의도한 방식으로 작용할 수 있는 관계에 있도록 병렬로 연결되는 것을 나타낸다. 용어 "재조합 발현 벡터” 또는 "DNA 작제물”은 벡터 및 적어도 하나의 삽입 단편을 포함하는 DNA 분자를 나타내도록 본 발명에서 호환적으로 사용된다. 재조합 발현 벡터는 일반적으로 삽입 단편의 발현 및/또는 증폭을 목적으로 하거나 다른 재조합 뉴클레오티드 서열을 구축하기 위해 생성된다.
재조합 발현 벡터와 같은 외인성 DNA가 세포 내로 도입된 경우, 세포는 상기 DNA에 의해 "유전적으로 변형”되거나 "형질전환”되거나 "형질감염”된 것이다. 외인성 DNA의 존재는 영구적이거나 일시적인 유전적 변경를 초래한다. 형질전환 DNA는 세포의 게놈에 통합되거나 통합되지 않는다.
용어 "표적 DNA"는 "표적 부위” 또는 "표적 서열”을 포함하는 DNA 폴리뉴클레오티드이다. 용어 "표적 부위”, "표적 서열”, "표적 프로토스페이서 DNA" 또는 "프로토스페이서 유사 서열”은 표적 DNA에 존재하는 핵산 서열을 나타내도록 본 발명에서 호환되어 사용되고, 결합을 위한 충분한 조건이 존재하면, gRNA의 DNA-표적화 세그먼트는 이에 결합한다. RNA 분자는 표적 DNA 내의 표적 서열에 결합, 혼성화하거나 상보적인 서열을 포함함으로써 결합된 폴리펩티드를 표적 DNA 내의 특정 위치(표적 서열)을 표적으로 한다. "절단”은 DNA 분자의 공유 결합 주 사슬의 파손을 의미한다.
용어 "뉴클레아제” 및 "엔도뉴클레아제”는 폴리뉴클레오티드 절단을 위한 엔도핵산 분해 촉매 활성을 갖는 효소를 의미하기 위해 호환하여 사용할 수 있다. 뉴클레아제의 "절단 도메인” 또는 "활성 도메인” 또는 "뉴클레아제 도메인”은 DNA 절단에 대한 촉매 활성을 갖는 뉴클레아제 내의 폴리펩티드 서열 또는 도메인을 의미한다. 절단 도메인은 단일 폴리펩티드 사슬에 포함될 수 있거나 절단 활성은 2개 이상의 폴리펩티드의 결합으로 인해 생성될 수 있다.
용어 "위치 지정 폴리펩티드” 또는 "RNA-결합 부위가 지시된 폴리펩티드”는 RNA에 결합하고 특정 DNA 서열을 표적으로 하는 폴리펩티드를 의미한다.
용어 "가이드 서열” 또는 DNA-표적화 세그먼트(또는 "DNA-표적화 서열”)는 본 발명에서 "프로토스페이서 유사” 서열이라고도 하는 표적 DNA 내의 특정 서열에 상보적인 뉴클레오티드 서열(표적 DNA의 상보성 사슬)을 포함한다.
용어 "재조합”은 2개의 폴리뉴클레오티드 사이에서 유전 정보를 교환하는 과정을 의미한다. 본 발명에 사용된 "상동성 지시 복구(HDR)"는 예를 들어 세포에서 이중 사슬 파손을 복구하는 동안 발생하는 특수한 형태의 DNA 복구를 나타낸다. 이러한 과정은 뉴클레오티드 서열 상동성을 요구하고, "공여자” 분자를 사용하여 "표적” 분자(즉, 이중 사슬 파손을 거친 분자)의 복구를 위해 주형을 제공하여 공여자로부터 표적으로 유전 정보가 전달된다. 공여자 폴리뉴클레오티드가 표적 분자와 상이하고, 공여자 폴리뉴클레오티드의 일부 또는 전부의 서열이 표적 DNA에 통합되면, 상동성 지시 복구는 표적 분자 서열의 변경(예를 들어 삽입, 결실, 돌연변이)을 초래할 수 있다.
용어 "비상동성 말단 연결(NHEJ)"은 상동 주형이 필요 없이 파손 말단을 서로 직접 연결하여 DNA의 이중 사슬 파손을 복구하는 것을 의미한다. NHEJ는 자주 이중 사슬 파손 부위 근처의 뉴클레오티드 서열 결실을 초래한다.
용어 "치료”는 질병 또는 증상의 발생을 방지하고; 질병 또는 증상을 억제하거나 질병을 완화시키는 것을 포함한다.
용어 "개체”, "대상체”, "숙주” 및 "환자”는 본 발명에서 호환하여 사용할 수 있고, 진단, 치료 또는 요법이 요망되는 임의의 포유동물 대상체, 특히 인간을 나타낸다.
본 발명은 i) gRNA와 상호작용하는 RNA-결합 부분; 및 활성 부분을 포함하는 CRISPR 편집 시스템에 적합한 극소형 C2C9 뉴클레아제를 제공한다.
상기 C2C9 뉴클레아제는 표적 유전자(예를 들어 표적 DNA) 내의 전사 조절, 절단 활성(엔도리보뉴클레아제 및/또는 엔도뉴클레아제 활성), 유전자 편집 활성 등의 활성 중 적어도 하나를 갖고, 구현된 유전자 편집의 유형은, 유전자 절단, 유전자 삭제, 유전자 삽입, 점 돌연변이, 전사 억제, 전사 활성화 및 염기 편집 등을 포함하지만 이에 한정되지 않는다. 상기 C2C9 뉴클레아제는 임의의 생물학적 종에서 유래될 수 있다.
비제한적인 설명의 예로서, 상기 C2C9 뉴클레아제는 예를 들어 CRISPR 편집 시스템의 뉴클레아제로 사용할 수 있다.
본 발명에서, 또한 변형, 돌연변이, DNA 셔플링 등 방식을 통해서도 C2C9 뉴클레아제 변이체를 형성할 수 있어 C2C9 뉴클레아제 변이체는 기능, 활성, 동역학, 반감기 등과 같은 개선된 필요한 특징을 갖는다. 상기 변형은 예를 들어 아미노산의 결실, 삽입 또는 치환일 수 있고, 또는 예를 들어 상이한 뉴클레아제로부터 유래된 상동 또는 이종 절단 도메인(예를 들어 CRISPR-관련 뉴클레아제의 HNH 도메인)으로 C2C9 뉴클레아제를 치환한 "절단 도메인”일 수 있으며; 메틸화 작용, 탈메틸화 작용, 아세틸화 작용 등과 같은 본 분야에 공지된 DNA결합 및/또는 DNA변형 단백질의 임의의 변형 방법에 의해, 예를 들어 C2C9 뉴클레아제의 DNA 표적화를 변경시킬 수 있다. 상기 DNA 셔플링은 RNA-지시 엔도뉴클레아제 활성을 갖는 합성 단백질을 코딩하는 키메라 DNA 서열을 생성하기 위해 상이한 유래의 C2C9 뉴클레아제의 DNA 서열 사이의 서열 단편의 교환을 의미한다. 상기 변형, 돌연변이, DNA 셔플링 등은 단독으로 또는 조합하여 사용할 수 있다.
상기 C2C9 뉴클레아제는 N 말단에서 C 말단까지,
서열번호 1로 표시되는 아미노산 서열 또는 상기 아미노산 서열과 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 서열 동일성을 갖는 변이체를 포함하는 도메인 1;
서열번호 2로 표시되는 아미노산 서열 또는 상기 아미노산 서열과 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 서열 동일성을 갖는 변이체를 포함하는 도메인 2를 포함한다.
상기 C2C9 뉴클레아제 변이체는,
(I) 야생형 C2C9 뉴클레아제의 아미노산 서열과 적어도 20%(예: 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%)의 서열 상동성을 갖고, 야생형 C2C9 뉴클레아제의 활성을 유지하는 변이체이고;
(II) 핵 국소화 신호 단편과 같은 다른 구성요소를 더 포함하여 무세포 반응, 원핵 세포, 또는 진핵 세포 환경에서 구축된 C2C9CRISPR 시스템이 적절한 활성을 갖도록 하는 (I)에 따른 C2C9 뉴클레아제 또는 이의 변이체이며;
(III) 야생형 C2C9 뉴클레아제 또는 (I) 및 (II)에 따른 변이체를 코딩하는 대응되는 폴리뉴클레오티드 서열의 코돈 최적화 변이체이고;
(IV) 야생형 C2C9 뉴클레아제 및 (I) 내지 (III) 중 어느 하나에 따른 변이체일 수 있으며, 상기 (IV) 변이체는 추가로,
(a) 현저히 감소되거나 검출되지 않는 뉴클레아제 활성을 갖는 C2C9를 생성하는 하나 이상의 변형 또는 돌연변이; 및
(b) 다른 기능 활성을 갖는 폴리펩티드 또는 도메인을 포함한다.
(IV) (b) 하의 적합한 폴리펩티드는 C2C9 뉴클레아제 및 이의 변이체의 C-말단 도메인에 연결된다.
(IV) 하의 C2C9 뉴클레아제 변이체는 표적 DNA 서열에 이중 사슬 파손을 도입하지 않고 변형 또는 돌연변이를 통해 임의의 염기쌍을 임의의 가능한 다른 염기쌍으로 형질전환할 수 있다.
(IV) 하의 C2C9 뉴클레아제 변이체는 야생형 C2C9 뉴클레아제이거나 (I) 내지 (III)의 변이체와 이종 서열로 형성된 융합체 또는 키메라 폴리펩티드일 수 있다. 상기 이종 서열은 광 유도 전사 조절자, 소분자/약물 반응 전사 조절자, 전사 인자, 전사 억제 단백질 등을 포함하지만 이에 한정되지 않는다. 융합체 또는 키메라 폴리펩티드 형성에 있어서, 야생형 C2C9 뉴클레아제 또는 (I) 내지 (III)의 변이체는 완전하거나 일부 또는 전부 결핍된 C2C9 뉴클레아제일 수 있다. 예를 들어, 촉매 활성 엔도뉴클레아제 도메인을 포함하는 C2C9 뉴클레아제는 Fokl 도메인에 융합되어 키메라 단백질을 형성하거나; 변형을 통해 엔도뉴클레아제 도메인 활성이 손실된 C2C9 뉴클레아제는 Fokl 도메인에 융합되어 키메라 단백질을 형성하거나; 후성유전학적 변형 인자, 태그, 영상화제, 전사 조절제, 히스톤, 유전자 구조 또는 활성을 조절하는 다른 구성요소 등은 C2C9 뉴클레아제에 융합되어 키메라 단백질을 제조한다. 일부 실시형태에서, 이종 서열은 용이한 추적 또는 정제를 위한 태그(예를 들어, 녹색 형광 단백질(GFP), YFP, RFP, CFP 등과 같은 형광 단백질; His태그; 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다. 일부 실시형태에서, 이종 서열은 C2C9 뉴클레아제의 서브 세포 위치 지정을 제공할 수 있다.
일부 실시형태에서, C2C9 뉴클레아제 변이체는 C2C9 뉴클레아제의 변형된 형태이다. 일부 실시형태에서, C2C9 뉴클레아제의 변형된 형태는 C2C9 뉴클레아제의 천연적으로 존재하는 뉴클레아제 활성을 감소시키는 아미노산 변경를 포함한다. 예를 들어, 일부 실시형태에서, C2C9 뉴클레아제의 변형된 형태는 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만에 상응하는 야생형 C2C9 뉴클레아제의 뉴클레아제 활성을 갖는다. 일부 실시형태에서, C2C9 뉴클레아제의 변형된 형태는 현저한 뉴클레아제 활성이 없지만 gRNA와 상호작용하는 능력을 유지한다. 일부 실시형태에서, C2C9 뉴클레아제의 변형된 형태는 뉴클레아제 활성이 없다. 일부 실시형태에서, C2C9 뉴클레아제의 엔도리보뉴클레아제 활성 또는 DNA에 대한 결합 친화력이 크게 감소하거나 강화되지 않은 경우, 돌연변이 폴리펩티드는 변경되거나 취소된 DNA 엔도뉴클레아제 활성을 갖는다.
일부 실시형태에서, C2C9 뉴클레아제의 다양한 잠재적 응용을 추가로 개발하기 위해 상기 C2C9는 다른 효소 성분 또는 다른 성분과 결합하여 사용될 수 있다. (IV) 하의 C2C9 뉴클레아제 변이체의 비제한적 예로서, 예를 들어 비활성화된 C2C9와 염기 데아미나제를 융합하여 C2C9 뉴클레아제 기반의 단일 염기 편집 시스템을 개발하고; 비활성화된 C2C9와 역전사 효소를 융합하여 C2C9 뉴클레아제 기반의 Prime 편집 시스템을 개발하며; 비활성화된 C2C9와 전사 활성화 인자를 융합하여 C2C9 뉴클레아제 기반의 전사 활성화 시스템을 개발하고; 비활성화된 C2C9와 핵산 에피변형 효소를 융합하여 C2C9 뉴클레아제 기반의 에피변형 시스템을 개발하며; 비활성화된 C2C9를 이용하여 C2C9 뉴클레아제 기반의 전사 억제 시스템을 개발한다.
C2C9 뉴클레아제 변이체는 다음의 특정 성질을 포함하지만 이에 한정되지 않는다.
강화되거나 향상된 표적에 대한 결합 능력을 갖거나 표적에 대한 결합 능력을 유지하고;
강화되거나 향상된 엔도리보뉴클레아제 및/또는 엔도뉴클레아제 활성을 갖거나 엔도리보뉴클레아제 및/또는 엔도뉴클레아제 활성을 유지하며;
시토신, 구아닌 또는 아데닌 염기에 작용할 수 있는 탈아미노효소 활성을 갖고, 그런 다음 탈아미노화 부위를 통해 복제하고 세포 내에서 복구하여 각각 구아닌, 티민 및 구아닌을 생성하고;
표적 DNA의 전사를 조절하는 활성을 갖고, 표적 DNA의 특정 위치에서 표적 DNA의 전사를 증가시키거나 감소시킬 수 있으며;
변경된 DNA 표적화를 갖고;
안정성을 증가하거나 감소하거나 유지하며;
표적 DNA의 상보성 사슬을 절단할 수 있지만, 감소된 표적 DNA의 비상보성 사슬을 절단하는 능력을 갖고;
표적 DNA의 비상보성 사슬을 절단할 수 있지만, 감소된 표적 DNA의 상보성 사슬을 절단하는 능력을 가지며;
감소된 표적 DNA의 상보성 사슬 및 비상보성 사슬 양자를 절단하는 능력을 갖고;
DNA 관련 폴리펩티드(예를 들어 히스톤)를 변형하는 효소 활성을 갖는데, 효소 활성은 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 리보실화 활성 등 중 하나 이상일 수 있다(단백질의 공유 결합 변형은 이러한 효소 활성에 의해 촉매되고; 예를 들어, C2C9 뉴클레아제 변이체는 메틸화 작용, 아세틸화 작용, 유비퀴틴화, 인산화 작용 등을 통해 히스톤을 변형시켜 히스톤 관련 DNA의 구조적 변경를 일으켜 DNA의 구조 및 특성을 제어한다).
일부 실시형태에서, C2C9 뉴클레아제 변이체는 절단 활성이 없다. 일부 실시형태에서, C2C9 뉴클레아제 변이체는 단일 사슬 절단 활성을 갖는다. 일부 실시형태에서, C2C9 뉴클레아제 변이체는 이중 사슬 파손 활성을 갖는다.
강화된 활성 또는 능력을 갖는 것은 야생형 C2C9 뉴클레아제에 비해 적어도 1%, 5%, 10%, 20%, 30%, 40%, 50% 향상된 활성 또는 능력을 갖는 것을 의미한다.
감소된 활성 및 능력을 갖는 것은 야생형 C2C9 뉴클레아제에 비해 50% 미만, 40% 미만, 30% 미만, 20% 미만의, 10% 미만, 5% 미만 또는 1% 미만의 활성 또는 능력을 갖는 것을 의미한다.
본 발명에서, 상기 C2C9 뉴클레아제는 바람직하게는 서열번호 3-117 등으로 이루어진 군에서 유래된다.
일부 실시형태에서, 상이한 C2C9 뉴클레아제의 다양한 효소적 특성(예를 들어, 상이한 PAM 서열 선호도에 대해), 상이한 종에서 유래된 C2C9 뉴클레아제는 예를 들어, 효소적 활성을 증가하거나 감소하고; 세포 독성 수준을 증가하거나 감소하며; NHEJ, 상동성 지향 복구, 단일 사슬 절단, 이중 사슬 파손 등 사이의 균형을 변경하는 상이한 응용을 제공하는 데 유리하다.
일부 실시형태에서, 상기 C2C9 뉴클레아제는 악티노마두라 크라니엘라에(Actinomadura craniellae)로부터 유래되고, 서열번호 3의 아미노산 서열 또는 서열번호 3과 적어도 약 90%(예: 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 중 어느 하나) 서열 상동성을 갖는 변이체을 포함하며; Actinomaduracraniellae C2C9 또는 "AcC2C9"는 PAM 서열 AAN을 인식할 수 있다. 일부 실시형태에서, 상기 C2C9 뉴클레아제는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(서열번호 5)으로부터 유래되고, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) C2C9 또는 "CgC2C9"는 PAM 서열 AAN을 인식할 수 있다. 일부 실시형태에서, 상기 C2C9 뉴클레아제는 로티아 덴토카리오사(Rothia dentocariosa)(서열번호 20)로부터 유래되고, 로티아 덴토카리오사(Rothia dentocariosa) C2C9 또는 "RdC2C9"는 PAM 서열 AAG를 인식할 수 있다. 일부 실시형태에서, 상기 RdC2C9 뉴클레아제는 PAM 서열 AAA, AAT 또는 AAC를 인식할 수 있다. 일부 실시형태에서, 상기 C2C9는 마이크로코쿠스 루테우스(Micrococcus luteus)(서열번호 12)로부터 유래되고, 마이크로코쿠스 루테우스(Micrococcus luteus) C2C9 또는 "MiC2C9"는 PAM 서열 AAN을 인식할 수 있다. 상기 AAN은 AAA, AAC, AAG 및 AAT를 포함한다.
상이한 종으로부터 유래된 C2C9 뉴클레아제 또는 동일한 종으로부터 유래된 상이한 C2C9 뉴클레아제는 표적 DNA에서 상이한 PAM 서열을 요구할 수 있으므로, 선택된 특정 C2C9 뉴클레아제에 대해 PAM 서열 요구는 상술한 PAM 서열과 상이할 수 있다.
일부 실시형태에서, 이러한 작은 C2C9는 본 발명의 이하에 기재된 임의의 시스템, 조성물, 키트 및 방법에서 사용될 수 있다.
바람직한 일 실시형태에서, 상기 C2C9 뉴클레아제는 AcC2C9인 악티노마두라 크라니엘라에(Actinomadura craniellae)에서 유래되고, 서열은 서열목록의 서열번호 3으로 표시된다.
일부 실시형태에서, 상기 AcC2C9 뉴클레아제 변이체는,
(I) 서열번호 3의 야생형 AcC2C9 뉴클레아제의 아미노산 서열과 적어도 20%(예: 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 99%)의 서열 상동성을 갖고, 야생형 C2C9 뉴클레아제에 비해 증가, 감소 또는 유지된 활성을 갖는 변이체이고;
(II) 핵 국소화 신호와 같은 다른 구성요소를 더 포함하여 무세포 반응, 원핵 세포, 또는 진핵 세포 환경에서 구축된 C2C9CRISPR 시스템이 적절한 활성을 갖도록 하는 (I)에 따른 AcC2C9 뉴클레아제 또는 이의 변이체이며;
(III) 서열번호 3 야생형 AcC2C9 뉴클레아제 또는 (I) 및 (II)에 따른 변이체를 코딩하는 대응되는 폴리뉴클레오티드 서열의 코돈 최적화 변이체이고;
(IV) 서열번호 3에 따른 야생형 AcC2C9 뉴클레아제 및 (I) 내지 (III) 중 어느 하나의 변이체이며, 상기 (IV) 변이체는 추가로,
(a) 현저히 감소되거나 검출되지 않는 뉴클레아제 활성을 갖는 C2C9를 생성하는 하나 이상의 변형 또는 돌연변이; 및
(b) 다른 기능 활성을 갖는 폴리펩티드를 포함한다.
본 발명에서 제공하는 C2C9 뉴클레아제의 아미노산 개수는 적다. 바람직한 일 실시형태에서, 상기 C2C9 뉴클레아제의 아미노산 서열이 서열번호 3으로 표시되는 경우, 이는 PAM 서열 AAN과 상호작용한다. 절단 부위는 일반적으로 PAM 서열 상류의 1~3개의 염기쌍 내에 존재한다. 상이한 종으로부터 유래된 C2C9 뉴클레아제 또는 동일한 종으로부터 유래된 상이한 C2C9 뉴클레아제는 표적 DNA에서 상이한 PAM 서열을 요구할 수 있으므로, 선택된 특정 C2C9 뉴클레아제에 대해 PAM 서열 요구는 상술한 PAM 서열과 상이할 수 있고; C2C9는 공학을 통해 표적화 PAM 서열“AAN" 또는 다른 적합한 표적화 PAM 서열로 변형될 수 있다.
일부 실시형태에서, 상기 AcC2C9 뉴클레아제 변이체는 서열번호 3으로 표시되는 아미노산 서열과 적어도 90%(예: 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%) 서열 상동성을 갖고 AcC2C9 뉴클레아제의 활성을 유지한다.
다른 설명이 없으면, 용어 "C2C9", "C2C9 뉴클레아제”는 야생형 C2C9 뉴클레아제 및 이의 모든 변이체를 포함하고, 당업자는 위에 나열된 것들에 제한되지 않고 일반적인 수단을 통해 C2C9 뉴클레아제 변이체의 유형을 결정할 수 있다.
본 발명은 또한 AcC2C9 뉴클레아제를 코딩하는 뉴클레오티드를 포함하는 핵산을 제공한다. 일 실시형태에서, 본 발명은 하나 이상의 기능성 C2C9 도메인을 코딩하거나 원래의 천연 뉴클레오티드 서열에 의해 코딩된 폴리펩티드와 동일한 기능을 갖는 폴리펩티드를 코딩하는 코돈 최적화된 폴리뉴클레오티드 서열을 제공한다. 따라서, 당업자는 특정 표적 중에서 본 발명에 따른 C2C9 뉴클레아제를 사용하기 위해 뉴클레오티드 서열 또는 재조합 핵산에 대한 코돈 최적화를 수행할 수 있다. 본 분야에 공지된 다른 방법에 의해 코돈 최적화에 사용되고, 천연 뉴클레오티드 서열 서열번호 121과 100% 미만의 동일성(예를 들어, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 미만)을 갖는다. 본 발명의 폴리뉴클레오티드는 표적 세포에서 코딩된 C2C9 뉴클레아제의 발현을 증가시키도록 코돈 최적화를 거친다. 일부 실시형태에서, 본 발명의 폴리뉴클레오티드는 인간 세포에서의 발현을 증가시키도록 코돈 최적화를 거친다. 일부 실시형태에서, 본 발명의 폴리뉴클레오티드는 대장균 세포에서의 발현을 증가시키도록 코돈 최적화를 거친다. 일부 실시형태에서, 본 발명의 폴리뉴클레오티드는 진균 세포에서의 발현을 증가시키도록 코돈 최적화를 거친다. 일부 실시형태에서, 본 발명의 폴리뉴클레오티드는 곤충 세포에서의 발현을 증가시키도록 코돈 최적화를 거친다.
일 실시형태에서, 상기 AcC2C9 뉴클레아제를 코딩하는 핵산은 서열목록의 서열번호 121로 표시된다. 일 실시형태에서, 본 발명은 서열번호 121과 적어도 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.2%, 99.5%, 99.8%, 99.9% 또는 100% 서열 상동성을 갖는 AcC2C9 뉴클레아제 코돈 최적화된 폴리뉴클레오티드 서열을 제공한다. 바람직한 일 실시형태에서, 상기 AcC2C9 뉴클레아제의 인간 코돈에 대해 최적화된 보다 바람직한 코딩 서열은 서열목록의 서열번호 122로 표시되고, 하나 이상의 기능성 C2C9 도메인을 코딩하거나 원래의 천연 뉴클레오티드 서열에 의해 코딩된 폴리펩티드와 동일한 기능을 갖는 폴리펩티드를 코딩한다. 일부 실시형태에서, 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드는 서열번호 121-122와 적어도 약 90%(예: 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 중 어느 하나) 서열 상동성을 갖는다.
일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 핵산은 DNA이다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 핵산은 RNA이다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 핵산은 재조합 발현 벡터와 같은 발현 벡터이다. 숙주 세포와 상용되는 한 임의의 적합한 발현 벡터를 사용할 수 있고, 바이러스 벡터(예를 들어 백시니아 바이러스 기반의 바이러스 벡터; 소아마비 바이러스; 아데노 바이러스; 아데노 관련 바이러스; SV40; 단순 포진 바이러스; 인간 면역 결핍 바이러스; 레트로 바이러스 벡터(예를 들어 쥐 백혈병 바이러스, 비장 괴사 바이러스, 및 로우스 육종 바이러스, 하비(Harvey) 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역 결핍 바이러스, 골수 증식성 육종 바이러스 및 유방 종양 바이러스와 같은 레트로 바이러스로부터 유래된 벡터) 등을 포함하지만 이에 한정되지 않는다.
일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 프로모터와 같은 전사 제어 요소와 같은 제어 요소에 작동 가능하게 연결된다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 구성적 프로모터에 작동 가능하게 연결된다. 전사 제어 요소는 포유동물 세포와 같은 진핵 세포; 또는 원핵 세포(예를 들어 박테리아 또는 고세균 세포)에서 역할을 할 수 있다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 원핵 및 진핵 세포 모두에서 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열의 발현을 허용하는 복수의 제어 요소에 작동 가능하게 연결된다. 일부 실시형태에서, 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드 서열은 세포 또는 체외 환경에서 발현을 위해 적합한 핵 국소화 신호에 작동 가능하게 연결된다.
본 발명에서, 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드는 화학적 방법과 같은 인공적인 합성 방식을 통해 합성될 수 있음으로써 다양한 변형을 용이하게 수행할 수 있다. 상기 변형은 본 분야에 공지된 임의의 변형 방식을 사용할 수 있다. 일부 실시형태에서, 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드는 하나 이상의 변형을 포함함으로써 전사 활성 강화, 효소 활성 변경, 이의 번역 또는 안정성 향상(예를 들어 단백질 가수분해, 분해에 대한 저항성 증가) 또는 특이적, 용해도 변경, 전달 변경, 숙주 세포의 선천적 면역 반응 감소와 같은 많은 변형을 용이하게 병합될 수 있다. 상기 변형은 본 분야에 공지된 임의의 변형 방식을 사용할 수 있다. 일부 실시형태에서, 세포 내로 도입된 C2C9 뉴클레아제를 코딩하는 DNA 또는 RNA를 변형하여 임의의 하나 이상의 게놈 유전자좌를 편집한다. 일부 실시형태에서, C2C9 뉴클레아제를 코딩하는 핵산 서열은 변형된 핵산이고, 예를 들어 코돈 최적화된 것이다. 상기 변형은 단일 변형이거나 조합 변형일 수 있다.
본 발명에서, C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드를 포함하는 핵산은 핵산 모방체일 수 있다. 예를 들어 우수한 혼성화 성질을 갖는 폴리뉴클레오티드 모방체 펩티드 핵산 등이다.
본 발명에서, 상기 C2C9 뉴클레아제, 또는 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드는 임의의 생물 또는 체외 환경에 적용되고, 박테리아, 고세균, 진균, 원생생물, 식물 또는 동물을 포함하지만 이에 한정되지 않는다. 이에 상응하여, 적합한 표적 세포는 박테리아 세포, 고세균 세포, 진균 세포, 원생생물 세포, 식물 세포 또는 동물 세포와 같은 진핵 세포 및 원핵 세포를 포함하지만 이에 한정되지 않되; 상기 진핵 세포는 포유동물 세포 및 식물 세포를 포함하고, 상기 원핵 세포는 대장균 및 클렙시엘라 뉴모니아을 포함한다. 적합한 표적 세포는 줄기세포, 체세포 등을 포함하는 임의의 유형의 세포일 수 있다. 상기 세포는 체내 또는 체외에 있을 수 있다. 일부 실시형태에서, 상기 C2C9 뉴클레아제 또는 상기 C2C9 뉴클레아제를 코딩하는 핵산은 리포솜 또는 지질 나노입자에 조제한다.
본 발명은 또한 CRISPR/C2C9 유전자 편집 시스템의 구축에서 상기 C2C9 뉴클레아제의 응용을 제공한다.
본 발명은 또한 체내, 체외 세포(In vitro cells) 또는 체외 환경에서 사용하기에 적합한 PAM 서열을 제공하고, 상기 PAM은 AAN 및/또는 GAN이다.
본 발명은 또한 원핵, 진핵 및 체외 환경에서 사용하기에 적합한 PAM 서열 및 적합한 가이드를 제공한다. 본 발명에서 제공하는 가이드 RNA(gRNA)는 C2C9 뉴클레아제와 같은 뉴클레아제를 표적 유전자 내의 특정 표적 서열로 안내한다.
일부 실시형태에서, 상기 gRNA는,
표적 유전자의 표적 서열에 상보적인 뉴클레오티드 서열의 제1 단편("유전자 표적화 서열” 또는 "유전자 표적화 단편”이라고도 함); 및,
C2C9 뉴클레아제와 상호작용하는 제2 단편("단백질 결합 서열” 또는 "단백질 결합 단편”이라고도 함)을 포함한다.
일부 실시형태에서, 상기 gRNA는 반복 서열 스페이서 어레이를 포함하되, 상기 스페이서는 유전자의 표적 서열에 상보적인 핵산 서열을 포함한다.
일부 실시형태에서, 상기 gRNA는,
i. 표적 서열에 혼성화할 수 있는 유전자 표적화 세그먼트 (예: DNA-표적화 세그먼트),
ii. tracr 파트너 서열, 및
iii. tracrRNA 서열을 포함하되;
상기 가이드 RNA는 상기 DNA-표적화 세그먼트 (i)와 tracr 파트너 서열 (ii) 및 tracrRNA 서열 (iii)이 순차적으로 연결되어 형성된 하나의 사슬이고; 또는, 상기 가이드 RNA는 두 사슬을 포함하되,그 중 하나의 사슬은 상기 유전자 표적화 세그먼트 (i)와 tracr 파트너 서열 (ii)이 연결되어 형성되고, 다른 하나의 사슬은 상기 tracrRNA 서열 (iii)이다.
여기서, 상기 유전자 표적화 세그먼트 (i)는 바람직하게는 PAM 서열 이후 길이가 20bp인 핵산 단편에 대응되는 RNA 서열이다.
여기서, 상기 tracr 파트너 서열 (ii)은 상기 tracrRNA 서열 (iii)에 혼성화하여 스템-루프 구조를 형성한다.
여기서, 상기 tracr 파트너 서열 (ii)과 상기 tracrRNA 서열 (iii)은 함께 연결되어 단일 가이드 RNA 골격 서열을 형성할 수 있다.
여기서, 표적 서열에 혼성화된 유전자 표적화 세그먼트 (i) 및 tracr 파트너 서열 (ii)을 연결하여 얻은 RNA 서열(crRNA)과 상기 tracrRNA 서열 (iii)은 두 개의 별도의 RNA 서열로서 동시에 존재하는 경우 C2C9 엔도뉴클레아제 활성을 매개할 수 있다. 또는 가이드 RNA 골격 서열 및 표적 서열에 혼성화하는 DNA-표적화 세그먼트 (i)를 연결한 후 얻은 표적 서열에 대한 완전 가이드 RNA 발현 작제물은 마찬가지로 C2C9 엔도뉴클레아제 활성을 매개할 수 있다.
gRNA의 유전자 표적화 세그먼트는 표적 유전자의 서열에 상보적인 뉴클레오티드 서열을 포함하고, 상기 유전자 표적화 서열은 혼성화(즉 염기쌍)를 통해 서열 특이적 방식으로 표적 유전자와 상호작용한다. gRNA의 유전자 표적화 서열은 예를 들어 유전자 공학의 방식에 의해 변형될 수 있어, gRNA는 표적 유전자 내의 임의의 필요한 서열에 혼성화한다. gRNA는 상기 유전자 표적화 서열을 통해 결합된 폴리펩티드를 표적 유전자 내의 특정 뉴클레오티드 서열로 가이드한다.
상기 스템-루프 구조는 C2C9 뉴클레아제와 상호작용하는 단백질 결합 구조를 형성한다. 일부 실시형태에서, 상기 gRNA의 단백질 결합 구조는 4개의 스템-루프 구조를 포함하고, tracr 파트너 서열 (ii)은 일반적으로 염기 상보성을 통해 tracrRNA 서열 (iii)과 쌍을 이룬다. gRNA의 염기 서열을 변형하여 C2C9 뉴클레아제의 활성을 향상시키거나 비특이적 인식을 감소시킬 수 있다.
일부 실시형태에서, 표적 유전자는 DNA 서열이다. 일부 실시형태에서, 표적 유전자는 RNA 서열이다.
일부 실시형태에서, 상기 gRNA는 sgRNA이다. 바람직한 일 실시형태에서, 상기 gRNA의 서열은 서열번호 123으로 표시된다.
일부 실시형태에서, 표적 유전자의 표적화 서열은 12~40개의 뉴클레오티드 길이를 가질 수 있고, 예를 들어 13~20, 18~25, 22~32, 26~37, 30~38, 32~40개의 뉴클레오티드 길이일 수 있다. 가이드 RNA의 표적화 세그먼트 (i)와 표적 유전자의 표적 서열사이의 상보성 백분율은 적어도 50%(예를 들어, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%)일 수 있다.
일부 실시형태에서, 상기 gRNA는 전사 종결 인자를 더 포함한다.
본 발명은 또한 변형형 gRNA를 제공하고, 이는 변형을 통해 표적 유전자 내의 임의의 필요한 서열 혼성화를 구현하고; 또는, gRNA의 변형을 통해 gRNA의 안정성을 향상시키는 것과 같이 gRNA 자체의 특성을 변경하는데, 세포에 존재하는 리보뉴클레아제(RNase)에 의한 분해에 대한 저항성을 향상시킴으로써 세포에서의 반감기를 연장하고; 또는, 변형을 통해 gRNA 및 엔도뉴클레아제(예를 들어 C2C9 뉴클레아제)를 포함하는 CRISPR-C2C9 게놈 편집 복합체의 형성 또는 이의 안정성을 향상시킬 수 있으며; 또는, 변형을 통해 게놈 편집 복합체의 특이성을 향상시킬 수 있고; 또는, 변형을 통해 게놈 편집 복합체와 게놈 중 표적 서열 사이의 상호작용의 시작 부위, 안정성 또는 동역학을 향상시킬 수 있으며; 또는, 변형을 통해 세포 내로 도입된 RNA가 선천적 면역 반응의 유발 가능성 또는 정도를 감소시킬 수 있는 등을 포함하지만 이에 한정되지 않는다. 본 발명에서, gRNA을 변형하여 CRISPR-C2C9 시스템(예: 이하 기재에 따름)의 다양한 특성을 변경하고, 예를 들어 CRISPR-C2C9 게놈 편집 복합체의 형성, 표적 활성, 특이적, 안정성 또는 동역학 특성을 향상시킨다. 본 분야에 공지된 변형 방식을 사용하여 RNA에 대해 변형하고, 피리미딘의 리보스, 염기 잔기 또는 RNA의 3' 말단의 역염기에서의 2'-플루오로, 2'-아미노 변형 등을 포함하지만 이에 한정되지 않는다. 본 발명에서, 임의의 변형 또는 다양한 변형의 조합을 사용하여 gRNA을 변형할 수 있다. 일부 실시형태에서, 세포 내로 도입된 sgRNA를 변형하여 임의의 하나 이상의 게놈 유전자좌를 편집한다.
본 발명은 gRNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 일부 실시형태에서, gRNA를 코딩하는 핵산은 재조합 발현 벡터와 같은 발현 벡터이다. 숙주 세포와 상용되는 한 임의의 적합한 발현 벡터를 사용할 수 있고, 바이러스 벡터(예를 들어 백시니아 바이러스 기반의 바이러스 벡터; 소아마비 바이러스; 아데노 바이러스; 아데노 관련 바이러스; SV40; 단순 포진 바이러스; 인간 면역 결핍 바이러스; 레트로 바이러스 벡터(예를 들어 쥐 백혈병 바이러스, 비장 괴사 바이러스, 및 로우스 육종 바이러스, 하비(Harvey) 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역 결핍 바이러스, 골수 증식 육종 바이러스 및 유방 종양 바이러스와 같은 레트로 바이러스로부터 유래된 벡터) 등을 포함하지만 이에 한정되지 않는다.
일부 실시형태에서, 동일한 세포에서 다양한 gRNA를 동시에 사용하여 동일한 표적 유전자 또는 상이한 표적 유전자의 상이한 위치의 전사를 동시에 조절한다. 복수의 gRNA가 동시에 사용되는 경우 동일한 발현 벡터 또는 상이한 벡터에 존재할 수 있고, 동시에 발현할 수도 있으며; 동일한 벡터에 존재하는 경우, 동일한 제어 요소 하에 발현할 수 있다.
일부 실시형태에서, gRNA를 코딩하는 뉴클레오티드 서열은 프로모터와 같은 전사 제어 요소와 같은 제어 요소에 작동 가능하게 연결된다. 일부 실시형태에서, gRNA를 코딩하는 뉴클레오티드 서열는 유도성 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, gRNA를 코딩하는 뉴클레오티드 서열은 구성적 프로모터에 작동 가능하게 연결된다. 전사 제어 요소는 포유동물 세포와 같은 진핵 세포; 또는 원핵 세포(예를 들어 박테리아 또는 고세균 세포)에서 역할을 할 수 있다. 일부 실시형태에서, gRNA를 코딩하는 뉴클레오티드 서열은 원핵 및 진핵 세포 모두에서 gRNA를 코딩하는 뉴클레오티드 서열의 발현을 허용하는 복수의 제어 요소에 작동 가능하게 연결된다.
본 발명에서, 상기 gRNA는 화학적 방법과 같은 인공적인 합성 방식을 통해 합성될 수 있음으로써 다양한 변형을 용이하게 수행할 수 있다. 상기 변형은 본 분야에 공지된 임의의 변형 방식을 사용할 수 있고, 예를 들어, 폴리A 테일을 사용하고, 5' 캡 유사체를 첨가하며, 5' 또는 3' 비번역 영역(UTR), 5' 또는 3' 말단은 포스포로티오에이트화 2'-O-메틸 뉴클레오티드를 포함하거나 포스파타제로 처리하여 5' 말단 인산에스테르를 제거하는 등을 사용할 수 있다.
일부 실시형태에서, 상기 gRNA를 코딩하는 뉴클레오티드 서열은 예를 들어 활성, 안정성 또는 특이성을 향상시키고, 전달을 변경하며, 숙주 세포에서의 선천적 면역 반응 감소 또는 다른 향상을 위해 사용될 수 있는 하나 이상의 변형을 포함한다.
일부 실시형태에서, gRNA를 코딩하는 뉴클레오티드 서열의 활성, 세포 분포 또는 세포 흡수를 향상시키는 하나 이상의 표적화 부분 또는 접합체는 gRNA에 화학적으로 연결된다. 상기 표적화 부분 또는 접합체는 기능성 그룹에 공유 결합된 접합체 그룹을 포함할 수 있고; 접합체 그룹은 리포터 분자, 폴리아민, 폴리에틸렌 글리콜을 포함한다. 일부 실시형태에서, 약력학 성질을 향상시키는 그룹을 gRNA에 연결하고, 약력학 성질을 향상시키는 그룹은 흡수를 개선하고, 분해에 대한 저항성을 향상시키고/시키거나 표적 핵산에 대한 서열 특이적 혼성화를 향상시키는 그룹을 포함한다.
본 발명에서, gRNA를 코딩하는 폴리뉴클레오티드를 포함하는 핵산은 핵산 모방체일 수 있다. 예를 들어 우수한 혼성화 성질을 갖는 폴리뉴클레오티드 모방체 펩티드 핵산 등이다.
본 발명에서, 상기 gRNA, 또는 gRNA를 코딩하는 폴리뉴클레오티드는 박테리아, 고세균, 진균, 원생생물, 식물 또는 동물을 포함하지만 이에 한정되지 않는 임의의 생물 또는 체외 환경에 적용된다. 이에 상응하여, 적합한 표적 세포는 박테리아 세포, 고세균 세포, 진균 세포, 원생생물 세포, 식물 세포 또는 동물 세포를 포함하지만 이에 한정되지 않는다. 적합한 표적 세포는 줄기세포, 체세포 등을 포함하는 임의의 유형의 세포일 수 있다.
본 발명은 또한 재조합 발현 벡터를 제공하고, 상기 발현 벡터는, (i) gRNA를 코딩하는 뉴클레오티드 서열, 및 (ii) C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함한다. 일 실시형태에서, 표적 유전자 내의 조절된 전사 부위는 상기 gRNA에 의해 결정된다.
본 발명은 또한 C2C9 뉴클레아제 기반의 CRISPR-C2C9 시스템을 제공하고, 상기 CRISPR-C2C9 시스템은, (a) 위에 기재된 바와 같은 C2C9 뉴클레아제 또는 위에 기재된 바와 같은 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드를 포함하는 핵산; 및/또는, (b) 위에 기재된 바와 같은 하나 이상의 gRNA 또는 상기 gRNA를 코딩하는 핵산을 포함한다. 여기서 상기 gRNA는 상기 C2C9 뉴클레아제을 표적 서열로 지시할 수 있다.
일부 실시형태에서, C2C9 뉴클레아제는 단백질로서 직접 제공되고, 예를 들어 스페로플라스트 형질전환을 사용하여 외인성 단백질 및/또는 핵산으로 진균을 형질전환시키는 방식일 수 있다. 주사 방식 등과같은 임의의 적합한 방법에 의해 C2C9 뉴클레아제가 세포에 도입될 수 있다.
본 발명에 따른 시스템에서, C2C9 뉴클레아제 및 gRNA는 숙주 세포에서 복합체를 형성하여 표적화 유전자(예: 표적화 DNA) 서열에서의 PAM 서열을 인식할 수 있고; 상기 CRISPR/C2C9 유전자 편집 시스템의 표적화 서열은 PAM 서열 이후 길이가 20bp인 핵산 단편(예: DNA 단편)이다. 일 실시형태에서, 상기 복합체는 숙주 세포에서 표적 DNA의 전사를 선택적으로 조절할 수 있다. CRISPR/C2C9 유전자 편집 시스템은 표적화 DNA의 이중 사슬을 절단하여 DNA 파손을 일으킬 수 있다. 표적화 사슬(gRNA와 상보적인 쌍을 이루는 DNA단일 사슬이고, Targeting strand 또는 TS 사슬이라고도 함)의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 21-22nt이고, 비표적 사슬(gRNA와 상보적인 쌍을 이루지 않는 DNA단일 사슬이고, Non-targeting strand 또는 NTS 사슬이라고도 함)의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 15-16nt이다.
일 실시형태에서, 상기 시스템은 gRNA 및 C2C9 뉴클레아제 복합체를 포함한다.
일 실시형태에서, 상기 시스템은 재조합 발현 벡터를 포함한다. 일 실시형태에서, 상기 시스템은 재조합 발현 벡터를 포함하고, 상기 재조합 발현 벡터는 (i) 및 (ii)를 포함하되, (i) gRNA를 코딩하는 뉴클레오티드 서열이되, 상기 gRNA는, (a) 표적 DNA의 서열에 상보적인 뉴클레오티드 서열을 포함하는 제1 세그먼트; 및 (b) C2C9 뉴클레아제와 상호작용하는 제2 세그먼트를 포함하고; 및 (ii) C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열이되, 상기 C2C9 뉴클레아제는, (a) 상기 gRNA와 상호작용하는 RNA-결합 부분; 및 (b) 표적 DNA 내에서 전사를 조절하는 활성 부분을 포함하되, 표적 DNA 내에서 조절된 전사 부위는 상기 gRNA에 의해 결정된다.
일부 실시형태에서, 상기 시스템은 서열번호 3으로 표시되는 C2C9 뉴클레아제를 포함한다(또는 이로 이루어짐). 일부 실시형태에서, 상기 시스템은 C2C9 뉴클레아제를 코딩하는 핵산을 포함하고, 상기 핵산은 서열번호 121 또는 서열번호 122와 적어도 약 90%(예: 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%) 서열 상동성을 갖는다. 일부 실시형태에서, 상기 시스템은 C2C9 뉴클레아제를 코딩하는 핵산을 포함하고, 상기 핵산은 서열번호 121 또는 서열번호 122의 서열을 포함한다(또는 이로 이루어짐). 일부 실시형태에서, 상기 시스템의 gRNA는 단일 gRNA(sgRNA)이다. 일부 실시형태에서, 상기 시스템은 하나 이상의 별도의 gRNA 또는 하나 이상의 별도의 gRNA를 코딩하는 핵산을 더 포함한다.
일부 실시형태에서, 상기 시스템은 세포 또는 체외 환경에서의 발현을 위한 적합한 프로모터 및/또는 적합한 핵 국소화 신호를 포함하고; 상기 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드 서열은 (i) 세포 또는 체외 환경에서의 발현을 위한 적합한 프로모터; 및/또는 (ii) 적합한 핵 국소화 신호에 작동 가능하게 연결된다.
일부 실시형태에서, 상기 시스템에서, 상기 gRNA를 코딩하는 폴리뉴클레오티드 서열은 (i) 세포 또는 체외 환경에서의 발현을 위한 적합한 프로모터; 및/또는 (ii) 적합한 핵 국소화 신호에 작동 가능하게 연결된다.
일부 실시형태에서, 본 발명은 시스템을 제공하고, 상기 시스템은, (a) 서열번호 3의 아미노산 서열 또는 서열번호 3과 적어도 90% 서열 상동성을 갖는 변이체를 포함하는 C2C9 뉴클레아제; 및 (b) 상기 C2C9 뉴클레아제 또는 이의 변이체를 표적 폴리뉴클레오티드 서열로 지시할 수 있는 gRNA를 포함한다.
일부 실시형태에서, 본 발명은 시스템을 제공하고, 상기 시스템은 (a) 및 (b)를 포함하되, (a) C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산이되, 상기 C2C9 뉴클레아제는 서열번호 3의 아미노산 서열 또는 서열번호 3과 적어도 90% 서열 상동성을 갖는 변이체를 포함하고; 상기 C2C9 뉴클레아제를 코딩하는 핵산은 서열번호 121 또는 서열번호 122의 폴리뉴클레오티드 서열 중 어느 하나 또는 서열번호 121 또는 서열번호 122의 폴리뉴클레오티드 서열 중 어느 하나와 적어도 90% 서열 상동성을 갖는 변이체을 포함하며; 및 (b) gRNA 또는 gRNA를 코딩하는 핵산이되, 상기 gRNA은 상기 C2C9 뉴클레아제 또는 이의 변이체를 표적 폴리뉴클레오티드 서열로 지시할 수 있다. 일부 실시형태에서, 상기 gRNA는 sgRNA이다.
본 발명에 따른 시스템은 1개의 gRNA를 포함하거나 복수의 gRNA를 동시에 포함할 수 있다. 일 실시형태에서, 상기 시스템은 동일한 표적 DNA 또는 상이한 표적 DNA 상의 상이한 위치를 동시에 변형하기 위해 복수의 gRNA를 동시에 포함한다. 일 실시형태에서, 2개 이상의 가이드 RNA는 동일한 유전자 또는 전사체 또는 유전자좌를 표적으로 한다. 일 실시형태에서, 2개 이상의 가이드 RNA는 상이한 무관한 유전자좌를 표적으로 한다. 일부 실시형태에서, 2개 이상의 가이드 RNA는 상이하지만 관련된 유전자좌를 표적으로 한다.
본 발명에 따른 시스템에서의 각 구성 부분은 벡터의 방식을 통해 운송될수 있다. 예를 들어, 폴리뉴클레오티드의 경우, 사용할 수 있는 방법은 나노입자, 리포솜, 리보핵단백질, 소분자 RNA-접합체, 키메라 및 RNA-융합 단백질 복합체 등을 포함하지만 이에 한정되지 않는다.
일부 실시형태에서, 상기 C2C9 또는 gRNA는 벡터 상에 구축될 수 있고, 코딩C2C9 및/또는 gRNA의 뉴클레오티드 서열은 프로모터와 같은 전사 제어 요소와 같은 제어 요소에 작동 가능하게 연결된다. 전사 제어 요소는 진핵 세포(예를 들어 포유동물 세포) 또는 원핵 세포(예를 들어 박테리아 또는 고세균 세포)에서 역할을 할 수 있다. 일부 실시형태에서, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 두 원핵 생물에서 가이드 RNA 및/또는 부위 지향적 변형 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 허용하는 복수의 제어 요소에 작동 가능하게 연결된다. 일부 실시형태에서, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 동일한 벡터 상에 구축된다. 일부 실시형태에서, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 상이한 벡터 상에 구축된다. 일부 실시형태에서, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 구성적 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열은 유도성 프로모터에 작동 가능하게 연결된다.
본 발명에 따른 시스템은 또한 하나 이상의 공여자 주형(Donor template)을 더 포함한다. 일부 실시형태에서, 상기 공여자 주형은 표적 유전자의 삽입을 위한 공여자 서열을 포함한다. 일부 실시형태에서, 상기 공여자 주형은 공여자 카세트를 포함하고, 상기 공여자 카세트의 일측 또는 양측 측면에 gRNA 표적 부위가 있다. 일부 실시형태에서, 상기 공여자 주형의 공여자 카세트는 양측 측면에 gRNA 표적 부위가 있되, 상기 공여자 주형의 gRNA 표적 부위는 상기 시스템에서 gRNA의 게놈 gRNA 표적 부위의 역보체 서열이다. 공여자 서열은 일반적으로 치환되는 게놈 서열 상이한데, 즉, 공여자 서열은 일반적으로 게놈 서열에 비해 염기 변경, 삽입, 결실, 역위 또는 재배열을 포함하고, 상동성 지시 복구를 뒷받침하기에 충분한 상동성이 존재한다. 공여자 서열은 단일 사슬 DNA, 단일 사슬 RNA, 이중 사슬 DNA 또는 이중 사슬 RNA일 수 있다. 일부 실시형태에서, 상기 공여자 서열은 외인성 서열이다. 일부 실시형태에서, 상기 공여자 서열은 공여자 DNA 서열(공여자 단일 사슬 또는 이중 사슬 DNA 포함)이되, 표적 DNA 서열은 상동성 지시 복구에 의해 편집된다. 일부 실시형태에서, 공여자 주형는 시스템의 gRNA에 물리적으로 연결된다. 일부 실시형태에서, 완전하거나 일부 또는 전부 결핍된 C2C9 뉴클레아제, 또는 gRNA는 공여자 주형에 연결되어 하나 이상의 gRNA 분자를 통해 하나 이상의 특정 표적 유전자(예: 표적 DNA) 부위로 지시함으로써 외인성 DNA 서열의 상동성 재조합을 촉진한다.
본 발명에 따른 시스템에서, 또한 이량체 FOK1 뉴클레아제를 더 포함할 수 있고, 완전하거나 일부 또는 전부 결핍된 C2C9 뉴클레아제 또는 gRNA을 이량체 FOK1 뉴클레아제에 연결시켜 하나 이상의 gRNA 분자에 의해 하나 이상의 특정 DNA 표적 부위로 지시되는 경우 엔도뉴클레아제 절단을 지시한다.
본 발명에 따른 시스템은 질병의 유전자 치료, 생물학적 연구, 농작물 저항성 개선 또는 생산량 향상 등을 포함하지만 이에 한정되지 않는 유전자 치료를 위해 세포의 복수의 위치에서 DNA를 편집 또는 변형할 수 있다.
본 발명에서, 상기 시스템은 임의의 생물 또는 체외 환경에 적용되고, 박테리아, 고세균, 진균, 원생생물, 식물 또는 동물을 포함하지만 이에 한정되지 않는다. 이에 상응하여, 적합한 표적 세포는 박테리아 세포, 고세균 세포, 진균 세포, 원생생물 세포, 식물 세포 또는 동물 세포를 포함하지만 이에 한정되지 않는다. 적합한 표적 세포는 줄기세포, 체세포 등을 포함하는 임의의 유형의 세포일 수 있다. 상기 세포는 체내 또는 체외일 수 있다.
본 발명은 또한 조성물을 제공하고, 상기 조성물은 상술한 바와 같은 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템 중 하나 이상을 포함하며, 허용 가능한 벡터, 매질 등을 더 포함할 수 있다. 상기 허용 가능한 벡터, 매질은 예를 들어 멸균수 또는 생리식염수, 안정제, 부형제, 항산화제(아스코르브산 등), 완충제(인산, 구연산, 다른 유기산 등), 방부제, 표면활성제(PEG, Tween 등), 킬레이트제(EDTA 등), 접착제 등이다. 그리고, 다른 저분자량의 폴리펩티드; 혈청 알부민, 젤라틴 또는 면역글로불린과 같은 단백질; 글리신, 글루타민, 아스파라긴, 아르기닌 및 라이신과 같은 아미노산; 다당 및 단당과 같은 당류 또는 탄수화물; 만니톨 또는 소르비톨과 같은 당알코올을 함유할 수도 있다. 생리식염수, D-소르비톨, D-만노스, D-만니톨, 염화나트륨과 같은 포동당 또는 다른 보조약물을 함유하는 등장액과 같은 주사용 수용액을 제조할 때 알코올(에탄올 등), 폴리올(프로필렌 글리콜, PEG 등), 비이온성 표면활성제(Tween 80, HCO-50) 등과 같은 적절한 가용화제를 병용할 수 있다. 일부 실시형태에서, 조성물은 gRNA 및 핵산 안정화를 위한 완충액을 포함한다.
본 발명은 또한 상술한 바와 같은 시스템 또는 조성물을 포함하는 키트를 제공한다. 상기 키트는 또한 희석 완충액; 세척 완충액; 대조 시약 등으로부터 선택되는 하나 이상의 추가 시약을 포함할 수 있다. 일부 실시형태에서, 상기 키트는, (a) 상술한 바에 따른 C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산; 및 (b) gRNA 또는 상기 gRNA를 코딩하는 핵산을 포함하되, 상기 gRNA는 상기 C2C9 뉴클레아제 또는 이의 변이체를 표적 폴리뉴클레오티드 서열로 지시할 수 있다. 일부 실시형태에서, 상기 키트는 이종 폴리뉴클레오티드 서열을 포함하는 공여자 주형을 더 포함하되, 상기 이종 폴리뉴클레오티드 서열은 상기 표적 폴리뉴클레오티드 서열에 삽입될 수 있다.
본 발명은 체내, 체외 세포 또는 무세포 시스템에서 상술한 바와 같은 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 및 키트의 다음 중 어느 하나의 용도를 제공하고, 상기 용도는,
표적 유전자 절단;
표적 유전자의 발현을 조종;
표적 유전자를 유전적으로 변형;
표적 유전자 관련 폴리펩티드를 유전적으로 변형;
표적 유전자의 임의의 필요한 위치에 의도적이고 통제된 손상을 위해;
표적 유전자의 임의의 필요한 위치에 의도적이고 통제된 복구를 위해;
이중 사슬 파손을 도입하는 것 이외의 방식으로 표적 유전자를 변형(C2C9 뉴클레아제는 효소 활성을 갖고, 이중 사슬 파손을 도입하는 것 이외의 방식으로 표적 유전자를 변형하며; 상기 효소 활성은 C2C9 자체에 의해 갖거나 예를 들어, 효소 활성을 갖는 이종 폴리펩티드를 C2C9 뉴클레아제에 융합하여 키메라 C2C9 뉴클레아제를 형성하여 얻어진 것일 수 있고, 상기 효소 활성은 메틸트랜스퍼라제 활성, 탈아미노화 활성, 디스무타제 활성, 알킬화 활성, 데메틸라제 활성, DNA 복구 활성, 트랜스포사제 활성, 재조합 효소 활성, DNA 손상 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성 등을 포함하지만 이에 한정되지 않음)을 포함하지만 이에 한정되지 않는다.
일부 실시형태에서, 상기 표적 유전자는 표적 DNA이다. 일부 실시형태에서, 상기 표적 유전자는 표적 RNA이다.
본 발명에서, C2C9 뉴클레아제의 다양한 잠재적 응용을 추가로 개발하기 위해 상기 C2C9는 다른 효소 성분 또는 다른 성분과 결합하여 사용될 수 있다. 비제한적 예로서, 예를 들어 비활성화된 C2C9와 염기 데아미나제를 융합하여 C2C9 뉴클레아제 기반의 단일 염기 편집 시스템을 개발하고; 비활성화된 C2C9와 역전사 효소를 융합하여 C2C9 뉴클레아제 기반의 Prime 편집 시스템을 개발하며; 비활성화된 C2C9와 전사 활성화 인자를 융합하여 C2C9 뉴클레아제 기반의 전사 활성화 시스템을 개발하고; 비활성화된 C2C9와 핵산 에피변형 효소를 융합하여 C2C9 뉴클레아제 기반의 에피변형 시스템을 개발하며; 비활성화된 C2C9를 이용하여 C2C9 뉴클레아제 기반의 전사 억제 시스템을 개발한다.
본 발명의 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 및 키트는 연구 분야, 진단 분야, 산업 분야(예를 들어 미생물 공학), 약물 발견(예를 들어 고처리량 스크리닝), 표적 확인, 영상학 분야 및 치료 분야 등에서 응용될 수 있다. 연구 분야에서의 응용은 예를 들어 조절 표적 핵산의 전사 증가가 발달, 성장, 대사(예: 특정 효소의 수준을 제어하여 생물 합성 경로를 정확하게 제어 및 조절함), 유전자 발현 등에 미치는 영향을 확정하는 것 일 수 있다.
본 발명에서, 상기 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 및 키트 등은 박테리아, 고세균, 진균, 원생생물, 식물 또는 동물을 포함하지만 이에 한정되지 않는 임의의 생물에 적용된다. 이에 상응하여, 적합한 표적 세포는 박테리아 세포, 고세균 세포, 진균 세포, 원생생물 세포, 식물 세포 또는 동물 세포(예를 들어 설치류 동물 세포, 인간 세포, 비인간 영장류 동물 세포)를 포함하지만 이에 한정되지 않는다. 적합한 표적 세포는 줄기세포, 체세포 등을 포함하는 임의의 유형의 세포일 수 있다.
본 발명에 따른 C2C9 뉴클레아제, gRNA, 시스템, 조성물 및 방법 등이 진핵 세포에 적용되는 경우, 예를 들어 포유동물 세포에 사용될 수 있다. 일부 실시형태에서, 상기 세포는 인간 태아 세포가 아니거나 인간 태아 세포로부터 유래되지 않는다. 일부 실시형태에서, 상기 세포는 인간 배아 세포가 아니거나 인간 배아 세포로부터 유래되지 않는다. 일부 실시형태에서, 본 발명은 인간 태아 또는 인간 배아의 파괴를 수반하지 않는다. 일부 실시형태에서, 상기 대상체 또는 개체는 인간 태아 또는 배아가 아니다.
본 발명에 따른 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 및 키트 등이 원핵 세포에 적용되는 경우, 예를 들어 대장균에 사용될 수 있다. 일부 실시형태에서, 박테리아 세포에서 유전자 발현을 끄는 데 사용된다. 일부 실시형태에서, 적합한 gRNA 및/또는 적합한 C2C9 뉴클레아제를 코딩하는 핵산을 표적 세포의 염색체로 도입하고, 상기 핵산은 유도성 프로모터의 제어 하에서 번역 및 발현되며; 여기서, 코딩된 gRNA 및 C2C9 뉴클레아제는 모두 복합체를 형성하여 표적 DNA의 관심 위치에서 절단을 수행한다. 따라서, 일부 실시형태에서, 공학 변형의 방식을 통해 박테리아 게놈은 적절한 C2C9 뉴클레아제을 코딩하는 핵산 서열 및/또는 플라스미드상의 적절한 gRNA를 포함하고, 유도성 프로모터의 제어하에 gRNA 및 C2C9 뉴클레아제의 발현을 유도하여 임의의 표적화 유전자의 발현을 제어한다. 일부 실시형태에서, C2C9 뉴클레아제는 효소 활성을 갖고, 이중 사슬 파손을 도입하는 것 의외의 방식으로 표적 DNA를 변형하며; 상기 효소 활성은 C2C9 자체에 의해 갖거나 예를 들어 효소 활성을 갖는 이종 폴리펩티드를 C2C9 뉴클레아제에 융합하여 키메라 C2C9 뉴클레아제를 형성하여 얻어진 것일 수 있고, 상기 효소 활성은 메틸트랜스퍼라제 활성, 탈아미노화 활성, 디스무타제 활성, 알킬화 활성, 데메틸라제 활성, DNA 복구 활성, 트랜스포사제 활성, 재조합 효소 활성, DNA 손상 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성 등을 포함하지만 이에 한정되지 않는다. 본 발명에서, 필요한 상보성 핵산 서열을 gRNA의 유전자 표적화 세그먼트 (예: DNA-표적화 세그먼트)에 유전 공학 변형함으로써 표적 유전자의 임의의 위치에서의 표적 유전자의 유전적으로 변형을 제어하는 데 사용될 수 있다. 본 발명에서, 필요한 상보성 핵산 서열을 C2C9에 유전 공학 변형함으로써 표적 유전자의 임의의 위치에서의 표적 핵산의 유전적으로 변형을 제어하는 데 사용될 수 있다. 일부 실시형태에서, 박테리아 표적 DNA 내의 임의의 필요한 위치에서 DNA의 의도적이고 통제된 손상에 응용된다. 일부 실시형태에서, 박테리아 표적 DNA 내의 임의의 필요한 위치에서 DNA의 서열 특이적 및 제어된 복구에 사용된다.
본 발명은 또한 세포에서 또는 체내, 체외 세포 또는 무세포 시스템에서 표적 유전자(예: 표적 DNA)를 표적화, 편집, 변형 또는 조작하는 방법을 제공하고, 상기 방법은, 상술한 바와 같은 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 등을 키트에 도입하여 체내, 체외 세포 또는 무세포 시스템에서 표적 유전자를 표적화, 편집, 변형 또는 조작하는 단계를 포함한다.
일 실시형태에서, 상기 방법은,
(a) 상기 C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산을 체내, 체외 세포 또는 무세포 시스템에 도입하는 단계; 및
(b) 상기 gRNA(sgRNA) 또는 이러한 sgRNA의 제자리 생성에 적합한 핵산(예를 들어, DNA)을 도입하는 단계; 및
(c) 세포 또는 표적 유전자를 C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산, gRNA(sgRNA) 또는 이러한 sgRNA의 제자리 생성에 적합한 핵산에 접촉시켜 상기 표적 유전자에서 하나 이상의 절단, 닉 또는 편집을 생성하는 단계를 포함하되; 상기 C2C9 뉴클레아제는 이의 가공되거나 가공되지 않은 형태의 gRNA를 통해 상기 표적 유전자로 지시된다.
일부 실시형태에서, 상기 표적 유전자는 표적 DNA이다. 일부 실시형태에서, 표적 DNA는 DNA 관련 단백질에 결합하지 않은 체외 벌거벗은 DNA일 수 있다. 일부 실시형태에서, 표적 DNA는 체외 세포의 염색체 DNA이다. 일부 실시형태에서, 상기 표적 유전자는 표적 RNA이다. 일부 실시형태에서, 표적 DNA를 상기 C2C9 뉴클레아제 및 gRNA를 포함하는 표적화 복합체에 접촉시키고, gRNA는 표적 DNA에 상보적인 뉴클레오티드 서열을 포함함으로써 표적화 복합체에 표적 특이성을 제공하고; C2C9 뉴클레아제는 부위 특이적 활성을 제공한다. 일부 실시형태에서, 표적화 복합체는 표적 DNA를 변형함으로써 예를 들어 DNA 절단, DNA 메틸화 작용, DNA 손상, DNA 복구 등을 초래한다. 일부 실시형태에서, 표적화 복합체는 표적 DNA와 관련된 폴리펩티드(예를 들어, 히스톤, DNA-결합 단백질 등)를 변형함으로써 예를 들어 표적 DNA 관련 폴리펩티드-히스톤의 메틸화, 히스톤 아세틸화, 히스톤 유비퀴틴화 등을 초래한다.
본 발명에 따른 방법에서, 체내에 응용되는 경우, C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물 및/또는 공여자 폴리뉴클레오티드를 개체에 직접 투여한다.
본 발명에 따른 방법에서, C2C9 뉴클레아제 또는 C2C9 뉴클레아제의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 공지된 방법에 의해 세포에 도입할 수 있다. 마찬가지로, gRNA 또는 gRNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 공지된 방법에 의해 세포에 도입할 수 있다. 공지된 방법은, DEAE-덱스트란 매개 형질감염, 리포솜 매개 형질감염, 바이러스 또는 파지 감염, 리포펙션법, 형질감염, 접합, 원형질체 융합, 폴리에틸렌이민 매개 형질감염, 전기천공, 인산칼슘 침전, 유전자총, 인산칼슘 침전, 미세주입, 나노입자 매개 핵산 전달 등을 포함한다. 예를 들어 전기천공, 염화칼슘 형질감염, 미세주입 및 리포펙션법 등에 의해 플라스미드를 전달한다. 바이러스 벡터 전달의 경우, 세포를 gRNA 및/또는 C2C9 뉴클레아제 및/또는 키메라 C2C9 뉴클레아제를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 포함하는 바이러스 입자와 접촉시킨다.
일부 실시형태에서, 본 발명에 따른 방법에서, 뉴클레아제는 세포의 표적 DNA를 절단하여 이중 사슬 파손을 생성한 다음 일반적으로 비상동성 말단 연결(NHEJ) 및 상동성 지시 복구의 방식으로 세포에 의해 복구된다.
비상동성 말단 연결에서, 파손 말단을 서로 직접 연결하여 이중 사슬 파손을 복구한다. 상기 과정에서, 절단 부위에 소수의 염기쌍이 삽입되거나 결실된다. 따라서, C2C9 뉴클레아제에 의한 DNA 절단은 표적 DNA 서열을 절단하고 세포가 외인성으로 제공된 공여자 폴리뉴클레오티드 없이 상기 서열을 복구하여 표적 DNA 서열로부터 핵산 물질을 삭제하는 데 사용될 수 있다. 따라서, 상기 방법은 유전자 녹아웃 또는 표적 DNA의 선택된 유전자좌에 유전 물질을 녹인시키는 데 사용될 수 있다.
상동성 지시 복구에서, 절단된 표적 DNA 서열과 상동성을 갖은 공여자 폴리뉴클레오티드가 절단된 표적 DNA 서열의 복구를 위한 주형으로 사용됨으로써, 유전 정보가 공여자 폴리뉴클레오티드에서 표적 DNA로 전달된다. 따라서, 새로운 핵산 물질이 부위에 삽입/복사될 수 있다. 일부 실시형태에서, 표적 DNA는 공여자 폴리뉴클레오티드에 접촉된다. 일부 실시형태에서, 공여자 폴리뉴클레오티드가 세포에 도입된다. NHEJ 및/또는 상동성 지시 복구로 인한 표적 DNA의 변형은 예를 들어 유전자 교정, 유전자 치환, 이식유전자 삽입, 뉴클레오티드 결실, 뉴클레오티드 삽입, 유전자 파괴, 유전자 돌연변이, 서열 치환 등을 초래한다.
일부 실시형태에서, 표적 유전자를 포함하는 세포는 체외에 있다. 일부 실시형태에서, 표적 유전자를 포함하는 세포는 체내에 있다. gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 적합한 핵산은 발현 벡터를 포함하되, gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 발현 벡터는 재조합 발현 벡터이다. 일부 실시형태에서, 상기 방법은 동일하거나 상이한 재조합 벡터를 통해 C2C9 뉴클레아제 및 하나 이상의 gRNA(gRNA)를 세포에 도입하여, 세포를 gRNA 및/또는 C2C9 뉴클레아제를 코딩하는 폴리뉴클레오티드를 포함하는 벡터와 접촉시켜 벡터가 세포에 의해 흡수되도록 한다.
본 발명의 상기 방법은 또한 세포의 복수의 위치에서 DNA를 편집 또는 변형하는 데 사용될 수 있다.
본 발명의 상기 방법은 또한 표적 DNA의 전사를 조절하는 데 사용될 수 있다.
일부 실시형태에서, 본 발명에서 제공하는 방법에 있어서, 완전하거나 일부 또는 전부 결핍된 C2C9 뉴클레아제 또는 gRNA 부분을 이량체 FOK1 뉴클레아제에 연결하여 하나 이상의 crRNA 분자를 통해 하나 이상의 특정 DNA 표적 부위로 지시하는 경우 엔도뉴클레아제 절단을 지시하는 단계를 포함한다. 다른 일부 실시형태에서, 본 발명에서 제공하는 방법에 있어서, 이량체 FOK1 뉴클레아제에 연결된 C2C9 뉴클레아제는 세포로 진입한 RNA로서 2개 이상을 포함하거나 DNA로 코딩되고 1개의 프로모터 제어 하에 있는 gRNA와 함께 세포로 도입되며, 각각의 gRNA는 반복 서열 스페이서 어레이를 포함하되, 상기 스페이서는 DNA의 표적 서열에 상보적인 핵산 서열을 포함하고, 상기 반복 서열은 스템-루프 구조를 포함한다. 일부 실시형태에서, 본 발명에서 제공하는 방법은, 완전하거나 일부 또는 전부 결핍된 C2C9 뉴클레아제 gRNA를 공여자 단일 사슬 또는 이중 사슬 DNA 공여자 주형에 연결시켜 하나 이상의 gRNA 분자를 통해 하나 이상의 특정 DNA 표적 부위로 지시함으로써 외인성 DNA 서열의 상동성 재조합을 촉진하는 단계를 포함한다.
본 발명은 또한 표적 유전자-관련 폴리펩티드를 위한 방법을 제공하고, 상기 방법은 표적 유전자를 표적화 복합체에 접촉시키는 단계를 포함하며, 상기 표적 복합체는 상술한 C2C9 뉴클레아제 또는 C2C9 뉴클레아제를 코딩하는 핵산, 및 gRNA를 포함하거나 이러한 sgRNA의 제자리 생성에 적합한 핵산에 접촉한다.
일부 실시형태에서, 표적 유전자-관련 폴리펩티드는 히스톤, DNA-결합 단백질 등이다. 일부 실시형태에서, 표적화 복합체는 표적 DNA와 관련된 폴리펩티드를 변형함으로써 예를 들어 표적 DNA 관련 폴리펩티드의 히스톤의 메틸화, 히스톤 아세틸화, 히스톤 유비퀴틴화 등을 초래한다.
일부 실시형태에서, 상기 표적 유전자는 표적 DNA이다. 일부 실시형태에서, 표적 DNA는 체외 세포의 염색체 DNA이다. 일부 실시형태에서, 표적 DNA는 체내 세포의 염색체 DNA 등이다. 일부 실시형태에서, 상기 표적 유전자는 표적 RNA이다. 일부 실시형태에서, 표적 DNA을 상기 C2C9 뉴클레아제 및 gRNA를 포함하는 표적화 복합체에 접촉시고, gRNA 및 C2C9 뉴클레아제는 복합체를 형성하며, gRNA는 표적 DNA에 상보적인 뉴클레오티드 서열을 포함함으로써 표적화 복합체에 표적 특이성을 제공하고; C2C9 뉴클레아제는 부위 특이적 활성을 제공한다. 일부 실시형태에서, C2C9 뉴클레아제 기반의 CRISPR-C2C9 시스템에서 변형된 폴리뉴클레오티드를 사용하여, 세포 내로 도입된 C2C9 뉴클레아제를 코딩하는 DNA 또는 RNA 및/또는 gRNA를 변형하여 임의의 하나 이상의 게놈 유전자좌를 편집한다.
본 발명은 또한 세포를 제공하고, 상기 C2C9 뉴클레아제 또는 이를 코딩하는 폴리뉴클레오티드, gRNA 또는 이를 코딩하는 폴리뉴클레오티드, 재조합 발현 벡터, 시스템, 조성물로의 숙주 세포에 대한 유전적으로 변형을 포함한다.
본 발명에서, gRNA 및/또는 C2C9 뉴클레아제 및/또는 재조합 발현 벡터 및/또는 공여자 폴리뉴클레오티드의 유효량은 당업자에게 있어서 일반적인 것이다. 이는 상이한 투여 경로 및 치료되는 병증의 특성에 따라 결정된다.
C2C9 뉴클레아제는 출원인이 발견한 CRISPR유전자 편집 시스템에 적합한 신규 뉴클레아제이고, 대응되는 가이드 RNA의 안내 하에 표적 유전자에 정확하게 위치 지정되어 게놈 DNA 절단하고, 게놈 DNA 이중 사슬 파손을 구현할 수 있다. C2C9 뉴클레아제 변이체는 상이한 또는 유리한 특징을 가질 수 있다. 이러한 C2C9 뉴클레아제 및 이의 변이체는 이전에는 존재하지 않았던 게놈 편집의 다른 기회를 제공한다. C2C9 뉴클레아제 및 이의 변이체는 이들을 사용하는 시스템에 따라 상이한 활성을 가질수 있다. C2C9는 분자량이 Cas9 및 Cas12a의 절반 이하에 불과하지만 C2C9는 Cas9 및 Cas12a와 가깝거나 유사한 게놈 절단 효율을 가져 원핵 박테리아 및 진핵 세포에서 효율적인 게놈 편집을 구현할 수 있음으로써 생물 기술 및 유전자 치료와 같은 분야에서 매우 큰 응용 전망을 가진다.
본 발명에서 제공하는 C2C9 뉴클레아제는 보고된 CRISPR-Cas 엔도뉴클레아제에 비해 유리한 특성, 예를 들어 원핵, 진핵 및/또는 체외 환경에서 더 높은 활성을 나타낼 수 있다. 일부 실시형태에서, C2C9는 작은 크기, 높은 편집 활성, 및 짧은 PAM 서열만 필요한 것 중 하나 이상을 조합한다. 본 발명에서 RNA-지시 뉴클레아제에 관한 작은 크기는 길이가 약 800개의 아미노산 이하인 뉴클레아제를 의미한다.
본 발명에서, 상기 박테리아 또는 원핵 박테리아는 대장균, 클렙시엘라 뉴모니아(Klebsiella pneumoniae), 박테로이데스 오바투스(Bacteroides ovatus), 캄필로박터 제주니(Campylobacter jejuni), 스타필로코커스 사프로피티쿠스(Staphylococcus saprophyticus), 엔테로코쿠스 패칼리스(Enterococcus faecalis), 박테로이데스 테타이오타오마이크론(Bacteroides thetaiotaomicron), 박테로이데스 불가리스(Bacteroides vulgaris), 박테로이데스 모노모르파(Bacteroides monomorpha), 락토바실러스 카제이(Lactobacillus casei), 박테로이데스 프라길리스(Bacteroides fragilis), 아시네토박터 루테리(Acinetobacter reuteri), 푸소박테리움 뉴클레아툼(Fusobacterium nucleatum), 박테로이데스 존소니(Bacteroides johnsonii), 박테로이데스 아라비돕시스 탈리아나(Bacteroides arabidopsis thaliana), 락토바실루스 람노서스(Lactobacillus rhamnosus), 박테로이데스 마르세레이(Bacteroides marseiliensis), 파라박테로이데스 패칼리스(Parabacteroides faecalis), 푸소박테리움 모템(Fusobacterium mortem) 및 비피도박테리움 브레브(Bifidobacterium breve) 등일 수 있다.
본 발명에서, 상기 진핵 세포는 포유동물 세포, 진균과 같은 진핵 생물세포를 포함하지만 이에 한정되지 않는다. 상기 진균은 효모, 아스페르길루스(Aspergillus)를 포함하고, 예를 들어 사카로미세스 세레비시아(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 피키아 파스토리스(Pichia pastoris), 클루이베로마이세스 프라질리스(Kluyveromyces fragilis), 클루이베로마이세스 락티스(Kluyveromyces lactis), 및 스키조사카로미세스 폼베(Scyzosaccharomyces pombe), 칸디다 알비칸스(Candida albicans), 칸디다 도노바니(Candida donovani), 칸디다 글라브라타(Candida glabrata), 칸디다 지예멍(Candida jiyemeng), 칸디다 락티스(Candida lactis), 칸디다 크루세이(Candida krusei), 칸디다 루시타니아(Candida lusitaniae), 칸디다 멜린(Candida Merlin), 칸디다 올레오필라(Candida oleophila), 칸디다 파라프실증(Candida parapsilosis), 칸디다 트로피컬리스(candida tropicalis) 및 칸디다 유틸리스(Candida utilis), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 플라부스(Aspergillus flavus), 아스페르길루스 니제르(Aspergillus niger), 아스페르길루스 클라불라투스(Aspergillus clavulatus), 아스페르길루스 그리세우스 그룹(Aspergillus griseus group), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 오리제(Aspergillus oryzae), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 파이로준(Aspergillus pyrozoon) 및 아스페르길루스 베르시컬러(Aspergillus versicolor) 등일 수 있다.
본 발명의 실시예에서, 극소형 CRISPR/C2C9 뉴클레아제 기반의 신규 게놈 편집 방법을 개시한다. 본 발명은 가이드 RNA의 안내 및 위치 지정 기능을 통해 C2C9는 게놈 DNA를 정확하게 절단하고, 게놈 DNA 이중 사슬 파손을 구현할 수 있다. 숙주 세포 자체 또는 외인성 복구 메커니즘을 이용하여 상기 시스템은 살아있는 세포 내에서 유전자 편집을 효율적이고 정확하게 구현할 수 있음을 나타낸다.
이하, 실시예를 결부하여 본 발명의 실시형태를 명확하고 완전하게 기재할 것인데, 기재된 실시예는 본 발명의 일부 실시예를 설명하기 위한 것일 뿐 본 발명의 범위를 한정하는 것으로 간주되어서는 안 됨은 분명하다. 실시예에서 구체적인 조건을 명시하지 않은 것은 일반적인 조건 또는 제조업체가 권장하는 조건을 따라 수행한다. 사용된 시약이나 기구의 생산 제조사가 명시되지 않은 것은 상업적 구매를 통해 얻은 일반적인 제품으로 간주된다.
각 실시예에서 사용된 생물학적 물질의 출처는 다음과 같다.
클렙시엘라 뉴모니아 NCTC9633 균주(미국 ATCC사에서 구입, Cat. No.: 13883); 컴피턴트 대장균 DH5α 균주(Kangwei Century Biotechnology Co., Ltd.)에서 구입, Cat. No.: CW0808S). 각 실시예에서 사용된 LB 액체 배지는 Sangon Bioengineering (Shanghai) Co., Ltd.에서 구입하고, Cat. No.: A507002-0250이며; LB 고체 배지는 Sangon Bioengineering (Shanghai) Co., Ltd.에서 구입하고, Cat. No.: A507003-0250이며; 아프라마이신(abramycin)은 미국 BioVision사에서 구입하고, Cat. No.: B1521-1G이며; 카나마이신(kanamycin)은 Shanghai Aladdin Biotech Co., Ltd.에서 구입하고, Cat. No.: K103024-5g이다.
실시예 1: AcC2C9의 전방 영역 서열 인접 모티브(PAM) 동정 플라스미드 p15a-AcC2C9Control 및 p15a-AcC2C9PAM의 구축
(1.1) p15a-AcC2C9Control 플라스미드 서열은 서열번호 124이고, 그 구체적인 구축 방법은 다음과 같다.
Sangon Bioengineering (Shanghai) Co., Ltd.에서 AcC2C9 뉴클레아제 및 이에 대응되는 가이드 RNA 발현 카세트의 DNA 서열(그 서열은 서열번호 125) 및 p15a 플라스미드 골격(그 서열은 서열번호 126)을 전체 유전자 합성하였다. Gibson assembly 기술을 사용하여 이러한 2개의 DNA 단편을 p15a-AcC2C9Control 플라스미드로 조립하였다. 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고 75μg/mL의 아프라마이신을 갖는 LB 배지 플레이트에 도말한 후 스크리닝하였다. 단클론을 선택한 후 확대 배양하고, 플라스미드를 추출하며, 동정 플라스미드 서열을 시퀀싱한 후 p15a-AcC2C9Control 플라스미드를 얻었다.
(1.2) p15a-AcC2C9PAM 플라스미드 서열은 서열번호 127이고, 그 구체적인 구축 방법은 다음과 같다.
Sangon Bioengineering (Shanghai) Co., Ltd.에서 다음 두 개의 프라이머를 합성하였다.
PAMprimerF: 5'-atcgTGTCCTCTTCCTCTTTAGCG-3'(서열번호 128)
PAMprimerR: 5'-ggccCGCTAAAGAGGAAGAGGACA-3'(서열번호 129)
상기 두 개의 프라이머를 어닐링하고, 구체적인 반응계는 5μl 10ХT4 DNA ligase Buffer(NEB사), 10μLPAM primerF(10μM), 10μLPAM primerR(10μM), 25μL ddH2O였다. 95℃에서 5분 동안 가열한 다음 1~2시간 내에 천천히 실온으로 낮추어 두 개의 단일 사슬 프라이머가 염기쌍을 이루어 이중 사슬 DNA를 형성하도록 하였다. 그런 다음 ddH2O로 얻은 생성물을 20배 희석하였다.
상기 얻은 이중 사슬 DNA를 Golden Gate 기술을 통해 p15a-AcC2C9Control 플라스미드의 BsaI 부위에 삽입하고, 구체적인 반응계는 1μL 10ХT4 DNA ligase Buffer, 1μL의 상기 20배 희석된 인산화 이중 사슬 DNA, 20fmolp15a-AcC2C9Control 플라스미드, 0.5μL T4 DNA ligase(400units/μL), 0.5μL BsaI-HF(20units/μL)이고, 마지막으로 총 부피가 10μL가 될 때까지 ddH2O를 적당량 첨가하였다. 상기 반응에서 사용된 Buffer 및 효소는 모두 NEB사에서 생산한 것이다. PCR기에서 37℃ 2분; 16℃ 5분, 총 25개 주기; 그 다음 80℃ 15분의 주기로 반응시켰다.
상기 10μL의 반응 생성물을 대장균 컴피턴트 DH5α 균주로 형질전환하고, 75μg/mL의 아프라마이신을 함유한 LB 고체 배양 플레이트에 플레이팅하였다. 형질전환 용액이 고체 배양 플레이트에 의해 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 배지에서 성장한 형질전환 균주를 옮겨 보관하고, 동시에 플라스미드를 추출하여 Sangon Bioengineering (Shanghai) Co., Ltd.에 보내 시퀀싱 검증을 수행하여 최종적으로 p15a-AcC2C9PAM 플라스미드를 얻었다.
실시예 2: PAM 동정을 위한 기질 플라스미드 pUC19-6N-library의 구축
pUC19-6N-library플라스미드 서열은 서열번호 130이고, 그 구체적인 구축 방법은 다음과 같다.
제품 pUC19 플라스미드를 주형으로 6N의 랜덤 서열을 갖는 프라이머 6N-F(그 서열은 서열번호 131) 및 일반 프라이머 6N-R(그 서열은 서열번호 132)을 사용하여 원형 중합효소 연장 클로닝(circular polymerase extension cloning)을 수행하였다. PCR 생성물을 DpnI 소화처리시킨 후 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고, 카르베니실린을 갖는 LBA 플레이트를 도말한 후 스프레더로 긁어 100,000개 이상의 단클론을 수집하며, 혼합한 후 플라스미드를 추출하여 PAM 동정 기질 플라스미드 pUC19-6N-library를 얻었다.
실시예 3: AcC2C9의 PAM 동정
실시예 1에서 구축된 p15a-AcC2C9Control 플라스미드를 대장균 DH5α 제품 컴피턴트 세포로 형질전환한 다음 75μg/mL의 아프라마이신을 함유한 LB 고체 플레이트에 도말하였다. 다음날 단클론을 선택하여 100mL의 신선한 LB 액체 배지에서 배양하고, OD600=0.5일 때 박테리아를 수집한 후 얼음 위에서 미리 냉각된 멸균 10%v/v 글리세린을 사용하여 균체를 2회 세척하며, 최종적으로 1mL의 멸균 10%v/v 글리세린 용액으로 박테리아를 재현탁하여 p15a-AcC2C9Control 플라스미드를 갖는 DH5α 컴피턴트 세포를 얻었다.
실시예 1에서 구축된 p15a-AcC2C9PAM 플라스미드를 갖는 DH5α 컴피턴트 세포를 제조하고, 그 제조 과정은 상기 p15a-AcC2C9Control 플라스미드를 갖는 DH5α 컴피턴트 세포의 제조 과정과 동일하다.
100ng의 실시예 2에서 구축된 pUC19-6N-library플라스미드를 취하고, p15a-AcC2C9Control 플라스미드를 갖는 DH5α 컴피턴트 세포에 전기 전달하며, 50μg/mL의 카르베니실린 및 75μg/mL의 아프라마이신을 갖는 LB 고체 플레이트에 도말하였다. 각각 스프레더로 긁어 100,000개 이상의 단클론을 수집하며, 혼합한 후 플라스미드를 추출하여 대조 라이브러리(control library)를 얻었다.
100ng의 실시예 2에서 구축된 pUC19-6N-library플라스미드를 취하고, p15a-AcC2C9PAM 플라스미드를 갖는 DH5α 컴피턴트 세포에 전기 전달하며, AcC2C9의 PAM 결실 라이브러리(PAM depletion library)를 제조하였다. 그 제조 과정은 대조 라이브러리의 단계와 동일하다.
각각 control library 및 PAM depletion library를 주형으로 하고, 프라이머 PAM-1F(그 서열은 서열번호 133) 및 PAM-1R(그 서열은 서열번호 134)을 사용하여 제1 라운드 PCR을 수행하며, 전기영동으로 생성물을 검출한 다음 1μL의 제1 라운드 PCR 생성물을 취하여 주형으로 하고, 프라이머 PAM-2F(그 서열은 서열번호 135) 및 PAM-2R(그 서열은 서열번호 136)을 사용하여 제2 라운드 PCR을 수행하며, 전기영동으로 생성물을 검출하였다. 각각 VAHTS DNA Clean Beads 자기 비드(Novizan Biotechnology Co., Ltd.)를 사용하여 생성물을 정제하였다. 각각 Illumina Hiseq2500 플랫폼을 사용하여 고처리량 시퀀싱을 수행하고, 각각 1Gb의 원시 데이터를 얻으며, 6N의 랜덤 서열 정보를 추출하며, PAM depletion library의 서열 빈도로 control library의 서열 빈도을 비교하고, 웹로그(weblogo)를 구축함으로써 AcC2C9 선호 PAM 정보를 얻었다.
도 1은 AcC2C9의 PAM의 동정 과정 및 결과 차트이다. 결과는, AcC2C9는 5'-AAN 유형의 PAM 서열 및 소수의 5'-GAN 서열(여기서 N은 A, T, C 또는 G 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있는 것으로 나타났다. 여기서, 횡좌표-1, -2, -3, -4, -5, -6은 각각 NTS 사슬(비표적 사슬)에서 표적화-DNA 세그먼트 서열의 5' 말단의 상류에 위치한 1번째, 2번째, 3번째, 4번째, 5번째 및 6번째 DNA 염기를 나타내고; 위의 문자는 DNA 서열에 대한 AcC2C9 뉴클레아제의 선호도를 나타내며, 문자가 차지하는 비중이 클수록, 상기 염기에 대한 AcC2C9의 선호도가 더 강함을 나타낸다.
실시예 4: CgC2C9, RdC2C9 및 MiC2C9의 PAM 동정
CgC2C9, RdC2C9와 MliC2C9의 PAM 동정 단계는 AcC2C9와 유사하다.
Sangon Bioengineering (Shanghai) Co., Ltd.에서 CgC2C9, RdC2C9와 MiC2C9 뉴클레아제 및 이에 대응되는 가이드 RNA 발현 카세트의 DNA 서열(그 서열은 서열번호 137-139)을 전체 유전자 합성하였다. Gibson assembly 기술을 사용하여 이러한 3개의 뉴클레아제DNA 단편과 p15a 플라스미드 골격(그 서열은 서열번호 126)을 각각 p15a-CgC2C9Control(그 서열은 서열번호 140), p15a-RdC2C9Control(그 서열은 서열번호 141) 및 p15a-MiC2C9Control(그 서열은 서열번호 142)로 조립하였다. 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고, 75μg/mL의 아프라마이신을 갖는 LB 배지 플레이트에 도말한 후 스크리닝하였다. 단클론을 선택한 후 확대 배양하고 플라스미드를 추출하며 동정 플라스미드 서열을 시퀀싱하였다.
Sangon Bioengineering (Shanghai) Co., Ltd.에 맡겨 다음 프라이머를 합성하였다.
CgPAMprimerF: 5'-tcccTGTCCTCTTCCTCTTTAGCG-3'(서열번호 143)
RdPAMprimerF: 5'-ttccTGTCCTCTTCCTCTTTAGCG-3'(서열번호 144)
MiPAMprimerF: 5'-gcctTGTCCTCTTCCTCTTTAGCG-3'(서열번호 145)
CgC2C9, RdC2C9와 MiC2C9에 대응되는 프라이머을 각각 PAMprimerR: 5'-ggccCGCTAAAGAGGAAGAGGACA-3'(서열번호 129)와 어닐링하고, 구체적인 반응계는 5μl 10ХT4 DNA ligase Buffer(NEB사), 10μL primerF(10μM), 10μL primerR(10μM), 25μL ddH2O였다. 95℃에서 5분 동안 가열한 다음 1~2시간 내에 천천히 실온으로 낮추어 두 개의 단일 사슬 프라이머가 염기쌍을 이루어 이중 사슬 DNA를 형성하도록 하였다. 그런 다음 ddH2O로 얻은 생성물을 20배 희석하였다. 상기 얻은 이중 사슬 DNA를 각각 Golden Gate 기술을 통해 p15a-CgC2C9Control, p15a-RdC2C9Control 및 p15a-MiC2C9Control 플라스미드의 BsaI 부위에 삽입하고, 구체적인 반응계는 1μL 10ХT4 DNA ligase Buffer, 1μL의 상기 20배 희석된 인산화 이중 사슬 DNA, 20fmol플라스미드, 0.5μL T4 DNA ligase(400units/μL), 0.5μL BsaI-HF(20units/μL)이고, 마지막으로 총 부피가 10μL가 될 때까지 ddH2O를 적당량 첨가하였다. 상기 반응에서 사용된 Buffer 및 효소는 모두 NEB사에서 생산한 것이다. PCR기에서 37℃에서 2분; 16℃에서 5분, 총 25개 주기; 그 다음 80℃에서 15분의 주기로 반응시켰다. 상기 10μL의 반응 생성물을 대장균 컴피턴트 DH5α 균주로 형질전환하고, 75μg/mL의 아프라마이신을 함유한 LB 고체 배양 플레이트에 플레이팅하였다. 형질전환 용액이 고체 배양 플레이트에 의해 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 배지에서 성장한 형질전환 균주를 옮겨 보관하고, 동시에 플라스미드를 추출하여 Sangon Bioengineering (Shanghai) Co., Ltd.에 보내 시퀀싱 검증을 수행하여, 최종적으로 p15a-CgC2C9PAM(그 서열은 서열번호 146), p15a-RdC2C9PAM(그 서열은 서열번호 147), 및 p15a-MiC2C9PAM(그 서열은 서열번호 148) 플라스미드를 얻었다.
CgC2C9, RdC2C9 및 MiC2C9의 PAM 선호도를 동정하였다. 그 조작 단계는 실시예 3의 AcC2C9의 PAM 동정 단계와 완전히 동일하다.
도 2는 CgC2C9, RdC2C9 및 MiC2C9의 PAM 동정 결과 차트이다. 결과는, CgC2C9(A)는 5'-AAS 유형의 PAM 서열(여기서 S는 C 또는 G 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있고, RdC2C9(B) 및 MiC2C9(C)는 5'-AAH 유형의 PAM 서열(여기서 N은 A, T또는 C 중 어느 하나의 염기를 나타내는 축퇴 염기임)을 효과적으로 인식할 수 있는 것으로 나타났다.
실시예 5: 클렙시엘라 뉴모니아 게놈 편집을 위한 p15a-AcC2C9와 pSGKP-AcC2C9 플라스미드 구축
p15a-AcC2C9 플라스미드 서열은 서열번호 149이고, 그 구체적인 구축 방법은 다음과 같다.
실시예 1의 p15a-AcC2C9Control 플라스미드를 주형으로 하고, AcC2C9 뉴클레아제 유전자 및 p15a 플라스미드 골격을 각각 증폭하였다.
AcC2C9 뉴클레아제 유전자 5' 프라이머 서열 AcC2C9F 증폭:
tcatctgtgcatatagctatactgatttcgtcagactcaca(서열번호 150)
AcC2C9 뉴클레아제 유전자 3' 프라이머 서열 ACC2C9R 증폭:
cgccaaccagccaCCTTATTGACCTGCACCGCTATG(서열번호 151)
p15a 플라스미드 골격5' 프라이머 서열 p15aF 증폭:
CAGGTCAATAAGGtggctggttggcgtactgtt(서열번호 152)
p15a 플라스미드 골격3' 프라이머 서열 p15aR 증폭:
atcagtatagctatatgcacagatgaaaacggtgtaaaaaaga(서열번호 153)
Novizan사의 Phanta Max Master Mix 시약을 사용하여 AcC2C9 유전자 단편 및 p15a 플라스미드 골격을 각각 증폭하고, 반응계는 다음과 같다. 25μL 2xPhanta Max Master Mix, 1.5μL5'Primer(10μM), 1.5μL 3'Primer(10μM), 0.5μl의 주형 DNA(100ng/μL), 1.5μL DMSO, 20μL ddH2O. PCR 반응계가 준비된 후 중합효소 연쇄 반응(PCR)을 수행하고, 그 주기는 98℃에서 2분; 그 다음 98℃에서 20초, 55℃에서 20초, 72℃에서 3분, 총 30개 주기; 마지막으로 72℃에서 5분이었다. Sangon Bioengineering (Shanghai) Co., Ltd.가 생산한 SanPrep 컬럼 PCR 생성물 정제 키트를 사용하여 PCR 생성물을 각각 회수하였다. PCR 생성물 정제의 구체적인 단계는 키트 사용 조작 매뉴얼에 따라 수행하였다.
얻은 AcC2C9 유전자 단편 및 p15a 플라스미드 골격을 Gibson Assembly를 통해 하나의 플라스미드로 조립하였다. 구체적인 반응계는 다음과 같다. 5μLNEBuilderHiFi DNA Assembly Master Mix(NEB사), 20fmol AcC2C9 유전자 단편, 20fmol p15a 플라스미드 골격, 총 부피가 10μL가 될 때까지 ddH2O를 적당량 첨가하였다. 50℃에서 1시간 동안 반응시켰다. 10μL의 반응 생성물을 대장균 컴피턴트 DH5α 균주로 형질전환하고, 75μg/mL의 아프라마이신을 함유한 LB 고체 배양 플레이트에 플레이팅하였다. 형질전환 용액이 고체 배양 플레이트에 의해 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 배양 플레이트에서 성장한 형질전환 균주를 옮겨 보관하고, Sangon Bioengineering (Shanghai) Co., Ltd.의 SanPrep 컬럼 플라스미드DNA 미니 추출 키트를 사용하여 플라스미드를 추출하여 후속 실험에 사용되며, 플라스미드 추출의 구체적인 단계는 키트 사용 조작 매뉴얼에 따라 수행하였다. 동시에 플라스미드를 Sangon Bioengineering (Shanghai) Co., Ltd.에 보내 시퀀싱 확인을 수행하여 최종적으로 p15a-AcC2C9 플라스미드를 얻었다.
pSGKP-AcC2C9 플라스미드 서열은 서열번호 154이고, 그 구체적인 구축 방법은 다음과 같다.
Sangon Bioengineering (Shanghai) Co., Ltd.에서 AcC2C9 뉴클레아제에 대응되는 가이드 RNA 발현 카세트의 DNA 서열(그 서열은 서열번호 155) 및 pSGKP 플라스미드 골격(그 서열은 서열번호 156)을 전체 유전자 합성하였다. Gibson assembly 기술을 사용하여 이러한 2개의 DNA 단편을 pSGKP-AcC2C9 플라스미드로 조립하였다. 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고, 50μg/mL의 카나마이신을 갖는 LB 배지 플레이트에 도말한 후 스크리닝하였다. 단클론을 선택한 후 확대 배양하고, 플라스미드를 추출하며, 동정 플라스미드 서열을 시퀀싱한 후 pSGKP-AcC2C9 플라스미드를 얻었다.
실시예 6: 클렙시엘라 뉴모니아 게놈 dha 유전자를 표적으로 하는 pSGKP-AcC2C9-dha 플라스미드 구축
pSGKP-AcC2C9-dha 플라스미드 서열은 서열번호 157이고, 그 구체적인 구축 방법은 다음과 같다.
먼저 클렙시엘라 뉴모니아 표적 유전자에서 어느 하나의 AAG(실시예에서 선택된 AcC2C9는 PAM 서열을 AAG로 인식) 서열 이후의 20개 염기의 DNA 단편(이러한 20개의 염기는 스페이서로 지칭되고, AAN은 여기에 포함되지 않음)을 선택한 다음 상기 스페이서 서열을 실시예 1에서 구축된 p15a-AcC2C9Control 플라스미드에 삽입하였다. 본 단계는, 스페이서 단편이 p15a-AcC2C9Control 플라스미드의 BsaI 부위에 삽입되도록 하기 위해, 상기 단일 사슬 DNA 서열의 5' 말단에 atcg를 추가해야 하는 것을 특징으로 한다. 동시에 스페이서의 역보체 서열을 합성하고 역보체 서열 5' 말단에 ggcc를 추가해야 한다. 본 실시예에서 선택된 dha 유전자 스페이서의 DNA 서열(서열번호 158)이 5'-TGTTTGTTACCAACTGCCTG-3'인 경우, 두 개의 프라이머의 구체적인 서열 설계는 다음과 같다.
PAM primerF(dha-spF): 5'-atcgTGTTTGTTACCAACTGCCTG-3'(서열번호 159)
PAM primerR(dha-spR): 5'-ggccCAGGCAGTTGGTAACAAACA-3'(서열번호 160)
상기 두 개의 프라이머를 어닐링하고, 구체적인 반응계는 5μl 10ХT4 DNA ligase Buffer (NEB사), 10μLPAM primerF(10μM), 10μLPAM primerR(10μM), 25μL ddH2O였다. 95℃에서 5분 동안 가열한 다음 1~2시간 내에 천천히 실온으로 낮추어 두 개의 단일 사슬 프라이머가 염기쌍을 이루어 이중 사슬 DNA를 형성하도록 하였다. 그런 다음 ddH2O로 얻은 생성물을 20배 희석하였다.
상기 얻은 이중 사슬 DNA를 Golden Gate 기술을 통해 실시예 4에서 구축된 pSGKP-AcC2C9 플라스미드의 BsaI 부위에 삽입하고, 구체적인 반응계는 1μL 10ХT4 DNA ligase Buffer, 1μL의 상기 20배 희석된 인산화 이중 사슬 DNA, 20fmol pSGKP-AcC2C9 플라스미드, 0.5μL T4 DNA ligase(400units/μL), 0.5μL BsaI-HF(20units/μL)이고, 마지막으로 총 부피가 10μL가 될 때까지 ddH2O를 적당량 첨가하였다. 상기 반응에서 사용된 Buffer 및 효소는 모두 NEB사에서 생산한 것이다. PCR기에서 37℃에서 2분; 16℃에서 5분, 총 25개 주기; 그 다음 80℃에서 15분의 주기로 반응시켰다.
상기 10μL의 반응 생성물을 대장균 컴피턴트 DH5α 균주로 형질전환하고, 75μg/mL의 아프라마이신을 함유한 LB 고체 배양 플레이트에 플레이팅하였다. 형질전환 용액이 고체 배양 플레이트에 의해 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 배지에서 성장한 형질전환 균주를 옮겨 보관하고, 동시에 플라스미드를 추출하여 Sangon Bioengineering (Shanghai) Co., Ltd.에 보내 시퀀싱 검증을 수행하여, 최종적으로 pSGKP-AcC2C9-dha 플라스미드를 얻었다.
실시예 7: p15a-AcC2C9 플라스미드 함유 클렙시엘라 뉴모니아 전기 전달 컴피턴트 제조
클렙시엘라 뉴모니아 NCTC9633 균주(미국 ATCC사에서 구입, Cat. No.: 13883)로 LB 고체 배양 플레이트에 선을 긋고, 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 배양 플레이트에서 성장한 1개의 단클론 세균 집락을 선택하고, 3mL의 LB 액체 배지에 접종하며, 37℃ 셰이커에서 250rpm의 회전 속도로 밤새 동안 흔들었다. 다음날 1mL의 균액을 취하여 100mL의 신선한 LB 액체 배지에 접종하고, 37℃ 셰이커에서 계속 흔들었다. 균액의 OD600이 0.3에 도달하면, 균액을 얼음 위에 놓고 10분 동안 냉각시켰다. 4℃ 원심분리기에서 8000rpm의 회전 속도로 5분 동안 원심분리하여 균주를 수집하고, 배지 상청액을 버리며, 바닥의 박테리아 펠릿을 20mL의 10%(v/v)글리세린(고압 멸균, 얼음 위에서 미리 냉각)을 사용하여 재현탁하였다. 동일한 회전 속도로 원심분리하고, 상청액을 버리며, 바닥의 박테리아 펠릿을 다시 20mL의 10%(v/v)글리세린을 사용하여 재현탁하였다. 동일한 회전 속도로 다시 1회 원심분리하고, 상청액을 버린 후 1mL의 10%(v/v)글리세린을 사용하여 바닥의 박테리아 펠릿을 재현탁하였다. 얻은 박테리아 전기 전달 컴피턴트를 EP 튜브에 분리하여 넣되, 각 튜브의 균액은 50μL이다. 분취된 균액을 먼저 액체질소에서 급속 냉동한 다음 -80℃ 냉장고에 넣어 보관하였다. 재현탁 시 동작은 부드러워야 하고, 피펫 건을 사용하여 부드럽게 피펫팅하는 방식으로 박테리아를 재현탁시킬 수 있다는 점에 유의해야 한다.
제조된 신선한 클렙시엘라 뉴모니아 전기 전달 컴피턴트를 1튜브 취하고, 얼음 위에 5~10분 동안 방치한 후 1μg의 실시예 4에서 제조된 p15a-AcC2C9 플라스미드를 첨가하였다. 균일하게 혼합한 후 1mm의 큐벳(Bio-Rad사)에 옮기고, 실온에서 GenePulserXcell 전기충격기(Bio-Rad사)에서 전기충격을 실시하였다. 전기충격의 매개변수는, 1800V, 200Ω, 25μF였다. 전기충격 직후 1mL의 LB 액체 배지를 첨가하고, 균일하게 혼합한 후 깨끗한 EP 튜브에 옮겨, 37℃ 셰이커에서 1~2시간 동안 흔들었다. 100μL의 균액을 취해 75μg/mL의 아프라마이신을 함유한 LB 고체 배양 플레이트에 플레이팅하였다. 균액이 고체 배양 플레이트에 의해 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다. 1개의 단클론 세균 집락을 선택하고, 3mL의 75μg/mL의 아프라마이신을 함유한 LB 액체 배지, 37℃ 셰이커에서 250rpm 회전 속도로 밤새 동안 흔들었다. 다음날 1mL의 박테리아 균액을 취해 100mL의 신선한 75μg/mL의 아프라마이신을 함유한 LB배지에 접종하고, 37℃ 셰이커에서 계속 흔들었다. 균액의 OD600이 0.2에 도달하면, 균액에 1mL의 20% w/v의 아라비노스(L-Arabinose)를 첨가하고, 균액을 2h 동안 계속 흔든 후 균액을 얼음 위에 놓고 10분 동안 냉각시켰다. 4℃ 원심분리기에서 8000rpm의 회전 속도로 5분 동안 원심분리하여 균주를 수집하고, 배지 상청액을 버리며, 바닥의 박테리아 펠릿을 20mL 10%v/v 글리세린(고압 멸균, 얼음 위에서 미리 냉각)을 사용하여 재현탁하고 2회 세척하였다. 마지막으로 동일한 회전 속도로 다시 1회 원심분리하고, 상청액을 버린 후 1mL 10%v/v 글리세린을 사용하여 바닥의 박테리아 펠릿을 재현탁하였다. 얻은 박테리아 전기 전달 컴피턴트를 EP 튜브에 분리하여 넣되, 각 튜브의 균액은 50μL이다. 분취된 균액을 먼저 액체질소에서 급속 냉동한 다음 -80℃ 냉장고에 넣어 보관하였다. 재현탁 시 동작은 부드러워야 하고, 피펫 건을 사용하여 부드럽게 피펫팅하는 방식으로 박테리아를 재현탁시킬 수 있다는 점에 유의해야 한다.
실시예 8: AcC2C9 시스템을 이용하여 클렙시엘라 뉴모니아 살아있는 세포 효율적인 유전자 삭제를 구현
실시예 6에서 제조된 p15a-AcC2C9 플라스미드 함유 클렙시엘라 뉴모니아 전기 컴피턴트 세포를 1튜브 취하고, 얼음 위에 5~10분 동안 방치한 후 녹은 후 200ng의 실시예 5에서 제조된 pSGKP-AcC2C9-dha 플라스미드 및 최종 농도가 5μM인 dha 유전자 상동성 재조합 복구 주형(그 서열은 서열번호 161)을 첨가하여 부드럽게 균일하게 혼합하였다. 피펫 건을 사용하여 균일하게 혼합한 후 박테리아 플라스미드 혼합물을 미리 냉각시킨 1mm의 큐벳(Bio-Rad사)에 옮겨 얼음 위에서 5분 동안 방치하였다. 큐벳 외벽의 응축수를 깨끗이 닦아내고, GenePulserXcell 전기충격기(Bio-Rad사)에서 전기충격을 실시하였다. 전기충격의 매개변수는, 1800V, 200Ω, 25μF였다. 전기충격 직후 1mL의 LB 배양액을 첨가하여 전기충격 후의 세포를 씻어내고, 멸균된 EP 튜브에 옮겨 37℃ 셰이커에서 250rpm/min의 회전 속도로 1h 동안 회수하여 배양하였다. 균액을 75μg/mL의 아프라마이신 및 50μg/mL의 카나마이신 함유 LB 고체 배지에 도말한 후 균액이 흡수된 후 37℃ 인큐베이터에서 밤새 동안 거꾸로 배양하였다.
성장한 세균 집락에 대해 콜로니 PCR을 실시하여 편집 효과를 검증하였다.
dha 유전자의 콜로니 PCR에 의해 검증된 5' 프라이머는 다음과 같다.
5'-TCATCATTGGCATCCTGAAA-3'(서열번호 162)
dha 유전자의 콜로니 PCR에 의해 검증된 3' 프라이머는 다음과 같다.
5'-TGGTCAGCCTGCTGATTAAA-3'(서열번호 163)
도 3은 CRISPR-AcC2C9 시스템을 사용하여 클렙시엘라 뉴모니아 살아있는 세포에서 유전자 녹아웃을 수행한 PCR 결과 차트이다. 결과는, 선택된 dha 유전자가 CRISPR-AcC2C9 시스템에 의해 정확하게 녹아웃될 수 있는 것으로 나타났다.
실시예 9: AcC2C9 단백질 이종 발현 플라스미드 pET28a-sumo-AcC2C9의 구축
실시예 1의 p15a-AcC2C9Control 플라스미드를 주형으로 하고, AcC2C9 발현 pET28a-sumo-AcC2C9 플라스미드(그 서열은 서열번호 164)을 구축하기 위해 AcC2C9 뉴클레아제 유전자 서열을 증폭하였다.
AcC2C9 유전자 5' 프라이머 서열 pET-AcC2C9F(5'Primer) 증폭:
5'-tCTTGAAGTCCTCTTTCAGGGACCCATGGTGCAGACGGAGATCCTG-3'(서열번호 165):
AcC2C9 유전자 3' 프라이머 서열 pET-AcC2C9R(3'Primer) 증폭:
5'-gtcgacggagctcgaattcttaagcTTATGGAGGCGTTGCCGTTTCG-3'(서열번호 166):
Novizan사의 Phanta Max Master Mix 시약을 사용하여 AcC2C9 유전자 단편을 증폭하고, 반응계는, 25μL 2xPhanta Max Master Mix, 1.5μL 5'Primer(10μM), 1.5μL3'Primer(10μM), 0.5μl의 실시예 4에서 제조된 p15a-AcC2C9 플라스미드(100ng/μL), 1.5μL DMSO, 20μL ddH2O였다. PCR 반응계가 준비된 후 중합효소 연쇄 반응(PCR)을 수행하고, 그 주기는 98℃에서 2분; 그 다음 98℃에서 20초, 55℃에서 20초, 72℃에서 1분, 총 30개 주기; 마지막으로 72℃에서 5분이었다. Sangon Bioengineering (Shanghai) Co., Ltd.가 생산한 SanPrep 컬럼 PCR 생성물 정제 키트를 사용하여 PCR 생성물을 각각 회수하였다. PCR 생성물 정제의 구체적인 단계는 키트 사용 조작 매뉴얼에 따라 수행하였다.
Sangon Bioengineering (Shanghai) Co., Ltd.에서 pET28a-sumo 플라스미드 골격(그 서열은 서열번호 167)을 전체 유전자 합성하였다. Gibson assembly 기술을 사용하여 이러한 2개의 AcC2C9 유전자 단편 및 pET28a-sumo 플라스미드 골격을 pET28a-sumo-AcC2C9 플라스미드로 조립하였다. 대장균 DH5α 제품 컴피턴트 세포로 형질전환하고, 50μg/mL의 카나마이신을 갖는 LB 배지 플레이트에 도말하여 스크리닝하였다. 단클론을 선택한 후 확대 배양하고, 플라스미드를 추출하며, 동정 플라스미드 서열을 시퀀싱한 후 pET28a-sumo-AcC2C9 플라스미드를 얻었다.
실시예 10: AcC2C9는 효율적인 체외 이중 사슬 DNA 절단을 구현
절단 기질의 제조. 클렙시엘라 뉴모니아의 게놈을 주형으로 하고, 5'FAM 표지 프라이머를 사용하여 절단 기질을 증폭하였다. 절단 기질을 증폭하는 5' 프라이머 서열은 5'-CCGCATATATCGCAAAACAA-3'(서열번호 168)이고, 절단 기질을 증폭하는 3' 프라이머 서열은 5'-CTGGCTGTGAACAAAGTGGA-3'(서열번호 169)였다. Sangon Bioengineering (Shanghai) Co., Ltd.가 생산한 SanPrep 컬럼 PCR 생성물 정제 키트를 사용하여 PCR 생성물을 각각 회수하였다.
AcC2C9 뉴클레아제의 제조. 실시예 8에서 구축된 pET28a-sumo-AcC2C9 플라스미드를 대장균 발현 균주 BL21(DE3)로 형질전환하였다. 다음날 형질전환체를 1L의 LB배지에 옮겨, 37℃ 조건 하에서 진탕 배양하였다. OD600이 0.6에 도달하면, 배양액에 0.5mL 1M IPTG를 첨가하고, 온도를 16℃로 낮추어 밤새 동안 계속 배양하였다. 밤을 새운 후의 균주를 수집하고, 초음파 파쇄한 후 HisTrap Ni-NTA(GE Healthcare) 크로마토그래피 컬럼을 사용하여 정제하였다. 그런 다음 HiLoad 16/600 Superdex 200pg 분자체(GE Healthcare)를 사용하여 추가로 정제하였다. 한외여과관을 사용하여 정제 후의 단백질을 농축한 후 500mM NaCl, 10mM Tris-HCl, pH=7.5, 1mM DTT의 완충액에 보관하였다.
절단 기질을 표적으로 하는 완전 가이드 RNA(그 서열은 서열번호 170)의 제조. 완전 가이드 RNA의 제조는 체외 전사를 통해 구현하였다. 이의 전사 주형 DNA는 Jinweizhi Biotechnology Co., Ltd.가 합성하고, 그 서열은 서열번호 171이다. 완전 가이드 RNA는 상기 주형을 사용하여 HiScribe T7 High Yield RNA Synthesis Kit(NEB사)를 통해 전사된다. 구체적인 단계는 키트 사용 조작 매뉴얼에 따라 수행하였다. 제조된 완전 가이드 RNA는 페놀-클로로포름 추출 및 에탄올 침전을 거쳐 정제하였다.
체외 절단 실험은 150mM NaCl, 10mM MgCl2, 10mM Tris-HCl, pH=7.5, 1mM DTT 조건에서 수행하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9와 2μM의 완전 가이드 RNA를 포함한다. 반응시간은 각각 0분, 1분, 2분, 5분, 15분 및 30분이고, 반응 온도는 37℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다.
도 4는 AcC2C9 뉴클레아제을 사용하여 기질 DNA를 절단한 결과 차트이다. 결과는, 기질 DNA가 AcC2C9에 의해 두 개의 DNA 단편으로 정확하게 절단된 것으로 나타났다.
실시예 11: AcC2C9의 최적 반응 조건 검출
AcC2C9의 최적 반응 조건을 검출하기 위해, 본 발명에서는 체외 절단 실험을 이용하여 상이한 반응 조건 하에서 AcC2C9의 활성을 검출하였다.
절단 기질. 실시예 10에 기재된 바와 같다.
AcC2C9 뉴클레아제의 제조. 실시예 10에 기재된 바와 같다.
절단 기질을 표적으로 하는 완전 가이드 RNA. 실시예 10에 기재된 바와 같다.
(1) 온도가 AcC2C9 활성에 미치는 영향
체외 절단 실험은 100mM NaCl, 10mM MgCl2, 10mM Tris-HCl, pH=7.5, 1mM DTT 조건에서 수행하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9와 2μM의 완전 가이드 RNA를 포함한다. 반응시간은 각각 0분, 5분, 10분, 20분, 40분 및 60분이고, 반응 온도는 각각 30℃, 34℃, 37℃, 40℃, 43℃, 46℃ 및 50℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다. 총 DNA 기질 양에 대한 절단된 밴드의 양의 비율에 의해 AcC2C9 절단 효율을 결정하였다.
(2) NaCl 농도가 AcC2C9 활성에 미치는 영향
체외 절단 실험의 반응 완충액은 10mM MgCl2, 10mM Tris-HCl, pH=7.5, 1mM DTT이고, 그런 다음 각각 50mM, 100mM, 200mM, 300mM 및 500mM NaCl을 첨가하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9와 2μM의 완전 가이드 RNA를 포함한다. 반응시간은 각각 0분, 5분, 10분, 20분, 40분 및 60분이고, 반응 온도는 37℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다. 총 DNA 기질 양에 대한 절단된 밴드의 양의 비율에 의해 AcC2C9 절단 효율을 결정하였다.
(3) MgCl2 농도가 AcC2C9 활성에 미치는 영향
체외 절단 실험의 반응 완충액은 100mM NaCl, 10mM Tris-HCl, pH=7.5, 1mM DTT이고, 그런 다음 각각 0mM, 1mM, 2mM, 5mM, 10mM 및 20mM MgCl2를 첨가하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9와 2μM의 완전 가이드 RNA를 포함한다. 반응시간은 각각 0분, 5분, 10분, 20분, 40분 및 60분이고, 반응 온도는 37℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다. 총 DNA 기질 양에 대한 절단된 밴드의 양의 비율에 의해 AcC2C9 절단 효율을 결정하였다.
(4) 상이한 2가 이온이 AcC2C9 활성에 미치는 영향
체외 절단 실험의 반응 완충액은 100mM NaCl, 10mM Tris-HCl, pH=7.5, 1mM DTT이고, 그런 다음 각각 10mM의 MgCl2, CdCl2, CoCl2, MnCl2 및 NiCl2를 첨가하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9와 2μM의 완전 가이드 RNA를 포함한다. 반응시간은 각각 0분, 5분, 10분, 20분, 40분 및 60분이고, 반응 온도는 37℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다. 총 DNA 기질 양에 대한 절단된 밴드의 양의 비율에 의해 AcC2C9 절단 효율을 결정하였다.
도 5는 상이한 온도(A), 상이한 NaCl 농도(B), 상이한 MgCl2 농도(C) 및 상이한 2가 이온(D) 조건 하에서 AcC2C9 뉴클레아제의 반응 활성 다이어그램이다. 결과는, 40℃, 100mM NaCl, 10mM MgCl2의 조건 하에서 AcC2C9의 활성이 가장 높은 것으로 나타났다. 40분 동안 반응시킨 경우, 40℃에서 AcC2C9의 절단 효율은 98.8%에 도달할 수 있고, 100mM의 NaCl인 경우 절단 효율은 98.7%에 도달할 수 있으며, 10mM MgCl2인 경우 절단 효율은 98.9%에 도달 할 수 있다.
실시예 12: 완전 가이드 RNA가 tracrRNA 및 crRNA로 분리된 후의 활성 검출
절단 기질을 표적으로 하는 완전 가이드 RNA는 tracrRNA 및 crRNA(표적 서열에 혼성화한 DNA-표적화 세그먼트가 tracr 파트너 서열에 연결되어 형성된 RNA 서열)를 포함한다. 완전 가이드 RNA가 tracrRNA 및 crRNA로 분리된 후 생물학적 활성을 갖는지 여부를 검증하기 위해, 본 발명에서는 체외 이중 사슬 DNA 절단 실험을 수행하였다.
절단 기질. 실시예 10에 기재된 바와 같다.
AcC2C9 뉴클레아제의 제조. 실시예 10에 기재된 바와 같다.
tracrRNA(서열번호 172)의 제조. tracrRNA의 제조는 체외 전사를 통해 구현되고, 이의 전사 주형 DNA는 Jinweizhi Biotechnology Co., Ltd.가 합성하며, 그 서열은 서열번호 173이다. tracrRNA는 상기 주형을 사용하여 HiScribe T7High Yield RNA Synthesis Kit(NEB사)를 통해 전사된다. 구체적인 단계는 키트 사용 조작 매뉴얼에 따라 수행하였다. 제조된 tracrRNA페놀-클로로포름 추출 및 에탄올 침전을 거쳐 정제하였다.
crRNA(서열번호 174)의 제조. crRNA의 제조는 체외 전사를 통해 구현되고, 이의 전사 주형 DNA는 Jinweizhi Biotechnology Co., Ltd.가 합성하며, 그 서열은 서열번호 175이다. crRNA의 전사 및 정제 단계는 tracrRNA와 동일하다.
체외 절단 실험은 150mM NaCl, 10mM MgCl2, 10mM Tris-HCl, pH=7.5, 1mM DTT 조건에서 수행하였다. 총 반응 부피는 20μL이되, 30nM의 절단 기질, 2μM AcC2C9, 2μM tracrRNA 및 2μM crRNA를 포함한다. 반응시간은 30분이고, 반응 온도는 37℃였다. 반응이 완료된 후 50mM EDTA 및 2mg/mL ProteinK를 첨가하여 반응을 종료시켰다. 반응 생성물을 6% w/v의 TBE 아크릴아미드 겔을 통해 분리하고, Bio-Rad사의 GELDOC 겔 영상기에서 488nm 청색광으로 여기시킨 후 이미징하였다. crRNA 및 tracrRNA 조건 하에서, 기질 DNA는 마찬가지로 두 개의 DNA 단편으로 정확하게 절단되는 것을 알 수 있고, 이는 완전 가이드 RNA가 tracrRNA 및 crRNA로 분리된 후 마찬가지로 생물학적 활성을 가짐을 나타낸다.
도 6의 (A) 부분은 AcC2C9 완전 가이드 RNA의 서열 모식도이고 (B) 부분은 tracrRNA 및 crRNA 조건 하에서, AcC2C9 뉴클레아제을 사용하여 기질 DNA를 절단한 결과 차트이다.
실시예 13: AcC2C9에 의한 이중 사슬 DNA 절단 닉 부위 동정
짧은 형광 표지을 표적으로 하여 DNA를 합성하는 완전 가이드 RNA의 제조. 실시예 9에 기재된 바와 같다.
AcC2C9 뉴클레아제의 제조. 실시예 9에 기재된 바와 같다.
절단 기질의 제조. 절단 기질은 4개의 58bp 형광 표지된 합성 DNA 서열이다. Sangon Bioengineering (Shanghai) Co., Ltd.가 두 개의 상보성 염기쌍의 프라이머를 합성하고, 그 서열은 각각 5'-GGCTGTGAGAAAGCGGTTCAGGTGAAAGTGAAAACACTGCCCGACGCCCAGTTCGAAG-3'(서열번호 176) 및 5'-CTTCGAACTGGGCGTCGGGCAGTGTTTTCACTTTCACCTGAA CCGCTTTCTCACAGCC-3'(서열번호 177)였다. 두 개의 프라이머의 5' 말단 또는 3' 말단에 FAM 형광 그룹을 각각 표지하였다.
체외 절단 실험은 150mM NaCl, 10mM MgCl2, 10mM Tris-HCl, pH=7.5, 1mM DTT 조건에서 수행하였다. 총 반응 부피는 10μL이되, 20nM절단 기질, 2μM AcC2C9, 2μM의 완전 가이드 RNA를 포함한다. 반응 온도는 37℃였다. 반응시간은 30분이었다. 반응이 완료된 후 10μL 2Х포름아미드 로딩 버퍼(Sangon Bioengineering (Shanghai) Co., Ltd.)를 첨가하여 반응을 종료시켰다. 반응 생성물을 20%의 TBE-Urea-PAGE를 통해 분리하고, 488nm 청색광으로 여기시킨 후 이미징하였다.
도 7은 AcC2C9 뉴클레아제를 사용하여 4개의 58bp 형광 표지된 DNA 기질을 절단한 결과 차트이다. 결과는, 표적화 사슬에서 AcC2C9의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 21-22nt이고, 비표적 사슬에서의 주요 절단 부위는 PAM 부위의 3' 말단 하류의 15-16nt인 것으로 나타났다.
실시예 14: AcC2C9의 포유동물 세포 유전자 편집 플라스미드 pAcC2C9Hs의 구축
실시예에 따른 AcC2C9는 인간 코돈에 최적화된 바람직한 AcC2C9 코딩 유전자를 사용하였다.
pAcC2C9Hs 플라스미드 서열은 서열번호 178이고, 그 구체적인 구축 방법은 다음과 같다.
인간 일시적 발현 플라스미드 골격(그 서열은 서열번호 179), 퓨로마이신 저항성 유전자 발현 카세트 서열(그 서열은 서열번호 180), 인간 코돈에 최적화된 AcC2C9 코딩 유전자 발현 카세트 서열(그 서열은 서열번호 181) 및 인간 세포에서 AcC2C9에 대응되는 가이드 RNA(서열번호 123) 발현 카세트(그 서열은 서열번호 182)는 Sangon Bioengineering (Shanghai) Co., Ltd.가 합성하고, 네 단편을 Gibson assembly 기술에 의해 pAcC2C9Hs 플라스미드로 조립하였다. 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고, 카르베니실린을 갖는 LBA 플레이트를 도말한 후 단클론을 선택한 후 확대 배양하고 플라스미드를 추출하며 시퀀싱 및 동정 후 pAcC2C9Hs 플라스미드를 얻었다.
실시예 15: AcC2C9를 이용하여 인간 살아있는 세포에서의 효율적인 유전자 편집을 구현
AcC2C9 뉴클레아제를 이용하여 인간 살아있는 세포에서의 효율적인 유전자 편집을 구현할 수 있다. 인간 배아 신장 세포 HEK293을 모델로 유전자 편집 효과를 디스플레이하였다.
pAcC2C9Hs 플라스미드에 표적화 스페이서 서열을 삽입하였다. 실시예에서는 인간 게놈 상의 VEGFA, EMX1, HEXA, DNMT1 및 FANCF 총 5개의 유전자를 표적 서열로 선택하고, 이러한 표적 서열에서 각각 하나의 20bp 표적화 서열 DNA를 선택하였다. 올리고뉴클레오타이드 서열 Guide1-F, Guide1-R, Guide2-F, Guide2-R, Guide3-F, Guide3-R, Guide4-F, Guide4-R, Guide5-F 및 Guide5-R(서열은 각각 서열번호 183-192)을 각각 합성하였다. Guide1-F 및 Guide1-R, Guide2-F 및 Guide2-R, Guide3-F 및 Guide3-R, Guide4-F 및 Guide4-R, 및 Guide5-F 및 Guide5-R을 각각 어닐링한 후, Golden gate assembly 기술을 통해 이러한 5개의 표적화 서열 DNA를 pAcC2C9Hs 플라스미드에 각각 삽입하고, pAcC2C9Hs-guide1, pAcC2C9Hs-guide2, pAcC2C9Hs-guide3, pAcC2C9Hs-guide4 및 pAcC2C9Hs-guide5 플라스미드(서열은 각각 서열번호 193-197)로 각각 구축하였다.
일시적 발현 플라스미드 매개 인간 세포 유전자 편집. 냉동보존된 HEK293세포를 활성화하였다. 2일 후 HEK293 세포를 24 웰 플레이트에서 계대하고, 웰당 세포 개수는 약 1.5Х105개였다. 16~18시간 후, 0.75μL의 lipofectamine3000(Invitrogen)을 사용하여 500ngpAcC2C9Hs-guide1, pAcC2C9Hs-guide2, pAcC2C9Hs-guide3, pAcC2C9Hs-guide4 및 pAcC2C9Hs-guide5 플라스미드를 각각 세포에 형질감염하였다. 72시간 동안 계속 배양하였다. 부착 세포를 소화하고, 게놈 DNA를 추출하였다. 유전자에 대응되는 증폭 프라이머(Guide1-IndelF 및 Guide1-IndelR, Guide2-IndelF 및 Guide2-IndelR, Guide3-IndelF 및 Guide3-IndelR, Guide4-IndelF 및 Guide4-IndelR, Guide5-IndelF 및 Guide5-IndelR, 그 서열은 각각 서열번호 198-207)를 사용하여 유전자 단편을 PCR 증폭하였다. PCR 생성물을 겔 회수하였다. NEBuffer2(NEB사)를 사용하여 PCR 생성물을 어닐링하였다. 그런 다음 T7endonuclease 1(NEB사)을 첨가하고, 37℃에서 15분 동안 효소 커팅하였다. 50mM EDTA를 첨가하여 반응을 종료시킨 후, 반응 생성물을 6%의 TBE-PAGE를 통해 분리하고, 4S Red dye(Sangon Bioengineering (Shanghai) Co., Ltd.)을 통해 염색 및 이미징하였다.
도 8은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서의 유전자 편집 결과 차트이다. (A) 부분은 결손(Indel) 실험의 TBE-PAGE 겔 이미지이다. 선택된 5개의 상이한 유전자 부위에서, AcC2C9 뉴클레아제는 VEGFA, HEXA 및 DNMT1 유전자의 효율적인 유전자 편집을 성공적으로 구현하였다. (B) 부분은 AcC2C9 일시적 발현 플라스미드에 의해 매개되는 인간 세포에서 VEGFA 유전자 편집 후 고처리량 시퀀싱의 통계 결과 차트이다. 도면에 도시된 바와 같이, AcC2C9 뉴클레아제는 표적 서열에 삽입 또는 결실 돌연변이를 정확하게 도입할 수 있다.
실시예 16: 인간 살아있는 세포의 복수의 부위에서 AcC2C9의 편집 효율 검출
상이한 유전자 부위에서 AcC2C9의 보편성 검증을 위해, 인간 게놈 상의 VEGFA, AAVS1, PDCD1, HEXA, EMX1, TP53, DNMT1 및 FANCE 유전자 표적 서열에서 계속하여 47개의 표적화 부위를 선택하였다. Sangon Bioengineering (Shanghai) Co., Ltd.를 통해 서열 Guide6-F―Guide52-F(서열은 각각 서열번호 208-254) 및 Guide6-R―Guide52-R(서열은 각각 서열번호 255-301)로 합성하였다.
실시예 15와 동일한 단계에 따라, 대응되는 프라이머를 어닐링한 후, Golden gate assembly 기술을 통해 이러한 47개의 표적화 서열 DNA를 pAcC2C9Hs 플라스미드에 각각 삽입하고, 성공적으로 구축된 플라스미드를 lipofectamine3000(Invitrogen)을 통해 HEK293세포에 각각 형질감염 및 형질전환하여 유전자 편집을 수행하였다. 편집된 세포를 수집하여 게놈을 추출하고, 편집 부위를 증폭한 후 생성물을 Jiangxi Hypros Biotechnology Co., Ltd.로 보내 고처리량 시퀀싱을 수행하고, 세포 편집 효율을 검출하였다.
도 9는 HEK293T 세포의 47개 부위에서 AcC2C9 일시적 발현 플라스미드의 유전자 편집 효율 그래프이고, 유전자 편집 효율이 가장 높은 부위는 부위 15이고, 효율은 73.7%에 도달한다.
실시예 17: 인간 살아있는 세포에서 아데노 관련 바이러스(AAV) 매개 AcC2C9 유전자 편집
Sangon Bioengineering (Shanghai) Co., Ltd.에서 AAV2 플라스미드 골격(그 서열은 서열번호 302) 및 각각 VEGFA, AAVS1, PDCD1유전자를 표적으로 하는 AcC2C9발현 카세트(그 서열은 각각 서열번호 303-305)를 전체 유전자 합성하였다. Gibson assembly 기술을 사용하여 AAV2 플라스미드 골격과 3개의 AcC2C9발현 카세트를 조립하여 AAV2-AcVEGFA(그 서열은 서열번호 306), AAV2-AcAAVS1(그 서열은 서열번호 307) 및 AAV2-AcPDCD1(그 서열은 서열번호 308)을 얻었다. 대장균 DH5α 제품 컴피턴트 세포를 형질전환하고, 50μg/mL의 카르베니실린을 갖는 LB 배지 플레이트에 도말한 후 스크리닝하였다. 단클론을 선택한 후 확대 배양하고, 플라스미드를 추출하며 동정 플라스미드 서열을 시퀀싱하였다.
구축하여 얻은 플라스미드를 Guangzhou Paizhen Biotechnology Co., Ltd.로 보내 AAV 생산을 수행하여 각각 3개 부위를 표적으로 하는 AcC2C9 시스템을 포함하는 AAV를 얻었다. 냉동보존된 HEK293T, HLEA, U-2 OS, Huh-7 및 HepG 세포를 활성화하였다. 인간 세포를 24 웰 플레이트에서 계대하고, 웰당 세포 개수는 약 0.5Х105개였다. 24시간 후, 각 웰에 0.5Х1010개 복사수의 AAV를 첨가하여 형질감염시켰다. 72시간 동안 계속 배양한 후, 부착 세포를 소화하고, 게놈 DNA를 추출하였다. 편집 부위를 증폭한 후 생성물을 Jiangxi Hypros Biotechnology Co., Ltd.에 보내 고처리량 시퀀싱을 수행하고 세포 편집 효율을 검출하였다.
도 10은 인간 세포 HEK293T, HLEA, U-2 OS, Huh-7 및 HepG 세포 중 3개의 상이한 유전자 부위(VEGFA, AAVS1, PDCD1)에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율 그래프이다. 인간 세포 HEK293T 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율은 각각 18.2%, 39.4%, 13.5%이고, 인간 세포 HLEA 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율은 각각 8.4%, 22.1%, 12.2%이며; 인간 세포 U-2 OS 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율은 각각 11.8%, 29.2%, 29.8%이고; 인간 세포 Huh-7 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율은 각각 5.1%, 11.9%, 5.6%이며; 인간 세포 HepG 세포 중 3개의 상이한 유전자 부위에서 AcC2C9 시스템을 발현하는 AAV의 편집 효율은 각각 3.9%, 7.4%, 6.0%였다.
상기 실시예는 본 발명의 기술적 해결수단을 설명하기 위한 것일 뿐 한정하기 위한 것은 아니고; 바람직한 실시예를 참조하여 본 발명을 상세히 설명하였으나, 본 발명의 구체적인 실시형태를 수정하거나 일부 기술특징을 동등하게 대체할 수 있으며; 발명 구상의 정신을 벗어나지 않는 범위 내에서 당업자가 생각할 수 있는 변경 및 장점은 모두 본 발명이 보호하고자 하는 기술적 해결수단의 범위에 포함된다는 것을 당업자는 이해해야 한다.
서열목록 전자파일 첨부
Claims (20)
- RNA-가이드된 엔도뉴클레아제로서의 C2C9 뉴클레아제의 용도.
- 유전자 편집 시스템에서 C2C9 뉴클레아제 또는 상기 C2C9 뉴클레아제를 코딩하는 핵산의 용도.
- 유전자 편집 시스템으로서,
상기 유전자 편집 시스템은 C2C9 뉴클레아제 및/또는 상기 C2C9 뉴클레아제를 코딩하는 핵산, 및 가이드 RNA 또는 상기 가이드 RNA를 코딩하는 핵산을 포함하는 것을 특징으로 하는 유전자 편집 시스템. - 제3항에 있어서,
상기 C2C9 뉴클레아제는,
(I) RNA-가이드된 핵산 결합 활성을 갖는 야생형 C2C9 뉴클레아제 또는 이의 단편이고;
(II) (I)의 아미노산 서열과 적어도 30% 서열 상동성을 갖고 RNA-가이드된 핵산 결합 활성을 갖는 변이체이며;
(III) (I) 또는 (II)에 따르면, 상기 C2C9 뉴클레아제는 핵 국소화 신호 단편을 더 포함하고;
(IV) (I) 또는 (II) 또는 (III)에 따르면, 상기 C2C9 뉴클레아제는,
(a) 변형 또는 돌연변이 전과 비교하여 현저히 감소된 엔도뉴클레아제 활성을 생성하거나 엔도뉴클레아제 활성이 상실된 하나 이상의 변형 또는 돌연변이; 및/또는
(b) 다른 기능 활성을 갖는 폴리펩티드 또는 도메인을 더 포함하며;
(V) (I) 또는 (II) 또는 (III)에 따르면, 상기 C2C9 뉴클레아제는 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는 유전자 편집 시스템. - 제3항 또는 제4항에 있어서,
상기 C2C9 뉴클레아제는 800개의 아미노산을 초과하지 않고; 및/또는, 상기 C2C9 뉴클레아제는 RNA-가이드된 핵산 결합 활성을 갖는 것을 특징으로 하는 유전자 편집 시스템. - 제3항 내지 제5항 중 어느 한 항에 있어서,
상기 유전자 편집 시스템은 표적화 서열에서의 PAM 서열을 인식하고; 및/또는, 상기 유전자 편집 시스템은 PAM 서열 이후 길이가 12~40bp, 바람직하게는 20bp인 핵산 단편을 표적으로 하는 것을 특징으로 하는 유전자 편집 시스템. - 제6항에 있어서,
상기 PAM 서열은 AAN, GAN이되; N은 A, T, C 또는 G 중 임의의 염기를 나타내는 축퇴 염기인 것을 특징으로 하는 유전자 편집 시스템. - 제3항 내지 제7항 중 어느 한 항에 있어서,
상기 C2C9 뉴클레아제는 N 말단에서 C 말단까지,
서열번호 1로 표시되는 아미노산 서열 또는 상기 아미노산 서열과 적어도 30% 서열 동일성을 갖는 변이체를 포함하고, RNA-가이드된 핵산 결합 활성 및/또는 엔도뉴클레아제 활성을 갖는 도메인 1;
서열번호 2로 표시되는 아미노산 서열 또는 상기 아미노산 서열과 적어도 30% 서열 동일성을 갖는 변이체를 포함하고, RNA-가이드된 핵산 결합 활성 및/또는 엔도뉴클레아제 활성을 갖는 도메인 2를 포함하는 것을 특징으로 하는 유전자 편집 시스템. - 제3항 내지 제7항 중 어느 한 항에 있어서,
상기 C2C9 뉴클레아제는 서열번호 3-117로 표시되는 아미노산 서열 중 어느 하나이거나 서열번호 3-117로 표시되는 아미노산 서열 중 어느 하나와 적어도 30% 서열 상동성을 갖고, RNA-가이드된 핵산 결합 활성 및/또는 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는 유전자 편집 시스템. - 제3항 내지 제7항 중 어느 한 항에 있어서,
상기 가이드 RNA는,
표적 서열에 혼성화할 수 있는 유전자 표적화 세그먼트 (i),
tracr 파트너 서열 (ii),
tracrRNA 서열 (iii)을 포함하되;
상기 tracr 파트너 서열 (ii)은 상기 tracrRNA 서열 (iii)에 혼성화하여 스템-루프 구조를 형성하고;
상기 가이드 RNA는 상기 핵산 표적화 세그먼트 (i)와 tracr 파트너 서열 (ii) 및 tracrRNA 서열 (iii)이 순차적으로 연결되어 형성된 하나의 사슬이며; 또는, 상기 가이드 RNA는 두 사슬을 포함하되, 그 중 하나의 사슬은 상기 유전자 표적화 세그먼트 (i)와 tracr 파트너 서열 (ii)이 연결되어 형성되고, 다른 하나의 사슬은 상기 tracrRNA 서열 (iii)인 것을 특징으로 하는 유전자 편집 시스템. - 제5항 또는 제6항에 있어서,
상기 유전자 편집 시스템은,
(1) C2C9 뉴클레아제의 발현 작제물;
(2) 완전 가이드 RNA의 발현 작제물을 포함하고;
상기 완전 가이드 RNA는 가이드 RNA 골격, 및 상기 가이드 RNA 골격의 3' 말단에 추가된 표적화 서열에 대응되는 RNA 서열을 포함하며; 상기 표적화 서열은 PAM 서열 이후 길이가 12~40bp인 핵산 단편, 바람직하게는 PAM 서열 이후 길이가 20bp인 핵산 단편인 것을 특징으로 하는 유전자 편집 시스템. - 제10항에 있어서,
상기 가이드 RNA 서열은 상기 C2C9 뉴클레아제에 대응되되, 상기 악티노마두라 크라니엘라에(Actinomadura craniellae) C2C9(서열번호 3)에 대응되는 tracr 파트너 서열은 서열번호 118로 표시되고, 상기 tracrRNA 서열은 서열번호 119로 표시되며, 함께 연결되어 얻은 가이드 RNA 골격 서열은 서열번호 120으로 표시되는 것을 특징으로 하는 유전자 편집 시스템. - 유전자 편집 방법으로서,
표적 유전자를 상기 제3항 내지 제12항 중 어느 한 항에 따른 유전자 편집 시스템에 접촉시켜 표적 유전자의 편집을 구현하는 것을 특징으로 하는 유전자 편집 방법. - 제13항에 있어서,
상기 방법은,
i) 상기 C2C9 뉴클레아제 또는 상기 C2C9 뉴클레아제를 코딩하는 핵산을 세포에 도입하는 단계;
ii) 상기 가이드 RNA 또는 상기 가이드 RNA를 코딩하는 핵산을 세포에 도입하는 단계;
III) C2C9 뉴클레아제에 의해 매개되고, 표적 유전자에 하나 이상의 닉을 생성하거나, 상기 표적 유전자를 표적화, 편집, 변형 또는 조작하는 단계를 포함하는 것을 특징으로 하는 유전자 편집 방법. - 제13항 또는 제14항에 있어서,
상기 C2C9 뉴클레아제는 가공되거나 가공되지 않은 형태의 가이드 RNA를 통해 표적 유전자로 가이드되는 것을 특징으로 하는 유전자 편집 방법. - 제13항 또는 제14항에 있어서,
상기 C2C9 뉴클레아제는 가이드 RNA와 복합체를 형성하고, 상기 표적 유전자의 PAM 서열을 인식하며; 및/또는, 상기 유전자 편집 시스템의 표적화 서열은 PAM 서열 이후 길이가 12~40bp인 핵산 단편, 바람직하게는 PAM 서열 이후 길이가 20bp인 핵산 단편인 것을 특징으로 하는 유전자 편집 방법. - 제14항에 있어서,
상기 방법은 이종 폴리뉴클레오티드 서열을 포함하는 공여자 주형을 세포에 도입하는 단계를 더 포함하는 것을 특징으로 하는 유전자 편집 방법. - 체내, 체외 세포 또는 무세포 환경에서 표적 유전자 및/또는 이의 관련 폴리펩티드의 유전자 편집에서 제3항 내지 제12항 중 어느 한 항에 따른 유전자 편집 시스템 또는 제13항 내지 제17항 중 어느 한 항에 따른 방법의 응용으로서,
상기 체외 세포는 박테리아 세포, 고세균 세포, 진균 세포, 원생생물 세포, 바이러스 세포, 식물 세포 및 동물 세포를 포함하는 것을 특징으로 하는 응용. - 체내, 체외 세포 또는 무세포 환경에서 표적 유전자 및/또는 이의 관련 폴리펩티드의 유전자 편집에서 제3항 내지 제12항 중 어느 한 항에 따른 유전자 편집 시스템 또는 제13항 내지 제17항 중 어느 한 항에 따른 방법의 응용으로서,
상기 유전자 편집은 유전자 절단, 유전자 삭제, 유전자 삽입, 점 돌연변이, 전사 억제, 전사 활성화, 염기 편집 및 가이드 편집으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 응용. - 유전적으로 변형된 세포로서,
상기 세포는 상기 제3항 내지 제12항 중 어느 한 항에 따른 유전자 편집 시스템 또는 제13항 내지 제17항 중 어느 한 항에 따른 방법을 통해 유전자 편집을 진행하여 얻어지는 유전적으로 변형된 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111445474.3A CN116200368A (zh) | 2021-11-30 | 2021-11-30 | 一种基于c2c9核酸酶的新型基因组编辑系统及其应用 |
CN202111445474.3 | 2021-11-30 | ||
PCT/CN2022/132596 WO2023098485A1 (zh) | 2021-11-30 | 2022-11-17 | 一种基于c2c9核酸酶的新型基因组编辑系统及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240107373A true KR20240107373A (ko) | 2024-07-09 |
Family
ID=86517869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247021149A KR20240107373A (ko) | 2021-11-30 | 2022-11-17 | C2c9 뉴클레아제 기반의 신규 게놈 편집 시스템 및 이의 응용 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4428233A1 (ko) |
JP (1) | JP2024543186A (ko) |
KR (1) | KR20240107373A (ko) |
CN (1) | CN116200368A (ko) |
AU (1) | AU2022402777A1 (ko) |
CA (1) | CA3240465A1 (ko) |
WO (1) | WO2023098485A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117701561A (zh) * | 2022-09-15 | 2024-03-15 | 上海科技大学 | 一种优化的向导RNA、CRISPR/AcC2C9基因编辑系统及基因编辑方法 |
CN118207185A (zh) * | 2022-12-15 | 2024-06-18 | 上海科技大学 | 一种碱基编辑系统及碱基编辑方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210093667A1 (en) * | 2017-06-26 | 2021-04-01 | The Broad Institute, Inc. | Crispr/cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing |
WO2019051097A1 (en) * | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
AU2018386301A1 (en) * | 2017-12-14 | 2020-06-18 | Bayer Healthcare Llc | Novel RNA-programmable endonuclease systems and their use in genome editing and other applications |
-
2021
- 2021-11-30 CN CN202111445474.3A patent/CN116200368A/zh active Pending
-
2022
- 2022-11-17 WO PCT/CN2022/132596 patent/WO2023098485A1/zh active Application Filing
- 2022-11-17 KR KR1020247021149A patent/KR20240107373A/ko unknown
- 2022-11-17 AU AU2022402777A patent/AU2022402777A1/en active Pending
- 2022-11-17 JP JP2024531724A patent/JP2024543186A/ja active Pending
- 2022-11-17 CA CA3240465A patent/CA3240465A1/en active Pending
- 2022-11-17 EP EP22900290.2A patent/EP4428233A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116200368A (zh) | 2023-06-02 |
EP4428233A9 (en) | 2024-11-27 |
AU2022402777A1 (en) | 2024-06-27 |
JP2024543186A (ja) | 2024-11-19 |
EP4428233A1 (en) | 2024-09-11 |
CA3240465A1 (en) | 2023-06-08 |
WO2023098485A1 (zh) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12123014B2 (en) | Class II, type V CRISPR systems | |
CN106922154B (zh) | 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑 | |
KR102626503B1 (ko) | 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 | |
JP2020517299A (ja) | 縦列反復配列を有するドナーdna修復鋳型を使用する部位特異的なdna改変 | |
US20230416710A1 (en) | Engineered and chimeric nucleases | |
US20230212612A1 (en) | Genome editing system and method | |
US20220298494A1 (en) | Enzymes with ruvc domains | |
KR20240107373A (ko) | C2c9 뉴클레아제 기반의 신규 게놈 편집 시스템 및 이의 응용 | |
EP4165177A1 (en) | Enzymes with ruvc domains | |
WO2023206871A1 (zh) | 一种优化的CRISPR/SpCas12f1系统、工程化向导RNA及其应用 | |
WO2023206872A1 (zh) | 一种工程优化的核酸酶、向导rna、编辑系统和应用 | |
CA3225082A1 (en) | Enzymes with ruvc domains | |
CN118202044A (zh) | 碱基编辑酶 | |
AU2022284808A1 (en) | Class ii, type v crispr systems | |
WO2022159742A1 (en) | Novel engineered and chimeric nucleases | |
WO2024125221A1 (zh) | 一种碱基编辑系统及碱基编辑方法 | |
WO2024055664A1 (zh) | 一种优化的向导RNA、CRISPR/AcC2C9基因编辑系统及基因编辑方法 | |
US20250059568A1 (en) | Class ii, type v crispr systems | |
CN118685399A (zh) | 一种工程化向导RNA、CRISPR/CnCas12f1系统及其应用 | |
CN118792281A (zh) | 一种小型CRISPR-Cas系统及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20240625 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application |