JP2024113696A - レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 - Google Patents
レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 Download PDFInfo
- Publication number
- JP2024113696A JP2024113696A JP2024076330A JP2024076330A JP2024113696A JP 2024113696 A JP2024113696 A JP 2024113696A JP 2024076330 A JP2024076330 A JP 2024076330A JP 2024076330 A JP2024076330 A JP 2024076330A JP 2024113696 A JP2024113696 A JP 2024113696A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- nucleic acid
- protein
- fusion protein
- nls
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 239
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 239
- 230000001177 retroviral effect Effects 0.000 title claims abstract description 111
- 238000010362 genome editing Methods 0.000 title claims description 27
- 238000003780 insertion Methods 0.000 title description 33
- 230000037431 insertion Effects 0.000 title description 33
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 475
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 381
- 108010061833 Integrases Proteins 0.000 claims abstract description 345
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims abstract description 263
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 245
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 215
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 215
- 238000000034 method Methods 0.000 claims abstract description 101
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 72
- 239000012634 fragment Substances 0.000 claims abstract description 56
- 108091033409 CRISPR Proteins 0.000 claims abstract description 38
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 4
- 102100034349 Integrase Human genes 0.000 claims description 386
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 297
- 239000013612 plasmid Substances 0.000 claims description 161
- 239000013598 vector Substances 0.000 claims description 94
- 125000003729 nucleotide group Chemical group 0.000 claims description 74
- 239000002773 nucleotide Substances 0.000 claims description 61
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 59
- 108020005004 Guide RNA Proteins 0.000 claims description 56
- 238000004806 packaging method and process Methods 0.000 claims description 55
- 230000008685 targeting Effects 0.000 claims description 49
- 238000012546 transfer Methods 0.000 claims description 46
- 101710168592 Gag-Pol polyprotein Proteins 0.000 claims description 37
- 101710091045 Envelope protein Proteins 0.000 claims description 33
- 101710188315 Protein X Proteins 0.000 claims description 33
- 241000700605 Viruses Species 0.000 claims description 31
- 230000000295 complement effect Effects 0.000 claims description 27
- 241000713800 Feline immunodeficiency virus Species 0.000 claims description 25
- 241000713704 Bovine immunodeficiency virus Species 0.000 claims description 22
- 241001430294 unidentified retrovirus Species 0.000 claims description 20
- 230000003197 catalytic effect Effects 0.000 claims description 18
- 241000714474 Rous sarcoma virus Species 0.000 claims description 17
- 241000714266 Bovine leukemia virus Species 0.000 claims description 16
- 241000713673 Human foamy virus Species 0.000 claims description 16
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 16
- 241000713730 Equine infectious anemia virus Species 0.000 claims description 15
- 101710149136 Protein Vpr Proteins 0.000 claims description 15
- 241000713311 Simian immunodeficiency virus Species 0.000 claims description 15
- 241000714165 Feline leukemia virus Species 0.000 claims description 14
- 241000598436 Human T-cell lymphotropic virus Species 0.000 claims description 14
- 241000713656 Simian foamy virus Species 0.000 claims description 14
- 241000101098 Xenotropic MuLV-related virus Species 0.000 claims description 14
- 238000000338 in vitro Methods 0.000 claims description 10
- 238000001727 in vivo Methods 0.000 claims description 10
- 230000002950 deficient Effects 0.000 claims description 9
- 241000713333 Mouse mammary tumor virus Species 0.000 claims description 8
- 208000032839 leukemia Diseases 0.000 claims description 8
- 241000714192 Human spumaretrovirus Species 0.000 claims description 7
- 241000785681 Sander vitreus Species 0.000 claims description 7
- 208000005266 avian sarcoma Diseases 0.000 claims description 7
- 201000004477 skin sarcoma Diseases 0.000 claims description 7
- 239000000463 material Substances 0.000 abstract description 3
- 102100034343 Integrase Human genes 0.000 abstract 3
- 235000018102 proteins Nutrition 0.000 description 199
- 210000004027 cell Anatomy 0.000 description 173
- 230000010354 integration Effects 0.000 description 124
- 108020004414 DNA Proteins 0.000 description 113
- 230000014509 gene expression Effects 0.000 description 102
- 108090000765 processed proteins & peptides Proteins 0.000 description 84
- 230000003612 virological effect Effects 0.000 description 69
- 239000002245 particle Substances 0.000 description 57
- 230000001404 mediated effect Effects 0.000 description 55
- 210000004962 mammalian cell Anatomy 0.000 description 50
- 230000004927 fusion Effects 0.000 description 48
- 102000004196 processed proteins & peptides Human genes 0.000 description 48
- 235000001014 amino acid Nutrition 0.000 description 46
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 39
- 102000040430 polynucleotide Human genes 0.000 description 39
- 108091033319 polynucleotide Proteins 0.000 description 39
- 239000002157 polynucleotide Substances 0.000 description 39
- 238000012384 transportation and delivery Methods 0.000 description 39
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 35
- 230000035772 mutation Effects 0.000 description 35
- 238000013459 approach Methods 0.000 description 32
- 102000053602 DNA Human genes 0.000 description 29
- 230000030648 nucleus localization Effects 0.000 description 29
- 230000000694 effects Effects 0.000 description 27
- 238000006467 substitution reaction Methods 0.000 description 27
- 150000002632 lipids Chemical class 0.000 description 26
- 238000010459 TALEN Methods 0.000 description 25
- 229940024606 amino acid Drugs 0.000 description 25
- 101000730577 Homo sapiens p21-activated protein kinase-interacting protein 1 Proteins 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 24
- 210000004899 c-terminal region Anatomy 0.000 description 24
- 239000005090 green fluorescent protein Substances 0.000 description 24
- 102100032579 p21-activated protein kinase-interacting protein 1 Human genes 0.000 description 24
- 230000004568 DNA-binding Effects 0.000 description 23
- 201000010099 disease Diseases 0.000 description 23
- 239000013604 expression vector Substances 0.000 description 22
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 21
- 102000002488 Nucleoplasmin Human genes 0.000 description 21
- -1 carboxymethyl ester Chemical class 0.000 description 21
- 108060005597 nucleoplasmin Proteins 0.000 description 21
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 230000001105 regulatory effect Effects 0.000 description 19
- 101710132601 Capsid protein Proteins 0.000 description 18
- 238000003776 cleavage reaction Methods 0.000 description 18
- 230000007017 scission Effects 0.000 description 18
- 238000013518 transcription Methods 0.000 description 18
- 230000035897 transcription Effects 0.000 description 18
- 108060001084 Luciferase Proteins 0.000 description 17
- 239000005089 Luciferase Substances 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 108090000565 Capsid Proteins Proteins 0.000 description 14
- 102100023321 Ceruloplasmin Human genes 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 14
- 241000713666 Lentivirus Species 0.000 description 14
- 108010067390 Viral Proteins Proteins 0.000 description 14
- 238000003556 assay Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000014616 translation Effects 0.000 description 14
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 13
- 239000002502 liposome Substances 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 238000013519 translation Methods 0.000 description 13
- 101710197658 Capsid protein VP1 Proteins 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 12
- 101710081079 Minor spike protein H Proteins 0.000 description 12
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 12
- 101710108545 Viral protein 1 Proteins 0.000 description 12
- 208000035475 disorder Diseases 0.000 description 12
- 238000001476 gene delivery Methods 0.000 description 12
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 12
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 11
- 239000000427 antigen Substances 0.000 description 11
- 108091007433 antigens Proteins 0.000 description 11
- 102000036639 antigens Human genes 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 210000004940 nucleus Anatomy 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000010361 transduction Methods 0.000 description 11
- 108091033380 Coding strand Proteins 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 10
- 108010027225 gag-pol Fusion Proteins Proteins 0.000 description 10
- 238000001415 gene therapy Methods 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 229950010131 puromycin Drugs 0.000 description 10
- 230000026683 transduction Effects 0.000 description 10
- 239000013603 viral vector Substances 0.000 description 10
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 9
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 9
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 9
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 9
- 229960005091 chloramphenicol Drugs 0.000 description 9
- 210000003527 eukaryotic cell Anatomy 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 8
- 102000004420 Creatine Kinase Human genes 0.000 description 8
- 108010042126 Creatine kinase Proteins 0.000 description 8
- 230000007018 DNA scission Effects 0.000 description 8
- 241000702421 Dependoparvovirus Species 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 8
- 102100022678 Nucleophosmin Human genes 0.000 description 8
- 108010025568 Nucleophosmin Proteins 0.000 description 8
- 108700008625 Reporter Genes Proteins 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 210000000234 capsid Anatomy 0.000 description 8
- 238000012761 co-transfection Methods 0.000 description 8
- 239000013613 expression plasmid Substances 0.000 description 8
- 230000037433 frameshift Effects 0.000 description 8
- 230000001976 improved effect Effects 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 102220276322 rs1557058403 Human genes 0.000 description 8
- 230000001225 therapeutic effect Effects 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 108020005345 3' Untranslated Regions Proteins 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 7
- 238000010442 DNA editing Methods 0.000 description 7
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 108091092356 cellular DNA Proteins 0.000 description 7
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 108700001624 vesicular stomatitis virus G Proteins 0.000 description 7
- 101710154451 60S ribosomal protein L27-A Proteins 0.000 description 6
- 101710187898 60S ribosomal protein L28 Proteins 0.000 description 6
- 102100021671 60S ribosomal protein L29 Human genes 0.000 description 6
- 239000013607 AAV vector Substances 0.000 description 6
- 108700015125 Adenovirus DBP Proteins 0.000 description 6
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 6
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 6
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 6
- 102100039556 Galectin-4 Human genes 0.000 description 6
- 101710103773 Histone H2B Proteins 0.000 description 6
- 102100021639 Histone H2B type 1-K Human genes 0.000 description 6
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 6
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 6
- 102000006835 Lamins Human genes 0.000 description 6
- 108010047294 Lamins Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 6
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 241001505332 Polyomavirus sp. Species 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- 108010087776 Proto-Oncogene Proteins c-myb Proteins 0.000 description 6
- 102000009096 Proto-Oncogene Proteins c-myb Human genes 0.000 description 6
- 101100289792 Squirrel monkey polyomavirus large T gene Proteins 0.000 description 6
- 108010085012 Steroid Receptors Proteins 0.000 description 6
- 102000007451 Steroid Receptors Human genes 0.000 description 6
- 241000193996 Streptococcus pyogenes Species 0.000 description 6
- 102100029210 Tetratricopeptide repeat protein 37 Human genes 0.000 description 6
- 101710129246 Tetratricopeptide repeat protein 37 Proteins 0.000 description 6
- 102000005610 Thyroid Hormone Receptors alpha Human genes 0.000 description 6
- 108010045070 Thyroid Hormone Receptors alpha Proteins 0.000 description 6
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 6
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 6
- 102220505382 Uncharacterized protein C1orf141_E85G_mutation Human genes 0.000 description 6
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 230000000692 anti-sense effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 208000006454 hepatitis Diseases 0.000 description 6
- 231100000283 hepatitis Toxicity 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 108700032552 influenza virus INS1 Proteins 0.000 description 6
- 210000005053 lamin Anatomy 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000006780 non-homologous end joining Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 208000024891 symptom Diseases 0.000 description 6
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 5
- 102100024108 Dystrophin Human genes 0.000 description 5
- 101710117538 Endogenous retrovirus group FC1 Env polyprotein Proteins 0.000 description 5
- 101710167714 Endogenous retrovirus group K member 18 Env polyprotein Proteins 0.000 description 5
- 101710152279 Endogenous retrovirus group K member 21 Env polyprotein Proteins 0.000 description 5
- 101710197529 Endogenous retrovirus group K member 25 Env polyprotein Proteins 0.000 description 5
- 101710141424 Endogenous retrovirus group K member 6 Env polyprotein Proteins 0.000 description 5
- 101710159911 Endogenous retrovirus group K member 8 Env polyprotein Proteins 0.000 description 5
- 101710205628 Endogenous retrovirus group K member 9 Env polyprotein Proteins 0.000 description 5
- 101710203526 Integrase Proteins 0.000 description 5
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 108010076039 Polyproteins Proteins 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 101710091286 Syncytin-1 Proteins 0.000 description 5
- 101710091284 Syncytin-2 Proteins 0.000 description 5
- 101710184535 Transmembrane protein Proteins 0.000 description 5
- 101710141239 Transmembrane protein domain Proteins 0.000 description 5
- 101710090322 Truncated surface protein Proteins 0.000 description 5
- 101710110267 Truncated transmembrane protein Proteins 0.000 description 5
- 108700010756 Viral Polyproteins Proteins 0.000 description 5
- 239000006143 cell culture medium Substances 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000004186 co-expression Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 230000001566 pro-viral effect Effects 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 210000002027 skeletal muscle Anatomy 0.000 description 5
- 239000007790 solid phase Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 108010069091 Dystrophin Proteins 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 101001053946 Homo sapiens Dystrophin Proteins 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 101150055766 cat gene Proteins 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000035800 maturation Effects 0.000 description 4
- 239000000693 micelle Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 210000001087 myotubule Anatomy 0.000 description 4
- 238000010647 peptide synthesis reaction Methods 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 3
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 3
- 101150018129 CSF2 gene Proteins 0.000 description 3
- 101150069031 CSN2 gene Proteins 0.000 description 3
- 101150074775 Csf1 gene Proteins 0.000 description 3
- 108010069514 Cyclic Peptides Proteins 0.000 description 3
- 102000001189 Cyclic Peptides Human genes 0.000 description 3
- 206010016654 Fibrosis Diseases 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 3
- 102000012330 Integrases Human genes 0.000 description 3
- 239000000232 Lipid Bilayer Substances 0.000 description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 3
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 3
- 230000007022 RNA scission Effects 0.000 description 3
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 3
- 241000712907 Retroviridae Species 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 230000002308 calcification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 101150055601 cops2 gene Proteins 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 150000001945 cysteines Chemical class 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 210000000188 diaphragm Anatomy 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000013401 experimental design Methods 0.000 description 3
- 210000003414 extremity Anatomy 0.000 description 3
- 230000004761 fibrosis Effects 0.000 description 3
- 238000003205 genotyping method Methods 0.000 description 3
- 210000002216 heart Anatomy 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 238000010172 mouse model Methods 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 210000000633 nuclear envelope Anatomy 0.000 description 3
- 230000025308 nuclear transport Effects 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 238000007363 ring formation reaction Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 241000190525 Acropora millepora Species 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 2
- 101100493735 Arabidopsis thaliana BBX25 gene Proteins 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 208000037150 Dysferlin-related limb-girdle muscular dystrophy R2 Diseases 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 239000005977 Ethylene Substances 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108010058643 Fungal Proteins Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Chemical compound OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 208000029549 Muscle injury Diseases 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 101100072646 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) INO4 gene Proteins 0.000 description 2
- 101100311254 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) STH1 gene Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 101100277996 Symbiobacterium thermophilum (strain T / IAM 14863) dnaA gene Proteins 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 239000012736 aqueous medium Substances 0.000 description 2
- 201000009563 autosomal recessive limb-girdle muscular dystrophy type 2B Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000001055 blue pigment Substances 0.000 description 2
- 102220355148 c.260A>G Human genes 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 239000013626 chemical specie Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000002716 delivery method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- RNPXCFINMKSQPQ-UHFFFAOYSA-N dicetyl hydrogen phosphate Chemical compound CCCCCCCCCCCCCCCCOP(O)(=O)OCCCCCCCCCCCCCCCC RNPXCFINMKSQPQ-UHFFFAOYSA-N 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000010441 gene drive Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 230000013632 homeostatic process Effects 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000034184 interaction with host Effects 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 201000006938 muscular dystrophy Diseases 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000007030 peptide scission Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 210000000605 viral structure Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-BIIVOSGPSA-N 2'-deoxythymidine Natural products O=C1NC(=O)C(C)=CN1[C@@H]1O[C@@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-BIIVOSGPSA-N 0.000 description 1
- LBLYYCQCTBFVLH-UHFFFAOYSA-N 2-Methylbenzenesulfonic acid Chemical compound CC1=CC=CC=C1S(O)(=O)=O LBLYYCQCTBFVLH-UHFFFAOYSA-N 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229960000549 4-dimethylaminophenol Drugs 0.000 description 1
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-dimethylaminopyridine Substances CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- SIBMIRVJDKGAIZ-CWUIGSMPSA-N 5-(2-aminopropyl)-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(CC(N)C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 SIBMIRVJDKGAIZ-CWUIGSMPSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- ASUCSHXLTWZYBA-UMMCILCDSA-N 8-Bromoguanosine Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Br)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ASUCSHXLTWZYBA-UMMCILCDSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000567147 Aeropyrum Species 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000713826 Avian leukosis virus Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- RLKKUFCOPKQDLH-OSPHWJPCSA-N C1(=CC=CC=2C3=CC=CC=C3CC1=2)COC(=O)ON([C@@H]([C@H](O)C)C(=O)OP(=O)(O)O)CC1=CC=CC=C1 Chemical class C1(=CC=CC=2C3=CC=CC=C3CC1=2)COC(=O)ON([C@@H]([C@H](O)C)C(=O)OP(=O)(O)O)CC1=CC=CC=C1 RLKKUFCOPKQDLH-OSPHWJPCSA-N 0.000 description 1
- 240000001432 Calendula officinalis Species 0.000 description 1
- 235000005881 Calendula officinalis Nutrition 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000191366 Chlorobium Species 0.000 description 1
- 241000588881 Chromobacterium Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102000004168 Dysferlin Human genes 0.000 description 1
- 108090000620 Dysferlin Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101100126143 Escherichia coli O111:H- insF gene Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 101000736086 Felis catus PC4 and SFRS1-interacting protein Proteins 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241001135750 Geobacter Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 241000204988 Haloferax mediterranei Species 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 102220554411 Holliday junction recognition protein_K71R_mutation Human genes 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101001116668 Homo sapiens Prefoldin subunit 3 Proteins 0.000 description 1
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 1
- 101000835860 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Proteins 0.000 description 1
- 108010004519 Human Immunodeficiency Virus vpr Gene Products Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100039137 Insulin receptor-related protein Human genes 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 241000204675 Methanopyrus Species 0.000 description 1
- 241000205276 Methanosarcina Species 0.000 description 1
- 241000589345 Methylococcus Species 0.000 description 1
- 201000001087 Miyoshi muscular dystrophy Diseases 0.000 description 1
- 208000009376 Miyoshi myopathy Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 102000008763 Neurofilament Proteins Human genes 0.000 description 1
- 108010088373 Neurofilament Proteins Proteins 0.000 description 1
- 241000605122 Nitrosomonas Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- TTZMPOZCBFTTPR-UHFFFAOYSA-N O=P1OCO1 Chemical compound O=P1OCO1 TTZMPOZCBFTTPR-UHFFFAOYSA-N 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 241000607568 Photobacterium Species 0.000 description 1
- 241000204826 Picrophilus Species 0.000 description 1
- 241001527104 Plautia stali Species 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 102100024884 Prefoldin subunit 3 Human genes 0.000 description 1
- 241000205226 Pyrobaculum Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 1
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 1
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 208000027073 Stargardt disease Diseases 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241000186339 Thermoanaerobacter Species 0.000 description 1
- 241000204652 Thermotoga Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108700022715 Viral Proteases Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 241000605941 Wolinella Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- ATBOMIWRCZXYSZ-XZBBILGWSA-N [1-[2,3-dihydroxypropoxy(hydroxy)phosphoryl]oxy-3-hexadecanoyloxypropan-2-yl] (9e,12e)-octadeca-9,12-dienoate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC ATBOMIWRCZXYSZ-XZBBILGWSA-N 0.000 description 1
- 235000011054 acetic acid Nutrition 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000001668 ameliorated effect Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001414 amino alcohols Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 239000000823 artificial membrane Substances 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- DMLAVOWQYNRWNQ-UHFFFAOYSA-N azobenzene Chemical compound C1=CC=CC=C1N=NC1=CC=CC=C1 DMLAVOWQYNRWNQ-UHFFFAOYSA-N 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical compound OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 229940092714 benzenesulfonic acid Drugs 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003012 bilayer membrane Substances 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000004640 cellular pathway Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000015165 citric acid Nutrition 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000001246 colloidal dispersion Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 229940093541 dicetylphosphate Drugs 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- BPHQZTVXXXJVHI-UHFFFAOYSA-N dimyristoyl phosphatidylglycerol Chemical compound CCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCCCCCCCC BPHQZTVXXXJVHI-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- KPUWHANPEXNPJT-UHFFFAOYSA-N disiloxane Chemical class [SiH3]O[SiH3] KPUWHANPEXNPJT-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000003365 immunocytochemistry Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000001630 malic acid Substances 0.000 description 1
- 235000011090 malic acid Nutrition 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000003228 microsomal effect Effects 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 230000004220 muscle function Effects 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 230000009707 neogenesis Effects 0.000 description 1
- 210000005044 neurofilament Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 231100001160 nonlethal Toxicity 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002953 preparative HPLC Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000005664 protein glycosylation in endoplasmic reticulum Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 239000002213 purine nucleotide Substances 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 239000002719 pyrimidine nucleotide Substances 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 102220036548 rs140382474 Human genes 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 230000035892 strand transfer Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000018412 transposition, RNA-mediated Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
【課題】本発明は、ゲノム物質を編集するためのレトロウイルスインテグラーゼとCasタンパク質とを含む融合タンパク質、関連する核酸、系及び方法を提供する。【解決手段】a)第1のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片、b)第2のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、及びc)第3のアミノ酸配列を有する核局在化シグナル(NLS)を含む、融合タンパク質。【選択図】図1A
Description
関連出願の相互参照
本出願は、2018年10月22日に出願された米国特許仮出願シリアル番号第62/748,703号に対する優先権を主張するものであり、この仮出願は、その全体が参照により本明細書に組み込まれる。
本出願は、2018年10月22日に出願された米国特許仮出願シリアル番号第62/748,703号に対する優先権を主張するものであり、この仮出願は、その全体が参照により本明細書に組み込まれる。
CRISPR-Cas9により、基礎研究及び臨床適用のために哺乳動物ゲノムを迅速に改変する能力が大幅に向上した。CRISPR-Cas9は、ガイドRNAを使用してCas9を特定のDNA標的配列に誘導し、そこで二本鎖DNA切断を誘発し、細胞修復経路を作動させてフレームシフト突然変異を導入するか、または相同組換え修復(HDR)を介してドナー配列を挿入する。これらの著しい進歩にもかかわらず、CRISPR-Cas9媒介性HDRを使用したゲノム編集のための大型DNA配列の標的化送達は、依然として非効率的であり、かなり大きな隣接相同領域を含むドナー鋳型を必要とし、かつp53 DNA損傷経路を誘発する(Byrne et al.,2015,NAR 43:e21、Happaniemi et al.,2018,Nat Med 24:927-30、Ihry et al.,2018,Nat Med 24:939-46)。総合すると、これらはCRISPR-Cas9ゲノム編集の効率を著しく制限する。したがって、統合的なゲノム編集の改善が必要とされている。
対照的に、レンチウイルス酵素であるインテグラーゼ(IN)は、標的配列の相同性を必要としないプロセスを介して大型レンチウイルスゲノムの宿主細胞DNAへの挿入を触媒するのに、必要かつ十分である。レンチウイルスDNAのIN媒介性挿入は、DNAに非特異的に結合するC末端ドメインに部分的に起因して、DNA標的配列の特異性がほとんどない状態で生じる(Lutzke & Plasterk 1998,J Virol 72:4841-48)。
遺伝子治療技術に関する現在の制限により、大部分のヒト単一遺伝子疾患の治療が妨げられている。CRISPR-Cas9遺伝子編集は、近年、哺乳動物ゲノムの有害な突然変異を修復するための治療的アプローチの開発に関して注目されている。これは、疾患及び障害を引き起こす可能性のあるヒトゲノム内の多数の患者特異的突然変異に起因して、依然として相当な難題である。エクソン-イントロン境界を標的とするように設計されたCRISPRガイドRNAにより、これらの突然変異群を標的とするエクソンスキッピング戦略が可能となるが、しかしながら、これらの戦略の有効性は依然として試験されておらず、すべての患者に適用できるわけではない。
多くの遺伝子の遺伝子導入発現は、動物モデルにおいて疾患結果を予防しかつ回復させることができるが、一部の遺伝子の大型のサイズは、CRISPR-Cas9などの従来の遺伝子編集アプローチ、またはAAV(限度約4.9kb)などの従来のウイルス遺伝子治療アプローチのサイズ制限を大幅に超過しており、ヒト遺伝子治療への使用が妨げられている。AAVによって送達される、より小さな操作された遺伝子を使用するアプローチは現在臨床試験中であるが、これらの戦略が長期的な回復をもたらすかどうか、及び特定の突然変異を有する患者にのみに適用可能かどうかは、依然として明らかになっていない。
対照的に、レンチウイルスベクターは大型遺伝子を送達することができ、宿主ゲノムへの組み込みにより永続的な修復が可能となる。しかし、レンチウイルス組み込みの現在のランダムな性質は、オフターゲット突然変異及び疾患を引き起こす可能性があり、これにより臨床用途へのこれらの使用が妨げられている(Milone et al.,2018,Leukemia 23:1529-41)。レンチウイルス配列は、ゲノム組み込みに必要な非特異的DNA結合ドメインを利用する、ウイルスにコードされた酵素インテグラーゼ(IN)によって宿主ゲノムに挿入される(Andrake et al.,2015,Annu Rev Virol 2:241-64)。
したがって、ゲノム物質の編集の改善が必要とされている。本発明は、この必要性を満たす。
一態様では、本発明は、融合タンパク質を提供する。一実施形態では、融合タンパク質は、第1のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片、第2のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、及び第3のアミノ酸配列を有する核局在化シグナル(NLS)を含む。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、及びウシ免疫不全ウイルス(BIV)INからなる群から選択される。
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
一実施形態では、Casタンパク質は、Cas9、Cas13及びCpf1からなる群から選択される。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも95%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、レトロトランスポゾンNLSは、Ty1 NLSまたはTy2 NLSである。一実施形態では、NLSは、Ty1様NLSである。一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つの配列を含む。
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
一態様では、本発明は、本発明の融合タンパク質をコードする核酸を提供する。一実施形態では、核酸は、配列番号155~196のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、核酸は、配列番号155~196から選択される配列を含む。
一態様では、本発明は、遺伝物質を編集する方法を提供する。一実施形態では、本方法は、(a)本発明の融合タンパク質または本発明の融合タンパク質をコードする核酸分子、(b)遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸、ならびに(c)U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、遺伝物質の編集方法は、in vitro法である。一実施形態では、遺伝物質の編集方法は、in vivo法である。
一態様では、本発明は、遺伝物質を編集するための系を提供する。一実施形態では、この系は、(a)本発明の融合タンパク質をコードする核酸配列、(b)CRISPR-Cas系ガイドRNAをコードする核酸配列、ならびに(c)ドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、融合タンパク質は、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質、及び核局在化シグナル(NLS)を含む。一実施形態では、核酸は、同じベクター上に存在する。一実施形態では、核酸は、異なるベクター上に存在する。
一実施形態では、CRISPR-Cas系ガイドRNAは、遺伝子の標的DNA配列に実質的にハイブリダイズする。一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
一態様では、本発明は、ゲノム編集成分を送達するための系を提供する。一実施形態では、この系は、(a)触媒的に死んだCas(dCas)タンパク質に融合されたインテグラーゼを含むgag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、(b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、ならびに(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、ガイドRNA配列をコードする配列をさらに含む。
一実施形態では、この系は、(a)gag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、(b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド、ならびに(d)VPR、インテグラーゼ及び触媒的に死んだCas(dCas)を含む融合タンパク質をコードする核酸配列を含むVPR-IN-dCasプラスミドを含む。一実施形態では、VPR-IN-dCasプラスミドは、ガイドRNA配列をコードする配列をさらに含む。
一実施形態では、この系は、(a)gag-polポリタンパク質をコードする核酸配列を含むパッケージングプラスミド、(b)ガイドRNA、融合タンパク質(インテグラーゼ及び触媒的に死んだCasを含む)、5’LTRならびに3’LTRをコードする核酸配列を含む導入プラスミド、ならびに(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミドを含む。
以下の本発明の実施形態の詳細な説明は、添付図面と併せて読むとより良好に理解されるであろう。しかしながら、本発明は、図面に示される実施形態の正確な配置及び手段に限定されないことを理解されたい。
本発明は、遺伝物質を編集するための融合タンパク質、融合タンパク質をコードする核酸、系及び方法に関する。一実施形態では、本発明は、レトロウイルスインテグラーゼ(IN)-CRISPR関連(Cas)融合タンパク質、及びレトロウイルスIN-Cas融合タンパク質をコードする核酸分子に関する。一実施形態では、IN-Cas融合タンパク質は、核局在化シグナル(NLS)をさらに含む。
本発明の融合タンパク質、核酸分子、系及び方法は、ドナーDNA配列を標的ゲノム位置に送達する能力を有する。さらに、本発明は、相同性アームを不要にしてガイドRNAによる標的化に依存し、遺伝物質の編集を大幅に簡素化する。
一態様では、本発明は、IN-Cas融合タンパク質を提供する。一実施形態では、融合タンパク質は、第1のアミノ酸配列を有するレトロウイルスINまたはその断片、第2のアミノ酸配列を有するCasタンパク質、及び第3のアミノ酸配列を有するNLSを含む。
一態様では、本発明は、IN-Cas融合タンパク質をコードする核酸分子を提供する。一実施形態では、核酸分子は、レトロウイルスINまたはその断片をコードする第1の核酸配列、Casタンパク質をコードする第2の核酸配列、及びNLSをコードする第3の核酸配列を含む。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INであり得る。一実施形態では、Casタンパク質は、Cas9またはCpf1である。一実施形態では、NLSは、Ty1 NLSなどのレトロトランスポゾンNLSである。一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。
一態様では、本発明は、遺伝物質を編集するための系を提供する。一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスINまたはその断片、Casタンパク質及びNLSを含む核酸配列;CRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。
一態様では、本発明は、遺伝物質を編集するための方法を提供する。一実施形態では、本発明の核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を投与することを含む方法。
定義
別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。
別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。
概して、本明細書で使用される命名法ならびに細胞培養、分子遺伝学、有機化学、及び核酸化学及びハイブリダイゼーションにおける実験手順は、当該技術分野で周知であり、一般的に用いられるものである。
核酸及びペプチド合成には、標準的技術が使用される。技術及び手順は、概して、当該技術分野における従来の方法及び本明細書全体にわたり提供される様々な一般的な参照文献(例えば、Sambrook and Russell,2012,Molecular Cloning,A Laboratory Approach,Cold Spring Harbor Press,Cold Spring Harbor,NY、及びAusubel et al.,2012,Current Protocols in Molecular Biology,John Wiley & Sons,NY)に従って実施される。
本明細書で使用される命名法ならびに以下に記載される分析化学及び有機合成で使用される実験手順は、当該技術分野で周知であり、一般的に用いられるものである。標準的技術またはその改変は、化学合成及び化学分析に使用される。
本発明の文脈中で(特に特許請求の範囲の文脈中で)使用される「a」、「an」、「the」という用語及び類似の用語は、本明細書中に別段の定めなき限りまたは文脈により明らかに矛盾しない限り、単数及び複数の両方を含むと解釈されるべきである。
量、時間の持続期間などの測定可能な値を指すときに本明細書で使用される「約」は、指定の値から±20%、または±10%、または±5%、または±1%、または±0.1%の変動を、そのような変動が開示された方法を実施するために適切である場合に包含することを意味する。
「アンチセンス」は、特に、タンパク質をコードする二本鎖DNA分子の非コード鎖の核酸配列、または非コード鎖に実質的に相同である配列を指す。本明細書で定義されるように、アンチセンス配列は、タンパク質をコードする二本鎖DNA分子の配列に相補的である。アンチセンス配列が、DNA分子のコード鎖のコード部分のみに相補的である必要はない。アンチセンス配列は、タンパク質をコードするDNA分子のコード鎖上に指定された調節配列に相補的であり得、この調節配列は、コード配列の発現を制御する。
「疾患」は、動物が恒常性を維持することができず、疾患が改善されない場合は動物の健康が悪化し続ける、動物の健康状態である。
対照的に、動物における「障害」は、動物が恒常性を維持できるが、その動物の健康状態がその障害が存在しないときよりも好ましくない、健康状態である。障害は、治療せずに放置しても必ずしも動物の健康状態をさらに低下させるとは限らない。
疾患もしくは障害の徴候もしくは症状の重症度、そのような徴候もしくは症状が患者によって経験される頻度、またはその両方が低減される場合、疾患または障害は「軽減」される。
「コードする」とは、定義されたヌクレオチド配列(すなわち、rRNA、tRNA及びmRNA)または定義されたアミノ酸配列のいずれか、及びそれらから生じる生物学的特性を有する生物学的プロセスにおける他のポリマー及び高分子の合成のための鋳型として機能するための、遺伝子、cDNA、またはmRNAなどのポリヌクレオチド中のヌクレオチドの特定の配列の固有の性質を指す。したがって、遺伝子は、その遺伝子に対応するmRNAの転写及び翻訳が、細胞または他の生物系においてタンパク質を生じさせる場合、タンパク質をコードする。ヌクレオチド配列がmRNA配列と同一であり、通常は配列表に示されるコード鎖と、遺伝子またはcDNAの転写のための鋳型として使用される非コード鎖の両方を、その遺伝子またはcDNAのタンパク質または他の産物をコードすると称することができる。
「患者」、「対象」、「個体」などの用語は、本明細書において互換的に使用され、in vitroであるかin vivoであるかを問わず、本明細書に記載の方法に適用可能な任意の動物またはその細胞を指す。特定の非限定的な実施形態では、患者、対象または個体は、ヒトである。
抗体に関して本明細書で使用される「特異的に結合する」という用語は、特定の抗原を認識するが、試料中の他の分子を実質的に認識しないか、またはそれらに結合しない抗体を意味する。例えば、1つの種に由来する抗原に特異的に結合する抗体はまた、1つ以上の種に由来するその抗原にも結合し得る。しかし、そのような異種間の反応性それ自体が、特異的なものとしての抗体の分類を変更することはない。別の例では、抗原に特異的に結合する抗体は、その抗原の異なる対立遺伝子形態にも結合し得る。しかしながら、そのような交差反応性それ自体が、特異的なものとしての抗体の分類を変更することはない。
場合によっては、「特異的結合」または「特異的に結合」という用語は、抗体、タンパク質、またはペプチドと第2の化学種との相互作用に関して、この相互作用が、化学種の特定の構造(例えば、抗原決定基またはエピトープ)の存在に依存することを意味するのに使用され得る。例えば、抗体はタンパク質全体にではなく、特定のタンパク質構造を認識してそれに結合する。抗体がエピトープ「A」に特異的である場合、標識された「A」及び抗体を含む反応物中にエピトープA(または遊離の非標識のA)を含む分子が存在すると、抗体に結合する標識されたAの量が減少する。
遺伝子の「コード領域」は、遺伝子の転写によって産生されるmRNA分子のコード領域とそれぞれ相同または相補的である、遺伝子のコード鎖のヌクレオチド残基及び遺伝子の非コード鎖のヌクレオチドからなる。
mRNA分子の「コード領域」はまた、mRNA分子の翻訳中に転移RNA分子のアンチコドン領域と一致するかまたは停止コドンをコードする、mRNA分子のヌクレオチド残基からなる。したがって、コード領域は、mRNA分子によってコードされる成熟タンパク質に存在しないアミノ酸残基のコドンを含むヌクレオチド残基(例えば、タンパク質輸送シグナル配列中のアミノ酸残基)を含み得る。
核酸に言及するために本明細書で使用される「相補的」は、2つの核酸鎖の領域間、または同じ核酸鎖の2つの領域間の配列相補性の広範な概念を指す。第1の核酸領域のアデニン残基は、第1の領域に対して逆平行である第2の核酸領域の残基と、この残基がチミンまたはウラシルである場合に特異的な水素結合を形成(「塩基対形成」)できることが知られている。同様に、第1の核酸鎖のシトシン残基は、第1の鎖に対して逆平行である第2の核酸鎖の残基と、この残基がグアニンである場合に塩基対形成できることが知られている。核酸の第1の領域は、2つの領域が逆平行の形で配置され、第1の領域の少なくとも1つのヌクレオチド残基が第2の領域の残基と塩基対形成できる場合、同一または異なる核酸の第2の領域と相補的である。一実施形態では、第1の領域は第1の部分を含み、第2の領域は第2の部分を含み、それにより、第1及び第2の部分が逆平行の形で配置される場合、第1の部分のヌクレオチド残基の少なくとも約50%、少なくとも約75%、少なくとも約90%、または少なくとも約95%が、第2の部分のヌクレオチド残基と塩基対形成できる。一実施形態では、第1の部分のすべてのヌクレオチド残基は、第2の部分のヌクレオチド残基と塩基対形成できる。
本明細書で使用される「DNA」という用語は、デオキシリボ核酸と定義される。
本明細書で使用される場合、「発現」という用語は、特定のヌクレオチド配列のそのプロモーターによって駆動される転写及び/または翻訳として定義される。
本明細書で使用される場合、「発現ベクター」という用語は、転写され得る遺伝子産物の少なくとも一部をコードする核酸配列を含むベクターを指す。場合によっては、RNA分子は続いて、タンパク質、ポリペプチド、またはペプチドに翻訳される。他の場合では、これらの配列は、例えば、アンチセンス分子、siRNA、リボザイムなどの産生において翻訳されない。発現ベクターは、特定の宿主生物における作動可能に連結されたコード配列の転写及び場合により翻訳に必要な核酸配列を指す、様々な制御配列を含み得る。転写及び翻訳を管理する制御配列に加えて、ベクター及び発現ベクターは、他の機能も同様に果たす核酸配列を含み得る。
本明細書で使用される場合、「野生型」という用語は、当業者によって理解される当該技術分野の用語であり、突然変異体形態または変異体形態とは区別される、自然界に存在するような生物、株、遺伝子または特徴の典型的な形態を意味する。
「相同性」という用語は、相補性の程度を指す。部分的な相同性または完全な相同性(すなわち、同一性)があってもよい。相同性は、多くの場合、配列解析ソフトウェア(例えば、Genetics Computer Group. University of Wisconsin Biotechnology Center.1710 University Avenue. Madison,Wis.53705の Sequence Analysis Software Package)を使用して測定される。そのようなソフトウェアは、様々な置換、欠失、挿入、及び他の修飾に相同性の程度を割り当てることによって、類似配列を合致させる。保存的置換は、通常、以下の群、すなわち、グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;及びフェニルアラニン、チロシン内の置換を含む。
「単離された」とは、天然状態から変化または除去されたことを意味する。例えば、生存している動物においてその通常の状況で天然に存在する核酸またはペプチドは「単離され」ていないが、その天然の状況の共存物質から部分的にまたは完全に分離された同じ核酸またはペプチドは「単離され」ている。単離された核酸またはタンパク質は、実質的に精製された形態で存在することができ、または、例えば、宿主細胞などの非天然環境に存在することができる。
「単離された」という用語は、「単離されたオリゴヌクレオチド」または「単離されたポリヌクレオチド」のように核酸に関して使用されるとき、その供給源中で通常会合している少なくとも1つの混入物から同定され、分離される核酸配列を指す。したがって、単離された核酸は、それが自然界に見出されるものとは異なる形態または状況に存在する。対照的に、単離されていない核酸(例えば、DNA及びRNA)は、それらが自然界に存在する状態で見出される。例えば、所与のDNA配列(例えば、遺伝子)は、隣接遺伝子に近接して宿主細胞染色体上に見出され、RNA配列(例えば、特定のタンパク質をコードする特定のmRNA配列)は、多数のタンパク質をコードする複数の他のmRNAとの混合物として細胞中に見出される。しかしながら、単離された核酸は、例として、その核酸を通常発現する細胞中のそのような核酸を含み、そこで核酸は、天然細胞のものと異なる染色体位置にあるか、またはそうでなければ自然界に見出されるものと異なる核酸配列に隣接している。単離された核酸またはオリゴヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。単離された核酸またはオリゴヌクレオチドがタンパク質を発現するために利用されるとき、このオリゴヌクレオチドは、センス鎖またはコード鎖を最低限含む(すなわち、オリゴヌクレオチドは一本鎖であってよい)が、センス鎖及びアンチセンス鎖の両方を含んでもよい(すなわち、オリゴヌクレオチドは、二本鎖であってもよい)。
「単離された」という用語は、「単離されたタンパク質」または「単離されたポリペプチド」のようにポリペプチドに関して使用されるとき、その供給源中で通常会合している少なくとも1つの混入物から同定され、分離されるポリペプチドを指す。したがって、単離された核酸は、それが自然界に見出されるものとは異なる形態または状況に存在する。対照的に、単離されていないポリペプチド(例えば、タンパク質及び酵素)は、それらが自然界に存在する状態で見出される。
「核酸」とは、デオキシリボヌクレオシドで構成されているかまたはリボヌクレオシドで構成されているかにかかわらず、かつホスホジエステル結合で構成されているかまたは修飾結合、例えば、ホスホトリエステル、ホスホロアミデート、シロキサン、カーボネート、カルボキシメチルエステル、アセトアミデート、カルバメート、チオエーテル、架橋ホスホロアミデート、架橋メチレンホスホネート、ホスホロチオエート、メチルホスホネート、ホスホロジチオエート、架橋ホスホロチオエートもしくはスルホン結合、及びそのような結合の組み合わせで構成されているかにかかわらず、任意の核酸を意味する。核酸という用語はまた、生物学的に存在する5つの塩基(アデニン、グアニン、チミン、シトシン及びウラシル)以外の塩基から構成される核酸も具体的に含む。「核酸」という用語は、通常、大型のポリヌクレオチドを指す。
本明細書では、ポリヌクレオチド配列を記述するために従来の表記法が使用される。一本鎖ポリヌクレオチド配列の左端は5’末端であり、二本鎖ポリヌクレオチド配列の左側方向は、5’方向と称される。
新生RNA転写物へのヌクレオチドの5’から3’への付加の方向は、転写方向と称される。mRNAと同じ配列を有するDNA鎖は「コード鎖」と称され、DNA上の参照点に対して5’に位置するDNA鎖上の配列は「上流配列」と称され、DNA鎖上の参照点に対して3’であるDNA鎖上の配列は、「下流配列」と称される。
「発現カセット」とは、コード配列の転写及び場合により翻訳に必要なプロモーター/調節配列に作動可能に連結されたコード配列を含む核酸分子を意味する。
本明細書で使用される「作動可能に連結された」という用語は、所与の遺伝子の転写及び/または所望のタンパク質分子の合成を指示することができる核酸分子が産生されるような方法での核酸配列の連結を指す。この用語はまた、機能的(例えば、酵素的に活性、結合パートナーに結合することが可能、阻害することが可能など)タンパク質またはポリペプチドが産生されるような方法でアミノ酸をコードする配列の連結を指す。
本明細書で使用される場合、「プロモーター/調節配列」という用語は、プロモーター/調節配列に作動可能に連結された遺伝子産物の発現に必要な核酸配列を意味する。場合によっては、この配列はコアプロモーター配列であり得、他の例では、この配列はまた、遺伝子産物の発現に必要なエンハンサー配列及び他の調節エレメントを含み得る。プロモーター/調節配列は、例えば、遺伝子産物を誘導可能な方法で発現させるものであり得る。
本明細書で使用される場合、ハイブリダイゼーションに関する「ストリンジェントな条件」は、標的配列に対して相補性を有する核酸が標的配列と主にハイブリダイズし、非標的配列に実質的にハイブリダイズしない条件を指す。ストリンジェントな条件は、一般に配列依存的であり、いくつかの要因によって変動する。一般に、配列が長いほど、その配列がその標的配列に特異的にハイブリダイズする温度は高くなる。ストリンジェントな条件の非限定的な例は、Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part 1,Second Chapter “Overview of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.に詳細が記載されている。
「ハイブリダイゼーション」は、1つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合を介して安定化される複合体を形成する反応を指す。水素結合は、ワトソンクリック塩基対形成、フーグスティーン結合、または他の任意の配列特異的な方法により生じ得る。複合体は、二本鎖構造を形成する2本の鎖、多鎖複合体を形成する3本以上の鎖、単一の自己ハイブリダイズ鎖、またはこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、PCRの開始、または酵素によるポリヌクレオチドの切断などの、より広範なプロセスのステップを構成し得る。所与の配列とハイブリダイズすることができる配列は、所与の配列の「相補体」と称される。
「誘導性」プロモーターは、遺伝子産物をコードまたは特定するポリヌクレオチドと作動可能に連結された場合、プロモーターに対応するインデューサーが存在する場合にのみ遺伝子産物を実質的に産生させるヌクレオチド配列である。
「構成的」プロモーターは、遺伝子産物をコードまたは特定するポリヌクレオチドと作動可能に連結された場合、細胞中で細胞の大部分またはすべての生理学的条件下において遺伝子産物を産生させるヌクレオチド配列である。
本明細書で使用される「ポリヌクレオチド」という用語は、ヌクレオチドの鎖として定義される。さらに、核酸はヌクレオチドのポリマーである。したがって、本明細書で使用される核酸及びポリヌクレオチドは互換的である。当業者は、核酸がポリヌクレオチドであり、これを単量体の「ヌクレオチド」に加水分解することができるという一般的知識を有する。単量体ヌクレオチドを、ヌクレオシドに加水分解することができる。本明細書で使用される場合、ポリヌクレオチドには、限定されないが、当該技術分野で利用可能な任意の手段によって得られるすべての核酸配列が含まれ、これら手段には、限定されないが、通常のクローニング技術及びPCRなどを使用した、ならびに合成的手段による、組換え手段すなわち組換えライブラリーまたは細胞ゲノムからの核酸配列のクローニングが含まれる。
本発明との関係において、一般に存在する核酸塩基に関する以下の略称が使用される。「A」はアデノシンを指し、「C」はシトシンを指し、「G」はグアノシンを指し、「T」はチミジンを指し、「U」はウリジンを指す。
本明細書で使用される場合、「ペプチド」、「ポリペプチド」及び「タンパク質」という用語は、互換的に使用され、ペプチド結合によって共有結合したアミノ酸残基から構成される化合物を指す。タンパク質またはペプチドには少なくとも2つのアミノ酸が含まれている必要があり、タンパク質またはペプチドの配列を構成することができるアミノ酸の最大数に制限は設けられていない。ポリペプチドには、ペプチド結合によって互いに連結した2つ以上のアミノ酸を含む任意のペプチドまたはタンパク質が含まれる。本明細書で使用される場合、この用語は、例えば、当該技術分野で一般にペプチド、オリゴペプチド及びオリゴマーとも称される短い鎖と、当該技術分野で一般にタンパク質と称され、多くのタイプが存在するより長い鎖の両方を指す。「ポリペプチド」には、例えば、特に、生物学的に活性な断片、実質的に相同なポリペプチド、オリゴペプチド、ホモ二量体、ヘテロ二量体、ポリペプチドの変異体、修飾ポリペプチド、誘導体、類似体、融合タンパク質が含まれる。ポリペプチドには、天然ペプチド、組換えペプチド、合成ペプチド、またはそれらの組み合わせが含まれる。
本明細書で使用される「RNA」という用語は、リボ核酸と定義される。
「組換えポリヌクレオチド」は、天然に互いに連結していない配列を有するポリヌクレオチドを指す。増幅またはアセンブルした組換えポリヌクレオチドを適切なベクターに含めることができ、このベクターを、適切な宿主細胞を形質転換するために使用することができる。
組換えポリヌクレオチドは、非コード機能(例えば、プロモーター、複製起点、リボソーム結合部位など)も同様に果たすことができる。
本明細書で使用される「組換えポリペプチド」という用語は、組換えDNA法を使用することによって産生されるポリペプチドとして定義される。
本明細書で使用される場合、「転写活性化因子様エフェクターヌクレアーゼ(TALEN)」は、TALエフェクターDNA結合ドメインをDNA切断ドメインに融合することによって作製される人工制限酵素である。これらの反応物質は、効率的でプログラム可能な特異的DNA切断を可能にし、遺伝物質をin situで編集するための強力なツールを代表する。転写活性化因子様エフェクター(TALE)を、ほぼ任意のDNA配列に結合するように迅速に操作することができる。本明細書で使用されるTALENという用語は広義であり、別のTALENの補助なしに二本鎖DNAを切断することができる単量体TALENを含む。TALENという用語は、同じ部位でDNAを切断するために共に機能するように操作された、TALEN対の一方または両方のメンバーを指すためにも使用される。共に機能するTALENは、DNAの掌性を参照して左TALEN及び右TALENと称される場合がある。米国シリアル番号第12/965,590号、米国シリアル番号第13/426,991号(米国特許番号第8,450,471号)、米国シリアル番号第13/427,040号(米国特許番号第8,440,431号)、米国シリアル番号第13/427,137号(米国特許番号第8,440,432号)、及び米国シリアル番号第13/738,381号(これらはすべて、その全体が参照により本明細書に組み込まれる)を参照されたい。
「変異体」とは、この用語が本明細書で使用される場合、それぞれ参照核酸配列または参照ペプチド配列とは配列が異なるが、参照分子の本質的な生物学的特性を保持する、核酸配列またはペプチド配列である。核酸変異体の配列の変化は、参照核酸によってコードされるペプチドのアミノ酸配列を変化させない場合もあれば、またはアミノ酸の置換、付加、欠失、融合及びトランケーションを生じさせる場合もある。ペプチド変異体の配列の変化は、通常、限定的または保存的であるため、参照ペプチド及び変異体の配列は全体的に極めて類似しており、多くの領域では同一である。変異体及び参照ペプチドは、任意の組み合わせでの1つ以上の置換、付加、欠失によってアミノ酸配列が異なり得る。核酸またはペプチドの変異体は、対立遺伝子変異体などの天然に存在するものであり得るか、または天然に存在することが知られていない変異体であり得る。核酸及びペプチドの天然に存在しない変異体は、突然変異誘発技術または直接合成によって作製することができる。
「ベクター」は、単離された核酸を含み、単離された核酸を細胞内部に送達するために使用することができる物質の組成物である。直鎖状ポリヌクレオチド、イオン性または両親媒性化合物と会合したポリヌクレオチド、プラスミド、及びウイルスを含むがこれらに限定されない多数のベクターが、当該技術分野で公知である。したがって、「ベクター」という用語は、自律的に複製するプラスミドまたはウイルスを含む。この用語はまた、例えば、ポリリジン化合物、リポソームなどの、細胞への核酸の導入を容易にする非プラスミド及び非ウイルス化合物を含むと解釈されるべきである。ウイルスベクターの例としては、アデノウイルスベクター、アデノ随伴ウイルスベクター、レトロウイルスベクターなどが挙げられるが、これらに限定されない。
範囲:本開示全体を通して、本発明の様々な態様を範囲形式で表すことができる。範囲形式での記載は、単に便宜上及び簡潔にするためのものであり、本発明の範囲に対する不可変の制限として解釈されるべきではないことを理解されたい。したがって、範囲の記載は、その範囲内の個々の数値に加えて、すべての考えられる副次的範囲を具体的に開示していると見なされるべきである。例えば、1~6などの範囲の記述は、その範囲内の個々の数、例えば、1、2、2.7、3、4、5、5.3及び6などに加えて、1~3、1~4、1~5、2~4、2~6、3~6などの副次的範囲を具体的に開示していると見なされるべきである。これは、範囲の幅に関係なく適用される。
融合タンパク質
一態様では、本発明は、核に効果的に送達される編集タンパク質の新規融合体の開発に基づく。一態様では、本発明は、編集タンパク質と第2のアミノ酸配列を有する核局在化シグナル(NLS)とを含む融合タンパク質を提供する。
一態様では、本発明は、核に効果的に送達される編集タンパク質の新規融合体の開発に基づく。一態様では、本発明は、編集タンパク質と第2のアミノ酸配列を有する核局在化シグナル(NLS)とを含む融合タンパク質を提供する。
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合ドメインを有するタンパク質を含むが、これらに限定されない。
Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、Cas9である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、Ty1、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。一実施形態では、NLSは、配列番号47~56及び配列番号254~257のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、NLSタンパク質は、配列番号47~56及び配列番号254~257のうちの1つの配列を含む。
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。一実施形態では、Ty1様NLSは、配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Ty1様NLSタンパク質は、配列番号275~887のうちの1つの配列を含む。
一実施形態では、融合タンパク質は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号249~250のうちの1つの配列を含む。
一態様では、本発明は、核に効果的に送達される、編集タンパク質とレトロウイルスインテグラーゼタンパク質との新規融合体の開発に基づく。これらの融合タンパク質は、ウイルスインテグラーゼのDNA組み込み活性と、触媒的に死んだCasのプログラム可能なDNA標的化能力とを組み合わせる。したがって、この融合タンパク質はDNA挿入について細胞経路に依存しないか、またはATPなどの細胞エネルギー源を必要としないため、この酵素は、例えば、in vitroから原核細胞、分裂真核細胞または非分裂真核細胞に至るまで、多くの状況で機能することができる。さらに、インテグラーゼは挿入に相同性領域を必要とせず、各インテグラーゼファミリーに特異的な小さな末端モチーフ配列のみを必要とするため、これらの融合タンパク質の編集は、複数のガイドRNAによって誘導される場合、多重ゲノム組み込みのための単一DNAドナー鋳型を利用することができる。
したがって、一態様では、本発明は、第1のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、第2のアミノ酸配列を有する核局在化シグナル(NLS)、及び第3のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片もしくは変異体を含む融合タンパク質を提供する。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
一実施形態では、インテグラーゼは、レトロトランスポゾンインテグラーゼである。一実施形態では、レトロトランスポゾンインテグラーゼは、Ty1またはTy2である。一実施形態では、インテグラーゼは、細菌インテグラーゼである。一実施形態では、細菌インテグラーゼは、insFである。
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上または9つのアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。一実施形態では、インテグラーゼの断片は、完全長インテグラーゼの少なくとも1つの活性を保持している。レトロウイルスインテグラーゼの機能及び断片は当該技術分野で公知であり、例えば、Li,et al.,2011,Virology 411:194-205、及びMaertens et al.,2010,Nature 468:326-29に見出すことができ、これらは参照により本明細書に組み込まれる。
一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
いくつかの実施形態では、CRISPR-Casドメインは、Casタンパク質を含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、Ty1、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。一実施形態では、NLSは、配列番号47~56及び配列番号254~257のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、NLSタンパク質は、配列番号47~56及び配列番号254~257のうちの1つの配列を含む。
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。一実施形態では、Ty1様NLSは、配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Ty1様NLSタンパク質は、配列番号275~887のうちの1つの配列を含む。
一実施形態では、融合タンパク質は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号249~250のうちの1つの配列を含む。
一実施形態では、NLSは、2つの異なるNLSの組み合わせを含む。例えば、一実施形態では、NLSは、Ty1由来のNLS及びSV40由来のNLSを含む。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
一実施形態では、NLSは、同じNLSの2つのコピーを含む。例えば、一実施形態では、NLSは、第1のTy1由来のNLSと第2のTy1由来のNLSの多量体を含む。
一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つに対して少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である第1の配列、ならびに配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つに対して少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である第2の配列を含む。一実施形態では、第1の配列及び第2の配列は同じである。一実施形態では、第1の配列及び第2の配列は異なる。
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つに対して70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
本発明のペプチドは、化学的な方法を使用して作製することができる。例えば、ペプチドを、固相技術(Roberge J Y et al(1995)Science 269:202-204)によって合成し、樹脂から切断して、分取高速液体クロマトグラフィーによって精製することができる。自動合成は、例えば、製造業者より提供された指示に従って、ABI 431 A Peptide Synthesizer(Perkin Elmer)を使用して行うことができる。
本発明はまた、本明細書に開示される融合タンパク質に対して実質的な相同性を有する任意の形態のペプチドを含むと解釈されるべきである。一実施形態では、「実質的に相同」であるペプチドは、本明細書に開示される融合タンパク質のアミノ酸配列に対して約50%相同、約70%相同、約80%相同、約90%相同、約95%相同、または約99%相同である。
あるいは、ペプチドを、組換え手段によって、またはより長いポリペプチドからの切断によって作製することができる。ペプチドの組成は、アミノ酸分析または配列決定によって確認することができる。
本発明によるペプチドの変異体は、(i)1つ以上のアミノ酸残基が保存または非保存アミノ酸残基で置換されており、そのような置換されたアミノ酸残基が遺伝暗号によってコードされていてもコードされていなくてもよいもの、(ii)1つ以上の修飾アミノ酸残基、例えば、置換基の付加によって修飾される残基が存在するもの、(iii)ペプチドが本発明のペプチドの代替のスプライス変異体であるもの、(iv)ペプチドの断片、及び/または(v)ペプチドが別のペプチド、例えば、リーダー配列もしくは分泌配列、または精製に使用される配列(例えば、Hisタグ)もしくは検出に使用される配列(例えば、Sv5エピトープタグ)に融合しているものであり得る。断片には、元の配列のタンパク質分解切断(多部位タンパク質分解を含む)を介して生成されたペプチドが含まれる。変異体は、翻訳後修飾または化学的修飾されていてもよい。そのような変異体は、本明細書の教示から当業者の範囲内にあると見なされる。
当該技術分野において公知のように、2つのペプチド間の「類似性」は、一方のポリペプチドのアミノ酸配列及びその保存的アミノ酸代替物を、第2のポリペプチドの配列と比較することによって決定される。変異体は、元の配列とは異なるペプチド配列を含むと定義される。一実施形態では、変異体は、対象のセグメントあたりの残基の40%未満で元の配列と異なるか、対象のセグメントあたりの残基の25%未満で元の配列と異なるか、対象のセグメントあたりの残基の10%未満で異なるか、または対象のセグメントあたりわずか数残基で元のタンパク質配列とは異なり、同時に、元の配列の機能性及び/または幹細胞の骨芽細胞系統への分化を刺激する能力を維持するために、元の配列と十分に相同である。本発明は、元のアミノ酸配列と少なくとも60%、65%、70%、72%、74%、76%、78%、80%、90%、または95%類似しているかまたは同一であるアミノ酸配列を含む。2つのペプチド間の同一性の程度は、当業者に周知のコンピュータアルゴリズム及び方法を使用して決定される。2つのアミノ酸配列間の同一性は、BLASTPアルゴリズム[BLAST Manual,Altschul,S.,et al.,NCBI NLM NIH Bethesda,Md.20894、Altschul,S.,et al.,J.Mol.Biol.215:403-410(1990)]を使用することにより決定することができる。
本発明のペプチドは、翻訳後修飾され得る。例えば、本発明の範囲内にある翻訳後修飾には、シグナルペプチド切断、グリコシル化、アセチル化、イソプレニル化、タンパク質分解、ミリストイル化、タンパク質フォールディング及びタンパク質分解プロセシングなどが含まれる。いくつかの修飾またはプロセシング事象は、さらなる生物学的機構の導入を必要とする。例えば、シグナルペプチド切断及びコアグリコシル化などのプロセシング事象は、イヌミクロソーム膜またはXenopus卵抽出物(米国特許第6,103,489号)を標準的な翻訳反応に加えることによって検査される。
本発明のペプチドは、翻訳後修飾によって、または翻訳中に非天然アミノ酸を導入することによって形成される非天然アミノ酸を含み得る。タンパク質翻訳中に非天然アミノ酸を導入するための様々なアプローチが利用可能である。
本発明のペプチドまたはタンパク質は、Reedijk et al.(The EMBO Journal 11(4):1365,1992)に記載されている方法などの従来の方法を使用してリン酸化することができる。
本発明のペプチドの環状誘導体もまた、本発明の一部である。環化により、ペプチドは他の分子との会合により好ましい立体構造をとることができる。環化は、当該技術分野で公知の技術を使用して行うことができる。例えば、ジスルフィド結合を、遊離スルフヒドリル基を有する適切に離間した2つの成分の間に形成することができ、またはアミド結合を、一方の成分のアミノ基と別の成分のカルボキシル基との間に形成することができる。環化はまた、Ulysse,L.,et al.,J.Am.Chem.Soc.1995,117,8466-8467に記載されているアゾベンゼン含有アミノ酸を使用して行うことができる。結合を形成する成分は、アミノ酸の側鎖、非アミノ酸成分、またはその2つの組み合わせであり得る。本発明の一実施形態では、環状ペプチドは、右位置にベータターンを含み得る。アミノ酸Pro-Glyを右位置に付加することにより、ベータターンを本発明のペプチドに導入することができる。
前述のようなペプチド結合連結を含む環状ペプチドよりも、より可撓性のある環状ペプチドを生成することが望ましい場合がある。より可撓性のあるペプチドは、ペプチドの左右の位置にシステインを導入し、2つのシステインの間にジスルフィドブリッジを形成することによって調製することができる。2つのシステインは、ベータシート及びターンを変形させないように配置される。このペプチドは、ジスルフィド結合の長さ、及びベータシート部分の水素結合数の減少の結果として、より可撓性が高い。環状ペプチドの相対的な可撓性は、分子動力学シミュレーションによって測定することができる。
本発明はまた、標的タンパク質に、及び/またはキメラタンパク質を所望の細胞成分もしくは細胞タイプもしくは組織へと誘導することができる標的化ドメインに、融合されたかまたは組み込まれたIN-Cas9ペプチドを含むペプチドに関する。キメラタンパク質はまた、追加のアミノ酸配列またはドメインを含み得る。キメラタンパク質は、様々な成分が異なる供給源に由来し、したがって自然界では一緒に見出されない(すなわち、異種である)という意味において組換えである。
一実施形態では、標的化ドメインは、膜貫通ドメイン、膜結合ドメイン、または例えば小胞もしくは核と会合するようにタンパク質を誘導する配列であり得る。一実施形態では、標的化ドメインは、ペプチドを特定の細胞タイプまたは組織に標的化することができる。例えば、標的化ドメインは、細胞表面リガンドまたは標的組織の細胞表面抗原に対する抗体であり得る。標的化ドメインは、本発明のペプチドを細胞成分に標的化することができる。
本発明のペプチドを、従来技術により合成することができる。例えば、ペプチドまたはキメラタンパク質を、固相ペプチド合成を使用する化学合成によって合成することができる。これらの方法は、固相合成方法または液相合成方法のいずれかを用いる(例えば、固相合成技術については、J.M.Stewart,and J.D.Young,Solid Phase Peptide Synthesis,2nd Ed.,Pierce Chemical Co.,Rockford Ill.(1984)及びG.Barany and R.B.Merrifield,The Peptides:Analysis Synthesis,Biology editors E.Gross and J.Meienhofer Vol.2 Academic Press,New York,1980,pp.3-254、ならびに古典的な溶液合成については、M Bodansky,Principles of Peptide Synthesis,Springer-Verlag,Berlin 1984、及びE.Gross and J.Meienhofer,Eds.,The Peptides:Analysis,Synthesis,Biology,suprs,Vol 1を参照されたい)。例として、本発明のペプチドは、N-フルオレニルメトキシ-カルボニル-O-ベンジル-L-ホスホスレオニン誘導体としてホスホスレオニンを直接導入する、9-フルオレニルメトキシカルボニル(Fmoc)固相化学を使用して合成することができる。
他の分子とコンジュゲートされた本発明のペプチドまたはキメラタンパク質を含むN末端またはC末端融合タンパク質は、ペプチドまたはキメラタンパク質のN末端またはC末端と、所望の生物学的機能を有する選択されたタンパク質または選択マーカーの配列を組換え技術により融合することによって調製することができる。得られた融合タンパク質は、本明細書に記載の選択されたタンパク質またはマーカータンパク質に融合されたIN-Cas9ペプチドを含有する。融合タンパク質を調製するために使用することができるタンパク質の例としては、免疫グロブリン、グルタチオン-S-トランスフェラーゼ(GST)、ヘマグルチニン(HA)及び短縮型mycが挙げられる。
本発明のペプチドは、生物学的発現系を使用して開発することができる。これらの系の使用により、ランダムペプチド配列の大型ライブラリーの作成、及び特定のタンパク質に結合するペプチド配列についてのこれらのライブラリーのスクリーニングが可能となる。ライブラリーは、ランダムペプチド配列をコードする合成DNAを適切な発現ベクターにクローニングすることにより作成することができる(Christian et al 1992,J.Mol.Biol.227:711、Devlin et al,1990 Science 249:404、Cwirla et al 1990,Proc.Natl.Acad,Sci.USA,87:6378を参照されたい)。ライブラリーは、重複ペプチドの同時合成によっても構築することもできる(米国特許第4,708,871号を参照されたい)。
本発明のペプチド及びキメラタンパク質は、無機酸、例えば、塩酸、硫酸、臭化水素酸、リン酸など、または有機酸、例えば、ギ酸、酢酸、プロピオン酸、グリコール酸、乳酸、ピルビン酸、シュウ酸、コハク酸、リンゴ酸、酒石酸、クエン酸、安息香酸、サリチル酸、ベンゼンスルホン酸、及びトルエンスルホン酸と反応させることにより、医薬塩へと変換することができる。
核酸
一実施形態では、本発明の方法は、融合タンパク質をコードする核酸分子を提供する。一実施形態では、核酸分子は、編集タンパク質をコードする第1の核酸配列、及び核局在化シグナル(NLS)をコードする第2の核酸配列を含む。
一実施形態では、本発明の方法は、融合タンパク質をコードする核酸分子を提供する。一実施形態では、核酸分子は、編集タンパク質をコードする第1の核酸配列、及び核局在化シグナル(NLS)をコードする第2の核酸配列を含む。
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合ドメインを有するタンパク質を含むが、これらに限定されない。一実施形態では、編集タンパク質は、Casタンパク質である。
Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、Cas9である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
一実施形態では、第2の核酸配列は、核局在化シグナル(NLS)をコードする。一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。
一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。一実施形態では、レトロトランスポゾンNLSは、非レトロトランスポゾンNLSと比較して、核局在化を著しく増加させる。
一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つをコードする核酸配列を含む。
一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
一実施形態では、核酸分子は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号249~250のうちの1つの配列を含む融合タンパク質をコードする。
一実施形態では、核酸分子は、編集タンパク質をコードする第1の核酸配列、核局在化シグナル(NLS)をコードする第2の核酸配列、及びレトロウイルスインテグラーゼ(IN)またはその断片をコードする第3の核酸配列を含む。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上または9つのアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。一実施形態では、インテグラーゼの断片は、完全長インテグラーゼの少なくとも1つの活性を保持している。レトロウイルスインテグラーゼの機能及び断片は当該技術分野で公知であり、例えば、Li,et al.,2011,Virology 411:194-205、及びMaertens et al.,2010,Nature 468:326-29に見出すことができ、これらは参照により本明細書に組み込まれる。
一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号1~40のうちの1つをコードする核酸配列を含む。
一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号99~138のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合タンパク質を含むが、これらに限定されない。一実施形態では、編集タンパク質は、Casタンパク質である。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、第1の核酸配列は、Casタンパク質をコードする。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
一実施形態では、第2の核酸配列は、核局在化シグナル(NLS)をコードする。一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。一実施形態では、レトロトランスポゾンNLSは、非レトロトランスポゾンNLSと比較して、核局在化を著しく増加させる。
一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~87のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つをコードする核酸配列を含む。
一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つの核酸配列を含む。
融合タンパク質をコードする単離された核酸配列は、当該技術分野において公知の多数の組換え方法のいずれかを使用して、例えば、標準的技術を使用して、その遺伝子を発現する細胞からライブラリーをスクリーニングすることによって、その遺伝子を含むことが知られているベクターから遺伝子を誘導することによって、またはその遺伝子を含む細胞及び組織から直接単離することなどによって得ることができる。あるいは、目的の遺伝子を、クローニングするのではなく合成的に生成することができる。
単離された核酸は、DNA及びRNAを含むがこれらに限定されない、任意のタイプの核酸を含み得る。例えば、一実施形態では、組成物は例えば、本発明の融合タンパク質をコードする、単離されたcDNA分子を含む単離されたDNA分子を含む。一実施形態では、組成物は、本発明の融合タンパク質をコードする単離されたRNA分子、またはその機能的断片を含む。
本発明の核酸分子は、血清中または細胞培養用の増殖培地中の安定性を改善するように修飾することができる。本発明の核酸分子の安定性、機能性及び/または特異性を向上させ、免疫刺激特性を最小化するために、修飾を加えることができる。例えば、安定性を向上させるために、3’残基を分解に対して安定化させることができ、例えば、それらを、プリンヌクレオチド、特にアデノシンまたはグアノシンヌクレオチドからなるように選択することができる。あるいは、修飾類似体によるピリミジンヌクレオチドの置換、例えば、2’-デオキシチミジンによるウリジンの置換は許容され、分子の機能に影響を及ぼさない。
本発明の一実施形態では、核酸分子は、少なくとも1つの修飾ヌクレオチド類似体を含み得る。例えば、末端は、修飾ヌクレオチド類似体を導入することによって安定化され得る。
ヌクレオチド類似体の非限定的な例には、糖修飾及び/または骨格修飾リボヌクレオチドが含まれる(すなわち、リン酸-糖骨格への修飾が含まれる)。例えば、天然RNAのホスホジエステル結合は、窒素または硫黄ヘテロ原子のうちの少なくとも1つを含むように修飾され得る。例示的な骨格修飾リボヌクレオチドでは、隣接するリボヌクレオチドに連結するリン酸エステル基は、修飾基、例えば、ホスホチオエート基の修飾基によって置換されている。例示的な糖修飾リボヌクレオチドでは、2’-OH基は、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2またはONから選択される基(式中、RはC1~C6アルキル、アルケニルまたはアルキニルであり、ハロはF、Cl、BrまたはIである)によって置換されている。
修飾の他の例は、核酸塩基修飾リボヌクレオチド、すなわち、天然に存在する核酸塩基の代わりに少なくとも1つの天然に存在しない核酸塩基を含有するリボヌクレオチドである。アデノシンデアミナーゼの活性を遮断するように塩基を修飾することができる。例示的な修飾核酸塩基には、限定されないが、5位で修飾されたウリジン及び/またはシチジン、例えば、5-(2-アミノ)プロピルウリジン、5-ブロモウリジン;8位で修飾されたアデノシン及び/またはグアノシン、例えば、8-ブロモグアノシン;デアザヌクレオチド、例えば、7-デアザ-アデノシン;O-アルキル化及びN-アルキル化ヌクレオチド、例えば、N6-メチルアデノシンが含まれ、好適である。前述の修飾を組み合わせてもよいことに留意されたい。
場合によっては、核酸分子は、以下の化学修飾のうちの1つ以上、すなわち、1つ以上のヌクレオチドの2’-H修飾、2’-O-メチル修飾、または2’-OH修飾を含む。特定の実施形態では、本発明の核酸分子は、ヌクレアーゼに対する向上した耐性を有し得る。ヌクレアーゼ耐性を増加させるために、核酸分子は、例えば、2’-修飾リボース単位及び/またはホスホロチオエート結合を含み得る。例えば、2’ヒドロキシル基(OH)を、いくつかの異なる「オキシ」または「デオキシ」置換基で修飾または置換することができる。ヌクレアーゼ耐性を増加させるために、本発明の核酸分子は、2’-O-メチル、2’-フッ素、2’-O-メトキシエチル、2’-O-アミノプロピル、2’-アミノ、及び/またはホスホロチオエート結合を含み得る。ロックド核酸(LNA)、エチレン核酸(ENA)、例えば2’-4’-エチレン架橋核酸の包含、及び2-アミノ-A修飾、2-チオ(例えば、2-チオ-U)修飾、G-クランプ修飾などの特定の核酸塩基修飾もまた、標的に対する結合親和性を増加させることができる。
一実施形態では、核酸分子は、2’-修飾ヌクレオチド、例えば、2’-デオキシ、2’-デオキシ-2’-フルオロ、2’-O-メチル、2’-O-メトキシエチル(2’-O-MOE)、2’-O-アミノプロピル(2’-O-AP)、2’-O-ジメチルアミノエチル(2’-O-DMAOE)、2’-O-ジメチルアミノプロピル(2’-O-DMAP)、2’-O-ジメチルアミノエチルオキシエチル(2’-O-DMAEOE)、または2’-O-N-メチルアセトアミド(2’-O-NMA)を含む。一実施形態では、核酸分子は、少なくとも1つの2’-O-メチル修飾ヌクレオチドを含み、いくつかの実施形態では、核酸分子のすべてのヌクレオチドは、2’-O-メチル修飾を含む。
特定の実施形態では、本発明の核酸分子は、以下の特性のうちの1つ以上を有する。
本明細書で論じられる核酸剤は、特に修飾されていないRNA及びDNA、ならびに例えば有効性を改善するために修飾されたRNA及びDNA、ならびにヌクレオシド代替物のポリマーを含む。非修飾RNAとは、核酸の成分、すなわち糖、塩基及びリン酸部分が自然界に存在するもの、または人体に天然に存在するものと同じかまたは本質的に同じである分子を指す。当該技術分野では、稀または特殊であるが天然に存在するRNAを修飾RNAと称しており、例えば、Limbach et al.(Nucleic Acids Res.,1994,22:2183-2196)を参照されたい。しばしば修飾RNAと称されるこのような稀または特殊なRNAは、通常、転写後修飾の結果であり、本明細書で使用される非修飾RNAという用語の範囲内にある。本明細書で使用される修飾RNAとは、核酸の成分、すなわち糖、塩基及びリン酸部分の1つ以上が、自然界に存在するものと異なるか、または人体に存在するものと異なる分子を指す。それらは「修飾RNA」と称されるが、修飾に起因して、厳密に言えばRNAではない分子も当然ながら含まれることになる。ヌクレオシド代替物とは、ハイブリダイゼーションがリボリン酸骨格で見られるものと実質的に類似するように、塩基を正しい空間関係で提示することが可能となる非リボリン酸構築物、例えばリボリン酸骨格の非荷電模倣物で、リボリン酸骨格が置換されている分子である。
本発明の核酸の修飾は、リン酸基、糖基、骨格、N末端、C末端、または核酸塩基のうちの1つ以上に存在し得る。
本発明はまた、本発明の単離された核酸が挿入されたベクターを含む。当該技術分野には、本発明において有用である適切なベクターが豊富に存在する。
簡単に要約すると、本発明の融合タンパク質をコードする天然または合成核酸の発現は、通常、本発明の融合タンパク質またはその一部をコードする核酸をプロモーターに作動可能に連結し、その構築物を発現ベクターに導入することにより行われる。使用するベクターは、真核細胞における複製、及び場合により組み込みに適している。典型的なベクターには、転写及び翻訳ターミネーター、開始配列、ならびに所望の核酸配列の発現の調節に有用なプロモーターが含まれる。
本発明のベクターはまた、標準的な遺伝子送達プロトコルを使用する核酸免疫化及び遺伝子治療に使用することができる。遺伝子送達の方法は当該技術分野で公知である。例えば、その全体が参照により本明細書に組み込まれる、米国特許第5,399,346号、同第5,580,859号、同第5,589,466号を参照されたい。別の実施形態では、本発明は、遺伝子治療ベクターを提供する。
本発明の単離された核酸は、多数のタイプのベクターにクローニングすることができる。例えば、核酸は、プラスミド、ファージミド、ファージ誘導体、動物ウイルス及びコスミドを含むがこれらに限定されないベクターにクローニングすることができる。特に対象となるベクターには、発現ベクター、複製ベクター、プローブ生成ベクター及び配列決定ベクターが含まれる。
さらに、ベクターを、ウイルスベクターの形態で細胞に供給することができる。ウイルスベクター技術は当該技術分野で周知であり、例えば、Sambrook et al.(2012,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,New York)ならびに他のウイルス学及び分子生物学のマニュアルに記載されている。ベクターとして有用なウイルスとしては、レトロウイルス、アデノウイルス、アデノ随伴ウイルス、ヘルペスウイルス及びレンチウイルスが挙げられるが、これらに限定されない。一般に、適切なベクターは、少なくとも1種の生物において機能する複製起点、プロモーター配列、好都合な制限エンドヌクレアーゼ部位、及び1つ以上の選択マーカーを含有する(例えば、WO01/96584、WO01/29058、及び米国特許第6,326,193号)。
送達系及び方法
一態様では、本発明は、新規のレンチウイルスパッケージング及び送達系の開発に関する。レンチウイルス粒子は、ウイルス酵素をタンパク質として送達する。このような方法では、レンチウイルス酵素が短命であることから、細胞の生涯にわたる長期間の発現に起因するオフターゲット編集の可能性が制限される。編集成分、または従来のCRISPR-Cas編集成分をタンパク質としてレンチウイルス粒子に導入することは、それらの必要な活性が短期間のみ必要とされることを考慮すると有利である。したがって、一実施形態では、本発明は、レンチウイルス送達系、ならびにレンチウイルス送達系を使用した本発明の組成物の送達、遺伝物質の編集、及び核酸送達の方法を提供する。
一態様では、本発明は、新規のレンチウイルスパッケージング及び送達系の開発に関する。レンチウイルス粒子は、ウイルス酵素をタンパク質として送達する。このような方法では、レンチウイルス酵素が短命であることから、細胞の生涯にわたる長期間の発現に起因するオフターゲット編集の可能性が制限される。編集成分、または従来のCRISPR-Cas編集成分をタンパク質としてレンチウイルス粒子に導入することは、それらの必要な活性が短期間のみ必要とされることを考慮すると有利である。したがって、一実施形態では、本発明は、レンチウイルス送達系、ならびにレンチウイルス送達系を使用した本発明の組成物の送達、遺伝物質の編集、及び核酸送達の方法を提供する。
例えば、一態様では、送達系は、(1)パッケージングプラスミド、(2)導入プラスミド、及び(3)エンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、修飾gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、修飾gag-polポリタンパク質は、編集タンパク質に融合されたインテグラーゼを含む。一実施形態では、修飾gag-polポリタンパク質は、Casタンパク質に融合されたインテグラーゼを含む。一実施形態では、修飾gag-polポリタンパク質は、触媒的に死んだCasタンパク質(dCas)に融合されたインテグラーゼを含む。一実施形態では、パッケージングプラスミドは、sgRNA配列をコードする配列をさらに含む。
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、Insctriptrパッケージングプラスミド中のインテグラーゼに特異的である。
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
一実施形態では、パッケージングプラスミド、導入プラスミド及びエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、修飾gag-polタンパク質をコードする核酸配列を転写及び翻訳して、修飾gag-polタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、sgRNAは、インテグラーゼ-Cas融合タンパク質に結合する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、sgRNAに結合する修飾gag-polタンパク質、エンベロープポリタンパク質及びドナー配列RNAは、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、sgRNAは細胞DNAの標的領域に結合し、これによりIN-Cas9融合タンパク質を標的化し、インテグラーゼはドナー配列の細胞DNAへの組み込みを触媒する。
一態様では、送達系は、(1)パッケージングプラスミド、(2)導入プラスミド、(3)エンベローププラスミド、及び(4)VPR-IN-dCasプラスミドを含む。一実施形態では、パッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116Nインテグラーゼ突然変異を含む。
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、VPR-IN-dCasパッケージングプラスミド中のインテグラーゼに特異的である。
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及びCasタンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及びdCasタンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、融合タンパク質は、VPRとインテグラーゼとの間にプロテアーゼ切断部位を含む。一実施形態では、VPR-IN-dCasプラスミドパッケージングプラスミドは、sgRNA配列をコードする配列をさらに含む。
一実施形態では、パッケージングプラスミド、導入プラスミド、エンベローププラスミド及びVPR-IN-dCasプラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、細胞は、融合タンパク質を転写及び翻訳して、VPR-インテグラーゼ-編集タンパク質融合タンパク質を産生する。一実施形態では、細胞は、融合タンパク質を転写及び翻訳して、VPR-インテグラーゼ-dCas融合タンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、sgRNAは、VPR-インテグラーゼ-dCas融合タンパク質に結合する。
一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、ドナー配列RNA、及びsgRNAに結合するVPR-インテグラーゼ-dCas9タンパク質は、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、VPRは、プロテアーゼ部位を介してウイルス粒子内の融合タンパク質から切断され、IN-dCas融合タンパク質をもたらす。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、sgRNAは細胞DNAの標的領域に結合し、これによりIN-dCas融合タンパク質を標的化し、インテグラーゼはドナー配列の細胞DNAへの組み込みを触媒する。
一態様では、送達系は、(1)導入プラスミド、(2)パッケージングプラスミド、及び(3)エンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116Nインテグラーゼ突然変異を含む。
一実施形態では、導入プラスミドは、sgRNAをコードする核酸、ならびにインテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、融合タンパク質のインテグラーゼに特異的である。一実施形態では、融合タンパク質は、インテグラーゼ及びCasタンパク質を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びdCasタンパク質を含む。一実施形態では、5’LTR及び3’LTRは、融合タンパク質をコードする配列及びsgRNAをコードする配列に隣接する。
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
一実施形態では、パッケージングプラスミド、導入プラスミド及びエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、細胞は、融合タンパク質をコードする核酸配列を転写する。
一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、ドナー配列RNA、及びsgRNAに結合するVPR-インテグラーゼ-dCas9タンパク質は、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、ウイルスは逆翻訳し、細胞は融合タンパク質及びsgRNAを発現する。一実施形態では、sgRNAは、融合タンパク質のCasタンパク質及び別のウイルスDNA転写物に結合し、ここで、インテグラーゼは自己組み込みを触媒する。一実施形態では、sgRNAは、融合タンパク質のCasタンパク質及び細胞DNAの標的領域に結合し、これにより標的遺伝子を破壊する。
一態様では、送達系は、(1)導入プラスミド、(2)第1のパッケージングプラスミド、(3)第1のエンベローププラスミド、(4)第2のパッケージングプラスミド、(5)第2のエンベローププラスミド、及び(6)導入プラスミドを含む。一実施形態では、第1のパッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、第2のパッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116NまたはD64Vインテグラーゼ突然変異を含む。
一実施形態では、第1のエンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、第2のエンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
一実施形態では、導入プラスミドは、sgRNAをコードする核酸、ならびにインテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びCasタンパク質を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びdCasタンパク質を含む。一実施形態では、融合タンパク質のインテグラーゼは、第1及び第2のパッケージングプラスミドのgag-polポリタンパク質と比較して、異なる種のレンチウイルスに由来する。例えば、一実施形態では、導入プラスミドは、FIVインテグラーゼ及びCasを含む融合タンパク質をコードする核酸を含み、第1及び第2のパッケージングプラスミドは、HIV gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、異なるレンチウイルス種の使用は、自己組み込みを防止する。
一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、gag-polポリタンパク質のインテグラーゼに特異的である。一実施形態では、5’LTR及び3’LTRは、融合タンパク質をコードする配列及びsgRNAをコードする配列に隣接する。
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、Inscrtipter導入プラスミド中のインテグラーゼに特異的である。
一実施形態では、第1のパッケージングプラスミド、導入プラスミド及び第1のエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、細胞は、融合タンパク質をコードする核酸配列を転写する。一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、gRNA及び融合タンパク質RNAは、第1のウイルス粒子にパッケージングされる。一実施形態では、第1のウイルス粒子は細胞培地から採取される。
一実施形態では、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polポリタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、gag-polポリタンパク質、エンベロープポリタンパク質及びドナー配列RNAは、第2のウイルス粒子にパッケージングされる。一実施形態では、第2のウイルス粒子は細胞培地から採取される。
一実施形態では、第1のパッケージングプラスミド、導入プラスミド、第1のエンベローププラスミド、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドは、同じ細胞に導入される。一実施形態では、第1のパッケージングプラスミド、導入プラスミド、第1のエンベローププラスミドは、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドと異なる細胞に導入される。
一実施形態では、第1のウイルス粒子及び第2のウイルス粒子は、標的細胞を形質導入する。一実施形態では、ウイルスは逆翻訳し、細胞は融合タンパク質及びsgRNAを発現し、ここで、sgRNAは、融合タンパク質のdCasに結合する。一実施形態では、ウイルスは、ドナー配列RNAを、融合タンパク質のインテグラーゼに結合するドナーDNA配列に逆翻訳する。一実施形態では、sgRNAは細胞DNAの標的領域に結合し、これによりIN-dCas融合タンパク質を標的化し、インテグラーゼはドナーDNA配列の細胞DNAへの組み込みを触媒する。
さらに、哺乳動物細胞への遺伝子導入のための、さらなるウイルスベースの系が数多く開発されている。例えば、レトロウイルスは、遺伝子送達系に好都合なプラットフォームを提供する。選択した遺伝子を、当該技術分野で公知の技術を使用して、ベクターに挿入し、レトロウイルス粒子にパッケージングすることができる。次に、組換えウイルスを単離して、in vivoまたはex vivoでのいずれかで対象の細胞に送達することができる。多数のレトロウイルス系が当該技術分野で公知である。いくつかの実施形態では、アデノウイルスベクターを使用する。多数のアデノウイルスベクターが当該技術分野で公知である。いくつかの実施形態では、レンチウイルスベクターを使用する。
例えば、レンチウイルスなどのレトロウイルス由来のベクターは、導入遺伝子の長期間の安定した組み込み及び娘細胞中のその増殖を可能とすることから、長期間の遺伝子導入を実現するのに適したツールである。レンチウイルスベクターは、肝細胞などの非増殖細胞を形質導入することができるという点で、マウス白血病ウイルスなどのオンコレトロウイルス由来のベクターと比べてさらなる利点を有する。これらはまた、免疫原性が低いというさらなる利点を有する。
一実施形態では、組成物は、アデノ随伴ウイルス(AAV)に由来するベクターを含む。「AAVベクター」という用語は、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8及びAAV-9を含むがこれらに限定されない、アデノ随伴ウイルス血清型に由来するベクターを意味する。AAVベクターは、様々な障害の治療のための強力な遺伝子送達ツールとなっている。AAVベクターは、病原性の欠如、最小限の免疫原性、及び安定かつ効率的な方法で有糸分裂後細胞を形質導入する能力を含む、遺伝子治療に最適なベクターとなるいくつかの特徴を有する。AAVベクター内に含まれる特定の遺伝子の発現は、AAV血清型、プロモーター及び送達方法の適切な組み合わせを選択することにより、1つ以上のタイプの細胞を特異的に標的とすることができる。
AAVベクターは、AAV野生型遺伝子のうちの1つ以上、好ましくはrep及び/またはcap遺伝子の全体または一部の欠失を有し得るが、機能的な隣接ITR配列を保持し得る。高い相同性にもかかわらず、異なる血清型は異なる組織に対する指向性を有する。AAV1の受容体は明らかではないが、AAV1はAAV2よりも効率的に骨格筋及び平滑筋を形質導入することが知られている。ほとんどの研究が、AAV2 ITRに隣接したベクターDNAが別の血清型のカプシドにパッケージングされる偽型ベクターを用いて行われたため、生物学的相違がゲノムよりもカプシドに関連することは明らかである。最近のエビデンスは、AAV1カプシドにパッケージングされたDNA発現カセットが、心筋細胞の形質導入において、AAV2カプシドにパッケージングされたものよりも少なくとも1log10効率的であることを示している。一実施形態では、ウイルス送達系は、アデノ随伴ウイルス送達系である。アデノ随伴ウイルスは、血清型1(AAV1)、血清型2(AAV2)、血清型3(AAV3)、血清型4(AAV4)、血清型5(AAV5)、血清型6(AAV6)、血清型7(AAV7)、血清型8(AAV8)、または血清型9(AAV9)のものであり得る。
ベクターへのアセンブルに望ましいAAV断片としては、vp1、vp2、vp3及び超可変領域を含むcapタンパク質、rep78、rep68、rep52、及びrep40を含むrepタンパク質、ならびにこれらのタンパク質をコードする配列が挙げられる。これらの断片は、様々なベクター系及び宿主細胞で容易に利用することができる。このような断片を、単独で、他のAAV血清型配列もしくは断片と組み合わせて、または他のAAVもしくは非AAVウイルス配列由来のエレメントと組み合わせて使用することができる。本明細書で使用される場合、人工AAV血清型は、限定されないが、天然に存在しないカプシドタンパク質を有するAAVを含む。そのような人工カプシドは、選択したAAV配列(例えば、vp1カプシドタンパク質の断片)を、選択した異なるAAV血清型、同じAAV血清型の非隣接部分、非AAVウイルス源、または非ウイルス源から得ることができる異種配列と組み合わせて使用して、任意の適切な技術により作製することができる。人工AAV血清型は、限定されないが、キメラAAVカプシド、組換えAAVカプシド、または「ヒト化」AAVカプシドであり得る。したがって、1つ以上のタンパク質の発現に適した例示的なAAV、または人工AAVには、とりわけ、AAV2/8(米国特許第7,282,199号を参照されたい)、AAV2/5(National Institutes of Healthから入手可能)、AAV2/9(国際特許公開第WO2005/033321号)、AAV2/6(米国特許第6,156,303号)、及びAAVrh8(国際特許公開第WO2003/042397号)が含まれる。
特定の実施形態では、ベクターはまた、プラスミドベクターでトランスフェクトされた細胞、または本発明によって産生されたウイルスに感染した細胞における導入遺伝子の転写、翻訳及び/または発現を可能にする形で導入遺伝子に作動可能に連結された従来の調節エレメントを含む。本明細書で使用される場合、「作動可能に連結された」配列は、目的遺伝子と隣接する発現制御配列と、目的遺伝子を制御するためにトランスでまたは一定の距離で作用する発現制御配列の両方を含む。発現制御配列には、適切な転写開始配列、転写終結配列、転写プロモーター配列、及び転写エンハンサー配列;スプライシングシグナル及びポリアデニル化(polyA)シグナルなどの効率的なRNAプロセシングシグナル;細胞質mRNAを安定化させる配列;翻訳効率を向上させる配列(すなわち、Kozakコンセンサス配列);タンパク質安定性を向上させる配列;ならびに必要に応じて、コードされた産物の分泌を向上させる配列が含まれる。天然プロモーター、構成的プロモーター、誘導性プロモーター、及び/または組織特異的プロモーターを含む、多数の発現制御配列が当該技術分野で公知であり、利用可能である。
さらなるプロモーターエレメント、例えばエンハンサーは転写開始の頻度を調節する。通常、これらは開始部位の30~110bp上流の領域に位置するが、近年、いくつかのプロモーターは開始部位の下流にも機能的エレメントを含むことが示されている。プロモーターエレメント間の間隔は柔軟であることが多く、そのためエレメントが互いに対して反転または移動する際にプロモーター機能が維持される。チミジンキナーゼ(tk)プロモーターでは、プロモーターエレメント間の間隔は、50bpの間隔まで長くすることができ、それ以降は活性が低下し始める。プロモーターによっては、転写を活性化するために、個々のエレメントを協働的に機能させることも、または独立して機能させることもできると思われる。
適切なプロモーターの一例は、前初期サイトメガロウイルス(CMV)プロモーター配列である。このプロモーター配列は、それに作動可能に連結された任意のポリヌクレオチド配列の高レベルの発現を駆動することができる強力な構成的プロモーター配列である。適切なプロモーターの別の例は、伸長成長因子-1α(EF-1α)である。しかしながら、他の構成的プロモーター配列も使用することができ、これらとしては、限定されないが、サルウイルス40(SV40)初期プロモーター、マウス乳癌ウイルス(MMTV)、ヒト免疫不全ウイルス(HIV)ロングターミナルリピート(LTR)プロモーター、MoMuLVプロモーター、トリ白血病ウイルスプロモーター、エプスタイン・バールウイルス前初期プロモーター、ラウス肉腫ウイルスプロモーター、ならびに、限定されないが、アクチンプロモーター、ミオシンプロモーター、ヘモグロビンプロモーター、及びクレアチンキナーゼプロモーターなどのヒト遺伝子プロモーターが挙げられる。さらに、本発明は、構成的プロモーターの使用に限定されるべきではない。誘導性プロモーターもまた、本発明の一部として企図される。誘導性プロモーターの使用により、それが作動可能に連結されているポリヌクレオチド配列の発現を、そのような発現が望ましい場合はオンにし、または発現が望ましくない場合はその発現をオフにすることが可能な分子スイッチが得られる。誘導性プロモーターの例としては、メタロチオニンプロモーター、グルココルチコイドプロモーター、プロゲステロンプロモーター、及びテトラサイクリンプロモーターが挙げられるが、これらに限定されない。
ベクター上に見られるエンハンサー配列もまた、その中に含まれる遺伝子の発現を調節する。通常、エンハンサーはタンパク質因子と結合して遺伝子の転写を増強させる。エンハンサーは、それが調節する遺伝子の上流または下流に位置し得る。エンハンサーはまた、特定の細胞タイプまたは組織タイプにおける転写を増強するために組織特異的であり得る。一実施形態では、本発明のベクターは、ベクター内に存在する遺伝子の転写を高めるための1つ以上のエンハンサーを含む。
本発明の融合タンパク質の発現を評価するために、細胞に導入される発現ベクターはまた、ウイルスベクターを介してトランスフェクトまたは感染させようとする細胞集団からの発現細胞の同定及び選択を容易にする、選択マーカー遺伝子もしくはレポーター遺伝子のいずれかまたは両方を含み得る。他の態様では、選択マーカーを個々のDNA片上に保有させ、コトランスフェクション手順に使用することができる。選択マーカーとレポーター遺伝子はいずれも、宿主細胞での発現を可能とする適切な調節配列と隣接させることができる。有用な選択マーカーとしては、例えば、neoなどの抗生物質耐性遺伝子が挙げられる。
レポーター遺伝子は、潜在的なトランスフェクト細胞を同定するため、及び調節配列の機能性を評価するために使用される。一般に、レポーター遺伝子は、レシピエント生物もしくは組織に存在しないか、またはそれらによって発現されない遺伝子であり、かついくつかの容易に検出可能な特性、例えば酵素活性によってその発現が明らかとなるポリペプチドをコードする遺伝子である。レポーター遺伝子の発現は、DNAがレシピエント細胞に導入された後の適切な時点でアッセイされる。適切なレポーター遺伝子には、ルシフェラーゼ、ベータ-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、分泌アルカリホスファターゼをコードする遺伝子、または緑色蛍光タンパク質遺伝子が含まれ得る(例えば、Ui-Tei et al.,2000 FEBS Letters 479:79-82)。適切な発現系は周知であり、公知の技術を用いて調製するか、または商業的に入手することができる。一般に、最小の5’隣接領域がレポーター遺伝子の最も高い発現レベルを示す構築物は、プロモーターとして同定される。そのようなプロモーター領域をレポーター遺伝子に連結させて、プロモーター駆動型転写を調節する能力について薬剤を評価するのに使用することができる。
遺伝子を細胞に導入し発現させる方法は、当該技術分野で公知である。発現ベクターに関連して、ベクターを、当該技術分野の任意の方法によって、宿主細胞、例えば、哺乳動物細胞、細菌細胞、酵母細胞、または昆虫細胞に容易に導入することができる。例えば、発現ベクターを、物理的、化学的、または生物学的手段により宿主細胞に導入することができる。
ポリヌクレオチドを宿主細胞に導入するための物理的方法としては、リン酸カルシウム沈殿、リポフェクション、微粒子銃、マイクロインジェクション、エレクトロポレーションなどが挙げられる。ベクター及び/または外来核酸を含む細胞の産生方法は、当該技術分野において周知である。例えば、Sambrook et al.(2012,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,New Yorkを参照されたい)。ポリヌクレオチドを宿主細胞に導入するための例示的な方法は、リン酸カルシウムトランスフェクションである。
目的のポリヌクレオチドを宿主細胞に導入するための生物学的方法には、DNA及びRNAベクターの使用が含まれる。ウイルスベクター、特にレトロウイルスベクターは、哺乳動物、例えばヒト細胞への遺伝子挿入に最も広く使用される方法となっている。他のウイルスベクターは、レンチウイルス、ポックスウイルス、単純ヘルペスウイルスI型、アデノウイルス及びアデノ随伴ウイルスなどに由来し得る。例えば、米国特許第5,350,674号及び同第5,585,362号を参照されたい。
ポリヌクレオチドを宿主細胞に導入するための化学的手段としては、巨大分子複合体、ナノカプセル、ミクロスフェア、ビーズ、ならびに水中油型エマルション、ミセル、混合ミセル及びリポソームを含む脂質ベース系などのコロイド分散系が挙げられる。in vitro及びin vivoでの送達ビヒクルとして使用するための例示的なコロイド系は、リポソーム(例えば、人工膜小胞)である。
非ウイルス送達系を利用する場合、例示的な送達ビヒクルはリポソームである。核酸の宿主細胞への導入(in vitro、ex vivoまたはin vivo)に脂質製剤の使用が企図される。別の態様では、核酸は脂質と会合され得る。脂質と会合される核酸は、リポソームの水性内部にカプセル化され得るか、リポソームの脂質二重層内に散在され得るか、リポソームとオリゴヌクレオチドの両方に会合した連結分子を介してリポソームに結合され得るか、リポソーム中に封入され得るか、リポソームと複合体を形成され得るか、脂質を含有する溶液中に分散され得るか、脂質と混合され得るか、脂質と組み合わされ得るか、脂質中に懸濁液として含有され得るか、ミセルに含有され得るかもしくはそれと複合体を形成され得るか、または他の方法で脂質と会合され得る。脂質、脂質/DNA、または脂質/発現ベクター会合組成物は、溶液中で何らかの特定の構造に限定されない。例えば、それらは、二重層構造で、ミセルとして、または「崩壊した」構造で存在し得る。それらはまた、単に溶液中に散在していてもよく、あるいは、サイズまたは形状が均一ではない凝集体を形成してもよい。脂質は、天然に存在する脂質または合成の脂質であり得る脂肪物質である。例えば、脂質には、細胞質に天然に存在する脂肪滴、ならびに脂肪酸、アルコール、アミン、アミノアルコール及びアルデヒドなどの長鎖脂肪族炭化水素ならびにそれらの誘導体を含む化合物のクラスが含まれる。
使用に適した脂質は、商業的供給源から入手することができる。例えば、ジミリスチルホスファチジルコリン(「DMPC」)は、Sigma,St.Louis,MOから入手することができ、リン酸ジセチル(「DCP」)は、K & K Laboratories(Plainview,NY)から入手することができ、コレステロール(「Choi」)は、Calbiochem-Behringから入手することができ、ジミリスチルホスファチジルグリセロール(「DMPG」)及び他の脂質は、Avanti Polar Lipids,Inc.(Birmingham,AL)から入手することができる。クロロホルムまたはクロロホルム/メタノール中の脂質原液は、約-20℃で保存することができる。クロロホルムはメタノールよりも容易に蒸発するため、単独の溶媒として使用される。「リポソーム」は、封入脂質二重層または凝集体の生成によって形成される様々な単層及び多層脂質ビヒクルを包含する一般的用語である。リポソームは、リン脂質二重層膜及び内部水性媒体を有する小胞構造を有することを特徴とし得る。多層リポソームは、水性媒体によって分離された複数の脂質層を有する。これらは、リン脂質を過剰の水溶液中で懸濁させた場合に自発的に形成される。脂質成分は、閉鎖構造の形成前に自己再構成を起こし、脂質二重層間に水及び溶解された溶質を取り込む(Ghosh et al.,1991 Glycobiology 5:505-10)。しかしながら、溶液中で通常の小胞構造とは異なる構造を有する組成物も包含される。例えば、脂質は、ミセル構造をとることも、または単に脂質分子の不均一な凝集体として存在することもできる。また、リポフェクタミン-核酸複合体も企図される。
外来核酸の宿主細胞への導入に使用する方法を問わず、宿主細胞中の組換えDNA配列の存在を確認するために、様々なアッセイを実施することができる。そのようなアッセイとしては、例えば、サザンブロッティング及びノーザンブロッティング、RT-PCR、ならびにPCRなどの当業者に周知の「分子生物学的」アッセイ;例えば、免疫学的手段(ELISA及びウエスタンブロット)によって、または本発明の範囲内にある薬剤を同定するための本明細書に記載されるアッセイによって、特定のペプチドの存在または不在を検出するなどの「生化学的」アッセイが挙げられる。
系
一態様では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集するための系を提供する。一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;CRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、CRISPR-Cas系ガイドRNAは、遺伝子の標的DNA配列に実質的にハイブリダイズする。
一態様では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集するための系を提供する。一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;CRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、CRISPR-Cas系ガイドRNAは、遺伝子の標的DNA配列に実質的にハイブリダイズする。
一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2のCRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、第1のCRISPR-Cas系ガイドRNAは第1のDNA配列に実質的にハイブリダイズし、第2のCRISPR-Cas系ガイドRNAは第2のDNA配列に実質的にハイブリダイズする。一実施形態では、第1のDNA配列及び第2のDNA配列は、標的挿入領域に隣接する。一実施形態では、この系は、ドナー鋳型核酸の標的挿入領域への挿入を触媒する。
一実施形態では、この系は、第1の融合タンパク質をコードする核酸配列であって、第1の融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2の融合タンパク質をコードする核酸配列であって、第2の融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2のCRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。
一実施形態では、第1の融合タンパク質及び第2の融合タンパク質は、同じであるか、または異なっている。例えば、一実施形態では、第1の融合タンパク質は、HIV INまたはその断片、dCas9タンパク質及びNLSを含み、第2の融合タンパク質は、BIV INまたはその断片、Cpf1 Casタンパク質及びNLSを含む。
一実施形態では、U3は、第1の融合タンパク質のレトロウイルスINに特異的であり、U5は、第2の融合タンパク質のレトロウイルスINに特異的である。例えば、一実施形態では、第1の融合タンパク質は、HIV INまたはその断片、dCas9タンパク質及びNLSを含み、第2の融合タンパク質は、BIV INまたはその断片、Cpf1 Casタンパク質及びNLSを含み、U3配列はHIV INに特異的であり、U5配列はBIV INに特異的である。
一実施形態では、第1のCRISPR-Cas系ガイドRNAは第1のDNA配列に実質的にハイブリダイズし、第2のCRISPR-Cas系ガイドRNAは第2のDNA配列に実質的にハイブリダイズする。一実施形態では、第1のDNA配列及び第2のDNA配列は、標的挿入領域に隣接する。一実施形態では、この系は、ドナー鋳型核酸の標的挿入領域への挿入を触媒する。
一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;CRISPR-Cas系ガイドRNA;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を含む。
一実施形態では、融合タンパク質をコードする核酸配列、CRISPR-Cas系ガイドRNAをコードする核酸配列、及びドナー鋳型核酸をコードする核酸配列は、同じかまたは異なるベクター上に存在する。
一実施形態では、融合タンパク質をコードする核酸配列は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、融合タンパク質をコードする核酸配列は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
一実施形態では、融合タンパク質をコードする核酸配列は、配列番号155~196のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、融合タンパク質をコードする核酸配列は、配列番号155~196のうちの1つの核酸配列を含む。
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。例えば、一実施形態では、レトロウイルスINはHIV INであり、U3配列は、配列番号197と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号198と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはRSV INであり、U3配列は、配列番号199と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号200と95%同一である配列を含む。
一実施形態では、レトロウイルスINはHFV INであり、U3配列は、配列番号201と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号202と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはEIAV INであり、U3配列は、配列番号203と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号204と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはMoLV INであり、U3配列は、配列番号205と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号206と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはMMTV INであり、U3配列は、配列番号207と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号208と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはWDSV INであり、U3配列は、配列番号209と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号210と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはBLV INであり、U3配列は、配列番号211と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号212と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはSIV INであり、U3配列は、配列番号213と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号214と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはFIV INであり、U3配列は、配列番号215と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号216と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、レトロウイルスINはBIV INであり、U3配列は、配列番号217と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号218と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、INはTy1であり、U3配列は、配列番号219と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号220と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
一実施形態では、INはInsF INであり、U3配列はIS3 IRL配列であり、U5配列はIS3 IRR配列である。一実施形態では、INはInsF INであり、U3配列は、配列番号221と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号222と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
系及びベクターは、原核細胞または真核細胞中のCRISPR転写物(例えば、核酸転写物、タンパク質または酵素)の発現のために設計することができる。例えば、CRISPR転写物を、Escherichia coliなどの細菌細胞、昆虫細胞(バキュロウイルス発現ベクターを使用)、酵母細胞、または哺乳動物細胞内で発現させることができる。適切な宿主細胞は、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)にさらに論じられている。あるいは、組換え発現ベクター系を、in vitroで、例えばT7プロモーター調節配列及びT7ポリメラーゼを使用して転写及び翻訳することができる。
ベクターを原核生物に導入し、原核生物中で増殖させることができる。いくつかの実施形態では、原核生物を、真核細胞に導入されるベクターのコピーを増幅するために使用するか、または真核細胞に導入されるベクターの産生における中間ベクターとして使用する(例えば、ウイルスベクターパッケージング系の一部としてのプラスミドを増幅する)。いくつかの実施形態では、宿主細胞または宿主生物に送達するための1つ以上のタンパク質の供給源を提供するように、原核生物を使用してベクターのコピーを増幅し、1つ以上の核酸を発現させる。原核生物中のタンパク質の発現は、ほとんどの場合、Escherichia coli内で、融合タンパク質または非融合タンパク質のいずれかの発現を指示する構成的プロモーターまたは誘導性プロモーターを含むベクターを用いて行われる。融合ベクターは、そこにコードされているタンパク質に、例えば、組換えタンパク質のアミノ末端に、いくつかのアミノ酸を付加する。そのような融合ベクターは、1つ以上の目的、例えば、(i)組換えタンパク質の発現を増加させるため、(ii)組換えタンパク質の溶解性を増加させるため、及び(iii)アフィニティー精製においてリガンドとして作用することにより組換えタンパク質の精製を補助するために役立ち得る。多くの場合、融合発現ベクターでは、融合タンパク質の精製後に組換えタンパク質を融合部分から分離することができるように、融合部分と組換えタンパク質との接合部にタンパク質分解切断部位が導入される。そのような酵素、及びそれらの同族認識配列には、第Xa因子、トロンビン、及びエンテロキナーゼが含まれる。融合発現ベクターの例としては、グルタチオンS-トランスフェラーゼ(GST)、マルトースE結合タンパク質、またはプロテインAを標的組換えタンパク質にそれぞれ融合する、pGEX(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)及びpRIT5(Pharmacia,Piscataway,N.J.)が挙げられる。
適切な誘導性非融合E.coli発現ベクターの例としては、pTrc(Amrann et al.,(1988)Gene 69:301-315)及びpET 11d(Studier et al.,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)が挙げられる。
いくつかの実施形態では、ベクターは、酵母発現ベクターである。酵母Saccharomyces cerivisaeにおける発現用のベクターの例としては、pYepSec1(Baldari,et al.,1987.EMBO J.6:229-234)、pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943)、pJRY88(Schultz et al.,1987.Gene 54:113-123)、pYES2(Invitrogen Corporation,San Diego,Calif.)及びpicZ(InVitrogen Corp,San Diego,Calif.)が挙げられる。
いくつかの実施形態では、ベクターは、バキュロウイルス発現ベクターを使用して、昆虫細胞におけるタンパク質発現を駆動する。培養昆虫細胞(例えば、SF9細胞)におけるタンパク質の発現に利用可能なバキュロウイルスベクターとしては、pAcシリーズ(Smith,et al.,1983.Mol.Cell.Biol.3:2156-2165)及びpVLシリーズ(Lucklow and Summers,1989.Virology 170:31-39)が挙げられる。
いくつかの実施形態では、ベクターは、哺乳動物発現ベクターを使用して、哺乳動物細胞における1つ以上の配列の発現を駆動することができる。哺乳動物の発現ベクターの例としては、pCDM8(Seed,1987.Nature 329:840)及びpMT2PC(Kaufman,et al.,1987.EMBO J.6:187-195)が挙げられる。哺乳動物細胞中で使用される場合、発現ベクターの制御機能は、通常、1つ以上の調節エレメントによってもたらされる。例えば、一般的に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、サルウイルス40、及び本明細書に開示され、当該技術分野で公知の他のものに由来する。原核細胞及び真核細胞の両方に適した他の発現系については、例えば、Sambrook,et al.,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989のChapter16及び17を参照されたい。
いくつかの実施形態では、組換え哺乳動物発現ベクターは、特定の細胞タイプにおいて優先的に核酸の発現を誘導することができる(例えば、組織特異的調節エレメントを使用して核酸を発現させる)。組織特異的な調節エレメントは、当該技術分野において公知である。適切な組織特異的プロモーターの非限定的な例としては、アルブミンプロモーター(肝臓特異的、Pinkert,et al.,1987.Genes Dev.1:268-277)、リンパ球特異的プロモーター(Calame and Eaton,1988.Adv.Immunol.43:235-275)、特にT細胞受容体のプロモーター(Winoto and Baltimore,1989.EMBO J.8:729-733)及び免疫グロブリンのプロモーター(Baneiji,et al.,1983.Cell 33:729-740、Queen and Baltimore,1983.Cell 33:741-748)、ニューロン特異的プロモーター(例えば、ニューロフィラメントプロモーター、Byrne and Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477)、膵臓特異的プロモーター(Edlund,et al.,1985.Science 230:912-916)、ならびに乳腺特異的プロモーター(例えば、乳清プロモーター、米国特許第4,873,316号及び欧州出願公開第264,166号)が挙げられる。発生的に調節されたプロモーター、例えば、ネズミhoxプロモーター(Kessel and Gruss,1990.Science 249:374-379)及びα-フェトプロテインプロモーター(Campes and Tilghman,1989.Genes Dev.3:537-546)も含まれる。
いくつかの実施形態では、調節エレメントは、CRISPR系の1つ以上のエレメントの発現を駆動するように、CRISPR系の1つ以上のエレメントに作動可能に連結されている。一般に、SPIDR(スペーサー散在型ダイレクトリピート(SPacer Interspersed Direct Repeat))としても知られるCRISPR(クラスター化され規則的に間隔が空いた短い回文構造の繰り返し)は、特定の細菌種に対して通常特異的であるDNA遺伝子座のファミリーを構成する。CRISPR遺伝子座は、E.coli中で認識された異なるクラスの散在する短い配列リピート(SSR)(Ishino et al.,J.Bacteriol.,169:5429-5433[1987]、及びNakata et al.,J.Bacteriol.,171:3553-3556[1989])ならびに関連する遺伝子を含む。同様の散在するSSRが、Haloferax mediterranei、Streptococcus pyogenes、Anabaena及びMycobacterium tuberculosisで同定されている(Groenen et al.,Mol.Microbiol.,10:1057-1065[1993]、Hoe et al.,Emerg.Infect.Dis.,5:254-263[1999]、Masepohl et al.,Biochim.Biophys.Acta 1307:26-30[1996]、及びMojica et al.,Mol.Microbiol.,17:85-93[1995]を参照されたい)。CRISPR遺伝子座は通常、リピートの構造によって他のSSRとは異なり、短く規則的に間隔が空いたリピート(short regularly spaced repeat)(SRSR)と称される(Janssen et al.,OMICS J.Integ. Biol.,6:23-33[2002]、及びMojica et al.,Mol.Microbiol.,36:244-246[2000])。一般に、リピートは、実質的に一定の長さであるユニークな介在配列によって規則的に間隔が空いた、クラスターで存在する短いエレメントである(Mojica et al.,[2000],上掲)。リピート配列は株間で高度に保存されているが、散在するリピートの数とスペーサー領域の配列は通常、株ごとに異なる(van Embden et al.,J.Bacteriol.,182:2393-2401[2000])。CRISPR遺伝子座は、40種を超える原核生物で同定されており(例えば、Jansen et al.,Mol.Microbiol.,43:1565-1575[2002]、及びMojica et al.,[2005]を参照されたい)、それらとしては、例えば、Aeropyrum、Pyrobaculum、Sulfolobus、Archaeoglobus、Halocarcula、Methanobacteriumn、Methanococcus、Methanosarcina、Methanopyrus、Pyrococcus、Picrophilus、Thernioplasnia、Corynebacterium、Mycobacterium、Streptomyces、Aquifrx、Porphvromonas、Chlorobium、Thermus、Bacillus、Listeria、Staphylococcus、Clostridium、Thermoanaerobacter、Mycoplasma、Fusobacterium、Azarcus、Chromobacterium、Neisseria、Nitrosomonas、Desulfovibrio、Geobacter、Myrococcus、Campylobacter、Wolinella、Acinetobacter、Erwinia、Escherichia、Legionella、Methylococcus、Pasteurella、Photobacterium、Salmonella、Xanthomonas、Yersinia、Treponema、及びThermotogaが挙げられるが、これらに限定されない。
本明細書で使用される場合、「標的配列」は、ガイドRNAが相補性を有するように設計された配列を指し、標的配列とガイド配列との間のハイブリダイゼーションは、CRISPR複合体の形成を促進する。ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性があれば、必ずしも完全な相補性は必要ない。標的配列は、DNAまたはRNAポリヌクレオチドなどの任意のポリヌクレオチドを含み得る。いくつかの実施形態では、標的配列は、細胞の核または細胞質に位置する。いくつかの実施形態では、標的配列は、真核細胞の細胞小器官、例えば、ミトコンドリアまたは葉緑体内に存在し得る。標的配列を含む標的遺伝子座への組換えに使用することができる配列または鋳型は、「編集鋳型」または「編集ポリヌクレオチド」または「編集配列」と称される。本発明の態様では、外来鋳型ポリヌクレオチドは、編集鋳型と称されることもある。本発明の一態様では、組換えは、相同組換えである。
ガイド配列を、任意の標的配列を標的とするように選択することができる。いくつかの実施形態では、標的配列は、細胞のゲノム内の配列である。例示的な標的配列には、標的ゲノムにおいてユニークなものが含まれる。例えば、S.pyogenes Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGのCas9標的部位を含み得、NNNNNNNNNNNNXGG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGのS.pyogenes Cas9標的部位を含み得、NNNNNNNNNNNXGG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。S.thermophilus CRISPR1 Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXXAGAAW(配列番号1)のCas9標的部位を含み得、NNNNNNNNNNNNXXAGAAW(配列番号2)(NはA、G、TまたはCであり、Xは任意でよく、WはAまたはTである)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXXAGAAW(配列番号3)のS.thermophilus CRISPR1Cas9標的部位を含み得、NNNNNNNNNNNXXAGAAW(配列番号4)(NはA、G、TまたはCであり、Xは任意でよく、WはAまたはTである)はそのゲノム中に1回出現する。S.pyogenes Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGXGのCas9標的部位を含み得、NNNNNNNNNNNNXGGXG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGXGのS.pyogenes Cas9標的部位を含み得、NNNNNNNNNNNXGGXG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。これらの配列のそれぞれにおいて、「M」はA、G、TまたはCであり得、配列をユニークであると同定する際にこれを考慮する必要はない。
いくつかの実施形態では、ガイド配列を、ガイド配列内の二次構造の程度を低減させるように選択する。二次構造は、任意の適切なポリヌクレオチドフォールディングアルゴリズムによって決定することができる。一部のプログラムは、最小ギブズ自由エネルギーの計算に基づく。そのようなアルゴリズムの一例は、Zuker and Stiegler(Nucleic Acids Res.9(1981),133-148)によって説明されているmFoldである。別のフォールディングアルゴリズムの例は、University of ViennaのInstitute for Theoretical Chemistryにてセントロイド構造予測アルゴリズムを使用して開発された、オンラインウェブサーバーRNAfoldである(例えば、A.R.Gruber et al.,2008,Cell106(1):23-24、及びPA Carr and GM Church,2009,Nature Biotechnology27(12):1151-62を参照されたい)。
一般に、tracrメイト配列は、(1)対応するtracr配列を含む細胞内のtracrメイト配列に隣接するガイド配列の切除、及び(2)tracr配列にハイブリダイズしたtracrメイト配列を含むCRISPR複合体の標的配列での形成、の1つ以上を促進するのに十分なtracr配列との相補性を有する任意の配列を含む。一般に、相補性の程度は、tracrメイト配列とtracr配列の、2つの配列のうちの短い方の長さに沿った最適なアラインメントを参照している。最適なアラインメントは、任意の適切なアラインメントアルゴリズムによって決定することができ、さらに、tracr配列内またはtracrメイト配列内のいずれかの自己相補性などの二次構造を説明することができる。いくつかの実施形態では、最適にアラインメントした場合、tracr配列とtracrメイト配列間の2つのうちの短い方の長さに沿った相補性の程度は、約25%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、約95%以上、約97.5%以上、約99%以上であるか、またはそれより高い。いくつかの実施形態では、tracr配列は、約5ヌクレオチド長以上、約6ヌクレオチド長以上、約7ヌクレオチド長以上、約8ヌクレオチド長以上、約9ヌクレオチド長以上、約10ヌクレオチド長以上、約11ヌクレオチド長以上、約12ヌクレオチド長以上、約13ヌクレオチド長以上、約14ヌクレオチド長以上、約15ヌクレオチド長以上、約16ヌクレオチド長以上、約17ヌクレオチド長以上、約18ヌクレオチド長以上、約19ヌクレオチド長以上、約20ヌクレオチド長以上、約25ヌクレオチド長以上、約30ヌクレオチド長以上、約40ヌクレオチド長以上、約50ヌクレオチド長以上であるか、またはそれより長い。いくつかの実施形態では、tracr配列及びtracrメイト配列は、単一の転写物内に含まれ、その結果、2つの間のハイブリダイゼーションは、ヘアピンなどの二次構造を有する転写物を生成する。一実施形態では、ヘアピン構造で使用するためのループ形成配列は、4ヌクレオチド長である。一実施形態では、ヘアピン構造で使用するためのループ形成配列は、配列GAAAを有する。但し、代替配列と同様に、より長いまたはより短いループ配列を使用することもできる。配列は、ヌクレオチドトリプレット(例えば、AAA)、及び別のヌクレオチド(例えば、CまたはG)を含み得る。ループ形成配列の例としては、CAAA及びAAAGが挙げられる。本発明の一実施形態では、転写物または転写されたポリヌクレオチド配列は、少なくとも2つ以上のヘアピンを有する。いくつかの実施形態では、転写物は、2つ、3つ、4つ、または5つのヘアピンを有する。本発明のさらなる実施形態では、転写物は、最大で5つのヘアピンを有する。いくつかの実施形態では、単一の転写物は、転写終結配列をさらに含み、いくつかの実施形態では、転写終結配列は、ポリT配列、例えば、6つのTヌクレオチドである。
核酸の編集及び送達方法
一実施形態では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集する方法を提供する。例えば、一実施形態では、編集は組み込みである。一実施形態では、編集はCRISPR媒介性編集である。
一実施形態では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集する方法を提供する。例えば、一実施形態では、編集は組み込みである。一実施形態では、編集はCRISPR媒介性編集である。
一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、in vitro法であるか、またはin vivo法である。
一実施形態では、本発明は、遺伝物質に核酸配列を送達する方法を提供する。一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝子に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、in vitro法であるか、またはin vivo法である。
一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
一実施形態では、遺伝物質の編集方法は、遺伝子の編集方法である。一実施形態では、遺伝子は細胞のゲノムに位置している。一実施形態では、遺伝物質の編集方法は、核酸の編集方法である。
一実施形態では、本発明は、ドナー鋳型配列を標的配列に挿入する方法を提供する。一実施形態では、本方法は、ドナー鋳型配列を細胞内の標的配列に挿入する。一実施形態では、本方法は、融合タンパク質をコードする核酸分子;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。一実施形態では、本方法は、融合タンパク質;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
CRISPR-Cas9媒介性HDRを使用したゲノム編集用の大型DNA配列の標的化送達は、依然として非効率的である。しかしながら、本方法は、大型のドナー鋳型配列を細胞内の標的配列に挿入するための方法を提供する。一実施形態では、本方法は、ドナー鋳型配列を、少なくとも1kb以上、少なくとも2kb以上、少なくとも3kb以上、少なくとも4kb以上、少なくとも5kb以上、少なくとも6kb以上、少なくとも7kb以上、少なくとも8kb以上、少なくとも9kb以上、少なくとも10kb以上、少なくとも11kb以上、少なくとも12kb以上、少なくとも13kb以上、少なくとも14kb以上、少なくとも15kb以上、少なくとも16kb以上、少なくとも17kb以上、または少なくとも18kb以上挿入する。一実施形態では、本方法は、融合タンパク質または融合タンパク質をコードする核酸分子;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
一実施形態では、標的配列は遺伝子内に位置する。一実施形態では、ドナー鋳型配列は、遺伝子配列を破壊し、それにより遺伝子の発現を阻害するかまたは低減させる。一実施形態では、標的配列は突然変異を有し、ドナー鋳型配列は、修復された配列を標的配列に挿入して、それにより遺伝子突然変異を修復する。一実施形態では、ドナー鋳型配列は遺伝子配列であり、ドナー鋳型配列を細胞内の標的配列に挿入することにより、遺伝子の発現が可能となる。
一実施形態では、ドナー鋳型配列は、セーフハーバー部位に挿入される。したがって、一実施形態では、ガイド核酸は、遺伝子内のセーフハーバー領域に相補的なヌクレオチド配列を含む。セーフハーバー領域は、隣接遺伝子の発現に影響を及ぼすことなく、治療遺伝子の発現を可能にする。セーフハーバー領域には、隣接遺伝子から離れた遺伝子間領域、例えば、H11、または「非必須」遺伝子、例えば、CCR5、hROSA26もしくはAAVS1内が含まれ得る。例示的なセーフハーバー領域及びこれらの配列に相補的なガイド核酸配列は、例えば、Pellenz et al.,New Human Chromosomal Sites with “Safe Harbor” Potential for Targeted Transgene Insertion,2019,Hum Gene Ther 30(7):814-28に見出すことができ、これは参照により本明細書に組み込まれる。
一実施形態では、ドナー鋳型配列を3’非翻訳領域(UTR)に挿入することにより、ドナー鋳型配列の発現を他の遺伝子のプロモーターによって制御することが可能となる。
一実施形態では、核酸分子は、レトロウイルスインテグラーゼ(IN)またはその断片をコードする第1の核酸配列、CRISPR関連(Cas)タンパク質をコードする第2の核酸配列、及び核局在化シグナル(NLS)をコードする第3の核酸配列を含む。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上のアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。
一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つをコードする核酸配列を含む。
一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つをコードする核酸配列を含む。
一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも95%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも96%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも97%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも98%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つの核酸配列を含む。
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
いくつかの実施形態では、遺伝子は、任意の目的標的遺伝子である。例えば、一実施形態では、遺伝子は、疾患を有するかまたは発症するリスクの増加に関連する任意の遺伝子である。いくつかの実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を導入することを含む。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチドに結合し遺伝子内の標的ポリヌクレオチドの切断をもたらす。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列及びドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸及びドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸及びドナー鋳型核酸と複合体を形成している。
いくつかの実施形態では、IN-Cas9は、ドナー鋳型の遺伝子への組み込みを触媒する。一実施形態では、組み込みは、1つ以上の突然変異を遺伝子に導入する。いくつかの実施形態では、前記突然変異は、標的配列を含む遺伝子からのタンパク質発現において1つ以上のアミノ酸変化を生じさせる。
一実施形態では、DNA配列のIN媒介性組み込みは、標的DNA配列のいずれの方向にも生じ得る。一実施形態では、Cas及びINレトロウイルスクラスのタンパク質の様々な組み合わせを使用して指向性編集を容易にする。例えば、一実施形態では、レトロウイルスクラスに由来するINの融合体は、Cas特異的ガイドRNAを利用した特定の標的配列への結合を可能とする、第1の触媒的に死んだCasに結合する。一実施形態では、ドナー配列は、HIV LTR及びBIV LTR配列の両方を含む。したがって、一実施形態では、この配列は、標的DNAに単一の方向で組み込まれる。
一実施形態では、LoxPに隣接する(Floxed)配列は、目的遺伝子周囲に導入される。floxed配列を含めることにより、Cre媒介性組換え及び条件付き突然変異誘発が可能となる。CRISPR-Cas9を使用してFloxed対立遺伝子を作製する現行の方法は、非効率的である。最も広く利用されているアプローチは、隣接する標的配列でのDNA切断を誘導するための2本のガイドRNA、及びLoxP配列を含有するssDNA鋳型を挿入するための相同組換え修復を使用することである。しかしながら、二重sgRNAを使用して切断を誘導する場合、最も好ましい反応は、介在配列が欠失し、その結果全体的な遺伝子欠失が生じることである。したがって、一実施形態では、インテグラーゼ-Cas媒介性遺伝子挿入の使用により、DNA配列のタンデム挿入の効率が上昇する。一実施形態では、IN媒介性組み込みがいずれの方向にも生じ得るため、反転したLoxP配列を含有する配列の組み込みにより、LoxPに隣接する配列の組換えが可能となる。
治療方法及び使用方法
本発明は、疾患または障害及び/または遺伝子改変を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させて、所望の表現型の結果をもたらす方法を提供する。例えば、一実施形態では、本発明の方法は、哺乳動物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、植物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、酵母生物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。
本発明は、疾患または障害及び/または遺伝子改変を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させて、所望の表現型の結果をもたらす方法を提供する。例えば、一実施形態では、本発明の方法は、哺乳動物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、植物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、酵母生物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。
一実施形態では、疾患または障害は、ゲノム遺伝子座における1つ以上の突然変異によって引き起こされる。したがって、一実施形態では、疾患または障害を、1つ以上の突然変異を有する領域の野生型配列に対応する核酸配列の導入、及び/または1つ以上の突然変異を有するゲノム配列の発現を防止もしくは低減させるエレメントの導入を介して治療するか、低減させるか、またはリスクを低減させることができる。したがって、一実施形態では、本方法は、標的配列内のゲノム遺伝子座のコーディングエレメント、非コーディングエレメント、または調節エレメント内の標的配列の操作を含む。
例えば、一実施形態では、疾患は単一遺伝子性疾患である。一実施形態では、疾患には、デュシェンヌ型筋ジストロフィー(ジストロフィンに発生する突然変異)、肢帯型筋ジストロフィー2B型(LGMD2B)及び三好型ミオパチー(ジスフェルリンに発生する突然変異)、嚢胞性線維症(CFTRに発生する突然変異)、ウィルソン病(ATP7Bに発生する突然変異)ならびにシュタルガルト黄斑変性(ABCA4に発生する突然変異)が含まれるが、これらに限定されない。
本発明はまた、遺伝子または遺伝物質の発現を調節する方法を提供する。例えば、一実施形態では、本発明の方法は、細胞または生物に表現型を付与するための遺伝物質の送達を提供する。例えば、一実施形態では、本方法は、病原体に対する耐性をもたらす。一実施形態では、本方法は、代謝経路の調節をもたらす。一実施形態では、本方法は、生物における物質の産生及び使用をもたらす。例えば、一実施形態では、本方法は、真核生物、酵母、細菌または植物などの生物において、生物学的物質、薬学的物質及びバイオ燃料などの物質を生成する。
一実施形態では、本方法は、融合タンパク質または融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列を含むドナー鋳型核酸を投与することを含む。一実施形態では、本方法は、ドナー鋳型配列を投与することをさらに含む。
一実施形態では、標的配列は遺伝子内に位置する。一実施形態では、ドナー鋳型配列は、遺伝子配列を破壊し、それにより遺伝子の発現を阻害するかまたは低減させる。一実施形態では、標的配列は突然変異を有し、ドナー鋳型配列は、修復された配列を標的配列に挿入して、それにより遺伝子突然変異を修復する。一実施形態では、ドナー鋳型配列は遺伝子配列であり、ドナー鋳型配列を細胞内の標的配列に挿入することにより、遺伝子の発現が可能となる。
一実施形態では、融合タンパク質は、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む。一実施形態では、融合タンパク質は、Casタンパク質、NLS及びレトロウイルスインテグラーゼ(IN)またはその断片を含む。
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上のアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。
一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
一実施形態では、レトロウイルスINをコードする核酸配列は、配列番号99~138のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
一実施形態では、Casタンパク質をコードする核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
一実施形態では、NLSは、配列番号47~56、配列番号254~256及び配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、NLSは、配列番号47~56、配列番号254~256及び配列番号275~887のうちの1つをコードする核酸配列を含む。
一実施形態では、NLSをコードする核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
いくつかの実施形態では、遺伝子は、任意の目的標的遺伝子である。例えば、一実施形態では、遺伝子は、疾患を有するかまたは発症するリスクの増加に関連する任意の遺伝子である。いくつかの実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を導入することを含む。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチドに結合し遺伝子内の標的ポリヌクレオチドの切断をもたらす。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列及びドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸及びドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸及びドナー鋳型核酸と複合体を形成している。
いくつかの実施形態では、IN-Cas9は、ドナー鋳型の遺伝子への組み込みを触媒する。一実施形態では、組み込みは、1つ以上の突然変異を遺伝子に導入する。いくつかの実施形態では、前記突然変異は、標的配列を含む遺伝子からのタンパク質発現において1つ以上のアミノ酸変化を生じさせる。
以下の実験的実施例を参照することにより、本発明をさらに詳細に説明する。これらの実施例は例示目的のためのみに提供され、別段の定めがない限り、限定することを意図したものではない。したがって、本発明は、以下の実施例に限定されると決して解釈されるべきではなく、むしろ、本明細書で提供される教示の結果として明らかとなるあらゆるすべての変形を包含すると解釈されるべきである。
さらなる説明なしに、当業者は、前述の説明及び以下の例示的な実施例を使用して、本発明を作製及び利用し、特許請求された方法を実施することができると考えられる。したがって、以下の実施例は、本発明の特定の実施形態を具体的に示すものであり、いかなる意味においても本開示の残りの部分を制限するものとして解釈されるべきではない。
実施例1:哺乳動物のゲノムDNAを編集するためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化の向上
哺乳動物のゲノムDNAを効率的にCRISPR-Cas9で編集するには、核膜を欠く原核細胞で通常機能する、大型の細菌RNA誘導エンドヌクレアーゼであるCas9の核局在化が必要である。哺乳動物細胞におけるCas9の効率的な核局在化には、1つはN末端に、もう1つはC末端に位置する少なくとも2つの哺乳動物核局在化シグナルの付加が必要であることが示されている(Cong et al.,2013,Science 339:819-23)。
哺乳動物のゲノムDNAを効率的にCRISPR-Cas9で編集するには、核膜を欠く原核細胞で通常機能する、大型の細菌RNA誘導エンドヌクレアーゼであるCas9の核局在化が必要である。哺乳動物細胞におけるCas9の効率的な核局在化には、1つはN末端に、もう1つはC末端に位置する少なくとも2つの哺乳動物核局在化シグナルの付加が必要であることが示されている(Cong et al.,2013,Science 339:819-23)。
編集のためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化を促進するために、dCas9上のC末端SV40 NLSに加えて、N末端SV40 NLSをインテグラーゼに含めた(図1A)。意外にも、哺乳動物細胞で発現させた場合、dCas9上のC末端3xFLAGエピトープを認識するFLAG抗体を使用して検出されたように、IN-dCas9融合タンパク質のごく一部のみが核に局在した(図1B)。興味深いことに、完全長IN-dCas9融合タンパク質は細胞質凝集体を生じさせたが、インテグラーゼのC末端ドメインの欠失(INΔC)により、溶解性が高まり、核局在化が増加した(図1B)。
レトロウイルスインテグラーゼのdCas9への融合は、核に局在するその能力を劇的に減少させるように思われる。インテグラーゼdCas9融合タンパク質の核局在化をさらに向上させるために、IN-dCas9の核内輸送を誘導する能力について、いくつかの異なる哺乳動物の核局在化配列を試験した(図1B)。SV40 NLSの3つのコピーの多量体化(3xSV40)は、IN-dCas9またはINΔC-dCas9の核局在化の程度に明らかな効果を示さなかった。しかしながら、ヌクレオプラスミン(NPM)由来の双節型(bipartite)NLSの付加により、INΔC-dCas9融合タンパク質の核局在化が増加したが、完全長IN融合タンパク質の核局在化は増加しなかった。3xSV40とNPM NLSの組み合わせは、NPM単独と同様であるように思われた。
興味深いことに、酵母LTRレトロトランスポゾン(例えば、Ty1)はレトロウイルスの進化上の祖先であり、細胞質内のRNA中間体の逆転写を通じてそれらのゲノムを複製する(Curcio et al.,2015,Microbiol Spectr 3:MDNA3-0053-2014)。LTRレトロトランスポゾンは、レトロトランスポゾンゲノムの挿入に必要なインテグラーゼ酵素を含有する。細胞分裂中に開放型有糸分裂を経る高等真核生物とは対照的に、酵母は閉鎖型有糸分裂を経るため、核膜はそのまま維持される。したがって、Ty1新生の場合、インテグラーゼ/レトロトランスポゾンゲノム複合体の核内輸送には、能動的な核内輸送が必要である。そのため、哺乳動物のインテグラーゼ酵素とは対照的に、Ty1インテグラーゼはレトロ転位に必要な大型のC末端双節型NLSを含有する(Moore et al.,1998,Mol Cell Biol 18:1105-14)。興味深いことに、本明細書に示された結果は、両方のIN-dCas9融合タンパク質のC末端へのTy1 NLSの融合が、哺乳動物細胞中で強力な核局在化をもたらしたことを実証している(図1B)。
INΔC-dCas9融合タンパク質の核局在化の増加は、培養中の分裂哺乳動物細胞における編集を大幅に向上させた。Ty1 NLSの付加により、HEK293細胞中のEF1-アルファの3’UTREを標的とするIRES-mCherry鋳型を組み込むための、INΔC-dCas9融合タンパク質の活性が増強された(図1C)。強力なTy1 NLSを利用することにより、核膜を常に維持する非分裂細胞での編集(例えば、in vivoでの治療適用)がさらに可能となり得る。
実施例2:筋ジストロフィーの修復のための統合的遺伝子編集アプローチ
本明細書の他の箇所に示されているように、レンチウイルスインテグラーゼのCRISPR-Cas9への融合により、ゲノムDNAへの大型DNA配列の配列特異的な組み込みが可能となる。このアプローチは、ヒトの遺伝性疾患を永続的に修復するために、非病原性のゲノム位置(セーフハーバー)に治療上有益な遺伝子を送達するために利用することができる(図2)。この技術により、短いウイルス末端モチーフを含有する大型DNAドナー配列の配列特異的な組み込みが可能となる。
本明細書の他の箇所に示されているように、レンチウイルスインテグラーゼのCRISPR-Cas9への融合により、ゲノムDNAへの大型DNA配列の配列特異的な組み込みが可能となる。このアプローチは、ヒトの遺伝性疾患を永続的に修復するために、非病原性のゲノム位置(セーフハーバー)に治療上有益な遺伝子を送達するために利用することができる(図2)。この技術により、短いウイルス末端モチーフを含有する大型DNAドナー配列の配列特異的な組み込みが可能となる。
本発明の遺伝子治療アプローチの主な利点は、ドナーDNA配列を標的ゲノム位置に送達する能力である。さらに、このアプローチは、相同性アームを不要にしてガイドRNAによる標的化に依存し、ゲノム編集を大幅に簡素化する。したがって、特定のレポータードナー配列を一旦作製すると、多種多様な適用のために、それを任意の場所(または複数の場所)に誘導することができる。
レンチウイルスインテグラーゼのdCas9への融合は、哺乳動物細胞中でCRISPRガイドRNAを使用して、短いウイルス末端を含有するドナーDNA配列を標的配列に挿入するのに十分である(図3)。哺乳動物細胞中のインテグラーゼ-Cas媒介性組み込みをモニタリングするために、IGR IRES配列とそれに続くmCherry-2a-ピューロマイシン遺伝子及びSV40ポリアデニル化配列を含有するドナーベクターを作製した(図3)。次に、COS-7細胞中の安定したヒトCMV-eGFP安定細胞株を標的とするsgRNAを設計した。hCMV-eGFPの安定した導入遺伝子は、強力に発現しているが必須ではない発現遺伝子座での編集を判定するために使用することができる異種標的配列をもたらした。ドナーmCherry-2a-puro鋳型を精製し、sgRNA及びIN-dCas9とともにGFP安定細胞にコトランスフェクトし、48時間培養した。48時間後、mCherry陽性細胞が培養液中に見られ、GFP陽性シグナルに取って代わった(図3)。
ヒトジストロフィンの哺乳動物ゲノムへのインテグラーゼ-Cas媒介性組み込みの有効性及び忠実度。
インテグラーゼ-Cas媒介性遺伝子送達は、哺乳動物のゲノムDNAへの大型DNA配列の配列特異的な組み込みを誘導する。インテグラーゼ-Casは、培養細胞中のヒトAAVS1及びマウスROSA26ゲノムDNAに特異的なCRISPRガイドRNAを使用して、ヒトα-骨格アクチン(HSA)プロモーターの制御下で、ヒトジストロフィン遺伝子をセーフハーバー位置に送達するために使用される。ジストロフィンの正確な標的化を、PCRベースの遺伝子型同定を使用して評価する。
インテグラーゼ-Cas媒介性遺伝子送達は、哺乳動物のゲノムDNAへの大型DNA配列の配列特異的な組み込みを誘導する。インテグラーゼ-Casは、培養細胞中のヒトAAVS1及びマウスROSA26ゲノムDNAに特異的なCRISPRガイドRNAを使用して、ヒトα-骨格アクチン(HSA)プロモーターの制御下で、ヒトジストロフィン遺伝子をセーフハーバー位置に送達するために使用される。ジストロフィンの正確な標的化を、PCRベースの遺伝子型同定を使用して評価する。
インテグラーゼ-Cas媒介性ジストロフィン遺伝子治療は、デュシェンヌ型筋ジストロフィーのマウスモデルの筋機能を回復させる。
ヒトジストロフィンのInscritpr媒介性送達の有効性を、筋ジストロフィーに最も一般的に使用されているマウスモデルであるMDXマウス系統で判定する。全身送達後、ジストロフィン発現のレベルを、2ヶ月、4ヶ月、及び6ヶ月の時間経過にわたり、抗ジストロフィン抗体を使用して、四肢骨格筋、心臓及び横隔膜で定量化及び測定する。DMD疾患の病因の軽減を、血清クレアチンキナーゼ(CK)(骨格筋損傷のマーカー及びDMD患者の診断マーカー)のレベル、握力、ならびに四肢骨格筋、心臓及び横隔膜の組織学的分析を定量化することにより評価する。
ヒトジストロフィンのInscritpr媒介性送達の有効性を、筋ジストロフィーに最も一般的に使用されているマウスモデルであるMDXマウス系統で判定する。全身送達後、ジストロフィン発現のレベルを、2ヶ月、4ヶ月、及び6ヶ月の時間経過にわたり、抗ジストロフィン抗体を使用して、四肢骨格筋、心臓及び横隔膜で定量化及び測定する。DMD疾患の病因の軽減を、血清クレアチンキナーゼ(CK)(骨格筋損傷のマーカー及びDMD患者の診断マーカー)のレベル、握力、ならびに四肢骨格筋、心臓及び横隔膜の組織学的分析を定量化することにより評価する。
遺伝子発現の組織学的分析。
8週齢で、左後肢四頭筋、心臓、及び横隔膜を回収し、重量を測定し、PBS中の4%ホルムアルデヒドで固定して、パラフィン組織学的検査用の日常的な方法を使用して処理する。HSA-ジストロフィン/GFP融合タンパク質を発現する筋線維のパーセンテージをDMDMdx/y及びWTマウスの両方で抗GFP抗体を使用して実施する。右後肢筋を、後続のPCRベースの遺伝子型同定、RT-PCRによる遺伝子発現、及びウエスタンブロットによるタンパク質発現解析のために、液体窒素で急速冷凍する。
8週齢で、左後肢四頭筋、心臓、及び横隔膜を回収し、重量を測定し、PBS中の4%ホルムアルデヒドで固定して、パラフィン組織学的検査用の日常的な方法を使用して処理する。HSA-ジストロフィン/GFP融合タンパク質を発現する筋線維のパーセンテージをDMDMdx/y及びWTマウスの両方で抗GFP抗体を使用して実施する。右後肢筋を、後続のPCRベースの遺伝子型同定、RT-PCRによる遺伝子発現、及びウエスタンブロットによるタンパク質発現解析のために、液体窒素で急速冷凍する。
インテグラーゼ-Cas媒介性送達は、デュシェンヌ型筋ジストロフィーのマウスモデルにおける疾患の病因を軽減する。
横断組織切片のヘマトキシリン・エオジン(H&E)染色、フォン・コッサ染色及びマッソントリクローム染色を使用して、中心核、石灰化及び筋内膜線維症を含有する筋線維をそれぞれ同定する。定量的比較と統計分析を使用して、中心核を伴う筋線維の比率を比較するか、または四頭筋肢筋(quadriceps limb muscle)中で染色された石灰化または線維症の領域を比較する。各遺伝子型の3匹の異なるマウスから、各筋肉について少なくとも3つの異なる平面断面を比較する。マウスが重症度が低い表現型を示すインテグラーゼ-Casで処置したDmdmdx/yは、中心核を伴う筋線維の比率が低下し、線維症及び石灰化の総面積が減少している。
横断組織切片のヘマトキシリン・エオジン(H&E)染色、フォン・コッサ染色及びマッソントリクローム染色を使用して、中心核、石灰化及び筋内膜線維症を含有する筋線維をそれぞれ同定する。定量的比較と統計分析を使用して、中心核を伴う筋線維の比率を比較するか、または四頭筋肢筋(quadriceps limb muscle)中で染色された石灰化または線維症の領域を比較する。各遺伝子型の3匹の異なるマウスから、各筋肉について少なくとも3つの異なる平面断面を比較する。マウスが重症度が低い表現型を示すインテグラーゼ-Casで処置したDmdmdx/yは、中心核を伴う筋線維の比率が低下し、線維症及び石灰化の総面積が減少している。
血清クレアチンキナーゼ(CK)測定。
血清CKは、骨格筋損傷の相関マーカーであり、DMD患者の診断マーカーである。CK測定を、非致死性手順を使用して、前述の動物コホートで2週間、4週間、6週間及び8週間で実施する。簡潔に述べると、血液を眼窩周囲の血管叢から直接マイクロヘマトクリットチューブに回収し、室温で30分間凝固させた後、1,700×gで10分間遠心分離する。Dmdmdx/yKOよりも重症度が低い表現型を示す処置マウスは、血清CKレベルが大幅に低下している。
血清CKは、骨格筋損傷の相関マーカーであり、DMD患者の診断マーカーである。CK測定を、非致死性手順を使用して、前述の動物コホートで2週間、4週間、6週間及び8週間で実施する。簡潔に述べると、血液を眼窩周囲の血管叢から直接マイクロヘマトクリットチューブに回収し、室温で30分間凝固させた後、1,700×gで10分間遠心分離する。Dmdmdx/yKOよりも重症度が低い表現型を示す処置マウスは、血清CKレベルが大幅に低下している。
実施例3:ゲノム編集-指向性非相同DNA組み込み
ここに示されるデータは、哺乳動物ゲノムの効率的な編集を可能にするために最適化されたインテグラーゼ-Casを示している。
ここに示されるデータは、哺乳動物ゲノムの効率的な編集を可能にするために最適化されたインテグラーゼ-Casを示している。
最適化された編集
IN媒介性組み込みを最適化するために、インテグラーゼの触媒活性、溶解性、または宿主細胞の補因子との相互作用を増強させるアミノ酸突然変異が、編集を向上させるかどうかを判定する。さらに、レトロウイルスの7つのユニークなクラスから単離されたINタンパク質の効率及び忠実度を評価する。
IN媒介性組み込みを最適化するために、インテグラーゼの触媒活性、溶解性、または宿主細胞の補因子との相互作用を増強させるアミノ酸突然変異が、編集を向上させるかどうかを判定する。さらに、レトロウイルスの7つのユニークなクラスから単離されたINタンパク質の効率及び忠実度を評価する。
哺乳動物細胞中のIN-dCas9媒介性組み込みを定量化及び特性決定するために、Escherichia coli中で発現すると濃青色のコロニーを生成するサンゴAcropora millepora(amilCP)由来の青色色素タンパク質を利用する、プラスミドベースのレポーター系を使用する。amilCPオープンリーディングフレームの破壊により青色タンパク質の発現が消失し、これを、標的化忠実度の直接的な読み取り値として使用することができる。さらに、HIV由来のU3及びU5レトロウイルス末端配列に隣接する、クロラムフェニコール抗生物質耐性遺伝子をコードするドナー鋳型を作製した。このドナー鋳型の組み込みはクロラムフェニコールに対する耐性を付与し、これを利用して、インテグラーゼ-Cas媒介性のDNA組み込みをモニタリングすることができる。このレポーターアッセイでは、IN-dCas9融合タンパク質、amilCPを標的とするsgRNA及びドナー鋳型を含有する発現プラスミドを、細菌amilCPレポーターとともに哺乳動物のCOS-7細胞にコトランスフェクトする。48時間後、カラム精製を使用して全プラスミドDNAを回収し、E.coliに形質転換させる。IN-dCas9は、クロラムフェニコールをコードする鋳型DNAをamilCPレポータープラスミドに組み込むのに十分であり、それにより、amilCPの発現を妨害し、クロラムフェニコールに対する耐性を付与する。個々の組み込み事象の定量化及びクローン配列解析を可能とするこの迅速なアッセイを、編集を最適化するために使用する。
インテグラーゼ活性の増強:IN内の大部分の突然変異はその活性を消失させるが、過去数十年の研究により、IN触媒活性(D116N)、二量体化(E85F)、溶解性(F185K/C280S)、及び宿主細胞タンパク質との相互作用(K71R)を増加させることによりINの組み込みを向上させる、いくつかの突然変異が同定されている。活性化IN突然変異を含有するIN-dCas9融合タンパク質を、プラスミドベースのレポーターアッセイを使用して、この融合タンパク質が活性を増強させるかどうかを判定するために使用する。
宿主細胞タンパク質によるインテグラーゼ活性の修飾:INはin vitroでプロウイルスDNAを組み込むために必要かつ十分な唯一のタンパク質であるが、宿主細胞タンパク質との相互作用は、IN媒介性のDNA組み込み18を大幅に変化させ得る。特に、LEDGF/p75、VBP1及びSNF5は、IN媒介性組み込みを促進することができる、特性が十分に明らかにされているHIV IN相互作用タンパク質である。これらの因子をプラスミドレポーターアッセイを使用して発現させ、これらがドナー鋳型の組み込みを促進するかどうかを判定する。
様々なレトロウイルスクラス由来のインテグラーゼを比較及び対比する:レトロウイルスクラス由来のすべてのIN酵素には保存されたコア触媒D,D(35)E残基が含まれているが、それらは、ゲノムサイズ、複雑性、U3及びU5末端配列、ならびにDNA結合効率について大幅に異なっている。様々なレトロウイルスINの編集効率を判定するために、アルファ(RSV)、ベータ(MMTV)、ガンマ(MoLV)、デルタ(BLV)、イプシロン(WDSV)及びスプーマウイルス(HFV)を含む各レトロウイルスクラスからのモデル例を、dCas9への融合体としてクローニングした。それぞれのU3及びU5末端モチーフを含有するドナープラスミドを作製する。タンパク質発現をウエスタンブロットによって検証し、核局在化を、dCas9のC末端に位置する3xFLAGエピトープを検出するためのFLAG抗体を使用した免疫細胞化学を使用して検証する。
哺乳動物のゲノムDNAの編集効率
哺乳動物のゲノムDNAの編集の有効性及び忠実度を、安定CMV駆動型GFPレポーター細胞株を使用して判定し、RFP及びピューロマイシン選択カセットを含有するドナー鋳型を作製する。組み込み事象を定量化しクローン的に特性決定して、新規ゲノム編集技術としての本方法の有効性及び忠実度を判定する。
哺乳動物のゲノムDNAの編集の有効性及び忠実度を、安定CMV駆動型GFPレポーター細胞株を使用して判定し、RFP及びピューロマイシン選択カセットを含有するドナー鋳型を作製する。組み込み事象を定量化しクローン的に特性決定して、新規ゲノム編集技術としての本方法の有効性及び忠実度を判定する。
細胞ベースのレポーターアッセイの作製:この遺伝子座での組み込み事象を定量化するために、IRES-RFP-2A-ピューロマイシンカセットとGFPコード配列を標的とするガイドRNAとを含有するドナー鋳型を使用する。ドナーカセットをCMV-GFP遺伝子座に挿入すると、RFP発現がGFP発現に取って代わり、抗生物質ピューロマイシンに対する耐性がもたらされる。FACSソーティングを使用してトランスフェクション及び48時間の培養後にRFP+/GFP-(標的化組み込み)である細胞のパーセンテージを測定し、Inscripr編集の効率及び忠実度を定量化する。クローン組み込み事象を選択するためにピューロマイシンを使用する。これは、PCRプライマーを使用してGFP遺伝子座とドナーカセットとの間の配列を増幅することを特徴とする。
複数の内在性遺伝子座での編集:インテグラーゼ-Casを、CMV-GFP遺伝子座及びHEK293ヒト細胞株中のヒトEF1-アルファ遺伝子座の3’UTRに特異的なsgRNAを使用して、RFP-2Aピューロマイシンカセットをノックインするために使用する。3’UTRを標的とすると、正常な遺伝子発現を妨害せずにIRES依存性ベクターを発現させることができる。ピューロマイシンを使用したクローン選択後、PCR遺伝子型同定を使用して、両方の遺伝子座にドナー鋳型を組み込んだクローンのパーセンテージを測定する。
実施例4:Incriptrの作製及び特性決定
機能的なIN-dCas9融合タンパク質の作製。
哺乳動物細胞中で使用するための機能的なIN-dCas9融合タンパク質を作製するために、完全長レトロウイルスINをHIV-1(gag-polポリタンパク質のアミノ酸1148~1435)から、可撓性のある15アミノ酸のリンカー[(GGGGS)3)]で分離させて、ヒトコドン最適化dCas9のN末端にクローニングした(図6)。SV40核局在化シグナル(NLS)をINのN末端に含め、これは、dCas9上のC末端SV40 NLSとともに、IN-dCas9融合タンパク質の核局在化をもたらした。C末端非特異的DNA結合ドメインを欠くIN-dCas9融合体を作製するために、dCas9へのN末端融合体としてINのN末端及び触媒コアドメイン(a.a.1148~1369)のみを含有する追加の構築物を作製した(図6)。
機能的なIN-dCas9融合タンパク質の作製。
哺乳動物細胞中で使用するための機能的なIN-dCas9融合タンパク質を作製するために、完全長レトロウイルスINをHIV-1(gag-polポリタンパク質のアミノ酸1148~1435)から、可撓性のある15アミノ酸のリンカー[(GGGGS)3)]で分離させて、ヒトコドン最適化dCas9のN末端にクローニングした(図6)。SV40核局在化シグナル(NLS)をINのN末端に含め、これは、dCas9上のC末端SV40 NLSとともに、IN-dCas9融合タンパク質の核局在化をもたらした。C末端非特異的DNA結合ドメインを欠くIN-dCas9融合体を作製するために、dCas9へのN末端融合体としてINのN末端及び触媒コアドメイン(a.a.1148~1369)のみを含有する追加の構築物を作製した(図6)。
プラスミドDNAの編集をモニタリングするためのレポーターの作製。
哺乳動物細胞中のIN-dCas9媒介性組み込みを定量化及び特性決定するために、Escherichia coli中で発現すると濃青色のコロニーを生成するサンゴAcropora millepora(amilCP)由来の青色色素タンパク質を利用する、プラスミドベースのレポーターアッセイを設計した(図6)。amilCPオープンリーディングフレームの破壊により青色タンパク質の発現が消失し、これを、標的化忠実度の直接的な読み取り値として、及びインテグラーゼ-Cas媒介性組み込みの標的DNAとして使用することができる。標的DNAでのN末端dCas9融合タンパク質の効率的な二量体化を促進するために、単一ガイドRNA(sgRNA)標的配列を、16bpのスペーサー配列によって分離して「PAM外部(PAM-out)」方向で設計した(図4)。
哺乳動物細胞中のIN-dCas9媒介性組み込みを定量化及び特性決定するために、Escherichia coli中で発現すると濃青色のコロニーを生成するサンゴAcropora millepora(amilCP)由来の青色色素タンパク質を利用する、プラスミドベースのレポーターアッセイを設計した(図6)。amilCPオープンリーディングフレームの破壊により青色タンパク質の発現が消失し、これを、標的化忠実度の直接的な読み取り値として、及びインテグラーゼ-Cas媒介性組み込みの標的DNAとして使用することができる。標的DNAでのN末端dCas9融合タンパク質の効率的な二量体化を促進するために、単一ガイドRNA(sgRNA)標的配列を、16bpのスペーサー配列によって分離して「PAM外部(PAM-out)」方向で設計した(図4)。
インテグラーゼ-Cas媒介性組み込みのためのウイルス末端ドナー配列の作製。
インテグラーゼ-Cas媒介性組み込み用のドナー配列を作製するために使用することができる標的化ベクターを構築するために、U3 HIV末端及びU5 HIV末端を含む30塩基対をpCRIIにサブクローニングした(図6)。ドナー配列のサブクローニングを容易にするために、9つのユニークな制限酵素を含有するマルチクローニングサイトをU3とU5の間に含めた。U3及びU5がそれらの末端で同じ3ヌクレオチド(それぞれACTとAGT)を共有しているため、プラスミド骨格から平滑末端ドナー配列を作製するために使用できるScaI制限部位を両端に作製するために、追加の半部位(half-site)配列を含めた(図6)。さらに、隣接するIIS型制限酵素部位をFauI用に含め、FauIは、2つの5’ヌクレオチドオーバーハングを切断して残し、露出したCAジヌクレオチドを含むプレプロセシングされたウイルス3’末端を模倣する(図6)。ゲル精製及びプラスミド骨格からのFauI消化鋳型の分離を補助するために、多部位指向性突然変異誘発を使用して、pCR IIプラスミド骨格に存在する6つのFauI部位を除去した。
インテグラーゼ-Cas媒介性組み込み用のドナー配列を作製するために使用することができる標的化ベクターを構築するために、U3 HIV末端及びU5 HIV末端を含む30塩基対をpCRIIにサブクローニングした(図6)。ドナー配列のサブクローニングを容易にするために、9つのユニークな制限酵素を含有するマルチクローニングサイトをU3とU5の間に含めた。U3及びU5がそれらの末端で同じ3ヌクレオチド(それぞれACTとAGT)を共有しているため、プラスミド骨格から平滑末端ドナー配列を作製するために使用できるScaI制限部位を両端に作製するために、追加の半部位(half-site)配列を含めた(図6)。さらに、隣接するIIS型制限酵素部位をFauI用に含め、FauIは、2つの5’ヌクレオチドオーバーハングを切断して残し、露出したCAジヌクレオチドを含むプレプロセシングされたウイルス3’末端を模倣する(図6)。ゲル精製及びプラスミド骨格からのFauI消化鋳型の分離を補助するために、多部位指向性突然変異誘発を使用して、pCR IIプラスミド骨格に存在する6つのFauI部位を除去した。
プロトコル:トランスフェクション用のINsrtドナー鋳型の調製
1)INsrtプラスミドDNAの制限消化を設定する
2)制限消化反応
3)骨格DNAからドナー鋳型をゲル精製する
4)トランスフェクション用にドナーDNAを溶出させる
1)INsrtプラスミドDNAの制限消化を設定する
2)制限消化反応
3)骨格DNAからドナー鋳型をゲル精製する
4)トランスフェクション用にドナーDNAを溶出させる
哺乳動物細胞におけるプラスミドDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
協調的IN-dCas9媒介性組み込みの陽性選択を可能にするために、発現プラスミドのレポーターには存在しないクロラムフェニコール耐性遺伝子(CAT)を保有するINsrtドナーベクターを設計した(図7)。Plautia stali腸管ウイルス(PSIV)由来のIGR IRESをCAT遺伝子の前に含めた。このIGR IRESは、原核生物細胞及び真核生物細胞の両方で翻訳を開始させて、複数の組み込み部位での翻訳を補助することができる。クロラムフェニコール耐性遺伝子とウイルス末端とを含有する鋳型を、ScaI(平滑末端)またはFauI(プロセシングされた末端)のいずれかを使用して消化し、プラスミド骨格DNAからゲル精製した。INsrt鋳型、amilCP配列を標的とするIN-dCas9ベクターのコトランスフェクションを、Cos7細胞にコトランスフェクトした(図7)。48時間後、カラム精製を使用して全プラスミドDNAを回収し、E.coliに形質転換させた。クロラムフェニコール耐性クローンは、全長IN及びINDC-dCas9融合タンパク質の両方で観察された。プラスミドの配列決定により、IG3-CATプラスミド配列がamilCPレポーターに組み込まれたことが明らかとなった。興味深いことに、ウイルスDNA末端の3’プレプロセシングを模倣するFauI消化ドナー配列の使用により、ScaI消化平滑末端鋳型と比較して2倍のクロラムフェニコール耐性クローンが生じた。インテグラーゼ-Cas媒介性組み込みは、組み込み部位に隣接する宿主DNAの5塩基対のリピートを含む、HIV INレンチウイルス組み込みの特徴を含んでいた。興味深いことに、組み込み部位は2つのsgRNA標的部位間には生じなかったが、amilCP標的配列の両側で生じた。
協調的IN-dCas9媒介性組み込みの陽性選択を可能にするために、発現プラスミドのレポーターには存在しないクロラムフェニコール耐性遺伝子(CAT)を保有するINsrtドナーベクターを設計した(図7)。Plautia stali腸管ウイルス(PSIV)由来のIGR IRESをCAT遺伝子の前に含めた。このIGR IRESは、原核生物細胞及び真核生物細胞の両方で翻訳を開始させて、複数の組み込み部位での翻訳を補助することができる。クロラムフェニコール耐性遺伝子とウイルス末端とを含有する鋳型を、ScaI(平滑末端)またはFauI(プロセシングされた末端)のいずれかを使用して消化し、プラスミド骨格DNAからゲル精製した。INsrt鋳型、amilCP配列を標的とするIN-dCas9ベクターのコトランスフェクションを、Cos7細胞にコトランスフェクトした(図7)。48時間後、カラム精製を使用して全プラスミドDNAを回収し、E.coliに形質転換させた。クロラムフェニコール耐性クローンは、全長IN及びINDC-dCas9融合タンパク質の両方で観察された。プラスミドの配列決定により、IG3-CATプラスミド配列がamilCPレポーターに組み込まれたことが明らかとなった。興味深いことに、ウイルスDNA末端の3’プレプロセシングを模倣するFauI消化ドナー配列の使用により、ScaI消化平滑末端鋳型と比較して2倍のクロラムフェニコール耐性クローンが生じた。インテグラーゼ-Cas媒介性組み込みは、組み込み部位に隣接する宿主DNAの5塩基対のリピートを含む、HIV INレンチウイルス組み込みの特徴を含んでいた。興味深いことに、組み込み部位は2つのsgRNA標的部位間には生じなかったが、amilCP標的配列の両側で生じた。
哺乳動物細胞における、平滑末端(ScaI切断)または3’プロセシング模倣(FauI切断)末端のいずれかを有するInsrt IGR-CATドナー鋳型のpCRII-amilCPレポーターへの組み込み。興味深いことに、dCas9への融合体としてのC末端非特異的DNA結合ドメインの欠失は、インテグラーゼ-Cas媒介性組み込みを阻害しない。3’プロセシングを模倣する末端を使用すると、CAT耐性クローンの約2倍の増加が示される(図29B)。二量体化阻害突然変異(E85G及びE85F)は、IGR-CATドナー鋳型のamilCPへの二重ガイドRNA標的化組み込みを使用したインテグラーゼ-Cas媒介性組み込みを妨害しない。しかしながら、IN E87G突然変異を、対形成した標的化sgRNAによって回復させることはできない。興味深いことに、dCas9へのタンデムINΔCd融合体(tdINΔC-dCas9)は、約2倍向上した組み込みを示す(図29C)。
プロトコル:哺乳動物細胞におけるプラスミドDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
1)マルチシストロン性sgRNA及びIN-dCas9プラスミド、細菌amilCPレポータープラスミド及びINsrtドナー鋳型を、哺乳動物(例えば、Cos7)細胞にコトランスフェクトする。
a.細胞をプレーティングする直前にトランスフェクション反応を設定する。
b.細胞を回収し、プレーティングし、トランスフェクトする。
2)トランスフェクトした細胞からプラスミドDNAを回収する。
3)回収したプラスミドDNAを化学的にコンピテントなE.coliに形質転換する。
1)マルチシストロン性sgRNA及びIN-dCas9プラスミド、細菌amilCPレポータープラスミド及びINsrtドナー鋳型を、哺乳動物(例えば、Cos7)細胞にコトランスフェクトする。
a.細胞をプレーティングする直前にトランスフェクション反応を設定する。
b.細胞を回収し、プレーティングし、トランスフェクトする。
2)トランスフェクトした細胞からプラスミドDNAを回収する。
3)回収したプラスミドDNAを化学的にコンピテントなE.coliに形質転換する。
ゲノムDNAへのインテグラーゼ-Cas媒介性組み込みのためのCMV-GFP安定哺乳動物細胞株の作製。
哺乳動物細胞における個々の組み込み事象の忠実度を定量化及び特性決定するために使用可能な安定GFPレポーター細胞株を作製した(図3)。ヒトCMVプロモーターの制御下にあるGFPをコードするプラスミド(pcDNA3.1-GFP)を線状化し、Cos7細胞にトランスフェクトして、G418及び段階希釈を使用して安定クローンを選択した。この人工遺伝子座は、必須宿主遺伝子を標的とする場合にさもなければ起こり得る正常細胞の生存率を低下させずに、破壊の標的となり得る強力な遺伝子発現を可能とする。
哺乳動物細胞における個々の組み込み事象の忠実度を定量化及び特性決定するために使用可能な安定GFPレポーター細胞株を作製した(図3)。ヒトCMVプロモーターの制御下にあるGFPをコードするプラスミド(pcDNA3.1-GFP)を線状化し、Cos7細胞にトランスフェクトして、G418及び段階希釈を使用して安定クローンを選択した。この人工遺伝子座は、必須宿主遺伝子を標的とする場合にさもなければ起こり得る正常細胞の生存率を低下させずに、破壊の標的となり得る強力な遺伝子発現を可能とする。
哺乳動物のゲノムDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
CMV-GFP遺伝子座での組み込み事象を定量化するために、IGR-mCherry-2A-ピューロマイシン-pAカセットとGFPコード配列を標的とする対形成したガイドRNAとを含有するドナー鋳型を構築した(図3)。ドナーカセットをCMV-GFP遺伝子座へ組み込むと、mCherryの発現が駆動され、GFPの発現が妨害されて、抗生物質ピューロマイシンに対する耐性がもたらされる。トランスフェクション及び48時間の培養後、mCherry陽性細胞が観察され、その一部には、弱いが検出可能なレベルのGFP発現が依然として含まれていた(図3)。
CMV-GFP遺伝子座での組み込み事象を定量化するために、IGR-mCherry-2A-ピューロマイシン-pAカセットとGFPコード配列を標的とする対形成したガイドRNAとを含有するドナー鋳型を構築した(図3)。ドナーカセットをCMV-GFP遺伝子座へ組み込むと、mCherryの発現が駆動され、GFPの発現が妨害されて、抗生物質ピューロマイシンに対する耐性がもたらされる。トランスフェクション及び48時間の培養後、mCherry陽性細胞が観察され、その一部には、弱いが検出可能なレベルのGFP発現が依然として含まれていた(図3)。
内在性遺伝子座でのドナー配列のインテグラーゼ-Cas媒介性組み込み。
標的化戦略を設計し、ヒトEF1-アルファ遺伝子座の3’UTRに特異的なガイドRNAを選択して、IGR-mCherry-2A-ピューロマイシン-pAカセットをヒトHEK293細胞株にノックインした(図8)。EF1-アルファ発現のオープンリーディングフレームを破壊することなくIGR-mCherryカセットを発現させるため、3’UTRを標的とした。トランスフェクション及び48時間の培養後、培養液中にmCherry陽性細胞が観察された(図8)。
標的化戦略を設計し、ヒトEF1-アルファ遺伝子座の3’UTRに特異的なガイドRNAを選択して、IGR-mCherry-2A-ピューロマイシン-pAカセットをヒトHEK293細胞株にノックインした(図8)。EF1-アルファ発現のオープンリーディングフレームを破壊することなくIGR-mCherryカセットを発現させるため、3’UTRを標的とした。トランスフェクション及び48時間の培養後、培養液中にmCherry陽性細胞が観察された(図8)。
プロトコル:哺乳動物のゲノムDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み
1)Fugene6またはLipofectamine2000を使用して、sgRNAをコードするプラスミド、IN-dCas9をコードするプラスミド及びINsrtドナー鋳型をコードするプラスミドを、1:1:1で哺乳動物細胞(COS7、HEK293など)にコトランスフェクトする。
a.細胞を回収し、プレーティングし、トランスフェクトする。
2)組み込まれた配列の抗生物質選択
a.抗生物質選択を含有する10mlの培地で細胞を洗浄し、この培地にプレーティングする。
b.細胞を培養後、クローンを作製する。
1)Fugene6またはLipofectamine2000を使用して、sgRNAをコードするプラスミド、IN-dCas9をコードするプラスミド及びINsrtドナー鋳型をコードするプラスミドを、1:1:1で哺乳動物細胞(COS7、HEK293など)にコトランスフェクトする。
a.細胞を回収し、プレーティングし、トランスフェクトする。
2)組み込まれた配列の抗生物質選択
a.抗生物質選択を含有する10mlの培地で細胞を洗浄し、この培地にプレーティングする。
b.細胞を培養後、クローンを作製する。
指向性編集。
DNA配列のIN媒介性組み込みは、標的DNA配列のいずれの方向にも生じ得る。Cas及びINレトロウイルスクラスのタンパク質の様々な組み合わせの利用により、指向性編集を促進する能力がもたらされる。例えば、触媒的に死んだLbCpf1(LbCpf1)に融合したBIV(ウシ免疫不全ウイルスまたは他のHIV関連ウイルス)由来のINの融合体は、Cpf1特異的ガイドRNAを利用した特定の標的配列への結合を可能にする。HIVとBIVの両方の末端配列を含有するドナー配列の利用により、標的DNAとの単一方向への結合が固定される(図9)。
DNA配列のIN媒介性組み込みは、標的DNA配列のいずれの方向にも生じ得る。Cas及びINレトロウイルスクラスのタンパク質の様々な組み合わせの利用により、指向性編集を促進する能力がもたらされる。例えば、触媒的に死んだLbCpf1(LbCpf1)に融合したBIV(ウシ免疫不全ウイルスまたは他のHIV関連ウイルス)由来のINの融合体は、Cpf1特異的ガイドRNAを利用した特定の標的配列への結合を可能にする。HIVとBIVの両方の末端配列を含有するドナー配列の利用により、標的DNAとの単一方向への結合が固定される(図9)。
Floxed対立遺伝子の作製のための多重ゲノム編集。
目的遺伝子周囲のLoxPに隣接する(Floxed)配列の導入により、Cre媒介性組換え及び条件付き突然変異誘発が可能となる。CRISPR-Cas9を使用してFloxed対立遺伝子を作製する現行の方法は、非効率的である。最も広く利用されているアプローチは、隣接する標的配列でのDNA切断を誘導するための2本のガイドRNA、及びLoxP配列を含有するssDNA鋳型を挿入するための相同組換え修復を使用することである。しかしながら、二重sgRNAを使用して切断を誘導する場合、最も好ましい反応は、介在配列が欠失し、その結果全体的な遺伝子欠失が生じることである。宿主DNAとのIN媒介性の鎖導入で介在配列の効率的な欠失が行えない場合、インテグラーゼ-Cas媒介性遺伝子挿入の使用は、DNA配列のタンデム挿入に、より効率的な代替アプローチを提供する。IN媒介性組み込みはいずれの方向でも生じ得るため、反転したLoxP配列を含有する配列の組み込みにより、LoxPに隣接する配列の組換えが可能となる(図10)。
目的遺伝子周囲のLoxPに隣接する(Floxed)配列の導入により、Cre媒介性組換え及び条件付き突然変異誘発が可能となる。CRISPR-Cas9を使用してFloxed対立遺伝子を作製する現行の方法は、非効率的である。最も広く利用されているアプローチは、隣接する標的配列でのDNA切断を誘導するための2本のガイドRNA、及びLoxP配列を含有するssDNA鋳型を挿入するための相同組換え修復を使用することである。しかしながら、二重sgRNAを使用して切断を誘導する場合、最も好ましい反応は、介在配列が欠失し、その結果全体的な遺伝子欠失が生じることである。宿主DNAとのIN媒介性の鎖導入で介在配列の効率的な欠失が行えない場合、インテグラーゼ-Cas媒介性遺伝子挿入の使用は、DNA配列のタンデム挿入に、より効率的な代替アプローチを提供する。IN媒介性組み込みはいずれの方向でも生じ得るため、反転したLoxP配列を含有する配列の組み込みにより、LoxPに隣接する配列の組換えが可能となる(図10)。
実施例5:Ty1 NLS様配列の同定及び活性
酵母Ty1レトロトランスポゾン由来のインテグラーゼ酵素は、比較的大型のリンカー配列によって分離されたタンデムKKRモチーフで構成される非古典的な双節型核局在化シグナルを含有する。酵母における先行研究により、核局在化及びTy1転位のためにこれらの基本的なモチーフが必要であることが実証されている(Kenna et al.,1998,Mol Cell Biol 18,1115-1124、Moore et al.,1998,Mol Cell Biol 18,1105-1114)。Ty1転位はTy1 NLSの存在に完全に依存しており、興味深いことに、古典的なNLSは、転位に必要なTy1 NLS活性を再現するには不十分である。興味深いことに、別の酵母タンパク質がこのタンデムKKRモチーフを共有しており、これらのタンパク質の多くが核に局在していることを考慮すると、これらはNLSとしての機能を果たす可能性がある(Kenna et al.,1998,Mol Cell Biol 18,1115-1124)。
酵母Ty1レトロトランスポゾン由来のインテグラーゼ酵素は、比較的大型のリンカー配列によって分離されたタンデムKKRモチーフで構成される非古典的な双節型核局在化シグナルを含有する。酵母における先行研究により、核局在化及びTy1転位のためにこれらの基本的なモチーフが必要であることが実証されている(Kenna et al.,1998,Mol Cell Biol 18,1115-1124、Moore et al.,1998,Mol Cell Biol 18,1105-1114)。Ty1転位はTy1 NLSの存在に完全に依存しており、興味深いことに、古典的なNLSは、転位に必要なTy1 NLS活性を再現するには不十分である。興味深いことに、別の酵母タンパク質がこのタンデムKKRモチーフを共有しており、これらのタンパク質の多くが核に局在していることを考慮すると、これらはNLSとしての機能を果たす可能性がある(Kenna et al.,1998,Mol Cell Biol 18,1115-1124)。
実施例1に示されるように、酵母Ty1 NLSは、哺乳動物細胞中でCasタンパク質及びCas融合タンパク質の強力な核局在化をもたらす。この活性がTy1 NLSの固有の特性であるかどうかを判断するために、Ty2インテグラーゼ及び他の酵母Ty1 NLS様モチーフに由来する近縁のNLSが、インテグラーゼ-dCas9融合タンパク質(INΔC-Cas9)を哺乳動物細胞中の核に局在させるのに十分であるかどうかを試験した。興味深いことに、Ty1 NLSに高度に保存されているTy2 NLSは、核局在化についてTy1 NLSと同等に効率的であった(図11)。Ty1/Ty2 NLS配列とは異なる、酵母中で同定された3つの異なるTy1 NLS様配列の融合体(Kenna et al.,1998)は、強力なNLS活性を示したか(MAK11)、または明らかなNLS活性を示さなかったか(INO4及びSTH1)のいずれかであった。MAK11配列は酵母核タンパク質に由来し、またタンパク質のC末端に存在する。これをさらにスクリーニングしたところ、この配列が実際にNLSとして機能していることが示唆された。モチーフKKRN20-40KKRを使用するSWISS-PROT Protein Sequence Databank内のすべてのタンパク質により、多種多様な種にわたり、多数の潜在的なTy1 NLS様配列が同定された(配列番号275~887)。これらのデータは、他のTy1 NLS様配列が強力なNLS活性を有する可能性があり、分裂真核細胞及び非分裂真核細胞におけるタンパク質(Cas及びCas融合タンパク質を含む)の局在化に有用である可能性があることを示している。
実施例6:Ty1 NLSを用いた向上したCRISPR-Cas9 DNA編集
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。これまで、哺乳動物細胞中のCRISPR-Cas9による効率的な核局在化及びDNAの編集には、2つの古典的な核局在化シグナル(N末端SV40及びC末端ヌクレオプラスミン(NPM)双節型NLS)の付加が必要であることが示されてきた(Cong et al.,2013,Science 339,819-823)。哺乳動物細胞中でCas融合タンパク質を局在化させるための、非古典的な酵母レトロトランスポゾンTy1 NLSの強力な性質(実施例1)を理由として、Ty1 NLSが哺乳動物細胞中で従来のCRISPR-Cas9の編集効率を向上させるようにも機能し得るかどうかを試験した。
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。これまで、哺乳動物細胞中のCRISPR-Cas9による効率的な核局在化及びDNAの編集には、2つの古典的な核局在化シグナル(N末端SV40及びC末端ヌクレオプラスミン(NPM)双節型NLS)の付加が必要であることが示されてきた(Cong et al.,2013,Science 339,819-823)。哺乳動物細胞中でCas融合タンパク質を局在化させるための、非古典的な酵母レトロトランスポゾンTy1 NLSの強力な性質(実施例1)を理由として、Ty1 NLSが哺乳動物細胞中で従来のCRISPR-Cas9の編集効率を向上させるようにも機能し得るかどうかを試験した。
Ty1がCRISPR-Cas9編集を向上させるかどうかを判断するために、既存のCRISPR-Cas9発現プラスミド(px330)を、C末端のNPM NLSを非古典的なTy1 NLS(px330-Ty1)に置き換えることにより改変した(図12A)。次に、標的配列(ts)の下流でアウトオブフレームのルシフェラーゼコード配列をコードする、フレームシフト応答性ルシフェラーゼレポーターを作製した(図12B)。このレポーターアッセイでは、標的配列付近の切断及び細胞の非相同末端結合(NHEJ)経路による不完全な修復により、ルシフェラーゼコード配列を再構成してルシフェラーゼ発現を生じさせる可能性のあるヌクレオチドの挿入または欠失が誘発され得る。
NPM NLSを含有するCas9と20ヌクレオチドの標的配列に特異的な単一ガイドRNAとをコードするベクターとのルシフェラーゼレポーターの共発現は、非標的化ガイドRNAと比較して、バックグラウンドに対する約20倍のルシフェラーゼ活性の増加をもたらした(図12C)。特に、Ty1 NLSを含有するCas9の発現は、NPM NLSを含有するCas9と比較して、COS-7細胞中のレポーター活性を有意に(約44%)増強させた(図12C)。
実施例7:編集のためのゲノム標的化戦略
インテグラーゼ-DNA結合融合タンパク質を使用したDNAドナー配列の標的化組み込みは、所望の結果に応じて、ゲノム内の様々な場所を標的とすることができる。例えば、遺伝子発現カセット(例えば、プロモーター、遺伝子配列及び転写ターミネーター)からなる治療用DNAドナー配列は、隣接遺伝子の発現に影響を及ぼすことなく治療遺伝子を発現させることができる、「セーフハーバー」位置を標的とすることができる(ヒトゲノムにおけるセーフハーバー部位の概説及びリストについては、Pellenz et al.,2019,Hum Gene Ther 30,814-828を参照されたい)。これらには、隣接遺伝子から離れた遺伝子間領域、例えばH11、または「非必須」遺伝子、例えばCCR5、hROSA26もしくはAAVS1内が含まれ得る(図13A及び図13B)。
インテグラーゼ-DNA結合融合タンパク質を使用したDNAドナー配列の標的化組み込みは、所望の結果に応じて、ゲノム内の様々な場所を標的とすることができる。例えば、遺伝子発現カセット(例えば、プロモーター、遺伝子配列及び転写ターミネーター)からなる治療用DNAドナー配列は、隣接遺伝子の発現に影響を及ぼすことなく治療遺伝子を発現させることができる、「セーフハーバー」位置を標的とすることができる(ヒトゲノムにおけるセーフハーバー部位の概説及びリストについては、Pellenz et al.,2019,Hum Gene Ther 30,814-828を参照されたい)。これらには、隣接遺伝子から離れた遺伝子間領域、例えばH11、または「非必須」遺伝子、例えばCCR5、hROSA26もしくはAAVS1内が含まれ得る(図13A及び図13B)。
疾患を引き起こす遺伝子突然変異の発現を元に戻すために、治療遺伝子配列の内在性疾患遺伝子座への標的化組み込みが有利である可能性があり、その理由としては、この遺伝子座がすでに欠損しており、この遺伝子座の空間的及び時間的発現が内在性の調節制御下にあるためである。1回の反復で、スプライスアクセプターを含有する治療遺伝子をコードするDNAドナー配列を内在性遺伝子座の第1イントロンに組み込むことができ、これにより、スプライシングは、1)導入された遺伝子配列を発現させ、かつ2)変異配列の下流の発現を阻止する(組み込まれたポリ(A)配列またはLTR配列からの終止による)(図13C)。これが下流のイントロンを標的とする場合、より小さなDNAドナー配列を送達または発現させることができる(図13D)。
遺伝子の3’非翻訳領域(3’UTR)へのIRES配列を含有するDNAドナー配列の標的化挿入は、このアプローチが標的遺伝子座と同じ空間的及び時間的発現での発現を可能にし、標的遺伝子座を破壊する可能性が低いという点で有益であり得る(図13E)。
実施例8:CRISPR-CASを使用した哺乳動物ゲノムへの標的化レンチウイルス組み込み
ここに示されるデータは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを示している。
ここに示されるデータは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを示している。
レンチウイルスの生活環
レンチウイルスは、それらのプロウイルスゲノムの永続的な二本鎖DNA(dsDNA)コピーを宿主細胞DNAに組み込む、一本鎖RNAウイルスである(図14)。レンチウイルスゲノムは、ウイルス遺伝子の転写を制御し、プロウイルスゲノムの組み込みに必要な短い(約20塩基対)配列モチーフをU3末端及びU5末端に含有する、ロングターミナルリピート(LTR)配列に隣接している。ウイルス感染に続いて、レンチウイルスRNAゲノムは、ウイルスにコードされた逆転写酵素(RT)により平滑末端dsDNAとしてコピーされ、インテグラーゼ(IN)により宿主ゲノムに挿入される。INは、DNAに非特異的に結合するC末端ドメイン(CTD)を含む、IN活性に不可欠な3つの機能ドメインからなる。レトロウイルスDNAのIN媒介性挿入は、DNA標的配列特異性をほとんど伴わずに生じ、活性遺伝子座へ組み込むことができるが、これは、正常遺伝子機能を破壊する可能性があり、ヒトにおいて疾患を引き起こす可能性がある。このことにより、大きな配列搭載容量という利点にもかかわらず、遺伝子治療のためのレンチウイルスベクターの有用性が制限されている。
レンチウイルスは、それらのプロウイルスゲノムの永続的な二本鎖DNA(dsDNA)コピーを宿主細胞DNAに組み込む、一本鎖RNAウイルスである(図14)。レンチウイルスゲノムは、ウイルス遺伝子の転写を制御し、プロウイルスゲノムの組み込みに必要な短い(約20塩基対)配列モチーフをU3末端及びU5末端に含有する、ロングターミナルリピート(LTR)配列に隣接している。ウイルス感染に続いて、レンチウイルスRNAゲノムは、ウイルスにコードされた逆転写酵素(RT)により平滑末端dsDNAとしてコピーされ、インテグラーゼ(IN)により宿主ゲノムに挿入される。INは、DNAに非特異的に結合するC末端ドメイン(CTD)を含む、IN活性に不可欠な3つの機能ドメインからなる。レトロウイルスDNAのIN媒介性挿入は、DNA標的配列特異性をほとんど伴わずに生じ、活性遺伝子座へ組み込むことができるが、これは、正常遺伝子機能を破壊する可能性があり、ヒトにおいて疾患を引き起こす可能性がある。このことにより、大きな配列搭載容量という利点にもかかわらず、遺伝子治療のためのレンチウイルスベクターの有用性が制限されている。
ゲノム編集
CRISPR-Cas9は、短い単一ガイドRNAを利用してDNAを認識しそれに結合することにより、プログラム可能なDNA標的化を可能にする。触媒的に不活性なCas9(dCas9)は、DNAを標的とする能力を保持しており、近年、ゲノムの照合及び調節用の多種多様な用途のためのプログラム可能なDNA結合プラットフォームとして再利用されている。実施例1に示したように、レンチウイルスインテグラーゼのdCas9への融合は、哺乳動物細胞中でCRISPRガイドRNAを使用して、短いウイルス末端を含有するドナーDNA配列を標的配列に挿入するのに十分である(図15)。哺乳動物細胞中のインテグラーゼ-Cas媒介性組み込みをモニタリングするために、IGR IRES配列とそれに続くmCherry-2a-ピューロマイシン遺伝子及びSV40ポリアデニル化配列を含有するドナーベクターを作製した(図15)。COS-7細胞中の安定したヒトCMV-eGFP安定細胞株を標的とするsgRNAを設計した(図15C及び15D)。hCMV-eGFPの安定した導入遺伝子は、強力に発現しているが必須ではない発現遺伝子座での編集を判定するために使用することができる異種標的配列をもたらした。ドナーmCherry-2a-puro鋳型を精製し、sgRNA及びIN-dCas9とともにGFP安定細胞にコトランスフェクトし、48時間培養した。48時間後、mCherry陽性細胞が培養液中に見られ、GFP陽性シグナルに取って代わった(図15E)。編集成分(インテグラーゼ-CRISPR-Cas9融合体)をレンチウイルス粒子に導入することにより、標的化され容易にプログラム可能な宿主DNAへのレンチウイルスゲノムの組み込みが可能となり、これにより、レンチウイルス遺伝子治療の主要な制限(すなわち、非特異的なレンチウイルスの組み込み)が取り除かれる。このアプローチは、基礎研究及び治療用途の両方に有用である。
CRISPR-Cas9は、短い単一ガイドRNAを利用してDNAを認識しそれに結合することにより、プログラム可能なDNA標的化を可能にする。触媒的に不活性なCas9(dCas9)は、DNAを標的とする能力を保持しており、近年、ゲノムの照合及び調節用の多種多様な用途のためのプログラム可能なDNA結合プラットフォームとして再利用されている。実施例1に示したように、レンチウイルスインテグラーゼのdCas9への融合は、哺乳動物細胞中でCRISPRガイドRNAを使用して、短いウイルス末端を含有するドナーDNA配列を標的配列に挿入するのに十分である(図15)。哺乳動物細胞中のインテグラーゼ-Cas媒介性組み込みをモニタリングするために、IGR IRES配列とそれに続くmCherry-2a-ピューロマイシン遺伝子及びSV40ポリアデニル化配列を含有するドナーベクターを作製した(図15)。COS-7細胞中の安定したヒトCMV-eGFP安定細胞株を標的とするsgRNAを設計した(図15C及び15D)。hCMV-eGFPの安定した導入遺伝子は、強力に発現しているが必須ではない発現遺伝子座での編集を判定するために使用することができる異種標的配列をもたらした。ドナーmCherry-2a-puro鋳型を精製し、sgRNA及びIN-dCas9とともにGFP安定細胞にコトランスフェクトし、48時間培養した。48時間後、mCherry陽性細胞が培養液中に見られ、GFP陽性シグナルに取って代わった(図15E)。編集成分(インテグラーゼ-CRISPR-Cas9融合体)をレンチウイルス粒子に導入することにより、標的化され容易にプログラム可能な宿主DNAへのレンチウイルスゲノムの組み込みが可能となり、これにより、レンチウイルス遺伝子治療の主要な制限(すなわち、非特異的なレンチウイルスの組み込み)が取り除かれる。このアプローチは、基礎研究及び治療用途の両方に有用である。
レンチウイルス遺伝子送達系
レンチウイルスベクターは、研究用途のための強力な遺伝子送達ツールとして適合されている(図16)。レンチウイルスの構造タンパク質及び酵素タンパク質は、大型ポリタンパク質(gag-pol及びエンベロープ)として転写及び翻訳される(図16A)。出芽ウイルス粒子に導入されると、ポリタンパク質はウイルスプロテアーゼによって個々のタンパク質にプロセシングされる。レンチウイルスベクター遺伝子発現系では、これらのポリタンパク質はウイルスゲノムから取り除かれ、別々の哺乳動物発現プラスミドを使用して発現される(図16B)。次に、目的のドナーDNA配列をウイルスポリタンパク質の代わりに、隣接するLTR配列の間にクローニングすることができる。哺乳動物細胞におけるこれらのベクターのコトランスフェクションにより、コードされたドナー配列を送達及び組み込むことができるレンチウイルス粒子が形成されるが、しかしながら、後続のウイルス増殖に必要なインテグラーゼ及び他のウイルスタンパク質についてのコード情報は必要とされない(図16B)。レンチウイルス粒子は、ウイルスタンパク質(例えば、インテグラーゼ及び逆転写酵素)ならびにdsDNAドナー配列の両方を送達するための天然のベクターであり、哺乳動物細胞へのインテグラーゼ媒介性の挿入に要する必要なウイルス末端配列を含有する(図16C)。
レンチウイルスベクターは、研究用途のための強力な遺伝子送達ツールとして適合されている(図16)。レンチウイルスの構造タンパク質及び酵素タンパク質は、大型ポリタンパク質(gag-pol及びエンベロープ)として転写及び翻訳される(図16A)。出芽ウイルス粒子に導入されると、ポリタンパク質はウイルスプロテアーゼによって個々のタンパク質にプロセシングされる。レンチウイルスベクター遺伝子発現系では、これらのポリタンパク質はウイルスゲノムから取り除かれ、別々の哺乳動物発現プラスミドを使用して発現される(図16B)。次に、目的のドナーDNA配列をウイルスポリタンパク質の代わりに、隣接するLTR配列の間にクローニングすることができる。哺乳動物細胞におけるこれらのベクターのコトランスフェクションにより、コードされたドナー配列を送達及び組み込むことができるレンチウイルス粒子が形成されるが、しかしながら、後続のウイルス増殖に必要なインテグラーゼ及び他のウイルスタンパク質についてのコード情報は必要とされない(図16B)。レンチウイルス粒子は、ウイルスタンパク質(例えば、インテグラーゼ及び逆転写酵素)ならびにdsDNAドナー配列の両方を送達するための天然のベクターであり、哺乳動物細胞へのインテグラーゼ媒介性の挿入に要する必要なウイルス末端配列を含有する(図16C)。
インテグラーゼ-dCas9融合タンパク質のレンチウイルス粒子へのパッケージング。
既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる(図17~図20)。ここでは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを記載する。
既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる(図17~図20)。ここでは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを記載する。
第1のアプローチは、gag-polポリタンパク質をコードするレンチウイルスパッケージングプラスミド(例えば、psPax2)内に、インテグラーゼ(またはそのC末端非特異的DNA結合ドメインを欠くインテグラーゼ(INΔC))への融合体としてdCas9を直接導入することである(図17A)。このアプローチでは、修飾gag-polポリタンパク質を他のウイルス成分とともにポリタンパク質として翻訳し、ガイドRNAとともに搭載してレンチウイルス粒子にパッケージングする(図4B)。インテグラーゼ-dCas9融合タンパク質は、プロテアーゼ切断(PR)に必要な配列を保持しており、これにより、粒子成熟中にgag-polポリタンパク質から正常に切断される。哺乳動物細胞の形質導入により、IN-dCas9融合タンパク質、sgRNA及びレンチウイルスドナー配列を含むウイルスタンパク質が送達される。逆転写酵素によるssRNAゲノムの逆転写によって正確なウイルス末端配列(U3及びU5)を含有するdsDNA配列が生成され、次いで、この配列はIN-dCas9融合タンパク質により哺乳動物ゲノムに組み込まれる。
第2のアプローチは、インテグラーゼ-dCas9とHIVウイルスタンパク質R(VPR)のN末端及びC末端融合体を生成することである(図18A)。VPRは、アクセサリータンパク質としてレンチウイルス粒子に効率的にパッケージングされており、異種タンパク質(例えば、GFP)のレンチウイルス粒子へのパッケージングに使用されている。ウイルスプロテアーゼ切断配列がVPRとIN-dCas9融合タンパク質との間に含まれており、これにより、成熟後にIN-dCas9がVPRから遊離する(図18A)。パッケージング細胞とレンチウイルス成分とのコトランスフェクションにより、VPR-IN-dCas9タンパク質及びsgRNAを含有するウイルス粒子が生成される。ウイルス粒子形成に必要なパッケージングプラスミド(例えば、psPax2)は、インテグラーゼ内にその触媒活性を阻害する突然変異を含んでおり、それにより非媒介性組み込みを阻害する(図18B)。ウイルスの形質導入時に、インテグラーゼ-dCas9タンパク質が送達され、このタンパク質がレンチウイルスドナー配列の組み込みを媒介する(図18C)。IN-dCas9融合体及びsgRNAをリボタンパク質として送達する利点は、これが標的細胞中で一過性にのみ発現することである。
第3の方法は、インテグラーゼ-dCas9融合タンパク質及びsgRNA発現カセットをレンチウイルス導入プラスミドまたは他のウイルスベクター(AAVなど)に直接導入することである(図19A)。IN-dCas9融合タンパク質とsgRNAとを含有する導入プラスミドを、レンチウイルス粒子を生成するのに必要なパッケージングプラスミド及びエンベローププラスミドとともにコトランスフェクトする。レンチウイルスを使用する場合、パッケージングプラスミドには、非特異的組み込みを阻害するための触媒性突然変異をインテグラーゼ内に含める(図19B)。哺乳動物細胞を形質導入すると、IN-dCas9融合タンパク質及びsgRNAの発現は、標的化組み込みのためにそれ自身のウイルスドナーベクターを標的とすること(自己組み込み)ができる成分を生成する(図19C)。この方法は、標的遺伝子の破壊のために、または遺伝子ドライブとして使用される。あるいは、ドナー配列をコードする追加のレンチウイルス粒子との共形質導入は、組み込まれたドナー鋳型として機能する(図19)。このアプローチにおいて、自身のウイルスをコードする配列の自己組み込みの防止は、異なるレトロウイルス科のメンバーに由来するインテグラーゼ酵素及びそれらの対応する導入プラスミドを使用することにより行われる。例えば、FIV IN-dCas9融合タンパク質をコードするHIVレンチウイルス粒子を利用して、FIVレンチウイルス粒子内にコードされたFIVドナー鋳型を組み込む(図20)。
単一遺伝子座であり、構成的に活性な遍在性ROSA26mGFP/+レポーターマウス系統の作製
ROSA26mT/mGレポーターマウス系統(Jackson Labs、ストック番号007576)には、floxed膜局在tdTO(mT)蛍光レポーターカセットが含まれており、これをCREリコンビナーゼを用いて組換えると、mTレポーターが除去され、膜局在eGFP(mG)レポーターが発現する。単一遺伝子座を生成するために、in vivo GFPレポーター系統であるROSA26mT/mGマウスを汎用CAG-CREリコンビナーゼマウスと交配させ、構成的かつ遍在的に発現するROSA26mGレポーターマウスを作製した。ヘテロ接合ROSA26mG/+マウスからのマウス胚性線維芽細胞(MEF)の単離により、培養中のすべての細胞における強力な膜GFP発現が明らかとなった(図21)。同様の戦略を利用して、ROSA26nT/nGマウス系統(Jackson Labs、ストック番号023035)の組換えにより、遍在的で構成的に活性な核GFPレポーターを作製する。
ROSA26mT/mGレポーターマウス系統(Jackson Labs、ストック番号007576)には、floxed膜局在tdTO(mT)蛍光レポーターカセットが含まれており、これをCREリコンビナーゼを用いて組換えると、mTレポーターが除去され、膜局在eGFP(mG)レポーターが発現する。単一遺伝子座を生成するために、in vivo GFPレポーター系統であるROSA26mT/mGマウスを汎用CAG-CREリコンビナーゼマウスと交配させ、構成的かつ遍在的に発現するROSA26mGレポーターマウスを作製した。ヘテロ接合ROSA26mG/+マウスからのマウス胚性線維芽細胞(MEF)の単離により、培養中のすべての細胞における強力な膜GFP発現が明らかとなった(図21)。同様の戦略を利用して、ROSA26nT/nGマウス系統(Jackson Labs、ストック番号023035)の組換えにより、遍在的で構成的に活性な核GFPレポーターを作製する。
ROSA-mGFP遺伝子座への標的化組み込みのためのレンチウイルス粒子への成分のパッケージング。
ROSA26mG/+MEF中のGFPコード配列へのIRES-tdTO配列の標的化組み込みのために、パッケージング細胞株(Lenti-X 293T、Clontech)でレンチウイルス粒子を作製した。レンチウイルス粒子を、第2世代SINレンチウイルスLTR間のIRES-tdTO蛍光レポーターをコードするレンチウイルス導入プラスミド(Lenti-IRES-tdTO)、汎親和性エンベロープタンパク質(VSV-G)をコードする発現ベクター、GFPを標的とするガイドRNAの反転させた対をコードする発現プラスミド、及びpsPax2パッキングプラスミド中のGag-Polレンチウイルスポリタンパク質の状態でINΔC-dCas9融合体をコードするパッキングプラスミド(INΔC-dCas9-psPax2)のコトランスフェクションにより作製した。レンチウイルス粒子を上清から回収し、0.45μmのPESフィルターを使用して濾過した。
ROSA26mG/+MEF中のGFPコード配列へのIRES-tdTO配列の標的化組み込みのために、パッケージング細胞株(Lenti-X 293T、Clontech)でレンチウイルス粒子を作製した。レンチウイルス粒子を、第2世代SINレンチウイルスLTR間のIRES-tdTO蛍光レポーターをコードするレンチウイルス導入プラスミド(Lenti-IRES-tdTO)、汎親和性エンベロープタンパク質(VSV-G)をコードする発現ベクター、GFPを標的とするガイドRNAの反転させた対をコードする発現プラスミド、及びpsPax2パッキングプラスミド中のGag-Polレンチウイルスポリタンパク質の状態でINΔC-dCas9融合体をコードするパッキングプラスミド(INΔC-dCas9-psPax2)のコトランスフェクションにより作製した。レンチウイルス粒子を上清から回収し、0.45μmのPESフィルターを使用して濾過した。
哺乳動物細胞における標的化レンチウイルス組み込み
Incriptr改変レンチウイルス粒子を使用して、培養液中のROSA26mG/+MEFを形質導入した。2日後、IRES-tdTOレポーターをコードするレンチウイルスで形質導入したMEF中で、遍在性の赤色蛍光タンパク質の発現が検出可能であったが、GFP蛍光が保持されていた。この最初の広範な発現はレンチウイルスIRES-tdTOにコードされたウイルスRNAの翻訳による可能性が高く、これは、レンチウイルスパッケージングがパッケージングプラスミドの改変によって阻害されなかったことを示している(図21)。従来のレンチウイルス形質導入では、ウイルスの組み込みの非存在下では、レンチウイルス導入遺伝子の発現は維持されない。注目すべきことに、形質導入の7日後、ROSA26mG/+一次細胞において(図21)、または前述のCMV-GFP COS-7安定細胞株を標的とした場合に(図22)、培養液中で今回は緑色蛍光を欠くtdTO赤色蛍光細胞が検出可能であった。これらのデータは、Gag-Polレンチウイルスポリタンパク質の状態でインテグラーゼ(C末端DNA結合ドメインを欠く)を触媒的に死んだCas9に融合させることにより、哺乳動物細胞におけるレンチウイルスのパッケージング、送達及びレンチウイルスにコードされたドナー配列の標的化が可能となることを示す。さらに、これらのデータは、レンチウイルスパッケージング細胞中のガイドRNAの発現がレンチウイルス粒子への導入に十分であり、これが、dCas9との強力な相互作用によって生じ得ることを示唆している。ガイドRNAをレンチウイルス粒子に送達するための代替的アプローチは、例えば、導入プラスミドにおけるガイドRNA(複数可)の構成的発現などを通じて、標的化組み込みを向上させ得る。
Incriptr改変レンチウイルス粒子を使用して、培養液中のROSA26mG/+MEFを形質導入した。2日後、IRES-tdTOレポーターをコードするレンチウイルスで形質導入したMEF中で、遍在性の赤色蛍光タンパク質の発現が検出可能であったが、GFP蛍光が保持されていた。この最初の広範な発現はレンチウイルスIRES-tdTOにコードされたウイルスRNAの翻訳による可能性が高く、これは、レンチウイルスパッケージングがパッケージングプラスミドの改変によって阻害されなかったことを示している(図21)。従来のレンチウイルス形質導入では、ウイルスの組み込みの非存在下では、レンチウイルス導入遺伝子の発現は維持されない。注目すべきことに、形質導入の7日後、ROSA26mG/+一次細胞において(図21)、または前述のCMV-GFP COS-7安定細胞株を標的とした場合に(図22)、培養液中で今回は緑色蛍光を欠くtdTO赤色蛍光細胞が検出可能であった。これらのデータは、Gag-Polレンチウイルスポリタンパク質の状態でインテグラーゼ(C末端DNA結合ドメインを欠く)を触媒的に死んだCas9に融合させることにより、哺乳動物細胞におけるレンチウイルスのパッケージング、送達及びレンチウイルスにコードされたドナー配列の標的化が可能となることを示す。さらに、これらのデータは、レンチウイルスパッケージング細胞中のガイドRNAの発現がレンチウイルス粒子への導入に十分であり、これが、dCas9との強力な相互作用によって生じ得ることを示唆している。ガイドRNAをレンチウイルス粒子に送達するための代替的アプローチは、例えば、導入プラスミドにおけるガイドRNA(複数可)の構成的発現などを通じて、標的化組み込みを向上させ得る。
レンチウイルス粒子の標的化組み込みのための代替的DNA結合ドメイン。
このデータは、インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルスにコードされたドナー配列の送達のための、dsDNAドナー鋳型の標的化組み込み、またはレンチウイルス粒子での送達を介した標的化組み込みが可能となることを示す。CRISPR-Cas系は2成分であり、標的化のためのCasタンパク質及び小さなガイドRNAの両方に依存する。場合によっては、レンチウイルス粒子を介した送達にTALENなどの単一成分DNA標的化タンパク質を利用することが有益であり得、それは、コードされたタンパク質によってのみそれらが標的化されるためである。同様のレンチウイルス産生アプローチを使用して、以前のパッケージング戦略におけるdCas9を所与の配列(例えば、eGFP及びセーフハーバー遺伝子座)を標的とするTALENに置き換えることで、ガイドRNAの送達を必要とせずにレンチウイルスのパッケージング及び標的化が可能となる(図23)。例えば、TALENは、gag-polポリタンパク質(図23A)、VPRなどのウイルスに導入されたタンパク質への融合体としてのIN-TALEN(図23B)、または導入プラスミド内に送達されたIN-TALEN(図23C)の状態のいずれかで、インテグラーゼへの融合体としてパッケージング及び送達される。
このデータは、インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルスにコードされたドナー配列の送達のための、dsDNAドナー鋳型の標的化組み込み、またはレンチウイルス粒子での送達を介した標的化組み込みが可能となることを示す。CRISPR-Cas系は2成分であり、標的化のためのCasタンパク質及び小さなガイドRNAの両方に依存する。場合によっては、レンチウイルス粒子を介した送達にTALENなどの単一成分DNA標的化タンパク質を利用することが有益であり得、それは、コードされたタンパク質によってのみそれらが標的化されるためである。同様のレンチウイルス産生アプローチを使用して、以前のパッケージング戦略におけるdCas9を所与の配列(例えば、eGFP及びセーフハーバー遺伝子座)を標的とするTALENに置き換えることで、ガイドRNAの送達を必要とせずにレンチウイルスのパッケージング及び標的化が可能となる(図23)。例えば、TALENは、gag-polポリタンパク質(図23A)、VPRなどのウイルスに導入されたタンパク質への融合体としてのIN-TALEN(図23B)、または導入プラスミド内に送達されたIN-TALEN(図23C)の状態のいずれかで、インテグラーゼへの融合体としてパッケージング及び送達される。
実施例9:Ty1 NLSを用いた向上したCRISPR-Cas9 DNA編集
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。
Ty1がCRISPR-Cas9編集を向上させるかどうかを判断するために、既存のCRISPR-Cas9発現プラスミド(px330)を、C末端のNPM NLSを非古典的なTy1 NLS(px330-Ty1)に置き換えることにより改変した(図24A)。次に、標的配列(ts)の下流でアウトオブフレームのルシフェラーゼコード配列をコードする、フレームシフト応答性ルシフェラーゼレポーターを作製した(図24B)。このレポーターアッセイでは、標的配列付近の切断及び細胞の非相同末端結合(NHEJ)経路による不完全な修復により、ルシフェラーゼコード配列を再構成してルシフェラーゼ発現を生じさせる可能性のあるヌクレオチドの挿入または欠失が誘発され得る。
NPM NLSを含有するCas9と20ヌクレオチドの標的配列に特異的な単一ガイドRNAとをコードするベクターとのルシフェラーゼレポーターの共発現は、非標的化ガイドRNAと比較して、バックグラウンドに対する約20倍のルシフェラーゼ活性の増加をもたらした(図24C)。特に、Ty1 NLSを含有するCas9の発現は、NPM NLSを含有するCas9と比較して、COS-7細胞中のレポーター活性を有意に(約44%)増強させた(図24C)。
実施例10:インテグラーゼ-TALEN融合タンパク質による非相同DNA組み込み
転写活性化因子様エフェクターヌクレアーゼ(TALEN)は、個々のヌクレオチド標的化ドメインをタンデムに組み立てることによって構築される、十分に研究されたプログラム可能なDNA結合タンパク質である(Reyon et al.,2012)。Inscriptrについて実証された同様のアプローチでは、TALENを利用して、ドナーDNA鋳型のレトロウイルスインテグラーゼ媒介性の組み込みを誘導することができる(図25)。TALEN-インテグラーゼ融合タンパク質を作製するために、前述のTALEN発現ベクターからTALEN標的化リピートを得てIN-TALENまたはTALEN-IN融合体のいずれかが生成されるように、哺乳動物発現ベクターを構築した。各融合タンパク質には、3xFLAGエピトープ、Ty1 NLS、及びC末端非特異的DNA結合ドメインを欠くHIVインテグラーゼ(INΔC)間のリンカー配列によって分離されたTALENリピートが導入された。場合によっては、IN突然変異を導入して、INの活性、二量体化、細胞タンパク質との相互作用、二量体化阻害剤に対する耐性、またはINΔCのタンデムコピー(tdINΔC)を変化させることができる。例えば、E85G突然変異を導入して、偏性(obligate)二量体形成を阻害することができる。
転写活性化因子様エフェクターヌクレアーゼ(TALEN)は、個々のヌクレオチド標的化ドメインをタンデムに組み立てることによって構築される、十分に研究されたプログラム可能なDNA結合タンパク質である(Reyon et al.,2012)。Inscriptrについて実証された同様のアプローチでは、TALENを利用して、ドナーDNA鋳型のレトロウイルスインテグラーゼ媒介性の組み込みを誘導することができる(図25)。TALEN-インテグラーゼ融合タンパク質を作製するために、前述のTALEN発現ベクターからTALEN標的化リピートを得てIN-TALENまたはTALEN-IN融合体のいずれかが生成されるように、哺乳動物発現ベクターを構築した。各融合タンパク質には、3xFLAGエピトープ、Ty1 NLS、及びC末端非特異的DNA結合ドメインを欠くHIVインテグラーゼ(INΔC)間のリンカー配列によって分離されたTALENリピートが導入された。場合によっては、IN突然変異を導入して、INの活性、二量体化、細胞タンパク質との相互作用、二量体化阻害剤に対する耐性、またはINΔCのタンデムコピー(tdINΔC)を変化させることができる。例えば、E85G突然変異を導入して、偏性(obligate)二量体形成を阻害することができる。
eGFPを標的とするTALEN対は、標的化効率について以前に記載及び検証されている(Reyon et al.,2012;Addgeneより入手可能)。TALEN対(ClaI/BamHI断片)をサブクローニングして、16bp長または28bp長のスペーサーを有するeGFPを対象としたTALEN-IN融合タンパク質を作製した。
プラスミドDNA組み込みアッセイ(図26)を使用して、eGFPを標的とするTALEN-IN対、IGR-CAT耐性遺伝子をコードする直鎖状二本鎖DNAドナー配列、及びamilCP細菌発現レポーターのコトランスフェクションを哺乳動物のCOS-7細胞にコトランスフェクトした。トランスフェクションの2日後、編集したプラスミドを哺乳動物細胞から回収し、e.coliに形質転換して、クロラムフェニコールプレートで選択した。興味深いことに、16bp離したTALEN対は約6倍多いクロラムフェニコール耐性コロニーを生じさせたが、その一方で、28bp離したTALEN対は非標的化インテグラーゼと同様であった(図27)。これらのデータは、TALENペアの近接性が標的化及び組み込みに重要であることを示唆しており、これは、TALEN-FokI媒介性のdsDNA切断について以前に報告された特徴である。
本明細書で引用されるありとあらゆる特許、特許出願、及び刊行物の開示は、参照によりそれらの全体が本明細書に組み込まれる。
本発明は、具体的な実施形態を参照して開示されてきたが、当業者によって、本発明の真の趣旨及び範囲から逸脱することなく、本発明の他の実施形態及び変形が考案されてもよいことは明らかである。添付の特許請求の範囲は、そのようなすべての実施形態及び同等の変形を含むと解釈されることを意図している。
Claims (31)
- a)第1のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片、
b)第2のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、及び
c)第3のアミノ酸配列を有する核局在化シグナル(NLS)
を含む、融合タンパク質。 - 前記レトロウイルスINが、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、及びウシ免疫不全ウイルス(BIV)INからなる群から選択される、請求項1に記載の融合タンパク質。
- 前記レトロウイルスINの断片が、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む、請求項1に記載の融合タンパク質。
- 前記Casタンパク質が、Cas9、Cas13及びCpf1からなる群から選択される、請求項1に記載の融合タンパク質。
- 前記Casタンパク質が、触媒的に欠損している(dCas)、請求項1に記載の融合タンパク質。
- 前記NLSが、レトロトランスポゾンNLSである、請求項1に記載の融合タンパク質。
- 前記レトロトランスポゾンNLSが、Ty1 NLSである、請求項6に記載の融合タンパク質。
- 前記レトロウイルスINが、配列番号1~40のうちの1つと少なくとも70%同一である配列を含む、請求項1に記載の融合タンパク質。
- 前記レトロウイルスINが、配列番号1~40から選択される配列を含む、請求項1に記載の融合タンパク質。
- 前記Casタンパク質が、配列番号41~46のうちの1つと少なくとも95%同一である配列を含む、請求項1に記載の融合タンパク質。
- 前記Casタンパク質が、配列番号41~46から選択される配列を含む、請求項1に記載の融合タンパク質。
- 前記NLSが、配列番号47~56のうちの1つと少なくとも70%同一である配列を含む、請求項1に記載の融合タンパク質。
- 前記NLSが、配列番号47~56から選択される配列を含む、請求項1に記載の融合タンパク質。
- 前記融合タンパク質が、配列番号57~98のうちの1つと少なくとも70%同一である配列を含む、請求項1に記載の融合タンパク質。
- 前記融合タンパク質が、配列番号57~98から選択される配列を含む、請求項1に記載の融合タンパク質。
- 請求項1~15のいずれか1項に記載の融合タンパク質をコードする、核酸分子。
- 前記核酸が、配列番号155~196のうちの1つと少なくとも70%同一である配列を含む、請求項16に記載の核酸分子。
- 前記核酸が、配列番号155~196から選択される配列を含む、請求項16に記載の核酸分子。
- 遺伝物質を編集する方法であって、
a)請求項1~15のいずれか1項に記載の融合タンパク質または請求項16~18のいずれか1項に記載の核酸分子、
b) 前記遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸、ならびに
c)U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸
を、前記遺伝物質に投与することを含む、前記方法。 - in vitro法またはin vivo法のいずれかである、請求項19に記載の方法。
- 遺伝物質を編集するための系であって、
a)融合タンパク質をコードする核酸配列であって、前記融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質、及び核局在化シグナル(NLS)を含む、前記融合タンパク質をコードする核酸配列、
b)CRISPR-Cas系ガイドRNAをコードする核酸配列、ならびに
c)ドナー鋳型核酸をコードする核酸配列であって、前記ドナー鋳型核酸が、U3配列、U5配列及びドナー鋳型配列を含む、前記ドナー鋳型核酸をコードする核酸配列
を、1つ以上のベクターに含む、前記系。 - a)、b)及びc)の核酸が同じかまたは異なるベクター上に存在する、請求項21に記載の系。
- 前記融合タンパク質が、配列番号57~98のうちの1つと少なくとも95%同一である配列を含む、請求項21に記載の系。
- 前記融合タンパク質が、配列番号57~98から選択される配列を含む、請求項21に記載の系。
- 前記CRISPR-Cas系ガイドRNAが、遺伝子の標的DNA配列に実質的にハイブリダイズする、請求項21に記載の系。
- 前記U3配列及び前記U5配列が、前記レトロウイルスINに特異的である、請求項21に記載の系。
- ゲノム編集成分を送達するための系であって、
a)触媒的に死んだCas(dCas)タンパク質に融合されたインテグラーゼを含むgag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、
b) ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、ならびに
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド
を含む、前記系。 - 前記パッケージングプラスミドが、ガイドRNA配列をコードする配列をさらに含む、請求項27に記載の系。
- ゲノム編集成分を送達するための系であって、
a)gag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、
b) ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド、ならびに
d)VPR、インテグラーゼ及び触媒的に死んだCas(dCas)を含む融合タンパク質をコードする核酸配列を含むVPR-IN-dCasプラスミド
を含む、前記系。 - 前記VPR-IN-dCasプラスミドが、ガイドRNA配列をコードする配列をさらに含む、請求項29に記載の系。
- ゲノム編集成分を送達するための系であって、
a)gag-polポリタンパク質をコードする核酸配列を含むパッケージングプラスミド、
b)ガイドRNA、融合タンパク質(インテグラーゼ及び触媒的に死んだCas(dCas)を含む)、5’LTRならびに3’LTRをコードする核酸配列を含む導入プラスミド、ならびに
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド
を含む、前記系。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862748703P | 2018-10-22 | 2018-10-22 | |
US62/748,703 | 2018-10-22 | ||
JP2021547065A JP7558575B2 (ja) | 2018-10-22 | 2019-10-22 | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 |
PCT/US2019/057498 WO2020086627A1 (en) | 2018-10-22 | 2019-10-22 | Genome editing by directed non-homologous dna insertion using a retroviral integrase-cas9 fusion protein |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021547065A Division JP7558575B2 (ja) | 2018-10-22 | 2019-10-22 | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024113696A true JP2024113696A (ja) | 2024-08-22 |
JP2024113696A5 JP2024113696A5 (ja) | 2024-08-29 |
Family
ID=68542806
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021547065A Active JP7558575B2 (ja) | 2018-10-22 | 2019-10-22 | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 |
JP2024076330A Pending JP2024113696A (ja) | 2018-10-22 | 2024-05-09 | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021547065A Active JP7558575B2 (ja) | 2018-10-22 | 2019-10-22 | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 |
Country Status (10)
Country | Link |
---|---|
US (2) | US20210363509A1 (ja) |
EP (1) | EP3870695A1 (ja) |
JP (2) | JP7558575B2 (ja) |
KR (1) | KR20210082205A (ja) |
CN (1) | CN113302291A (ja) |
AU (1) | AU2019365100A1 (ja) |
BR (1) | BR112021007503A2 (ja) |
CA (1) | CA3116334A1 (ja) |
MX (1) | MX2021004602A (ja) |
WO (1) | WO2020086627A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240181084A1 (en) * | 2021-04-23 | 2024-06-06 | University Of Rochester | Genome Editing by Directed Non-Homologous DNA Insertion Using a Retroviral Integrase-Cas Fusion Protein and Methods of Treatment |
US20230272434A1 (en) * | 2021-10-19 | 2023-08-31 | Massachusetts Institute Of Technology | Genomic editing with site-specific retrotransposons |
CN114181972A (zh) * | 2021-11-23 | 2022-03-15 | 上海本导基因技术有限公司 | 适用于难治性血管新生性眼疾病基因治疗的慢病毒载体 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0138854B1 (en) | 1983-03-08 | 1992-11-04 | Chiron Mimotopes Pty. Ltd. | Antigenically active amino acid sequences |
DE3751873T2 (de) | 1986-04-09 | 1997-02-13 | Genzyme Corp | Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
US5703055A (en) | 1989-03-21 | 1997-12-30 | Wisconsin Alumni Research Foundation | Generation of antibodies through lipid mediated DNA delivery |
US5399346A (en) | 1989-06-14 | 1995-03-21 | The United States Of America As Represented By The Department Of Health And Human Services | Gene therapy |
US5585362A (en) | 1989-08-22 | 1996-12-17 | The Regents Of The University Of Michigan | Adenovirus vectors for gene therapy |
US5350674A (en) | 1992-09-04 | 1994-09-27 | Becton, Dickinson And Company | Intrinsic factor - horse peroxidase conjugates and a method for increasing the stability thereof |
US6103489A (en) | 1997-03-21 | 2000-08-15 | University Of Hawaii | Cell-free protein synthesis system with protein translocation and processing |
US6156303A (en) | 1997-06-11 | 2000-12-05 | University Of Washington | Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom |
EP1235842A4 (en) | 1999-10-15 | 2003-04-23 | Univ Massachusetts | GENESIS OF THE RNA INTERFERENCE PATH AS AID OF TARGETED GENTIAN INTERFERENCE |
US6326193B1 (en) | 1999-11-05 | 2001-12-04 | Cambria Biosciences, Llc | Insect control agent |
AU2001275474A1 (en) | 2000-06-12 | 2001-12-24 | Akkadix Corporation | Materials and methods for the control of nematodes |
AU2002361573B2 (en) | 2001-11-13 | 2008-06-12 | The Trustees Of The University Of Pennsylvania | A method of detecting and/or identifying ADENO-associated virus (AAV) sequences and isolating novel sequences identified thereby |
JP4810062B2 (ja) | 2001-12-17 | 2011-11-09 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | アデノ随伴ウイルス(aav)血清型8の配列 |
HUE033158T2 (en) | 2003-09-30 | 2017-11-28 | Univ Pennsylvania | Adeno-associated virus (AAV) clusters, sequences, vectors containing them, and their use |
PL2816112T3 (pl) | 2009-12-10 | 2019-03-29 | Regents Of The University Of Minnesota | Modyfikacja DNA za pośrednictwem efektorów TAL |
EP3256578B8 (en) * | 2015-02-13 | 2020-04-01 | INSERM - Institut National de la Santé et de la Recherche Médicale | Polypeptides for engineering integrase chimeric proteins and their use in gene therapy |
US20180080051A1 (en) * | 2015-03-31 | 2018-03-22 | Exeligen Scientific, Inc. | Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism |
WO2017078631A1 (en) * | 2015-11-05 | 2017-05-11 | Agency For Science, Technology And Research | Chemical-inducible genome engineering technology |
-
2019
- 2019-10-22 MX MX2021004602A patent/MX2021004602A/es unknown
- 2019-10-22 WO PCT/US2019/057498 patent/WO2020086627A1/en unknown
- 2019-10-22 CN CN201980083507.9A patent/CN113302291A/zh active Pending
- 2019-10-22 BR BR112021007503A patent/BR112021007503A2/pt unknown
- 2019-10-22 US US17/287,184 patent/US20210363509A1/en active Pending
- 2019-10-22 AU AU2019365100A patent/AU2019365100A1/en active Pending
- 2019-10-22 KR KR1020217015360A patent/KR20210082205A/ko active Search and Examination
- 2019-10-22 JP JP2021547065A patent/JP7558575B2/ja active Active
- 2019-10-22 CA CA3116334A patent/CA3116334A1/en active Pending
- 2019-10-22 EP EP19802407.7A patent/EP3870695A1/en active Pending
-
2021
- 2021-07-02 US US17/366,419 patent/US20210340508A1/en active Pending
-
2024
- 2024-05-09 JP JP2024076330A patent/JP2024113696A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3116334A1 (en) | 2020-04-30 |
MX2021004602A (es) | 2021-09-08 |
WO2020086627A1 (en) | 2020-04-30 |
BR112021007503A2 (pt) | 2021-11-03 |
US20210363509A1 (en) | 2021-11-25 |
CN113302291A (zh) | 2021-08-24 |
AU2019365100A1 (en) | 2021-06-03 |
KR20210082205A (ko) | 2021-07-02 |
JP2022513376A (ja) | 2022-02-07 |
US20210340508A1 (en) | 2021-11-04 |
JP7558575B2 (ja) | 2024-10-01 |
EP3870695A1 (en) | 2021-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210261985A1 (en) | Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo | |
KR20200093635A (ko) | 변형된 폐쇄된 말단 dna (cedna)를 사용한 유전자 편집 | |
JP2024079798A (ja) | アデノ随伴ウイルスベクタープロデューサー細胞株 | |
JP2024113696A (ja) | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 | |
JP2023165953A (ja) | Casトランスジェニックマウスの胚性幹細胞およびマウスならびにその使用 | |
KR20220141829A (ko) | 리보자임-매개 rna 조립 및 발현 | |
US20220154223A1 (en) | Nucleic acid constructs for simultaneous gene activation | |
AU2018309714A1 (en) | Assessment of CRISPR/Cas-induced recombination with an exogenous donor nucleic acid in vivo | |
US20230102342A1 (en) | Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use | |
JP2002543792A (ja) | ベクターによるトランスポゾン配列の供給及び組込み | |
US20240181084A1 (en) | Genome Editing by Directed Non-Homologous DNA Insertion Using a Retroviral Integrase-Cas Fusion Protein and Methods of Treatment | |
GB2566572A (en) | Methods for adeno-associated viral vector production | |
JP2023553701A (ja) | 先天性筋ジストロフィーの処置のための治療用lama2ペイロード | |
US20240002839A1 (en) | Crispr sam biosensor cell lines and methods of use thereof | |
RU2811724C2 (ru) | РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) | |
CN117043324A (zh) | 用于治疗先天性肌营养不良的治疗性lama2载荷 | |
WO2021158883A1 (en) | Non-human animals comprising a humanized klkb1 locus and methods of use | |
TW202027798A (zh) | 用於從白蛋白基因座表現轉殖基因的組成物及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240531 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240531 |