JP2023524733A - 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 - Google Patents
遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 Download PDFInfo
- Publication number
- JP2023524733A JP2023524733A JP2022567096A JP2022567096A JP2023524733A JP 2023524733 A JP2023524733 A JP 2023524733A JP 2022567096 A JP2022567096 A JP 2022567096A JP 2022567096 A JP2022567096 A JP 2022567096A JP 2023524733 A JP2023524733 A JP 2023524733A
- Authority
- JP
- Japan
- Prior art keywords
- domain
- domains
- cells
- protein
- reporter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 115
- 239000000203 mixture Substances 0.000 title claims abstract description 35
- 239000012636 effector Substances 0.000 title abstract description 96
- 230000030279 gene silencing Effects 0.000 title abstract description 90
- 230000003213 activating effect Effects 0.000 title abstract description 19
- 108090000623 proteins and genes Proteins 0.000 claims description 212
- 102000004169 proteins and genes Human genes 0.000 claims description 114
- 150000007523 nucleic acids Chemical group 0.000 claims description 92
- 102000040945 Transcription factor Human genes 0.000 claims description 85
- 108091023040 Transcription factor Proteins 0.000 claims description 85
- 150000001413 amino acids Chemical class 0.000 claims description 81
- 230000004568 DNA-binding Effects 0.000 claims description 79
- 102000039446 nucleic acids Human genes 0.000 claims description 79
- 108020004707 nucleic acids Proteins 0.000 claims description 79
- 230000004913 activation Effects 0.000 claims description 72
- 108020001580 protein domains Proteins 0.000 claims description 69
- 238000013518 transcription Methods 0.000 claims description 67
- 230000035897 transcription Effects 0.000 claims description 67
- 239000013598 vector Substances 0.000 claims description 55
- 238000012163 sequencing technique Methods 0.000 claims description 51
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 36
- 108091006047 fluorescent proteins Proteins 0.000 claims description 35
- 102000034287 fluorescent proteins Human genes 0.000 claims description 35
- 239000003795 chemical substances by application Substances 0.000 claims description 34
- 230000001939 inductive effect Effects 0.000 claims description 30
- 108020005004 Guide RNA Proteins 0.000 claims description 27
- 239000003550 marker Substances 0.000 claims description 24
- 108700008625 Reporter Genes Proteins 0.000 claims description 22
- 230000037426 transcriptional repression Effects 0.000 claims description 20
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 18
- 239000013642 negative control Substances 0.000 claims description 15
- 230000030648 nucleus localization Effects 0.000 claims description 14
- 108020001507 fusion proteins Proteins 0.000 claims description 13
- 102000037865 fusion proteins Human genes 0.000 claims description 12
- 108091006107 transcriptional repressors Proteins 0.000 claims description 10
- 102100025169 Max-binding protein MNT Human genes 0.000 claims description 8
- 230000001965 increasing effect Effects 0.000 claims description 8
- 108020004999 messenger RNA Proteins 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 8
- 108091006106 transcriptional activators Proteins 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 230000003834 intracellular effect Effects 0.000 claims description 5
- 230000015556 catabolic process Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000006731 degradation reaction Methods 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 abstract description 4
- 210000004027 cell Anatomy 0.000 description 376
- 235000018102 proteins Nutrition 0.000 description 101
- 235000001014 amino acid Nutrition 0.000 description 81
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 77
- 229960003722 doxycycline Drugs 0.000 description 77
- 230000007115 recruitment Effects 0.000 description 70
- 230000006870 function Effects 0.000 description 60
- 230000002401 inhibitory effect Effects 0.000 description 54
- 238000000684 flow cytometry Methods 0.000 description 46
- 230000035772 mutation Effects 0.000 description 41
- 238000005259 measurement Methods 0.000 description 40
- 101000818735 Homo sapiens Zinc finger protein 10 Proteins 0.000 description 37
- 230000027455 binding Effects 0.000 description 37
- 230000000694 effects Effects 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 34
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 34
- 108091005960 Citrine Proteins 0.000 description 31
- 230000004927 fusion Effects 0.000 description 31
- 239000011035 citrine Substances 0.000 description 30
- 238000010200 validation analysis Methods 0.000 description 30
- 241000282414 Homo sapiens Species 0.000 description 28
- 239000012190 activator Substances 0.000 description 28
- 102100022012 Transcription intermediary factor 1-beta Human genes 0.000 description 27
- 101710177718 Transcription intermediary factor 1-beta Proteins 0.000 description 27
- 108090000765 processed proteins & peptides Proteins 0.000 description 27
- 239000002773 nucleotide Substances 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 238000006467 substitution reaction Methods 0.000 description 25
- 102000007999 Nuclear Proteins Human genes 0.000 description 24
- 108010089610 Nuclear Proteins Proteins 0.000 description 24
- 230000001718 repressive effect Effects 0.000 description 24
- 230000002103 transcriptional effect Effects 0.000 description 23
- 241000713666 Lentivirus Species 0.000 description 22
- 102000009331 Homeodomain Proteins Human genes 0.000 description 21
- 108010048671 Homeodomain Proteins Proteins 0.000 description 21
- 108700005087 Homeobox Genes Proteins 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 20
- 102000004196 processed proteins & peptides Human genes 0.000 description 20
- 238000010186 staining Methods 0.000 description 20
- 229930189065 blasticidin Natural products 0.000 description 19
- 108091033409 CRISPR Proteins 0.000 description 18
- 238000003556 assay Methods 0.000 description 18
- 238000012226 gene silencing method Methods 0.000 description 18
- 239000011324 bead Substances 0.000 description 17
- 238000009826 distribution Methods 0.000 description 17
- 238000007885 magnetic separation Methods 0.000 description 16
- 238000010446 CRISPR interference Methods 0.000 description 15
- 230000003389 potentiating effect Effects 0.000 description 15
- 210000001519 tissue Anatomy 0.000 description 15
- 239000000872 buffer Substances 0.000 description 14
- 230000001629 suppression Effects 0.000 description 14
- 108010077544 Chromatin Proteins 0.000 description 13
- 101000915647 Homo sapiens Zinc finger protein 473 Proteins 0.000 description 13
- 102100029024 Zinc finger protein 473 Human genes 0.000 description 13
- 210000003483 chromatin Anatomy 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- 238000012216 screening Methods 0.000 description 12
- 239000013603 viral vector Substances 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 11
- 101710185494 Zinc finger protein Proteins 0.000 description 11
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 11
- 208000015181 infectious disease Diseases 0.000 description 11
- 229910052725 zinc Inorganic materials 0.000 description 11
- 239000011701 zinc Substances 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 10
- 230000002378 acidificating effect Effects 0.000 description 10
- 210000005260 human cell Anatomy 0.000 description 10
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 210000004962 mammalian cell Anatomy 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 230000003612 virological effect Effects 0.000 description 9
- 241000701022 Cytomegalovirus Species 0.000 description 8
- 101000915532 Homo sapiens Zinc finger protein 28 homolog Proteins 0.000 description 8
- 102100022621 MAX gene-associated protein Human genes 0.000 description 8
- 241000700605 Viruses Species 0.000 description 8
- 102100028611 Zinc finger protein 28 homolog Human genes 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 239000000427 antigen Substances 0.000 description 8
- 108091007433 antigens Proteins 0.000 description 8
- 102000036639 antigens Human genes 0.000 description 8
- 230000001973 epigenetic effect Effects 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 230000000869 mutational effect Effects 0.000 description 8
- 230000008520 organization Effects 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- 238000001353 Chip-sequencing Methods 0.000 description 7
- 108090000144 Human Proteins Proteins 0.000 description 7
- 102000003839 Human Proteins Human genes 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 6
- 102000034356 gene-regulatory proteins Human genes 0.000 description 6
- 108091006104 gene-regulatory proteins Proteins 0.000 description 6
- 210000004940 nucleus Anatomy 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 102100021576 Bromodomain adjacent to zinc finger domain protein 2A Human genes 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 101000970561 Homo sapiens Myc box-dependent-interacting protein 1 Proteins 0.000 description 5
- 102100021970 Myc box-dependent-interacting protein 1 Human genes 0.000 description 5
- 230000000903 blocking effect Effects 0.000 description 5
- 238000002659 cell therapy Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000002898 library design Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000013641 positive control Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000013515 script Methods 0.000 description 5
- 230000003584 silencer Effects 0.000 description 5
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 4
- 241000283707 Capra Species 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 238000000729 Fisher's exact test Methods 0.000 description 4
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 4
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 238000002887 multiple sequence alignment Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 238000000159 protein binding assay Methods 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- 230000007420 reactivation Effects 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 101100388128 Caenorhabditis elegans dpy-30 gene Proteins 0.000 description 3
- 102100034279 Calcium-binding mitochondrial carrier protein Aralar2 Human genes 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 101000971147 Homo sapiens Bromodomain adjacent to zinc finger domain protein 2A Proteins 0.000 description 3
- 101000744945 Homo sapiens Zinc finger protein 496 Proteins 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 108010061100 Nucleoproteins Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 108010000598 Polycomb Repressive Complex 1 Proteins 0.000 description 3
- 102000002273 Polycomb Repressive Complex 1 Human genes 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- 238000010459 TALEN Methods 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- 102100039944 Zinc finger protein 496 Human genes 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 108010084210 citrin Proteins 0.000 description 3
- 238000000749 co-immunoprecipitation Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 238000012203 high throughput assay Methods 0.000 description 3
- 102000044778 human ZNF10 Human genes 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- -1 morpholino nucleic acid Chemical class 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 229960005322 streptomycin Drugs 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 102100030379 Acyl-coenzyme A synthetase ACSM2A, mitochondrial Human genes 0.000 description 2
- 239000000592 Artificial Cell Substances 0.000 description 2
- 101710139704 Bromodomain adjacent to zinc finger domain protein 2A Proteins 0.000 description 2
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102100032919 Chromobox protein homolog 1 Human genes 0.000 description 2
- 102100032918 Chromobox protein homolog 5 Human genes 0.000 description 2
- 102100026680 Chromobox protein homolog 7 Human genes 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 101150059252 Cyt-b5 gene Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 108091006010 FLAG-tagged proteins Proteins 0.000 description 2
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102100029283 Hepatocyte nuclear factor 3-alpha Human genes 0.000 description 2
- 102100029284 Hepatocyte nuclear factor 3-beta Human genes 0.000 description 2
- 208000009889 Herpes Simplex Diseases 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101100054737 Homo sapiens ACSM2A gene Proteins 0.000 description 2
- 101000797584 Homo sapiens Chromobox protein homolog 1 Proteins 0.000 description 2
- 101000910835 Homo sapiens Chromobox protein homolog 7 Proteins 0.000 description 2
- 101000872516 Homo sapiens E3 ubiquitin-protein ligase HERC2 Proteins 0.000 description 2
- 101001062353 Homo sapiens Hepatocyte nuclear factor 3-alpha Proteins 0.000 description 2
- 101001062347 Homo sapiens Hepatocyte nuclear factor 3-beta Proteins 0.000 description 2
- 101001115417 Homo sapiens M-phase phosphoprotein 8 Proteins 0.000 description 2
- 101000974356 Homo sapiens Nuclear receptor coactivator 3 Proteins 0.000 description 2
- 101000613343 Homo sapiens Polycomb group RING finger protein 2 Proteins 0.000 description 2
- 101001093152 Homo sapiens Polycomb protein SCMH1 Proteins 0.000 description 2
- 101000832631 Homo sapiens Small ubiquitin-related modifier 3 Proteins 0.000 description 2
- 101000759233 Homo sapiens Zinc finger protein 140 Proteins 0.000 description 2
- 101000782484 Homo sapiens Zinc finger protein 461 Proteins 0.000 description 2
- 101000760179 Homo sapiens Zinc finger protein 57 Proteins 0.000 description 2
- 101000976473 Homo sapiens Zinc finger protein 597 Proteins 0.000 description 2
- 101000915605 Homo sapiens Zinc finger protein 783 Proteins 0.000 description 2
- 101000782302 Homo sapiens Zinc finger protein 823 Proteins 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- 102000004344 Interferon regulatory factor 2 Human genes 0.000 description 2
- 108090000908 Interferon regulatory factor 2 Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 102100023268 M-phase phosphoprotein 8 Human genes 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 238000000585 Mann–Whitney U test Methods 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 2
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 2
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 2
- 102100040919 Polycomb group RING finger protein 2 Human genes 0.000 description 2
- 102100036294 Polycomb protein SCMH1 Human genes 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 239000012979 RPMI medium Substances 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 102100024534 Small ubiquitin-related modifier 3 Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 102100027644 YY1-associated factor 2 Human genes 0.000 description 2
- 108050006405 YY1-associated factor 2 Proteins 0.000 description 2
- 102100023393 Zinc finger protein 140 Human genes 0.000 description 2
- 102100035850 Zinc finger protein 461 Human genes 0.000 description 2
- 102100024665 Zinc finger protein 57 Human genes 0.000 description 2
- 102100023612 Zinc finger protein 597 Human genes 0.000 description 2
- 102100028583 Zinc finger protein 783 Human genes 0.000 description 2
- 102100035804 Zinc finger protein 823 Human genes 0.000 description 2
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 2
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 230000008823 permeabilization Effects 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 238000012418 validation experiment Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101150019028 Antp gene Proteins 0.000 description 1
- 101100472734 Arabidopsis thaliana RING1B gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010045123 Blasticidin-S deaminase Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 102100040775 CREB-regulated transcription coactivator 1 Human genes 0.000 description 1
- 238000010454 CRISPR gRNA design Methods 0.000 description 1
- 101000687585 Caenorhabditis elegans REST corepressor spr-1 Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 102000017589 Chromo domains Human genes 0.000 description 1
- 108050005811 Chromo domains Proteins 0.000 description 1
- 102000014669 Chromo shadow domains Human genes 0.000 description 1
- 108050005011 Chromo shadow domains Proteins 0.000 description 1
- 102100031266 Chromodomain-helicase-DNA-binding protein 3 Human genes 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101000687583 Drosophila melanogaster REST corepressor Proteins 0.000 description 1
- 108700011215 E-Box Elements Proteins 0.000 description 1
- 102100034745 E3 ubiquitin-protein ligase HERC2 Human genes 0.000 description 1
- 102100031438 E3 ubiquitin-protein ligase RING1 Human genes 0.000 description 1
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 102100031690 Erythroid transcription factor Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010009306 Forkhead Box Protein O1 Proteins 0.000 description 1
- 102100035427 Forkhead box protein O1 Human genes 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150069554 HIS4 gene Proteins 0.000 description 1
- 108091008054 HOXC@ Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010038661 Hepatocyte Nuclear Factor 3-alpha Proteins 0.000 description 1
- 102000010818 Hepatocyte Nuclear Factor 3-alpha Human genes 0.000 description 1
- 108010087745 Hepatocyte Nuclear Factor 3-beta Proteins 0.000 description 1
- 102000009094 Hepatocyte Nuclear Factor 3-beta Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- 101000891939 Homo sapiens CREB-regulated transcription coactivator 1 Proteins 0.000 description 1
- 101000797581 Homo sapiens Chromobox protein homolog 5 Proteins 0.000 description 1
- 101000777071 Homo sapiens Chromodomain-helicase-DNA-binding protein 3 Proteins 0.000 description 1
- 101000707962 Homo sapiens E3 ubiquitin-protein ligase RING1 Proteins 0.000 description 1
- 101000896450 Homo sapiens Early growth response protein 3 Proteins 0.000 description 1
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 1
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 description 1
- 101001077842 Homo sapiens Interferon regulatory factor 2-binding protein 1 Proteins 0.000 description 1
- 101001077835 Homo sapiens Interferon regulatory factor 2-binding protein 2 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101000599816 Homo sapiens Probable E3 ubiquitin-protein ligase IRF2BPL Proteins 0.000 description 1
- 101000702559 Homo sapiens Probable global transcription activator SNF2L2 Proteins 0.000 description 1
- 101000947115 Homo sapiens Protein CASC3 Proteins 0.000 description 1
- 101000785654 Homo sapiens Zinc finger protein with KRAB and SCAN domains 2 Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100025355 Interferon regulatory factor 2-binding protein 1 Human genes 0.000 description 1
- 102100025356 Interferon regulatory factor 2-binding protein 2 Human genes 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 244000178870 Lavandula angustifolia Species 0.000 description 1
- 235000010663 Lavandula angustifolia Nutrition 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010080991 Mediator Complex Proteins 0.000 description 1
- 102000000490 Mediator Complex Human genes 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100037864 Probable E3 ubiquitin-protein ligase IRF2BPL Human genes 0.000 description 1
- 102100031021 Probable global transcription activator SNF2L2 Human genes 0.000 description 1
- 101100364827 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) ahcY gene Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100035601 Protein CASC3 Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 241000293825 Rhinosporidium Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 208000035217 Ring chromosome 1 syndrome Diseases 0.000 description 1
- 101150062997 Rnf2 gene Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 101150081953 SAM1 gene Proteins 0.000 description 1
- 108010011005 STAT6 Transcription Factor Proteins 0.000 description 1
- 102000013968 STAT6 Transcription Factor Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000125258 Scandix pecten-veneris Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100178269 Schizosaccharomyces pombe (strain 972 / ATCC 24843) hob1 gene Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 1
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 1
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010062653 Wiskott-Aldrich Syndrome Protein Family Proteins 0.000 description 1
- 102000011104 Wiskott-Aldrich Syndrome Protein Family Human genes 0.000 description 1
- 102100026514 Zinc finger protein with KRAB and SCAN domains 2 Human genes 0.000 description 1
- OBZKMHQCWJWLEJ-GWPKAZDLSA-L [H+].[H+].[Zn++].N[C@@H](C[S-])C(O)=O.N[C@@H](C[S-])C(O)=O.N[C@@H](Cc1c[n-]cn1)C(O)=O.N[C@@H](Cc1c[n-]cn1)C(O)=O Chemical compound [H+].[H+].[Zn++].N[C@@H](C[S-])C(O)=O.N[C@@H](C[S-])C(O)=O.N[C@@H](Cc1c[n-]cn1)C(O)=O.N[C@@H](Cc1c[n-]cn1)C(O)=O OBZKMHQCWJWLEJ-GWPKAZDLSA-L 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000002583 anti-histone Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000012455 biphasic mixture Substances 0.000 description 1
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000003320 cell separation method Methods 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 108700010039 chimeric receptor Proteins 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 101150015424 dmd gene Proteins 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000009459 flexible packaging Methods 0.000 description 1
- 238000002376 fluorescence recovery after photobleaching Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 108010021685 homeobox protein HOXA13 Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000012001 immunoprecipitation mass spectrometry Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000001102 lavandula vera Substances 0.000 description 1
- 235000018219 lavender Nutrition 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000006993 memory improvement Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 108060006184 phycobiliprotein Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 1
- 229960001225 rifampicin Drugs 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 1
- 229960001082 trimethoprim Drugs 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000002477 vacuolizing effect Effects 0.000 description 1
- 238000003828 vacuum filtration Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1086—Preparation or screening of expression libraries, e.g. reporter assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6897—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/035—Fusion polypeptide containing a localisation/targetting motif containing a signal for targeting to the external surface of a cell, e.g. to the outer membrane of Gram negative bacteria, GPI- anchored eukaryote proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Detergent Compositions (AREA)
Abstract
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。
Description
関連出願の相互参照
本出願は、それらの各々の内容が、参照によりそれらの全体において本明細書に組み込まれた、2020年5月4日に出願された米国仮出願第63/019,706号及び2020年9月4日に出願された米国仮出願第63/074,793号の利益を主張する。
本出願は、それらの各々の内容が、参照によりそれらの全体において本明細書に組み込まれた、2020年5月4日に出願された米国仮出願第63/019,706号及び2020年9月4日に出願された米国仮出願第63/074,793号の利益を主張する。
分野
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。
連邦政府による後援を受けた調査研究に関する言明
本発明は、米国国立衛生研究所により授与された、GM128947の契約下にある政府助成によりなされた。米国連邦政府は、本発明において、一定の権利を有する。
本発明は、米国国立衛生研究所により授与された、GM128947の契約下にある政府助成によりなされた。米国連邦政府は、本発明において、一定の権利を有する。
合成転写因子を操作しようとする、既存の取組みは、既に発見されたエフェクタードメインによる、小型のツールボックスから、活性化ドメイン及び抑制ドメインを取り出した。このツールボックスを拡張するための、新たな方法が必要とされている。
(発明の要旨)
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。本明細書の一部の実施形態において、ツールボックスを大幅に拡張するエフェクタードメインを発見し、性質決定するためのハイスループット法が提供される。これらのドメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子の増強を操作する喫緊の必要を満たす。
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。本明細書の一部の実施形態において、ツールボックスを大幅に拡張するエフェクタードメインを発見し、性質決定するためのハイスループット法が提供される。これらのドメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子の増強を操作する喫緊の必要を満たす。
一部の実施形態において、エフェクタードメインを同定するための方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、エフェクタードメインを同定するための方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能であるステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写活性化因子として同定するステップを含む。
一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップd~gは、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される。
一部の実施形態において、各タンパク質ドメインは、80アミノ酸以下である。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。
一部の実施形態において、誘導型DNA結合性ドメインはタグを含む。
一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。一部の実施形態において、発現レベルは、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも3日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも5日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも24時間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも48時間にわたり処理される。
一部の実施形態において、タンパク質ドメインは、比のlog2が発現不良陰性対照の平均値から少なくとも2標準偏差である(例えば、これより高値である)場合に、転写抑制因子として同定される。
一部の実施形態において、タンパク質ドメインは、比のlog2が低発現陰性対照の平均値から少なくとも2標準偏差である(例えば、これより低値である)場合に、転写活性化因子として同定される。
本明細書においてまた、異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含む合成転写因子も提供される。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む。
一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、表2において見出されるものから選択される。
一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、表1、3又は4において見出されるものから選択される。
一部の実施形態において、1つ以上の転写活性化ドメイン又は1つ以上の転写抑制ドメインは、本明細書において開示された方法により同定される。
一部の実施形態において、異種DNA結合性ドメインは、プログラム可能なDNA結合性ドメインを含む。一部の実施形態において、DNA結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質に由来する。一部の実施形態において、DNA結合性ドメインは、転写活性化因子様エフェクター(TALE)ドメインに由来する。
本明細書においてまた、本明細書において開示された合成転写因子又はエフェクタードメインをコードする核酸も提供される。一部の実施形態において、核酸は、誘導型プロモーターの制御下にある。一部の実施形態において、核酸は、組織特異的プロモーターの制御下にある。一部の実施形態において、核酸は、少なくとも1つのさらなる転写因子又はエフェクタードメインをコードする。
本明細書において、本明細書において開示された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムがさらに提供される。一部の実施形態において、組成物は、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む。一部の実施形態において、組成物は、ガイドRNA又はガイドRNAをコードする核酸をさらに含む。
加えて、細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法も提供される。方法は、細胞へと、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む。少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる。一部の実施形態において、合成転写因子は、Casタンパク質のDNA結合性ドメインを含み、方法は、細胞を少なくとも1つのガイドRNAと接触させるステップをさらに含む。
一部の実施形態において、細胞は、インビトロ(例えば、エクスビボ)における細胞又は対象における細胞である。
一部の実施形態において、少なくとも2つの遺伝子の遺伝子発現がモジュレートされる。
コンパクト転写エフェクタードメインのカタログを生成するシステム及び方法が提供される。さらに、一部の実施形態において、このドメインのカタログは、合成転写因子を操作するように、DNA結合性ドメインへと融合される。これらは、真核(又は他の)細胞内の遺伝子発現の、ターゲティングされた、微調整可能な調節を実施するのに使用される。この技術は、ハイスループットプラットフォームを利用して、細胞内の数万の合成転写因子をスクリーニングし、性質決定する。これらの合成転写因子は、DNA結合性ドメインと、転写エフェクタードメインとの融合体である。システムは、数百の短鎖エフェクタードメイン(例えば、80アミノ酸)を作出し、それらを、送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列(例えば、10アミノ酸)へと、さらに短縮するためのハイスループットステップを実施するのに使用されている。これらの融合体のターゲティングは、エフェクタードメインに応じて、mRNA転写の、負又は正への局所的調節をもたらす。これらの合成転写因子の一部は、因子自体が標的から放出された後においても遷延する、長期にわたるエピジェネティック調節を媒介する。
かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、DNA結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体を同定するのにも使用される。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用される。
例示的な適用は、以下を含むがこれらに限定されない:
プログラム可能なDNA結合性ドメイン(例えば、dCas9、dCas12a、亜鉛フィンガー、TALE)の、転写エフェクタードメインとの融合体による、内因性遺伝子の抑制/活性化のターゲティング;
遺伝子治療及び細胞療法(例えば、患者における病原性転写物をサイレンシングする)又は調査研究;
合成転写因子は、複数の遺伝子の発現を、同時に摂動させる(例えば、複数のガイドRNAを使用して、CRISPRi/aスクリーニングによる、ハイスループットの遺伝子相互作用マッピングを実施する)のに使用される;
遺伝回路内、例えば、誘導型遺伝子発現又はより複雑な回路内の合成転写因子の使用。これらの回路は、環境からの小分子インプットに応答する、治療的遺伝子発現アウトプットを達成するための、遺伝子治療(例えば、AAVによる抗体の送達)及び細胞療法(例えば、エクスビボにおけるCAR-T細胞の操作)において使用される。
プログラム可能なDNA結合性ドメイン(例えば、dCas9、dCas12a、亜鉛フィンガー、TALE)の、転写エフェクタードメインとの融合体による、内因性遺伝子の抑制/活性化のターゲティング;
遺伝子治療及び細胞療法(例えば、患者における病原性転写物をサイレンシングする)又は調査研究;
合成転写因子は、複数の遺伝子の発現を、同時に摂動させる(例えば、複数のガイドRNAを使用して、CRISPRi/aスクリーニングによる、ハイスループットの遺伝子相互作用マッピングを実施する)のに使用される;
遺伝回路内、例えば、誘導型遺伝子発現又はより複雑な回路内の合成転写因子の使用。これらの回路は、環境からの小分子インプットに応答する、治療的遺伝子発現アウトプットを達成するための、遺伝子治療(例えば、AAVによる抗体の送達)及び細胞療法(例えば、エクスビボにおけるCAR-T細胞の操作)において使用される。
本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。短鎖ドメイン(例えば≦80アミノ酸)が同定され、それらを、送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップがもたらされた。場合によって、10アミノ酸という短鎖である、強力なエフェクタードメインが同定された。一部の実施形態において、ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。生成されたドメインの大半は未だ、転写エフェクターとして報告されていない。加えて、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットプロセスも提供される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく支援される。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。
同定されたドメインのコレクションは、膨大かつ多様であり、プラットフォームは、新たな特性を伴う、合成転写因子(例えば、高速サイレンシングと、恒久的サイレンシングとの組合せを達成する、2つの抑制ドメインの組成物)を創出するように、ハイスループットにおいて、ドメインの新たな組合せを、融合体として調べることをたやすく可能とする。
転写をサイレンシングする又は活性化させることができる、数百に及ぶ未だ性質決定されていない又は未知であるエフェクタードメインは、DNA結合性ドメインへと融合されうる。例えば、ヒト細胞内において、レンチウイルススクリーニングを使用して、単一ドメイン及びドメイン対をスクリーニングするためのハイスループット法が提供される。ハイスループット法は、磁性分離を使用する、より効率的かつ廉価かつ迅速な、これらのライブラリーのスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能となる。
1.定義
本明細書において使用された、「~を含む(comprise、include)」、「~を有すること」、「~を有する」、「~しうる」、「~を含有する」という用語及びこれらの変化形は、さらなる行為又は構造の可能性を除外しない、オープンエンドの移行句、用語又は語句であることが意図される。文脈により別途明示されない限り、単数形の「ある(a)」、「ある(an)」及び「その」は、複数の指示対象を含む。明示される場合であれ、そうでない場合であれ、本開示はまた、本明細書において提示された態様又は要素「を含み」、これら「からなり」、これら「から本質的になる」他の態様も想定する。
本明細書において使用された、「~を含む(comprise、include)」、「~を有すること」、「~を有する」、「~しうる」、「~を含有する」という用語及びこれらの変化形は、さらなる行為又は構造の可能性を除外しない、オープンエンドの移行句、用語又は語句であることが意図される。文脈により別途明示されない限り、単数形の「ある(a)」、「ある(an)」及び「その」は、複数の指示対象を含む。明示される場合であれ、そうでない場合であれ、本開示はまた、本明細書において提示された態様又は要素「を含み」、これら「からなり」、これら「から本質的になる」他の態様も想定する。
本明細書における数値範囲の列挙のために、その間に介在する各数が、同じ程度の精度により想定される。例えば、6~9の範囲について、6及び9に加えて、数である7及び8も想定され、6.0~7.0の範囲について、数である、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9及び7.0も、明示的に想定される。
本明細書において別途規定されない限りにおいて、本開示において使用された、学術用語及び技術用語は、当業者により一般に理解された意味と同じ意味を有するものとする。例えば、本明細書において記載される細胞及び組織培養、分子生物学、免疫学、遺伝学並びにタンパク質化学及び核酸化学及びハイブリダイゼーションの技術との関連において使用される任意の用語法は、周知であり、当技術分野において一般的に使用されている。用語の意味及び範囲は、明確であるものとするが、万一、任意の潜在的曖昧さが生じた場合、本明細書において提供された定義が、任意の辞書又は外部の定義に対して優先される。さらに、文脈により、別途要求されない限りにおいて、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。
本明細書において使用された、「抗体」という用語は、細菌及びウイルスなどの異物を同定し、中和するように、免疫系により、内因的に使用されたタンパク質を指す。典型的に、抗体は、少なくとも1つの相補性決定領域(CDR)を含むタンパク質である。CDRは、抗原への結合の一因をなす、抗体の「超可変領域」(下記において、さらに論じられる)を形成する。全抗体は、典型的に、4つのポリペプチド:重(H)鎖ポリペプチドの、2つの同一なコピー及び軽(L)鎖ポリペプチドの、2つの同一なコピーからなる。重鎖の各々は、1つのN末端の可変(VH)領域及び3つのC末端定常(CH1、CH2及びCH3)領域を含有し、各軽鎖は、1つのN末端可変(VL)領域及び1つのC末端定常(CL)領域を含有する。抗体の軽鎖は、それらの定常ドメインのアミノ酸配列に基づき、2つの顕著に異なる種類のうちの1つ、カッパ(κ)又はラムダ(λ)へと割り当てられうる。典型的抗体において、各軽鎖は、ジスルフィド結合により、重鎖へと連結され、2つの重鎖は、ジスルフィド結合により、互いへと連結される。軽鎖可変領域は、重鎖の可変領域とアライメントされ、軽鎖定常領域は、重鎖の第1の定常領域とアライメントされる。重鎖の定常領域の残余は、互いとアライメントされる。軽鎖と重鎖の各対の可変領域は、抗体の抗原結合性部位を形成する。VH領域と、VL領域とは、各領域が、4つのフレームワーク(FW又はFR)領域を含む、同じ一般的構造を有する。本明細書において使用された、「フレームワーク領域」という用語は、CDR間に配置された、可変領域内において比較的保存的なアミノ酸配列を指す。各可変ドメイン内に、4つのフレームワーク領域が存在し、これらは、FR1、FR2、FR3及びFR4と称されている。フレームワーク領域は、可変領域の構造フレームワークをもたらすβシートを形成する(例えば、C.A.Janewayら(編)、「Immunobiology」、第5版、Garland Publishing、New York、N.Y.(2001)を参照されたい)。フレームワーク領域は、3つのCDRにより接続される。上記において論じられた通り、CDR1、CDR2及びCDR3として公知である、3つのCDRは、抗原への結合の一因をなす、抗体の「超可変領域」を形成する。CDRは、フレームワーク領域により形成されたベータ-シート構造を接続し、場合によって、これらの一部を含む、ループを形成する。軽鎖及び重鎖の定常領域が、抗体の、抗原への結合に直接関与しないのに対し、定常領域は、可変領域の配向性に影響を及ぼしうる。定常領域はまた、エフェクター分子及び細胞との相互作用を介する、抗体依存性補体媒介溶解又は抗体依存性細胞傷害作用への参与など、多様なエフェクター機能も呈する。
本明細書において、「抗体の断片」、「抗体断片」及び抗体の「抗原結合性断片」という用語は、抗原に特異的に結合する能力を保持する、1つ以上の抗体の断片を指すように、互換的に使用される(一般に、Holligerら、Nat.Biotech.、23(9):1126~1129(2005)を参照されたい)。本明細書において記載された、抗体の任意の抗原結合性断片は、本発明の範囲内にある。抗体断片は、例えば、1つ以上のCDR、可変領域(又はこれらの部分)、定常領域(又はこれらの部分)又はこれらの組合せを含むことが所望される。抗体断片の例は、(i)VLドメイン、VHドメイン、CLドメイン及びCH1ドメインからなる一価断片である、Fab断片;(ii)ヒンジ領域におけるジスルフィド架橋により連結された、2つのFab断片を含む二価断片である、F(ab’)2断片;(iii)抗体の単一のアームのVLドメイン及びVHドメインからなる、Fv断片;(iv)穏和な還元条件を使用する、F(ab’)2断片のジスルフィド架橋の切断から生じる、Fab’断片;(v)ジスルフィド安定化Fv断片(dsFv);並びに(vi)抗原に特異的に結合する、抗体の単鎖可変領域ドメイン(VH又はVL)ポリペプチドである、ドメイン抗体(dAb)を含むがこれらに限定されない。
本明細書において使用された、「核酸」又は「核酸配列」とは、ピリミジン塩基及び/又はプリン塩基、好ましくは、それぞれ、シトシン、チミン及びウラシル並びにアデニン及びグアニンのポリマー又はオリゴマーを指す(Albert L.Lehninger、「Principles of Biochemistry」、793~800(Worth Pub.、1982)を参照されたい)。本技術は、任意のデオキシリボ核チド、リボ核チド又はペプチド核酸の構成要素及びこれらの塩基のメチル化形態、ヒドロキシメチル化形態又はグリコシル化形態など、これらの任意の化学的変異体を想定する。ポリマー又はオリゴマーは、組成物中において異種の場合もあり、同種の場合もあり、自然発生の供給源から単離される場合もあり、人工的に、又は合成的に作製される場合もある。加えて、核酸は、DNA若しくはRNA又はこれらの混合物であることが可能であり、ホモ二重鎖、ヘテロ二重鎖及びこれらのハイブリッド状態を含む、一本鎖形態又は二本鎖形態において、恒常的に存在する場合もあり、一過性に存在する場合もある。一部の実施形態において、核酸又は核酸配列は、例えば、DNA/RNAヘリックス、ペプチド核酸(PNA)、モルホリノ核酸(例えば、Braasch及びCorey、Biochemistry、41(14):4503~4510(2002)並びに米国特許第5,034,506号を参照されたい)、ロックト核酸(LNA;Wahlestedtら、Proc.Natl.Acad.Sci.U.S.A.、97:5633~5638(2000)を参照されたい)、シクロヘキシニル核酸(Wang、J.Am.Chem.Soc.、122:8595~8602(2000)を参照されたい)及び/又はリボザイムなど、他の種類の核酸構造を含む。よって、「核酸」又は「核酸配列」という用語はまた、天然ヌクレオチドと同じ機能を呈しうる、非天然ヌクレオチド、修飾ヌクレオチド及び/又は非ヌクレオチド構成要素(例えば、「ヌクレオチド類似体」)を含む鎖も包摂することが可能であり;さらに、本明細書において使用された、「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチド又はポリヌクレオチド及びこれらの断片又は部分並びに一本鎖の場合もあり、二本鎖の場合もあり、センス鎖を表す場合もあり、アンチセンス鎖を表す場合もある、ゲノム由来又は合成由来の、DNA又はRNAを指す。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」及び「オリゴヌクレオチド」という用語は、互換的に使用される。これらの用語は、デオキシヌクレオチド若しくはヌクレオチド又はこれらの類似体である、任意の長さのヌクレオチドのポリマー形態を指す。
「ペプチド」又は「ポリペプチド」とは、ペプチド結合により連結された、2つ以上のアミノ酸による連結配列である。ペプチド又はポリペプチドは、天然ペプチド又は天然ポリペプチドの場合もあり、合成ペプチド又は合成ポリペプチドの場合もあり、修飾ペプチド又は修飾ポリペプチドの場合もあり、天然ペプチド又は天然ポリペプチドと、合成ペプチド又は合成ポリペプチドとの組合せの場合もある。ポリペプチドは、結合性タンパク質、受容体及び抗体などのタンパク質を含む。タンパク質は、糖、脂質又はアミノ酸鎖内に含まれない、他の部分の付加により修飾されうる。「ポリペプチド」及び「タンパク質」という用語は、本明細書において、互換的に使用される。
本明細書において使用された、「配列同一性パーセント」という用語は、最大の同一性パーセントを達成するように、2つの配列をアライメントし、必要な場合、ギャップを導入した後における、参照配列内の、対応するヌクレオチド又はアミノ酸と同一である、核酸配列内のヌクレオチド若しくはヌクレオチド類似体又はアミノ酸配列内のアミノ酸の百分率を指す。よって、参照配列より長い、本技術に従う核酸の場合、参照配列とアライメントしない、核酸内のさらなるヌクレオチドは、配列同一性を決定するために考慮されない。最適のアライメントを得、2つ以上の配列の間の同一性を計算するための、多数の数学的アルゴリズムが公知であり、多数の、利用可能なソフトウェアプログラムへと組み込まれている。このようなプログラムの例は、CLUSTAL-W、T-Coffee及びALIGN(核酸配列及びアミノ酸配列のアライメントのための)、BLASTプログラム(例えば、BLAST 2.1、BL2SEQ及びこれらの最新バージョン)及びFASTAプログラム(例えば、FASTA3x、FAS(商標)及びSSEARCH)(配列アライメント及び配列類似性の検索のための)を含む。配列アライメントアルゴリズムはまた、例えば、Altschulら、J.Molecular Biol.、215(3):403~410(1990);Beigertら、Proc.Natl.Acad.Sci.USA、106(10):3770~3775(2009);Durbinら編、「Biological Sequence Analysis:Probabilistic Models of Proteins and Nucleic Acids」、Cambridge University Press、Cambridge、UK(2009);Soding、Bioinformatics、21(7):951~960(2005);Altschulら、Nucleic Acids Res.、25(17):3389~3402(1997);及びGusfield、「Algorithms on Strings、Trees and Sequences」、Cambridge University Press、Cambridge UK(1997)においても開示されている。
「ベクター」又は「発現ベクター」とは、細胞内における、接合されたセグメントの複製をもたらすように、別のDNAセグメント、例えば、「インサート」が接合される場合もあり、組み込まれる場合もある、プラスミド、ファージ、ウイルス又はコスミドなどのレプリコンである。
「野生型」という用語は、自然発生の供給源から単離されたときの、この遺伝子又は遺伝子産物の特徴を有する、遺伝子又は遺伝子産物を指す。野生型遺伝子は、集団内において、最も高頻度において観察される遺伝子であるので、任意に、遺伝子の「正常」形態又は「野生型」形態と称されている。これに対し、「修飾」、「突然変異体」又は「多型」という用語は、野生型の遺伝子又は遺伝子産物と比較した場合に、配列及び/又は機能的特性(例えば、特徴の変更)の修飾を提示する、遺伝子又は遺伝子産物を指す。自然発生の突然変異体も単離されうることが注目され;これらは、野生型の遺伝子又は遺伝子産物と比較した場合に、特徴が変更されているという事実により同定される。
2.転写修飾ドメインを同定するための方法
本明細書において、転写エフェクター(例えば、活性化及び抑制)ドメインを同定するための方法が開示される。一部の実施形態において、方法は、各々が誘導型DNA結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップ;レポーター細胞を、薬剤により、細胞内において、タンパク質及びmRNAのレベルが変更されるために(例えば、産生に起因する上昇、又は分解に起因する低下のために)必要な長さの時間にわたり処理するステップ;分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにタンパク質ドメインを、転写抑制因子又は活性化因子として同定するステップを含む。
本明細書において、転写エフェクター(例えば、活性化及び抑制)ドメインを同定するための方法が開示される。一部の実施形態において、方法は、各々が誘導型DNA結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップ;レポーター細胞を、薬剤により、細胞内において、タンパク質及びmRNAのレベルが変更されるために(例えば、産生に起因する上昇、又は分解に起因する低下のために)必要な長さの時間にわたり処理するステップ;分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにタンパク質ドメインを、転写抑制因子又は活性化因子として同定するステップを含む。
方法は、各々が誘導型DNA結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップを含む。タンパク質ドメインは、80アミノ酸以下でありうる。一部の実施形態において、タンパク質ドメインは、約75アミノ酸、約70アミノ酸、約65アミノ酸、約60アミノ酸、約55アミノ酸、約50アミノ酸、約45アミノ酸、約40アミノ酸、約35アミノ酸、約30アミノ酸、約25アミノ酸、約20アミノ酸、約15アミノ酸、約10アミノ酸、又は約5アミノ酸でありうる。
タンパク質ドメインは、任意の公知のタンパク質に由来しうる。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。核局在化タンパク質は、タンパク質の寿命において、核へと、完全に、又は部分的に局在化された、又は局在化されうる核局在化タンパク質を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。
誘導型DNA結合性ドメインは、Tet/DOXテトラサイクリン誘導型システム、光誘導型システム、アブシシン酸(ABA)誘導型システム、クメートシステム、40HT/エストロゲン誘導型システム、エクジソンベース誘導型システム及びFKBP12/FRAP(FKBP12-ラパマイシン複合体)誘導型システムを含むがこれらに限定されない、DNAへの結合の誘導のための、任意のシステムを使用しうる。
一部の実施形態において、誘導型DNA結合性ドメインはタグを含む。タグは、化学的手段又は酵素的手段により除去可能なタグを含む、当技術分野において公知である、任意のタグを含みうる。本方法における使用に適するタグは、キチン結合性タンパク質(CBP)、マルトース結合性タンパク質(MBP)、Strepタグ、グルタチオン-S-トランスフェラーゼ(GST)、ポリヒスチジン(PolyHis)タグ、ALFAタグ、V5タグ、Mycタグ、ヘマグルチニン(HA)タグ、スポットタグ、T7タグ、NEタグ、カルモデュリンタグ、ポリグルタミン酸タグ、ポリアルギニンタグ、FLAGタグなどを含む。
方法は、レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップを含む。
プロモーターは、高転写速度を付与する(強いプロモーター)場合もあり、低転写速度を付与する(弱いプロモーター)場合もある。多くのプロモーターライブラリーが、実験により確立されており、プロモーター及びプロモーター強度の選出は、細胞型に依存する。一部の実施形態において、転写活性化ドメインを同定する場合、弱いプロモーターが使用されうる。一部の実施形態において、転写抑制ドメインを同定する場合、強いプロモーターが使用されうる。
細胞表面マーカーは、細胞膜へと接合された、タンパク質及び炭水化物を含む。当技術分野において、細胞表面マーカーは、一般に、様々な細胞型について公知であり、公知の分子生物学法に基づき、選り抜きのレポーター細胞内において発現されうる。表面マーカーは、膜貫通ドメインへと接合されたマーカーポリペプチドを含む、合成表面マーカーでありうる。例えば、マーカーポリペプチドは、膜貫通ドメインへと接合された、抗体又はその断片(例えば、Fc領域)を含みうる。一部の実施形態において、マーカーポリペプチドは、ヒトIgG1 Fc領域であり、合成表面マーカーは、膜貫通ドメインへと接合された、ヒトIgG1 Fc領域を含む。
当技術分野において、蛍光タンパク質は、周知であり、多様な細胞のコンパートメント内において、入射光の波長の変動の結果として蛍光発光するように適合されたタンパク質を含む。蛍光タンパク質の例は、フィコビリタンパク質、シアン蛍光タンパク質(CFP)、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、増強オレンジ蛍光タンパク質(OFP)、増強緑色蛍光タンパク質(eGFP)、改変緑色蛍光タンパク質(emGFP)、増強黄色蛍光タンパク質(eYFP)及び/又は単量体赤色蛍光タンパク質(mRFP)並びにこれらの誘導体及び変異体を含む。
方法は、表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップを含む。当技術分野において、本明細書において開示された方法による使用に適する、多数の細胞分離法が公知であり、例えば、免疫磁性細胞分離、蛍光活性化細胞分取(FACS)及びマイクロ流体細胞分取を含む。一部の実施形態において、細胞分離は、免疫磁性細胞分離を含む。
一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、分離するステップ、シーケンシングするステップ、計算するステップ及び同定するステップを、1回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップは、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される。
一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。タンパク質ドメインの発現レベルは、タンパク質自体又はその任意のタグ若しくは標識についての免疫ブロット法及びイムノアッセイを含む、当技術分野において公知である、任意の方法を使用して決定されうる。一部の実施形態において、発現レベルは、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。
一部の実施形態において、方法は、転写抑制ドメインを同定する。一部の実施形態において、方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも3日間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも3日間、少なくとも4日間、少なくとも5日間、少なくとも6日間、少なくとも7日間、少なくとも8日間、少なくとも9日間、少なくとも10日間、少なくとも14日間以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、薬剤により、3~12日間、3~10日間、3~7日間、又は3~5日間にわたり処理される。
タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のlog2が、陰性対照の平均値から少なくとも2標準偏差である(例えば、大きい)場合に、転写抑制因子として同定される(例えば、図1Cを参照されたい)。
一部の実施形態において、方法は、転写活性化ドメインを同定する。一部の実施形態において、方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも24時間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも24時間(1日間)、少なくとも36時間、少なくとも48時間(2日間)、少なくとも60時間、少なくとも72時間(3日間)、少なくとも94時間、少なくとも106時間(4日間)以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、24~72時間の間又は36~60時間の間にわたり処理される。
タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のlog2が、陰性対照の平均値から少なくとも2標準偏差である(例えば、小さい)場合に、転写活性化因子として同定される(例えば、図5Bを参照されたい)。
3.転写因子
本開示においてまた、異種DNA結合性ドメインへと融合した1つ以上の転写エフェクタードメインを含む合成転写因子も提供される。本明細書において使用された、「転写因子」という用語は、目的のゲノム遺伝子座又は遺伝子と関連づけられた、特異的DNA配列と、直接的に、又は間接的に相互作用して、RNAポリメラーゼ活性を、遮断する、又は遺伝子若しくは遺伝子セットのためのプロモーター部位へとリクルートする、タンパク質又はポリペプチドを指す。
本開示においてまた、異種DNA結合性ドメインへと融合した1つ以上の転写エフェクタードメインを含む合成転写因子も提供される。本明細書において使用された、「転写因子」という用語は、目的のゲノム遺伝子座又は遺伝子と関連づけられた、特異的DNA配列と、直接的に、又は間接的に相互作用して、RNAポリメラーゼ活性を、遮断する、又は遺伝子若しくは遺伝子セットのためのプロモーター部位へとリクルートする、タンパク質又はポリペプチドを指す。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~896のうちのいずれかに対する少なくとも70%(例えば、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、99%)の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せは、本明細書において開示された方法により同定される。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写エフェクタードメイン(例えば、転写活性化ドメイン、転写抑制ドメイン又はこれらの組合せ)を含む。一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む。2つ以上のエフェクタードメインは、任意の配向性において、DNA結合性ドメインへの融合が可能であり、アミノ酸リンカーにより、互いから隔てられうる。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、合成転写因子は、当技術分野において公知である、少なくとも1つのさらなるエフェクタードメインと共に、本明細書において開示された少なくとも1つの転写活性化ドメイン又は少なくとも1つの転写抑制ドメインを含みうる。例えば、参照によりその全体において本明細書に組み込まれた、Tycko J.ら、Cell、2020年12月23日、183(7):2020~2035を参照されたい。一部の実施形態において、1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメインは、本明細書において記載された方法により同定される。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~596のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、表2において見出されるものから選択される。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号666のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、表1、3又は4において見出されるものから選択される。
DNA結合性ドメインは、二本鎖DNA又は一本鎖DNAに、全般的に、又は配列特異的に結合することが可能である、任意のポリペプチドである。DNA結合性ドメインは、ヘリックス-ターン-ヘリックスモチーフ、亜鉛フィンガー、ロイシンジッパー、HMGボックス(high mobility group box)ドメイン、ウィングドヘリックス領域、ウィングドヘリックス-ターン-ヘリックス領域、ヘリックス-ループ-ヘリックス領域、免疫グロブリンフォールド、B3ドメイン、Wor3ドメイン、TALエフェクターDNA結合性ドメインなどを有するポリペプチドを含む。異種DNA結合性ドメインは、天然結合性ドメインでありうる。一部の実施形態において、異種DNA結合性ドメインは、プログラム可能なDNA結合性ドメイン、例えば、所定のヌクレオチド配列に結合するように、天然DNA結合性ドメインの、1つ以上のアミノ酸を変更することにより操作された、例えば、DNA結合性ドメインを含む。
一部の実施形態において、DNA結合性ドメインは、標的DNA配列に、直接結合することが可能である。
DNA結合性ドメインは、AvrBs3、Hax2、Hax3又はHax4(Bonasら、1989、Mol Gen Genet、218(1):127~36;Kayら、2005、Mol Plant Mcrobe Interact 18(8):838~48)など、自然発生の転写活性化因子様エフェクター(TALE)内に見出されたドメインに由来しうる。TALEは、残基の反復配列からなる、モジュラーDNA結合性ドメインを有し、各リピート領域は、34アミノ酸からなる。各リピート領域の第12位及び第13位における残基対は、ヌクレオチドの特異性を決定し、領域の組み合わせは、配列特異的TALE DNA結合性ドメインの合成を可能とする。一部の実施形態において、TALE DNA結合性ドメインは、DNA結合性ドメインに、任意の標的配列に対する、選り抜きの特異性をもたらすように、公知の方法を使用して操作されうる。DNA結合性ドメインは、複数の(例えば、2つ、3つ、4つ、5つ、6つ、10、20以上の)TalエフェクターDNA結合性モチーフを含みうる。特に、本転写因子において援用される、配列特異的DNA結合性ドメインを形成するように、任意の数のヌクレオチド特異的Talエフェクターモチーフが、組み合わされうる。
一部の実施形態において、DNA結合性ドメインは、外因性因子と呼応して、標的DNAと会合する。
一部の実施形態において、DNA結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質(例えば、触媒不活化Cas9)に由来し、ガイドRNAを介して、標的DNAと会合する。gRNA自体は、DNA標的配列の1つの鎖及び足場配列と相補性の配列であって、標的DNA配列に結合し、これを、Cas9へとリクルートする配列を含む。本明細書において記載された転写因子は、CRISPR干渉(CRISPRi)又はCRISPR活性化(CRISPRa)に有用でありうる。
ガイドRNA(gRNA)は、crRNA、crRNA/tracrRNA(又は単鎖ガイドRNA、sgRNA)でありうる。gRNAは、非自然発生gRNAでありうる。「gRNA」、「ガイドRNA」及び「ガイド配列」という用語は、本明細書を通して互換的に使用される場合があり、Casタンパク質の特異性への結合を決定する配列を含む核酸を指す。gRNAは、DNA標的配列とハイブリダイズする(部分的に、又は完全に相補性である)。
標的核酸(標的部位)とハイブリダイズする、gRNA又はその一部は、選択的ハイブリダイゼーションに必要な、任意の長さでありうる。gRNA又はsgRNA(複数可)は、約5~約100ヌクレオチドの間の長さ、又はそれ以上(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、又は100ヌクレオチドの長さ以上)でありうる。
gRNAのデザインを容易とするために、多くの計算ツールが開発されている(Prykhozhijら(PLoS ONE、10(3):(2015));Zhuら(PLoS ONE、9(9)(2014));Xiaoら(Bioinformatics.、1月21日(2014));Heigwerら(Nat Methods、11(2):122~123(2014))を参照されたい)。ガイドRNAをデザインするための方法及びツールについて、参照により本明細書に組み込まれる、Zhu(Frontiers in Biology、10(4)、289~296頁(2015))により論じられている。加えて、Genscript Interactive CRISPR gRNA Design Tool、WU-CRISPR、and Broad Institute GPP sgRNA Designerを含むがこれらに限定されない、sgRNAのデザイン(複数可)を容易とするのに使用されうる、多くのソフトウェアツールが公表されている。ゲノムワイドのgRNAのデータベースである、IDT DNA Predesigned Alt-R CRISPR-Cas9 guide RNA、Addgene Validated gRNA Target Sequences及びGenScriptを含むがこれらに限定されない、多くの種(ヒト、マウス、ラット、ゼブラフィッシュ、C.エレガンス(C.elegans))の、ゲノム内の、多くの遺伝子及び位置をターゲティングするようにあらかじめデザインされたgRNA配列もまた、公表されている。
本開示はまた、本明細書において開示された、合成転写因子又は転写エフェクタードメイン(例えば、活性化ドメイン又は抑制ドメイン)をコードする核酸も提供する。例えば、エフェクタードメインは、表1~3に開示された核酸によりコードされうる。一部の実施形態において、エフェクタードメインは、配列番号897~1329のうちのいずれかに対して、少なくとも70%の同一性を有する核酸コードされうる。一部の実施形態において、核酸は、1つ以上の合成転写因子又は1つ以上のエフェクタードメインをコードする。
本開示の核酸は、当技術分野に公知の多数のプロモーターのうちのいずれかを含む場合があり、この場合、プロモーターは、構成的プロモーター、調節的プロモーター又は誘導型プロモーター、細胞型特異的プロモーター、組織特異的プロモーター又は種特異的プロモーターである。転写を方向付けるのに十分な配列に加えて、本発明のプロモーター配列はまた、転写をモジュレートすることに関与する、他の調節的エレメントの配列(例えば、エンハンサー、Kozak配列及びイントロン)も含みうる。当技術分野において、遺伝子の構成的発現を駆動するために有用な、多くのプロモーター/調節配列が利用可能であり、例えば、CMV(サイトメガロウイルスプロモーター)、EF1a(ヒト伸長因子1アルファプロモーター)、SV40(サル空胞化ウイルス40プロモーター)、PGK(哺乳動物のホスホグリセリン酸キナーゼプロモーター)、Ubc(ヒトユビキチンCプロモーター)、ヒトベータ-アクチンプロモーター、齧歯動物ベータ-アクチンプロモーター、CBh(ニワトリベータ-アクチンプロモーター)、CAG(ハイブリッド体プロモーターは、CMVエンハンサー、ニワトリベータアクチンプロモーター及びウサギベータ-グロビンスプライスアクセプターを含有する)、TRE(テトラサイクリン応答エレメントプロモーター)、H1(ヒトポリメラーゼIIIRNAプロモーター)、U6(ヒトU6小核プロモーター)などを含むがこれらに限定されない。本システムの構成要素の発現のために使用されうる、さらなるプロモーターは、限定せずに述べると、サイトメガロウイルス(CMV)中間初期プロモーター、ラウス肉腫ウイルスLTR、HIV-LTR、ハイスループットLV-1LTR、モロニーマウス白血病ウイルス(MMLV)LTR、骨髄増殖性肉腫ウイルス(MPSV)LTR、脾臓フォーカス形成ウイルス(SFFV)LTRなどのウイルスLTR、サルウイルス40(SV40)初期プロモーター、単純ヘルペスtkウイルスプロモーター、EF1-αイントロンを伴う、又は伴わない、伸長因子1アルファ(EF1-α)プロモーターを含む。さらなるプロモーターは、任意の構成的に活性のプロモーターを含む。代替的に、任意の調節的プロモーターは、その発現が、細胞内においてモジュレートされうるように使用されうる。
さらに、誘導型発現は、このような分子をコードする核酸を、誘導型プロモーター/調節配列の制御下に置くことにより達せられうる。当技術分野において周知のプロモーターは、金属、グルココルチコイド、テトラサイクリン、ホルモンなどの誘導剤に応答した誘導が可能であり、また、本発明による使用のためにも想定される。したがって、本開示は、これらへと作動可能に連結された、所望のタンパク質の発現を駆動することが可能である、当技術分野において公知の、任意のプロモーター/調節配列の使用を含むことが察知される。
本開示はまた、核酸を含有するベクター及び核酸又はそのベクターを含有する細胞も提供する。ベクターは、適切な細胞内において、核酸を繁殖させるのに使用される場合もあり、かつ/又は核酸(例えば、発現ベクター)からの発現を可能とするのに使用される場合もある。当業者は、核酸配列の繁殖及び発現に利用可能な、多様なベクターについて承知している。
本転写因子を発現させる細胞を構築するために、常套的な方法を介して、本システムの、安定的発現又は一過性発現のための発現ベクターを構築し、細胞へと導入することができる。例えば、本開示の転写因子の構成要素をコードする核酸又は他の核酸若しくはタンパク質を、適切なプロモーターへの作動可能な連結下において、プラスミド又はウイルスベクターなど、適切な発現ベクターへとクローニングすることができる。発現ベクター/プラスミド/ウイルスベクターの選択は、真核細胞内の組込み及び複製に適するものとする。
ある特定の実施形態において、本開示のベクターは、哺乳動物用発現ベクターを使用して、哺乳動物細胞内の、1つ以上の配列の発現を駆動しうる。哺乳動物用発現ベクターの例は、pCDM8(参照により本明細書に組み込まれる、Seed、Nature(1987)、329:840)及びpMT2PC(参照により本明細書に組み込まれる、Kaufmanら、EMBOJ.(1987)6:187)を含む。哺乳動物細胞内において使用される場合、発現ベクターの制御機能は、典型的に、1つ以上の調節エレメントによりもたらされる。例えば、一般に使用されているプロモーターは、ポリオーマウイルス、2型アデノウイルス、サイトメガロウイルス、サルウイルス40及び本明細書において開示され、当技術分野において公知である、他のウイルスに由来する。原核細胞及び真核細胞のいずれにも適する、他の発現系について、例えば、参照により本明細書に組み込まれる、Sambrookら、「MOLECULAR CLONING:A LABORATORY MANUAL」、2版、Cold Spring Harbor Laboratory、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、1989の16及び17章を参照されたい。
本開示のベクターは、特定の細胞型内の核酸の発現を方向付けうる(例えば、組織特異的調節エレメントは、核酸を発現させるのに使用される)。このような調節エレメントは、組織特異的の場合もあり、細胞特異的の場合もあるプロモーターを含む。プロモーターへと適用された場合の、「組織特異的」という用語は、異なる組織型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、目的のヌクレオチド配列の選択的発現を、特異的組織型(例えば、種子)へと方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語は、同じ組織内の、異なる細胞型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、特異的細胞型内の、目的のヌクレオチド配列の選択的発現を方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語はまた、単一組織内の領域において、目的のヌクレオチド配列の選択的発現を促進することが可能なプロモーターも意味する。プロモーターの細胞型特異性は、当技術分野において周知の方法、例えば、免疫組織化学的染色を使用して評価されうる。
加えて、ベクターは、例えば、以下の一部又は全部:宿主細胞内における、安定的形質転換体又は一過性形質転換体を選択するための、選択用マーカー遺伝子;転写終結シグナル及びRNAプロセシングシグナル;5’非翻訳領域及び3’非翻訳領域;多目的の多重クローニング部位である、内部リボソーム結合部位(IRES);並びにキメラ受容体の発現を評価するためのレポーター遺伝子を含有しうる。トランス遺伝子を含有するベクターを作製するために適する、ベクター及び方法は、周知であり、当技術分野において利用可能である。選択用マーカーは、クロラムフェニコール耐性、テトラサイクリン耐性、スペクチノマイシン耐性、ネオマイシン、ストレプトマイシン耐性、エリスロマイシン耐性、リファンピシン耐性、ブレオマイシン耐性、熱適合カナマイシン耐性、ゲンタマイシン耐性、ヒグロマイシン耐性、トリメトプリム耐性、ジヒドロ葉酸レダクターゼ(DHFR)、GPT;S.セレビシエ(S.cerevisiae)の遺伝子である、URA3、HIS4、LEU2及びTRP1を含む。
細胞へと導入された場合、ベクターは、自律的複製配列又は染色体外エレメントとして維持される場合もあり、宿主DNAへと組み込まれる場合もある
したがって、本開示は、本明細書において開示された、合成転写因子、核酸又はベクターを含む細胞をさらに提供する。
したがって、本開示は、本明細書において開示された、合成転写因子、核酸又はベクターを含む細胞をさらに提供する。
常套的なウイルスベースの遺伝子導入法及び非ウイルスベースの遺伝子導入法は、核酸を、細胞、組織又は対象へと導入するのに使用されうる。このような方法は、核酸を、培養物中の細胞又は宿主生物における細胞へと投与するのに使用されうる。非ウイルスベクター性の送達システムは、DNAプラスミド、コスミド、RNA(例えば、本明細書において記載されたベクターの転写物)、核酸及び送達媒体と複合体化された核酸を含む。
ウイルスベクター性の送達システムは、細胞へと送達された後において、エピソーム性である又はゲノムへと組み込まれたDNAウイルス及びRNAウイルスを含む。様々なウイルス構築物は、本核酸を、細胞、組織及び/又は対象へと送達するのに使用されうる。ウイルスベクターは、例えば、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター及び単純ヘルペスウイルスベクターを含む。このような組換えウイルスの非限定例は、組換えアデノ随伴ウイルス(AAV)、組換えアデノウイルス、組換えレンチウイルス、組換えレトロウイルス、組換え単純ヘルペスウイルス、組換えポックスウイルス、ファージなどを含む。本開示は、レトロウイルス又はレンチウイルスなど、宿主ゲノムへの組込みが可能なベクターを提示する。参照により本明細書に組み込まれる、例えば、Ausubelら、「Current Protocols in Molecular Biology」、John Wiley & Sons、New York、1989;Kay,M.A.ら、2001、Nat.Medic.、7(1):33~40;並びにWalther W.及びStein U.、2000、Drugs、60(2):249~71を参照されたい。
核酸又は転写因子は、任意の適切な手段により送達されうる。ある特定の実施形態において、核酸又はそのタンパク質は、インビボにおいて送達される。他の実施形態において、核酸又はそのタンパク質は、疾患又は状態を患う患者へのインビボ送達に有用な、改変細胞をもたらすように、インビトロ又はエクスビボにおいて、分離/培養細胞へと送達される。
多種多様な宿主細胞が、本開示に従うベクターにより形質転換される場合もあり、トランスフェクトされる場合もあり、本開示に従うベクターが、他の方式において、多種多様な宿主細胞へと導入される場合もある。トランスフェクションとは、任意のコード配列が、実際に発現されるのであれ、発現されないのであれ、ベクターが細胞に取り込まれることを指す。当業者に、多数のトランスフェクション法、例えば、リポフェクタミン、リン酸カルシウム共沈殿、電気穿孔、DEAEデキストラン処理、マイクロインジェクション、ウイルス感染及び当技術分野において公知である、他の方法が公知である。形質導入とは、ウイルスの、細胞への侵入及びウイルスベクターゲノムにより送達された配列の発現(例えば、転写及び/又は翻訳)を指す。組換えベクターの場合、「形質導入」とは、一般に、組換えウイルスベクターの、細胞への侵入及びベクターゲノムにより送達された目的の核酸の発現を指す。
当技術分野において、ベクターを、細胞へと送達する方法が周知であり、DNA又はRNAの電気穿孔、リポソームなどのトランスフェクション試薬又はDNA若しくはRNAを送達するためのナノ粒子;機械的変形による、DNA、RNA、又はタンパク質の送達(例えば、参照により本明細書に組み込まれる、Shareiら、Proc.Natl.Acad.Sci.USA(2013)、110(6):2082~2087を参照されたい);又はウイルスによる形質導入を含みうる。一部の実施形態において、ベクターは、ウイルスによる形質導入を介して、宿主細胞へと送達される。核酸は、プラスミド又はウイルスベクターなど、大型の構築物の一部として送達される場合もあり、例えば、電気穿孔、脂質小胞、ウイルス輸送体、マイクロインジェクション及びバイオリスティック法(高速粒子ボンバードメント)により直接送達される場合もある。同様に、1つ以上のトランス遺伝子を含有する構築物は、核酸を、細胞へと導入するために適切な、任意の方法により送達されうる。一部の実施形態において、本システムの構成要素をコードする構築物又は核酸は、DNA分子である。一部の実施形態において、本システムの構成要素をコードする核酸は、DNAベクターであり、細胞へと電気穿孔されうる。一部の実施形態において、本システムの構成要素をコードする核酸は、細胞へと電気穿孔されうる、RNA分子である。
加えて、ナノ粒子ベースの送達システム及び脂質ベースの送達システムなどの送達媒体も使用されうる。さらなる送達媒体の例は、レンチウイルスベクター、リボ核タンパク質(RNP)複合体、脂質ベースの送達システム、遺伝子銃、流体力学法、電気穿孔又はヌクレオフェクション、マイクロインジェクション及びバイオリスティック法を含む。多様な遺伝子送達法は、参照により本明細書に組み込まれる、Nayerossadatら(Adv Biomed Res.、2012、1:27)及びIbraheemら(Int J Pharm.、2014年1月1日、459(1~2):70~83)により、詳細に論じられている。
このように、本開示は、本明細書において開示されたベクター(複数可)又は核酸(複数可)を含む分離細胞を提供する。好ましい細胞は、容易に、かつ、信頼できる形において増殖し、増殖速度が、妥当な程度に高速であり、発現系が、十分に特徴づけられており、容易に、かつ、効率的に形質転換又はトランスフェクトされうる細胞である。適切な原核細胞の例は、バチルス属(Bacillus)(バチルス・スブチリス(Bacillus subtilis)及びバチルス・ブレビス(Bacillus brevis)など)、エシェリキア属(Escherichia)(E.コリー(E.coli)など)、シュードモナス属(Pseudomonas)、ストレプトマイセス属(Streptomyces)、サルモネラ属(Salmonella)及びエルウィニア属(Erwinia)に由来する細胞を含むがこれらに限定されない。適切な真核細胞は、当技術分野において公知であり、例えば、酵母細胞、昆虫細胞及び哺乳動物細胞を含む。適切な酵母細胞の例は、クルイベロマイセス属(Kluyveromyces)、ピキア属(Pichia)、リノスポリジウム属(Rhinosporidium)、サッカロマイセス属(Saccharomyces)及びスキゾサッカロマイセス属(Schizosaccharomyces)に由来する酵母細胞を含む。例示的な昆虫細胞は、Sf-9細胞及びHIS細胞(Invitrogen、Carlsbad、Calif.)を含み、例えば、参照により本明細書に組み込まれる、Kittsら、Biotechniques、14:810~817(1993);Lucklow、Curr.Opin.Biotechnol.、4:564~572(1993)並びにLucklowら、J.Virol.、67:4566~4579(1993)において記載されている。細胞は、哺乳動物細胞であることが所望され、一部の実施形態において、細胞は、ヒト細胞である。当技術分野において、多数の適切な哺乳動物宿主細胞及びヒト宿主細胞が公知であり、これらのうちの多くは、American Type Culture Collection(ATCC、Manassas、Va.)から入手可能である。適切な哺乳動物細胞の例は、チャイニーズハムスター卵巣細胞(CHO)(ATCC受託番号:CCL61)、CHO DHFR細胞(Urlaubら、Proc.Natl.Acad.Sci.USA、97:4216~4220(1980))、ヒト胎児性腎臓(HEK)293細胞又はHEK 293T細胞(ATCC受託番号:CRL1573)及び3T3細胞(ATCC受託番号:CCL92)を含むがこれらに限定されない。他の適切な哺乳動物細胞系は、サルCOS-1細胞系(ATCC受託番号:CRL1650)及びCOS-7細胞系(ATCC受託番号:CRL1651)のほか、CV-1細胞系(ATCC受託番号:CCL70)である。さらなる例示的な哺乳動物宿主細胞は、形質転換細胞系を含む、霊長動物細胞系、齧歯動物細胞系及びヒト細胞系を含む。正常二倍体細胞、初代組織のインビトロ培養物に由来する細胞株のほか、初代外植片もまた適する。他の適切な哺乳動物細胞系は、マウス神経芽細胞腫N2A細胞、HeLa細胞、HEK細胞、A549細胞、HepG2細胞、マウスL-929細胞及びBHKハムスター細胞系又はHaKハムスター細胞系を含むがこれらに限定されない。
当技術分野において、細胞の形質転換、培養物、増幅、スクリーニング及び精製に適する哺乳動物細胞及び方法を選択するための方法が公知である。
本発明はまた、本明細書において記載された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムも対象とする。一部の実施形態において、組成物又はシステムは、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む。
一部の実施形態において、組成物又はシステムは、gRNAをさらに含む。gRNAは、合成転写因子と同じ核酸上においてコードされる場合もあり、異なる核酸上においてコードされる場合もある。一部の実施形態において、合成転写因子をコードするベクターは、同じプロモーター下において、gRNAをさらにコードする場合もあり、異なるプロモーター下において、gRNAをさらにコードする場合もある。一部の実施形態において、gRNAは、転写因子のベクターと隔てられた、その固有のベクター上においてコードされる。
4.遺伝子発現をモジュレートする方法
本開示はまた、細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法であって、細胞へと、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む方法も提供する。一部の実施形態において、少なくとも2つの遺伝子の遺伝子発現がモジュレートされる。
本開示はまた、細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法であって、細胞へと、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む方法も提供する。一部の実施形態において、少なくとも2つの遺伝子の遺伝子発現がモジュレートされる。
発現のモジュレーションは、標的遺伝子についての正常な遺伝子発現と比較した、遺伝子発現の増大又は低下を含む。少なくとも2つの遺伝子の遺伝子発現がモジュレートされる場合、いずれの遺伝子の遺伝子発現も増大する場合もあり、いずれの遺伝子の遺伝子発現も低下する場合もあり、一方の遺伝子の遺伝子発現は増大するが、他方の遺伝子の遺伝子発現は低下する場合もある。
細胞は、原核細胞の場合もあり、真核細胞の場合もある。好ましい実施形態において、細胞は、真核細胞である。一部の実施形態において、細胞は、インビトロにおける細胞である。一部の実施形態において、細胞は、エクスビボにおける細胞である。
一部の実施形態において、細胞は、開示されたシステム、組成物、ベクターの、細胞への導入が、対象への投与を含むように、生物又は宿主における細胞である。方法は、インビボにおいて、又はエクスビボにおいて処理された細胞の移入により、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと提供又は投与するステップを含みうる。
「対象」は、ヒトの場合もあり、ヒト以外の場合もあり、例えば、本明細書において記載されたマウスモデルなど、調査研究を目的とする「モデル系」として使用された、動物株又は動物種を含みうる。同様に、対象は、成人又は若年者(例えば、小児)を含みうる。さらに、対象とは、本明細書において想定された組成物の投与から利益を得うる、任意の生物、好ましくは、哺乳動物(例えば、ヒト又は非ヒト哺乳動物)を意味しうる。哺乳動物の例は、哺乳動物のクラス:ヒト、チンパンジー並びに他の類人猿種及びサル種などの非ヒト霊長動物;ウシ、ウマ、ヒツジ、ヤギ、ブタなどの農場動物;ウサギ、イヌ及びネコなどの愛玩動物;ラット、マウス及びモルモットなどの齧歯動物を含む実験動物などのうちの任意のメンバーを含むがこれらに限定されない。非哺乳動物の例は、鳥類、魚類などを含むがこれらに限定されない。本明細書で提供された方法及び組成物についての一実施形態において、哺乳動物は、ヒトである。
本明細書において使用された、「~を施すこと」、「~を投与すること」、「~を導入すること」という用語は、本明細書において、互換的に使用され、所望の部位への、システムの少なくとも部分的な局在化を結果としてもたらす方法又は経路による、本開示のシステムの、対象への留置を指す。システムは、対象における所望の位置への送達を結果としてもたらす、任意の適切な経路により投与されうる。
5.キット
エフェクタードメイン若しくはDNA結合性ドメイン又はこれらの組合せをコードする、少なくとも1つの核酸のうちの少なくとも1つ又は全て、少なくとも1つの合成転写因子又はこれをコードする核酸、少なくとも1つのエフェクタードメイン又は少なくとも1つの合成転写因子をコードするベクター、本明細書において記載された組成物又はシステム、エフェクタードメイン、DNA結合性ドメイン、合成転写因子、又はこれらのうちのいずれかをコードする核酸を含む細胞、本明細書において記載されたレポーター細胞及び本明細書において記載された、二部構成型レポーター遺伝子又はこれをコードする核酸を含むキットもまた、本開示の範囲内にある。
エフェクタードメイン若しくはDNA結合性ドメイン又はこれらの組合せをコードする、少なくとも1つの核酸のうちの少なくとも1つ又は全て、少なくとも1つの合成転写因子又はこれをコードする核酸、少なくとも1つのエフェクタードメイン又は少なくとも1つの合成転写因子をコードするベクター、本明細書において記載された組成物又はシステム、エフェクタードメイン、DNA結合性ドメイン、合成転写因子、又はこれらのうちのいずれかをコードする核酸を含む細胞、本明細書において記載されたレポーター細胞及び本明細書において記載された、二部構成型レポーター遺伝子又はこれをコードする核酸を含むキットもまた、本開示の範囲内にある。
キットはまた、キットの構成要素を使用するための指示書も含みうる。指示書とは、キットに関する、関与性の材料又は方法である。材料は、以下:背景情報、構成要素の一覧、組成物を使用するための、略式プロトコール又は詳細プロトコール、トラブルシューティング、参考文献、テクニカルサポート及び他の任意の関連文献の、任意の組合せを含みうる。指示書は、キットと共に提供される場合もあり、別個のメンバー構成要素である、紙形態として提供される場合もあり、コンピューター読取り型メモリーデバイス上において提供される場合もあり、インターネット上のウェブサイトからダウンロードされる場合もあり、表示の記録として提示される場合もある、電子的形態として提供される場合もある。
開示されたキットは、開示された方法との関連において援用されうることが理解される。キットは、本明細書において記載された方法のうちのいずれかにおける使用のための指示書を含みうる。指示書は、抑制ドメインを同定する方法又は遺伝子発現をモジュレートする方法のための構成要素の使用についての記載を含みうる。
本明細書において提供されたキットは、適切にパッケージングされている。適切なパッケージングは、バイアル、ボトル、ジャー、可撓性パッケージングなどを含むがこれらに限定されない。
キットは、任意選択的に、緩衝液解釈のための情報などの、さらなる構成要素を提供しうる。通常、キットは、容器及び容器上の表示又は容器に付属するパッケージ添付文書(複数可)を含む。一部の実施形態において、本開示は、上記において記載されたキットの内容物を含む製品を提供する。
キットは、本システム又は本組成物を保持又は投与するためのデバイスをさらに含みうる。デバイスは、注入デバイス、静脈内溶液バッグ、皮下注射針、バイアル及び/又はシリンジを含みうる。
本開示はまた、インビトロにおいて、方法を実施する、又は構成要素を作製するためのキットも提供する。キットは、本システムの構成要素を含みうる。キットの任意選択的な成分は、以下:(1)緩衝液構成成分、(2)対照プラスミド、(3)シーケンシングプライマーのうちの1つ以上を含む。
6.実施例
ヒト遺伝子の発現は、転写を活性化させる、又は抑制する、数千のタンパク質により調節されている。我々は、これらのタンパク質の遺伝子発現の変化を媒介するのに十分なドメインである、エフェクタードメインについての、完全かつ定量的な記載を欠いている。ヒト細胞内の転写エフェクタードメインを体系的に測定するために、本明細書において、タンパク質ドメインのライブラリーが、DNA結合性ドメインへと融合され、レポーター遺伝子へとリクルートされる、ハイスループットアッセイが提供される。次いで、細胞が、レポーターの発現レベルにより分離され、タンパク質ドメインのライブラリーが、シーケンシングされる。レポーターは、磁性ビーズを使用する、細胞数千万個の、高発現集団及び低発現集団への、単純な分離を容易とする、合成表面マーカーである。
ヒト遺伝子の発現は、転写を活性化させる、又は抑制する、数千のタンパク質により調節されている。我々は、これらのタンパク質の遺伝子発現の変化を媒介するのに十分なドメインである、エフェクタードメインについての、完全かつ定量的な記載を欠いている。ヒト細胞内の転写エフェクタードメインを体系的に測定するために、本明細書において、タンパク質ドメインのライブラリーが、DNA結合性ドメインへと融合され、レポーター遺伝子へとリクルートされる、ハイスループットアッセイが提供される。次いで、細胞が、レポーターの発現レベルにより分離され、タンパク質ドメインのライブラリーが、シーケンシングされる。レポーターは、磁性ビーズを使用する、細胞数千万個の、高発現集団及び低発現集団への、単純な分離を容易とする、合成表面マーカーである。
遺伝子サイレンシング及びエピジェネティックメモリーを、≦80アミノ酸である、全ての核タンパク質ドメインのリクルートメントの後において定量した。>300のKRABドメイン及び>200のホメオドメインの全ファミリーについての測定を使用して、転写因子の抑制ドメイン強度と、それらの進化履歴及び発生的役割との関係を発見した。さらに、ZNF10 KRABエフェクター機能について、高深度突然変異スキャンを行い、CRISPRiにおいて使用されたKRABドメインと比較して、安定性及び抑制を増強する置換を同定した。既存のアノテーション領域を越えて、エフェクタードメインを探索するために、238の抑制性複合体タンパク質の配列をタイリングし、非カノニカルのポリコーム1.6リクルートメントタンパク質であるMGAを含む、大型のクロマチン調節因子の、非アノテーション領域内において、10アミノ酸という短鎖の、新規の抑制ドメインを発見した。20を超える抑制因子を、個別に特徴づけ、それらの全てが、サイレンシング及びエピジェネティックメモリーの動態は、顕著に異なるが、レポーター遺伝子を、単一細胞レベルにおいて、全部又はゼロ式にサイレンシングすることを見出した。
加えて、高度に分岐的な、酸性KRABドメイン変異体を含む、核タンパク質内の、新たな活性化ドメインも発見した。
まとめると、これらの結果は、ヒト細胞内の転写エフェクタードメイン活性の体系的測定のための戦略を裏付け、合成転写技術及びエピジェネティック摂動技術において適用されうる、コンパクト転写エフェクタードメインの数を拡張する。
本技術により取り扱われる問題は、
i.どの遺伝子が、エフェクター機能を有するのかという、未知の問題
ii.どのドメインがこの機能を有するのか未知であることが多い、公知のTF/CR遺伝子内の問題
iii.どのファミリーメンバーが、この機能を有するのか、未知である、公知のエフェクタードメインを含むドメインファミリー内の問題
iv.どの残基が必要であり、突然変異が、どのようにして機能を低減又は増強するのか未知である、公知のエフェクタードメイン内の問題
である。
i.どの遺伝子が、エフェクター機能を有するのかという、未知の問題
ii.どのドメインがこの機能を有するのか未知であることが多い、公知のTF/CR遺伝子内の問題
iii.どのファミリーメンバーが、この機能を有するのか、未知である、公知のエフェクタードメインを含むドメインファミリー内の問題
iv.どの残基が必要であり、突然変異が、どのようにして機能を低減又は増強するのか未知である、公知のエフェクタードメイン内の問題
である。
本明細書において提供されるシステム及び方法は、レポータープロモーターからのアウトプットを変化させる、活性化能及び抑制能に対する調節ドメインを測定しうる。歴史的に、これは、ロースループットの作業を要求し、比較的少数のエフェクタードメインが測定されている。本明細書において提供されるシステム及び方法は、代替的ハイスループットアッセイを提供する。
システム及び方法は、例えば、a.遺伝子調節を理解し、これらのタンパク質が結合する非コード調節エレメントの機能を予測すること;及びb.エピゲノム摂動ツールのためのエフェクタードメインを同定するために使用される。
かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、DNA結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体も同定する。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用されうる。
本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。本発明者らは、短鎖ドメイン(≦80アミノ酸)及び送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップを同定する。場合によって、本発明者らは、10アミノ酸という短鎖である、強力なエフェクタードメインを同定する。ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。これらのドメインの大半は未だ、転写エフェクターとして報告されていない。
強力なpEFプロモーター及び弱いminCMVプロモーターの両方に対して、Pfamドメインライブラリーを伴う、ハイスループットリクルートメントを実施することにより、抑制ドメイン及び活性化ドメインの両方の測定が可能であった。多くのさらなる抑制因子が見出された、1つの可能な理由は、TADが、よりしばしば、Pfamによるドメイン定義を満たす、自律的な安定フォールディング配列でありながら、よりしばしば、ドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることである。別の可能な理由は、核内において、活性化補因子が、抑制補因子より限定的であり(Gillespie、Mol Cell、2020)、これは、活性化ドメインの発現の低下が、活性化強度の増大を結果としてもたらす場合もあることを含意するが、この効果が、スクリーン内のシグナルを、完全に遮蔽するとは予測されないことでありうる。転写因子をタイリングする、又はTAD様署名(例えば、酸性度)を伴う領域に焦点を当てる、新たなライブラリーデザインは、さらなる活性化ドメインを明らかにする。
加えて、本明細書において、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットステップも開示される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能とされる。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。
[実施例1]
ハイスループットリクルートメントは、ヒトタンパク質内の、数百の抑制ドメインを同定する
転写ドメインについての、古典的リクルートメントレポーターアッセイを、ハイスループットアッセイへと転換するために、2つの問題:(1)レポーターを、数万ドメインを有するライブラリーの急速なスクリーニングに適合性とするための、レポーターの修飾;及び(2)候補エフェクタードメインのライブラリーを作出する戦略の開発を解決した。既に公表されている蛍光レポーター(Bintuら、2016)に対する改善のために、合成表面マーカーを操作して、多数の細胞の容易な磁性分離を可能とし、レポーターを、大容量のスピナーフラスコ内の細胞培養に適する、懸濁細胞系内に組み込んだ。具体的に、合成表面マーカー(Igκリーダー及びPDGFRβ膜貫通ドメインへと連結された、ヒトIgG1 Fc領域)と、蛍光シトリンタンパク質とからなる、二部構成レポーター(図1)の発現を駆動する、強い構成的pEF1aプロモーターの上流に、9×TetO結合性部位を伴う、K562レポーター細胞を作出した。フローサイトメトリーは、5日以内に、亜鉛フィンガー転写因子であるZNF10に由来する、公知の抑制ドメインである、KRABドメインの、TetO部位におけるリクルートメントが、このレポーターを、ドキシサイクリン依存的にサイレンシングすることを確認した(図7並びに16A及び16B)。合成表面マーカーに結合するProG Dynabeadによる磁性分離は、レポーターオン細胞を、レポーターオフ細胞から分離した(図7及び16C)。
ハイスループットリクルートメントは、ヒトタンパク質内の、数百の抑制ドメインを同定する
転写ドメインについての、古典的リクルートメントレポーターアッセイを、ハイスループットアッセイへと転換するために、2つの問題:(1)レポーターを、数万ドメインを有するライブラリーの急速なスクリーニングに適合性とするための、レポーターの修飾;及び(2)候補エフェクタードメインのライブラリーを作出する戦略の開発を解決した。既に公表されている蛍光レポーター(Bintuら、2016)に対する改善のために、合成表面マーカーを操作して、多数の細胞の容易な磁性分離を可能とし、レポーターを、大容量のスピナーフラスコ内の細胞培養に適する、懸濁細胞系内に組み込んだ。具体的に、合成表面マーカー(Igκリーダー及びPDGFRβ膜貫通ドメインへと連結された、ヒトIgG1 Fc領域)と、蛍光シトリンタンパク質とからなる、二部構成レポーター(図1)の発現を駆動する、強い構成的pEF1aプロモーターの上流に、9×TetO結合性部位を伴う、K562レポーター細胞を作出した。フローサイトメトリーは、5日以内に、亜鉛フィンガー転写因子であるZNF10に由来する、公知の抑制ドメインである、KRABドメインの、TetO部位におけるリクルートメントが、このレポーターを、ドキシサイクリン依存的にサイレンシングすることを確認した(図7並びに16A及び16B)。合成表面マーカーに結合するProG Dynabeadによる磁性分離は、レポーターオン細胞を、レポーターオフ細胞から分離した(図7及び16C)。
配列は、核へと局在化されうる、ヒトタンパク質(核局在化タンパク質だけに限られない、ヒトタンパク質を含む)内の、Pfamアノテーションドメインについて、UniProtデータベースから取り出した。合計、14,657ドメインを検索した。これらのうち、72%は、80アミノ酸(AA)長以下であった(図1)が、これは、これらのドメインを、300塩基のオリゴヌクレオチドとしてプールされた合成オリゴヌクレオチドに適合性とした。80アミノ酸より短いドメインについて、ドメイン配列を、両末端において、80アミノ酸の長さに到達させ、PCR増幅バイアスを回避するために、天然タンパク質配列に由来する隣接残基により伸長させた。80アミノ酸のランダム配列又はタイリングウィンドウを10アミノ酸として、DMDタンパク質に沿ってタイリングされた、80アミノ酸の配列である、861の陰性対照を追加した。DMDタンパク質は、核内に局在化しなかった(Chevronら、1994)ので、転写活性を伴うドメインを特徴づける可能性は小さかった。ライブラリーは、レンチウイルスによる発現のために、rTetRドキシサイクリン誘導性DNA結合性ドメイン単独との融合タンパク質又は3×FLAGタグ付けrTetRとの融合タンパク質としてクローニングされ(図17A及び8)、K562レポーター細胞へと送達された(図1)。
転写活性についてアッセイする前に、ハイスループット法を使用して、K562細胞内において、どのタンパク質ドメインが発現良好であるのかを決定した(図17A及び8)。細胞ライブラリーを、抗FLAG蛍光標識化抗体により染色し、細胞を、2つのビンへと分取し(図17B及び8)、ゲノムDNAを抽出し、単位複製配列シーケンシングにより、各ドメインの頻度をカウントした。シーケンシングカウントを使用して、各ドメインについて、発現レベルの測定値として、FLAGlow集団と対比される、FLAGhigh集団のエンリッチメント比を計算した。これらの測定は、個別に形質導入された生物学的反復間において、再現可能であり(r2=0.82、図17C及び8)、ウェスタンブロットにより測定された、個々のドメイン融合体の発現レベルと高度に相関した(r2=0.92、図17D及び17E並びに8)。天然Pfamドメインが、ランダム配列対照より、有意に発現良好(マンホイットニー検定によるp<1×10-5である)であるのに対し、Pfamドメイン及びDMDタイリング対照は、同等に発現良好であった(図17F及び8)。ランダム対照の中央値を、1標準偏差上回る、FLAGhigh:FLAGlow比により、発現良好ドメインを同定するように、閾値を設定した。この定義により、Pfamドメインのうちの66%が、発現良好であり、これらのドメインを、さらなる解析の焦点とした。
Pfamドメインライブラリーを、転写抑制因子についてスクリーニングした。プールされた細胞ライブラリーを、ドキシサイクリンにより、転写サイレンシング後に、細胞分裂のために、レポーターのmRNA及びタンパク質が分解及び希釈される結果として、「オン」細胞と、「オフ」細胞との、透明な二相性混合物をもたらすのに十分な時間をもたらす、5日間にわたり処理した(図18A及び9)。次いで、磁性細胞分離(図18A及び9)及びドメインシーケンシングを実施し、次いで、非結合集団内及びビーズ結合集団内のリードカウントを使用して、各ライブラリーメンバーについて、log2(オフ:オン)比を計算した(図1)。明確さのために述べると、ビーズ結合集団を、「オン」集団と称し、非結合集団を、「オフ」集団と称した。測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった(r2=0.96、図1)。ドメインが、発現不良陰性対照の平均値を、2標準偏差を超える抑制を引き起こした場合に、ヒットと判定した。これは、63のドメインファミリーに由来するドメインについて、5日目において、446の抑制因子ヒットを結果としてもたらした(図12A)。場合によって、正確な同じドメイン配列が、複数の遺伝子内において生じるため、これらの抑制ドメインは、451のヒトタンパク質内において見出される。10のドメインファミリーに由来し、Pfamにより、抑制因子又は抑制補因子結合性ドメインとして記載された、公知の抑制ドメイン(例えば、ヒトZNF10に由来するKRAB、CBX5に由来するChromoshadow)は、ヒットの中にあった。エピジェネティックメモリーを測定するために、9及び13日目に、さらなる時点を設定した。ヒットを含有するタンパク質のセットは、転写因子及びクロマチン調節因子について、ライブラリー内において使用された、全ての核タンパク質と比較した場合に、有意にエンリッチされたが、異なるカテゴリーのタンパク質も、それらのメモリーレベルにより分類された場合に、示差的にエンリッチされた(図18B及び9)。具体的に、13日目において、メモリーが高度である抑制因子(細胞は、オフ状態を維持する)は、KRAB ZNFタンパク質を含む、C2H2型亜鉛フィンガー転写因子について、最も高度にエンリッチされ、メモリーが低度である抑制因子は、Hoxタンパク質を含む、ホメオドメイン転写因子について、最も高度にエンリッチされた。全体として、ヒット間における、極めて高度の再現性及び予測された陽性対照抑制ドメインの同定は、ハイスループットリクルートメントと呼ばれるスクリーニング法が、信頼できる結果をもたらすことを示唆した。核Pfamドメインライブラリー内において同定された抑制因子についてのアミノ酸配列及び核酸配列を、表1に示すが、高スコアは、高度の抑制を指し示す。
最強のヒットのうちの1つは、いずれも、ポリコーム抑制複合体1(PRC1)の構成要素である(Chittockら、2017;Garciaら、1999)、RING1/YY1結合性タンパク質(RYBP)及びそのパラログであるYY1関連因子2(YAF2)に存在するドメインである、YAF2_RYBPであった。PfamによりアノテーションされたRYBPタンパク質ドメイン(わずか32アミノ酸であるので、80アミノ酸のドメインライブラリー内において合成された短鎖形である)を、個別に調べ、レポーター遺伝子の急速なサイレンシングを確認した(図12B)。RYBP媒介サイレンシングはまた、マウス胚性幹細胞内の全長RYBPタンパク質のリクルートメントについての近年の報告においても裏付けられた(Moussaら、2019;Zhaoら、2020)。結果は、表面プラズモン共鳴により、ポリコームヒストン修飾酵素であるRING1Bに結合するのに要求される最小ドメインであることが示された、32アミノ酸のRYBPドメイン(Wangら、2010)が、細胞内のサイレンシングを媒介するのに十分であることを確立した。
抑制反応速度を定量するために、シトリンレベルの分布にゲートをかけて、非処理細胞内の、均一の低レベルのバックグラウンドサイレンシングにより正規化された、サイレンシング細胞の百分率を計算し、次いで、データを、ドキシサイクリン処理時における指数関数的サイレンシング速度と、ドキシサイクリン除去の後における指数関数的減衰(又は再活性化)とを伴い、細胞の不可逆的サイレント百分率を一定とするプラトーに達するモデルに照らしてフィッティングした(図12C)。この手法を使用して、全て、リクルートメントアッセイ又は抑制補因子結合アッセイにより、抑制機能についての裏付けがなされている、SUMO3、MPP8に由来するChromoドメイン、CBX1に由来するChromoshadowドメイン及びSCMH1に由来するSAM_1/SPMドメイン(図18C~18F及び9)の抑制機能もまた、検証した(Changら、2011;Chupretaら、2005;Freyら、2016;Lechnerら、2000)。個々の測定値の全てによるサイレンシング速度(上記の抑制因子ヒット及び下記において論じられる他のヒットについて;図18C~18K及び9)は、5日目におけるサイレンシングのハイスループット測定値とよく相関した(R2=0.86;図12D)。これらの個別の検証は、酵母内のドキシサイクリンの非存在下において漏洩度を軽減するように操作され(Roneyら、2016)、ヒト細胞内において漏洩しないことが見出され(図19A及び19B)、哺乳動物合成生物学に有用なツールとなった、DNA結合性ドメインであるrTetRの新たな変異体(SE-G72P)を使用して実施した。この新たなrTetR変異体は、最大のドキシサイクリンリクルートメントにおいて、元のrTetRと同じサイレンシング強度を有し(図19C)、これはまた、個別の検証と、スクリーンスコアとの、高度の相関によっても証拠立てられた(図12D)。まとめると、これらの検証実験は、ハイスループットリクルートメントが、真正の抑制因子の同定及び各ドメインについての抑制強度の定量の両方に、個別のフローサイトメトリー実験と同等の精度により成功したことを裏付けた。
[実施例2]
転写を抑制する、機能未知ドメインの同定
Pfamドメインファミリーのうちの22%を超えるドメインが、機能未知ドメイン(DUF)として分類されているのに対し、他のドメインは、この分類を使用して分類されていないが、これにもかかわらず、DUFである(El-Gebaliら、2019)。これらのドメインは、認識可能な配列の保存を有するが、実験による性質決定を欠いている。このように、本明細書において記載されたハイスループットドメインスクリーンは、初期機能を、DUFと関連づける機会をもたらした。まず、DUF3669ドメインを、抑制因子ヒットとして同定し、フローサイトメトリーにより、個別に検証した(図12A~12C)。これらのDUFは、多くの抑制性転写因子を含有する遺伝子ファミリーである、KRAB亜鉛フィンガータンパク質内の天然において見出される。これと符合して、2つのDUF3669ファミリードメインのリクルートメントの後における、転写の抑制を裏付ける結果が、近年公表され(Al Chiblakら、2019)、ハイスループット結果は、この所見を、残る4つの未験DUF3669配列を含むように拡張する。HNF3のC末端ドメインである、HNF_Cは、肝細胞核因子3アルファ及び肝細胞核因子3ベータ(また、FOXA1及びFOXA2としても公知である)だけにおいて見出されるため、より特異的な名称を有するが、別のDUFである。FOXA1及びFOXA2のいずれに由来するHNF_Cドメインもまた、抑制因子ヒットとして見出された。これらのいずれも、抑制性モチーフの候補に挙げられている(Copley、2005)、FxIxxIL配列により特徴づけられた、EH1(engrailed homology 1)モチーフを含む。
転写を抑制する、機能未知ドメインの同定
Pfamドメインファミリーのうちの22%を超えるドメインが、機能未知ドメイン(DUF)として分類されているのに対し、他のドメインは、この分類を使用して分類されていないが、これにもかかわらず、DUFである(El-Gebaliら、2019)。これらのドメインは、認識可能な配列の保存を有するが、実験による性質決定を欠いている。このように、本明細書において記載されたハイスループットドメインスクリーンは、初期機能を、DUFと関連づける機会をもたらした。まず、DUF3669ドメインを、抑制因子ヒットとして同定し、フローサイトメトリーにより、個別に検証した(図12A~12C)。これらのDUFは、多くの抑制性転写因子を含有する遺伝子ファミリーである、KRAB亜鉛フィンガータンパク質内の天然において見出される。これと符合して、2つのDUF3669ファミリードメインのリクルートメントの後における、転写の抑制を裏付ける結果が、近年公表され(Al Chiblakら、2019)、ハイスループット結果は、この所見を、残る4つの未験DUF3669配列を含むように拡張する。HNF3のC末端ドメインである、HNF_Cは、肝細胞核因子3アルファ及び肝細胞核因子3ベータ(また、FOXA1及びFOXA2としても公知である)だけにおいて見出されるため、より特異的な名称を有するが、別のDUFである。FOXA1及びFOXA2のいずれに由来するHNF_Cドメインもまた、抑制因子ヒットとして見出された。これらのいずれも、抑制性モチーフの候補に挙げられている(Copley、2005)、FxIxxIL配列により特徴づけられた、EH1(engrailed homology 1)モチーフを含む。
3つのいずれもが、IRF-2BP1_2のN末端亜鉛フィンガードメイン(Childs及びGoodbourn、2003)である、インターフェロン調節因子2(IRF2)の抑制補因子である、IRF2BP1、IRF2BP2及びIRF2BPLにおいて見出された、性質決定されていないドメインは、抑制因子ヒットであった。DNA修復因子である、HERC2 E3リガーゼ内のCyt-b5ドメイン(Mifsud及びBateman、2002)は、強力な抑制因子ヒットとして検証されたが、機能的に性質決定されていない、別のドメインであった(図18G及び9)。BIN1内のSH3_9ドメインは、SH3タンパク質結合性ドメインの、大部分が性質決定されていない変異体であるが、これもまた、抑制因子として検証された(図18H及び9)。BIN1は、アルツハイマー病の危険性ともまた関連する(Nottら、2019)、Myc相互作用性タンパク質及び腫瘍抑制因子(Elliottら、1999)である。全長BIN1及びMyc結合性ドメイン欠失突然変異体のいずれも、HeLa細胞内のGal4リクルートメントアッセイにおいて、転写を抑制することが既に示されており(Elliottら、1999)、BIN1酵母ホモログであるhob1が、転写の抑制及びヒストンのメチル化と連関した(Ramalingam及びPrendergast、2007)ことは、この結果と符合する。加えて、転写因子であるTOXに由来するHMGボックスドメイン及びポリコームの構成要素であるPCGF2に由来するzf-C3HC4_2 RINGフィンガードメインの抑制活性も検証した(図18I及び18J)。最後に、DUF1087は、クロマチンリモデラーであるCHD内において見出され、そのハイスループット測定値は、スクリーン有意性閾値をわずかに下回った(図12A)が、CHD3 DUF1087を、個別のフローサイトメトリーにより、弱い抑制因子として検証した(図12B及び12C)。まとめると、これらの結果は、ハイスループットタンパク質ドメインスクリーニングが、初期機能を、DUFへと割り当て、特徴づけが不完全なドメインの機能の理解を拡張しうることを裏付けた。
[実施例3]
抑制活性が強力なランダム配列
ランダム配列は未だ、抑制活性について調べられていない。驚くべきことに、陰性対照としてデザインされた、80アミノ酸のランダム配列のうちの1つは、閾値を下回る、低度の発現レベルを有するにもかかわらず、平均log2(オフ:オン)を、4.0とする、強力な抑制因子ヒットであった。フローサイトメトリーによる、個別の検証は、この配列が、5日間にわたるリクルートメントの後に、レポーター細胞の集団を、完全にサイレンシングし、ドキシサイクリン除去の後も、2週間以下にわたる、中程度のエピジェネティックメモリーをもたらすことを確認した(図18K及び9)。1つさらなるランダム配列は、ヒット閾値をわずかに上回る抑制スコアを示した。
抑制活性が強力なランダム配列
ランダム配列は未だ、抑制活性について調べられていない。驚くべきことに、陰性対照としてデザインされた、80アミノ酸のランダム配列のうちの1つは、閾値を下回る、低度の発現レベルを有するにもかかわらず、平均log2(オフ:オン)を、4.0とする、強力な抑制因子ヒットであった。フローサイトメトリーによる、個別の検証は、この配列が、5日間にわたるリクルートメントの後に、レポーター細胞の集団を、完全にサイレンシングし、ドキシサイクリン除去の後も、2週間以下にわたる、中程度のエピジェネティックメモリーをもたらすことを確認した(図18K及び9)。1つさらなるランダム配列は、ヒット閾値をわずかに上回る抑制スコアを示した。
[実施例4]
抑制性KRABドメインは、より近年のタンパク質内において見出される
データは、最大の転写因子ファミリー:KRABドメイン内において、全てのエフェクタードメインの機能を解析する機会をもたらした。KRAB遺伝子ファミリーは、最強の公知の抑制ドメイン(ZNF10内のKRABなど)の一部を示した。抑制性KRABドメインのサブセットについての先行研究は、これらが、抑制補因子であるKAP1と相互作用し、KAP1が、SETDB1及びHP1などのクロマチン調節因子と相互作用することにより転写を抑制しうることを明らかにした(Chengら、2014)。しかし、KRABドメインのうちのどれほど多くが抑制因子であり、KAP1のリクルートメントが、全てのKRABにわたる抑制に必要又は十分であるのかどうかは不明である。
抑制性KRABドメインは、より近年のタンパク質内において見出される
データは、最大の転写因子ファミリー:KRABドメイン内において、全てのエフェクタードメインの機能を解析する機会をもたらした。KRAB遺伝子ファミリーは、最強の公知の抑制ドメイン(ZNF10内のKRABなど)の一部を示した。抑制性KRABドメインのサブセットについての先行研究は、これらが、抑制補因子であるKAP1と相互作用し、KAP1が、SETDB1及びHP1などのクロマチン調節因子と相互作用することにより転写を抑制しうることを明らかにした(Chengら、2014)。しかし、KRABドメインのうちのどれほど多くが抑制因子であり、KAP1のリクルートメントが、全てのKRABにわたる抑制に必要又は十分であるのかどうかは不明である。
ライブラリーは、335のヒトKRABドメインを含み、発現良好ドメインについてのフィルタリングの後に、92.1%を、抑制因子ヒットとして見出した。9つのヒット抑制性KRABドメイン及び2つのヒットなしKRABドメインを、フローサイトメトリーにより個別に検証し、あらゆる場合に、これらの類別化を確認した(図19D)。次いで、ドメインリクルートメントの結果を、全長KRABタンパク質プルダウンから生成された、既に公表されている免疫沈降質量分析データ(Helleboidら、2019)と比較したところ、1つを除く非抑制性KRABの全ては、KAP1と相互作用しないタンパク質内にあり(1つの例外的KRABは、発現が低度であった)、ヒット抑制性KRABドメインの全ては、KAP1相互作用性であった(p<1×10-9;フィッシャーの正確検定;図2)。さらに、利用可能なChiP-seqデータセット及びChIP-exoデータセットを解析した(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)ところ、抑制性KRABドメインは、非抑制性KRABドメインと対称的に、KAP1と共局在化する、KRAB亜鉛フィンガータンパク質に由来した(図2)。
興味深いことに、抑制性KRABドメインが、大半が、KRABドメイン及び亜鉛フィンガーアレイだけからなる、極めて単純なドメインアーキテクチャーを伴うタンパク質内において見出されたのに対し、非抑制性KRABドメインは、大半が、DUF3669ドメイン又はSCANドメインもまた含む遺伝子内において見出された(図2)。実際、DUF3669含有遺伝子内において、1つのKRABである、ZNF783だけが、抑制因子であった。ZNF783は、亜鉛フィンガーアレイを固有な形において欠く(その名称にもかかわらず)、性質決定されていないDUF3669-KRAB含有遺伝子であり、これが、そのエフェクター機能及び標的へと局在化する、その方式の両方において、この転写因子のクラスの間において、顕著に異なることを示唆する。
SCAN又はDUF3669を含んだ、複合ドメインアーキテクチャーは、進化年代が古いKRAB遺伝子内において、より一般的である(Imbeaultら、2017)。本実施例において、KRAB遺伝子の進化年代と、KRABの抑制強度との間の明確な関係が観察され、有袋類-ヒトに共通の祖先以前に遡る遺伝子に由来するKRABドメインは、抑制活性を有さず、この後において進化した遺伝子に由来するKRABドメインは、これに符合して、強い抑制因子として機能する(図2)。まとめると、これらの結果は、旧世代の非抑制性KRAB遺伝子に、KAP1をリクルートして、ゲノム標的をサイレンシングする、抑制性KRAB遺伝子の、より後世代における大規模な拡大が後続するモデルを裏付ける。
[実施例5]
遺伝子サイレンシングをモジュレートする突然変異を同定する、CRISPRi ZNF10 KRABエフェクターについての高深度突然変異スキャン
ZNF10に由来するKRABドメインは、遺伝子抑制のための合成生物学適用において、広範に使用されており、CRISPR干渉として公知である、プログラム可能なエピジェネティック/転写制御ツールにおいて、dCas9へと融合している(Gilbertら、2014)。その配列-機能関係を、よりよく理解するために、ハイスループットリクルートメントを使用して、このKRABドメインについての高深度突然変異スキャン(DMS)を実施した。全ての可能な単一置換並びに全ての連続二重置換及び三重置換を伴うライブラリーをデザインした(図3)。シーケンシングリードを、明確にアライメントする能力を改善するために、DNA配列が、アミノ酸配列より大きな固有性を有するように、可変的コドン使用を使用して、サイレントバーコードを、ドメインのコード配列内に実装した(図3)。図1におけるレポーター及びワークフローを使用して、ハイスループットリクルートメント:5日間にわたるドキシサイクリン誘導並びに5、9及び13日目における、オン細胞と、オフ細胞との磁性分離を実施した(図20A及び10)。これらの測定は、高度に再現可能であり、予測された通り、突然変異の長さが、単一から三重へと増大するのに伴い、有害性を増大させる、一般的傾向を示した(図20B及び10)。さらに、これらの結果を、KRABアミノ酸の保存と比較したところ、保存と、突然変異の有害性との間において、目覚ましい相関が見出された(図3)。同定されたKRAB抑制性突然変異体についてのアミノ酸配列及び核酸配列を、表3に示す。各抑制性突然変異体のスコアを、野生型配列についての0と比べて示すと、高スコアは、KRAB転写の抑制の増強を表す。
遺伝子サイレンシングをモジュレートする突然変異を同定する、CRISPRi ZNF10 KRABエフェクターについての高深度突然変異スキャン
ZNF10に由来するKRABドメインは、遺伝子抑制のための合成生物学適用において、広範に使用されており、CRISPR干渉として公知である、プログラム可能なエピジェネティック/転写制御ツールにおいて、dCas9へと融合している(Gilbertら、2014)。その配列-機能関係を、よりよく理解するために、ハイスループットリクルートメントを使用して、このKRABドメインについての高深度突然変異スキャン(DMS)を実施した。全ての可能な単一置換並びに全ての連続二重置換及び三重置換を伴うライブラリーをデザインした(図3)。シーケンシングリードを、明確にアライメントする能力を改善するために、DNA配列が、アミノ酸配列より大きな固有性を有するように、可変的コドン使用を使用して、サイレントバーコードを、ドメインのコード配列内に実装した(図3)。図1におけるレポーター及びワークフローを使用して、ハイスループットリクルートメント:5日間にわたるドキシサイクリン誘導並びに5、9及び13日目における、オン細胞と、オフ細胞との磁性分離を実施した(図20A及び10)。これらの測定は、高度に再現可能であり、予測された通り、突然変異の長さが、単一から三重へと増大するのに伴い、有害性を増大させる、一般的傾向を示した(図20B及び10)。さらに、これらの結果を、KRABアミノ酸の保存と比較したところ、保存と、突然変異の有害性との間において、目覚ましい相関が見出された(図3)。同定されたKRAB抑制性突然変異体についてのアミノ酸配列及び核酸配列を、表3に示す。各抑制性突然変異体のスコアを、野生型配列についての0と比べて示すと、高スコアは、KRAB転写の抑制の増強を表す。
ZNF10 KRABエフェクターは、3つの構成要素:KAP1への結合に必要であるAボックス(Pengら、2009)、KAP1への結合を強化する考えられるBボックス(Pengら、2007)及び天然において、KRABドメインの上流の、別個のエクソン上に見出されるN末端伸長部を有する(図3)。Aボックス内の多数の位置における突然変異は、抑制活性を、野生型配列と比べて、劇的に低下させた(図3)。これらの突然変異のうちのいくつかはCOS細胞内及び3T3細胞内におけるCATリクルートメントアッセイにより、既に調べられており;それらのデータは、K562細胞内の、高深度突然変異スキャンによる測定値と、よく相関した(図3)。KRAB Aボックスの突然変異体内における、サイレンシング機能の完全な欠如もまた、個別に検証した(図3)。Aボックスにわたる突然変異の影響が、周期的であると考えられることは、アルファヘリックスに沿った、これらの残基の角度が、機能的に関与性であることを示唆する(図3)。これらの残基を、サイレンシングに必要な残基であると指定し(p<1×10-5;5日目において、全ての置換の分布を、野生型に対して比較するウィルコクソンランクサム検定)、Aボックス内の突然変異の影響が大きい、12の必要な残基と、Bボックス内の影響が有意であるが、弱い、1つの残基を見出した(図3)。
これらの置換を、アライメントされたマウスKRAB Aボックス構造(PDB:1v65:Aボックス[V13~Y54]内における同一性が55%であり、類似性が69%である;図20C及び10)へとマッピングし、必要な残基は、3D空間内の配向性が同様であることが見出されたことは、結合インターフェースを示唆する(図3及び20D;赤色;並びに図10)。これらの残基は、これらのAボックス残基12のうち、10残基は、必要な残基のうちの12全てを含有する領域(赤色のKRAB-O残基;図20C及び10)内の、ZNF10 KRABの12~71(50%の同一性、75%の類似性)に照らしてアライメントされる、KRAB-Oを使用する、以前の組換えタンパク質結合アッセイ(Pengら、2009)において、KAP1への結合を容易とすることが、実際に示されたので、KAP1への結合に重要でありうる。結合に不要であることが既に見出されている、残る8残基のうちの8残基はまた、DMSにおいても、抑制に不要であった(p<1×10-4;フィッシャーの正確検定;グレーKRAB-O残基;図20C及び10)。5日目におけるDMSサイレンシングスコアを、結合アッセイにおいて使用された、個々の単一アラニン置換、二重アラニン置換及び三重アラニン置換について精査したところ、完全な一致が見出された:結合を剥離させた突然変異はまた、サイレンシングも失効化させ(野生型分布と比較したZスコア<-4)、結合に影響を及ぼさない突然変異はまた、サイレンシングにも影響を及ぼさなかった(|Zスコア|<0.6)(p<0.01;突然変異のn=12;フィッシャーの正確検定)。この高度の検証率及び3D構造内のそれらの位置は、DMSによる、残る12の、必要なAボックス残基のうち、2残基(V41及びN45)がまた、KAP1への結合にも関与しうることを示唆する。
Aボックスと対称的に、Bボックスの突然変異は、リクルートメントの終了時(5日目)において、比較的小さな影響を示し、統計学的に有意な、1つの位置(P59)だけが、一貫した影響であるが、弱い影響を示した。他方、P59及び他の4つの位置(K58、I62、L65、E66)は、9日目に測定された通り、ドキシサイクリン除去の後、メモリーに対する有意な影響を示した(図3)。4つの有意な位置について、個別の検証を実施したところ、ハイスループット実験における通り、Bボックスの突然変異体は、リクルートメントの5日後において、強力な遺伝子サイレンサーであったが、ドキシサイクリンの放出後において、メモリーの低減を示した(図3及び20E及び10)。この結果を解釈するために、サイレンシングされた細胞は、「不可逆的サイレント」状態に入る前に、「可逆的サイレント」状態を通過するという、かつて提起された遺伝子サイレンシングモデル(Bintuら、2016)を検討した。Bボックス突然変異体のメモリー低減は、5日目までに不可逆的サイレント状態にコミットする、少数の細胞を結果としてもたらす、中程度のサイレンシング速度低減の結果であることが可能であり、5日目において、可逆的サイレント細胞と、不可逆的サイレント細胞とは、識別不可能であるため、突然変異の、サイレンシング速度に対する影響は遮蔽されたということでありうる。リクルートメント強度を下方に微調整して、この可能性について調べるために、サイレンシングの時間経過を、100分の1の低用量ドキシサイクリンにより反復した。このレジメにおいて、Bボックスの突然変異は、5日目以前に、サイレンシング速度を低減した(図20E及び10)。この結果は、Bボックスが、KRABサイレンシング速度に対して、部分的に寄与していることを示す。
最後に、KRABのN末端は、多くの置換が、サイレンシングを、野生型と比べて、一貫して増強する残基を含有した(図3;青色;13日目のパネル)。特に、8位におけるトリプトファンの、ほぼ全ての置換は、13日目(大半のダイナミックレンジが、野生型を上回るレベルのサイレンシングを検出する時点である)において、野生型と比べた、サイレンシング細胞数の増大をもたらした。これは、サイレンシングを増強するための、唯一の有意な位置であった(図3)。これらの突然変異体のうち、ランク付けが最高度である2つ(WSR8EEE及びAW7EE)について、メモリー増強を、高量ドキシサイクリンリクルートメントにより個別に検証した(図3及び20E及び10)。
このサイレンシングの増強は、KRABタンパク質発現レベルの増強の結果でありうる。タンパク質の発現レベルと、KRABのサイレンシング強度との関係について探索するために、KAP1結合性KRABドメインのセットについて、ハイスループットFLAGタグ発現レベル測定値を精査し、13日目において、KRABの発現レベルと、サイレンシングとの有意な相関を見出した(r2=0.49、図20F及び10)。ZNF10 KRABが、13日目において、高度のサイレンシングレベルを示した、他のKRABドメインと比較して、発現レベルが低度であったことは、高深度突然変異スキャン結果と、極めて大きく関与し、この結果が、突然変異を介して改善されうることを含意する。とりわけ、N末端は、極めて保存不良であり(図3)、このことが、BLASTにより、実際に、ZNF10に由来するKRAB内において、固有に見出されたことは、N末端における、安定性を改善する突然変異が、KRAB機能に干渉しそうにないことを示唆する。加えて、ドメイン発現の全体にわたり、発現レベルと負に相関するドメイン内において、高トリプトファン(W)頻度を観察したのに対し、発現レベルと正に相関するドメイン内において、高グルタミン酸(E)頻度を観察した(図20G及び10)。このアミノ酸組成の傾向は、KRABの8位からの、トリプトファンの置換による除去が、そのエフェクター機能を増強し、この増強は、グルタミン酸により置換する場合に、最も顕著であったので、N末端のKRAB突然変異体の増強は、発現レベルの改善に起因しうることをさらに示唆した。ZNF10 KRAB変異体についてのウェスタンブロットは、N末端のグルタミン酸置換突然変異体が、野生型より高度に発現されることを確認した(図20H及び10)。まとめると、これらの結果は、高深度突然変異スキャンの使用が、ヒト転写抑制因子について、配列を、機能と対比してマッピングし、かつ、発現増強置換を、保存不良位置へと組み込むことにより、エフェクターを改善することを裏付けた。
[実施例6]
ホメオドメイン抑制強度は、Hox遺伝子の編成と共直線性である
スクリーンにおいて、抑制因子ヒットを含んだ、2番目に大きなドメインファミリーは、ホメオドメインファミリーであった。ホメオドメインは、3つのヘリックスから構成され、ヘリックス3を介して、塩基を接触させる、配列特異的DNA結合性ドメインである(Lynchら、2006)。場合によって、ホメオドメインはまた、抑制因子として作用することも公知でもある(Hollandら、2007;Schnabel及びAbate-Shen、1996)。ライブラリーは、216のヒト遺伝子に由来するホメオドメインを含み、26%は、抑制因子ヒットであった。抑制因子は、ホメオドメインの11のサブクラス中4つのサブクラス:PRD、NKL、HOXL及びLIMにおいて見出された(図13A)。これらのリクルートメントアッセイ結果は、転写の抑制が、ホメオドメイン転写因子の、遍在的な機能ではないにせよ、広範にわたりうる機能であることを示唆した。
ホメオドメイン抑制強度は、Hox遺伝子の編成と共直線性である
スクリーンにおいて、抑制因子ヒットを含んだ、2番目に大きなドメインファミリーは、ホメオドメインファミリーであった。ホメオドメインは、3つのヘリックスから構成され、ヘリックス3を介して、塩基を接触させる、配列特異的DNA結合性ドメインである(Lynchら、2006)。場合によって、ホメオドメインはまた、抑制因子として作用することも公知でもある(Hollandら、2007;Schnabel及びAbate-Shen、1996)。ライブラリーは、216のヒト遺伝子に由来するホメオドメインを含み、26%は、抑制因子ヒットであった。抑制因子は、ホメオドメインの11のサブクラス中4つのサブクラス:PRD、NKL、HOXL及びLIMにおいて見出された(図13A)。これらのリクルートメントアッセイ結果は、転写の抑制が、ホメオドメイン転写因子の、遍在的な機能ではないにせよ、広範にわたりうる機能であることを示唆した。
次いで、HOXLサブクラスについての結果を、より克明に精査した。このサブクラスは、細胞運命の主要な調節因子であり、胚発生時に、前後軸に沿って、体制領域を指定する、39のホメオドメイン転写因子のうちのサブセットである、Hox遺伝子を含有した。これらの遺伝子は、前後軸に沿った、それらの発現の時間的順序及び空間的パターン化に対応して、3’から5’へと共直線的に配置された、4つのHoxパラログクラスター(A~D)内に見出される(Gilbert、1971)。興味深いことに、それらのホメオドメインの抑制強度はまた、5’側の遺伝子ホメオドメインほど、強力な抑制因子であるように、Hoxクラスター内における、それらの配置とも共直線性であった(スピアマンによるρ=0.82;図13B)。この相関は、ホメオドメイン抑制機能と、Hox遺伝子発現のタイミング及び前後軸に沿った空間的パターン化との、可能な連関を示唆した。
Hoxホメオドメインの複数の配列アライメントは、11の最も強力な抑制ドメイン内のN末端アームに存在するRKKR(配列番号1330)モチーフを明らかにした(図13C)。RKKRモチーフが、塩基の文脈において、最も強力な抑制因子内に存在するのに対し、ランク付けが低位のドメインも、RKKRモチーフは欠くが、抑制強度と、正帯電アミノ酸であるアルギニン及びリシンの数との、有意な相関を結果としてもたらす、無秩序N末端アーム内の一部の塩基をやはり含有した(R2=0.85、図13C~13E)。
Hoxホメオドメインの外部において、Pfam核タンパク質ドメインライブラリー内の抑制因子ヒットのうちの99.5%が、RKKR(配列番号1330)モチーフを含有しなかったのに対し、多くのヒットなしドメインは、RKKRモチーフを含有した。また、ドメインの全ライブラリーを検討したところ、5日目における、正味のドメイン電荷と、抑制強度との相関も見られなかった(R2=0.04)。まとめると、これらの結果は、リクルートメントアッセイにおいて、RKKR(配列番号1330)モチーフ及び電荷が、Hoxホメオドメインの抑制に寄与するが、他のドメインの文脈において見出された場合の抑制には十分でないことを示唆した。
[実施例7]
最小プロモーターへのハイスループットリクルートメントによる、転写活性化因子の発見
弱い最小CMV(min CMV)プロモーターを伴うレポーターK562細胞系は、rTetRと、活性化ドメインとの融合体が、リクルートされると活性化されうることが確立された(図14A)。活性化因子スクリーンを実施するために、レンチウイルスを使用して、核Pfamドメインライブラリーを、これらのレポーター細胞へと送達し、ドキシサイクリンにより、48時間にわたり、rTetR媒介リクルートメントを誘導し、細胞(図21A)を、磁性的に分離し、結果として得られる2つの細胞集団内のドメインをシーケンシングした。各ドメインについて、ビーズ結合集団(オン)内のシーケンシングカウントと、非結合集団(オフ)内のシーケンシングカウントとのエンリッチメント比を、転写活性化強度の尺度として計算し、発現不良陰性対照の平均値を、2標準偏差超えたドメインをヒットとした(図14B)。ヒットは、ライブラリー内に存在する、3つの既に公知の転写活性化ドメインファミリー:FOXO1/3/6に由来するFOXO-TAD、Myb/Myb-Aに由来するLMSTEN及びCRTC1/2/3に由来するTORC_Cを含んだ。ヒットについての活性化強度の測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった(r2=0.89、図14B)。短鎖核ドメインライブラリーによる、この第2のスクリーンは、ハイスループットリクルートメントが、レポーターのプロモーターを変化させることにより、活性化又は抑制を測定するのに使用されうることを確立した。核Pfamドメインライブラリー内において同定された活性化因子についてのアミノ酸配列及び核酸配列を、表2に示すが、低値のスコアは、強力な活性化因子を指し示した。
最小プロモーターへのハイスループットリクルートメントによる、転写活性化因子の発見
弱い最小CMV(min CMV)プロモーターを伴うレポーターK562細胞系は、rTetRと、活性化ドメインとの融合体が、リクルートされると活性化されうることが確立された(図14A)。活性化因子スクリーンを実施するために、レンチウイルスを使用して、核Pfamドメインライブラリーを、これらのレポーター細胞へと送達し、ドキシサイクリンにより、48時間にわたり、rTetR媒介リクルートメントを誘導し、細胞(図21A)を、磁性的に分離し、結果として得られる2つの細胞集団内のドメインをシーケンシングした。各ドメインについて、ビーズ結合集団(オン)内のシーケンシングカウントと、非結合集団(オフ)内のシーケンシングカウントとのエンリッチメント比を、転写活性化強度の尺度として計算し、発現不良陰性対照の平均値を、2標準偏差超えたドメインをヒットとした(図14B)。ヒットは、ライブラリー内に存在する、3つの既に公知の転写活性化ドメインファミリー:FOXO1/3/6に由来するFOXO-TAD、Myb/Myb-Aに由来するLMSTEN及びCRTC1/2/3に由来するTORC_Cを含んだ。ヒットについての活性化強度の測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった(r2=0.89、図14B)。短鎖核ドメインライブラリーによる、この第2のスクリーンは、ハイスループットリクルートメントが、レポーターのプロモーターを変化させることにより、活性化又は抑制を測定するのに使用されうることを確立した。核Pfamドメインライブラリー内において同定された活性化因子についてのアミノ酸配列及び核酸配列を、表2に示すが、低値のスコアは、強力な活性化因子を指し示した。
26のドメインファミリーに由来する、合計48のヒットを見出した。上記の、3つの公知の活性化ドメインファミリーを越えると、活性化性ヒットを伴う、残りのファミリーは、Pfam上において、未だ、活性化ドメインとしてアノテーションされていなかった(図14C)。全体として、抑制因子より少数の活性化因子を見出したが、これは、単純に、活性化因子が、しばしば、Pfamドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることが多い(Liuら、2006)ためでありうる。しかし、活性化ドメインを含有するタンパク質は、「転写の正の調節」などの遺伝子オントロジータームについて、有意にエンリッチされ、最も強力なエンリッチメントは、「シグナル伝達」についてであったが、これは、それらの供給源タンパク質のうちの多くが、活性化因子であることを反映する(図21B)。さらに、ヒットは、活性化ドメイン内の共通の特性である(Mitchell及びTjian、1989;Stallerら、2018)が、ヒットなしより、有意に酸性度が強かった(p≦1×10-5;マンホイットニー検定;図14D)。
いくつかのヒットは、古典的活性化ドメインが予測された、配列特異的転写因子を供給源とはせず、活性化補因子と、Med9、TFIIEβ及びNCOA3を含む転写機構タンパク質とに由来する、非古典的活性化因子を供給源とした。特に、そのオーソログが、酵母内の、他のメディエーター複合体構成要素に直接結合する、Med9ドメイン(Takahashiら、2009)は、その弱い発現レベルにもかかわらず、平均log2(オフ:オン)を、-5.5とする、強い活性化因子であった。非古典的活性化因子は、酵母内において、個別に働くことが、既に報告されている(Gaudreauら、1999)が、哺乳動物細胞内において、個別にリクルートされた場合、弱く働くに過ぎない(Nevadoら、1999)。1つの例外は、TATA結合性タンパク質である(Dorris及びStruhl、2000)。より多くの非古典的配列をスクリーニングすることにより、この概念に対する、より多くの例外を見出した。
全ての被験ドメインについて、ライブラリーから伸長した80アミノ酸の配列及びトリミングされたPfamアノテーションドメインとの両方を使用して、レポーター遺伝子のドキシサイクリン依存性活性化を確認した(図21C)。既にアノテーションされているFOXO-TAD及びLMSTENは、それらの伸長形及びトリミング形のいずれにおいても、強い活性化因子であった。転写因子EGR3に由来するDUF3446及びSWI/SNFファミリーのSMARCA2タンパク質に由来し、大部分が性質決定されていない、QLQドメインの活性化機能もまた確認した。さらに、Dpy-30タンパク質内において見出されたDUFである、Dpy-30モチーフドメインが、弱い活性化因子であることも確認された。Dpy-30は、転写活性クロマチン領域と関連するクロマチンマーク(Simsら、2003)である、H3K4me3と表記される、ヒストンメチルトランスフェラーゼ複合体のコアサブユニット(Hyunら、2017)であった。合計11のヒットドメイン(非古典的ヒットである、Med9及びNCOA3に由来するNuc_rec_co-actを含む)を調べ、ライブラリーから伸長した80アミノ酸の配列を使用した場合、全てが、レポーターを、有意に活性化させることを見出した。まとめると、スクリーン及び検証は、不偏核タンパク質ドメインライブラリーが、顕著に異なる機能を伴うドメインを明らかにする、生産的な再スクリーニングが可能であり、古典的活性化ドメインを越える(かつ、DUFを含む)ドメインの多様なセットが、リクルートされると、転写を活性化させうることを裏付けた。
[実施例8]
KRAB活性化ドメインの発見
驚くべきことに、ライブラリー内の、最も強力な活性化因子は、ZNF473に由来するKRABドメインであった(図5B)。他の3つのKRABドメイン(ZFP28、ZNF496及びZNF597に由来する)もまた、活性化性ヒットであり、これらの全ては、安定的に発現され、抑制因子ではなかった。ZNF496に由来する、これらのドメインのうちの1つは、HT1080細胞内において個別にリクルートされた場合に、活性化因子として、既に報告されていた(Losson及びNielsen、2010)。興味深いことに、ZFP28は、2つのKRABドメインを含有するが、KRAB_1は、抑制因子であり、KRAB_2は、活性化因子であった。全長ZFP28に対して実施された、既存のアフィニティー精製/質量分析は、抑制性タンパク質及び活性化性タンパク質の両方との、有意な相互作用を同定した(Schmitgesら、2016)。活性化性KRABドメインは、非活性化性KRABより、有意に強く酸性であった(p=0.01、マンホイットニー検定、図14D)。配列解析は、活性化性KRABドメインが、互いに対する相同性を共有する一方、コンセンサスのKRAB配列から分岐的であり、変異体KRABサブクラスターを形成することを示した(図14E)。既存の系統発生的解析は、変異体KRABクラスターを、KAP1への結合の欠如及び進化年代の古さと連関させた(Helleboidら、2019)。より具体的に、活性化性KRAB供給源タンパク質のうちの2つ(ZNF496及びZNF597)は、共免疫沈降質量分析により、既に調べられたが、KAP1と相互作用することは見出されなかった(Helleboidら、2019)。
KRAB活性化ドメインの発見
驚くべきことに、ライブラリー内の、最も強力な活性化因子は、ZNF473に由来するKRABドメインであった(図5B)。他の3つのKRABドメイン(ZFP28、ZNF496及びZNF597に由来する)もまた、活性化性ヒットであり、これらの全ては、安定的に発現され、抑制因子ではなかった。ZNF496に由来する、これらのドメインのうちの1つは、HT1080細胞内において個別にリクルートされた場合に、活性化因子として、既に報告されていた(Losson及びNielsen、2010)。興味深いことに、ZFP28は、2つのKRABドメインを含有するが、KRAB_1は、抑制因子であり、KRAB_2は、活性化因子であった。全長ZFP28に対して実施された、既存のアフィニティー精製/質量分析は、抑制性タンパク質及び活性化性タンパク質の両方との、有意な相互作用を同定した(Schmitgesら、2016)。活性化性KRABドメインは、非活性化性KRABより、有意に強く酸性であった(p=0.01、マンホイットニー検定、図14D)。配列解析は、活性化性KRABドメインが、互いに対する相同性を共有する一方、コンセンサスのKRAB配列から分岐的であり、変異体KRABサブクラスターを形成することを示した(図14E)。既存の系統発生的解析は、変異体KRABクラスターを、KAP1への結合の欠如及び進化年代の古さと連関させた(Helleboidら、2019)。より具体的に、活性化性KRAB供給源タンパク質のうちの2つ(ZNF496及びZNF597)は、共免疫沈降質量分析により、既に調べられたが、KAP1と相互作用することは見出されなかった(Helleboidら、2019)。
ライブラリー内において使用されたKRABドメインを中心とする、同じ80アミノ酸の配列を使用して、ZNF473に由来するKRABが、強力な活性化因子であり、ZFP28に由来するKRAB_2が、強度が中程度の活性化因子であることが個別に検証された(図14F)。さらに、ZNF473からトリミングされた、41アミノ酸のKRABが、強力な活性化のために十分であるのに対し、ZFP28からトリミングされた、37アミノ酸のKRAB_2は、活性化させなかったことは、周囲の配列の一部が、活性化に要求されたことを含意する(図21C)。次いで、利用可能なChiP-seqデータセット及びChIP-exoデータセットを精査したところ、(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)抑制性ZNF10と対称的に、ZNF473は、活性クロマチンマークである、H3K27acと共局在化することが見出された(図14G)。手作業により精査したところ、遺伝子(CASC3、STAT6、WASF2、ZKSCAN2)の転写開始部位及びlncRNA(LINC00431)の近傍において、最も著明なZNF473ピークを見出した。一方、ZFP28は、H3K27acと共局在化しなかったが、これはおそらく、そのKAP1結合性抑制性KRAB_1ドメインが、一般に、強度が中程度である、その活性化性KRAB_2ドメインを上回る、主要なエフェクターであったことを指し示す。これらの個々のKRABタンパク質を越えて検討すると、抑制性KRABを含有する亜鉛フィンガータンパク質が、H3K27acと共局在化しなかったのに対し、群としての非抑制性KRABタンパク質は、共局在化ピークを、確かに含んだ(図14G)。まとめると、結果は、変異体KRABタンパク質が、機能的に多様であり、場合により、転写活性化因子としても機能することを裏付ける。
[実施例9]
タイリングライブラリーは、核タンパク質の、非アノテーション領域内のエフェクタードメインを明らかにする
Pfamアノテーションは、核プロテオームをフィルタリングして、比較的コンパクトなライブラリーを作出する、1つの有用な手段をもたらしたが、Pfamは、現在のところ、ヒトエフェクタードメインのうちの多くを逸失する可能性が高い。タンパク質の非アノテーション領域内において、エフェクタードメインを発見するために、サイレンサー複合体に由来する238のタンパク質のリストをキュレーションし、それらの配列を、10アミノ酸のタイリングウィンドウにより隔てられた、80アミノ酸によりタイリングすることにより、タイリングライブラリーをデザインした(図15A)。強力なpEFレポーターへのハイスループットリクルートメントを実施し、5日間にわたるドキシサイクリンの後に、サイレンシングを測定する時点を設定し、13日目(ドキシサイクリンを放出した8日後)に、再度、エピジェネティックメモリーを測定する時点を設定した(図22A)。タイルのうちの4.3%は、5日目において、ヒットとして評定され(図15B)それらの抑制強度測定は、再現可能であった(r2=0.72、図22B)。まとめると、タイリングスクリーンは、タンパク質238例中141例において、短鎖抑制ドメインを見出した。これらのヒットのうちの一部は、アノテーションドメインに重複する陽性対照を含む:例えば、ZNF57及びZNF461をタイリングすることにより、これらの転写因子のKRABドメインを、抑制性エフェクターとして同定したが、配列の残りの部分は、抑制性エフェクターとして同定しなかった(図22C)。同様に、タイリング戦略は、Pfamによりアノテーションされた、RYBP抑制性ドメインを同定し、個別の検証においても、80アミノ酸のタイル及び32アミノ酸Pfamドメインのいずれもが、同様の強度及びエピジェネティックメモリーを伴って、サイレンシングした(図22D)。REST(CoREST結合性ドメインと重複する(Ballasら、2001))、DNMT3b(DNMT1結合性ドメイン及びDNMT3a結合性ドメインと重複する(Kimら、2002))及びCBX7(PRC1をリクルートするPcBoxと重複する(Liら、2010))における抑制因子もまた、同定及び検証した(図22E~22G)。タイリングヒットについての、別のカテゴリーは、Pfam内のドメインとしてアノテーションされていなかったが、文献において、それらの抑制機能についての以前の報告が見出された。例えば、CTCFのアミノ酸121~220は、スクリーンにおいて、強い抑制機能を有し、個別に検証したところ(図15C及び15E)、HeLa細胞、HEK293細胞及びCOS-7細胞における、以前のリクルートメント研究と符合した(Drueppelら、2004)。まとめると、これらの結果は、タンパク質タイルのハイスループットリクルートメントが、真正の抑制性ドメインを同定する有効な戦略であることを確立した。タイリングライブラリーにおいて同定された抑制因子についてのアミノ酸配列を、表4に示すが、高スコアは、高度の抑制を指し示す。
タイリングライブラリーは、核タンパク質の、非アノテーション領域内のエフェクタードメインを明らかにする
Pfamアノテーションは、核プロテオームをフィルタリングして、比較的コンパクトなライブラリーを作出する、1つの有用な手段をもたらしたが、Pfamは、現在のところ、ヒトエフェクタードメインのうちの多くを逸失する可能性が高い。タンパク質の非アノテーション領域内において、エフェクタードメインを発見するために、サイレンサー複合体に由来する238のタンパク質のリストをキュレーションし、それらの配列を、10アミノ酸のタイリングウィンドウにより隔てられた、80アミノ酸によりタイリングすることにより、タイリングライブラリーをデザインした(図15A)。強力なpEFレポーターへのハイスループットリクルートメントを実施し、5日間にわたるドキシサイクリンの後に、サイレンシングを測定する時点を設定し、13日目(ドキシサイクリンを放出した8日後)に、再度、エピジェネティックメモリーを測定する時点を設定した(図22A)。タイルのうちの4.3%は、5日目において、ヒットとして評定され(図15B)それらの抑制強度測定は、再現可能であった(r2=0.72、図22B)。まとめると、タイリングスクリーンは、タンパク質238例中141例において、短鎖抑制ドメインを見出した。これらのヒットのうちの一部は、アノテーションドメインに重複する陽性対照を含む:例えば、ZNF57及びZNF461をタイリングすることにより、これらの転写因子のKRABドメインを、抑制性エフェクターとして同定したが、配列の残りの部分は、抑制性エフェクターとして同定しなかった(図22C)。同様に、タイリング戦略は、Pfamによりアノテーションされた、RYBP抑制性ドメインを同定し、個別の検証においても、80アミノ酸のタイル及び32アミノ酸Pfamドメインのいずれもが、同様の強度及びエピジェネティックメモリーを伴って、サイレンシングした(図22D)。REST(CoREST結合性ドメインと重複する(Ballasら、2001))、DNMT3b(DNMT1結合性ドメイン及びDNMT3a結合性ドメインと重複する(Kimら、2002))及びCBX7(PRC1をリクルートするPcBoxと重複する(Liら、2010))における抑制因子もまた、同定及び検証した(図22E~22G)。タイリングヒットについての、別のカテゴリーは、Pfam内のドメインとしてアノテーションされていなかったが、文献において、それらの抑制機能についての以前の報告が見出された。例えば、CTCFのアミノ酸121~220は、スクリーンにおいて、強い抑制機能を有し、個別に検証したところ(図15C及び15E)、HeLa細胞、HEK293細胞及びCOS-7細胞における、以前のリクルートメント研究と符合した(Drueppelら、2004)。まとめると、これらの結果は、タンパク質タイルのハイスループットリクルートメントが、真正の抑制性ドメインを同定する有効な戦略であることを確立した。タイリングライブラリーにおいて同定された抑制因子についてのアミノ酸配列を、表4に示すが、高スコアは、高度の抑制を指し示す。
アノテーションされていない、新規の抑制ドメインもまた、発見した。例えば、BAZ2A(また、TIP5としても公知である)は、一部のrDNAの転写サイレンシングを媒介する、核リモデリング複合体(NoRC)の構成要素である(Guetgら、2010)が、アノテーションエフェクタードメインを有さない。BAZ2Aについてのタイリングデータは、グルタミンリッチ領域内の抑制機能のピークを示したが、強度が中程度である抑制因子として、個別に検証された(図15D及び15E)。抑制性タイルは、3つのTETDNAデメチラーゼ(TET1/2/3)の非アノテーション領域内に見出された。予測外に、抑制因子タイルはまた、対照タンパク質であるDMD内においても同定されたが、これは、フローサイトメトリーにより検証された(図22H)。
E-ボックスモチーフにおいてゲノムに結合し、非カノニカルのポリコーム1.6複合体をリクルートすることにより、転写を抑制すると考えられる(Blackledgeら、2014;Jolmaら、2013;Stielowら、2018)MGA内において、タイリング実験は、抑制機能を伴い、2つの公知のDNA結合性ドメインに隣接して配置され、本明細書において、抑制因子1及び抑制因子2と呼ばれた、2つのドメインを明らかにした(図15F)。これらの抑制ドメインを、個別に検証し、顕著に異なるサイレンシング動態及びメモリーの程度を観察した;第1のドメイン(アミノ酸341~420)が、緩徐なサイレンシングの反面、強いメモリーを特徴としたのに対し、第2のドメイン(アミノ酸2381~2460)は、急速なサイレンシングの反面、高速の再活性化を伴う、弱いメモリーを特徴とした(図15G)。これらは、ncPRC1.6サイレンシング複合体内のタンパク質から単離された、第1のエフェクタードメインであると考えられる。
次いで、抑制機能を示すタンパク質領域をカバーする、全てのタイル内の重複を検討し、どのアミノ酸連続配列が、全ての抑制性タイル内に存在するのかを決定することにより、各非依存性ドメイン内の抑制機能に必要最小限の配列を同定しようと試みた(図15H)。この手法を使用して、MGAについての、2つの候補最小化エフェクタードメイン:いずれもが、ConSurfにより予測された機能的露出残基を伴い、保存領域内において重複した、10アミノ酸のMGA配列[381~390]と、30アミノ酸のMGA配列[2431~2460]とを生成した。個別の検証実験は、いずれの最小化候補配列も、レポーターを、効率的にサイレンシングしうることを裏付けた(図15I)。
材料及び方法
細胞株及び細胞培養
全ての実験は、K562細胞(ATCC CCL-243)において行った。細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)、ストレプトマイシン(10,000ug/mL)及びL-グルタミン(2mM)で補充されたRPMI 1640(Gibco)培地中、37℃及び5%のCO2の制御された加湿インキュベーターにおいて培養した。HEK293FT細胞及びHEK293T-LentiX細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)及びストレプトマイシン(10,000ug/mL)で補充されたDMEM(Gibco)培地中で成長させ、レンチウイルスを産生させるために使用した。レポーター細胞株を、以下の通り、TALEN媒介相同性指向修復によって作出して、AAVS1遺伝子座にドナー構築物を組み込んだ。1.2×106個のK562細胞を、1000ngのレポータードナープラスミド、並びに500ngの各TALEN-L(Addgene #35431)及びTALEN-R(Addgene #35432)プラスミド(それぞれ、意図するDNA切断部位の上流及び下流を標的にする)を有するAmaxa溶液(Lonza Nucleofector 2b、設定T0-16)中で電気穿孔した。7日後、細胞を、1000ng/mLのピューロマイシン抗生物質により5日間にわたり処理して、ドナーが意図される遺伝子座に安定に組み込まれた集団について選択し、これは、PuroR耐性遺伝子を発現するプロモーターを提供する。蛍光レポーター発現を、顕微鏡法によって、及びフローサイトメトリー(BD Accuri)によって測定した。
細胞株及び細胞培養
全ての実験は、K562細胞(ATCC CCL-243)において行った。細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)、ストレプトマイシン(10,000ug/mL)及びL-グルタミン(2mM)で補充されたRPMI 1640(Gibco)培地中、37℃及び5%のCO2の制御された加湿インキュベーターにおいて培養した。HEK293FT細胞及びHEK293T-LentiX細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)及びストレプトマイシン(10,000ug/mL)で補充されたDMEM(Gibco)培地中で成長させ、レンチウイルスを産生させるために使用した。レポーター細胞株を、以下の通り、TALEN媒介相同性指向修復によって作出して、AAVS1遺伝子座にドナー構築物を組み込んだ。1.2×106個のK562細胞を、1000ngのレポータードナープラスミド、並びに500ngの各TALEN-L(Addgene #35431)及びTALEN-R(Addgene #35432)プラスミド(それぞれ、意図するDNA切断部位の上流及び下流を標的にする)を有するAmaxa溶液(Lonza Nucleofector 2b、設定T0-16)中で電気穿孔した。7日後、細胞を、1000ng/mLのピューロマイシン抗生物質により5日間にわたり処理して、ドナーが意図される遺伝子座に安定に組み込まれた集団について選択し、これは、PuroR耐性遺伝子を発現するプロモーターを提供する。蛍光レポーター発現を、顕微鏡法によって、及びフローサイトメトリー(BD Accuri)によって測定した。
核タンパク質Pfamドメインライブラリーデザイン
UniProtデータベース(UniProt Consortium、2015)に、核を局在化し得るヒト遺伝子についてクエリを行った。UniProtにおける細胞内位置情報を、公開から、又は類似の遺伝子(例えば、オルソログ)においてのみ公開が存在する場合に「類似性によって」、決定し、手動でレビューした。次いで、Pfamアノテーションドメインを、ProDy searchPfam機能(Bakanら、2011)を使用して探索した。80アミノ酸又はそれよりも短いドメインをフィルター処理し、非常に豊富で反復性のC2H2亜鉛フィンガーDNA結合ドメインを、排除し、転写エフェクターとしての機能は予想されなかった。アノテーションドメインの配列を検索し、それを、合計80アミノ酸に到達するまでいずれかの側鎖において伸長させた。重複配列を除去し、次いで、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。終止コドンを欠く80アミノ酸の499のランダム対照を、対照として、コンピューターで作出した。DMDが転写調節因子であると思われなかったので、10アミノ酸スライディングウィンドウを有する80アミノ酸タイルにおいてDMDタンパク質をタイリングした362エレメントも、対照として含めた。合計で、ライブラリーは、5,955エレメントからなる。
UniProtデータベース(UniProt Consortium、2015)に、核を局在化し得るヒト遺伝子についてクエリを行った。UniProtにおける細胞内位置情報を、公開から、又は類似の遺伝子(例えば、オルソログ)においてのみ公開が存在する場合に「類似性によって」、決定し、手動でレビューした。次いで、Pfamアノテーションドメインを、ProDy searchPfam機能(Bakanら、2011)を使用して探索した。80アミノ酸又はそれよりも短いドメインをフィルター処理し、非常に豊富で反復性のC2H2亜鉛フィンガーDNA結合ドメインを、排除し、転写エフェクターとしての機能は予想されなかった。アノテーションドメインの配列を検索し、それを、合計80アミノ酸に到達するまでいずれかの側鎖において伸長させた。重複配列を除去し、次いで、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。終止コドンを欠く80アミノ酸の499のランダム対照を、対照として、コンピューターで作出した。DMDが転写調節因子であると思われなかったので、10アミノ酸スライディングウィンドウを有する80アミノ酸タイルにおいてDMDタンパク質をタイリングした362エレメントも、対照として含めた。合計で、ライブラリーは、5,955エレメントからなる。
サイレンサータイリングライブラリーデザイン
転写サイレンシングに関与する216タンパク質を、転写調節因子のデータベース(Lambertfら、2018)から精選した。転写サイレンシングに関与する可能性がある32タンパク質を手動で加え、次いで、不偏性タンパク質タイリングライブラリーを作出した。これを行うために、各遺伝子についてのカノニカルの転写物を、Python APIを使用して、Ensembl BioMart(Kinsellaら、2011)から検索した。カノニカルの転写物が見出されなかった場合、CDSを有する最も長い転写物を検索した。コード配列を、タイル間で、10アミノ酸スライディングウィンドウを有する80アミノ酸のタイルに分割した。各遺伝子について、C末端領域がライブラリーに含まれるように、最後の残基の80アミノ酸上流からその最後の残基に及ぶ最終タイルを含めた。重複タンパク質配列を除去し、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。361タイリング陰性対照を、以前のライブラリーデザインにおけるように含め、合計で15,737ライブラリーエレメントを得た。
転写サイレンシングに関与する216タンパク質を、転写調節因子のデータベース(Lambertfら、2018)から精選した。転写サイレンシングに関与する可能性がある32タンパク質を手動で加え、次いで、不偏性タンパク質タイリングライブラリーを作出した。これを行うために、各遺伝子についてのカノニカルの転写物を、Python APIを使用して、Ensembl BioMart(Kinsellaら、2011)から検索した。カノニカルの転写物が見出されなかった場合、CDSを有する最も長い転写物を検索した。コード配列を、タイル間で、10アミノ酸スライディングウィンドウを有する80アミノ酸のタイルに分割した。各遺伝子について、C末端領域がライブラリーに含まれるように、最後の残基の80アミノ酸上流からその最後の残基に及ぶ最終タイルを含めた。重複タンパク質配列を除去し、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。361タイリング陰性対照を、以前のライブラリーデザインにおけるように含め、合計で15,737ライブラリーエレメントを得た。
KRAB高深度突然変異スキャンライブラリーデザイン
CRISPRi(Gilbertら、2014)において使用されるZNF10 KRABドメイン配列の高深度突然変異スキャンを、全ての可能な単一置換及び同じアミノ酸の全ての連続した二重及び三重置換(例えば、AAAによる置換)を用いてデザインした。これらのアミノ酸配列を、各DNA配列が置換された残基を超えていくつかの変動を含有するように、確率コドン最適化アルゴリズムを使用して、DNA配列に逆翻訳し、これは、一意的なライブラリーメンバーに対してシーケンシングリードを明確に整列させる能力を改善する。加えて、InterProにおいて見出されるヒトKRAB由来の全てのPfamアノテーションKRABドメインを、以前の核Pfamドメインライブラリーにおけるのと類似して、含めた。以前のタイリングライブラリーにおいてデザインされたタイリング配列も、5個のKRAB亜鉛フィンガー遺伝子のために含まれた。300ランダム対照配列及びDMD遺伝子由来の200タイルを、陰性対照として含めた。コドン最適化時に、BsmBI部位は除去され、GC含有量を80ヌクレオチドウィンドウごとに30%~70%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。合計のライブラリーサイズは、5,731エレメントであった。
CRISPRi(Gilbertら、2014)において使用されるZNF10 KRABドメイン配列の高深度突然変異スキャンを、全ての可能な単一置換及び同じアミノ酸の全ての連続した二重及び三重置換(例えば、AAAによる置換)を用いてデザインした。これらのアミノ酸配列を、各DNA配列が置換された残基を超えていくつかの変動を含有するように、確率コドン最適化アルゴリズムを使用して、DNA配列に逆翻訳し、これは、一意的なライブラリーメンバーに対してシーケンシングリードを明確に整列させる能力を改善する。加えて、InterProにおいて見出されるヒトKRAB由来の全てのPfamアノテーションKRABドメインを、以前の核Pfamドメインライブラリーにおけるのと類似して、含めた。以前のタイリングライブラリーにおいてデザインされたタイリング配列も、5個のKRAB亜鉛フィンガー遺伝子のために含まれた。300ランダム対照配列及びDMD遺伝子由来の200タイルを、陰性対照として含めた。コドン最適化時に、BsmBI部位は除去され、GC含有量を80ヌクレオチドウィンドウごとに30%~70%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。合計のライブラリーサイズは、5,731エレメントであった。
ドメインライブラリークローニング
最高で300ヌクレオチドまでの長さのオリゴヌクレオチドを、プールライブラリー(Twist Biosciences)として合成し、次いで、PCR増幅した。6×50ulの反応を、混入DNAの増幅を回避するために、クリーンPCRフードにおいてセットした。各反応について、5ngの鋳型、0.1μlの各100μMのプライマー、1μlのHerculase IIポリメラーゼ(Agilent)、1μlのDMSO、1μlの10nMのdNTP及び10μlの5×Herculase緩衝液を使用した。サーモサイクリングプロトコールは、98℃で3分、次いで、98℃で20秒間、61℃で20秒間、72℃で30秒間、次いで、72℃で3分間の最終ステップのサイクルであった。デフォルトのサイクル数は29回であり、これを各ライブラリーについて最適化して、ゲル抽出のためのきれいな可視生成物をもたらす最も少ないサイクルを見出した(実際には、25サイクルが最小であった)。PCR後、得られたdsDNAライブラリーを、2%のTBEゲルの≧4レーンにローディングし、予想される長さ(300bp周辺)でバンドを切り取り、QIAgenゲル抽出キットを使用することによって、ゲル抽出した。ライブラリーを、4×10μlのGoldenGate反応(75ngの消化前のゲル抽出された骨格プラスミド、5ngのライブラリー、0.13μlのT4 DNAリガーゼ(NEB、20000U/μl)、0.75μlのEsp3I-HF(NEB)及び1μlの10×T4 DNAリガーゼ緩衝液)による37℃での30サイクルの消化により、レンチウイルスリクルートメントベクターpJT050にクローニングし、各々5分間にわたり16℃でライゲーションし、それに続いて、37℃での最後の5分の消化、次いで70℃での20分の熱失活を行った。次いで、反応をプールし、MinEluteカラム(QIAgen)により精製し、6ulのddH2Oで溶出させた。チューブあたり2μlを、製造業者の説明書に従って、2つのチューブの50μlのエレクトロコンピテントセル(Lucigen DUO)に形質転換した。回収後、細胞を、カルベニシリンを有する3~7の大型10インチ×10インチLBプレートに蒔いた。37℃での終夜成長後、細菌コロニーを、収集ボトルにかき集め、プラスミドプールを、HiSpeed Plasmid Maxiprepキット(QIAgen)により抽出した。2~3の小型プレートを、コロニーをカウントするために希釈された形質転換細胞と並行して調製し、形質転換効率が少なくとも30×ライブラリーカバレッジを維持するのに十分であったかを確認した。ライブラリーの品質を決定するために、ドメインを、プラスミドプールから、及び元のオリゴプールから、Illuminaアダプターを含む伸長を有するプライマーを用いるPCRによって増幅し、シーケンシングした。PCR及びシーケンシングのプロトコールは、これらのPCRが10ngのインプットDNA及び17サイクルを使用する以外は、ゲノムDNAからのシーケンシングについて下記に記載されるものと同じであった。これらのシーケンシングデータを、下記に記載されるようにして解析して、カバレッジの均一性及びライブラリーの合成品質を決定した。加えて、形質転換からの20~30コロニーを、サンガーシーケンシング(Quintara)して、クローニング効率及びプール中の空骨格プラスミドの割合を推定した。
最高で300ヌクレオチドまでの長さのオリゴヌクレオチドを、プールライブラリー(Twist Biosciences)として合成し、次いで、PCR増幅した。6×50ulの反応を、混入DNAの増幅を回避するために、クリーンPCRフードにおいてセットした。各反応について、5ngの鋳型、0.1μlの各100μMのプライマー、1μlのHerculase IIポリメラーゼ(Agilent)、1μlのDMSO、1μlの10nMのdNTP及び10μlの5×Herculase緩衝液を使用した。サーモサイクリングプロトコールは、98℃で3分、次いで、98℃で20秒間、61℃で20秒間、72℃で30秒間、次いで、72℃で3分間の最終ステップのサイクルであった。デフォルトのサイクル数は29回であり、これを各ライブラリーについて最適化して、ゲル抽出のためのきれいな可視生成物をもたらす最も少ないサイクルを見出した(実際には、25サイクルが最小であった)。PCR後、得られたdsDNAライブラリーを、2%のTBEゲルの≧4レーンにローディングし、予想される長さ(300bp周辺)でバンドを切り取り、QIAgenゲル抽出キットを使用することによって、ゲル抽出した。ライブラリーを、4×10μlのGoldenGate反応(75ngの消化前のゲル抽出された骨格プラスミド、5ngのライブラリー、0.13μlのT4 DNAリガーゼ(NEB、20000U/μl)、0.75μlのEsp3I-HF(NEB)及び1μlの10×T4 DNAリガーゼ緩衝液)による37℃での30サイクルの消化により、レンチウイルスリクルートメントベクターpJT050にクローニングし、各々5分間にわたり16℃でライゲーションし、それに続いて、37℃での最後の5分の消化、次いで70℃での20分の熱失活を行った。次いで、反応をプールし、MinEluteカラム(QIAgen)により精製し、6ulのddH2Oで溶出させた。チューブあたり2μlを、製造業者の説明書に従って、2つのチューブの50μlのエレクトロコンピテントセル(Lucigen DUO)に形質転換した。回収後、細胞を、カルベニシリンを有する3~7の大型10インチ×10インチLBプレートに蒔いた。37℃での終夜成長後、細菌コロニーを、収集ボトルにかき集め、プラスミドプールを、HiSpeed Plasmid Maxiprepキット(QIAgen)により抽出した。2~3の小型プレートを、コロニーをカウントするために希釈された形質転換細胞と並行して調製し、形質転換効率が少なくとも30×ライブラリーカバレッジを維持するのに十分であったかを確認した。ライブラリーの品質を決定するために、ドメインを、プラスミドプールから、及び元のオリゴプールから、Illuminaアダプターを含む伸長を有するプライマーを用いるPCRによって増幅し、シーケンシングした。PCR及びシーケンシングのプロトコールは、これらのPCRが10ngのインプットDNA及び17サイクルを使用する以外は、ゲノムDNAからのシーケンシングについて下記に記載されるものと同じであった。これらのシーケンシングデータを、下記に記載されるようにして解析して、カバレッジの均一性及びライブラリーの合成品質を決定した。加えて、形質転換からの20~30コロニーを、サンガーシーケンシング(Quintara)して、クローニング効率及びプール中の空骨格プラスミドの割合を推定した。
抑制因子活性を測定するためのハイスループットリクルートメント
大スケールのレンチウイルス産生及びK562細胞のスピンフェクションを行った。ライブラリーをK562細胞に感染させるのに十分なレンチウイルスを作出するために、HEK293T細胞を、4つの15cm組織培養プレートに蒔いた。各プレートにおいて、9×105個のHEK293T細胞を、30mLのDMEMに蒔き、終夜成長させ、次いで、50μlのポリエチレンイミン(PEI、Polysciences #23966)を使用して、8μgの3つの第三世代パッケージングプラスミドの等モル混合物及び8μgのrTetR-ドメインライブラリーベクターによりトランスフェクトした。インキュベーションの48時間及び72時間後、レンチウイルスを採取した。プールされたレンチウイルスを、0.45μmのPVDFフィルター(Millipore)を通して濾過して、任意の細胞残屑を除去した。核Pfamドメイン抑制因子スクリーンのために、4.5×107個のK562レポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を3日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり合計で少なくとも1.5×108個細胞を残すとともに、細胞濃度を元の5×105個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>25,000個細胞であった(不完全なブラストサイジン選択、ライブラリー調製、及びライブラリー合成エラーからの損失を補償する非常に高いカバレッジレベル)。感染後6日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を5日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに8日間にわたり維持し、ドキシサイクリンの添加から最長で13日目に、カウントした。2.5×108個細胞を、各時点(5日目、9日目及び13日目)に測定のために採取した。プロトコールは、KRAB DMSについてと同様であったが、ドキシサイクリンを感染後8日目に添加し、>12,500×カバレッジで、2×108~2.2×108個細胞を各時点で採取した。プロトコールは、タイリングスクリーンについてと同様であったが、9.6×107個細胞を感染させ、ドキシサイクリンを感染後8日目に添加し、少なくとも2×108個細胞を、>12,500×カバレッジのために各継代で維持し、2×108~2.7×108個細胞を各時点で採取した。
大スケールのレンチウイルス産生及びK562細胞のスピンフェクションを行った。ライブラリーをK562細胞に感染させるのに十分なレンチウイルスを作出するために、HEK293T細胞を、4つの15cm組織培養プレートに蒔いた。各プレートにおいて、9×105個のHEK293T細胞を、30mLのDMEMに蒔き、終夜成長させ、次いで、50μlのポリエチレンイミン(PEI、Polysciences #23966)を使用して、8μgの3つの第三世代パッケージングプラスミドの等モル混合物及び8μgのrTetR-ドメインライブラリーベクターによりトランスフェクトした。インキュベーションの48時間及び72時間後、レンチウイルスを採取した。プールされたレンチウイルスを、0.45μmのPVDFフィルター(Millipore)を通して濾過して、任意の細胞残屑を除去した。核Pfamドメイン抑制因子スクリーンのために、4.5×107個のK562レポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を3日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり合計で少なくとも1.5×108個細胞を残すとともに、細胞濃度を元の5×105個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>25,000個細胞であった(不完全なブラストサイジン選択、ライブラリー調製、及びライブラリー合成エラーからの損失を補償する非常に高いカバレッジレベル)。感染後6日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を5日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに8日間にわたり維持し、ドキシサイクリンの添加から最長で13日目に、カウントした。2.5×108個細胞を、各時点(5日目、9日目及び13日目)に測定のために採取した。プロトコールは、KRAB DMSについてと同様であったが、ドキシサイクリンを感染後8日目に添加し、>12,500×カバレッジで、2×108~2.2×108個細胞を各時点で採取した。プロトコールは、タイリングスクリーンについてと同様であったが、9.6×107個細胞を感染させ、ドキシサイクリンを感染後8日目に添加し、少なくとも2×108個細胞を、>12,500×カバレッジのために各継代で維持し、2×108~2.7×108個細胞を各時点で採取した。
転写活性化の活性を測定するためのハイスループットリクルートメント
核Pfamドメイン活性化因子スクリーンのために、rTetR(SE-G72P)-3XFLAGベクターにおける核Pfamライブラリーのためのレンチウイルスを、レポータースクリーンに関して作出し、3.8×107個のK562-pDY32 minCMVレポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を2日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり少なくとも1×108個の合計細胞を残すとともに、細胞濃度を元の5×105個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>18,000個細胞であった。感染後7日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を2日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに4日間にわたり維持した。2×108個細胞を、2日目の時点で測定のために採取した。フローサイトメトリーによるシトリン陽性細胞の非存在によって決定されるように、ドキシサイクリン除去後4日目に活性化メモリーの証拠はなく、その結果、さらなる時点で収集しなかった。
核Pfamドメイン活性化因子スクリーンのために、rTetR(SE-G72P)-3XFLAGベクターにおける核Pfamライブラリーのためのレンチウイルスを、レポータースクリーンに関して作出し、3.8×107個のK562-pDY32 minCMVレポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を2日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり少なくとも1×108個の合計細胞を残すとともに、細胞濃度を元の5×105個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>18,000個細胞であった。感染後7日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を2日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに4日間にわたり維持した。2×108個細胞を、2日目の時点で測定のために採取した。フローサイトメトリーによるシトリン陽性細胞の非存在によって決定されるように、ドキシサイクリン除去後4日目に活性化メモリーの証拠はなく、その結果、さらなる時点で収集しなかった。
レポーター細胞の磁気分離
各時点で、細胞を、300×gで5分間にわたりスピンダウンして、培地を吸引した。次いで、細胞を、同じ体積のPBS(Gibco)に再懸濁させ、スピンダウン及び吸引を繰り返して、細胞を洗浄し、血清から任意のIgGを除去した。Dynabeads(商標)M-280プロテインG(ThermoFisher 10003D)を、30秒間にわたるボルテックスによって再懸濁させた。2×108個細胞あたり、50mLのブロッキング緩衝液を、1グラムの無ビオチンBSA(Sigma Aldrich)及び200μlの0.5M pH8.0 EDTA(ThemoFisher 15575020)をDPBS(Gibco)に添加すること、0.22μmフィルター(Millipore)による真空濾過、及び氷上での保持によって、調製した。60μlのビーズを、200μlのビーズあたり1mLの緩衝液を添加し、5秒間にわたりボルテックスし、磁気チューブラック(Eppendorf)上に蒔き、1分間待ち、上清を除去し、最後にビーズを磁石から除去し、初期の60μlのビーズあたり100~600μlのブロッキング緩衝液に再懸濁させることによって、全て1×107個細胞について調製した。KRAB DMSのみについて、30μlのビーズを、同じ方法で、全て1×107個細胞について調製した。ビーズを、100μlの再懸濁ビーズあたり1×107個細胞以下で細胞に添加し、次いで、30分間にわたり揺り動かしながら、室温でインキュベートした。2×108個細胞を有する試料について、15mLのFalconチューブ及び大型磁気ラックにおいて、1.2mLのビーズを使用し、12mLのブロッキング緩衝液に再懸濁させた。<5×107個細胞を有する試料について、非スタックAmbion 1.5mLチューブ及び小型磁気ラックを使用した。インキュベーション後、ビーズ及び細胞混合物を、>2分間にわたり磁気ラックに置いた。未結合上清を、新しいチューブに移し、再び>2分間にわたり磁石上に置いて、任意の残ったビーズを除去し、次いで、上清を移し、未結合画分として保存した。次いで、ビーズを、同じ体積のブロッキング緩衝液に再懸濁させ、磁気的に再度分離し、上清を廃棄し、ビーズを有するチューブを、結合画分として保持した。結合画分を、ブロッキング緩衝液又はPBSに再懸濁させて、細胞を希釈した(未結合画分は既に希釈されている)。フローサイトメトリー(BD Accuri)を、各画分のごく一部を使用して行って、各画分中の細胞数を推定し(ライブラリーカバレッジが維持されるのを確実にするため)、シトリンレポーターレベルに基づいて分離を確認した(結合画分は、>90%シトリン陽性であるはずであるが、未結合画分は、レポーターレベルの初期分布に応じてより変動する)。最後に、試料をスピンダウンし、ペレットを、ゲノムDNA抽出まで-20℃で凍結させた。
各時点で、細胞を、300×gで5分間にわたりスピンダウンして、培地を吸引した。次いで、細胞を、同じ体積のPBS(Gibco)に再懸濁させ、スピンダウン及び吸引を繰り返して、細胞を洗浄し、血清から任意のIgGを除去した。Dynabeads(商標)M-280プロテインG(ThermoFisher 10003D)を、30秒間にわたるボルテックスによって再懸濁させた。2×108個細胞あたり、50mLのブロッキング緩衝液を、1グラムの無ビオチンBSA(Sigma Aldrich)及び200μlの0.5M pH8.0 EDTA(ThemoFisher 15575020)をDPBS(Gibco)に添加すること、0.22μmフィルター(Millipore)による真空濾過、及び氷上での保持によって、調製した。60μlのビーズを、200μlのビーズあたり1mLの緩衝液を添加し、5秒間にわたりボルテックスし、磁気チューブラック(Eppendorf)上に蒔き、1分間待ち、上清を除去し、最後にビーズを磁石から除去し、初期の60μlのビーズあたり100~600μlのブロッキング緩衝液に再懸濁させることによって、全て1×107個細胞について調製した。KRAB DMSのみについて、30μlのビーズを、同じ方法で、全て1×107個細胞について調製した。ビーズを、100μlの再懸濁ビーズあたり1×107個細胞以下で細胞に添加し、次いで、30分間にわたり揺り動かしながら、室温でインキュベートした。2×108個細胞を有する試料について、15mLのFalconチューブ及び大型磁気ラックにおいて、1.2mLのビーズを使用し、12mLのブロッキング緩衝液に再懸濁させた。<5×107個細胞を有する試料について、非スタックAmbion 1.5mLチューブ及び小型磁気ラックを使用した。インキュベーション後、ビーズ及び細胞混合物を、>2分間にわたり磁気ラックに置いた。未結合上清を、新しいチューブに移し、再び>2分間にわたり磁石上に置いて、任意の残ったビーズを除去し、次いで、上清を移し、未結合画分として保存した。次いで、ビーズを、同じ体積のブロッキング緩衝液に再懸濁させ、磁気的に再度分離し、上清を廃棄し、ビーズを有するチューブを、結合画分として保持した。結合画分を、ブロッキング緩衝液又はPBSに再懸濁させて、細胞を希釈した(未結合画分は既に希釈されている)。フローサイトメトリー(BD Accuri)を、各画分のごく一部を使用して行って、各画分中の細胞数を推定し(ライブラリーカバレッジが維持されるのを確実にするため)、シトリンレポーターレベルに基づいて分離を確認した(結合画分は、>90%シトリン陽性であるはずであるが、未結合画分は、レポーターレベルの初期分布に応じてより変動する)。最後に、試料をスピンダウンし、ペレットを、ゲノムDNA抽出まで-20℃で凍結させた。
ドメイン融合タンパク質発現レベルのハイスループット測定
発現レベル測定を、3×FLAGタグ付け核Pfamドメインライブラリーに感染したK562-pDY32細胞(シトリンオフを有する)において行った。生物学的反復あたり1×108個細胞を、ブラストサイジン選択(10μg/mL、Sigma)の5日後に使用し、これは、感染7日後であった。1×106個の対照K562-JT039細胞(シトリンオン、レンチウイルス感染なし)を、各反復に添加した。固定緩衝液I(BD Biosciences、BDB557870)を、37℃で15分間にわたり予熱し、透過処理緩衝液III(BD Biosciences、BDB558050)、及び10%のFBS(Hyclone)を有するPBS(Gibco)を氷上で冷やした。ドメインを発現する細胞のライブラリーを収集し、細胞密度を、フローサイトメトリー(BD Accuri)によってカウントした。固定のために、細胞を、100万個細胞あたり20μlで、37℃で10~15分間にわたり、ペレット体積に対応する体積の固定緩衝液I(BD Biosciences、BDB557870)に再懸濁させた。細胞を、1mLの10%のFBSを含有する冷PBSで洗浄し、500×gで5分間にわたりスピンダウンし、次いで、上清を吸引した。細胞を、100万個細胞あたり20μlで、ゆっくりと添加し、ボルテックスすることによって混合した冷BD透過処理緩衝液III(BD Biosciences、BDB558050)を使用して、氷上で30分間にわたり透過処理した。次いで、細胞を、これまでのように1mlのPBS+10%のFBS中で2回洗浄し、次いで、上清を吸引した。抗体染色を、α-FLAG-Alexa647(RNDsystems、IC8529R)の5μl/1×106個細胞を使用して、光から保護して、室温で1時間にわたり行った。細胞を、洗浄し、PBS+10%のFBSに3×107個細胞の濃度で再懸濁させた。細胞を、mCherry陽性生存細胞についてゲートをかけた後、APC-A蛍光(Sony SH800S)のレベルに基づいて2つのビンに分取した。少数の未染色対照細胞も、ソーターにおいて解析して、染色がバックグラウンドを上回ったかを確認した。シトリン陽性細胞の急増を使用して、3×FLAGタグを欠いていることが公知の細胞における染色のバックグラウンドレベルを評価し、分取のためにゲートをかけることで、そのレベルの上に導いた。分取後、細胞カバレッジは、試料にわたるライブラリーエレメントあたり336~1,295個細胞の範囲であった。分取された細胞を、500×gで5分間にわたりスピンダウンし、次いで、PBSに再懸濁させた。ゲノムDNA抽出を、製造業者の説明書に従って、プロテイナーゼK+AL緩衝液インキュベーションを56℃で終夜行ったという1つの改変を伴って、行った(QIAgen Blood Maxiキットを、>1×107個細胞を有する試料のために使用し、QIAamp DNA Miniキットと最高で5×106個細胞あたり1カラムを、≦1×107個細胞を有する試料のために使用した)。
発現レベル測定を、3×FLAGタグ付け核Pfamドメインライブラリーに感染したK562-pDY32細胞(シトリンオフを有する)において行った。生物学的反復あたり1×108個細胞を、ブラストサイジン選択(10μg/mL、Sigma)の5日後に使用し、これは、感染7日後であった。1×106個の対照K562-JT039細胞(シトリンオン、レンチウイルス感染なし)を、各反復に添加した。固定緩衝液I(BD Biosciences、BDB557870)を、37℃で15分間にわたり予熱し、透過処理緩衝液III(BD Biosciences、BDB558050)、及び10%のFBS(Hyclone)を有するPBS(Gibco)を氷上で冷やした。ドメインを発現する細胞のライブラリーを収集し、細胞密度を、フローサイトメトリー(BD Accuri)によってカウントした。固定のために、細胞を、100万個細胞あたり20μlで、37℃で10~15分間にわたり、ペレット体積に対応する体積の固定緩衝液I(BD Biosciences、BDB557870)に再懸濁させた。細胞を、1mLの10%のFBSを含有する冷PBSで洗浄し、500×gで5分間にわたりスピンダウンし、次いで、上清を吸引した。細胞を、100万個細胞あたり20μlで、ゆっくりと添加し、ボルテックスすることによって混合した冷BD透過処理緩衝液III(BD Biosciences、BDB558050)を使用して、氷上で30分間にわたり透過処理した。次いで、細胞を、これまでのように1mlのPBS+10%のFBS中で2回洗浄し、次いで、上清を吸引した。抗体染色を、α-FLAG-Alexa647(RNDsystems、IC8529R)の5μl/1×106個細胞を使用して、光から保護して、室温で1時間にわたり行った。細胞を、洗浄し、PBS+10%のFBSに3×107個細胞の濃度で再懸濁させた。細胞を、mCherry陽性生存細胞についてゲートをかけた後、APC-A蛍光(Sony SH800S)のレベルに基づいて2つのビンに分取した。少数の未染色対照細胞も、ソーターにおいて解析して、染色がバックグラウンドを上回ったかを確認した。シトリン陽性細胞の急増を使用して、3×FLAGタグを欠いていることが公知の細胞における染色のバックグラウンドレベルを評価し、分取のためにゲートをかけることで、そのレベルの上に導いた。分取後、細胞カバレッジは、試料にわたるライブラリーエレメントあたり336~1,295個細胞の範囲であった。分取された細胞を、500×gで5分間にわたりスピンダウンし、次いで、PBSに再懸濁させた。ゲノムDNA抽出を、製造業者の説明書に従って、プロテイナーゼK+AL緩衝液インキュベーションを56℃で終夜行ったという1つの改変を伴って、行った(QIAgen Blood Maxiキットを、>1×107個細胞を有する試料のために使用し、QIAamp DNA Miniキットと最高で5×106個細胞あたり1カラムを、≦1×107個細胞を有する試料のために使用した)。
ライブラリー調製及びシーケンシング
ゲノムDNAを、カラムあたり最高で1.25×108個細胞を用いて、Blood & Tissueキット(QIAgen)を使用して、製造業者の説明書に従って、抽出した。サブシーケンスPCR阻害を回避するために、DNAは、AEではなくEBで溶出させた。ドメイン配列を、伸長としてIlluminaアダプターを含有するプライマーによるPCRによって増幅した。テストPCRを、50μl(半分のサイズ)の反応において5μgのゲノムDNAを使用して行って、PCR条件が、各試料について予想されるサイズで可視バンドをもたらすかを検証した。次いで、12~24×100μlの反応を、各実験において利用可能なゲノムDNAの量に応じた反応の数で、氷上にセットした(混入DNAの増幅を回避するためにクリーンPCRフード中)。10μgのゲノムDNA、0.5μlの各100μMのプライマー、及び50μlのNEBnext 2×Master Mix(NEB)を、各反応において使用した。サーモサイクリングプロトコールは、98℃へのサーモサイクラーの予熱、次いで98℃で3分にわたり試料を添加し、次いで、98℃で10秒間、63℃で30秒間、72℃で30秒間、次いで、72℃で2分間の最終ステップの32回のサイクルであった。全てのその後のステップは、PCRフード外で行った。PCR反応物をプールし、≧140μlを、100bpのラダーと並行して2%のTBEゲルの少なくとも3つのレーンにおいて、少なくとも1時間にわたり流し、395bp周辺のライブラリーバンドを切断し、DNAを、QIAquick Gel Extractionキット(QIAgen)を使用して、非スティックチューブ(Ambion)への30ulの溶出により、精製した。確認ゲルを流して、小さな生成物が除去されたことを検証した。次いで、これらのライブラリーを、Qubit HSキット(Thermo Fisher)により定量化し、15%のPhiX対照(Illumina)によりプールし、シングルエンドフォワードリード(266又は300サイクル)及び8サイクルのインデックスリードを使用して、Highアウトプットキットを用いるIllumina NextSeqにおいてシーケンシングした。
ゲノムDNAを、カラムあたり最高で1.25×108個細胞を用いて、Blood & Tissueキット(QIAgen)を使用して、製造業者の説明書に従って、抽出した。サブシーケンスPCR阻害を回避するために、DNAは、AEではなくEBで溶出させた。ドメイン配列を、伸長としてIlluminaアダプターを含有するプライマーによるPCRによって増幅した。テストPCRを、50μl(半分のサイズ)の反応において5μgのゲノムDNAを使用して行って、PCR条件が、各試料について予想されるサイズで可視バンドをもたらすかを検証した。次いで、12~24×100μlの反応を、各実験において利用可能なゲノムDNAの量に応じた反応の数で、氷上にセットした(混入DNAの増幅を回避するためにクリーンPCRフード中)。10μgのゲノムDNA、0.5μlの各100μMのプライマー、及び50μlのNEBnext 2×Master Mix(NEB)を、各反応において使用した。サーモサイクリングプロトコールは、98℃へのサーモサイクラーの予熱、次いで98℃で3分にわたり試料を添加し、次いで、98℃で10秒間、63℃で30秒間、72℃で30秒間、次いで、72℃で2分間の最終ステップの32回のサイクルであった。全てのその後のステップは、PCRフード外で行った。PCR反応物をプールし、≧140μlを、100bpのラダーと並行して2%のTBEゲルの少なくとも3つのレーンにおいて、少なくとも1時間にわたり流し、395bp周辺のライブラリーバンドを切断し、DNAを、QIAquick Gel Extractionキット(QIAgen)を使用して、非スティックチューブ(Ambion)への30ulの溶出により、精製した。確認ゲルを流して、小さな生成物が除去されたことを検証した。次いで、これらのライブラリーを、Qubit HSキット(Thermo Fisher)により定量化し、15%のPhiX対照(Illumina)によりプールし、シングルエンドフォワードリード(266又は300サイクル)及び8サイクルのインデックスリードを使用して、Highアウトプットキットを用いるIllumina NextSeqにおいてシーケンシングした。
ドメインシーケンシング解析
シーケンシングリードを、bcl2fastq(Illumina)を使用して、逆多重化した。Bowtie参照を、スクリプト「makeIndices.py」によるデザインされたライブラリー配列を使用して、作出し、リードを、スクリプト「makeCounts.py」を使用して、0のミスマッチを許容して整列させた。オフ試料及びオン試料(又はFLAGhigh及びFLAGlow)の間の各ドメインについてのエンリッチメントを、スクリプト「makeRhos.py」を使用して、計算した。所与の反復について両方の試料において<5リードのドメインを、反復からドロップさせた(0カウントを割り当てた)一方、一試料中に<5リードのドメインを、低深度からのエンリッチメント値の暴騰を回避するために、これらのリードを5に調節した。全ての核ドメインスクリーンについて、所与の条件の両方の反復において≦5カウントのドメインを、下流の解析からフィルター除去した。核ドメイン発現スクリーンについて、発現良好ドメインは、log2(FLAGhigh:FLAGlow)が、ランダム対照の中央値を≧1標準偏差上回るドメインであった。核Pfamドメイン抑制因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≧2標準偏差上回るドメインであった。核ドメイン活性化因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≦2標準偏差下回るドメインであった。サイレンサータイリングスクリーンについて、所与の条件の両方の反復において≦20カウントのタイルを、フィルター除去し、ヒットは、log2(オフ:オン)が、ランダム対照及びDMDタイリング対照の平均を≧2標準偏差上回るタイルであった。遺伝子オントロジー解析エンリッチメントを、PantherDBウェブツール(www.pantherdb.org)を使用して、計算した。バックグラウンドセットは、発現良好であり、カウントフィルターが適用された後に実験において測定されたドメインを含有する全てのタンパク質であった。統計的有意性についてのP値を、フィッシャーの正確確率検定を使用して計算し、偽発見率(FDR)を計算し、全てFDR<10%の最も有意な結果のみを示した。
シーケンシングリードを、bcl2fastq(Illumina)を使用して、逆多重化した。Bowtie参照を、スクリプト「makeIndices.py」によるデザインされたライブラリー配列を使用して、作出し、リードを、スクリプト「makeCounts.py」を使用して、0のミスマッチを許容して整列させた。オフ試料及びオン試料(又はFLAGhigh及びFLAGlow)の間の各ドメインについてのエンリッチメントを、スクリプト「makeRhos.py」を使用して、計算した。所与の反復について両方の試料において<5リードのドメインを、反復からドロップさせた(0カウントを割り当てた)一方、一試料中に<5リードのドメインを、低深度からのエンリッチメント値の暴騰を回避するために、これらのリードを5に調節した。全ての核ドメインスクリーンについて、所与の条件の両方の反復において≦5カウントのドメインを、下流の解析からフィルター除去した。核ドメイン発現スクリーンについて、発現良好ドメインは、log2(FLAGhigh:FLAGlow)が、ランダム対照の中央値を≧1標準偏差上回るドメインであった。核Pfamドメイン抑制因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≧2標準偏差上回るドメインであった。核ドメイン活性化因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≦2標準偏差下回るドメインであった。サイレンサータイリングスクリーンについて、所与の条件の両方の反復において≦20カウントのタイルを、フィルター除去し、ヒットは、log2(オフ:オン)が、ランダム対照及びDMDタイリング対照の平均を≧2標準偏差上回るタイルであった。遺伝子オントロジー解析エンリッチメントを、PantherDBウェブツール(www.pantherdb.org)を使用して、計算した。バックグラウンドセットは、発現良好であり、カウントフィルターが適用された後に実験において測定されたドメインを含有する全てのタンパク質であった。統計的有意性についてのP値を、フィッシャーの正確確率検定を使用して計算し、偽発見率(FDR)を計算し、全てFDR<10%の最も有意な結果のみを示した。
ウェスタンブロット及び共免疫沈降
rTetR-fusion-T2A-mCherry-BSDを含有するレンチウイルスベクターで形質導入された細胞を、ブラストサイジン(10μg/mL)により選択し、mCherryが>80%まで選択した。細胞を、溶解緩衝液(1%のTriton X-100、150mMのNaCl、50mMのTris pH 7.5、1mMのEDTA、プロテアーゼ阻害剤カクテル)に溶解した。タンパク質の量を、DC Protein Assayキット(Bio-Rad)を使用して、定量した。等量を、ゲル上にロードし、ニトロセルロース又はPVDF膜に移した。一次抗体として、GATA1抗体(1:1000、ウサギ、Cell Signaling Technologies カタログ番号3535S)及びGAPDH抗体(1:2000、マウス、ThermoFisher カタログ番号AM4300)又はFLAG M2モノクローナル抗体(1:1000、マウス、Sigma-Aldrich、カタログ番号F1804)及びヒストン3抗体(1:1000、マウス、Abcam カタログ番号AB1791)を使用して、膜を探査した。二次抗体として、それぞれ、ロバ抗ウサギIRDye 680 LT及びヤギ抗マウスIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68023及び926-32210)又はヤギ抗マウスIRDye 680 RD及びヤギ抗ウサギIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68070及び926-32211)を使用した。
rTetR-fusion-T2A-mCherry-BSDを含有するレンチウイルスベクターで形質導入された細胞を、ブラストサイジン(10μg/mL)により選択し、mCherryが>80%まで選択した。細胞を、溶解緩衝液(1%のTriton X-100、150mMのNaCl、50mMのTris pH 7.5、1mMのEDTA、プロテアーゼ阻害剤カクテル)に溶解した。タンパク質の量を、DC Protein Assayキット(Bio-Rad)を使用して、定量した。等量を、ゲル上にロードし、ニトロセルロース又はPVDF膜に移した。一次抗体として、GATA1抗体(1:1000、ウサギ、Cell Signaling Technologies カタログ番号3535S)及びGAPDH抗体(1:2000、マウス、ThermoFisher カタログ番号AM4300)又はFLAG M2モノクローナル抗体(1:1000、マウス、Sigma-Aldrich、カタログ番号F1804)及びヒストン3抗体(1:1000、マウス、Abcam カタログ番号AB1791)を使用して、膜を探査した。二次抗体として、それぞれ、ロバ抗ウサギIRDye 680 LT及びヤギ抗マウスIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68023及び926-32210)又はヤギ抗マウスIRDye 680 RD及びヤギ抗ウサギIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68070及び926-32211)を使用した。
ブロットを、LiCor Odyssey CLxにおいて画像化した。バンド強度を、ImageJを使用して、定量した。
個々の抑制因子リクルートメントアッセイ
個々のエフェクタードメインを、骨格pJT050又はpJT126へのGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流の3×FLAGタグ(図の凡例を参照されたい)を伴う又は伴わないrTetR又はrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562-pJT039-pEF-シトリンレポーター細胞を、このレンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリン(Fisher Scientific)により処理した又は非処理のまま放置した。処理の5日後、ドキシサイクリンを、細胞からスピンダウンすることによって除去し、培地をDPBS(Gibco)で交換して、任意の残ったドキシサイクリンを希釈し、次いで、再び細胞からスピンダウンし、それらを新鮮な培地に移した。>7,000個細胞のフローサイトメトリー解析(BD Accuri C6又はBeckman Coulter CytoFLEXのいずれか)によって、2~3日ごとに時点を測定した。データを、Cytoflow及びカスタムPythonスクリプトを使用して、解析した。事象を、生存率についての、及び送達マーカーとしてのmCherryについてのゲートをかけた。ドキシサイクリン処理時のオフ細胞の画分を計算するために、2成分ガウシアン混合モデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オンピーク及びバックグラウンドのサイレンシングされたオフ細胞のサブ集団の両方にフィッティングさせ、次いで、オフとしてサイレンシングされた細胞を表示するために、オンピークの平均を2標準偏差下回った閾値を設定した。時間がマッチした非処理対照を使用して、細胞のバックグラウンドの正規化された百分率を計算した。細胞オフ、正規化=細胞オフ+ドキシサイクリン/(1-細胞オフ、非処理)。2つの独立に形質導入された物学的反復を使用した。ドキシサイクリン処理フェーズ時の指数関数的減衰(例えば、1から減算された指数関数的減衰)、並びにサイレンシング及び再活性化開始の前のラグタイムについての追加パラメーターを伴うドキシサイクリン除去フェーズ時の指数関数的減衰の増加形態からなる遺伝子サイレンシングモデルを、SciPyを使用して、正規化されたデータにフィッティングさせた。
個々のエフェクタードメインを、骨格pJT050又はpJT126へのGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流の3×FLAGタグ(図の凡例を参照されたい)を伴う又は伴わないrTetR又はrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562-pJT039-pEF-シトリンレポーター細胞を、このレンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリン(Fisher Scientific)により処理した又は非処理のまま放置した。処理の5日後、ドキシサイクリンを、細胞からスピンダウンすることによって除去し、培地をDPBS(Gibco)で交換して、任意の残ったドキシサイクリンを希釈し、次いで、再び細胞からスピンダウンし、それらを新鮮な培地に移した。>7,000個細胞のフローサイトメトリー解析(BD Accuri C6又はBeckman Coulter CytoFLEXのいずれか)によって、2~3日ごとに時点を測定した。データを、Cytoflow及びカスタムPythonスクリプトを使用して、解析した。事象を、生存率についての、及び送達マーカーとしてのmCherryについてのゲートをかけた。ドキシサイクリン処理時のオフ細胞の画分を計算するために、2成分ガウシアン混合モデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オンピーク及びバックグラウンドのサイレンシングされたオフ細胞のサブ集団の両方にフィッティングさせ、次いで、オフとしてサイレンシングされた細胞を表示するために、オンピークの平均を2標準偏差下回った閾値を設定した。時間がマッチした非処理対照を使用して、細胞のバックグラウンドの正規化された百分率を計算した。細胞オフ、正規化=細胞オフ+ドキシサイクリン/(1-細胞オフ、非処理)。2つの独立に形質導入された物学的反復を使用した。ドキシサイクリン処理フェーズ時の指数関数的減衰(例えば、1から減算された指数関数的減衰)、並びにサイレンシング及び再活性化開始の前のラグタイムについての追加パラメーターを伴うドキシサイクリン除去フェーズ時の指数関数的減衰の増加形態からなる遺伝子サイレンシングモデルを、SciPyを使用して、正規化されたデータにフィッティングさせた。
個々の活性化因子リクルートメントアッセイ
ドメインを、骨格pJT126におけるGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流のrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562 pDY32 minCMVシトリンレポーター細胞を、各レンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリンにより処理した又は非処理のまま放置した。>15,000個細胞のフローサイトメトリー解析(Biorad ZE5)によって、時点を測定した。ドキシサイクリン処理時のオン細胞の画分を計算するために、ガウシアンモデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オフピークにフィッティングさせ、次いで、オンとして活性化された細胞を表示するために、オフピークの平均を2標準偏差上回った閾値を設定した。2つの独立に形質導入された生物学的反復を使用した。
ドメインを、骨格pJT126におけるGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流のrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562 pDY32 minCMVシトリンレポーター細胞を、各レンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリンにより処理した又は非処理のまま放置した。>15,000個細胞のフローサイトメトリー解析(Biorad ZE5)によって、時点を測定した。ドキシサイクリン処理時のオン細胞の画分を計算するために、ガウシアンモデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オフピークにフィッティングさせ、次いで、オンとして活性化された細胞を表示するために、オフピークの平均を2標準偏差上回った閾値を設定した。2つの独立に形質導入された生物学的反復を使用した。
FLAGタグ付けタンパク質レベルについてのフローサイトメトリー
FLAGタグ付け融合タンパク質レベルの染色を行った。具体的には、K562細胞を、レンチウイルスを用いて形質導入して、融合タンパク質を発現させ、ブラストサイジンにより選択し、次いで、固定緩衝液I(BD Biosciences)により、37℃で15分間にわたり固定した。細胞を、10%のFBSを有する冷PBSで1回洗浄し、次いで、Perm緩衝液III(BD Biosciences)を使用して、氷上で30分間にわたり透過処理した。細胞を、2回洗浄し、次いで、抗FLAG(XX)により、4℃で1時間にわたり染色した。最終ラウンドの洗浄後、フローサイトメトリーを、CytoFLEX(Beckman Coulter)フローサイトメーターを使用して、行った。データを、細胞をmCherry発現に対してゲートをかけることによって、CytoFlowにより解析し、次いで、mCherry+及び非形質導入細胞におけるFLAGタグ付けタンパク質レベルをプロットした。2つの細胞群として染色効率における変動性についてのこの手法の対照を、同じ試料内で混合した。
FLAGタグ付け融合タンパク質レベルの染色を行った。具体的には、K562細胞を、レンチウイルスを用いて形質導入して、融合タンパク質を発現させ、ブラストサイジンにより選択し、次いで、固定緩衝液I(BD Biosciences)により、37℃で15分間にわたり固定した。細胞を、10%のFBSを有する冷PBSで1回洗浄し、次いで、Perm緩衝液III(BD Biosciences)を使用して、氷上で30分間にわたり透過処理した。細胞を、2回洗浄し、次いで、抗FLAG(XX)により、4℃で1時間にわたり染色した。最終ラウンドの洗浄後、フローサイトメトリーを、CytoFLEX(Beckman Coulter)フローサイトメーターを使用して、行った。データを、細胞をmCherry発現に対してゲートをかけることによって、CytoFlowにより解析し、次いで、mCherry+及び非形質導入細胞におけるFLAGタグ付けタンパク質レベルをプロットした。2つの細胞群として染色効率における変動性についてのこの手法の対照を、同じ試料内で混合した。
系統学的解析及びアライメント解析
周囲の天然配列を使用して、KRAB及びホメオドメイン配列を、80AAに到達するように、Pfamから検索し、抽出した。発現良好ドメインを、アライメントのために選択した。系統樹及び配列アライメントを、デフォルトパラメーターを使用するアライメントウェブサイトClustal Omega(McWilliamら、2013;Sieversら、2011)を使用して得て、距離補正なしの52の系統学的な近隣結合樹を、Jalview(Waterhouseら、2009)におけるデフォルトパラメーターにより構築した。アライメントの可視化を、Jalviewにおいて行った。
周囲の天然配列を使用して、KRAB及びホメオドメイン配列を、80AAに到達するように、Pfamから検索し、抽出した。発現良好ドメインを、アライメントのために選択した。系統樹及び配列アライメントを、デフォルトパラメーターを使用するアライメントウェブサイトClustal Omega(McWilliamら、2013;Sieversら、2011)を使用して得て、距離補正なしの52の系統学的な近隣結合樹を、Jalview(Waterhouseら、2009)におけるデフォルトパラメーターにより構築した。アライメントの可視化を、Jalviewにおいて行った。
アミノ酸残基保存の解析
タンパク質配列を、ConSurfウェブサーバーに提出し、ConSeq法を使用して、解析した。簡潔には、ConSeqは、35~95%の配列同一性を有するホモログのリストからのサンプリングによって、多重ストリングアライメントのために最大で150のホモログを選択する。次いで、系統樹を再構築し、保存を、Rate4Siteを使用して、スコア付けする。ConSurfは、正規化されたスコアを提供し、その結果、全ての残基についての平均スコアは、ゼロであり、標準偏差は、1である。ConSurfによって計算された保存スコアは、タンパク質中の各残基の進化的保存の相対的尺度であり、最も低いスコアは、タンパク質中の最も保存された位置を表す。ZNF10 KRAB N末端伸長の一意性を、全てのヒトタンパク質に対するタンパク質BLAST、及びBLASTマッチ(Johnsonら、2008)の中の他の亜鉛フィンガータンパク質について探索することによって決定した。
タンパク質配列を、ConSurfウェブサーバーに提出し、ConSeq法を使用して、解析した。簡潔には、ConSeqは、35~95%の配列同一性を有するホモログのリストからのサンプリングによって、多重ストリングアライメントのために最大で150のホモログを選択する。次いで、系統樹を再構築し、保存を、Rate4Siteを使用して、スコア付けする。ConSurfは、正規化されたスコアを提供し、その結果、全ての残基についての平均スコアは、ゼロであり、標準偏差は、1である。ConSurfによって計算された保存スコアは、タンパク質中の各残基の進化的保存の相対的尺度であり、最も低いスコアは、タンパク質中の最も保存された位置を表す。ZNF10 KRAB N末端伸長の一意性を、全てのヒトタンパク質に対するタンパク質BLAST、及びBLASTマッチ(Johnsonら、2008)の中の他の亜鉛フィンガータンパク質について探索することによって決定した。
ChIP-seq及びChiP-exo解析
外部ChIPデータセットを、複数のソースから検索した。ENCODE ChIP-seqデータを、ENCODE(ENCODE Project Consortiumら、2020)の均一な処理パイプラインで処理し、0.05のIDR閾値を下回る狭いピークを、検索した。HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのKRAB ZNF ChIP-exoデータ、及びH1 hESCからのKAP1 ChIP-exoデータを、GEOアクセッションGSE78099(Imbeaultら、2017)から得た。リードを、Bowtie(バージョン1.0.1;(Langmeadら、2009))を使用して、36塩基対の均一な長さにトリミングし、ヒトゲノムのhg38バージョンにマッピングし、最大で2のミスマッチ及び一意的アライメントのみを保持することを可能にした。ピークを、以下の設定:「-g hs-f BAM--keep-dup all--shift-75--extsize 150--nomodel」によるMACS2(バージョン2.1.0)(Fengら、2012)を使用して、コールした。ブラウザートラックを、Pythonスクリプトを使用して、作出した。ChIP-exoデータが利用可能でなかったいくつかのKRAB ZNFのために、HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのChIP-seqデータを、GEOアクセッションGSE76496(Schmitgesら、2016)及びGSE52523(Najafabadiら、2015)から得た。KRAB ZNFピークを、データセット中の他のKRAB ZNFが250塩基対未満離れたピークを有していなかった場合に、単独結合部位として定義した。H1細胞についてのENCODE H3K27ac ChIP-seqデータセットを、ENCODEパイプライン(ENCODE Project Consortiumら、2020)で処理し、狭いピークを、MACS2によりコールし、0.05のIDR閾値を下回るピークを、検索した。
外部ChIPデータセットを、複数のソースから検索した。ENCODE ChIP-seqデータを、ENCODE(ENCODE Project Consortiumら、2020)の均一な処理パイプラインで処理し、0.05のIDR閾値を下回る狭いピークを、検索した。HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのKRAB ZNF ChIP-exoデータ、及びH1 hESCからのKAP1 ChIP-exoデータを、GEOアクセッションGSE78099(Imbeaultら、2017)から得た。リードを、Bowtie(バージョン1.0.1;(Langmeadら、2009))を使用して、36塩基対の均一な長さにトリミングし、ヒトゲノムのhg38バージョンにマッピングし、最大で2のミスマッチ及び一意的アライメントのみを保持することを可能にした。ピークを、以下の設定:「-g hs-f BAM--keep-dup all--shift-75--extsize 150--nomodel」によるMACS2(バージョン2.1.0)(Fengら、2012)を使用して、コールした。ブラウザートラックを、Pythonスクリプトを使用して、作出した。ChIP-exoデータが利用可能でなかったいくつかのKRAB ZNFのために、HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのChIP-seqデータを、GEOアクセッションGSE76496(Schmitgesら、2016)及びGSE52523(Najafabadiら、2015)から得た。KRAB ZNFピークを、データセット中の他のKRAB ZNFが250塩基対未満離れたピークを有していなかった場合に、単独結合部位として定義した。H1細胞についてのENCODE H3K27ac ChIP-seqデータセットを、ENCODEパイプライン(ENCODE Project Consortiumら、2020)で処理し、狭いピークを、MACS2によりコールし、0.05のIDR閾値を下回るピークを、検索した。
外部のデータセット
KRAB ZNF、KAP1及びH3K27acについての、ChIP-seq及びChIP-exoデータ(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)、KRAB ZNF遺伝子の進化年代(Imbeaultら、2017)、KRAB ZNFタンパク質の共免疫沈降/質量分析データ(Helleboidら、2019)及びKRAB抑制活性についてのCATアッセイ(Margolinら、1994;Witzgallら、1994)は、既に公表されている研究から検索した。
KRAB ZNF、KAP1及びH3K27acについての、ChIP-seq及びChIP-exoデータ(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)、KRAB ZNF遺伝子の進化年代(Imbeaultら、2017)、KRAB ZNFタンパク質の共免疫沈降/質量分析データ(Helleboidら、2019)及びKRAB抑制活性についてのCATアッセイ(Margolinら、1994;Witzgallら、1994)は、既に公表されている研究から検索した。
本明細書において引用される、刊行物、特許出願及び特許を含む、全ての参考文献は、各参考文献が、参照により組み込まれることが、個別に、かつ、具体的に指し示され、その全体において、本明細書に明示された場合と同じ程度において、参照により本明細書に組み込まれる。
本明細書において、本発明者らに公知である、本発明を実行するための、最良の方式を含む、本発明の、好ましい実施形態が記載される。前出の記載を読めば、これらの好ましい実施形態に対する変動は、当業者に明らかとなりうる。本発明者らは、当業者が、必要に応じて、このような変動を援用することを期待しており、本発明者らは、本発明が、本明細書において具体的に記載された方式以外の方式において実施されることを意図する。したがって、本発明は、本明細書に付属の特許請求の範囲において列挙された対象物に対する、全ての改変及びこれらの同等物を、適用可能な法規により許容されたものとして含む。さらに、本明細書においてそうでないことが指し示されない限り、又は、文脈により、逆の記載がない限り、上記において記載された要素の、これらの全ての可能な変動における、任意の組合せも、本発明に包含される。
Claims (57)
- 転写抑制ドメインを同定するための方法であって、
a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;
b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;
c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;
d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;
e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;
f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びに
g)タンパク質ドメインを、転写抑制因子として同定するステップ
を含む方法。 - レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む、請求項1に記載の方法。
- ステップd~gが、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される、請求項2に記載の方法。
- 各タンパク質ドメインが、80アミノ酸以下である、請求項1~3のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来する、請求項1~4のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項1~5のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項1~5のいずれかに記載の方法。
- 誘導型DNA結合性ドメインがタグを含む、請求項1~7のいずれかに記載の方法。
- タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項1~8のいずれかに記載の方法。
- 発現レベルが、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項9に記載の方法。
- レポーター細胞が、薬剤により、少なくとも3日間にわたり処理される、請求項1~10のいずれかに記載の方法。
- レポーター細胞が、薬剤により、5日間にわたり処理される、請求項1~11のいずれかに記載の方法。
- タンパク質ドメインが、比のlog2が発現不良陰性対照の平均値から少なくとも2標準偏差である場合に、転写抑制因子として同定される、請求項1~12のいずれかに記載の方法。
- 転写活性化ドメインを同定するための方法であって、
a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;
b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ;
c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;
d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;
e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;
f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びに
g)タンパク質ドメインを、転写抑制因子として同定するステップ
を含む方法。 - レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む、請求項14に記載の方法。
- ステップd~gが、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される、請求項15に記載の方法。
- 各タンパク質ドメインが、80アミノ酸以下である、請求項14~16のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来する、請求項14~17のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項14~18のいずれかに記載の方法。
- タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項14~19のいずれかに記載の方法。
- 誘導型DNA結合性ドメインがタグを含む、請求項14~20のいずれかに記載の方法。
- タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項14~21のいずれかに記載の方法。
- 発現レベルが、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項22に記載の方法。
- レポーター細胞が、薬剤により、少なくとも24時間にわたり処理される、請求項14~23のいずれかに記載の方法。
- レポーター細胞が、薬剤により、48時間にわたり処理される、請求項14~24のいずれかに記載の方法。
- タンパク質ドメインが、比のlog2が低発現陰性対照の平均値から少なくとも2標準偏差である場合に、転写活性化因子として同定される、請求項14~25のいずれかに記載の方法。
- 異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含み、
1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つが、配列番号1~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、合成転写因子。 - 異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む、請求項27に記載の合成転写因子。
- 1つ以上の転写活性化ドメインのうちの少なくとも1つが、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、請求項27~28のいずれかに記載の合成転写因子。
- 1つ以上の転写活性化ドメインのうちの少なくとも1つが、表2において見出されるものから選択される、請求項27~29のいずれかに記載の合成転写因子。
- 1つ以上の転写抑制ドメインのうちの少なくとも1つが、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、請求項27~30のいずれかに記載の合成転写因子。
- 1つ以上の転写抑制ドメインのうちの少なくとも1つが、表1、3又は4において見出されるものから選択される、請求項27~31に記載の合成転写因子。
- 1つ以上の転写活性化ドメイン又は1つ以上の転写抑制ドメインが、請求項1~26のいずれか一項に記載の方法により同定される、請求項27~32のいずれかに記載の合成転写因子。
- 異種DNA結合性ドメインが、プログラム可能なDNA結合性ドメインを含む、請求項27~33のいずれかに記載の合成転写因子。
- DNA結合性ドメインが、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質に由来する、請求項27~34のいずれかに記載の合成転写因子。
- 請求項27~35のいずれかに記載の合成転写因子をコードする核酸。
- 誘導型プロモーターの制御下にある、請求項36に記載の核酸。
- 組織特異的プロモーターの制御下にある、請求項36に記載の核酸。
- 少なくとも1つのさらなる転写因子をコードする、請求項36~39のいずれかに記載の核酸。
- 少なくとも1つのさらなる転写因子が、請求項27~35のいずれかに記載の合成転写因子を含む、請求項39に記載の核酸。
- 請求項36~40のいずれかに記載の核酸を含むベクター。
- 請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、又は請求項41に記載のベクターを含む細胞。
- 2つ以上の合成転写因子、核酸又はベクターを含む、請求項42に記載の細胞。
- 請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項42若しくは43に記載の細胞を含む組成物又はシステム。
- 前記組成物が、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む、請求項44に記載の組成物又はシステム。
- ガイドRNA又はガイドRNAをコードする核酸をさらに含む、請求項44又は45に記載の組成物又はシステム。
- 請求項27~36のいずれかに記載の少なくとも1つの合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、請求項42若しくは43に記載の細胞、又は請求項44~46に記載の組成物若しくはシステムを含むキット。
- 細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法であって、請求項27~35のいずれかに記載の少なくとも1つの合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項44~46に記載の組成物若しくはシステムを、細胞へ導入するステップを含む方法。
- 合成転写因子が、Casタンパク質のDNA結合性ドメインを含み、前記方法が、前記細胞を少なくとも1つのガイドRNAと接触させるステップをさらに含む、請求項48に記載の方法。
- 前記細胞が、対象における細胞である、請求項48又は49に記載の方法。
- 少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと投与するステップを含む、請求項50に記載の方法。
- 少なくとも2つの遺伝子の遺伝子発現がモジュレートされる、請求項48~51のいずれかに記載の方法。
- 少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる、請求項48~52のいずれかに記載の方法。
- 細胞内の少なくとも1つの標的遺伝子の発現をモジュレートするための、請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項44~46に記載の組成物若しくはシステムの使用。
- 合成転写因子が、Casタンパク質のDNA結合性ドメインを含む、請求項54に記載の使用。
- 少なくとも2つの遺伝子の遺伝子発現がモジュレートされる、請求項54又は55に記載の使用。
- 少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる、請求項54~56のいずれかに記載の使用。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063019706P | 2020-05-04 | 2020-05-04 | |
US63/019,706 | 2020-05-04 | ||
US202063074793P | 2020-09-04 | 2020-09-04 | |
US63/074,793 | 2020-09-04 | ||
PCT/US2021/030643 WO2021226077A2 (en) | 2020-05-04 | 2021-05-04 | Compositions, systems, and methods for the generation, identification, and characterization of effector domains for activating and silencing gene expression |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023524733A true JP2023524733A (ja) | 2023-06-13 |
JPWO2021226077A5 JPWO2021226077A5 (ja) | 2024-05-01 |
Family
ID=78468782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022567096A Pending JP2023524733A (ja) | 2020-05-04 | 2021-05-04 | 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4146801A4 (ja) |
JP (1) | JP2023524733A (ja) |
KR (1) | KR20230005984A (ja) |
CN (1) | CN116234902A (ja) |
AU (1) | AU2021268634A1 (ja) |
CA (1) | CA3176046A1 (ja) |
WO (1) | WO2021226077A2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4377460A1 (en) | 2021-07-30 | 2024-06-05 | Tune Therapeutics, Inc. | Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) |
EP4377459A2 (en) | 2021-07-30 | 2024-06-05 | Tune Therapeutics, Inc. | Compositions and methods for modulating expression of frataxin (fxn) |
WO2023137472A2 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene repression |
WO2023137471A1 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene activation |
WO2023215711A1 (en) | 2022-05-01 | 2023-11-09 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of pcsk9 expression |
WO2023250512A1 (en) | 2022-06-23 | 2023-12-28 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of ciita expression |
WO2023250490A1 (en) | 2022-06-23 | 2023-12-28 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of trac expression |
WO2023250509A1 (en) | 2022-06-23 | 2023-12-28 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of b2m expression |
WO2023250511A2 (en) | 2022-06-24 | 2023-12-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression |
WO2024015881A2 (en) | 2022-07-12 | 2024-01-18 | Tune Therapeutics, Inc. | Compositions, systems, and methods for targeted transcriptional activation |
TW202426641A (zh) | 2022-08-19 | 2024-07-01 | 美商圖恩療法股份有限公司 | 以靶向基因抑制來調節b型肝炎病毒之組合物、系統和方法 |
WO2024064642A2 (en) | 2022-09-19 | 2024-03-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for modulating t cell function |
WO2024064910A1 (en) | 2022-09-23 | 2024-03-28 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of hbv gene expression |
WO2024081879A1 (en) | 2022-10-14 | 2024-04-18 | Chroma Medicine, Inc. | Compositions and methods for epigenetic regulation of cd247 expression |
WO2024163683A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Systems, compositions, and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) and x-inactive specific transcript (xist) |
WO2024163678A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Fusion proteins and systems for targeted activation of frataxin (fxn) and related methods |
CN117143257B (zh) * | 2023-10-31 | 2024-02-09 | 深圳市帝迈生物技术有限公司 | Trim28-krab-znf10二元复合物、制备方法及用于前列腺癌筛查的试剂盒 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030180777A1 (en) * | 2002-03-12 | 2003-09-25 | Victor Bartsevich | Rapid identification of transcriptional regulatory domains |
EP2825561A4 (en) * | 2012-03-15 | 2016-03-09 | Permeon Biolog Inc | CELL PENETRATING COMPOSITIONS FOR THE DISPOSAL OF INTRA-CELLULAR ANTIBODIES AND ANTIBODY-RELATED UNITS AND METHODS OF USE |
US8999380B2 (en) * | 2012-04-02 | 2015-04-07 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of biologics and proteins associated with human disease |
WO2016011080A2 (en) * | 2014-07-14 | 2016-01-21 | The Regents Of The University Of California | Crispr/cas transcriptional modulation |
US11629342B2 (en) * | 2017-10-17 | 2023-04-18 | President And Fellows Of Harvard College | Cas9-based transcription modulation systems |
US11547614B2 (en) * | 2017-10-31 | 2023-01-10 | The Broad Institute, Inc. | Methods and compositions for studying cell evolution |
US20210079404A9 (en) * | 2018-09-25 | 2021-03-18 | Massachusetts Institute Of Technology | Engineered dcas9 with reduced toxicity and its use in genetic circuits |
-
2021
- 2021-05-04 WO PCT/US2021/030643 patent/WO2021226077A2/en unknown
- 2021-05-04 AU AU2021268634A patent/AU2021268634A1/en active Pending
- 2021-05-04 EP EP21800824.1A patent/EP4146801A4/en active Pending
- 2021-05-04 JP JP2022567096A patent/JP2023524733A/ja active Pending
- 2021-05-04 CA CA3176046A patent/CA3176046A1/en active Pending
- 2021-05-04 CN CN202180047231.6A patent/CN116234902A/zh active Pending
- 2021-05-04 KR KR1020227042321A patent/KR20230005984A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
CA3176046A1 (en) | 2021-11-11 |
WO2021226077A3 (en) | 2022-02-03 |
EP4146801A4 (en) | 2024-06-26 |
CN116234902A (zh) | 2023-06-06 |
WO2021226077A2 (en) | 2021-11-11 |
EP4146801A2 (en) | 2023-03-15 |
AU2021268634A1 (en) | 2022-11-24 |
KR20230005984A (ko) | 2023-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023524733A (ja) | 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 | |
Replogle et al. | Maximizing CRISPRi efficacy and accessibility with dual-sgRNA libraries and optimal effectors | |
O'Connor et al. | Ubiquitin‐Activated Interaction Traps (UBAIT s) identify E3 ligase binding partners | |
JP5537420B2 (ja) | 標的遺伝子の誘導性変異誘発 | |
CN103620405B (zh) | 全面单克隆抗体产生 | |
US20240230663A1 (en) | Methods, compositions, and systems for profiling or predicting an immune response | |
CN105924499B (zh) | 蛋白演化的新方法 | |
JP2021515582A (ja) | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 | |
KR20220002712A (ko) | 생산 숙주에서 항체/단백질 성능과 발현을 동시에 통합 선택하고 진화시키는 방법 | |
Dai et al. | Massively parallel knock-in engineering of human T cells | |
US20210118522A1 (en) | Methods and composition for modulating immune response and immune homeostasis | |
Rosch et al. | CRISPR-mediated isogenic cell-SELEX approach for generating highly specific aptamers against native membrane proteins | |
WO2022167665A1 (en) | Engineered transposase and uses thereof | |
WO2017117331A1 (en) | Methods for identifying and treating hemoglobinopathies | |
US20230365637A1 (en) | Identification of pax3-foxo1 binding genomic regions | |
WO2023023553A2 (en) | Compositions, systems, and methods for activating and silencing gene expression | |
Chieca et al. | Live-cell quantification of APOBEC1-mediated RNA editing: a comparison of RNA editing assays | |
US20220411472A1 (en) | Self-assembling circular tandem repeat proteins with increased stability | |
CA3188501A1 (en) | Therapeutic targeting of phosphate dysregulation in cancer via the xpr1:kidins220 protein complex | |
EP4442704A1 (en) | Peptide having framework sequence for random region placement and peptide library composed of said peptide | |
WO2023039528A1 (en) | Nanobody-mediated control of gene expression and epigenetic memory | |
Oldberg | Elucidating the Novel Role for Core Binding Factor beta in Osteosarcoma Protein Translation | |
US10954515B2 (en) | Therapeutic methods, products and compositions inhibiting ZNF555 | |
Xu et al. | the Interaction Proteome of Ribosomal 40S Components PNO1 and NOB1 Using TurboID Proximity Labeling Technology | |
Stranger | DNA damage in transcriptional regulation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240418 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240418 |