[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2023524733A - 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 - Google Patents

遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 Download PDF

Info

Publication number
JP2023524733A
JP2023524733A JP2022567096A JP2022567096A JP2023524733A JP 2023524733 A JP2023524733 A JP 2023524733A JP 2022567096 A JP2022567096 A JP 2022567096A JP 2022567096 A JP2022567096 A JP 2022567096A JP 2023524733 A JP2023524733 A JP 2023524733A
Authority
JP
Japan
Prior art keywords
domain
domains
cells
protein
reporter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022567096A
Other languages
English (en)
Other versions
JPWO2021226077A5 (ja
Inventor
バッシク,マイケル・シー
ティッコ,ジョッシュ
ヘス,ガーレン・ティー
ビントゥ,ラクラミオアラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leland Stanford Junior University
Original Assignee
Leland Stanford Junior University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leland Stanford Junior University filed Critical Leland Stanford Junior University
Publication of JP2023524733A publication Critical patent/JP2023524733A/ja
Publication of JPWO2021226077A5 publication Critical patent/JPWO2021226077A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/035Fusion polypeptide containing a localisation/targetting motif containing a signal for targeting to the external surface of a cell, e.g. to the outer membrane of Gram negative bacteria, GPI- anchored eukaryote proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Detergent Compositions (AREA)

Abstract

本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。

Description

関連出願の相互参照
本出願は、それらの各々の内容が、参照によりそれらの全体において本明細書に組み込まれた、2020年5月4日に出願された米国仮出願第63/019,706号及び2020年9月4日に出願された米国仮出願第63/074,793号の利益を主張する。
分野
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。
連邦政府による後援を受けた調査研究に関する言明
本発明は、米国国立衛生研究所により授与された、GM128947の契約下にある政府助成によりなされた。米国連邦政府は、本発明において、一定の権利を有する。
合成転写因子を操作しようとする、既存の取組みは、既に発見されたエフェクタードメインによる、小型のツールボックスから、活性化ドメイン及び抑制ドメインを取り出した。このツールボックスを拡張するための、新たな方法が必要とされている。
(発明の要旨)
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。本明細書の一部の実施形態において、ツールボックスを大幅に拡張するエフェクタードメインを発見し、性質決定するためのハイスループット法が提供される。これらのドメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子の増強を操作する喫緊の必要を満たす。
一部の実施形態において、エフェクタードメインを同定するための方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、エフェクタードメインを同定するための方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能であるステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写活性化因子として同定するステップを含む。
一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップd~gは、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される。
一部の実施形態において、各タンパク質ドメインは、80アミノ酸以下である。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。
一部の実施形態において、誘導型DNA結合性ドメインはタグを含む。
一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。一部の実施形態において、発現レベルは、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも3日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも5日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも24時間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも48時間にわたり処理される。
一部の実施形態において、タンパク質ドメインは、比のlog2が発現不良陰性対照の平均値から少なくとも2標準偏差である(例えば、これより高値である)場合に、転写抑制因子として同定される。
一部の実施形態において、タンパク質ドメインは、比のlog2が低発現陰性対照の平均値から少なくとも2標準偏差である(例えば、これより低値である)場合に、転写活性化因子として同定される。
本明細書においてまた、異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含む合成転写因子も提供される。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む。
一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、表2において見出されるものから選択される。
一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、表1、3又は4において見出されるものから選択される。
一部の実施形態において、1つ以上の転写活性化ドメイン又は1つ以上の転写抑制ドメインは、本明細書において開示された方法により同定される。
一部の実施形態において、異種DNA結合性ドメインは、プログラム可能なDNA結合性ドメインを含む。一部の実施形態において、DNA結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質に由来する。一部の実施形態において、DNA結合性ドメインは、転写活性化因子様エフェクター(TALE)ドメインに由来する。
本明細書においてまた、本明細書において開示された合成転写因子又はエフェクタードメインをコードする核酸も提供される。一部の実施形態において、核酸は、誘導型プロモーターの制御下にある。一部の実施形態において、核酸は、組織特異的プロモーターの制御下にある。一部の実施形態において、核酸は、少なくとも1つのさらなる転写因子又はエフェクタードメインをコードする。
本明細書において、本明細書において開示された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムがさらに提供される。一部の実施形態において、組成物は、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む。一部の実施形態において、組成物は、ガイドRNA又はガイドRNAをコードする核酸をさらに含む。
加えて、細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法も提供される。方法は、細胞へと、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む。少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる。一部の実施形態において、合成転写因子は、Casタンパク質のDNA結合性ドメインを含み、方法は、細胞を少なくとも1つのガイドRNAと接触させるステップをさらに含む。
一部の実施形態において、細胞は、インビトロ(例えば、エクスビボ)における細胞又は対象における細胞である。
一部の実施形態において、少なくとも2つの遺伝子の遺伝子発現がモジュレートされる。
ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。核へと局在化されたヒトタンパク質内のPfamアノテーションドメインの長さである。≦80アミノ酸のドメインを、ライブラリーへの組入れのために選択した。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。転写抑制因子を同定するスクリーンについての概略図である。抑制レポーターは、抑制ドメインの、ドキシサイクリン媒介リクルートメントによりサイレンシングされうる、強力なpEFプロモーターを使用する。細胞を、ドキシサイクリンにより、5日間にわたり処理し、オン細胞と、オフ細胞とを、磁性的に分離し、ドメインをシーケンシングした。ドキシサイクリンを除去し、9及び13日目に、さらなる時点を設定した。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。log(オフ:オン)比の、独立に形質導入された生物学的反復からの再現性を示し、選択されたドメインファミリーに着色する。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。ファミリー内のドメインの、5日目における最大の抑制強度によりランク付けされた、上位の抑制ドメインファミリーについての箱髭図である。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。フローサイトメトリーにより測定された、ヒットRYBPドメインについての、個別検証の時間経過である。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。抑制ドメインのパネルについての、さらなる検証時間経過である。一部のドメインは、ライブラリーに由来する、正確な80アミノ酸の配列として調べ、一部のドメインは、Pfamにより、ドメインとしてアノテーションされた領域へとトリミングされた、短い配列として調べたため、ドメイン長を、括弧内に列挙する。1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した。 ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のPfamアノテーションドメインの、転写抑制活性を測定することを示す図である。KRABエフェクタードメインのコレクションについての、スクリーンによる測定値の、個別の検証フローサイトメトリー測定との相関である。 抑制性KRABドメインが、KAP1抑制補因子と共局在化し、これに結合する、より近年のKRAB亜鉛フィンガータンパク質内にあることを示す図である。KRABのサイレンシング機能を、KRABドメインが、天然で見出される、KRAB亜鉛フィンガータンパク質のアーキテクチャーと比較した。 抑制性KRABドメインが、KAP1抑制補因子と共局在化し、これに結合する、より近年のKRAB亜鉛フィンガータンパク質内にあることを示す図である。KRABのサイレンシング機能を、その全DNA結合性亜鉛フィンガーアレイ配列を使用して、遺伝子の最も近年のオーソログを見出すことにより決定された、KRAB亜鉛フィンガー遺伝子の進化年代と比較した(年代は、Trono、2017において公表されている)。 抑制性KRABドメインが、KAP1抑制補因子と共局在化し、これに結合する、より近年のKRAB亜鉛フィンガータンパク質内にあることを示す図である。KRABドメインを、サイレンサー又は非サイレンサーと類別し、ChIP-seqデータセットにおける、それらのゲノム内局在を、抑制補因子である、KRAB関連タンパク質1(KAP1)の局在と比較した。 抑制性KRABドメインが、KAP1抑制補因子と共局在化し、これに結合する、より近年のKRAB亜鉛フィンガータンパク質内にあることを示す図である。質量分析データセット(Helleboid、2019)において、それらのKRAB亜鉛フィンガー遺伝子が、抑制補因子であるKAP1と、有意に相互作用するのかどうかにより類別された、KRABドメインの抑制強度分布である。ドットの色は、KRABドメインの発現レベルについての5分位数である。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。高深度突然変異スキャニングライブラリーは、ZNF10に由来するKRABドメイン内の、単一置換並びに連続二重置換及び連続三重置換の全てを含む。DNAオリゴは、コドン使用の変動によるタンパク質配列より顕著に異なるようにデザインされる。赤色残基は、WT配列と異なる。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。単一置換変異体及び三重置換変異体の全てによる抑制因子の、WTと比べた測定値を、KRABドメインについての概略図の下方に示す。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。9日目における、突然変異の、抑制に対する、全てのヒトKRABドメインについての、複数の配列アライメントによる、配列の保存(ConSurfにより計算された)と比較した、平均効果である。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。ハイスループット測定値の、異なる細胞型における、CATアッセイを使用する、既に公表されているロースループットデータとの相関である。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。KRAB突然変異体についての、個々の時間経過は、Aボックス/Bボックス及びN末端における置換の効果を検証する。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。図3Bの各時点における各位置について、全ての単一置換の分布を、野生型効果の分布と比較した(ウィルコクソンランクサム検定)。5日目における符号つきlog10(p)を、<-5とする位置を、赤色(サイレンシングの高度に有意な低下)により着色し、9日目における符号つきlog10(p)を、<-5とするが、5日目における符号つきlog10(p)は、<-5としない位置を、緑色により着色し、13日目におけるlog10(p)を、>5とするW8位を、青色(高度に有意な増大)により着色する。水平方向の破線は、ヒット閾値を示す。配列保存についてのConSurfスコアを、オレンジにより示す。 ZNF10 KRABドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。突然変異した場合に、5日目に、サイレンシングを失効化させる残基を、マウスKRAB Aボックス(PDB:1v65)のNMR構造の秩序領域へとマッピングする。 ホメオドメイン抑制強度が、Hox遺伝子の編成と共直線性であることを示す図である。5日目における中央値抑制強度による、ホメオボックス遺伝子ファミリー又はホメオボックス遺伝子クラスのランク付けである。最強のホメオドメイン抑制因子を含有する、ANTPクラスのホメオドメインの、HOXLサブクラス及びNKLサブクラス、並びにPRDクラス及びLIMクラスが、個々の遺伝子ファミリーへと分けられる(Holland BMC、2007)のに対し、残りのクラスは、凝集される。ドットの色は、ハイスループット発現アッセイにおいて測定された、ホメオドメイン発現レベルの5分位数である。 ホメオドメイン抑制強度が、Hox遺伝子の編成と共直線性であることを示す図である。Hox遺伝子ファミリーに由来するホメオドメインの、5日目における抑制強度である。矢印は、4つのヒトHox遺伝子座内に見出された遺伝子を表し、Hox遺伝子転写の方向を指し示す。グレーバーは、遺伝子ファミリーを区分する。スピアマンのロー値及びp値を、全てのHox遺伝子にわたり、遺伝子数と、抑制強度との関係について計算した。データを、フィルタリングして、5日目におけるシーケンシング試料のうちのいずれかにおけるカウントが10より小さい、任意のドメインを除去した。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化ドメインのドキシサイクリン媒介リクルートメントにより活性化されうる、弱いminCMVプロモーターを使用する活性化レポーターについての概略図及び活性化スクリーンについての概略図である。細胞のプールを、ドキシサイクリンにより、48時間にわたり処理し、オン細胞と、オフ細胞とを、ProG Dynabeadにより磁性的に分離し、ドメインをシーケンシングした。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。公知の活性化ドメインファミリー(FOXO-TAD、Myb LMSTEN、TORC_C)に着色して、log(オフ:オン)比の、独立に形質導入された生物学的反復からの再現性を示す。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化強度が閾値を下回るドメインを含有する遺伝子についてのGOタームエンリッチメントである。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化ドメイン(赤)は、非ヒット(グレー)より酸性である。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。平均値活性化強度によりランク付けされた、ドメインファミリーのリストである。 ハイスループットリクルートメントが、ZNF473内の、KRABドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。KRABドメインを、配列によりアライメント及びクラスター化したところ、Helleboid、2019における分類と同様の結果がもたらされた。最も分岐的なKRAB配列のクラスターは、緑色により表示された変異体KRABである。スクリーンからの結果を、ヒートマップの下方に示す。標準KRABは、発現良好である場合、抑制因子として機能する。変異体KRABは、スクリーンにおいて、抑制因子、活性化因子としての混合効果を示し、転写効果を示さない。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。80アミノ酸のタイルが、10アミノ酸のスライディングウィンドウにより、タンパク質配列をカバーする、ライブラリーについてのグラフ描示である。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。独立に形質導入された生物学的反復からの、log(オフ:オン)比の再現性を示す。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。5日目における抑制を、MGAタンパク質について公知のドメインアーキテクチャーと比較する。2つの抑制ドメインは、既存のアノテーション領域の外部に見出される。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。フローサイトメトリーについての時間経過は、80アミノ酸のタイルとしての、個々のMGAエフェクターを検証する。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。エフェクターを、スクリーンにおいて抑制活性を示すタイルの間において共有された配列を選択することにより、10~30アミノ酸のサブタイルへと最小化した。これらの最小化配列を、フローサイトメトリーについての時間経過により、個別に検証した。 タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。タイリングスクリーンによる、さらなる80アミノ酸の抑制因子ヒットについての、個別の検証である。rTetR-タイル融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、細胞を、100ng/mlのドキシサイクリンにより、5日間にわたり処理し、次いで、ドキシサイクリンを除去した。細胞を、フローサイトメトリーにより解析し、それらのシトリン発現レベルにより、細胞にゲートをかけることにより、オフ細胞の割合を測定した。 リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスrTetRドメイン融合体による遺伝子サイレンシングを測定することを示す図である。レンチウイルスベクターについての概略図である。 リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスrTetRドメイン融合体による遺伝子サイレンシングを測定することを示す図である。pJT050へとクローニングされたZNF10KRABについての、時間経過にわたる、シトリンオフ:オンのFACSヒストグラムを示す、K562レポーター細胞内のパイロット試験である。1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した。 リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスrTetRドメイン融合体による遺伝子サイレンシングを測定することを示す図である。時間経過にわたる、オン細胞の割合である。 リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスrTetRドメイン融合体による遺伝子サイレンシングを測定することを示す図である。レポーターシステムはまた、HEK293T細胞においても確立した。細胞に、rTetR-KRAB又はpOri対照をコードするプラスミドをトランスフェクトし、フローサイトメトリーにより解析する前に、2日間(上)及び4日間(下)にわたり、1000ng/mlのドキシサイクリンを伴う、又は伴わずに処理した。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ライブラリー内の、各ドメイン融合体について、発現レベルを測定するハイスループット法についての概略図である。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ドメイン発現の測定値の再現性である。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ウェスタンブロットによる検証である。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。サブライブラリーについての安定性:ランダムは不安定化されるが、タイルは、Pfamドメインと同様である。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。安定性は、残基の正味電荷及び障害促進性と分類された残基と関連する。 Pfamドメインの、抑制機能についてのスクリーンを示す図である。磁性分離の前後における、細胞ライブラリーについてのフローサイトメトリーである。 Pfamドメインの、抑制機能についてのスクリーンを示す図である。一過性抑制因子と対比した、logPによる上位10の安定性抑制因子についての、PANTHERタンパク質クラスエンリッチメントである。 Pfamドメインの、抑制機能についてのスクリーンを示す図である。5日目における抑制強度によりランク付けされた、ドメインファミリーの全リストである。 Pfamドメインの、抑制機能についてのスクリーンを示す図である。rTetR-SUMO融合体は、レポーターをサイレンシングする。SUMOコンジュゲーション部位における突然変異(GG91AA)は、サイレンシング速度を低減し、SUMO相互作用性非共有結合的結合性部位における突然変異は、サイレンシングメモリーを低減する。 Pfamドメインの、抑制機能についてのスクリーンを示す図である。抑制活性を伴う、機能未知ドメイン(DUF)についての検証である。 KRABについての高深度突然変異スキャンを示す図である。5、9及び13日目における、ZNF10に由来するKRABドメインについての高深度突然変異ライブラリーに対する、2連の生物学的反復による、オフ:オンスコアである。 KRABについての高深度突然変異スキャンを示す図である。KRAB変異体の発現レベルについてのFLAGタグ染色:非サイレンシング変異体は、分解される。Bボックス突然変異体は、安定性である。 KRABについての高深度突然変異スキャンを示す図である。FLAGタグ染色は、FLAGタグについてのウェスタンブロットと相関する。 活性化因子のスクリーンデータを示す図である。rTetR-VP64を、K562minCMVレポーター細胞へと電気穿孔するパイロット試験である。ドキシサイクリンを添加した後において、レポーター細胞は、シトリンの発現についてのフローサイトメトリーにより測定される通り、オンになる。 活性化因子のスクリーンデータを示す図である。フローサイトメトリーにより解析された、活性化因子スクリーン時における、プールライブラリーの磁性分離である。 活性化因子のスクリーンデータを示す図である。Pfamドメインライブラリーを、2つの異なるレポータープロモーターと共に使用する、ハイスループットリクルートメントによる転写調節の測定値の比較である。各ドメインは、ドットであり、ドットのサイズは、FLAGスクリーンにおいて測定された発現四分位数である。 数千のPfamドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。任意のファミリー内のドメインの、5日目における最大の抑制強度によりランク付けされた、上位の抑制ドメインファミリーについての箱髭図である。直線は、中央値を示し、髭は、高四分位数及び低四分位数を、四分位間範囲の1.5倍の範囲を示し、異常値は、ダイアモンドにより示される。破線は、ヒット閾値を示す。ボックスは、本文中において明らかにされたドメインファミリーについて着色した。 数千のPfamドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。フローサイトメトリーにより測定された、RYBPドメイン及び抑制活性を伴う、2つの機能未知ドメイン(DUF)についての個別の検証である。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、2連の生物学的反復を伴う。垂直方向の直線は、オフ細胞の割合を決定するのに使用された、シトリンゲートを示す。 数千のPfamドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。遺伝子サイレンシングモデルによりフィッティングされた検証時間経過:速度ksによる指数関数的サイレンシングに続く、指数関数的再活性化である。ドキシサイクリン(1000ng/ml)を、0日目に添加し、5日目に除去した(生物学的反復のN=2)。シトリンレポーターがオフである、mCherry陽性細胞の割合は、図12Bにおける通りに、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。 数千のPfamドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。5日目におけるハイスループット測定値の、サイレンシング速度ksとの相関である(R=0.86、ドメインのn=15、生物学的反復のN=2~3)。水平方向の誤差バーは、フィッティングされた速度についての標準偏差であり、垂直方向の誤差バーは、スクリーンの生物学的反復の範囲であり、破線は、線形回帰の95%信頼区間である。 Hoxホメオドメインの抑制強度が、Hox遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。5日目における、それらのホメオドメインの中央値抑制強度による、ホメオボックス遺伝子クラスのランク付けである。水平方向の直線は、ヒット閾値を示す。CERSクラスに由来する5つのホメオドメインは、いずれも、発現良好ではなかった。 Hoxホメオドメインの抑制強度が、Hox遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。Hox遺伝子ファミリーに由来するホメオドメインである。(上)前後軸に沿った、Hox遺伝子発現パターンを、適合胚画像上のHoxパラログ数により着色する(Hueberら、2010)。Hox11及びHox12はいずれも、四肢の後端において、近位-遠位軸に沿って発現される(Wellik及びCapecchi、2003)。(中)5日間にわたるドキシサイクリン処理後における抑制強度である。ドットを、Hoxクラスターにより着色し、パラログ数を、胚概略図における通りに着色する。スピアマンのロー値及びp値を、パラログ数及び抑制強度の間の関係について、全てのHox遺伝子にわたり計算した。(下)有色矢印は、4つのヒトHoxクラスター内において見出された遺伝子を表し、Hox遺伝子転写の方向を、5’から3’へと指し示す。グレーバーは、遺伝子配列の類似性群を、既に分類されている(Hueberら、2010)通りに区分する。 Hoxホメオドメインの抑制強度が、Hox遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。赤色により強調されたRKKRモチーフを示す、強力な抑制因子を上位とする(5日目におけるオフ:オン比によりランク付けされた)、Hoxホメオドメインの複数の配列アライメントである。N末端アーム内の他の塩基残基を、ラベンダーにより着色した。 Hoxホメオドメインの抑制強度が、Hox遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。各Hoxホメオドメインのヘリックス1の上流のN末端アーム内における、正帯電残基の数と、5日目における抑制平均との相関である。ドットの色は、パラログ数を示す。 Hoxホメオドメインの抑制強度が、Hox遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。PDB ID:2L7Zにより検索され、RKKRモチーフを赤色により強調した、HOXA13ホメオドメインのNMR構造である。複数の配列アライメントに由来する座標を使用する、G15~S81の配列を示す。 活性化ドメインの発見を示す図である。rTetRへと融合したエフェクタードメインを活性化させる、ドキシサイクリン媒介リクルートメントにより活性化されうる、弱いminCMVプロモーターを使用する、活性化レポーターについての概略図である。 活性化ドメインの発見を示す図である。独立に形質導入された、2連の生物学的反復からの、ハイスループット活性化因子測定の再現性である。核ドメインライブラリーを、図14Aの活性化レポーターを含有する細胞のプールへと形質導入し、細胞のプールを、ドキシサイクリンにより、48時間にわたり処理し、オン細胞と、オフ細胞とを、磁性的に分離し、ドメインをシーケンシングした。オフ細胞に由来するシーケンシングリードの、オン細胞に由来するシーケンシングリードと対比した比を、発現良好ドメインについて示す。アノテーションされたPfam活性化ドメインファミリー(FOXO-TAD、Myb LMSTEN、TORC_C)を、赤色の影により着色した。直線は、最強のヒットである、ZNF473に由来するKRABドメインに照らして引く。ヒット閾値は、発現不良ドメイン分布の平均値の2標準偏差下方に引かれた破線である。 活性化ドメインの発見を示す図である。少なくとも1つの活性化性ヒットを伴うドメインファミリーについてのランクリストである。Pfam内において、活性化因子として、既にアノテーションされているファミリーを、赤色とする。破線は、図14Bにおける通り、ヒット閾値を表す。発現良好ドメインだけを示す。 活性化ドメインの発見を示す図である。アミノ酸1つ当たりの正味電荷として計算された、Pfamライブラリーに由来するエフェクタードメインの酸性度である。(左)ヒットなしの、発現良好Pfamドメイン(KRAB及びアノテーション活性化因子を除く)の、活性化性ヒットドメインとの比較である。アノテーションされたPfam活性化ドメインファミリーを、陽性対照群(オレンジ)として示す。(右)活性化性ヒットドメインと、KRABドメインファミリーに由来するヒットなしドメインとの比較である。マン-ホイットニー検定によるP値を、比較群間のバーにより示す。n.s.=非有意(p>0.05)である。 活性化ドメインの発見を示す図である。配列分岐的変異体KRABクラスターを伴う、全ての発現良好KRABドメインについての系統樹を、緑色により示す(上)。5日目における抑制についての、ハイスループットリクルートメント測定値を、青色により示し(中)、活性化についての測定値を、赤色により示す(下)。水平方向の破線は、ヒット閾値を示す。ZNF10に由来する抑制性KRAB、ZFP28に由来する抑制性KRAB_1、及び全ての活性化性KRABドメインについての例は、大型の表示によりコールアウトする。KRABドメイン始点を、括弧内に記載する。 活性化ドメインの発見を示す図である。変異体KRAB活性化ドメインについての個別の検証である。rTetR(SE-G72P)-ドメイン融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、ブラストサイジンにより選択し、1000ng/mlのドキシサイクリンにより、細胞を、2日間にわたり処理し、次いで、フローサイトメトリーにより、シトリンレポーターレベルを測定した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、2連の生物学的反復を伴う。垂直方向の直線は、オン細胞の割合を決定するのに使用されたシトリンゲートを示し、ドキシサイクリン処理細胞について、オン細胞の平均の割合を示す。 活性化ドメインの発見を示す図である。KRAB亜鉛フィンガータンパク質活性クロマチンマークである、H3K27acの最近接ピークからの、ChIPピーク位置の距離である。KRABタンパク質は、5日目の抑制因子スクリーンにおいて、それらの状態により、ヒット(青)又はヒットなし(緑)と分類される(左)。加えて、データを、抑制性ヒットKRABを含有するZNF10(黒)、活性化性ヒットKRABを含有するZNF473(赤)、及び活性化性ヒットKRAB及び抑制性ヒットKRABの両方を含有するZFP28(黄)(右)について、個別に示す。各ドットは、40塩基対のビン内のピークの割合を示す。ChIP-seqデータ及びChiP-exoデータは、ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016から検索した。集計データに、単一のKRAB亜鉛フィンガーが結合する単独ピークだけを組み入れる(左図の、青ドット及び緑ドット)が、各個別のタンパク質について、単独ピークの数が少ないため、個々のタンパク質に、全てのピークを組み入れる(右図の、赤ドット、黒ドット及び黄ドット)。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。238の核局在化タンパク質のキュレーションセットをカバーする、80アミノ酸のタイリングライブラリーについての概略図である。抑制強度を測定するように、図1におけるワークフローと同じワークフローを使用して、これらのタイルを、rTetRと融合させ、レポーターへとリクルートした。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。各タイルについて、ドットにより示された、5日目における、最大の抑制機能によりランク付けされた、タイリング遺伝子である。ヒットは、log(オフ:オン)が、陰性対照の平均値を≧2標準偏差上回るタイルである。タイルがヒットした遺伝子を、階調を施して着色し、タイルがヒットしなかった遺伝子を、グレーにより着色した。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。CTCFのタイリングである。概略図は、UniProtから検索された、タンパク質のアノテーションを示す。水平方向のバーは、各タイルにより張り渡された領域を示し、垂直方向の誤差バーは、スクリーンについての、2連の生物学的反復による標準誤差を示す。最強のヒットタイルを、垂直方向の階調により強調し、抑制ドメインとしてアノテーションする(オレンジ)。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。BAZ2A(また、TIP5としても公知である)のタイリングである。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。個別の検証である。レンチウイルスrTetR(SE-G72P)-タイル融合体を、K562レポーター細胞へと送達し、細胞を、100ng/mlのドキシサイクリンにより5日間(垂直方向の破線の間)にわたり処理し、次いで、ドキシサイクリンを除去した。フローサイトメトリーにより、細胞を解析し、シトリンレポーターがオフである細胞の割合を決定し、遺伝子サイレンシングモデルにより、データをフィッティングした(生物学的反復のN=2)。2つのKRAB抑制ドメインを、陽性対照として示す。下方に示される検証(青色の曲線)に対応するタイリングスクリーンデータは、図22に示す。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。MGAのタイリングである。2つの抑制ドメインは、既存のアノテーション領域の外部に見出され抑制因子1及び2(暗赤色、紫色)として表示される。ヒットタイルの重複部における最小化抑制性領域を、垂直方向の狭い赤色階調により強調する。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。図15Eにおいて記載された方法により、MGA内の2つのピークに由来する、最強抑制因子タイルを、個別に検証した(生物学的反復のN=2)。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。垂直方向の破線間に示されたピーク内の、全てのヒットタイルの間において共有された領域を選択することにより、MGA抑制因子1の配列を最小化し、赤色により影を付した。タンパク質配列保存についてのConSurfスコアを、下方に、オレンジの直線により示し、信頼区間(推定進化速度分布の、第25百分位数~第75百分位数)を、グレーにより示す。アステリスクは、ConSurfにより、機能的である(高度に保存され、露出されている)ことが予測された残基をマークする。同じ手法により、抑制因子2の配列を最小化し、また、予測された機能的残基と重複する領域も最小化した(データは示さない)。 核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。MGAエフェクターを、10~30アミノ酸のサブタイルへと最小化し、図15Hに示される通り、レンチウイルスrTetR(SE-G72P)-タイル融合体としてクローニングし、K562レポーター細胞へと送達した。選択の後、100又は1000ng/mlのドキシサイクリンにより、細胞を、5日間にわたり処理し、フローサイトメトリーにより、シトリンレポーターがサイレンシングされた細胞の百分率を測定した(生物学的反復のN=2)。 レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。エフェクタードメインの、ドキシサイクリン誘導性DNA結合性ドメインであるrTetRとの融合体を創出するための、Golden Gateクローニング部位を伴う、レンチウイルスリクルートメントベクターについての概略図である。構成的pEFプロモーターは、T2A自己切断ペプチドにより隔てられた、rTetR-エフェクター融合体と、mCherry-BSD(ブラストサイジンSデアミナーゼ耐性遺伝子)との発現を駆動する。 レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。(上)rTetR-KRAB融合体の、二重レポーター遺伝子へのリクルートメントについての概略図である。TALEN媒介相同性指向修復により、レポーターを、AAVS1遺伝子座内に組み込み、内因性AAVS1プロモーターによりにより、PuroR耐性遺伝子を駆動する。二重レポーターは、合成表面マーカーである(Igκ-hIgG1-Fc-PDGFRβ)及びシトリン蛍光タンパク質からなる。(下)K562レポーター細胞内のパイロット試験である。レポーターを、AAVS1遺伝子座へと組み込む、TALEN媒介相同性指向修復により、レポーター細胞を作出し、次いで、ピューロマイシンにより選択した。次いで、rTetR-KRABを送達するように、細胞に、レンチウイルスをスピンフェクトし、次いで、非処理のまま放置する、又はTetO部位における、rTetRの、DNAへの結合を誘導するように、1000ng/mlのドキシサイクリンにより処理した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、黒又はオレンジにより示し、各条件において、独立に形質導入された、2連の生物学的反復を伴う。レンチウイルス処理細胞に、送達マーカーとしてのmCherryについてのゲートをかけた。ヒトZNF10に由来するKRABドメインを使用した。 レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。合成表面マーカーに結合するProG Dynabeadを使用する、オフ細胞の、オン細胞からの磁性分離の実証である。細胞1000万個を、30μlのビーズを使用する磁性分離にかけ、分離の前後において、フローサイトメトリーにより、シトリンレポーターの発現を測定した。混合されたオン細胞と、オフ細胞とを、磁性分離にかけることについての例示を、右側に示す。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。(上)ライブラリー内の各ドメインの発現レベルを測定するための、ハイスループット戦略についての概略図である。それらの天然タンパク質配列を使用して、80アミノ酸長を下回るドメインを、80アミノ酸に到達するように、両側において伸長させて、これにより、全ての合成ライブラリーエレメントを同じ長さとした。(中)ライブラリーを、FLAGタグ付け構築物へとクローニングし、細胞の大部分が、単一のライブラリーメンバーを発現するように、低感染多重度において、レンチウイルスにより、K562細胞へと送達した。mCherry-BSD融合タンパク質は、第2の2A構成要素を使用せずに、ブラストサイジンによる選択並びに送達及び選択効率のための蛍光マーカーを可能とする。(下)抗FLAGにより、細胞を染色し、高発現集団と、低発現集団とを分取し、ドメインをシーケンシングし、log2(FLAGhigh:FLAGlow)比を計算することにより、発現を測定する。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。2つのビン(重複領域に影を付して示される、細胞ライブラリーの生物学的反復のN=2)への分取の前後において、フローサイトメトリーにより測定されたFLAG染色レベルの分布である。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ドメイン発現スクリーンに由来する生物学的反復の再現性である(r=0.82)。閾値(ランダム対照の中央値を、1標準偏差上回る破線)を上回る、発現良好ドメインを、転写調節スクリーンにおける、さらなる解析のために選択した。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。KRABドメインのパネルについての、発現レベルの検証である。レンチウイルスにより、個々のrTetR-3×FLAG-KRAB構築物を、K562細胞へと送達した。ブラストサイジンにより、細胞を選択し、フローサイトメトリーにより、>80%が、mCherry陽性であることを確認した。抗FLAG抗体を伴うウェスタンブロットにより、発現レベルを測定した。抗ヒストンH3を、正規化のためのローディング対照として使用した。レベルは、ImageJを使用して定量した。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ハイスループット発現測定値の、ウェスタンブロットによるタンパク質レベルとの比較である。これらの6つのKRABドメインは、Pfamドメインライブラリーに由来する、正確な80アミノ酸の配列を、個別に使用してクローニングした。 FLAG染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ライブラリーメンバーの異なるカテゴリーについての、発現レベルの分布である。ランダム対照は、DMDタンパク質又はPfamドメインにわたるタイルと比較して、発現不良である(マンホイットニー検定によるp<1×10-5である)。破線は、図17Cにおける通り、発現レベルについての閾値を示す。 抑制機能を伴うドメインの同定を示す図である。フローサイトメトリーは、合成表面マーカーに結合するProG DynaBeadを使用する磁性分離の前後の、Pfamドメインライブラリーを発現する細胞のプール内における、シトリンレポーターレベルの分布を示す。重複ヒストグラムを、2連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した。 抑制機能を伴うドメインの同定を示す図である。ドメインがライブラリーに組み入れられた、全ての核タンパク質のバックグラウンドセットと比較した場合に、メモリーが強い、又は弱い抑制ドメインを含有する核タンパク質についての、PANTHERタンパク質クラスによるエンリッチメントである。 抑制機能を伴うドメインの同定を示す図である。rTetR-SUMO遺伝子サイレンシングモデルによりフィッティングされた検証時間経過である。SUMO3のRad60-SLDドメイン及びトリミングドメインの近傍を中心とする、80アミノ酸の配列を、レンチウイルスへと、個別にクローニングし、レポーター細胞へと送達した。1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した(生物学的反復のN=2)。シトリンレポーターがオフである、mCherry陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。 抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、80アミノ酸の完全配列及びPfamアノテーション及びUniProtアノテーションにマッチするようにトリミングされた配列による、HUSH複合体のメンバーである、MPP8 Chromoドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。Pfamアノテーションにマッチするようにトリミングされた、52アミノ酸の配列による、CBX1 Chromoshadowドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。Pfamアノテーションにマッチするようにトリミングされた、65アミノ酸の配列による、ポリコーム1の構成要素である、SCMH1 SAM1ドメイン(また、SPMとしても公知である)の検証である。 抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、80アミノ酸の完全配列及びPfamアノテーションにマッチするようにトリミングされた、72アミノ酸の配列による、HERC2 Cyt-b5ドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。BIN1 SH3_9ドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。Pfamアノテーションにマッチするようにトリミングされた、39アミノ酸の配列による、ポリコーム1の構成要素である、PCGF2 zf-C3HC4_2ドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、80アミノ酸の完全配列及びPfamアノテーションにマッチするようにトリミングされた、68アミノ酸の配列による、TOX HMGボックスドメインの検証である。 抑制機能を伴うドメインの同定を示す図である。抑制因子として機能する、ランダム80アミノ酸の配列の検証である。 rTetR(SE-G72P)が、ヒト細胞内のKRABサイレンシングの漏洩を軽減することを示す図である。rTetR-KRAB融合体によるサイレンシングは、KRABドメインのサブセットについて、ドキシサイクリン処理を伴わないサイレンシングの漏洩を示す(ダークグレーバー)。0日目に、レンチウイルスにより、構築物を、レポーター細胞へと送達し、3~11日目の間に、細胞を、ブラストサイジンにより選択し、11日目に、細胞を、ドキシサイクリン処理又は非処理の条件に分け、16日目に、フローサイトメトリーにより、レポーターレベルを測定した。mCherry陽性細胞についてゲートをかけた後の結果を示す。KRABドメインは、スクリーンにおけるそれらの測定値に基づき、3つのカテゴリーから選択し、右側に表示した。バーは、平均を示し、誤差バーは、標準偏差(独立に形質導入された生物学的反復のN=3)を示す。 rTetR(SE-G72P)が、ヒト細胞内のKRABサイレンシングの漏洩を軽減することを示す図である。漏洩は、rTetR(SE-G72P)を使用する、又はrTetRと、ZNF823に由来するKRABドメインとの間に、3×FLAGを導入することにより軽減しうる。0日目に、レンチウイルスにより、構築物を、レポーター細胞へと送達し、4日目に、細胞を、ドキシサイクリン処理又は非処理の条件に分け、7日目に、フローサイトメトリーにより、レポーターレベルを測定した。mCherry陽性細胞についてゲートをかけた後の結果を示す。ZNF140に由来する、非漏洩KRABドメインを、対照として使用した。バーは、平均を示し、誤差バーは、標準偏差(独立に形質導入された生物学的反復のN=2)を示す。 rTetR(SE-G72P)が、ヒト細胞内のKRABサイレンシングの漏洩を軽減することを示す図である。rTetR又はrTetR(SE-G72P)との融合体としてクローニングされた、ZNF823に由来する、漏洩KRABドメイン又はZNF140に由来する、非漏洩抑制性KRABドメインの、レンチウイルスによる発現を安定的とするK562レポーター細胞系を、変動用量のドキシサイクリンにより処理した。4日後に、レポーターレベルを、フローサイトメトリーにより測定し、シトリンレポーターがオフである、mCherry陽性細胞の百分率を示す(独立に形質導入された生物学的反復のN=2)。用量反応を、PRISM統計解析ソフトウェアを使用する、非線形可変勾配S字型曲線を伴う、最小二乗法によりフィッティングした。 rTetR(SE-G72P)が、ヒト細胞内のKRABサイレンシングの漏洩を軽減することを示す図である。遺伝子サイレンシングモデルによりフィッティングされた、KRABドメインの個別の検証の全てについての、サイレンシング/メモリー動態である。rTetR(SE-G72P)-KRAB融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、10ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した(生物学的反復のN=2)。シトリンレポーターがオフである、mCherry陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。高速KRABサイレンシングドメイン間の、サイレンシング/メモリー能の差違を測定するのが容易なダイナミックレンジにおいて作動するように、10ng/mlのドキシサイクリンを使用した。ドキシサイクリンを1000ng/mlとした場合、ヒット抑制性KRABドメイン(緑及びオレンジ)の全ては、5日以内に、レポーターを、完全にサイレンシングし、動態は識別不可能であった(データは示さない)。とりわけ、rTetR上において漏洩性であったKRAB(オレンジ)は、rTetR(SE-G72P)と融合した場合、rTetR上において漏洩性でなかったKRAB(緑)と、有意に異なるメモリー動態を示さない。重要なことは、いずれのrTetR(SE-G72P)-KRAB融合体も、非処理条件下において、サイレンシングの有意な漏洩を示さなかったことである。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。フローサイトメトリーは、合成表面マーカーに結合するProG DynaBeadを使用する磁性分離の前後における、KRABライブラリーをプールされた細胞内のシトリンレポーターレベルを示す。重複ヒストグラムを、2連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。5、9及び13日目における、ZNF10 KRABドメインについての高深度突然変異スキャンライブラリーに対する、2連の生物学的反復による、オフ:オンスコアである。細胞を、最初の5日間にわたり、1000ng/mlのドキシサイクリンにより処理した。グレーの対角線は、平均log(オフ:オン)が、WTドメイン(黒色ドット)の中央値である場合を示す。黒色の対角線は、フィッティングされた直線モデルを示す。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。ヒトZNF10 KRABの、NMR構造(PDB:1v65)において使用されたマウスKRAB及び組換えタンパク質結合アッセイ(Pengら、2009)において使用されたKRAB-Oとのアライメントである。秩序領域は、図3において使用され、全ての必要な12残基を含有するアライメント領域は、図20Dにおいて使用される。5日目におけるサイレンシングに必要な残基を、ZNF10配列内及びPDB:1v65配列内において、赤色により着色した。組換えKAP1への結合に必要な残基を、赤色により着色し、組換えKAP1への結合に不要な残基を、KRAB-O配列内において、グレーにより着色し、既に公表されている結果(Pengら、2009)をまとめた。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。KRABのNMR構造(PDB:1v65)の20の状態の集成である。5日目におけるサイレンシングに必要な残基を、赤色により着色した。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。遺伝子サイレンシングモデルによりフィッティングされた、KRAB ZNF10突然変異体の個別の検証全てについての、サイレンシング/メモリー動態である(上)rTetR-KRAB融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した。(生物学的反復のN=2)。(下)rTetR(SE-G72P)-KRAB融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、10ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した(生物学的反復のN=2)。列表示は、KRABドメイン内の変異体位置及びエフェクター機能に対する影響について記載する。シトリンレポーターがオフである、mCherry陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。rTetR(SE-G72P)-KRAB融合体の全てはまた、1000ng/mlのドキシサイクリンによる、5日間の処理にわたっても測定したが、結果は、rTetRによる結果と識別不可能であり、全てのKRAB変異体は、サイレンシングしないEEW25AAA変異体を除き、レポーターを、完全にサイレンシングした(データは示さない)。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。Pfamドメインライブラリーによる、rTetR-KRAB融合体の発現レベルと、13日目におけるサイレンシングスコアとの相関である。IP/MS(Helleboidら、2019)により、抑制補因子であるKAP1と相互作用することが示されたKRABドメインだけを組み入れた。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。Pfamドメインについてのライブラリー及び対照にわたる、アミノ酸頻度の、ドメイン発現レベルとの相関である(ピアソンのr値を示す)。 CRISPRiにおいて使用された、ZNF10 KRABについての高深度突然変異スキャンを示す図である。K562へのレンチウイルス送達の後における、FLAGタグ付けrTetR-KRAB融合体についてのウェスタンブロットである。ブラストサイジンにより、細胞を、送達について選択し、フローサイトメトリーにより、>80%が、mCherry陽性であることを確認した。ImageJを使用して、H3ローディング対照と比べた発現レベルを定量した。 最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。磁性分離の前後における、活性化レポーター細胞内のPfamドメインについてのプールライブラリーに対するフローサイトメトリーである。オン細胞の百分率を、垂直方向の直線により描示された、シトリンレベルゲートの右側に示す。1~2連の生物学的反復を、重複領域に影を付して示す。 最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。カウントについてフィルターをかけた後のライブラリー内において、発現良好ドメインを含有する、全てのタンパク質についてのバックグラウンドセットと比較した、ヒット活性化ドメインを含有する遺伝子についてのGOタームエンリッチメントである。生のp値を示すが、示された全てのGOタームは、偽発見率が10%を下回った。 最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。活性化ドメインについての、個別の検証である。rTetR(SE-G72P)-ドメイン融合体を、レンチウイルスにより、K562レポーター細胞へと送達し、ブラストサイジンにより選択した。1000ng/mlのドキシサイクリンにより、細胞を、2日間にわたり処理し、次いで、フローサイトメトリーにより、シトリンレポーターレベルを測定した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、2連の生物学的反復を伴う。垂直方向の直線は、オン細胞の割合を決定するのに使用されたシトリンゲートを示し、ドキシサイクリン処理細胞について、オン細胞の平均の割合を示す。VP64は、陽性対照である。各ドメインを、Pfamアノテーション領域が、それぞれ、75~69アミノ酸であるため、最小の伸長を有した、Med9及びDUF3446を除き、いずれもが、ライブラリー配列又はトリミングPfamアノテーションドメイン配列から伸長した配列である、80アミノ酸の配列として調べた。KRABドメインについての80アミノ酸のライブラリー配列についての、対応する結果を、図14に示す。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。フローサイトメトリーは、合成表面マーカーに結合するProG DynaBeadを使用する磁性分離の前後における、タイリングライブラリーを発現する細胞のプール内の、シトリンレポーターレベルの分布を示す。重複ヒストグラムを、2連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。1000ng/mlのドキシサイクリンを、0日目に添加し、5日目に除去した。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ドキシサイクリン処理の5日目及びドキシサイクリン除去の8日後である13日目における、核タンパク質タイリングライブラリーについての、2連の生物学的反復による、ハイスループットリクルートメントの測定値である。ヒット判定閾値は、ランダム対照及びDMDタイリング対照の平均値を2標準偏差上回る値である。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。KRABの亜鉛フィンガータンパク質である、ZNF57及びZNF461についてのタイリング結果である。各バーは、80アミノ酸のタイルであり、垂直方向の誤差バーは、2連の生物学的反復による範囲である。タンパク質のアノテーションは、UniProtを出典とする。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。RYBPのタイリングである。概略図は、上方に記載されたUniProt IDを使用して検索された、タンパク質のアノテーションを示す。垂直方向の誤差バーは、2連の生物学的反復による標準誤差を示す。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。RESTのタイリングである。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。CBX7のタイリングである。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。DNMT3Bのタイリングである。 タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。(上)DMDのタイリングである。(下)DMDヒットタイルのリクルートメントの後における、サイレンシング及びメモリーの動態である。細胞を、最初の5日間にわたり、1000ng/mlのドキシサイクリンにより処理し、シトリンレポーターレベルをフローサイトメトリーにより測定した。バックグラウンドサイレンシングを説明するように、オフ細胞の百分率を正規化し、データ(ドット)を、遺伝子サイレンシングモデル(曲線)によりフィッティングした(生物学的反復のN=2)。
コンパクト転写エフェクタードメインのカタログを生成するシステム及び方法が提供される。さらに、一部の実施形態において、このドメインのカタログは、合成転写因子を操作するように、DNA結合性ドメインへと融合される。これらは、真核(又は他の)細胞内の遺伝子発現の、ターゲティングされた、微調整可能な調節を実施するのに使用される。この技術は、ハイスループットプラットフォームを利用して、細胞内の数万の合成転写因子をスクリーニングし、性質決定する。これらの合成転写因子は、DNA結合性ドメインと、転写エフェクタードメインとの融合体である。システムは、数百の短鎖エフェクタードメイン(例えば、80アミノ酸)を作出し、それらを、送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列(例えば、10アミノ酸)へと、さらに短縮するためのハイスループットステップを実施するのに使用されている。これらの融合体のターゲティングは、エフェクタードメインに応じて、mRNA転写の、負又は正への局所的調節をもたらす。これらの合成転写因子の一部は、因子自体が標的から放出された後においても遷延する、長期にわたるエピジェネティック調節を媒介する。
かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、DNA結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体を同定するのにも使用される。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用される。
例示的な適用は、以下を含むがこれらに限定されない:
プログラム可能なDNA結合性ドメイン(例えば、dCas9、dCas12a、亜鉛フィンガー、TALE)の、転写エフェクタードメインとの融合体による、内因性遺伝子の抑制/活性化のターゲティング;
遺伝子治療及び細胞療法(例えば、患者における病原性転写物をサイレンシングする)又は調査研究;
合成転写因子は、複数の遺伝子の発現を、同時に摂動させる(例えば、複数のガイドRNAを使用して、CRISPRi/aスクリーニングによる、ハイスループットの遺伝子相互作用マッピングを実施する)のに使用される;
遺伝回路内、例えば、誘導型遺伝子発現又はより複雑な回路内の合成転写因子の使用。これらの回路は、環境からの小分子インプットに応答する、治療的遺伝子発現アウトプットを達成するための、遺伝子治療(例えば、AAVによる抗体の送達)及び細胞療法(例えば、エクスビボにおけるCAR-T細胞の操作)において使用される。
本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。短鎖ドメイン(例えば≦80アミノ酸)が同定され、それらを、送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップがもたらされた。場合によって、10アミノ酸という短鎖である、強力なエフェクタードメインが同定された。一部の実施形態において、ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。生成されたドメインの大半は未だ、転写エフェクターとして報告されていない。加えて、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットプロセスも提供される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく支援される。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。
同定されたドメインのコレクションは、膨大かつ多様であり、プラットフォームは、新たな特性を伴う、合成転写因子(例えば、高速サイレンシングと、恒久的サイレンシングとの組合せを達成する、2つの抑制ドメインの組成物)を創出するように、ハイスループットにおいて、ドメインの新たな組合せを、融合体として調べることをたやすく可能とする。
転写をサイレンシングする又は活性化させることができる、数百に及ぶ未だ性質決定されていない又は未知であるエフェクタードメインは、DNA結合性ドメインへと融合されうる。例えば、ヒト細胞内において、レンチウイルススクリーニングを使用して、単一ドメイン及びドメイン対をスクリーニングするためのハイスループット法が提供される。ハイスループット法は、磁性分離を使用する、より効率的かつ廉価かつ迅速な、これらのライブラリーのスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能となる。
1.定義
本明細書において使用された、「~を含む(comprise、include)」、「~を有すること」、「~を有する」、「~しうる」、「~を含有する」という用語及びこれらの変化形は、さらなる行為又は構造の可能性を除外しない、オープンエンドの移行句、用語又は語句であることが意図される。文脈により別途明示されない限り、単数形の「ある(a)」、「ある(an)」及び「その」は、複数の指示対象を含む。明示される場合であれ、そうでない場合であれ、本開示はまた、本明細書において提示された態様又は要素「を含み」、これら「からなり」、これら「から本質的になる」他の態様も想定する。
本明細書における数値範囲の列挙のために、その間に介在する各数が、同じ程度の精度により想定される。例えば、6~9の範囲について、6及び9に加えて、数である7及び8も想定され、6.0~7.0の範囲について、数である、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9及び7.0も、明示的に想定される。
本明細書において別途規定されない限りにおいて、本開示において使用された、学術用語及び技術用語は、当業者により一般に理解された意味と同じ意味を有するものとする。例えば、本明細書において記載される細胞及び組織培養、分子生物学、免疫学、遺伝学並びにタンパク質化学及び核酸化学及びハイブリダイゼーションの技術との関連において使用される任意の用語法は、周知であり、当技術分野において一般的に使用されている。用語の意味及び範囲は、明確であるものとするが、万一、任意の潜在的曖昧さが生じた場合、本明細書において提供された定義が、任意の辞書又は外部の定義に対して優先される。さらに、文脈により、別途要求されない限りにおいて、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。
本明細書において使用された、「抗体」という用語は、細菌及びウイルスなどの異物を同定し、中和するように、免疫系により、内因的に使用されたタンパク質を指す。典型的に、抗体は、少なくとも1つの相補性決定領域(CDR)を含むタンパク質である。CDRは、抗原への結合の一因をなす、抗体の「超可変領域」(下記において、さらに論じられる)を形成する。全抗体は、典型的に、4つのポリペプチド:重(H)鎖ポリペプチドの、2つの同一なコピー及び軽(L)鎖ポリペプチドの、2つの同一なコピーからなる。重鎖の各々は、1つのN末端の可変(V)領域及び3つのC末端定常(CH1、CH2及びCH3)領域を含有し、各軽鎖は、1つのN末端可変(V)領域及び1つのC末端定常(C)領域を含有する。抗体の軽鎖は、それらの定常ドメインのアミノ酸配列に基づき、2つの顕著に異なる種類のうちの1つ、カッパ(κ)又はラムダ(λ)へと割り当てられうる。典型的抗体において、各軽鎖は、ジスルフィド結合により、重鎖へと連結され、2つの重鎖は、ジスルフィド結合により、互いへと連結される。軽鎖可変領域は、重鎖の可変領域とアライメントされ、軽鎖定常領域は、重鎖の第1の定常領域とアライメントされる。重鎖の定常領域の残余は、互いとアライメントされる。軽鎖と重鎖の各対の可変領域は、抗体の抗原結合性部位を形成する。V領域と、V領域とは、各領域が、4つのフレームワーク(FW又はFR)領域を含む、同じ一般的構造を有する。本明細書において使用された、「フレームワーク領域」という用語は、CDR間に配置された、可変領域内において比較的保存的なアミノ酸配列を指す。各可変ドメイン内に、4つのフレームワーク領域が存在し、これらは、FR1、FR2、FR3及びFR4と称されている。フレームワーク領域は、可変領域の構造フレームワークをもたらすβシートを形成する(例えば、C.A.Janewayら(編)、「Immunobiology」、第5版、Garland Publishing、New York、N.Y.(2001)を参照されたい)。フレームワーク領域は、3つのCDRにより接続される。上記において論じられた通り、CDR1、CDR2及びCDR3として公知である、3つのCDRは、抗原への結合の一因をなす、抗体の「超可変領域」を形成する。CDRは、フレームワーク領域により形成されたベータ-シート構造を接続し、場合によって、これらの一部を含む、ループを形成する。軽鎖及び重鎖の定常領域が、抗体の、抗原への結合に直接関与しないのに対し、定常領域は、可変領域の配向性に影響を及ぼしうる。定常領域はまた、エフェクター分子及び細胞との相互作用を介する、抗体依存性補体媒介溶解又は抗体依存性細胞傷害作用への参与など、多様なエフェクター機能も呈する。
本明細書において、「抗体の断片」、「抗体断片」及び抗体の「抗原結合性断片」という用語は、抗原に特異的に結合する能力を保持する、1つ以上の抗体の断片を指すように、互換的に使用される(一般に、Holligerら、Nat.Biotech.、23(9):1126~1129(2005)を参照されたい)。本明細書において記載された、抗体の任意の抗原結合性断片は、本発明の範囲内にある。抗体断片は、例えば、1つ以上のCDR、可変領域(又はこれらの部分)、定常領域(又はこれらの部分)又はこれらの組合せを含むことが所望される。抗体断片の例は、(i)Vドメイン、Vドメイン、Cドメイン及びCH1ドメインからなる一価断片である、Fab断片;(ii)ヒンジ領域におけるジスルフィド架橋により連結された、2つのFab断片を含む二価断片である、F(ab’)断片;(iii)抗体の単一のアームのVドメイン及びVドメインからなる、Fv断片;(iv)穏和な還元条件を使用する、F(ab’)断片のジスルフィド架橋の切断から生じる、Fab’断片;(v)ジスルフィド安定化Fv断片(dsFv);並びに(vi)抗原に特異的に結合する、抗体の単鎖可変領域ドメイン(V又はV)ポリペプチドである、ドメイン抗体(dAb)を含むがこれらに限定されない。
本明細書において使用された、「核酸」又は「核酸配列」とは、ピリミジン塩基及び/又はプリン塩基、好ましくは、それぞれ、シトシン、チミン及びウラシル並びにアデニン及びグアニンのポリマー又はオリゴマーを指す(Albert L.Lehninger、「Principles of Biochemistry」、793~800(Worth Pub.、1982)を参照されたい)。本技術は、任意のデオキシリボ核チド、リボ核チド又はペプチド核酸の構成要素及びこれらの塩基のメチル化形態、ヒドロキシメチル化形態又はグリコシル化形態など、これらの任意の化学的変異体を想定する。ポリマー又はオリゴマーは、組成物中において異種の場合もあり、同種の場合もあり、自然発生の供給源から単離される場合もあり、人工的に、又は合成的に作製される場合もある。加えて、核酸は、DNA若しくはRNA又はこれらの混合物であることが可能であり、ホモ二重鎖、ヘテロ二重鎖及びこれらのハイブリッド状態を含む、一本鎖形態又は二本鎖形態において、恒常的に存在する場合もあり、一過性に存在する場合もある。一部の実施形態において、核酸又は核酸配列は、例えば、DNA/RNAヘリックス、ペプチド核酸(PNA)、モルホリノ核酸(例えば、Braasch及びCorey、Biochemistry、41(14):4503~4510(2002)並びに米国特許第5,034,506号を参照されたい)、ロックト核酸(LNA;Wahlestedtら、Proc.Natl.Acad.Sci.U.S.A.、97:5633~5638(2000)を参照されたい)、シクロヘキシニル核酸(Wang、J.Am.Chem.Soc.、122:8595~8602(2000)を参照されたい)及び/又はリボザイムなど、他の種類の核酸構造を含む。よって、「核酸」又は「核酸配列」という用語はまた、天然ヌクレオチドと同じ機能を呈しうる、非天然ヌクレオチド、修飾ヌクレオチド及び/又は非ヌクレオチド構成要素(例えば、「ヌクレオチド類似体」)を含む鎖も包摂することが可能であり;さらに、本明細書において使用された、「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチド又はポリヌクレオチド及びこれらの断片又は部分並びに一本鎖の場合もあり、二本鎖の場合もあり、センス鎖を表す場合もあり、アンチセンス鎖を表す場合もある、ゲノム由来又は合成由来の、DNA又はRNAを指す。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」及び「オリゴヌクレオチド」という用語は、互換的に使用される。これらの用語は、デオキシヌクレオチド若しくはヌクレオチド又はこれらの類似体である、任意の長さのヌクレオチドのポリマー形態を指す。
「ペプチド」又は「ポリペプチド」とは、ペプチド結合により連結された、2つ以上のアミノ酸による連結配列である。ペプチド又はポリペプチドは、天然ペプチド又は天然ポリペプチドの場合もあり、合成ペプチド又は合成ポリペプチドの場合もあり、修飾ペプチド又は修飾ポリペプチドの場合もあり、天然ペプチド又は天然ポリペプチドと、合成ペプチド又は合成ポリペプチドとの組合せの場合もある。ポリペプチドは、結合性タンパク質、受容体及び抗体などのタンパク質を含む。タンパク質は、糖、脂質又はアミノ酸鎖内に含まれない、他の部分の付加により修飾されうる。「ポリペプチド」及び「タンパク質」という用語は、本明細書において、互換的に使用される。
本明細書において使用された、「配列同一性パーセント」という用語は、最大の同一性パーセントを達成するように、2つの配列をアライメントし、必要な場合、ギャップを導入した後における、参照配列内の、対応するヌクレオチド又はアミノ酸と同一である、核酸配列内のヌクレオチド若しくはヌクレオチド類似体又はアミノ酸配列内のアミノ酸の百分率を指す。よって、参照配列より長い、本技術に従う核酸の場合、参照配列とアライメントしない、核酸内のさらなるヌクレオチドは、配列同一性を決定するために考慮されない。最適のアライメントを得、2つ以上の配列の間の同一性を計算するための、多数の数学的アルゴリズムが公知であり、多数の、利用可能なソフトウェアプログラムへと組み込まれている。このようなプログラムの例は、CLUSTAL-W、T-Coffee及びALIGN(核酸配列及びアミノ酸配列のアライメントのための)、BLASTプログラム(例えば、BLAST 2.1、BL2SEQ及びこれらの最新バージョン)及びFASTAプログラム(例えば、FASTA3x、FAS(商標)及びSSEARCH)(配列アライメント及び配列類似性の検索のための)を含む。配列アライメントアルゴリズムはまた、例えば、Altschulら、J.Molecular Biol.、215(3):403~410(1990);Beigertら、Proc.Natl.Acad.Sci.USA、106(10):3770~3775(2009);Durbinら編、「Biological Sequence Analysis:Probabilistic Models of Proteins and Nucleic Acids」、Cambridge University Press、Cambridge、UK(2009);Soding、Bioinformatics、21(7):951~960(2005);Altschulら、Nucleic Acids Res.、25(17):3389~3402(1997);及びGusfield、「Algorithms on Strings、Trees and Sequences」、Cambridge University Press、Cambridge UK(1997)においても開示されている。
「ベクター」又は「発現ベクター」とは、細胞内における、接合されたセグメントの複製をもたらすように、別のDNAセグメント、例えば、「インサート」が接合される場合もあり、組み込まれる場合もある、プラスミド、ファージ、ウイルス又はコスミドなどのレプリコンである。
「野生型」という用語は、自然発生の供給源から単離されたときの、この遺伝子又は遺伝子産物の特徴を有する、遺伝子又は遺伝子産物を指す。野生型遺伝子は、集団内において、最も高頻度において観察される遺伝子であるので、任意に、遺伝子の「正常」形態又は「野生型」形態と称されている。これに対し、「修飾」、「突然変異体」又は「多型」という用語は、野生型の遺伝子又は遺伝子産物と比較した場合に、配列及び/又は機能的特性(例えば、特徴の変更)の修飾を提示する、遺伝子又は遺伝子産物を指す。自然発生の突然変異体も単離されうることが注目され;これらは、野生型の遺伝子又は遺伝子産物と比較した場合に、特徴が変更されているという事実により同定される。
2.転写修飾ドメインを同定するための方法
本明細書において、転写エフェクター(例えば、活性化及び抑制)ドメインを同定するための方法が開示される。一部の実施形態において、方法は、各々が誘導型DNA結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップ;レポーター細胞を、薬剤により、細胞内において、タンパク質及びmRNAのレベルが変更されるために(例えば、産生に起因する上昇、又は分解に起因する低下のために)必要な長さの時間にわたり処理するステップ;分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにタンパク質ドメインを、転写抑制因子又は活性化因子として同定するステップを含む。
方法は、各々が誘導型DNA結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップを含む。タンパク質ドメインは、80アミノ酸以下でありうる。一部の実施形態において、タンパク質ドメインは、約75アミノ酸、約70アミノ酸、約65アミノ酸、約60アミノ酸、約55アミノ酸、約50アミノ酸、約45アミノ酸、約40アミノ酸、約35アミノ酸、約30アミノ酸、約25アミノ酸、約20アミノ酸、約15アミノ酸、約10アミノ酸、又は約5アミノ酸でありうる。
タンパク質ドメインは、任意の公知のタンパク質に由来しうる。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。核局在化タンパク質は、タンパク質の寿命において、核へと、完全に、又は部分的に局在化された、又は局在化されうる核局在化タンパク質を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。
誘導型DNA結合性ドメインは、Tet/DOXテトラサイクリン誘導型システム、光誘導型システム、アブシシン酸(ABA)誘導型システム、クメートシステム、40HT/エストロゲン誘導型システム、エクジソンベース誘導型システム及びFKBP12/FRAP(FKBP12-ラパマイシン複合体)誘導型システムを含むがこれらに限定されない、DNAへの結合の誘導のための、任意のシステムを使用しうる。
一部の実施形態において、誘導型DNA結合性ドメインはタグを含む。タグは、化学的手段又は酵素的手段により除去可能なタグを含む、当技術分野において公知である、任意のタグを含みうる。本方法における使用に適するタグは、キチン結合性タンパク質(CBP)、マルトース結合性タンパク質(MBP)、Strepタグ、グルタチオン-S-トランスフェラーゼ(GST)、ポリヒスチジン(PolyHis)タグ、ALFAタグ、V5タグ、Mycタグ、ヘマグルチニン(HA)タグ、スポットタグ、T7タグ、NEタグ、カルモデュリンタグ、ポリグルタミン酸タグ、ポリアルギニンタグ、FLAGタグなどを含む。
方法は、レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップを含む。
プロモーターは、高転写速度を付与する(強いプロモーター)場合もあり、低転写速度を付与する(弱いプロモーター)場合もある。多くのプロモーターライブラリーが、実験により確立されており、プロモーター及びプロモーター強度の選出は、細胞型に依存する。一部の実施形態において、転写活性化ドメインを同定する場合、弱いプロモーターが使用されうる。一部の実施形態において、転写抑制ドメインを同定する場合、強いプロモーターが使用されうる。
細胞表面マーカーは、細胞膜へと接合された、タンパク質及び炭水化物を含む。当技術分野において、細胞表面マーカーは、一般に、様々な細胞型について公知であり、公知の分子生物学法に基づき、選り抜きのレポーター細胞内において発現されうる。表面マーカーは、膜貫通ドメインへと接合されたマーカーポリペプチドを含む、合成表面マーカーでありうる。例えば、マーカーポリペプチドは、膜貫通ドメインへと接合された、抗体又はその断片(例えば、Fc領域)を含みうる。一部の実施形態において、マーカーポリペプチドは、ヒトIgG1 Fc領域であり、合成表面マーカーは、膜貫通ドメインへと接合された、ヒトIgG1 Fc領域を含む。
当技術分野において、蛍光タンパク質は、周知であり、多様な細胞のコンパートメント内において、入射光の波長の変動の結果として蛍光発光するように適合されたタンパク質を含む。蛍光タンパク質の例は、フィコビリタンパク質、シアン蛍光タンパク質(CFP)、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、増強オレンジ蛍光タンパク質(OFP)、増強緑色蛍光タンパク質(eGFP)、改変緑色蛍光タンパク質(emGFP)、増強黄色蛍光タンパク質(eYFP)及び/又は単量体赤色蛍光タンパク質(mRFP)並びにこれらの誘導体及び変異体を含む。
方法は、表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップを含む。当技術分野において、本明細書において開示された方法による使用に適する、多数の細胞分離法が公知であり、例えば、免疫磁性細胞分離、蛍光活性化細胞分取(FACS)及びマイクロ流体細胞分取を含む。一部の実施形態において、細胞分離は、免疫磁性細胞分離を含む。
一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、分離するステップ、シーケンシングするステップ、計算するステップ及び同定するステップを、1回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップは、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される。
一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。タンパク質ドメインの発現レベルは、タンパク質自体又はその任意のタグ若しくは標識についての免疫ブロット法及びイムノアッセイを含む、当技術分野において公知である、任意の方法を使用して決定されうる。一部の実施形態において、発現レベルは、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。
一部の実施形態において、方法は、転写抑制ドメインを同定する。一部の実施形態において、方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも3日間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも3日間、少なくとも4日間、少なくとも5日間、少なくとも6日間、少なくとも7日間、少なくとも8日間、少なくとも9日間、少なくとも10日間、少なくとも14日間以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、薬剤により、3~12日間、3~10日間、3~7日間、又は3~5日間にわたり処理される。
タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のlog2が、陰性対照の平均値から少なくとも2標準偏差である(例えば、大きい)場合に、転写抑制因子として同定される(例えば、図1Cを参照されたい)。
一部の実施形態において、方法は、転写活性化ドメインを同定する。一部の実施形態において、方法は、a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ;c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びにg)タンパク質ドメインを、転写抑制因子として同定するステップを含む。
一部の実施形態において、レポーター細胞は、薬剤により、少なくとも24時間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも24時間(1日間)、少なくとも36時間、少なくとも48時間(2日間)、少なくとも60時間、少なくとも72時間(3日間)、少なくとも94時間、少なくとも106時間(4日間)以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、24~72時間の間又は36~60時間の間にわたり処理される。
タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のlog2が、陰性対照の平均値から少なくとも2標準偏差である(例えば、小さい)場合に、転写活性化因子として同定される(例えば、図5Bを参照されたい)。
3.転写因子
本開示においてまた、異種DNA結合性ドメインへと融合した1つ以上の転写エフェクタードメインを含む合成転写因子も提供される。本明細書において使用された、「転写因子」という用語は、目的のゲノム遺伝子座又は遺伝子と関連づけられた、特異的DNA配列と、直接的に、又は間接的に相互作用して、RNAポリメラーゼ活性を、遮断する、又は遺伝子若しくは遺伝子セットのためのプロモーター部位へとリクルートする、タンパク質又はポリペプチドを指す。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~896のうちのいずれかに対する少なくとも70%(例えば、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、99%)の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せは、本明細書において開示された方法により同定される。
一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写エフェクタードメイン(例えば、転写活性化ドメイン、転写抑制ドメイン又はこれらの組合せ)を含む。一部の実施形態において、合成転写因子は、異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む。2つ以上のエフェクタードメインは、任意の配向性において、DNA結合性ドメインへの融合が可能であり、アミノ酸リンカーにより、互いから隔てられうる。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、合成転写因子は、当技術分野において公知である、少なくとも1つのさらなるエフェクタードメインと共に、本明細書において開示された少なくとも1つの転写活性化ドメイン又は少なくとも1つの転写抑制ドメインを含みうる。例えば、参照によりその全体において本明細書に組み込まれた、Tycko J.ら、Cell、2020年12月23日、183(7):2020~2035を参照されたい。一部の実施形態において、1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメインは、本明細書において記載された方法により同定される。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、配列番号563~596のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写活性化ドメインのうちの少なくとも1つは、表2において見出されるものから選択される。
一部の実施形態において、合成転写因子が、1つを超える転写エフェクタードメインを含む場合、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、配列番号666のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む。一部の実施形態において、1つ以上の転写抑制ドメインのうちの少なくとも1つは、表1、3又は4において見出されるものから選択される。
DNA結合性ドメインは、二本鎖DNA又は一本鎖DNAに、全般的に、又は配列特異的に結合することが可能である、任意のポリペプチドである。DNA結合性ドメインは、ヘリックス-ターン-ヘリックスモチーフ、亜鉛フィンガー、ロイシンジッパー、HMGボックス(high mobility group box)ドメイン、ウィングドヘリックス領域、ウィングドヘリックス-ターン-ヘリックス領域、ヘリックス-ループ-ヘリックス領域、免疫グロブリンフォールド、B3ドメイン、Wor3ドメイン、TALエフェクターDNA結合性ドメインなどを有するポリペプチドを含む。異種DNA結合性ドメインは、天然結合性ドメインでありうる。一部の実施形態において、異種DNA結合性ドメインは、プログラム可能なDNA結合性ドメイン、例えば、所定のヌクレオチド配列に結合するように、天然DNA結合性ドメインの、1つ以上のアミノ酸を変更することにより操作された、例えば、DNA結合性ドメインを含む。
一部の実施形態において、DNA結合性ドメインは、標的DNA配列に、直接結合することが可能である。
DNA結合性ドメインは、AvrBs3、Hax2、Hax3又はHax4(Bonasら、1989、Mol Gen Genet、218(1):127~36;Kayら、2005、Mol Plant Mcrobe Interact 18(8):838~48)など、自然発生の転写活性化因子様エフェクター(TALE)内に見出されたドメインに由来しうる。TALEは、残基の反復配列からなる、モジュラーDNA結合性ドメインを有し、各リピート領域は、34アミノ酸からなる。各リピート領域の第12位及び第13位における残基対は、ヌクレオチドの特異性を決定し、領域の組み合わせは、配列特異的TALE DNA結合性ドメインの合成を可能とする。一部の実施形態において、TALE DNA結合性ドメインは、DNA結合性ドメインに、任意の標的配列に対する、選り抜きの特異性をもたらすように、公知の方法を使用して操作されうる。DNA結合性ドメインは、複数の(例えば、2つ、3つ、4つ、5つ、6つ、10、20以上の)TalエフェクターDNA結合性モチーフを含みうる。特に、本転写因子において援用される、配列特異的DNA結合性ドメインを形成するように、任意の数のヌクレオチド特異的Talエフェクターモチーフが、組み合わされうる。
一部の実施形態において、DNA結合性ドメインは、外因性因子と呼応して、標的DNAと会合する。
一部の実施形態において、DNA結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質(例えば、触媒不活化Cas9)に由来し、ガイドRNAを介して、標的DNAと会合する。gRNA自体は、DNA標的配列の1つの鎖及び足場配列と相補性の配列であって、標的DNA配列に結合し、これを、Cas9へとリクルートする配列を含む。本明細書において記載された転写因子は、CRISPR干渉(CRISPRi)又はCRISPR活性化(CRISPRa)に有用でありうる。
ガイドRNA(gRNA)は、crRNA、crRNA/tracrRNA(又は単鎖ガイドRNA、sgRNA)でありうる。gRNAは、非自然発生gRNAでありうる。「gRNA」、「ガイドRNA」及び「ガイド配列」という用語は、本明細書を通して互換的に使用される場合があり、Casタンパク質の特異性への結合を決定する配列を含む核酸を指す。gRNAは、DNA標的配列とハイブリダイズする(部分的に、又は完全に相補性である)。
標的核酸(標的部位)とハイブリダイズする、gRNA又はその一部は、選択的ハイブリダイゼーションに必要な、任意の長さでありうる。gRNA又はsgRNA(複数可)は、約5~約100ヌクレオチドの間の長さ、又はそれ以上(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、又は100ヌクレオチドの長さ以上)でありうる。
gRNAのデザインを容易とするために、多くの計算ツールが開発されている(Prykhozhijら(PLoS ONE、10(3):(2015));Zhuら(PLoS ONE、9(9)(2014));Xiaoら(Bioinformatics.、1月21日(2014));Heigwerら(Nat Methods、11(2):122~123(2014))を参照されたい)。ガイドRNAをデザインするための方法及びツールについて、参照により本明細書に組み込まれる、Zhu(Frontiers in Biology、10(4)、289~296頁(2015))により論じられている。加えて、Genscript Interactive CRISPR gRNA Design Tool、WU-CRISPR、and Broad Institute GPP sgRNA Designerを含むがこれらに限定されない、sgRNAのデザイン(複数可)を容易とするのに使用されうる、多くのソフトウェアツールが公表されている。ゲノムワイドのgRNAのデータベースである、IDT DNA Predesigned Alt-R CRISPR-Cas9 guide RNA、Addgene Validated gRNA Target Sequences及びGenScriptを含むがこれらに限定されない、多くの種(ヒト、マウス、ラット、ゼブラフィッシュ、C.エレガンス(C.elegans))の、ゲノム内の、多くの遺伝子及び位置をターゲティングするようにあらかじめデザインされたgRNA配列もまた、公表されている。
本開示はまた、本明細書において開示された、合成転写因子又は転写エフェクタードメイン(例えば、活性化ドメイン又は抑制ドメイン)をコードする核酸も提供する。例えば、エフェクタードメインは、表1~3に開示された核酸によりコードされうる。一部の実施形態において、エフェクタードメインは、配列番号897~1329のうちのいずれかに対して、少なくとも70%の同一性を有する核酸コードされうる。一部の実施形態において、核酸は、1つ以上の合成転写因子又は1つ以上のエフェクタードメインをコードする。
本開示の核酸は、当技術分野に公知の多数のプロモーターのうちのいずれかを含む場合があり、この場合、プロモーターは、構成的プロモーター、調節的プロモーター又は誘導型プロモーター、細胞型特異的プロモーター、組織特異的プロモーター又は種特異的プロモーターである。転写を方向付けるのに十分な配列に加えて、本発明のプロモーター配列はまた、転写をモジュレートすることに関与する、他の調節的エレメントの配列(例えば、エンハンサー、Kozak配列及びイントロン)も含みうる。当技術分野において、遺伝子の構成的発現を駆動するために有用な、多くのプロモーター/調節配列が利用可能であり、例えば、CMV(サイトメガロウイルスプロモーター)、EF1a(ヒト伸長因子1アルファプロモーター)、SV40(サル空胞化ウイルス40プロモーター)、PGK(哺乳動物のホスホグリセリン酸キナーゼプロモーター)、Ubc(ヒトユビキチンCプロモーター)、ヒトベータ-アクチンプロモーター、齧歯動物ベータ-アクチンプロモーター、CBh(ニワトリベータ-アクチンプロモーター)、CAG(ハイブリッド体プロモーターは、CMVエンハンサー、ニワトリベータアクチンプロモーター及びウサギベータ-グロビンスプライスアクセプターを含有する)、TRE(テトラサイクリン応答エレメントプロモーター)、H1(ヒトポリメラーゼIIIRNAプロモーター)、U6(ヒトU6小核プロモーター)などを含むがこれらに限定されない。本システムの構成要素の発現のために使用されうる、さらなるプロモーターは、限定せずに述べると、サイトメガロウイルス(CMV)中間初期プロモーター、ラウス肉腫ウイルスLTR、HIV-LTR、ハイスループットLV-1LTR、モロニーマウス白血病ウイルス(MMLV)LTR、骨髄増殖性肉腫ウイルス(MPSV)LTR、脾臓フォーカス形成ウイルス(SFFV)LTRなどのウイルスLTR、サルウイルス40(SV40)初期プロモーター、単純ヘルペスtkウイルスプロモーター、EF1-αイントロンを伴う、又は伴わない、伸長因子1アルファ(EF1-α)プロモーターを含む。さらなるプロモーターは、任意の構成的に活性のプロモーターを含む。代替的に、任意の調節的プロモーターは、その発現が、細胞内においてモジュレートされうるように使用されうる。
さらに、誘導型発現は、このような分子をコードする核酸を、誘導型プロモーター/調節配列の制御下に置くことにより達せられうる。当技術分野において周知のプロモーターは、金属、グルココルチコイド、テトラサイクリン、ホルモンなどの誘導剤に応答した誘導が可能であり、また、本発明による使用のためにも想定される。したがって、本開示は、これらへと作動可能に連結された、所望のタンパク質の発現を駆動することが可能である、当技術分野において公知の、任意のプロモーター/調節配列の使用を含むことが察知される。
本開示はまた、核酸を含有するベクター及び核酸又はそのベクターを含有する細胞も提供する。ベクターは、適切な細胞内において、核酸を繁殖させるのに使用される場合もあり、かつ/又は核酸(例えば、発現ベクター)からの発現を可能とするのに使用される場合もある。当業者は、核酸配列の繁殖及び発現に利用可能な、多様なベクターについて承知している。
本転写因子を発現させる細胞を構築するために、常套的な方法を介して、本システムの、安定的発現又は一過性発現のための発現ベクターを構築し、細胞へと導入することができる。例えば、本開示の転写因子の構成要素をコードする核酸又は他の核酸若しくはタンパク質を、適切なプロモーターへの作動可能な連結下において、プラスミド又はウイルスベクターなど、適切な発現ベクターへとクローニングすることができる。発現ベクター/プラスミド/ウイルスベクターの選択は、真核細胞内の組込み及び複製に適するものとする。
ある特定の実施形態において、本開示のベクターは、哺乳動物用発現ベクターを使用して、哺乳動物細胞内の、1つ以上の配列の発現を駆動しうる。哺乳動物用発現ベクターの例は、pCDM8(参照により本明細書に組み込まれる、Seed、Nature(1987)、329:840)及びpMT2PC(参照により本明細書に組み込まれる、Kaufmanら、EMBOJ.(1987)6:187)を含む。哺乳動物細胞内において使用される場合、発現ベクターの制御機能は、典型的に、1つ以上の調節エレメントによりもたらされる。例えば、一般に使用されているプロモーターは、ポリオーマウイルス、2型アデノウイルス、サイトメガロウイルス、サルウイルス40及び本明細書において開示され、当技術分野において公知である、他のウイルスに由来する。原核細胞及び真核細胞のいずれにも適する、他の発現系について、例えば、参照により本明細書に組み込まれる、Sambrookら、「MOLECULAR CLONING:A LABORATORY MANUAL」、2版、Cold Spring Harbor Laboratory、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、1989の16及び17章を参照されたい。
本開示のベクターは、特定の細胞型内の核酸の発現を方向付けうる(例えば、組織特異的調節エレメントは、核酸を発現させるのに使用される)。このような調節エレメントは、組織特異的の場合もあり、細胞特異的の場合もあるプロモーターを含む。プロモーターへと適用された場合の、「組織特異的」という用語は、異なる組織型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、目的のヌクレオチド配列の選択的発現を、特異的組織型(例えば、種子)へと方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語は、同じ組織内の、異なる細胞型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、特異的細胞型内の、目的のヌクレオチド配列の選択的発現を方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語はまた、単一組織内の領域において、目的のヌクレオチド配列の選択的発現を促進することが可能なプロモーターも意味する。プロモーターの細胞型特異性は、当技術分野において周知の方法、例えば、免疫組織化学的染色を使用して評価されうる。
加えて、ベクターは、例えば、以下の一部又は全部:宿主細胞内における、安定的形質転換体又は一過性形質転換体を選択するための、選択用マーカー遺伝子;転写終結シグナル及びRNAプロセシングシグナル;5’非翻訳領域及び3’非翻訳領域;多目的の多重クローニング部位である、内部リボソーム結合部位(IRES);並びにキメラ受容体の発現を評価するためのレポーター遺伝子を含有しうる。トランス遺伝子を含有するベクターを作製するために適する、ベクター及び方法は、周知であり、当技術分野において利用可能である。選択用マーカーは、クロラムフェニコール耐性、テトラサイクリン耐性、スペクチノマイシン耐性、ネオマイシン、ストレプトマイシン耐性、エリスロマイシン耐性、リファンピシン耐性、ブレオマイシン耐性、熱適合カナマイシン耐性、ゲンタマイシン耐性、ヒグロマイシン耐性、トリメトプリム耐性、ジヒドロ葉酸レダクターゼ(DHFR)、GPT;S.セレビシエ(S.cerevisiae)の遺伝子である、URA3、HIS4、LEU2及びTRP1を含む。
細胞へと導入された場合、ベクターは、自律的複製配列又は染色体外エレメントとして維持される場合もあり、宿主DNAへと組み込まれる場合もある
したがって、本開示は、本明細書において開示された、合成転写因子、核酸又はベクターを含む細胞をさらに提供する。
常套的なウイルスベースの遺伝子導入法及び非ウイルスベースの遺伝子導入法は、核酸を、細胞、組織又は対象へと導入するのに使用されうる。このような方法は、核酸を、培養物中の細胞又は宿主生物における細胞へと投与するのに使用されうる。非ウイルスベクター性の送達システムは、DNAプラスミド、コスミド、RNA(例えば、本明細書において記載されたベクターの転写物)、核酸及び送達媒体と複合体化された核酸を含む。
ウイルスベクター性の送達システムは、細胞へと送達された後において、エピソーム性である又はゲノムへと組み込まれたDNAウイルス及びRNAウイルスを含む。様々なウイルス構築物は、本核酸を、細胞、組織及び/又は対象へと送達するのに使用されうる。ウイルスベクターは、例えば、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター及び単純ヘルペスウイルスベクターを含む。このような組換えウイルスの非限定例は、組換えアデノ随伴ウイルス(AAV)、組換えアデノウイルス、組換えレンチウイルス、組換えレトロウイルス、組換え単純ヘルペスウイルス、組換えポックスウイルス、ファージなどを含む。本開示は、レトロウイルス又はレンチウイルスなど、宿主ゲノムへの組込みが可能なベクターを提示する。参照により本明細書に組み込まれる、例えば、Ausubelら、「Current Protocols in Molecular Biology」、John Wiley & Sons、New York、1989;Kay,M.A.ら、2001、Nat.Medic.、7(1):33~40;並びにWalther W.及びStein U.、2000、Drugs、60(2):249~71を参照されたい。
核酸又は転写因子は、任意の適切な手段により送達されうる。ある特定の実施形態において、核酸又はそのタンパク質は、インビボにおいて送達される。他の実施形態において、核酸又はそのタンパク質は、疾患又は状態を患う患者へのインビボ送達に有用な、改変細胞をもたらすように、インビトロ又はエクスビボにおいて、分離/培養細胞へと送達される。
多種多様な宿主細胞が、本開示に従うベクターにより形質転換される場合もあり、トランスフェクトされる場合もあり、本開示に従うベクターが、他の方式において、多種多様な宿主細胞へと導入される場合もある。トランスフェクションとは、任意のコード配列が、実際に発現されるのであれ、発現されないのであれ、ベクターが細胞に取り込まれることを指す。当業者に、多数のトランスフェクション法、例えば、リポフェクタミン、リン酸カルシウム共沈殿、電気穿孔、DEAEデキストラン処理、マイクロインジェクション、ウイルス感染及び当技術分野において公知である、他の方法が公知である。形質導入とは、ウイルスの、細胞への侵入及びウイルスベクターゲノムにより送達された配列の発現(例えば、転写及び/又は翻訳)を指す。組換えベクターの場合、「形質導入」とは、一般に、組換えウイルスベクターの、細胞への侵入及びベクターゲノムにより送達された目的の核酸の発現を指す。
当技術分野において、ベクターを、細胞へと送達する方法が周知であり、DNA又はRNAの電気穿孔、リポソームなどのトランスフェクション試薬又はDNA若しくはRNAを送達するためのナノ粒子;機械的変形による、DNA、RNA、又はタンパク質の送達(例えば、参照により本明細書に組み込まれる、Shareiら、Proc.Natl.Acad.Sci.USA(2013)、110(6):2082~2087を参照されたい);又はウイルスによる形質導入を含みうる。一部の実施形態において、ベクターは、ウイルスによる形質導入を介して、宿主細胞へと送達される。核酸は、プラスミド又はウイルスベクターなど、大型の構築物の一部として送達される場合もあり、例えば、電気穿孔、脂質小胞、ウイルス輸送体、マイクロインジェクション及びバイオリスティック法(高速粒子ボンバードメント)により直接送達される場合もある。同様に、1つ以上のトランス遺伝子を含有する構築物は、核酸を、細胞へと導入するために適切な、任意の方法により送達されうる。一部の実施形態において、本システムの構成要素をコードする構築物又は核酸は、DNA分子である。一部の実施形態において、本システムの構成要素をコードする核酸は、DNAベクターであり、細胞へと電気穿孔されうる。一部の実施形態において、本システムの構成要素をコードする核酸は、細胞へと電気穿孔されうる、RNA分子である。
加えて、ナノ粒子ベースの送達システム及び脂質ベースの送達システムなどの送達媒体も使用されうる。さらなる送達媒体の例は、レンチウイルスベクター、リボ核タンパク質(RNP)複合体、脂質ベースの送達システム、遺伝子銃、流体力学法、電気穿孔又はヌクレオフェクション、マイクロインジェクション及びバイオリスティック法を含む。多様な遺伝子送達法は、参照により本明細書に組み込まれる、Nayerossadatら(Adv Biomed Res.、2012、1:27)及びIbraheemら(Int J Pharm.、2014年1月1日、459(1~2):70~83)により、詳細に論じられている。
このように、本開示は、本明細書において開示されたベクター(複数可)又は核酸(複数可)を含む分離細胞を提供する。好ましい細胞は、容易に、かつ、信頼できる形において増殖し、増殖速度が、妥当な程度に高速であり、発現系が、十分に特徴づけられており、容易に、かつ、効率的に形質転換又はトランスフェクトされうる細胞である。適切な原核細胞の例は、バチルス属(Bacillus)(バチルス・スブチリス(Bacillus subtilis)及びバチルス・ブレビス(Bacillus brevis)など)、エシェリキア属(Escherichia)(E.コリー(E.coli)など)、シュードモナス属(Pseudomonas)、ストレプトマイセス属(Streptomyces)、サルモネラ属(Salmonella)及びエルウィニア属(Erwinia)に由来する細胞を含むがこれらに限定されない。適切な真核細胞は、当技術分野において公知であり、例えば、酵母細胞、昆虫細胞及び哺乳動物細胞を含む。適切な酵母細胞の例は、クルイベロマイセス属(Kluyveromyces)、ピキア属(Pichia)、リノスポリジウム属(Rhinosporidium)、サッカロマイセス属(Saccharomyces)及びスキゾサッカロマイセス属(Schizosaccharomyces)に由来する酵母細胞を含む。例示的な昆虫細胞は、Sf-9細胞及びHIS細胞(Invitrogen、Carlsbad、Calif.)を含み、例えば、参照により本明細書に組み込まれる、Kittsら、Biotechniques、14:810~817(1993);Lucklow、Curr.Opin.Biotechnol.、4:564~572(1993)並びにLucklowら、J.Virol.、67:4566~4579(1993)において記載されている。細胞は、哺乳動物細胞であることが所望され、一部の実施形態において、細胞は、ヒト細胞である。当技術分野において、多数の適切な哺乳動物宿主細胞及びヒト宿主細胞が公知であり、これらのうちの多くは、American Type Culture Collection(ATCC、Manassas、Va.)から入手可能である。適切な哺乳動物細胞の例は、チャイニーズハムスター卵巣細胞(CHO)(ATCC受託番号:CCL61)、CHO DHFR細胞(Urlaubら、Proc.Natl.Acad.Sci.USA、97:4216~4220(1980))、ヒト胎児性腎臓(HEK)293細胞又はHEK 293T細胞(ATCC受託番号:CRL1573)及び3T3細胞(ATCC受託番号:CCL92)を含むがこれらに限定されない。他の適切な哺乳動物細胞系は、サルCOS-1細胞系(ATCC受託番号:CRL1650)及びCOS-7細胞系(ATCC受託番号:CRL1651)のほか、CV-1細胞系(ATCC受託番号:CCL70)である。さらなる例示的な哺乳動物宿主細胞は、形質転換細胞系を含む、霊長動物細胞系、齧歯動物細胞系及びヒト細胞系を含む。正常二倍体細胞、初代組織のインビトロ培養物に由来する細胞株のほか、初代外植片もまた適する。他の適切な哺乳動物細胞系は、マウス神経芽細胞腫N2A細胞、HeLa細胞、HEK細胞、A549細胞、HepG2細胞、マウスL-929細胞及びBHKハムスター細胞系又はHaKハムスター細胞系を含むがこれらに限定されない。
当技術分野において、細胞の形質転換、培養物、増幅、スクリーニング及び精製に適する哺乳動物細胞及び方法を選択するための方法が公知である。
本発明はまた、本明細書において記載された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムも対象とする。一部の実施形態において、組成物又はシステムは、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む。
一部の実施形態において、組成物又はシステムは、gRNAをさらに含む。gRNAは、合成転写因子と同じ核酸上においてコードされる場合もあり、異なる核酸上においてコードされる場合もある。一部の実施形態において、合成転写因子をコードするベクターは、同じプロモーター下において、gRNAをさらにコードする場合もあり、異なるプロモーター下において、gRNAをさらにコードする場合もある。一部の実施形態において、gRNAは、転写因子のベクターと隔てられた、その固有のベクター上においてコードされる。
4.遺伝子発現をモジュレートする方法
本開示はまた、細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法であって、細胞へと、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む方法も提供する。一部の実施形態において、少なくとも2つの遺伝子の遺伝子発現がモジュレートされる。
発現のモジュレーションは、標的遺伝子についての正常な遺伝子発現と比較した、遺伝子発現の増大又は低下を含む。少なくとも2つの遺伝子の遺伝子発現がモジュレートされる場合、いずれの遺伝子の遺伝子発現も増大する場合もあり、いずれの遺伝子の遺伝子発現も低下する場合もあり、一方の遺伝子の遺伝子発現は増大するが、他方の遺伝子の遺伝子発現は低下する場合もある。
細胞は、原核細胞の場合もあり、真核細胞の場合もある。好ましい実施形態において、細胞は、真核細胞である。一部の実施形態において、細胞は、インビトロにおける細胞である。一部の実施形態において、細胞は、エクスビボにおける細胞である。
一部の実施形態において、細胞は、開示されたシステム、組成物、ベクターの、細胞への導入が、対象への投与を含むように、生物又は宿主における細胞である。方法は、インビボにおいて、又はエクスビボにおいて処理された細胞の移入により、本明細書において記載された少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと提供又は投与するステップを含みうる。
「対象」は、ヒトの場合もあり、ヒト以外の場合もあり、例えば、本明細書において記載されたマウスモデルなど、調査研究を目的とする「モデル系」として使用された、動物株又は動物種を含みうる。同様に、対象は、成人又は若年者(例えば、小児)を含みうる。さらに、対象とは、本明細書において想定された組成物の投与から利益を得うる、任意の生物、好ましくは、哺乳動物(例えば、ヒト又は非ヒト哺乳動物)を意味しうる。哺乳動物の例は、哺乳動物のクラス:ヒト、チンパンジー並びに他の類人猿種及びサル種などの非ヒト霊長動物;ウシ、ウマ、ヒツジ、ヤギ、ブタなどの農場動物;ウサギ、イヌ及びネコなどの愛玩動物;ラット、マウス及びモルモットなどの齧歯動物を含む実験動物などのうちの任意のメンバーを含むがこれらに限定されない。非哺乳動物の例は、鳥類、魚類などを含むがこれらに限定されない。本明細書で提供された方法及び組成物についての一実施形態において、哺乳動物は、ヒトである。
本明細書において使用された、「~を施すこと」、「~を投与すること」、「~を導入すること」という用語は、本明細書において、互換的に使用され、所望の部位への、システムの少なくとも部分的な局在化を結果としてもたらす方法又は経路による、本開示のシステムの、対象への留置を指す。システムは、対象における所望の位置への送達を結果としてもたらす、任意の適切な経路により投与されうる。
5.キット
エフェクタードメイン若しくはDNA結合性ドメイン又はこれらの組合せをコードする、少なくとも1つの核酸のうちの少なくとも1つ又は全て、少なくとも1つの合成転写因子又はこれをコードする核酸、少なくとも1つのエフェクタードメイン又は少なくとも1つの合成転写因子をコードするベクター、本明細書において記載された組成物又はシステム、エフェクタードメイン、DNA結合性ドメイン、合成転写因子、又はこれらのうちのいずれかをコードする核酸を含む細胞、本明細書において記載されたレポーター細胞及び本明細書において記載された、二部構成型レポーター遺伝子又はこれをコードする核酸を含むキットもまた、本開示の範囲内にある。
キットはまた、キットの構成要素を使用するための指示書も含みうる。指示書とは、キットに関する、関与性の材料又は方法である。材料は、以下:背景情報、構成要素の一覧、組成物を使用するための、略式プロトコール又は詳細プロトコール、トラブルシューティング、参考文献、テクニカルサポート及び他の任意の関連文献の、任意の組合せを含みうる。指示書は、キットと共に提供される場合もあり、別個のメンバー構成要素である、紙形態として提供される場合もあり、コンピューター読取り型メモリーデバイス上において提供される場合もあり、インターネット上のウェブサイトからダウンロードされる場合もあり、表示の記録として提示される場合もある、電子的形態として提供される場合もある。
開示されたキットは、開示された方法との関連において援用されうることが理解される。キットは、本明細書において記載された方法のうちのいずれかにおける使用のための指示書を含みうる。指示書は、抑制ドメインを同定する方法又は遺伝子発現をモジュレートする方法のための構成要素の使用についての記載を含みうる。
本明細書において提供されたキットは、適切にパッケージングされている。適切なパッケージングは、バイアル、ボトル、ジャー、可撓性パッケージングなどを含むがこれらに限定されない。
キットは、任意選択的に、緩衝液解釈のための情報などの、さらなる構成要素を提供しうる。通常、キットは、容器及び容器上の表示又は容器に付属するパッケージ添付文書(複数可)を含む。一部の実施形態において、本開示は、上記において記載されたキットの内容物を含む製品を提供する。
キットは、本システム又は本組成物を保持又は投与するためのデバイスをさらに含みうる。デバイスは、注入デバイス、静脈内溶液バッグ、皮下注射針、バイアル及び/又はシリンジを含みうる。
本開示はまた、インビトロにおいて、方法を実施する、又は構成要素を作製するためのキットも提供する。キットは、本システムの構成要素を含みうる。キットの任意選択的な成分は、以下:(1)緩衝液構成成分、(2)対照プラスミド、(3)シーケンシングプライマーのうちの1つ以上を含む。
6.実施例
ヒト遺伝子の発現は、転写を活性化させる、又は抑制する、数千のタンパク質により調節されている。我々は、これらのタンパク質の遺伝子発現の変化を媒介するのに十分なドメインである、エフェクタードメインについての、完全かつ定量的な記載を欠いている。ヒト細胞内の転写エフェクタードメインを体系的に測定するために、本明細書において、タンパク質ドメインのライブラリーが、DNA結合性ドメインへと融合され、レポーター遺伝子へとリクルートされる、ハイスループットアッセイが提供される。次いで、細胞が、レポーターの発現レベルにより分離され、タンパク質ドメインのライブラリーが、シーケンシングされる。レポーターは、磁性ビーズを使用する、細胞数千万個の、高発現集団及び低発現集団への、単純な分離を容易とする、合成表面マーカーである。
遺伝子サイレンシング及びエピジェネティックメモリーを、≦80アミノ酸である、全ての核タンパク質ドメインのリクルートメントの後において定量した。>300のKRABドメイン及び>200のホメオドメインの全ファミリーについての測定を使用して、転写因子の抑制ドメイン強度と、それらの進化履歴及び発生的役割との関係を発見した。さらに、ZNF10 KRABエフェクター機能について、高深度突然変異スキャンを行い、CRISPRiにおいて使用されたKRABドメインと比較して、安定性及び抑制を増強する置換を同定した。既存のアノテーション領域を越えて、エフェクタードメインを探索するために、238の抑制性複合体タンパク質の配列をタイリングし、非カノニカルのポリコーム1.6リクルートメントタンパク質であるMGAを含む、大型のクロマチン調節因子の、非アノテーション領域内において、10アミノ酸という短鎖の、新規の抑制ドメインを発見した。20を超える抑制因子を、個別に特徴づけ、それらの全てが、サイレンシング及びエピジェネティックメモリーの動態は、顕著に異なるが、レポーター遺伝子を、単一細胞レベルにおいて、全部又はゼロ式にサイレンシングすることを見出した。
加えて、高度に分岐的な、酸性KRABドメイン変異体を含む、核タンパク質内の、新たな活性化ドメインも発見した。
まとめると、これらの結果は、ヒト細胞内の転写エフェクタードメイン活性の体系的測定のための戦略を裏付け、合成転写技術及びエピジェネティック摂動技術において適用されうる、コンパクト転写エフェクタードメインの数を拡張する。
本技術により取り扱われる問題は、
i.どの遺伝子が、エフェクター機能を有するのかという、未知の問題
ii.どのドメインがこの機能を有するのか未知であることが多い、公知のTF/CR遺伝子内の問題
iii.どのファミリーメンバーが、この機能を有するのか、未知である、公知のエフェクタードメインを含むドメインファミリー内の問題
iv.どの残基が必要であり、突然変異が、どのようにして機能を低減又は増強するのか未知である、公知のエフェクタードメイン内の問題
である。
本明細書において提供されるシステム及び方法は、レポータープロモーターからのアウトプットを変化させる、活性化能及び抑制能に対する調節ドメインを測定しうる。歴史的に、これは、ロースループットの作業を要求し、比較的少数のエフェクタードメインが測定されている。本明細書において提供されるシステム及び方法は、代替的ハイスループットアッセイを提供する。
システム及び方法は、例えば、a.遺伝子調節を理解し、これらのタンパク質が結合する非コード調節エレメントの機能を予測すること;及びb.エピゲノム摂動ツールのためのエフェクタードメインを同定するために使用される。
かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、DNA結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体も同定する。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用されうる。
本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。本発明者らは、短鎖ドメイン(≦80アミノ酸)及び送達(例えば、ウイルスベクター内のパッケージング)のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップを同定する。場合によって、本発明者らは、10アミノ酸という短鎖である、強力なエフェクタードメインを同定する。ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。これらのドメインの大半は未だ、転写エフェクターとして報告されていない。
強力なpEFプロモーター及び弱いminCMVプロモーターの両方に対して、Pfamドメインライブラリーを伴う、ハイスループットリクルートメントを実施することにより、抑制ドメイン及び活性化ドメインの両方の測定が可能であった。多くのさらなる抑制因子が見出された、1つの可能な理由は、TADが、よりしばしば、Pfamによるドメイン定義を満たす、自律的な安定フォールディング配列でありながら、よりしばしば、ドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることである。別の可能な理由は、核内において、活性化補因子が、抑制補因子より限定的であり(Gillespie、Mol Cell、2020)、これは、活性化ドメインの発現の低下が、活性化強度の増大を結果としてもたらす場合もあることを含意するが、この効果が、スクリーン内のシグナルを、完全に遮蔽するとは予測されないことでありうる。転写因子をタイリングする、又はTAD様署名(例えば、酸性度)を伴う領域に焦点を当てる、新たなライブラリーデザインは、さらなる活性化ドメインを明らかにする。
加えて、本明細書において、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットステップも開示される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能とされる。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。
[実施例1]
ハイスループットリクルートメントは、ヒトタンパク質内の、数百の抑制ドメインを同定する
転写ドメインについての、古典的リクルートメントレポーターアッセイを、ハイスループットアッセイへと転換するために、2つの問題:(1)レポーターを、数万ドメインを有するライブラリーの急速なスクリーニングに適合性とするための、レポーターの修飾;及び(2)候補エフェクタードメインのライブラリーを作出する戦略の開発を解決した。既に公表されている蛍光レポーター(Bintuら、2016)に対する改善のために、合成表面マーカーを操作して、多数の細胞の容易な磁性分離を可能とし、レポーターを、大容量のスピナーフラスコ内の細胞培養に適する、懸濁細胞系内に組み込んだ。具体的に、合成表面マーカー(Igκリーダー及びPDGFRβ膜貫通ドメインへと連結された、ヒトIgG1 Fc領域)と、蛍光シトリンタンパク質とからなる、二部構成レポーター(図1)の発現を駆動する、強い構成的pEF1aプロモーターの上流に、9×TetO結合性部位を伴う、K562レポーター細胞を作出した。フローサイトメトリーは、5日以内に、亜鉛フィンガー転写因子であるZNF10に由来する、公知の抑制ドメインである、KRABドメインの、TetO部位におけるリクルートメントが、このレポーターを、ドキシサイクリン依存的にサイレンシングすることを確認した(図7並びに16A及び16B)。合成表面マーカーに結合するProG Dynabeadによる磁性分離は、レポーターオン細胞を、レポーターオフ細胞から分離した(図7及び16C)。
配列は、核へと局在化されうる、ヒトタンパク質(核局在化タンパク質だけに限られない、ヒトタンパク質を含む)内の、Pfamアノテーションドメインについて、UniProtデータベースから取り出した。合計、14,657ドメインを検索した。これらのうち、72%は、80アミノ酸(AA)長以下であった(図1)が、これは、これらのドメインを、300塩基のオリゴヌクレオチドとしてプールされた合成オリゴヌクレオチドに適合性とした。80アミノ酸より短いドメインについて、ドメイン配列を、両末端において、80アミノ酸の長さに到達させ、PCR増幅バイアスを回避するために、天然タンパク質配列に由来する隣接残基により伸長させた。80アミノ酸のランダム配列又はタイリングウィンドウを10アミノ酸として、DMDタンパク質に沿ってタイリングされた、80アミノ酸の配列である、861の陰性対照を追加した。DMDタンパク質は、核内に局在化しなかった(Chevronら、1994)ので、転写活性を伴うドメインを特徴づける可能性は小さかった。ライブラリーは、レンチウイルスによる発現のために、rTetRドキシサイクリン誘導性DNA結合性ドメイン単独との融合タンパク質又は3×FLAGタグ付けrTetRとの融合タンパク質としてクローニングされ(図17A及び8)、K562レポーター細胞へと送達された(図1)。
転写活性についてアッセイする前に、ハイスループット法を使用して、K562細胞内において、どのタンパク質ドメインが発現良好であるのかを決定した(図17A及び8)。細胞ライブラリーを、抗FLAG蛍光標識化抗体により染色し、細胞を、2つのビンへと分取し(図17B及び8)、ゲノムDNAを抽出し、単位複製配列シーケンシングにより、各ドメインの頻度をカウントした。シーケンシングカウントを使用して、各ドメインについて、発現レベルの測定値として、FLAGlow集団と対比される、FLAGhigh集団のエンリッチメント比を計算した。これらの測定は、個別に形質導入された生物学的反復間において、再現可能であり(r=0.82、図17C及び8)、ウェスタンブロットにより測定された、個々のドメイン融合体の発現レベルと高度に相関した(r=0.92、図17D及び17E並びに8)。天然Pfamドメインが、ランダム配列対照より、有意に発現良好(マンホイットニー検定によるp<1×10-5である)であるのに対し、Pfamドメイン及びDMDタイリング対照は、同等に発現良好であった(図17F及び8)。ランダム対照の中央値を、1標準偏差上回る、FLAGhigh:FLAGlow比により、発現良好ドメインを同定するように、閾値を設定した。この定義により、Pfamドメインのうちの66%が、発現良好であり、これらのドメインを、さらなる解析の焦点とした。
Pfamドメインライブラリーを、転写抑制因子についてスクリーニングした。プールされた細胞ライブラリーを、ドキシサイクリンにより、転写サイレンシング後に、細胞分裂のために、レポーターのmRNA及びタンパク質が分解及び希釈される結果として、「オン」細胞と、「オフ」細胞との、透明な二相性混合物をもたらすのに十分な時間をもたらす、5日間にわたり処理した(図18A及び9)。次いで、磁性細胞分離(図18A及び9)及びドメインシーケンシングを実施し、次いで、非結合集団内及びビーズ結合集団内のリードカウントを使用して、各ライブラリーメンバーについて、log(オフ:オン)比を計算した(図1)。明確さのために述べると、ビーズ結合集団を、「オン」集団と称し、非結合集団を、「オフ」集団と称した。測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった(r=0.96、図1)。ドメインが、発現不良陰性対照の平均値を、2標準偏差を超える抑制を引き起こした場合に、ヒットと判定した。これは、63のドメインファミリーに由来するドメインについて、5日目において、446の抑制因子ヒットを結果としてもたらした(図12A)。場合によって、正確な同じドメイン配列が、複数の遺伝子内において生じるため、これらの抑制ドメインは、451のヒトタンパク質内において見出される。10のドメインファミリーに由来し、Pfamにより、抑制因子又は抑制補因子結合性ドメインとして記載された、公知の抑制ドメイン(例えば、ヒトZNF10に由来するKRAB、CBX5に由来するChromoshadow)は、ヒットの中にあった。エピジェネティックメモリーを測定するために、9及び13日目に、さらなる時点を設定した。ヒットを含有するタンパク質のセットは、転写因子及びクロマチン調節因子について、ライブラリー内において使用された、全ての核タンパク質と比較した場合に、有意にエンリッチされたが、異なるカテゴリーのタンパク質も、それらのメモリーレベルにより分類された場合に、示差的にエンリッチされた(図18B及び9)。具体的に、13日目において、メモリーが高度である抑制因子(細胞は、オフ状態を維持する)は、KRAB ZNFタンパク質を含む、C2H2型亜鉛フィンガー転写因子について、最も高度にエンリッチされ、メモリーが低度である抑制因子は、Hoxタンパク質を含む、ホメオドメイン転写因子について、最も高度にエンリッチされた。全体として、ヒット間における、極めて高度の再現性及び予測された陽性対照抑制ドメインの同定は、ハイスループットリクルートメントと呼ばれるスクリーニング法が、信頼できる結果をもたらすことを示唆した。核Pfamドメインライブラリー内において同定された抑制因子についてのアミノ酸配列及び核酸配列を、表1に示すが、高スコアは、高度の抑制を指し示す。
最強のヒットのうちの1つは、いずれも、ポリコーム抑制複合体1(PRC1)の構成要素である(Chittockら、2017;Garciaら、1999)、RING1/YY1結合性タンパク質(RYBP)及びそのパラログであるYY1関連因子2(YAF2)に存在するドメインである、YAF2_RYBPであった。PfamによりアノテーションされたRYBPタンパク質ドメイン(わずか32アミノ酸であるので、80アミノ酸のドメインライブラリー内において合成された短鎖形である)を、個別に調べ、レポーター遺伝子の急速なサイレンシングを確認した(図12B)。RYBP媒介サイレンシングはまた、マウス胚性幹細胞内の全長RYBPタンパク質のリクルートメントについての近年の報告においても裏付けられた(Moussaら、2019;Zhaoら、2020)。結果は、表面プラズモン共鳴により、ポリコームヒストン修飾酵素であるRING1Bに結合するのに要求される最小ドメインであることが示された、32アミノ酸のRYBPドメイン(Wangら、2010)が、細胞内のサイレンシングを媒介するのに十分であることを確立した。
抑制反応速度を定量するために、シトリンレベルの分布にゲートをかけて、非処理細胞内の、均一の低レベルのバックグラウンドサイレンシングにより正規化された、サイレンシング細胞の百分率を計算し、次いで、データを、ドキシサイクリン処理時における指数関数的サイレンシング速度と、ドキシサイクリン除去の後における指数関数的減衰(又は再活性化)とを伴い、細胞の不可逆的サイレント百分率を一定とするプラトーに達するモデルに照らしてフィッティングした(図12C)。この手法を使用して、全て、リクルートメントアッセイ又は抑制補因子結合アッセイにより、抑制機能についての裏付けがなされている、SUMO3、MPP8に由来するChromoドメイン、CBX1に由来するChromoshadowドメイン及びSCMH1に由来するSAM_1/SPMドメイン(図18C~18F及び9)の抑制機能もまた、検証した(Changら、2011;Chupretaら、2005;Freyら、2016;Lechnerら、2000)。個々の測定値の全てによるサイレンシング速度(上記の抑制因子ヒット及び下記において論じられる他のヒットについて;図18C~18K及び9)は、5日目におけるサイレンシングのハイスループット測定値とよく相関した(R=0.86;図12D)。これらの個別の検証は、酵母内のドキシサイクリンの非存在下において漏洩度を軽減するように操作され(Roneyら、2016)、ヒト細胞内において漏洩しないことが見出され(図19A及び19B)、哺乳動物合成生物学に有用なツールとなった、DNA結合性ドメインであるrTetRの新たな変異体(SE-G72P)を使用して実施した。この新たなrTetR変異体は、最大のドキシサイクリンリクルートメントにおいて、元のrTetRと同じサイレンシング強度を有し(図19C)、これはまた、個別の検証と、スクリーンスコアとの、高度の相関によっても証拠立てられた(図12D)。まとめると、これらの検証実験は、ハイスループットリクルートメントが、真正の抑制因子の同定及び各ドメインについての抑制強度の定量の両方に、個別のフローサイトメトリー実験と同等の精度により成功したことを裏付けた。
[実施例2]
転写を抑制する、機能未知ドメインの同定
Pfamドメインファミリーのうちの22%を超えるドメインが、機能未知ドメイン(DUF)として分類されているのに対し、他のドメインは、この分類を使用して分類されていないが、これにもかかわらず、DUFである(El-Gebaliら、2019)。これらのドメインは、認識可能な配列の保存を有するが、実験による性質決定を欠いている。このように、本明細書において記載されたハイスループットドメインスクリーンは、初期機能を、DUFと関連づける機会をもたらした。まず、DUF3669ドメインを、抑制因子ヒットとして同定し、フローサイトメトリーにより、個別に検証した(図12A~12C)。これらのDUFは、多くの抑制性転写因子を含有する遺伝子ファミリーである、KRAB亜鉛フィンガータンパク質内の天然において見出される。これと符合して、2つのDUF3669ファミリードメインのリクルートメントの後における、転写の抑制を裏付ける結果が、近年公表され(Al Chiblakら、2019)、ハイスループット結果は、この所見を、残る4つの未験DUF3669配列を含むように拡張する。HNF3のC末端ドメインである、HNF_Cは、肝細胞核因子3アルファ及び肝細胞核因子3ベータ(また、FOXA1及びFOXA2としても公知である)だけにおいて見出されるため、より特異的な名称を有するが、別のDUFである。FOXA1及びFOXA2のいずれに由来するHNF_Cドメインもまた、抑制因子ヒットとして見出された。これらのいずれも、抑制性モチーフの候補に挙げられている(Copley、2005)、FxIxxIL配列により特徴づけられた、EH1(engrailed homology 1)モチーフを含む。
3つのいずれもが、IRF-2BP1_2のN末端亜鉛フィンガードメイン(Childs及びGoodbourn、2003)である、インターフェロン調節因子2(IRF2)の抑制補因子である、IRF2BP1、IRF2BP2及びIRF2BPLにおいて見出された、性質決定されていないドメインは、抑制因子ヒットであった。DNA修復因子である、HERC2 E3リガーゼ内のCyt-b5ドメイン(Mifsud及びBateman、2002)は、強力な抑制因子ヒットとして検証されたが、機能的に性質決定されていない、別のドメインであった(図18G及び9)。BIN1内のSH3_9ドメインは、SH3タンパク質結合性ドメインの、大部分が性質決定されていない変異体であるが、これもまた、抑制因子として検証された(図18H及び9)。BIN1は、アルツハイマー病の危険性ともまた関連する(Nottら、2019)、Myc相互作用性タンパク質及び腫瘍抑制因子(Elliottら、1999)である。全長BIN1及びMyc結合性ドメイン欠失突然変異体のいずれも、HeLa細胞内のGal4リクルートメントアッセイにおいて、転写を抑制することが既に示されており(Elliottら、1999)、BIN1酵母ホモログであるhob1が、転写の抑制及びヒストンのメチル化と連関した(Ramalingam及びPrendergast、2007)ことは、この結果と符合する。加えて、転写因子であるTOXに由来するHMGボックスドメイン及びポリコームの構成要素であるPCGF2に由来するzf-C3HC4_2 RINGフィンガードメインの抑制活性も検証した(図18I及び18J)。最後に、DUF1087は、クロマチンリモデラーであるCHD内において見出され、そのハイスループット測定値は、スクリーン有意性閾値をわずかに下回った(図12A)が、CHD3 DUF1087を、個別のフローサイトメトリーにより、弱い抑制因子として検証した(図12B及び12C)。まとめると、これらの結果は、ハイスループットタンパク質ドメインスクリーニングが、初期機能を、DUFへと割り当て、特徴づけが不完全なドメインの機能の理解を拡張しうることを裏付けた。
[実施例3]
抑制活性が強力なランダム配列
ランダム配列は未だ、抑制活性について調べられていない。驚くべきことに、陰性対照としてデザインされた、80アミノ酸のランダム配列のうちの1つは、閾値を下回る、低度の発現レベルを有するにもかかわらず、平均log(オフ:オン)を、4.0とする、強力な抑制因子ヒットであった。フローサイトメトリーによる、個別の検証は、この配列が、5日間にわたるリクルートメントの後に、レポーター細胞の集団を、完全にサイレンシングし、ドキシサイクリン除去の後も、2週間以下にわたる、中程度のエピジェネティックメモリーをもたらすことを確認した(図18K及び9)。1つさらなるランダム配列は、ヒット閾値をわずかに上回る抑制スコアを示した。
[実施例4]
抑制性KRABドメインは、より近年のタンパク質内において見出される
データは、最大の転写因子ファミリー:KRABドメイン内において、全てのエフェクタードメインの機能を解析する機会をもたらした。KRAB遺伝子ファミリーは、最強の公知の抑制ドメイン(ZNF10内のKRABなど)の一部を示した。抑制性KRABドメインのサブセットについての先行研究は、これらが、抑制補因子であるKAP1と相互作用し、KAP1が、SETDB1及びHP1などのクロマチン調節因子と相互作用することにより転写を抑制しうることを明らかにした(Chengら、2014)。しかし、KRABドメインのうちのどれほど多くが抑制因子であり、KAP1のリクルートメントが、全てのKRABにわたる抑制に必要又は十分であるのかどうかは不明である。
ライブラリーは、335のヒトKRABドメインを含み、発現良好ドメインについてのフィルタリングの後に、92.1%を、抑制因子ヒットとして見出した。9つのヒット抑制性KRABドメイン及び2つのヒットなしKRABドメインを、フローサイトメトリーにより個別に検証し、あらゆる場合に、これらの類別化を確認した(図19D)。次いで、ドメインリクルートメントの結果を、全長KRABタンパク質プルダウンから生成された、既に公表されている免疫沈降質量分析データ(Helleboidら、2019)と比較したところ、1つを除く非抑制性KRABの全ては、KAP1と相互作用しないタンパク質内にあり(1つの例外的KRABは、発現が低度であった)、ヒット抑制性KRABドメインの全ては、KAP1相互作用性であった(p<1×10-9;フィッシャーの正確検定;図2)。さらに、利用可能なChiP-seqデータセット及びChIP-exoデータセットを解析した(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)ところ、抑制性KRABドメインは、非抑制性KRABドメインと対称的に、KAP1と共局在化する、KRAB亜鉛フィンガータンパク質に由来した(図2)。
興味深いことに、抑制性KRABドメインが、大半が、KRABドメイン及び亜鉛フィンガーアレイだけからなる、極めて単純なドメインアーキテクチャーを伴うタンパク質内において見出されたのに対し、非抑制性KRABドメインは、大半が、DUF3669ドメイン又はSCANドメインもまた含む遺伝子内において見出された(図2)。実際、DUF3669含有遺伝子内において、1つのKRABである、ZNF783だけが、抑制因子であった。ZNF783は、亜鉛フィンガーアレイを固有な形において欠く(その名称にもかかわらず)、性質決定されていないDUF3669-KRAB含有遺伝子であり、これが、そのエフェクター機能及び標的へと局在化する、その方式の両方において、この転写因子のクラスの間において、顕著に異なることを示唆する。
SCAN又はDUF3669を含んだ、複合ドメインアーキテクチャーは、進化年代が古いKRAB遺伝子内において、より一般的である(Imbeaultら、2017)。本実施例において、KRAB遺伝子の進化年代と、KRABの抑制強度との間の明確な関係が観察され、有袋類-ヒトに共通の祖先以前に遡る遺伝子に由来するKRABドメインは、抑制活性を有さず、この後において進化した遺伝子に由来するKRABドメインは、これに符合して、強い抑制因子として機能する(図2)。まとめると、これらの結果は、旧世代の非抑制性KRAB遺伝子に、KAP1をリクルートして、ゲノム標的をサイレンシングする、抑制性KRAB遺伝子の、より後世代における大規模な拡大が後続するモデルを裏付ける。
[実施例5]
遺伝子サイレンシングをモジュレートする突然変異を同定する、CRISPRi ZNF10 KRABエフェクターについての高深度突然変異スキャン
ZNF10に由来するKRABドメインは、遺伝子抑制のための合成生物学適用において、広範に使用されており、CRISPR干渉として公知である、プログラム可能なエピジェネティック/転写制御ツールにおいて、dCas9へと融合している(Gilbertら、2014)。その配列-機能関係を、よりよく理解するために、ハイスループットリクルートメントを使用して、このKRABドメインについての高深度突然変異スキャン(DMS)を実施した。全ての可能な単一置換並びに全ての連続二重置換及び三重置換を伴うライブラリーをデザインした(図3)。シーケンシングリードを、明確にアライメントする能力を改善するために、DNA配列が、アミノ酸配列より大きな固有性を有するように、可変的コドン使用を使用して、サイレントバーコードを、ドメインのコード配列内に実装した(図3)。図1におけるレポーター及びワークフローを使用して、ハイスループットリクルートメント:5日間にわたるドキシサイクリン誘導並びに5、9及び13日目における、オン細胞と、オフ細胞との磁性分離を実施した(図20A及び10)。これらの測定は、高度に再現可能であり、予測された通り、突然変異の長さが、単一から三重へと増大するのに伴い、有害性を増大させる、一般的傾向を示した(図20B及び10)。さらに、これらの結果を、KRABアミノ酸の保存と比較したところ、保存と、突然変異の有害性との間において、目覚ましい相関が見出された(図3)。同定されたKRAB抑制性突然変異体についてのアミノ酸配列及び核酸配列を、表3に示す。各抑制性突然変異体のスコアを、野生型配列についての0と比べて示すと、高スコアは、KRAB転写の抑制の増強を表す。
ZNF10 KRABエフェクターは、3つの構成要素:KAP1への結合に必要であるAボックス(Pengら、2009)、KAP1への結合を強化する考えられるBボックス(Pengら、2007)及び天然において、KRABドメインの上流の、別個のエクソン上に見出されるN末端伸長部を有する(図3)。Aボックス内の多数の位置における突然変異は、抑制活性を、野生型配列と比べて、劇的に低下させた(図3)。これらの突然変異のうちのいくつかはCOS細胞内及び3T3細胞内におけるCATリクルートメントアッセイにより、既に調べられており;それらのデータは、K562細胞内の、高深度突然変異スキャンによる測定値と、よく相関した(図3)。KRAB Aボックスの突然変異体内における、サイレンシング機能の完全な欠如もまた、個別に検証した(図3)。Aボックスにわたる突然変異の影響が、周期的であると考えられることは、アルファヘリックスに沿った、これらの残基の角度が、機能的に関与性であることを示唆する(図3)。これらの残基を、サイレンシングに必要な残基であると指定し(p<1×10-5;5日目において、全ての置換の分布を、野生型に対して比較するウィルコクソンランクサム検定)、Aボックス内の突然変異の影響が大きい、12の必要な残基と、Bボックス内の影響が有意であるが、弱い、1つの残基を見出した(図3)。
これらの置換を、アライメントされたマウスKRAB Aボックス構造(PDB:1v65:Aボックス[V13~Y54]内における同一性が55%であり、類似性が69%である;図20C及び10)へとマッピングし、必要な残基は、3D空間内の配向性が同様であることが見出されたことは、結合インターフェースを示唆する(図3及び20D;赤色;並びに図10)。これらの残基は、これらのAボックス残基12のうち、10残基は、必要な残基のうちの12全てを含有する領域(赤色のKRAB-O残基;図20C及び10)内の、ZNF10 KRABの12~71(50%の同一性、75%の類似性)に照らしてアライメントされる、KRAB-Oを使用する、以前の組換えタンパク質結合アッセイ(Pengら、2009)において、KAP1への結合を容易とすることが、実際に示されたので、KAP1への結合に重要でありうる。結合に不要であることが既に見出されている、残る8残基のうちの8残基はまた、DMSにおいても、抑制に不要であった(p<1×10-4;フィッシャーの正確検定;グレーKRAB-O残基;図20C及び10)。5日目におけるDMSサイレンシングスコアを、結合アッセイにおいて使用された、個々の単一アラニン置換、二重アラニン置換及び三重アラニン置換について精査したところ、完全な一致が見出された:結合を剥離させた突然変異はまた、サイレンシングも失効化させ(野生型分布と比較したZスコア<-4)、結合に影響を及ぼさない突然変異はまた、サイレンシングにも影響を及ぼさなかった(|Zスコア|<0.6)(p<0.01;突然変異のn=12;フィッシャーの正確検定)。この高度の検証率及び3D構造内のそれらの位置は、DMSによる、残る12の、必要なAボックス残基のうち、2残基(V41及びN45)がまた、KAP1への結合にも関与しうることを示唆する。
Aボックスと対称的に、Bボックスの突然変異は、リクルートメントの終了時(5日目)において、比較的小さな影響を示し、統計学的に有意な、1つの位置(P59)だけが、一貫した影響であるが、弱い影響を示した。他方、P59及び他の4つの位置(K58、I62、L65、E66)は、9日目に測定された通り、ドキシサイクリン除去の後、メモリーに対する有意な影響を示した(図3)。4つの有意な位置について、個別の検証を実施したところ、ハイスループット実験における通り、Bボックスの突然変異体は、リクルートメントの5日後において、強力な遺伝子サイレンサーであったが、ドキシサイクリンの放出後において、メモリーの低減を示した(図3及び20E及び10)。この結果を解釈するために、サイレンシングされた細胞は、「不可逆的サイレント」状態に入る前に、「可逆的サイレント」状態を通過するという、かつて提起された遺伝子サイレンシングモデル(Bintuら、2016)を検討した。Bボックス突然変異体のメモリー低減は、5日目までに不可逆的サイレント状態にコミットする、少数の細胞を結果としてもたらす、中程度のサイレンシング速度低減の結果であることが可能であり、5日目において、可逆的サイレント細胞と、不可逆的サイレント細胞とは、識別不可能であるため、突然変異の、サイレンシング速度に対する影響は遮蔽されたということでありうる。リクルートメント強度を下方に微調整して、この可能性について調べるために、サイレンシングの時間経過を、100分の1の低用量ドキシサイクリンにより反復した。このレジメにおいて、Bボックスの突然変異は、5日目以前に、サイレンシング速度を低減した(図20E及び10)。この結果は、Bボックスが、KRABサイレンシング速度に対して、部分的に寄与していることを示す。
最後に、KRABのN末端は、多くの置換が、サイレンシングを、野生型と比べて、一貫して増強する残基を含有した(図3;青色;13日目のパネル)。特に、8位におけるトリプトファンの、ほぼ全ての置換は、13日目(大半のダイナミックレンジが、野生型を上回るレベルのサイレンシングを検出する時点である)において、野生型と比べた、サイレンシング細胞数の増大をもたらした。これは、サイレンシングを増強するための、唯一の有意な位置であった(図3)。これらの突然変異体のうち、ランク付けが最高度である2つ(WSR8EEE及びAW7EE)について、メモリー増強を、高量ドキシサイクリンリクルートメントにより個別に検証した(図3及び20E及び10)。
このサイレンシングの増強は、KRABタンパク質発現レベルの増強の結果でありうる。タンパク質の発現レベルと、KRABのサイレンシング強度との関係について探索するために、KAP1結合性KRABドメインのセットについて、ハイスループットFLAGタグ発現レベル測定値を精査し、13日目において、KRABの発現レベルと、サイレンシングとの有意な相関を見出した(r=0.49、図20F及び10)。ZNF10 KRABが、13日目において、高度のサイレンシングレベルを示した、他のKRABドメインと比較して、発現レベルが低度であったことは、高深度突然変異スキャン結果と、極めて大きく関与し、この結果が、突然変異を介して改善されうることを含意する。とりわけ、N末端は、極めて保存不良であり(図3)、このことが、BLASTにより、実際に、ZNF10に由来するKRAB内において、固有に見出されたことは、N末端における、安定性を改善する突然変異が、KRAB機能に干渉しそうにないことを示唆する。加えて、ドメイン発現の全体にわたり、発現レベルと負に相関するドメイン内において、高トリプトファン(W)頻度を観察したのに対し、発現レベルと正に相関するドメイン内において、高グルタミン酸(E)頻度を観察した(図20G及び10)。このアミノ酸組成の傾向は、KRABの8位からの、トリプトファンの置換による除去が、そのエフェクター機能を増強し、この増強は、グルタミン酸により置換する場合に、最も顕著であったので、N末端のKRAB突然変異体の増強は、発現レベルの改善に起因しうることをさらに示唆した。ZNF10 KRAB変異体についてのウェスタンブロットは、N末端のグルタミン酸置換突然変異体が、野生型より高度に発現されることを確認した(図20H及び10)。まとめると、これらの結果は、高深度突然変異スキャンの使用が、ヒト転写抑制因子について、配列を、機能と対比してマッピングし、かつ、発現増強置換を、保存不良位置へと組み込むことにより、エフェクターを改善することを裏付けた。
[実施例6]
ホメオドメイン抑制強度は、Hox遺伝子の編成と共直線性である
スクリーンにおいて、抑制因子ヒットを含んだ、2番目に大きなドメインファミリーは、ホメオドメインファミリーであった。ホメオドメインは、3つのヘリックスから構成され、ヘリックス3を介して、塩基を接触させる、配列特異的DNA結合性ドメインである(Lynchら、2006)。場合によって、ホメオドメインはまた、抑制因子として作用することも公知でもある(Hollandら、2007;Schnabel及びAbate-Shen、1996)。ライブラリーは、216のヒト遺伝子に由来するホメオドメインを含み、26%は、抑制因子ヒットであった。抑制因子は、ホメオドメインの11のサブクラス中4つのサブクラス:PRD、NKL、HOXL及びLIMにおいて見出された(図13A)。これらのリクルートメントアッセイ結果は、転写の抑制が、ホメオドメイン転写因子の、遍在的な機能ではないにせよ、広範にわたりうる機能であることを示唆した。
次いで、HOXLサブクラスについての結果を、より克明に精査した。このサブクラスは、細胞運命の主要な調節因子であり、胚発生時に、前後軸に沿って、体制領域を指定する、39のホメオドメイン転写因子のうちのサブセットである、Hox遺伝子を含有した。これらの遺伝子は、前後軸に沿った、それらの発現の時間的順序及び空間的パターン化に対応して、3’から5’へと共直線的に配置された、4つのHoxパラログクラスター(A~D)内に見出される(Gilbert、1971)。興味深いことに、それらのホメオドメインの抑制強度はまた、5’側の遺伝子ホメオドメインほど、強力な抑制因子であるように、Hoxクラスター内における、それらの配置とも共直線性であった(スピアマンによるρ=0.82;図13B)。この相関は、ホメオドメイン抑制機能と、Hox遺伝子発現のタイミング及び前後軸に沿った空間的パターン化との、可能な連関を示唆した。
Hoxホメオドメインの複数の配列アライメントは、11の最も強力な抑制ドメイン内のN末端アームに存在するRKKR(配列番号1330)モチーフを明らかにした(図13C)。RKKRモチーフが、塩基の文脈において、最も強力な抑制因子内に存在するのに対し、ランク付けが低位のドメインも、RKKRモチーフは欠くが、抑制強度と、正帯電アミノ酸であるアルギニン及びリシンの数との、有意な相関を結果としてもたらす、無秩序N末端アーム内の一部の塩基をやはり含有した(R=0.85、図13C~13E)。
Hoxホメオドメインの外部において、Pfam核タンパク質ドメインライブラリー内の抑制因子ヒットのうちの99.5%が、RKKR(配列番号1330)モチーフを含有しなかったのに対し、多くのヒットなしドメインは、RKKRモチーフを含有した。また、ドメインの全ライブラリーを検討したところ、5日目における、正味のドメイン電荷と、抑制強度との相関も見られなかった(R=0.04)。まとめると、これらの結果は、リクルートメントアッセイにおいて、RKKR(配列番号1330)モチーフ及び電荷が、Hoxホメオドメインの抑制に寄与するが、他のドメインの文脈において見出された場合の抑制には十分でないことを示唆した。
[実施例7]
最小プロモーターへのハイスループットリクルートメントによる、転写活性化因子の発見
弱い最小CMV(min CMV)プロモーターを伴うレポーターK562細胞系は、rTetRと、活性化ドメインとの融合体が、リクルートされると活性化されうることが確立された(図14A)。活性化因子スクリーンを実施するために、レンチウイルスを使用して、核Pfamドメインライブラリーを、これらのレポーター細胞へと送達し、ドキシサイクリンにより、48時間にわたり、rTetR媒介リクルートメントを誘導し、細胞(図21A)を、磁性的に分離し、結果として得られる2つの細胞集団内のドメインをシーケンシングした。各ドメインについて、ビーズ結合集団(オン)内のシーケンシングカウントと、非結合集団(オフ)内のシーケンシングカウントとのエンリッチメント比を、転写活性化強度の尺度として計算し、発現不良陰性対照の平均値を、2標準偏差超えたドメインをヒットとした(図14B)。ヒットは、ライブラリー内に存在する、3つの既に公知の転写活性化ドメインファミリー:FOXO1/3/6に由来するFOXO-TAD、Myb/Myb-Aに由来するLMSTEN及びCRTC1/2/3に由来するTORC_Cを含んだ。ヒットについての活性化強度の測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった(r=0.89、図14B)。短鎖核ドメインライブラリーによる、この第2のスクリーンは、ハイスループットリクルートメントが、レポーターのプロモーターを変化させることにより、活性化又は抑制を測定するのに使用されうることを確立した。核Pfamドメインライブラリー内において同定された活性化因子についてのアミノ酸配列及び核酸配列を、表2に示すが、低値のスコアは、強力な活性化因子を指し示した。
26のドメインファミリーに由来する、合計48のヒットを見出した。上記の、3つの公知の活性化ドメインファミリーを越えると、活性化性ヒットを伴う、残りのファミリーは、Pfam上において、未だ、活性化ドメインとしてアノテーションされていなかった(図14C)。全体として、抑制因子より少数の活性化因子を見出したが、これは、単純に、活性化因子が、しばしば、Pfamドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることが多い(Liuら、2006)ためでありうる。しかし、活性化ドメインを含有するタンパク質は、「転写の正の調節」などの遺伝子オントロジータームについて、有意にエンリッチされ、最も強力なエンリッチメントは、「シグナル伝達」についてであったが、これは、それらの供給源タンパク質のうちの多くが、活性化因子であることを反映する(図21B)。さらに、ヒットは、活性化ドメイン内の共通の特性である(Mitchell及びTjian、1989;Stallerら、2018)が、ヒットなしより、有意に酸性度が強かった(p≦1×10-5;マンホイットニー検定;図14D)。
いくつかのヒットは、古典的活性化ドメインが予測された、配列特異的転写因子を供給源とはせず、活性化補因子と、Med9、TFIIEβ及びNCOA3を含む転写機構タンパク質とに由来する、非古典的活性化因子を供給源とした。特に、そのオーソログが、酵母内の、他のメディエーター複合体構成要素に直接結合する、Med9ドメイン(Takahashiら、2009)は、その弱い発現レベルにもかかわらず、平均log(オフ:オン)を、-5.5とする、強い活性化因子であった。非古典的活性化因子は、酵母内において、個別に働くことが、既に報告されている(Gaudreauら、1999)が、哺乳動物細胞内において、個別にリクルートされた場合、弱く働くに過ぎない(Nevadoら、1999)。1つの例外は、TATA結合性タンパク質である(Dorris及びStruhl、2000)。より多くの非古典的配列をスクリーニングすることにより、この概念に対する、より多くの例外を見出した。
全ての被験ドメインについて、ライブラリーから伸長した80アミノ酸の配列及びトリミングされたPfamアノテーションドメインとの両方を使用して、レポーター遺伝子のドキシサイクリン依存性活性化を確認した(図21C)。既にアノテーションされているFOXO-TAD及びLMSTENは、それらの伸長形及びトリミング形のいずれにおいても、強い活性化因子であった。転写因子EGR3に由来するDUF3446及びSWI/SNFファミリーのSMARCA2タンパク質に由来し、大部分が性質決定されていない、QLQドメインの活性化機能もまた確認した。さらに、Dpy-30タンパク質内において見出されたDUFである、Dpy-30モチーフドメインが、弱い活性化因子であることも確認された。Dpy-30は、転写活性クロマチン領域と関連するクロマチンマーク(Simsら、2003)である、H3K4me3と表記される、ヒストンメチルトランスフェラーゼ複合体のコアサブユニット(Hyunら、2017)であった。合計11のヒットドメイン(非古典的ヒットである、Med9及びNCOA3に由来するNuc_rec_co-actを含む)を調べ、ライブラリーから伸長した80アミノ酸の配列を使用した場合、全てが、レポーターを、有意に活性化させることを見出した。まとめると、スクリーン及び検証は、不偏核タンパク質ドメインライブラリーが、顕著に異なる機能を伴うドメインを明らかにする、生産的な再スクリーニングが可能であり、古典的活性化ドメインを越える(かつ、DUFを含む)ドメインの多様なセットが、リクルートされると、転写を活性化させうることを裏付けた。
[実施例8]
KRAB活性化ドメインの発見
驚くべきことに、ライブラリー内の、最も強力な活性化因子は、ZNF473に由来するKRABドメインであった(図5B)。他の3つのKRABドメイン(ZFP28、ZNF496及びZNF597に由来する)もまた、活性化性ヒットであり、これらの全ては、安定的に発現され、抑制因子ではなかった。ZNF496に由来する、これらのドメインのうちの1つは、HT1080細胞内において個別にリクルートされた場合に、活性化因子として、既に報告されていた(Losson及びNielsen、2010)。興味深いことに、ZFP28は、2つのKRABドメインを含有するが、KRAB_1は、抑制因子であり、KRAB_2は、活性化因子であった。全長ZFP28に対して実施された、既存のアフィニティー精製/質量分析は、抑制性タンパク質及び活性化性タンパク質の両方との、有意な相互作用を同定した(Schmitgesら、2016)。活性化性KRABドメインは、非活性化性KRABより、有意に強く酸性であった(p=0.01、マンホイットニー検定、図14D)。配列解析は、活性化性KRABドメインが、互いに対する相同性を共有する一方、コンセンサスのKRAB配列から分岐的であり、変異体KRABサブクラスターを形成することを示した(図14E)。既存の系統発生的解析は、変異体KRABクラスターを、KAP1への結合の欠如及び進化年代の古さと連関させた(Helleboidら、2019)。より具体的に、活性化性KRAB供給源タンパク質のうちの2つ(ZNF496及びZNF597)は、共免疫沈降質量分析により、既に調べられたが、KAP1と相互作用することは見出されなかった(Helleboidら、2019)。
ライブラリー内において使用されたKRABドメインを中心とする、同じ80アミノ酸の配列を使用して、ZNF473に由来するKRABが、強力な活性化因子であり、ZFP28に由来するKRAB_2が、強度が中程度の活性化因子であることが個別に検証された(図14F)。さらに、ZNF473からトリミングされた、41アミノ酸のKRABが、強力な活性化のために十分であるのに対し、ZFP28からトリミングされた、37アミノ酸のKRAB_2は、活性化させなかったことは、周囲の配列の一部が、活性化に要求されたことを含意する(図21C)。次いで、利用可能なChiP-seqデータセット及びChIP-exoデータセットを精査したところ、(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)抑制性ZNF10と対称的に、ZNF473は、活性クロマチンマークである、H3K27acと共局在化することが見出された(図14G)。手作業により精査したところ、遺伝子(CASC3、STAT6、WASF2、ZKSCAN2)の転写開始部位及びlncRNA(LINC00431)の近傍において、最も著明なZNF473ピークを見出した。一方、ZFP28は、H3K27acと共局在化しなかったが、これはおそらく、そのKAP1結合性抑制性KRAB_1ドメインが、一般に、強度が中程度である、その活性化性KRAB_2ドメインを上回る、主要なエフェクターであったことを指し示す。これらの個々のKRABタンパク質を越えて検討すると、抑制性KRABを含有する亜鉛フィンガータンパク質が、H3K27acと共局在化しなかったのに対し、群としての非抑制性KRABタンパク質は、共局在化ピークを、確かに含んだ(図14G)。まとめると、結果は、変異体KRABタンパク質が、機能的に多様であり、場合により、転写活性化因子としても機能することを裏付ける。
[実施例9]
タイリングライブラリーは、核タンパク質の、非アノテーション領域内のエフェクタードメインを明らかにする
Pfamアノテーションは、核プロテオームをフィルタリングして、比較的コンパクトなライブラリーを作出する、1つの有用な手段をもたらしたが、Pfamは、現在のところ、ヒトエフェクタードメインのうちの多くを逸失する可能性が高い。タンパク質の非アノテーション領域内において、エフェクタードメインを発見するために、サイレンサー複合体に由来する238のタンパク質のリストをキュレーションし、それらの配列を、10アミノ酸のタイリングウィンドウにより隔てられた、80アミノ酸によりタイリングすることにより、タイリングライブラリーをデザインした(図15A)。強力なpEFレポーターへのハイスループットリクルートメントを実施し、5日間にわたるドキシサイクリンの後に、サイレンシングを測定する時点を設定し、13日目(ドキシサイクリンを放出した8日後)に、再度、エピジェネティックメモリーを測定する時点を設定した(図22A)。タイルのうちの4.3%は、5日目において、ヒットとして評定され(図15B)それらの抑制強度測定は、再現可能であった(r=0.72、図22B)。まとめると、タイリングスクリーンは、タンパク質238例中141例において、短鎖抑制ドメインを見出した。これらのヒットのうちの一部は、アノテーションドメインに重複する陽性対照を含む:例えば、ZNF57及びZNF461をタイリングすることにより、これらの転写因子のKRABドメインを、抑制性エフェクターとして同定したが、配列の残りの部分は、抑制性エフェクターとして同定しなかった(図22C)。同様に、タイリング戦略は、Pfamによりアノテーションされた、RYBP抑制性ドメインを同定し、個別の検証においても、80アミノ酸のタイル及び32アミノ酸Pfamドメインのいずれもが、同様の強度及びエピジェネティックメモリーを伴って、サイレンシングした(図22D)。REST(CoREST結合性ドメインと重複する(Ballasら、2001))、DNMT3b(DNMT1結合性ドメイン及びDNMT3a結合性ドメインと重複する(Kimら、2002))及びCBX7(PRC1をリクルートするPcBoxと重複する(Liら、2010))における抑制因子もまた、同定及び検証した(図22E~22G)。タイリングヒットについての、別のカテゴリーは、Pfam内のドメインとしてアノテーションされていなかったが、文献において、それらの抑制機能についての以前の報告が見出された。例えば、CTCFのアミノ酸121~220は、スクリーンにおいて、強い抑制機能を有し、個別に検証したところ(図15C及び15E)、HeLa細胞、HEK293細胞及びCOS-7細胞における、以前のリクルートメント研究と符合した(Drueppelら、2004)。まとめると、これらの結果は、タンパク質タイルのハイスループットリクルートメントが、真正の抑制性ドメインを同定する有効な戦略であることを確立した。タイリングライブラリーにおいて同定された抑制因子についてのアミノ酸配列を、表4に示すが、高スコアは、高度の抑制を指し示す。
アノテーションされていない、新規の抑制ドメインもまた、発見した。例えば、BAZ2A(また、TIP5としても公知である)は、一部のrDNAの転写サイレンシングを媒介する、核リモデリング複合体(NoRC)の構成要素である(Guetgら、2010)が、アノテーションエフェクタードメインを有さない。BAZ2Aについてのタイリングデータは、グルタミンリッチ領域内の抑制機能のピークを示したが、強度が中程度である抑制因子として、個別に検証された(図15D及び15E)。抑制性タイルは、3つのTETDNAデメチラーゼ(TET1/2/3)の非アノテーション領域内に見出された。予測外に、抑制因子タイルはまた、対照タンパク質であるDMD内においても同定されたが、これは、フローサイトメトリーにより検証された(図22H)。
E-ボックスモチーフにおいてゲノムに結合し、非カノニカルのポリコーム1.6複合体をリクルートすることにより、転写を抑制すると考えられる(Blackledgeら、2014;Jolmaら、2013;Stielowら、2018)MGA内において、タイリング実験は、抑制機能を伴い、2つの公知のDNA結合性ドメインに隣接して配置され、本明細書において、抑制因子1及び抑制因子2と呼ばれた、2つのドメインを明らかにした(図15F)。これらの抑制ドメインを、個別に検証し、顕著に異なるサイレンシング動態及びメモリーの程度を観察した;第1のドメイン(アミノ酸341~420)が、緩徐なサイレンシングの反面、強いメモリーを特徴としたのに対し、第2のドメイン(アミノ酸2381~2460)は、急速なサイレンシングの反面、高速の再活性化を伴う、弱いメモリーを特徴とした(図15G)。これらは、ncPRC1.6サイレンシング複合体内のタンパク質から単離された、第1のエフェクタードメインであると考えられる。
次いで、抑制機能を示すタンパク質領域をカバーする、全てのタイル内の重複を検討し、どのアミノ酸連続配列が、全ての抑制性タイル内に存在するのかを決定することにより、各非依存性ドメイン内の抑制機能に必要最小限の配列を同定しようと試みた(図15H)。この手法を使用して、MGAについての、2つの候補最小化エフェクタードメイン:いずれもが、ConSurfにより予測された機能的露出残基を伴い、保存領域内において重複した、10アミノ酸のMGA配列[381~390]と、30アミノ酸のMGA配列[2431~2460]とを生成した。個別の検証実験は、いずれの最小化候補配列も、レポーターを、効率的にサイレンシングしうることを裏付けた(図15I)。
材料及び方法
細胞株及び細胞培養
全ての実験は、K562細胞(ATCC CCL-243)において行った。細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)、ストレプトマイシン(10,000ug/mL)及びL-グルタミン(2mM)で補充されたRPMI 1640(Gibco)培地中、37℃及び5%のCOの制御された加湿インキュベーターにおいて培養した。HEK293FT細胞及びHEK293T-LentiX細胞を、10%のFBS(Hyclone)、ペニシリン(10,000I.U./mL)及びストレプトマイシン(10,000ug/mL)で補充されたDMEM(Gibco)培地中で成長させ、レンチウイルスを産生させるために使用した。レポーター細胞株を、以下の通り、TALEN媒介相同性指向修復によって作出して、AAVS1遺伝子座にドナー構築物を組み込んだ。1.2×10個のK562細胞を、1000ngのレポータードナープラスミド、並びに500ngの各TALEN-L(Addgene #35431)及びTALEN-R(Addgene #35432)プラスミド(それぞれ、意図するDNA切断部位の上流及び下流を標的にする)を有するAmaxa溶液(Lonza Nucleofector 2b、設定T0-16)中で電気穿孔した。7日後、細胞を、1000ng/mLのピューロマイシン抗生物質により5日間にわたり処理して、ドナーが意図される遺伝子座に安定に組み込まれた集団について選択し、これは、PuroR耐性遺伝子を発現するプロモーターを提供する。蛍光レポーター発現を、顕微鏡法によって、及びフローサイトメトリー(BD Accuri)によって測定した。
核タンパク質Pfamドメインライブラリーデザイン
UniProtデータベース(UniProt Consortium、2015)に、核を局在化し得るヒト遺伝子についてクエリを行った。UniProtにおける細胞内位置情報を、公開から、又は類似の遺伝子(例えば、オルソログ)においてのみ公開が存在する場合に「類似性によって」、決定し、手動でレビューした。次いで、Pfamアノテーションドメインを、ProDy searchPfam機能(Bakanら、2011)を使用して探索した。80アミノ酸又はそれよりも短いドメインをフィルター処理し、非常に豊富で反復性のC2H2亜鉛フィンガーDNA結合ドメインを、排除し、転写エフェクターとしての機能は予想されなかった。アノテーションドメインの配列を検索し、それを、合計80アミノ酸に到達するまでいずれかの側鎖において伸長させた。重複配列を除去し、次いで、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。終止コドンを欠く80アミノ酸の499のランダム対照を、対照として、コンピューターで作出した。DMDが転写調節因子であると思われなかったので、10アミノ酸スライディングウィンドウを有する80アミノ酸タイルにおいてDMDタンパク質をタイリングした362エレメントも、対照として含めた。合計で、ライブラリーは、5,955エレメントからなる。
サイレンサータイリングライブラリーデザイン
転写サイレンシングに関与する216タンパク質を、転写調節因子のデータベース(Lambertfら、2018)から精選した。転写サイレンシングに関与する可能性がある32タンパク質を手動で加え、次いで、不偏性タンパク質タイリングライブラリーを作出した。これを行うために、各遺伝子についてのカノニカルの転写物を、Python APIを使用して、Ensembl BioMart(Kinsellaら、2011)から検索した。カノニカルの転写物が見出されなかった場合、CDSを有する最も長い転写物を検索した。コード配列を、タイル間で、10アミノ酸スライディングウィンドウを有する80アミノ酸のタイルに分割した。各遺伝子について、C末端領域がライブラリーに含まれるように、最後の残基の80アミノ酸上流からその最後の残基に及ぶ最終タイルを含めた。重複タンパク質配列を除去し、コドン最適化をヒトコドン使用について行い、BsmBI部位を除去し、GC含有量を50ヌクレオチドウィンドウごとに20%~75%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。361タイリング陰性対照を、以前のライブラリーデザインにおけるように含め、合計で15,737ライブラリーエレメントを得た。
KRAB高深度突然変異スキャンライブラリーデザイン
CRISPRi(Gilbertら、2014)において使用されるZNF10 KRABドメイン配列の高深度突然変異スキャンを、全ての可能な単一置換及び同じアミノ酸の全ての連続した二重及び三重置換(例えば、AAAによる置換)を用いてデザインした。これらのアミノ酸配列を、各DNA配列が置換された残基を超えていくつかの変動を含有するように、確率コドン最適化アルゴリズムを使用して、DNA配列に逆翻訳し、これは、一意的なライブラリーメンバーに対してシーケンシングリードを明確に整列させる能力を改善する。加えて、InterProにおいて見出されるヒトKRAB由来の全てのPfamアノテーションKRABドメインを、以前の核Pfamドメインライブラリーにおけるのと類似して、含めた。以前のタイリングライブラリーにおいてデザインされたタイリング配列も、5個のKRAB亜鉛フィンガー遺伝子のために含まれた。300ランダム対照配列及びDMD遺伝子由来の200タイルを、陰性対照として含めた。コドン最適化時に、BsmBI部位は除去され、GC含有量を80ヌクレオチドウィンドウごとに30%~70%に制限した(DNAチゼル(Zulkower及びRosser、2020)により行った)。合計のライブラリーサイズは、5,731エレメントであった。
ドメインライブラリークローニング
最高で300ヌクレオチドまでの長さのオリゴヌクレオチドを、プールライブラリー(Twist Biosciences)として合成し、次いで、PCR増幅した。6×50ulの反応を、混入DNAの増幅を回避するために、クリーンPCRフードにおいてセットした。各反応について、5ngの鋳型、0.1μlの各100μMのプライマー、1μlのHerculase IIポリメラーゼ(Agilent)、1μlのDMSO、1μlの10nMのdNTP及び10μlの5×Herculase緩衝液を使用した。サーモサイクリングプロトコールは、98℃で3分、次いで、98℃で20秒間、61℃で20秒間、72℃で30秒間、次いで、72℃で3分間の最終ステップのサイクルであった。デフォルトのサイクル数は29回であり、これを各ライブラリーについて最適化して、ゲル抽出のためのきれいな可視生成物をもたらす最も少ないサイクルを見出した(実際には、25サイクルが最小であった)。PCR後、得られたdsDNAライブラリーを、2%のTBEゲルの≧4レーンにローディングし、予想される長さ(300bp周辺)でバンドを切り取り、QIAgenゲル抽出キットを使用することによって、ゲル抽出した。ライブラリーを、4×10μlのGoldenGate反応(75ngの消化前のゲル抽出された骨格プラスミド、5ngのライブラリー、0.13μlのT4 DNAリガーゼ(NEB、20000U/μl)、0.75μlのEsp3I-HF(NEB)及び1μlの10×T4 DNAリガーゼ緩衝液)による37℃での30サイクルの消化により、レンチウイルスリクルートメントベクターpJT050にクローニングし、各々5分間にわたり16℃でライゲーションし、それに続いて、37℃での最後の5分の消化、次いで70℃での20分の熱失活を行った。次いで、反応をプールし、MinEluteカラム(QIAgen)により精製し、6ulのddH2Oで溶出させた。チューブあたり2μlを、製造業者の説明書に従って、2つのチューブの50μlのエレクトロコンピテントセル(Lucigen DUO)に形質転換した。回収後、細胞を、カルベニシリンを有する3~7の大型10インチ×10インチLBプレートに蒔いた。37℃での終夜成長後、細菌コロニーを、収集ボトルにかき集め、プラスミドプールを、HiSpeed Plasmid Maxiprepキット(QIAgen)により抽出した。2~3の小型プレートを、コロニーをカウントするために希釈された形質転換細胞と並行して調製し、形質転換効率が少なくとも30×ライブラリーカバレッジを維持するのに十分であったかを確認した。ライブラリーの品質を決定するために、ドメインを、プラスミドプールから、及び元のオリゴプールから、Illuminaアダプターを含む伸長を有するプライマーを用いるPCRによって増幅し、シーケンシングした。PCR及びシーケンシングのプロトコールは、これらのPCRが10ngのインプットDNA及び17サイクルを使用する以外は、ゲノムDNAからのシーケンシングについて下記に記載されるものと同じであった。これらのシーケンシングデータを、下記に記載されるようにして解析して、カバレッジの均一性及びライブラリーの合成品質を決定した。加えて、形質転換からの20~30コロニーを、サンガーシーケンシング(Quintara)して、クローニング効率及びプール中の空骨格プラスミドの割合を推定した。
抑制因子活性を測定するためのハイスループットリクルートメント
大スケールのレンチウイルス産生及びK562細胞のスピンフェクションを行った。ライブラリーをK562細胞に感染させるのに十分なレンチウイルスを作出するために、HEK293T細胞を、4つの15cm組織培養プレートに蒔いた。各プレートにおいて、9×105個のHEK293T細胞を、30mLのDMEMに蒔き、終夜成長させ、次いで、50μlのポリエチレンイミン(PEI、Polysciences #23966)を使用して、8μgの3つの第三世代パッケージングプラスミドの等モル混合物及び8μgのrTetR-ドメインライブラリーベクターによりトランスフェクトした。インキュベーションの48時間及び72時間後、レンチウイルスを採取した。プールされたレンチウイルスを、0.45μmのPVDFフィルター(Millipore)を通して濾過して、任意の細胞残屑を除去した。核Pfamドメイン抑制因子スクリーンのために、4.5×10個のK562レポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を3日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり合計で少なくとも1.5×10個細胞を残すとともに、細胞濃度を元の5×10個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>25,000個細胞であった(不完全なブラストサイジン選択、ライブラリー調製、及びライブラリー合成エラーからの損失を補償する非常に高いカバレッジレベル)。感染後6日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を5日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに8日間にわたり維持し、ドキシサイクリンの添加から最長で13日目に、カウントした。2.5×10個細胞を、各時点(5日目、9日目及び13日目)に測定のために採取した。プロトコールは、KRAB DMSについてと同様であったが、ドキシサイクリンを感染後8日目に添加し、>12,500×カバレッジで、2×10~2.2×10個細胞を各時点で採取した。プロトコールは、タイリングスクリーンについてと同様であったが、9.6×10個細胞を感染させ、ドキシサイクリンを感染後8日目に添加し、少なくとも2×10個細胞を、>12,500×カバレッジのために各継代で維持し、2×10~2.7×10個細胞を各時点で採取した。
転写活性化の活性を測定するためのハイスループットリクルートメント
核Pfamドメイン活性化因子スクリーンのために、rTetR(SE-G72P)-3XFLAGベクターにおける核Pfamライブラリーのためのレンチウイルスを、レポータースクリーンに関して作出し、3.8×10個のK562-pDY32 minCMVレポーター細胞に、感染の2連の別々の生物学的反復を用いて、2時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を2日間にわたり成長させ、次いで、細胞をブラストサイジン(10μg/mL、Sigma)により選択した。感染及び選択の効率を、mCherry(BD Accuri C6)を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり少なくとも1×10個の合計細胞を残すとともに、細胞濃度を元の5×10個細胞/mLに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり>18,000個細胞であった。感染後7日目に、リクルートメントを、1000ng/mlのドキシサイクリン(Fisher Scientific)により細胞を2日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理RPMI培地中でさらに4日間にわたり維持した。2×10個細胞を、2日目の時点で測定のために採取した。フローサイトメトリーによるシトリン陽性細胞の非存在によって決定されるように、ドキシサイクリン除去後4日目に活性化メモリーの証拠はなく、その結果、さらなる時点で収集しなかった。
レポーター細胞の磁気分離
各時点で、細胞を、300×gで5分間にわたりスピンダウンして、培地を吸引した。次いで、細胞を、同じ体積のPBS(Gibco)に再懸濁させ、スピンダウン及び吸引を繰り返して、細胞を洗浄し、血清から任意のIgGを除去した。Dynabeads(商標)M-280プロテインG(ThermoFisher 10003D)を、30秒間にわたるボルテックスによって再懸濁させた。2×10個細胞あたり、50mLのブロッキング緩衝液を、1グラムの無ビオチンBSA(Sigma Aldrich)及び200μlの0.5M pH8.0 EDTA(ThemoFisher 15575020)をDPBS(Gibco)に添加すること、0.22μmフィルター(Millipore)による真空濾過、及び氷上での保持によって、調製した。60μlのビーズを、200μlのビーズあたり1mLの緩衝液を添加し、5秒間にわたりボルテックスし、磁気チューブラック(Eppendorf)上に蒔き、1分間待ち、上清を除去し、最後にビーズを磁石から除去し、初期の60μlのビーズあたり100~600μlのブロッキング緩衝液に再懸濁させることによって、全て1×10個細胞について調製した。KRAB DMSのみについて、30μlのビーズを、同じ方法で、全て1×10個細胞について調製した。ビーズを、100μlの再懸濁ビーズあたり1×10個細胞以下で細胞に添加し、次いで、30分間にわたり揺り動かしながら、室温でインキュベートした。2×10個細胞を有する試料について、15mLのFalconチューブ及び大型磁気ラックにおいて、1.2mLのビーズを使用し、12mLのブロッキング緩衝液に再懸濁させた。<5×10個細胞を有する試料について、非スタックAmbion 1.5mLチューブ及び小型磁気ラックを使用した。インキュベーション後、ビーズ及び細胞混合物を、>2分間にわたり磁気ラックに置いた。未結合上清を、新しいチューブに移し、再び>2分間にわたり磁石上に置いて、任意の残ったビーズを除去し、次いで、上清を移し、未結合画分として保存した。次いで、ビーズを、同じ体積のブロッキング緩衝液に再懸濁させ、磁気的に再度分離し、上清を廃棄し、ビーズを有するチューブを、結合画分として保持した。結合画分を、ブロッキング緩衝液又はPBSに再懸濁させて、細胞を希釈した(未結合画分は既に希釈されている)。フローサイトメトリー(BD Accuri)を、各画分のごく一部を使用して行って、各画分中の細胞数を推定し(ライブラリーカバレッジが維持されるのを確実にするため)、シトリンレポーターレベルに基づいて分離を確認した(結合画分は、>90%シトリン陽性であるはずであるが、未結合画分は、レポーターレベルの初期分布に応じてより変動する)。最後に、試料をスピンダウンし、ペレットを、ゲノムDNA抽出まで-20℃で凍結させた。
ドメイン融合タンパク質発現レベルのハイスループット測定
発現レベル測定を、3×FLAGタグ付け核Pfamドメインライブラリーに感染したK562-pDY32細胞(シトリンオフを有する)において行った。生物学的反復あたり1×10個細胞を、ブラストサイジン選択(10μg/mL、Sigma)の5日後に使用し、これは、感染7日後であった。1×10個の対照K562-JT039細胞(シトリンオン、レンチウイルス感染なし)を、各反復に添加した。固定緩衝液I(BD Biosciences、BDB557870)を、37℃で15分間にわたり予熱し、透過処理緩衝液III(BD Biosciences、BDB558050)、及び10%のFBS(Hyclone)を有するPBS(Gibco)を氷上で冷やした。ドメインを発現する細胞のライブラリーを収集し、細胞密度を、フローサイトメトリー(BD Accuri)によってカウントした。固定のために、細胞を、100万個細胞あたり20μlで、37℃で10~15分間にわたり、ペレット体積に対応する体積の固定緩衝液I(BD Biosciences、BDB557870)に再懸濁させた。細胞を、1mLの10%のFBSを含有する冷PBSで洗浄し、500×gで5分間にわたりスピンダウンし、次いで、上清を吸引した。細胞を、100万個細胞あたり20μlで、ゆっくりと添加し、ボルテックスすることによって混合した冷BD透過処理緩衝液III(BD Biosciences、BDB558050)を使用して、氷上で30分間にわたり透過処理した。次いで、細胞を、これまでのように1mlのPBS+10%のFBS中で2回洗浄し、次いで、上清を吸引した。抗体染色を、α-FLAG-Alexa647(RNDsystems、IC8529R)の5μl/1×10個細胞を使用して、光から保護して、室温で1時間にわたり行った。細胞を、洗浄し、PBS+10%のFBSに3×10個細胞の濃度で再懸濁させた。細胞を、mCherry陽性生存細胞についてゲートをかけた後、APC-A蛍光(Sony SH800S)のレベルに基づいて2つのビンに分取した。少数の未染色対照細胞も、ソーターにおいて解析して、染色がバックグラウンドを上回ったかを確認した。シトリン陽性細胞の急増を使用して、3×FLAGタグを欠いていることが公知の細胞における染色のバックグラウンドレベルを評価し、分取のためにゲートをかけることで、そのレベルの上に導いた。分取後、細胞カバレッジは、試料にわたるライブラリーエレメントあたり336~1,295個細胞の範囲であった。分取された細胞を、500×gで5分間にわたりスピンダウンし、次いで、PBSに再懸濁させた。ゲノムDNA抽出を、製造業者の説明書に従って、プロテイナーゼK+AL緩衝液インキュベーションを56℃で終夜行ったという1つの改変を伴って、行った(QIAgen Blood Maxiキットを、>1×10個細胞を有する試料のために使用し、QIAamp DNA Miniキットと最高で5×10個細胞あたり1カラムを、≦1×10個細胞を有する試料のために使用した)。
ライブラリー調製及びシーケンシング
ゲノムDNAを、カラムあたり最高で1.25×10個細胞を用いて、Blood & Tissueキット(QIAgen)を使用して、製造業者の説明書に従って、抽出した。サブシーケンスPCR阻害を回避するために、DNAは、AEではなくEBで溶出させた。ドメイン配列を、伸長としてIlluminaアダプターを含有するプライマーによるPCRによって増幅した。テストPCRを、50μl(半分のサイズ)の反応において5μgのゲノムDNAを使用して行って、PCR条件が、各試料について予想されるサイズで可視バンドをもたらすかを検証した。次いで、12~24×100μlの反応を、各実験において利用可能なゲノムDNAの量に応じた反応の数で、氷上にセットした(混入DNAの増幅を回避するためにクリーンPCRフード中)。10μgのゲノムDNA、0.5μlの各100μMのプライマー、及び50μlのNEBnext 2×Master Mix(NEB)を、各反応において使用した。サーモサイクリングプロトコールは、98℃へのサーモサイクラーの予熱、次いで98℃で3分にわたり試料を添加し、次いで、98℃で10秒間、63℃で30秒間、72℃で30秒間、次いで、72℃で2分間の最終ステップの32回のサイクルであった。全てのその後のステップは、PCRフード外で行った。PCR反応物をプールし、≧140μlを、100bpのラダーと並行して2%のTBEゲルの少なくとも3つのレーンにおいて、少なくとも1時間にわたり流し、395bp周辺のライブラリーバンドを切断し、DNAを、QIAquick Gel Extractionキット(QIAgen)を使用して、非スティックチューブ(Ambion)への30ulの溶出により、精製した。確認ゲルを流して、小さな生成物が除去されたことを検証した。次いで、これらのライブラリーを、Qubit HSキット(Thermo Fisher)により定量化し、15%のPhiX対照(Illumina)によりプールし、シングルエンドフォワードリード(266又は300サイクル)及び8サイクルのインデックスリードを使用して、Highアウトプットキットを用いるIllumina NextSeqにおいてシーケンシングした。
ドメインシーケンシング解析
シーケンシングリードを、bcl2fastq(Illumina)を使用して、逆多重化した。Bowtie参照を、スクリプト「makeIndices.py」によるデザインされたライブラリー配列を使用して、作出し、リードを、スクリプト「makeCounts.py」を使用して、0のミスマッチを許容して整列させた。オフ試料及びオン試料(又はFLAGhigh及びFLAGlow)の間の各ドメインについてのエンリッチメントを、スクリプト「makeRhos.py」を使用して、計算した。所与の反復について両方の試料において<5リードのドメインを、反復からドロップさせた(0カウントを割り当てた)一方、一試料中に<5リードのドメインを、低深度からのエンリッチメント値の暴騰を回避するために、これらのリードを5に調節した。全ての核ドメインスクリーンについて、所与の条件の両方の反復において≦5カウントのドメインを、下流の解析からフィルター除去した。核ドメイン発現スクリーンについて、発現良好ドメインは、log2(FLAGhigh:FLAGlow)が、ランダム対照の中央値を≧1標準偏差上回るドメインであった。核Pfamドメイン抑制因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≧2標準偏差上回るドメインであった。核ドメイン活性化因子スクリーンについて、ヒットは、log2(オフ:オン)が、発現不良ドメインの平均を≦2標準偏差下回るドメインであった。サイレンサータイリングスクリーンについて、所与の条件の両方の反復において≦20カウントのタイルを、フィルター除去し、ヒットは、log2(オフ:オン)が、ランダム対照及びDMDタイリング対照の平均を≧2標準偏差上回るタイルであった。遺伝子オントロジー解析エンリッチメントを、PantherDBウェブツール(www.pantherdb.org)を使用して、計算した。バックグラウンドセットは、発現良好であり、カウントフィルターが適用された後に実験において測定されたドメインを含有する全てのタンパク質であった。統計的有意性についてのP値を、フィッシャーの正確確率検定を使用して計算し、偽発見率(FDR)を計算し、全てFDR<10%の最も有意な結果のみを示した。
ウェスタンブロット及び共免疫沈降
rTetR-fusion-T2A-mCherry-BSDを含有するレンチウイルスベクターで形質導入された細胞を、ブラストサイジン(10μg/mL)により選択し、mCherryが>80%まで選択した。細胞を、溶解緩衝液(1%のTriton X-100、150mMのNaCl、50mMのTris pH 7.5、1mMのEDTA、プロテアーゼ阻害剤カクテル)に溶解した。タンパク質の量を、DC Protein Assayキット(Bio-Rad)を使用して、定量した。等量を、ゲル上にロードし、ニトロセルロース又はPVDF膜に移した。一次抗体として、GATA1抗体(1:1000、ウサギ、Cell Signaling Technologies カタログ番号3535S)及びGAPDH抗体(1:2000、マウス、ThermoFisher カタログ番号AM4300)又はFLAG M2モノクローナル抗体(1:1000、マウス、Sigma-Aldrich、カタログ番号F1804)及びヒストン3抗体(1:1000、マウス、Abcam カタログ番号AB1791)を使用して、膜を探査した。二次抗体として、それぞれ、ロバ抗ウサギIRDye 680 LT及びヤギ抗マウスIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68023及び926-32210)又はヤギ抗マウスIRDye 680 RD及びヤギ抗ウサギIRDye 800CW(1:20,000希釈、LI-COR Biosciences、それぞれ、カタログ番号926-68070及び926-32211)を使用した。
ブロットを、LiCor Odyssey CLxにおいて画像化した。バンド強度を、ImageJを使用して、定量した。
個々の抑制因子リクルートメントアッセイ
個々のエフェクタードメインを、骨格pJT050又はpJT126へのGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流の3×FLAGタグ(図の凡例を参照されたい)を伴う又は伴わないrTetR又はrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562-pJT039-pEF-シトリンレポーター細胞を、このレンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリン(Fisher Scientific)により処理した又は非処理のまま放置した。処理の5日後、ドキシサイクリンを、細胞からスピンダウンすることによって除去し、培地をDPBS(Gibco)で交換して、任意の残ったドキシサイクリンを希釈し、次いで、再び細胞からスピンダウンし、それらを新鮮な培地に移した。>7,000個細胞のフローサイトメトリー解析(BD Accuri C6又はBeckman Coulter CytoFLEXのいずれか)によって、2~3日ごとに時点を測定した。データを、Cytoflow及びカスタムPythonスクリプトを使用して、解析した。事象を、生存率についての、及び送達マーカーとしてのmCherryについてのゲートをかけた。ドキシサイクリン処理時のオフ細胞の画分を計算するために、2成分ガウシアン混合モデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オンピーク及びバックグラウンドのサイレンシングされたオフ細胞のサブ集団の両方にフィッティングさせ、次いで、オフとしてサイレンシングされた細胞を表示するために、オンピークの平均を2標準偏差下回った閾値を設定した。時間がマッチした非処理対照を使用して、細胞のバックグラウンドの正規化された百分率を計算した。細胞オフ、正規化=細胞オフ+ドキシサイクリン/(1-細胞オフ、非処理)。2つの独立に形質導入された物学的反復を使用した。ドキシサイクリン処理フェーズ時の指数関数的減衰(例えば、1から減算された指数関数的減衰)、並びにサイレンシング及び再活性化開始の前のラグタイムについての追加パラメーターを伴うドキシサイクリン除去フェーズ時の指数関数的減衰の増加形態からなる遺伝子サイレンシングモデルを、SciPyを使用して、正規化されたデータにフィッティングさせた。
個々の活性化因子リクルートメントアッセイ
ドメインを、骨格pJT126におけるGoldenGateクローニングを使用して、T2A-mCherry-BSDマーカーの上流のrTetR(SE-G72P)との融合物としてクローニングした。次いで、K562 pDY32 minCMVシトリンレポーター細胞を、各レンチウイルスベクターにより形質導入し、3日後、細胞の>80%がmCherry陽性まで(6~7日)、ブラストサイジン(10μg/mL)により選択した。細胞を、24ウェルプレートの別々のウェルに分割し、ドキシサイクリンにより処理した又は非処理のまま放置した。>15,000個細胞のフローサイトメトリー解析(Biorad ZE5)によって、時点を測定した。ドキシサイクリン処理時のオン細胞の画分を計算するために、ガウシアンモデルを、非処理rTetRのみの陰性対照細胞にフィッティングさせ、これを、オフピークにフィッティングさせ、次いで、オンとして活性化された細胞を表示するために、オフピークの平均を2標準偏差上回った閾値を設定した。2つの独立に形質導入された生物学的反復を使用した。
FLAGタグ付けタンパク質レベルについてのフローサイトメトリー
FLAGタグ付け融合タンパク質レベルの染色を行った。具体的には、K562細胞を、レンチウイルスを用いて形質導入して、融合タンパク質を発現させ、ブラストサイジンにより選択し、次いで、固定緩衝液I(BD Biosciences)により、37℃で15分間にわたり固定した。細胞を、10%のFBSを有する冷PBSで1回洗浄し、次いで、Perm緩衝液III(BD Biosciences)を使用して、氷上で30分間にわたり透過処理した。細胞を、2回洗浄し、次いで、抗FLAG(XX)により、4℃で1時間にわたり染色した。最終ラウンドの洗浄後、フローサイトメトリーを、CytoFLEX(Beckman Coulter)フローサイトメーターを使用して、行った。データを、細胞をmCherry発現に対してゲートをかけることによって、CytoFlowにより解析し、次いで、mCherry+及び非形質導入細胞におけるFLAGタグ付けタンパク質レベルをプロットした。2つの細胞群として染色効率における変動性についてのこの手法の対照を、同じ試料内で混合した。
系統学的解析及びアライメント解析
周囲の天然配列を使用して、KRAB及びホメオドメイン配列を、80AAに到達するように、Pfamから検索し、抽出した。発現良好ドメインを、アライメントのために選択した。系統樹及び配列アライメントを、デフォルトパラメーターを使用するアライメントウェブサイトClustal Omega(McWilliamら、2013;Sieversら、2011)を使用して得て、距離補正なしの52の系統学的な近隣結合樹を、Jalview(Waterhouseら、2009)におけるデフォルトパラメーターにより構築した。アライメントの可視化を、Jalviewにおいて行った。
アミノ酸残基保存の解析
タンパク質配列を、ConSurfウェブサーバーに提出し、ConSeq法を使用して、解析した。簡潔には、ConSeqは、35~95%の配列同一性を有するホモログのリストからのサンプリングによって、多重ストリングアライメントのために最大で150のホモログを選択する。次いで、系統樹を再構築し、保存を、Rate4Siteを使用して、スコア付けする。ConSurfは、正規化されたスコアを提供し、その結果、全ての残基についての平均スコアは、ゼロであり、標準偏差は、1である。ConSurfによって計算された保存スコアは、タンパク質中の各残基の進化的保存の相対的尺度であり、最も低いスコアは、タンパク質中の最も保存された位置を表す。ZNF10 KRAB N末端伸長の一意性を、全てのヒトタンパク質に対するタンパク質BLAST、及びBLASTマッチ(Johnsonら、2008)の中の他の亜鉛フィンガータンパク質について探索することによって決定した。
ChIP-seq及びChiP-exo解析
外部ChIPデータセットを、複数のソースから検索した。ENCODE ChIP-seqデータを、ENCODE(ENCODE Project Consortiumら、2020)の均一な処理パイプラインで処理し、0.05のIDR閾値を下回る狭いピークを、検索した。HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのKRAB ZNF ChIP-exoデータ、及びH1 hESCからのKAP1 ChIP-exoデータを、GEOアクセッションGSE78099(Imbeaultら、2017)から得た。リードを、Bowtie(バージョン1.0.1;(Langmeadら、2009))を使用して、36塩基対の均一な長さにトリミングし、ヒトゲノムのhg38バージョンにマッピングし、最大で2のミスマッチ及び一意的アライメントのみを保持することを可能にした。ピークを、以下の設定:「-g hs-f BAM--keep-dup all--shift-75--extsize 150--nomodel」によるMACS2(バージョン2.1.0)(Fengら、2012)を使用して、コールした。ブラウザートラックを、Pythonスクリプトを使用して、作出した。ChIP-exoデータが利用可能でなかったいくつかのKRAB ZNFのために、HEK293細胞におけるタグ付けされたKRAB ZNFの過剰発現からのChIP-seqデータを、GEOアクセッションGSE76496(Schmitgesら、2016)及びGSE52523(Najafabadiら、2015)から得た。KRAB ZNFピークを、データセット中の他のKRAB ZNFが250塩基対未満離れたピークを有していなかった場合に、単独結合部位として定義した。H1細胞についてのENCODE H3K27ac ChIP-seqデータセットを、ENCODEパイプライン(ENCODE Project Consortiumら、2020)で処理し、狭いピークを、MACS2によりコールし、0.05のIDR閾値を下回るピークを、検索した。
外部のデータセット
KRAB ZNF、KAP1及びH3K27acについての、ChIP-seq及びChIP-exoデータ(ENCODE Project Consortiumら、2020;Imbeaultら、2017;Najafabadiら、2015;Schmitgesら、2016)、KRAB ZNF遺伝子の進化年代(Imbeaultら、2017)、KRAB ZNFタンパク質の共免疫沈降/質量分析データ(Helleboidら、2019)及びKRAB抑制活性についてのCATアッセイ(Margolinら、1994;Witzgallら、1994)は、既に公表されている研究から検索した。
本明細書において引用される、刊行物、特許出願及び特許を含む、全ての参考文献は、各参考文献が、参照により組み込まれることが、個別に、かつ、具体的に指し示され、その全体において、本明細書に明示された場合と同じ程度において、参照により本明細書に組み込まれる。
本明細書において、本発明者らに公知である、本発明を実行するための、最良の方式を含む、本発明の、好ましい実施形態が記載される。前出の記載を読めば、これらの好ましい実施形態に対する変動は、当業者に明らかとなりうる。本発明者らは、当業者が、必要に応じて、このような変動を援用することを期待しており、本発明者らは、本発明が、本明細書において具体的に記載された方式以外の方式において実施されることを意図する。したがって、本発明は、本明細書に付属の特許請求の範囲において列挙された対象物に対する、全ての改変及びこれらの同等物を、適用可能な法規により許容されたものとして含む。さらに、本明細書においてそうでないことが指し示されない限り、又は、文脈により、逆の記載がない限り、上記において記載された要素の、これらの全ての可能な変動における、任意の組合せも、本発明に包含される。
Figure 2023524733000002
Figure 2023524733000003
Figure 2023524733000004
Figure 2023524733000005
Figure 2023524733000006
Figure 2023524733000007
Figure 2023524733000008
Figure 2023524733000009
Figure 2023524733000010
Figure 2023524733000011
Figure 2023524733000012
Figure 2023524733000013
Figure 2023524733000014
Figure 2023524733000015
Figure 2023524733000016
Figure 2023524733000017
Figure 2023524733000018
Figure 2023524733000019
Figure 2023524733000020
Figure 2023524733000021
Figure 2023524733000022
Figure 2023524733000023
Figure 2023524733000024
Figure 2023524733000025
Figure 2023524733000026
Figure 2023524733000027
Figure 2023524733000028
Figure 2023524733000029
Figure 2023524733000030
Figure 2023524733000031
Figure 2023524733000032
Figure 2023524733000033
Figure 2023524733000034
Figure 2023524733000035
Figure 2023524733000036
Figure 2023524733000037
Figure 2023524733000038
Figure 2023524733000039
Figure 2023524733000040
Figure 2023524733000041
Figure 2023524733000042
Figure 2023524733000043
Figure 2023524733000044
Figure 2023524733000045
Figure 2023524733000046
Figure 2023524733000047
Figure 2023524733000048
Figure 2023524733000049
Figure 2023524733000050
Figure 2023524733000051
Figure 2023524733000052
Figure 2023524733000053
Figure 2023524733000054
Figure 2023524733000055
Figure 2023524733000056
Figure 2023524733000057
Figure 2023524733000058
Figure 2023524733000059
Figure 2023524733000060
Figure 2023524733000061
Figure 2023524733000062
Figure 2023524733000063
Figure 2023524733000064
Figure 2023524733000065
Figure 2023524733000066
Figure 2023524733000067
Figure 2023524733000068
Figure 2023524733000069
Figure 2023524733000070
Figure 2023524733000071
Figure 2023524733000072
Figure 2023524733000073
Figure 2023524733000074
Figure 2023524733000075
Figure 2023524733000076
Figure 2023524733000077
Figure 2023524733000078
Figure 2023524733000079
Figure 2023524733000080
Figure 2023524733000081
Figure 2023524733000082
Figure 2023524733000083
Figure 2023524733000084
Figure 2023524733000085
Figure 2023524733000086
Figure 2023524733000087
Figure 2023524733000088
Figure 2023524733000089
Figure 2023524733000090
Figure 2023524733000091
Figure 2023524733000092

Claims (57)

  1. 転写抑制ドメインを同定するための方法であって、
    a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;
    b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
    二部構成型レポーター遺伝子を、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ;
    c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの分解に必要な長さの時間にわたり処理するステップ;
    d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;
    e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;
    f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びに
    g)タンパク質ドメインを、転写抑制因子として同定するステップ
    を含む方法。
  2. レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む、請求項1に記載の方法。
  3. ステップd~gが、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される、請求項2に記載の方法。
  4. 各タンパク質ドメインが、80アミノ酸以下である、請求項1~3のいずれかに記載の方法。
  5. タンパク質ドメインが、核局在化タンパク質に由来する、請求項1~4のいずれかに記載の方法。
  6. タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項1~5のいずれかに記載の方法。
  7. タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項1~5のいずれかに記載の方法。
  8. 誘導型DNA結合性ドメインがタグを含む、請求項1~7のいずれかに記載の方法。
  9. タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項1~8のいずれかに記載の方法。
  10. 発現レベルが、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項9に記載の方法。
  11. レポーター細胞が、薬剤により、少なくとも3日間にわたり処理される、請求項1~10のいずれかに記載の方法。
  12. レポーター細胞が、薬剤により、5日間にわたり処理される、請求項1~11のいずれかに記載の方法。
  13. タンパク質ドメインが、比のlog2が発現不良陰性対照の平均値から少なくとも2標準偏差である場合に、転写抑制因子として同定される、請求項1~12のいずれかに記載の方法。
  14. 転写活性化ドメインを同定するための方法であって、
    a)各々が誘導型DNA結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ;
    b)レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
    二部構成型レポーター遺伝子が、誘導型DNA結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ;
    c)レポーター細胞を、薬剤により、細胞内のタンパク質及びmRNAの産生に必要な長さの時間にわたり処理するステップ;
    d)表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ;
    e)分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ;
    f)各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ;並びに
    g)タンパク質ドメインを、転写抑制因子として同定するステップ
    を含む方法。
  15. レポーター細胞の薬剤による処理を停止し、ステップd~gを、1回以上にわたり反復するステップをさらに含む、請求項14に記載の方法。
  16. ステップd~gが、レポーター細胞の薬剤による処理を停止した後に、少なくとも48時間にわたり反復される、請求項15に記載の方法。
  17. 各タンパク質ドメインが、80アミノ酸以下である、請求項14~16のいずれかに記載の方法。
  18. タンパク質ドメインが、核局在化タンパク質に由来する、請求項14~17のいずれかに記載の方法。
  19. タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項14~18のいずれかに記載の方法。
  20. タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項14~19のいずれかに記載の方法。
  21. 誘導型DNA結合性ドメインがタグを含む、請求項14~20のいずれかに記載の方法。
  22. タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項14~21のいずれかに記載の方法。
  23. 発現レベルが、DNA結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項22に記載の方法。
  24. レポーター細胞が、薬剤により、少なくとも24時間にわたり処理される、請求項14~23のいずれかに記載の方法。
  25. レポーター細胞が、薬剤により、48時間にわたり処理される、請求項14~24のいずれかに記載の方法。
  26. タンパク質ドメインが、比のlog2が低発現陰性対照の平均値から少なくとも2標準偏差である場合に、転写活性化因子として同定される、請求項14~25のいずれかに記載の方法。
  27. 異種DNA結合性ドメインへと融合した1つ以上の転写活性化ドメイン、1つ以上の転写抑制ドメイン又はこれらの組合せを含み、
    1つ以上の転写活性化ドメインのうちの少なくとも1つ又は1つ以上の転写抑制ドメインのうちの少なくとも1つが、配列番号1~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、合成転写因子。
  28. 異種DNA結合性ドメインへと融合した2つ以上の転写活性化ドメイン又は2つ以上の転写抑制ドメインを含む、請求項27に記載の合成転写因子。
  29. 1つ以上の転写活性化ドメインのうちの少なくとも1つが、配列番号563~664のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、請求項27~28のいずれかに記載の合成転写因子。
  30. 1つ以上の転写活性化ドメインのうちの少なくとも1つが、表2において見出されるものから選択される、請求項27~29のいずれかに記載の合成転写因子。
  31. 1つ以上の転写抑制ドメインのうちの少なくとも1つが、配列番号1~562及び665~896のうちのいずれかに対する少なくとも70%の同一性を有するアミノ酸配列を含む、請求項27~30のいずれかに記載の合成転写因子。
  32. 1つ以上の転写抑制ドメインのうちの少なくとも1つが、表1、3又は4において見出されるものから選択される、請求項27~31に記載の合成転写因子。
  33. 1つ以上の転写活性化ドメイン又は1つ以上の転写抑制ドメインが、請求項1~26のいずれか一項に記載の方法により同定される、請求項27~32のいずれかに記載の合成転写因子。
  34. 異種DNA結合性ドメインが、プログラム可能なDNA結合性ドメインを含む、請求項27~33のいずれかに記載の合成転写因子。
  35. DNA結合性ドメインが、クラスター化規則的間隔短鎖回文反復配列関連(Cas)タンパク質に由来する、請求項27~34のいずれかに記載の合成転写因子。
  36. 請求項27~35のいずれかに記載の合成転写因子をコードする核酸。
  37. 誘導型プロモーターの制御下にある、請求項36に記載の核酸。
  38. 組織特異的プロモーターの制御下にある、請求項36に記載の核酸。
  39. 少なくとも1つのさらなる転写因子をコードする、請求項36~39のいずれかに記載の核酸。
  40. 少なくとも1つのさらなる転写因子が、請求項27~35のいずれかに記載の合成転写因子を含む、請求項39に記載の核酸。
  41. 請求項36~40のいずれかに記載の核酸を含むベクター。
  42. 請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、又は請求項41に記載のベクターを含む細胞。
  43. 2つ以上の合成転写因子、核酸又はベクターを含む、請求項42に記載の細胞。
  44. 請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項42若しくは43に記載の細胞を含む組成物又はシステム。
  45. 前記組成物が、2つ以上の合成転写因子、核酸、ベクター又は細胞を含む、請求項44に記載の組成物又はシステム。
  46. ガイドRNA又はガイドRNAをコードする核酸をさらに含む、請求項44又は45に記載の組成物又はシステム。
  47. 請求項27~36のいずれかに記載の少なくとも1つの合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、請求項42若しくは43に記載の細胞、又は請求項44~46に記載の組成物若しくはシステムを含むキット。
  48. 細胞内の少なくとも1つの標的遺伝子の発現をモジュレートする方法であって、請求項27~35のいずれかに記載の少なくとも1つの合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項44~46に記載の組成物若しくはシステムを、細胞へ導入するステップを含む方法。
  49. 合成転写因子が、Casタンパク質のDNA結合性ドメインを含み、前記方法が、前記細胞を少なくとも1つのガイドRNAと接触させるステップをさらに含む、請求項48に記載の方法。
  50. 前記細胞が、対象における細胞である、請求項48又は49に記載の方法。
  51. 少なくとも1つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと投与するステップを含む、請求項50に記載の方法。
  52. 少なくとも2つの遺伝子の遺伝子発現がモジュレートされる、請求項48~51のいずれかに記載の方法。
  53. 少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる、請求項48~52のいずれかに記載の方法。
  54. 細胞内の少なくとも1つの標的遺伝子の発現をモジュレートするための、請求項27~35のいずれかに記載の合成転写因子、請求項36~40のいずれかに記載の核酸、請求項41に記載のベクター、又は請求項44~46に記載の組成物若しくはシステムの使用。
  55. 合成転写因子が、Casタンパク質のDNA結合性ドメインを含む、請求項54に記載の使用。
  56. 少なくとも2つの遺伝子の遺伝子発現がモジュレートされる、請求項54又は55に記載の使用。
  57. 少なくとも1つの標的遺伝子の遺伝子発現レベルが少なくとも1つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも1つの標的遺伝子の遺伝子発現がモジュレートされる、請求項54~56のいずれかに記載の使用。
JP2022567096A 2020-05-04 2021-05-04 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法 Pending JP2023524733A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063019706P 2020-05-04 2020-05-04
US63/019,706 2020-05-04
US202063074793P 2020-09-04 2020-09-04
US63/074,793 2020-09-04
PCT/US2021/030643 WO2021226077A2 (en) 2020-05-04 2021-05-04 Compositions, systems, and methods for the generation, identification, and characterization of effector domains for activating and silencing gene expression

Publications (2)

Publication Number Publication Date
JP2023524733A true JP2023524733A (ja) 2023-06-13
JPWO2021226077A5 JPWO2021226077A5 (ja) 2024-05-01

Family

ID=78468782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022567096A Pending JP2023524733A (ja) 2020-05-04 2021-05-04 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法

Country Status (7)

Country Link
EP (1) EP4146801A4 (ja)
JP (1) JP2023524733A (ja)
KR (1) KR20230005984A (ja)
CN (1) CN116234902A (ja)
AU (1) AU2021268634A1 (ja)
CA (1) CA3176046A1 (ja)
WO (1) WO2021226077A2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4377460A1 (en) 2021-07-30 2024-06-05 Tune Therapeutics, Inc. Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2)
EP4377459A2 (en) 2021-07-30 2024-06-05 Tune Therapeutics, Inc. Compositions and methods for modulating expression of frataxin (fxn)
WO2023137472A2 (en) 2022-01-14 2023-07-20 Tune Therapeutics, Inc. Compositions, systems, and methods for programming t cell phenotypes through targeted gene repression
WO2023137471A1 (en) 2022-01-14 2023-07-20 Tune Therapeutics, Inc. Compositions, systems, and methods for programming t cell phenotypes through targeted gene activation
WO2023215711A1 (en) 2022-05-01 2023-11-09 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of pcsk9 expression
WO2023250512A1 (en) 2022-06-23 2023-12-28 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of ciita expression
WO2023250490A1 (en) 2022-06-23 2023-12-28 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of trac expression
WO2023250509A1 (en) 2022-06-23 2023-12-28 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of b2m expression
WO2023250511A2 (en) 2022-06-24 2023-12-28 Tune Therapeutics, Inc. Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression
WO2024015881A2 (en) 2022-07-12 2024-01-18 Tune Therapeutics, Inc. Compositions, systems, and methods for targeted transcriptional activation
TW202426641A (zh) 2022-08-19 2024-07-01 美商圖恩療法股份有限公司 以靶向基因抑制來調節b型肝炎病毒之組合物、系統和方法
WO2024064642A2 (en) 2022-09-19 2024-03-28 Tune Therapeutics, Inc. Compositions, systems, and methods for modulating t cell function
WO2024064910A1 (en) 2022-09-23 2024-03-28 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of hbv gene expression
WO2024081879A1 (en) 2022-10-14 2024-04-18 Chroma Medicine, Inc. Compositions and methods for epigenetic regulation of cd247 expression
WO2024163683A2 (en) 2023-02-01 2024-08-08 Tune Therapeutics, Inc. Systems, compositions, and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) and x-inactive specific transcript (xist)
WO2024163678A2 (en) 2023-02-01 2024-08-08 Tune Therapeutics, Inc. Fusion proteins and systems for targeted activation of frataxin (fxn) and related methods
CN117143257B (zh) * 2023-10-31 2024-02-09 深圳市帝迈生物技术有限公司 Trim28-krab-znf10二元复合物、制备方法及用于前列腺癌筛查的试剂盒

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030180777A1 (en) * 2002-03-12 2003-09-25 Victor Bartsevich Rapid identification of transcriptional regulatory domains
EP2825561A4 (en) * 2012-03-15 2016-03-09 Permeon Biolog Inc CELL PENETRATING COMPOSITIONS FOR THE DISPOSAL OF INTRA-CELLULAR ANTIBODIES AND ANTIBODY-RELATED UNITS AND METHODS OF USE
US8999380B2 (en) * 2012-04-02 2015-04-07 Moderna Therapeutics, Inc. Modified polynucleotides for the production of biologics and proteins associated with human disease
WO2016011080A2 (en) * 2014-07-14 2016-01-21 The Regents Of The University Of California Crispr/cas transcriptional modulation
US11629342B2 (en) * 2017-10-17 2023-04-18 President And Fellows Of Harvard College Cas9-based transcription modulation systems
US11547614B2 (en) * 2017-10-31 2023-01-10 The Broad Institute, Inc. Methods and compositions for studying cell evolution
US20210079404A9 (en) * 2018-09-25 2021-03-18 Massachusetts Institute Of Technology Engineered dcas9 with reduced toxicity and its use in genetic circuits

Also Published As

Publication number Publication date
CA3176046A1 (en) 2021-11-11
WO2021226077A3 (en) 2022-02-03
EP4146801A4 (en) 2024-06-26
CN116234902A (zh) 2023-06-06
WO2021226077A2 (en) 2021-11-11
EP4146801A2 (en) 2023-03-15
AU2021268634A1 (en) 2022-11-24
KR20230005984A (ko) 2023-01-10

Similar Documents

Publication Publication Date Title
JP2023524733A (ja) 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法
Replogle et al. Maximizing CRISPRi efficacy and accessibility with dual-sgRNA libraries and optimal effectors
O'Connor et al. Ubiquitin‐Activated Interaction Traps (UBAIT s) identify E3 ligase binding partners
JP5537420B2 (ja) 標的遺伝子の誘導性変異誘発
CN103620405B (zh) 全面单克隆抗体产生
US20240230663A1 (en) Methods, compositions, and systems for profiling or predicting an immune response
CN105924499B (zh) 蛋白演化的新方法
JP2021515582A (ja) 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集
KR20220002712A (ko) 생산 숙주에서 항체/단백질 성능과 발현을 동시에 통합 선택하고 진화시키는 방법
Dai et al. Massively parallel knock-in engineering of human T cells
US20210118522A1 (en) Methods and composition for modulating immune response and immune homeostasis
Rosch et al. CRISPR-mediated isogenic cell-SELEX approach for generating highly specific aptamers against native membrane proteins
WO2022167665A1 (en) Engineered transposase and uses thereof
WO2017117331A1 (en) Methods for identifying and treating hemoglobinopathies
US20230365637A1 (en) Identification of pax3-foxo1 binding genomic regions
WO2023023553A2 (en) Compositions, systems, and methods for activating and silencing gene expression
Chieca et al. Live-cell quantification of APOBEC1-mediated RNA editing: a comparison of RNA editing assays
US20220411472A1 (en) Self-assembling circular tandem repeat proteins with increased stability
CA3188501A1 (en) Therapeutic targeting of phosphate dysregulation in cancer via the xpr1:kidins220 protein complex
EP4442704A1 (en) Peptide having framework sequence for random region placement and peptide library composed of said peptide
WO2023039528A1 (en) Nanobody-mediated control of gene expression and epigenetic memory
Oldberg Elucidating the Novel Role for Core Binding Factor beta in Osteosarcoma Protein Translation
US10954515B2 (en) Therapeutic methods, products and compositions inhibiting ZNF555
Xu et al. the Interaction Proteome of Ribosomal 40S Components PNO1 and NOB1 Using TurboID Proximity Labeling Technology
Stranger DNA damage in transcriptional regulation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240418

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240418