JP2023524733A

JP2023524733A - 遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法

Info

Publication number: JP2023524733A
Application number: JP2022567096A
Authority: JP
Inventors: バッシク，マイケル・シー; ティッコ，ジョッシュ; ヘス，ガーレン・ティー; ビントゥ，ラクラミオアラ
Original assignee: Leland Stanford Junior University
Current assignee: Leland Stanford Junior University
Priority date: 2020-05-04
Filing date: 2021-05-04
Publication date: 2023-06-13
Also published as: CA3176046A1; WO2021226077A3; EP4146801A4; CN116234902A; WO2021226077A2; EP4146801A2; AU2021268634A1; KR20230005984A

Abstract

本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。

Description

関連出願の相互参照
本出願は、それらの各々の内容が、参照によりそれらの全体において本明細書に組み込まれた、２０２０年５月４日に出願された米国仮出願第６３／０１９，７０６号及び２０２０年９月４日に出願された米国仮出願第６３／０７４，７９３号の利益を主張する。

分野
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。

連邦政府による後援を受けた調査研究に関する言明
本発明は、米国国立衛生研究所により授与された、ＧＭ１２８９４７の契約下にある政府助成によりなされた。米国連邦政府は、本発明において、一定の権利を有する。

合成転写因子を操作しようとする、既存の取組みは、既に発見されたエフェクタードメインによる、小型のツールボックスから、活性化ドメイン及び抑制ドメインを取り出した。このツールボックスを拡張するための、新たな方法が必要とされている。

（発明の要旨）
本明細書において、遺伝子発現を活性化及びサイレンシングするためのエフェクタードメインの作出、同定及び性質決定のための組成物、システム及び方法が提供される。特に、エフェクタードメインを発見し、性質決定するためのハイスループットシステムが提供される。本明細書の一部の実施形態において、ツールボックスを大幅に拡張するエフェクタードメインを発見し、性質決定するためのハイスループット法が提供される。これらのドメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子の増強を操作する喫緊の必要を満たす。

一部の実施形態において、エフェクタードメインを同定するための方法は、ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ；ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの分解に必要な長さの時間にわたり処理するステップ；ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びにｇ）タンパク質ドメインを、転写抑制因子として同定するステップを含む。

一部の実施形態において、エフェクタードメインを同定するための方法は、ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能であるステップ；ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの産生に必要な長さの時間にわたり処理するステップ；ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びにｇ）タンパク質ドメインを、転写活性化因子として同定するステップを含む。

一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、ステップｄ～ｇを、１回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップｄ～ｇは、レポーター細胞の薬剤による処理を停止した後に、少なくとも４８時間にわたり反復される。

一部の実施形態において、各タンパク質ドメインは、８０アミノ酸以下である。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。

一部の実施形態において、誘導型ＤＮＡ結合性ドメインはタグを含む。

一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。一部の実施形態において、発現レベルは、ＤＮＡ結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。

一部の実施形態において、レポーター細胞は、薬剤により、少なくとも３日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも５日間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも２４時間にわたり処理される。一部の実施形態において、レポーター細胞は、薬剤により、少なくとも４８時間にわたり処理される。

一部の実施形態において、タンパク質ドメインは、比のｌｏｇ２が発現不良陰性対照の平均値から少なくとも２標準偏差である（例えば、これより高値である）場合に、転写抑制因子として同定される。

一部の実施形態において、タンパク質ドメインは、比のｌｏｇ２が低発現陰性対照の平均値から少なくとも２標準偏差である（例えば、これより低値である）場合に、転写活性化因子として同定される。

本明細書においてまた、異種ＤＮＡ結合性ドメインへと融合した１つ以上の転写活性化ドメイン、１つ以上の転写抑制ドメイン又はこれらの組合せを含む合成転写因子も提供される。一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つ又は１つ以上の転写抑制ドメインのうちの少なくとも１つは、配列番号１～８９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。

一部の実施形態において、合成転写因子は、異種ＤＮＡ結合性ドメインへと融合した２つ以上の転写活性化ドメイン又は２つ以上の転写抑制ドメインを含む。

一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つは、配列番号５６３～６６４のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つは、表２において見出されるものから選択される。

一部の実施形態において、１つ以上の転写抑制ドメインのうちの少なくとも１つは、配列番号１～５６２及び６６５～８９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写抑制ドメインのうちの少なくとも１つは、表１、３又は４において見出されるものから選択される。

一部の実施形態において、１つ以上の転写活性化ドメイン又は１つ以上の転写抑制ドメインは、本明細書において開示された方法により同定される。

一部の実施形態において、異種ＤＮＡ結合性ドメインは、プログラム可能なＤＮＡ結合性ドメインを含む。一部の実施形態において、ＤＮＡ結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連（Ｃａｓ）タンパク質に由来する。一部の実施形態において、ＤＮＡ結合性ドメインは、転写活性化因子様エフェクター（ＴＡＬＥ）ドメインに由来する。

本明細書においてまた、本明細書において開示された合成転写因子又はエフェクタードメインをコードする核酸も提供される。一部の実施形態において、核酸は、誘導型プロモーターの制御下にある。一部の実施形態において、核酸は、組織特異的プロモーターの制御下にある。一部の実施形態において、核酸は、少なくとも１つのさらなる転写因子又はエフェクタードメインをコードする。

本明細書において、本明細書において開示された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムがさらに提供される。一部の実施形態において、組成物は、２つ以上の合成転写因子、核酸、ベクター又は細胞を含む。一部の実施形態において、組成物は、ガイドＲＮＡ又はガイドＲＮＡをコードする核酸をさらに含む。

加えて、細胞内の少なくとも１つの標的遺伝子の発現をモジュレートする方法も提供される。方法は、細胞へと、本明細書において記載された少なくとも１つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む。少なくとも１つの標的遺伝子の遺伝子発現レベルが少なくとも１つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも１つの標的遺伝子の遺伝子発現がモジュレートされる。一部の実施形態において、合成転写因子は、Ｃａｓタンパク質のＤＮＡ結合性ドメインを含み、方法は、細胞を少なくとも１つのガイドＲＮＡと接触させるステップをさらに含む。

一部の実施形態において、細胞は、インビトロ（例えば、エクスビボ）における細胞又は対象における細胞である。

一部の実施形態において、少なくとも２つの遺伝子の遺伝子発現がモジュレートされる。

ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。核へと局在化されたヒトタンパク質内のＰｆａｍアノテーションドメインの長さである。≦８０アミノ酸のドメインを、ライブラリーへの組入れのために選択した。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。転写抑制因子を同定するスクリーンについての概略図である。抑制レポーターは、抑制ドメインの、ドキシサイクリン媒介リクルートメントによりサイレンシングされうる、強力なｐＥＦプロモーターを使用する。細胞を、ドキシサイクリンにより、５日間にわたり処理し、オン細胞と、オフ細胞とを、磁性的に分離し、ドメインをシーケンシングした。ドキシサイクリンを除去し、９及び１３日目に、さらなる時点を設定した。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。ｌｏｇ_２（オフ：オン）比の、独立に形質導入された生物学的反復からの再現性を示し、選択されたドメインファミリーに着色する。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。ファミリー内のドメインの、５日目における最大の抑制強度によりランク付けされた、上位の抑制ドメインファミリーについての箱髭図である。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。フローサイトメトリーにより測定された、ヒットＲＹＢＰドメインについての、個別検証の時間経過である。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。抑制ドメインのパネルについての、さらなる検証時間経過である。一部のドメインは、ライブラリーに由来する、正確な８０アミノ酸の配列として調べ、一部のドメインは、Ｐｆａｍにより、ドメインとしてアノテーションされた領域へとトリミングされた、短い配列として調べたため、ドメイン長を、括弧内に列挙する。１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した。ハイスループットリクルートメントが、核局在化タンパク質に由来する、数千のＰｆａｍアノテーションドメインの、転写抑制活性を測定することを示す図である。ＫＲＡＢエフェクタードメインのコレクションについての、スクリーンによる測定値の、個別の検証フローサイトメトリー測定との相関である。抑制性ＫＲＡＢドメインが、ＫＡＰ１抑制補因子と共局在化し、これに結合する、より近年のＫＲＡＢ亜鉛フィンガータンパク質内にあることを示す図である。ＫＲＡＢのサイレンシング機能を、ＫＲＡＢドメインが、天然で見出される、ＫＲＡＢ亜鉛フィンガータンパク質のアーキテクチャーと比較した。抑制性ＫＲＡＢドメインが、ＫＡＰ１抑制補因子と共局在化し、これに結合する、より近年のＫＲＡＢ亜鉛フィンガータンパク質内にあることを示す図である。ＫＲＡＢのサイレンシング機能を、その全ＤＮＡ結合性亜鉛フィンガーアレイ配列を使用して、遺伝子の最も近年のオーソログを見出すことにより決定された、ＫＲＡＢ亜鉛フィンガー遺伝子の進化年代と比較した（年代は、Ｔｒｏｎｏ、２０１７において公表されている）。抑制性ＫＲＡＢドメインが、ＫＡＰ１抑制補因子と共局在化し、これに結合する、より近年のＫＲＡＢ亜鉛フィンガータンパク質内にあることを示す図である。ＫＲＡＢドメインを、サイレンサー又は非サイレンサーと類別し、ＣｈＩＰ－ｓｅｑデータセットにおける、それらのゲノム内局在を、抑制補因子である、ＫＲＡＢ関連タンパク質１（ＫＡＰ１）の局在と比較した。抑制性ＫＲＡＢドメインが、ＫＡＰ１抑制補因子と共局在化し、これに結合する、より近年のＫＲＡＢ亜鉛フィンガータンパク質内にあることを示す図である。質量分析データセット（Ｈｅｌｌｅｂｏｉｄ、２０１９）において、それらのＫＲＡＢ亜鉛フィンガー遺伝子が、抑制補因子であるＫＡＰ１と、有意に相互作用するのかどうかにより類別された、ＫＲＡＢドメインの抑制強度分布である。ドットの色は、ＫＲＡＢドメインの発現レベルについての５分位数である。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。高深度突然変異スキャニングライブラリーは、ＺＮＦ１０に由来するＫＲＡＢドメイン内の、単一置換並びに連続二重置換及び連続三重置換の全てを含む。ＤＮＡオリゴは、コドン使用の変動によるタンパク質配列より顕著に異なるようにデザインされる。赤色残基は、ＷＴ配列と異なる。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。単一置換変異体及び三重置換変異体の全てによる抑制因子の、ＷＴと比べた測定値を、ＫＲＡＢドメインについての概略図の下方に示す。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。９日目における、突然変異の、抑制に対する、全てのヒトＫＲＡＢドメインについての、複数の配列アライメントによる、配列の保存（ＣｏｎＳｕｒｆにより計算された）と比較した、平均効果である。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。ハイスループット測定値の、異なる細胞型における、ＣＡＴアッセイを使用する、既に公表されているロースループットデータとの相関である。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。ＫＲＡＢ突然変異体についての、個々の時間経過は、Ａボックス／Ｂボックス及びＮ末端における置換の効果を検証する。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。図３Ｂの各時点における各位置について、全ての単一置換の分布を、野生型効果の分布と比較した（ウィルコクソンランクサム検定）。５日目における符号つきｌｏｇ_１０（ｐ）を、＜－５とする位置を、赤色（サイレンシングの高度に有意な低下）により着色し、９日目における符号つきｌｏｇ_１０（ｐ）を、＜－５とするが、５日目における符号つきｌｏｇ_１０（ｐ）は、＜－５としない位置を、緑色により着色し、１３日目におけるｌｏｇ_１０（ｐ）を、＞５とするＷ８位を、青色（高度に有意な増大）により着色する。水平方向の破線は、ヒット閾値を示す。配列保存についてのＣｏｎＳｕｒｆスコアを、オレンジにより示す。ＺＮＦ１０ＫＲＡＢドメインの高深度突然変異スキャンが、抑制活性を低減又は増強する置換を同定することを示す図である。突然変異した場合に、５日目に、サイレンシングを失効化させる残基を、マウスＫＲＡＢＡボックス（ＰＤＢ：１ｖ６５）のＮＭＲ構造の秩序領域へとマッピングする。ホメオドメイン抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であることを示す図である。５日目における中央値抑制強度による、ホメオボックス遺伝子ファミリー又はホメオボックス遺伝子クラスのランク付けである。最強のホメオドメイン抑制因子を含有する、ＡＮＴＰクラスのホメオドメインの、ＨＯＸＬサブクラス及びＮＫＬサブクラス、並びにＰＲＤクラス及びＬＩＭクラスが、個々の遺伝子ファミリーへと分けられる（ＨｏｌｌａｎｄＢＭＣ、２００７）のに対し、残りのクラスは、凝集される。ドットの色は、ハイスループット発現アッセイにおいて測定された、ホメオドメイン発現レベルの５分位数である。ホメオドメイン抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であることを示す図である。Ｈｏｘ遺伝子ファミリーに由来するホメオドメインの、５日目における抑制強度である。矢印は、４つのヒトＨｏｘ遺伝子座内に見出された遺伝子を表し、Ｈｏｘ遺伝子転写の方向を指し示す。グレーバーは、遺伝子ファミリーを区分する。スピアマンのロー値及びｐ値を、全てのＨｏｘ遺伝子にわたり、遺伝子数と、抑制強度との関係について計算した。データを、フィルタリングして、５日目におけるシーケンシング試料のうちのいずれかにおけるカウントが１０より小さい、任意のドメインを除去した。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化ドメインのドキシサイクリン媒介リクルートメントにより活性化されうる、弱いｍｉｎＣＭＶプロモーターを使用する活性化レポーターについての概略図及び活性化スクリーンについての概略図である。細胞のプールを、ドキシサイクリンにより、４８時間にわたり処理し、オン細胞と、オフ細胞とを、ＰｒｏＧＤｙｎａｂｅａｄにより磁性的に分離し、ドメインをシーケンシングした。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。公知の活性化ドメインファミリー（ＦＯＸＯ－ＴＡＤ、ＭｙｂＬＭＳＴＥＮ、ＴＯＲＣ＿Ｃ）に着色して、ｌｏｇ_２（オフ：オン）比の、独立に形質導入された生物学的反復からの再現性を示す。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化強度が閾値を下回るドメインを含有する遺伝子についてのＧＯタームエンリッチメントである。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。活性化ドメイン（赤）は、非ヒット（グレー）より酸性である。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。平均値活性化強度によりランク付けされた、ドメインファミリーのリストである。ハイスループットリクルートメントが、ＺＮＦ４７３内の、ＫＲＡＢドメインの強力変異体、酸性変異体及び分岐変異体を含む、活性化ドメインを発見することを示す図である。ＫＲＡＢドメインを、配列によりアライメント及びクラスター化したところ、Ｈｅｌｌｅｂｏｉｄ、２０１９における分類と同様の結果がもたらされた。最も分岐的なＫＲＡＢ配列のクラスターは、緑色により表示された変異体ＫＲＡＢである。スクリーンからの結果を、ヒートマップの下方に示す。標準ＫＲＡＢは、発現良好である場合、抑制因子として機能する。変異体ＫＲＡＢは、スクリーンにおいて、抑制因子、活性化因子としての混合効果を示し、転写効果を示さない。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。８０アミノ酸のタイルが、１０アミノ酸のスライディングウィンドウにより、タンパク質配列をカバーする、ライブラリーについてのグラフ描示である。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。独立に形質導入された生物学的反復からの、ｌｏｇ_２（オフ：オン）比の再現性を示す。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。５日目における抑制を、ＭＧＡタンパク質について公知のドメインアーキテクチャーと比較する。２つの抑制ドメインは、既存のアノテーション領域の外部に見出される。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。フローサイトメトリーについての時間経過は、８０アミノ酸のタイルとしての、個々のＭＧＡエフェクターを検証する。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。エフェクターを、スクリーンにおいて抑制活性を示すタイルの間において共有された配列を選択することにより、１０～３０アミノ酸のサブタイルへと最小化した。これらの最小化配列を、フローサイトメトリーについての時間経過により、個別に検証した。タイリングライブラリーが、大型のクロマチン調節タンパク質内の、新たな自律性抑制ドメインを明らかにすることを示す図である。タイリングスクリーンによる、さらなる８０アミノ酸の抑制因子ヒットについての、個別の検証である。ｒＴｅｔＲ－タイル融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、細胞を、１００ｎｇ／ｍｌのドキシサイクリンにより、５日間にわたり処理し、次いで、ドキシサイクリンを除去した。細胞を、フローサイトメトリーにより解析し、それらのシトリン発現レベルにより、細胞にゲートをかけることにより、オフ細胞の割合を測定した。リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスｒＴｅｔＲドメイン融合体による遺伝子サイレンシングを測定することを示す図である。レンチウイルスベクターについての概略図である。リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスｒＴｅｔＲドメイン融合体による遺伝子サイレンシングを測定することを示す図である。ｐＪＴ０５０へとクローニングされたＺＮＦ１０ＫＲＡＢについての、時間経過にわたる、シトリンオフ：オンのＦＡＣＳヒストグラムを示す、Ｋ５６２レポーター細胞内のパイロット試験である。１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した。リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスｒＴｅｔＲドメイン融合体による遺伝子サイレンシングを測定することを示す図である。時間経過にわたる、オン細胞の割合である。リクルートメントアッセイが、蛍光レポーターを伴う、レンチウイルスｒＴｅｔＲドメイン融合体による遺伝子サイレンシングを測定することを示す図である。レポーターシステムはまた、ＨＥＫ２９３Ｔ細胞においても確立した。細胞に、ｒＴｅｔＲ－ＫＲＡＢ又はｐＯｒｉ対照をコードするプラスミドをトランスフェクトし、フローサイトメトリーにより解析する前に、２日間（上）及び４日間（下）にわたり、１０００ｎｇ／ｍｌのドキシサイクリンを伴う、又は伴わずに処理した。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ライブラリー内の、各ドメイン融合体について、発現レベルを測定するハイスループット法についての概略図である。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ドメイン発現の測定値の再現性である。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ウェスタンブロットによる検証である。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。サブライブラリーについての安定性：ランダムは不安定化されるが、タイルは、Ｐｆａｍドメインと同様である。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。安定性は、残基の正味電荷及び障害促進性と分類された残基と関連する。Ｐｆａｍドメインの、抑制機能についてのスクリーンを示す図である。磁性分離の前後における、細胞ライブラリーについてのフローサイトメトリーである。Ｐｆａｍドメインの、抑制機能についてのスクリーンを示す図である。一過性抑制因子と対比した、ｌｏｇＰによる上位１０の安定性抑制因子についての、ＰＡＮＴＨＥＲタンパク質クラスエンリッチメントである。Ｐｆａｍドメインの、抑制機能についてのスクリーンを示す図である。５日目における抑制強度によりランク付けされた、ドメインファミリーの全リストである。Ｐｆａｍドメインの、抑制機能についてのスクリーンを示す図である。ｒＴｅｔＲ－ＳＵＭＯ融合体は、レポーターをサイレンシングする。ＳＵＭＯコンジュゲーション部位における突然変異（ＧＧ９１ＡＡ）は、サイレンシング速度を低減し、ＳＵＭＯ相互作用性非共有結合的結合性部位における突然変異は、サイレンシングメモリーを低減する。Ｐｆａｍドメインの、抑制機能についてのスクリーンを示す図である。抑制活性を伴う、機能未知ドメイン（ＤＵＦ）についての検証である。ＫＲＡＢについての高深度突然変異スキャンを示す図である。５、９及び１３日目における、ＺＮＦ１０に由来するＫＲＡＢドメインについての高深度突然変異ライブラリーに対する、２連の生物学的反復による、オフ：オンスコアである。ＫＲＡＢについての高深度突然変異スキャンを示す図である。ＫＲＡＢ変異体の発現レベルについてのＦＬＡＧタグ染色：非サイレンシング変異体は、分解される。Ｂボックス突然変異体は、安定性である。ＫＲＡＢについての高深度突然変異スキャンを示す図である。ＦＬＡＧタグ染色は、ＦＬＡＧタグについてのウェスタンブロットと相関する。活性化因子のスクリーンデータを示す図である。ｒＴｅｔＲ－ＶＰ６４を、Ｋ５６２ｍｉｎＣＭＶレポーター細胞へと電気穿孔するパイロット試験である。ドキシサイクリンを添加した後において、レポーター細胞は、シトリンの発現についてのフローサイトメトリーにより測定される通り、オンになる。活性化因子のスクリーンデータを示す図である。フローサイトメトリーにより解析された、活性化因子スクリーン時における、プールライブラリーの磁性分離である。活性化因子のスクリーンデータを示す図である。Ｐｆａｍドメインライブラリーを、２つの異なるレポータープロモーターと共に使用する、ハイスループットリクルートメントによる転写調節の測定値の比較である。各ドメインは、ドットであり、ドットのサイズは、ＦＬＡＧスクリーンにおいて測定された発現四分位数である。数千のＰｆａｍドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。任意のファミリー内のドメインの、５日目における最大の抑制強度によりランク付けされた、上位の抑制ドメインファミリーについての箱髭図である。直線は、中央値を示し、髭は、高四分位数及び低四分位数を、四分位間範囲の１．５倍の範囲を示し、異常値は、ダイアモンドにより示される。破線は、ヒット閾値を示す。ボックスは、本文中において明らかにされたドメインファミリーについて着色した。数千のＰｆａｍドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。フローサイトメトリーにより測定された、ＲＹＢＰドメイン及び抑制活性を伴う、２つの機能未知ドメイン（ＤＵＦ）についての個別の検証である。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、２連の生物学的反復を伴う。垂直方向の直線は、オフ細胞の割合を決定するのに使用された、シトリンゲートを示す。数千のＰｆａｍドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。遺伝子サイレンシングモデルによりフィッティングされた検証時間経過：速度ｋｓによる指数関数的サイレンシングに続く、指数関数的再活性化である。ドキシサイクリン（１０００ｎｇ／ｍｌ）を、０日目に添加し、５日目に除去した（生物学的反復のＮ＝２）。シトリンレポーターがオフである、ｍＣｈｅｒｒｙ陽性細胞の割合は、図１２Ｂにおける通りに、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。数千のＰｆａｍドメインについてのスクリーンにおいて発見された、数百の抑制因子を示す図である。５日目におけるハイスループット測定値の、サイレンシング速度ｋｓとの相関である（Ｒ^２＝０．８６、ドメインのｎ＝１５、生物学的反復のＮ＝２～３）。水平方向の誤差バーは、フィッティングされた速度についての標準偏差であり、垂直方向の誤差バーは、スクリーンの生物学的反復の範囲であり、破線は、線形回帰の９５％信頼区間である。Ｈｏｘホメオドメインの抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。５日目における、それらのホメオドメインの中央値抑制強度による、ホメオボックス遺伝子クラスのランク付けである。水平方向の直線は、ヒット閾値を示す。ＣＥＲＳクラスに由来する５つのホメオドメインは、いずれも、発現良好ではなかった。Ｈｏｘホメオドメインの抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。Ｈｏｘ遺伝子ファミリーに由来するホメオドメインである。（上）前後軸に沿った、Ｈｏｘ遺伝子発現パターンを、適合胚画像上のＨｏｘパラログ数により着色する（Ｈｕｅｂｅｒら、２０１０）。Ｈｏｘ１１及びＨｏｘ１２はいずれも、四肢の後端において、近位－遠位軸に沿って発現される（Ｗｅｌｌｉｋ及びＣａｐｅｃｃｈｉ、２００３）。（中）５日間にわたるドキシサイクリン処理後における抑制強度である。ドットを、Ｈｏｘクラスターにより着色し、パラログ数を、胚概略図における通りに着色する。スピアマンのロー値及びｐ値を、パラログ数及び抑制強度の間の関係について、全てのＨｏｘ遺伝子にわたり計算した。（下）有色矢印は、４つのヒトＨｏｘクラスター内において見出された遺伝子を表し、Ｈｏｘ遺伝子転写の方向を、５’から３’へと指し示す。グレーバーは、遺伝子配列の類似性群を、既に分類されている（Ｈｕｅｂｅｒら、２０１０）通りに区分する。Ｈｏｘホメオドメインの抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。赤色により強調されたＲＫＫＲモチーフを示す、強力な抑制因子を上位とする（５日目におけるオフ：オン比によりランク付けされた）、Ｈｏｘホメオドメインの複数の配列アライメントである。Ｎ末端アーム内の他の塩基残基を、ラベンダーにより着色した。Ｈｏｘホメオドメインの抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。各Ｈｏｘホメオドメインのヘリックス１の上流のＮ末端アーム内における、正帯電残基の数と、５日目における抑制平均との相関である。ドットの色は、パラログ数を示す。Ｈｏｘホメオドメインの抑制強度が、Ｈｏｘ遺伝子の編成と共直線性であり、正電荷と関連することを示す図である。ＰＤＢＩＤ：２Ｌ７Ｚにより検索され、ＲＫＫＲモチーフを赤色により強調した、ＨＯＸＡ１３ホメオドメインのＮＭＲ構造である。複数の配列アライメントに由来する座標を使用する、Ｇ１５～Ｓ８１の配列を示す。活性化ドメインの発見を示す図である。ｒＴｅｔＲへと融合したエフェクタードメインを活性化させる、ドキシサイクリン媒介リクルートメントにより活性化されうる、弱いｍｉｎＣＭＶプロモーターを使用する、活性化レポーターについての概略図である。活性化ドメインの発見を示す図である。独立に形質導入された、２連の生物学的反復からの、ハイスループット活性化因子測定の再現性である。核ドメインライブラリーを、図１４Ａの活性化レポーターを含有する細胞のプールへと形質導入し、細胞のプールを、ドキシサイクリンにより、４８時間にわたり処理し、オン細胞と、オフ細胞とを、磁性的に分離し、ドメインをシーケンシングした。オフ細胞に由来するシーケンシングリードの、オン細胞に由来するシーケンシングリードと対比した比を、発現良好ドメインについて示す。アノテーションされたＰｆａｍ活性化ドメインファミリー（ＦＯＸＯ－ＴＡＤ、ＭｙｂＬＭＳＴＥＮ、ＴＯＲＣ＿Ｃ）を、赤色の影により着色した。直線は、最強のヒットである、ＺＮＦ４７３に由来するＫＲＡＢドメインに照らして引く。ヒット閾値は、発現不良ドメイン分布の平均値の２標準偏差下方に引かれた破線である。活性化ドメインの発見を示す図である。少なくとも１つの活性化性ヒットを伴うドメインファミリーについてのランクリストである。Ｐｆａｍ内において、活性化因子として、既にアノテーションされているファミリーを、赤色とする。破線は、図１４Ｂにおける通り、ヒット閾値を表す。発現良好ドメインだけを示す。活性化ドメインの発見を示す図である。アミノ酸１つ当たりの正味電荷として計算された、Ｐｆａｍライブラリーに由来するエフェクタードメインの酸性度である。（左）ヒットなしの、発現良好Ｐｆａｍドメイン（ＫＲＡＢ及びアノテーション活性化因子を除く）の、活性化性ヒットドメインとの比較である。アノテーションされたＰｆａｍ活性化ドメインファミリーを、陽性対照群（オレンジ）として示す。（右）活性化性ヒットドメインと、ＫＲＡＢドメインファミリーに由来するヒットなしドメインとの比較である。マン－ホイットニー検定によるＰ値を、比較群間のバーにより示す。ｎ．ｓ．＝非有意（ｐ＞０．０５）である。活性化ドメインの発見を示す図である。配列分岐的変異体ＫＲＡＢクラスターを伴う、全ての発現良好ＫＲＡＢドメインについての系統樹を、緑色により示す（上）。５日目における抑制についての、ハイスループットリクルートメント測定値を、青色により示し（中）、活性化についての測定値を、赤色により示す（下）。水平方向の破線は、ヒット閾値を示す。ＺＮＦ１０に由来する抑制性ＫＲＡＢ、ＺＦＰ２８に由来する抑制性ＫＲＡＢ＿１、及び全ての活性化性ＫＲＡＢドメインについての例は、大型の表示によりコールアウトする。ＫＲＡＢドメイン始点を、括弧内に記載する。活性化ドメインの発見を示す図である。変異体ＫＲＡＢ活性化ドメインについての個別の検証である。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ドメイン融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、ブラストサイジンにより選択し、１０００ｎｇ／ｍｌのドキシサイクリンにより、細胞を、２日間にわたり処理し、次いで、フローサイトメトリーにより、シトリンレポーターレベルを測定した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、２連の生物学的反復を伴う。垂直方向の直線は、オン細胞の割合を決定するのに使用されたシトリンゲートを示し、ドキシサイクリン処理細胞について、オン細胞の平均の割合を示す。活性化ドメインの発見を示す図である。ＫＲＡＢ亜鉛フィンガータンパク質活性クロマチンマークである、Ｈ３Ｋ２７ａｃの最近接ピークからの、ＣｈＩＰピーク位置の距離である。ＫＲＡＢタンパク質は、５日目の抑制因子スクリーンにおいて、それらの状態により、ヒット（青）又はヒットなし（緑）と分類される（左）。加えて、データを、抑制性ヒットＫＲＡＢを含有するＺＮＦ１０（黒）、活性化性ヒットＫＲＡＢを含有するＺＮＦ４７３（赤）、及び活性化性ヒットＫＲＡＢ及び抑制性ヒットＫＲＡＢの両方を含有するＺＦＰ２８（黄）（右）について、個別に示す。各ドットは、４０塩基対のビン内のピークの割合を示す。ＣｈＩＰ－ｓｅｑデータ及びＣｈｉＰ－ｅｘｏデータは、ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０；Ｉｍｂｅａｕｌｔら、２０１７；Ｎａｊａｆａｂａｄｉら、２０１５；Ｓｃｈｍｉｔｇｅｓら、２０１６から検索した。集計データに、単一のＫＲＡＢ亜鉛フィンガーが結合する単独ピークだけを組み入れる（左図の、青ドット及び緑ドット）が、各個別のタンパク質について、単独ピークの数が少ないため、個々のタンパク質に、全てのピークを組み入れる（右図の、赤ドット、黒ドット及び黄ドット）。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。２３８の核局在化タンパク質のキュレーションセットをカバーする、８０アミノ酸のタイリングライブラリーについての概略図である。抑制強度を測定するように、図１におけるワークフローと同じワークフローを使用して、これらのタイルを、ｒＴｅｔＲと融合させ、レポーターへとリクルートした。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。各タイルについて、ドットにより示された、５日目における、最大の抑制機能によりランク付けされた、タイリング遺伝子である。ヒットは、ｌｏｇ_２（オフ：オン）が、陰性対照の平均値を≧２標準偏差上回るタイルである。タイルがヒットした遺伝子を、階調を施して着色し、タイルがヒットしなかった遺伝子を、グレーにより着色した。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。ＣＴＣＦのタイリングである。概略図は、ＵｎｉＰｒｏｔから検索された、タンパク質のアノテーションを示す。水平方向のバーは、各タイルにより張り渡された領域を示し、垂直方向の誤差バーは、スクリーンについての、２連の生物学的反復による標準誤差を示す。最強のヒットタイルを、垂直方向の階調により強調し、抑制ドメインとしてアノテーションする（オレンジ）。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。ＢＡＺ２Ａ（また、ＴＩＰ５としても公知である）のタイリングである。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。個別の検証である。レンチウイルスｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－タイル融合体を、Ｋ５６２レポーター細胞へと送達し、細胞を、１００ｎｇ／ｍｌのドキシサイクリンにより５日間（垂直方向の破線の間）にわたり処理し、次いで、ドキシサイクリンを除去した。フローサイトメトリーにより、細胞を解析し、シトリンレポーターがオフである細胞の割合を決定し、遺伝子サイレンシングモデルにより、データをフィッティングした（生物学的反復のＮ＝２）。２つのＫＲＡＢ抑制ドメインを、陽性対照として示す。下方に示される検証（青色の曲線）に対応するタイリングスクリーンデータは、図２２に示す。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。ＭＧＡのタイリングである。２つの抑制ドメインは、既存のアノテーション領域の外部に見出され抑制因子１及び２（暗赤色、紫色）として表示される。ヒットタイルの重複部における最小化抑制性領域を、垂直方向の狭い赤色階調により強調する。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。図１５Ｅにおいて記載された方法により、ＭＧＡ内の２つのピークに由来する、最強抑制因子タイルを、個別に検証した（生物学的反復のＮ＝２）。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。垂直方向の破線間に示されたピーク内の、全てのヒットタイルの間において共有された領域を選択することにより、ＭＧＡ抑制因子１の配列を最小化し、赤色により影を付した。タンパク質配列保存についてのＣｏｎＳｕｒｆスコアを、下方に、オレンジの直線により示し、信頼区間（推定進化速度分布の、第２５百分位数～第７５百分位数）を、グレーにより示す。アステリスクは、ＣｏｎＳｕｒｆにより、機能的である（高度に保存され、露出されている）ことが予測された残基をマークする。同じ手法により、抑制因子２の配列を最小化し、また、予測された機能的残基と重複する領域も最小化した（データは示さない）。核タンパク質内において発見された、コンパクト抑制ドメインを示す図である。ＭＧＡエフェクターを、１０～３０アミノ酸のサブタイルへと最小化し、図１５Ｈに示される通り、レンチウイルスｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－タイル融合体としてクローニングし、Ｋ５６２レポーター細胞へと送達した。選択の後、１００又は１０００ｎｇ／ｍｌのドキシサイクリンにより、細胞を、５日間にわたり処理し、フローサイトメトリーにより、シトリンレポーターがサイレンシングされた細胞の百分率を測定した（生物学的反復のＮ＝２）。レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。エフェクタードメインの、ドキシサイクリン誘導性ＤＮＡ結合性ドメインであるｒＴｅｔＲとの融合体を創出するための、ＧｏｌｄｅｎＧａｔｅクローニング部位を伴う、レンチウイルスリクルートメントベクターについての概略図である。構成的ｐＥＦプロモーターは、Ｔ２Ａ自己切断ペプチドにより隔てられた、ｒＴｅｔＲ－エフェクター融合体と、ｍＣｈｅｒｒｙ－ＢＳＤ（ブラストサイジンＳデアミナーゼ耐性遺伝子）との発現を駆動する。レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。（上）ｒＴｅｔＲ－ＫＲＡＢ融合体の、二重レポーター遺伝子へのリクルートメントについての概略図である。ＴＡＬＥＮ媒介相同性指向修復により、レポーターを、ＡＡＶＳ１遺伝子座内に組み込み、内因性ＡＡＶＳ１プロモーターによりにより、ＰｕｒｏＲ耐性遺伝子を駆動する。二重レポーターは、合成表面マーカーである（Ｉｇκ－ｈＩｇＧ１－Ｆｃ－ＰＤＧＦＲβ）及びシトリン蛍光タンパク質からなる。（下）Ｋ５６２レポーター細胞内のパイロット試験である。レポーターを、ＡＡＶＳ１遺伝子座へと組み込む、ＴＡＬＥＮ媒介相同性指向修復により、レポーター細胞を作出し、次いで、ピューロマイシンにより選択した。次いで、ｒＴｅｔＲ－ＫＲＡＢを送達するように、細胞に、レンチウイルスをスピンフェクトし、次いで、非処理のまま放置する、又はＴｅｔＯ部位における、ｒＴｅｔＲの、ＤＮＡへの結合を誘導するように、１０００ｎｇ／ｍｌのドキシサイクリンにより処理した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、黒又はオレンジにより示し、各条件において、独立に形質導入された、２連の生物学的反復を伴う。レンチウイルス処理細胞に、送達マーカーとしてのｍＣｈｅｒｒｙについてのゲートをかけた。ヒトＺＮＦ１０に由来するＫＲＡＢドメインを使用した。レンチウイルスリクルートメントアッセイ及び遺伝子サイレンシングについての二重レポーターについての検証を示す図である。合成表面マーカーに結合するＰｒｏＧＤｙｎａｂｅａｄを使用する、オフ細胞の、オン細胞からの磁性分離の実証である。細胞１０００万個を、３０μｌのビーズを使用する磁性分離にかけ、分離の前後において、フローサイトメトリーにより、シトリンレポーターの発現を測定した。混合されたオン細胞と、オフ細胞とを、磁性分離にかけることについての例示を、右側に示す。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。（上）ライブラリー内の各ドメインの発現レベルを測定するための、ハイスループット戦略についての概略図である。それらの天然タンパク質配列を使用して、８０アミノ酸長を下回るドメインを、８０アミノ酸に到達するように、両側において伸長させて、これにより、全ての合成ライブラリーエレメントを同じ長さとした。（中）ライブラリーを、ＦＬＡＧタグ付け構築物へとクローニングし、細胞の大部分が、単一のライブラリーメンバーを発現するように、低感染多重度において、レンチウイルスにより、Ｋ５６２細胞へと送達した。ｍＣｈｅｒｒｙ－ＢＳＤ融合タンパク質は、第２の２Ａ構成要素を使用せずに、ブラストサイジンによる選択並びに送達及び選択効率のための蛍光マーカーを可能とする。（下）抗ＦＬＡＧにより、細胞を染色し、高発現集団と、低発現集団とを分取し、ドメインをシーケンシングし、ｌｏｇ２（ＦＬＡＧ_ｈｉｇｈ：ＦＬＡＧ_ｌｏｗ）比を計算することにより、発現を測定する。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。２つのビン（重複領域に影を付して示される、細胞ライブラリーの生物学的反復のＮ＝２）への分取の前後において、フローサイトメトリーにより測定されたＦＬＡＧ染色レベルの分布である。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ドメイン発現スクリーンに由来する生物学的反復の再現性である（ｒ^２＝０．８２）。閾値（ランダム対照の中央値を、１標準偏差上回る破線）を上回る、発現良好ドメインを、転写調節スクリーンにおける、さらなる解析のために選択した。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ＫＲＡＢドメインのパネルについての、発現レベルの検証である。レンチウイルスにより、個々のｒＴｅｔＲ－３×ＦＬＡＧ－ＫＲＡＢ構築物を、Ｋ５６２細胞へと送達した。ブラストサイジンにより、細胞を選択し、フローサイトメトリーにより、＞８０％が、ｍＣｈｅｒｒｙ陽性であることを確認した。抗ＦＬＡＧ抗体を伴うウェスタンブロットにより、発現レベルを測定した。抗ヒストンＨ３を、正規化のためのローディング対照として使用した。レベルは、ＩｍａｇｅＪを使用して定量した。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ハイスループット発現測定値の、ウェスタンブロットによるタンパク質レベルとの比較である。これらの６つのＫＲＡＢドメインは、Ｐｆａｍドメインライブラリーに由来する、正確な８０アミノ酸の配列を、個別に使用してクローニングした。ＦＬＡＧ染色、分取、及びシーケンシングによる、ドメイン発現についてのハイスループット測定値を示す図である。ライブラリーメンバーの異なるカテゴリーについての、発現レベルの分布である。ランダム対照は、ＤＭＤタンパク質又はＰｆａｍドメインにわたるタイルと比較して、発現不良である（マンホイットニー検定によるｐ＜１×１０^－５である）。破線は、図１７Ｃにおける通り、発現レベルについての閾値を示す。抑制機能を伴うドメインの同定を示す図である。フローサイトメトリーは、合成表面マーカーに結合するＰｒｏＧＤｙｎａＢｅａｄを使用する磁性分離の前後の、Ｐｆａｍドメインライブラリーを発現する細胞のプール内における、シトリンレポーターレベルの分布を示す。重複ヒストグラムを、２連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した。抑制機能を伴うドメインの同定を示す図である。ドメインがライブラリーに組み入れられた、全ての核タンパク質のバックグラウンドセットと比較した場合に、メモリーが強い、又は弱い抑制ドメインを含有する核タンパク質についての、ＰＡＮＴＨＥＲタンパク質クラスによるエンリッチメントである。抑制機能を伴うドメインの同定を示す図である。ｒＴｅｔＲ－ＳＵＭＯ遺伝子サイレンシングモデルによりフィッティングされた検証時間経過である。ＳＵＭＯ３のＲａｄ６０－ＳＬＤドメイン及びトリミングドメインの近傍を中心とする、８０アミノ酸の配列を、レンチウイルスへと、個別にクローニングし、レポーター細胞へと送達した。１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した（生物学的反復のＮ＝２）。シトリンレポーターがオフである、ｍＣｈｅｒｒｙ陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、８０アミノ酸の完全配列及びＰｆａｍアノテーション及びＵｎｉＰｒｏｔアノテーションにマッチするようにトリミングされた配列による、ＨＵＳＨ複合体のメンバーである、ＭＰＰ８Ｃｈｒｏｍｏドメインの検証である。抑制機能を伴うドメインの同定を示す図である。Ｐｆａｍアノテーションにマッチするようにトリミングされた、５２アミノ酸の配列による、ＣＢＸ１Ｃｈｒｏｍｏｓｈａｄｏｗドメインの検証である。抑制機能を伴うドメインの同定を示す図である。Ｐｆａｍアノテーションにマッチするようにトリミングされた、６５アミノ酸の配列による、ポリコーム１の構成要素である、ＳＣＭＨ１ＳＡＭ１ドメイン（また、ＳＰＭとしても公知である）の検証である。抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、８０アミノ酸の完全配列及びＰｆａｍアノテーションにマッチするようにトリミングされた、７２アミノ酸の配列による、ＨＥＲＣ２Ｃｙｔ－ｂ５ドメインの検証である。抑制機能を伴うドメインの同定を示す図である。ＢＩＮ１ＳＨ３＿９ドメインの検証である。抑制機能を伴うドメインの同定を示す図である。Ｐｆａｍアノテーションにマッチするようにトリミングされた、３９アミノ酸の配列による、ポリコーム１の構成要素である、ＰＣＧＦ２ｚｆ－Ｃ３ＨＣ４＿２ドメインの検証である。抑制機能を伴うドメインの同定を示す図である。スクリーンにおいて使用された、８０アミノ酸の完全配列及びＰｆａｍアノテーションにマッチするようにトリミングされた、６８アミノ酸の配列による、ＴＯＸＨＭＧボックスドメインの検証である。抑制機能を伴うドメインの同定を示す図である。抑制因子として機能する、ランダム８０アミノ酸の配列の検証である。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）が、ヒト細胞内のＫＲＡＢサイレンシングの漏洩を軽減することを示す図である。ｒＴｅｔＲ－ＫＲＡＢ融合体によるサイレンシングは、ＫＲＡＢドメインのサブセットについて、ドキシサイクリン処理を伴わないサイレンシングの漏洩を示す（ダークグレーバー）。０日目に、レンチウイルスにより、構築物を、レポーター細胞へと送達し、３～１１日目の間に、細胞を、ブラストサイジンにより選択し、１１日目に、細胞を、ドキシサイクリン処理又は非処理の条件に分け、１６日目に、フローサイトメトリーにより、レポーターレベルを測定した。ｍＣｈｅｒｒｙ陽性細胞についてゲートをかけた後の結果を示す。ＫＲＡＢドメインは、スクリーンにおけるそれらの測定値に基づき、３つのカテゴリーから選択し、右側に表示した。バーは、平均を示し、誤差バーは、標準偏差（独立に形質導入された生物学的反復のＮ＝３）を示す。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）が、ヒト細胞内のＫＲＡＢサイレンシングの漏洩を軽減することを示す図である。漏洩は、ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）を使用する、又はｒＴｅｔＲと、ＺＮＦ８２３に由来するＫＲＡＢドメインとの間に、３×ＦＬＡＧを導入することにより軽減しうる。０日目に、レンチウイルスにより、構築物を、レポーター細胞へと送達し、４日目に、細胞を、ドキシサイクリン処理又は非処理の条件に分け、７日目に、フローサイトメトリーにより、レポーターレベルを測定した。ｍＣｈｅｒｒｙ陽性細胞についてゲートをかけた後の結果を示す。ＺＮＦ１４０に由来する、非漏洩ＫＲＡＢドメインを、対照として使用した。バーは、平均を示し、誤差バーは、標準偏差（独立に形質導入された生物学的反復のＮ＝２）を示す。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）が、ヒト細胞内のＫＲＡＢサイレンシングの漏洩を軽減することを示す図である。ｒＴｅｔＲ又はｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）との融合体としてクローニングされた、ＺＮＦ８２３に由来する、漏洩ＫＲＡＢドメイン又はＺＮＦ１４０に由来する、非漏洩抑制性ＫＲＡＢドメインの、レンチウイルスによる発現を安定的とするＫ５６２レポーター細胞系を、変動用量のドキシサイクリンにより処理した。４日後に、レポーターレベルを、フローサイトメトリーにより測定し、シトリンレポーターがオフである、ｍＣｈｅｒｒｙ陽性細胞の百分率を示す（独立に形質導入された生物学的反復のＮ＝２）。用量反応を、ＰＲＩＳＭ統計解析ソフトウェアを使用する、非線形可変勾配Ｓ字型曲線を伴う、最小二乗法によりフィッティングした。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）が、ヒト細胞内のＫＲＡＢサイレンシングの漏洩を軽減することを示す図である。遺伝子サイレンシングモデルによりフィッティングされた、ＫＲＡＢドメインの個別の検証の全てについての、サイレンシング／メモリー動態である。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ＫＲＡＢ融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、１０ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した（生物学的反復のＮ＝２）。シトリンレポーターがオフである、ｍＣｈｅｒｒｙ陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。高速ＫＲＡＢサイレンシングドメイン間の、サイレンシング／メモリー能の差違を測定するのが容易なダイナミックレンジにおいて作動するように、１０ｎｇ／ｍｌのドキシサイクリンを使用した。ドキシサイクリンを１０００ｎｇ／ｍｌとした場合、ヒット抑制性ＫＲＡＢドメイン（緑及びオレンジ）の全ては、５日以内に、レポーターを、完全にサイレンシングし、動態は識別不可能であった（データは示さない）。とりわけ、ｒＴｅｔＲ上において漏洩性であったＫＲＡＢ（オレンジ）は、ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）と融合した場合、ｒＴｅｔＲ上において漏洩性でなかったＫＲＡＢ（緑）と、有意に異なるメモリー動態を示さない。重要なことは、いずれのｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ＫＲＡＢ融合体も、非処理条件下において、サイレンシングの有意な漏洩を示さなかったことである。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。フローサイトメトリーは、合成表面マーカーに結合するＰｒｏＧＤｙｎａＢｅａｄを使用する磁性分離の前後における、ＫＲＡＢライブラリーをプールされた細胞内のシトリンレポーターレベルを示す。重複ヒストグラムを、２連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。５、９及び１３日目における、ＺＮＦ１０ＫＲＡＢドメインについての高深度突然変異スキャンライブラリーに対する、２連の生物学的反復による、オフ：オンスコアである。細胞を、最初の５日間にわたり、１０００ｎｇ／ｍｌのドキシサイクリンにより処理した。グレーの対角線は、平均ｌｏｇ_２（オフ：オン）が、ＷＴドメイン（黒色ドット）の中央値である場合を示す。黒色の対角線は、フィッティングされた直線モデルを示す。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。ヒトＺＮＦ１０ＫＲＡＢの、ＮＭＲ構造（ＰＤＢ：１ｖ６５）において使用されたマウスＫＲＡＢ及び組換えタンパク質結合アッセイ（Ｐｅｎｇら、２００９）において使用されたＫＲＡＢ－Ｏとのアライメントである。秩序領域は、図３において使用され、全ての必要な１２残基を含有するアライメント領域は、図２０Ｄにおいて使用される。５日目におけるサイレンシングに必要な残基を、ＺＮＦ１０配列内及びＰＤＢ：１ｖ６５配列内において、赤色により着色した。組換えＫＡＰ１への結合に必要な残基を、赤色により着色し、組換えＫＡＰ１への結合に不要な残基を、ＫＲＡＢ－Ｏ配列内において、グレーにより着色し、既に公表されている結果（Ｐｅｎｇら、２００９）をまとめた。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。ＫＲＡＢのＮＭＲ構造（ＰＤＢ：１ｖ６５）の２０の状態の集成である。５日目におけるサイレンシングに必要な残基を、赤色により着色した。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。遺伝子サイレンシングモデルによりフィッティングされた、ＫＲＡＢＺＮＦ１０突然変異体の個別の検証全てについての、サイレンシング／メモリー動態である（上）ｒＴｅｔＲ－ＫＲＡＢ融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した。（生物学的反復のＮ＝２）。（下）ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ＫＲＡＢ融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、ブラストサイジンにより選択し、次いで、１０ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した（生物学的反復のＮ＝２）。列表示は、ＫＲＡＢドメイン内の変異体位置及びエフェクター機能に対する影響について記載する。シトリンレポーターがオフである、ｍＣｈｅｒｒｙ陽性細胞の割合は、フローサイトメトリーにより決定し、非処理の時点マッチ対照を使用して、バックグラウンドサイレンシングについて正規化した。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ＫＲＡＢ融合体の全てはまた、１０００ｎｇ／ｍｌのドキシサイクリンによる、５日間の処理にわたっても測定したが、結果は、ｒＴｅｔＲによる結果と識別不可能であり、全てのＫＲＡＢ変異体は、サイレンシングしないＥＥＷ２５ＡＡＡ変異体を除き、レポーターを、完全にサイレンシングした（データは示さない）。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。Ｐｆａｍドメインライブラリーによる、ｒＴｅｔＲ－ＫＲＡＢ融合体の発現レベルと、１３日目におけるサイレンシングスコアとの相関である。ＩＰ／ＭＳ（Ｈｅｌｌｅｂｏｉｄら、２０１９）により、抑制補因子であるＫＡＰ１と相互作用することが示されたＫＲＡＢドメインだけを組み入れた。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。Ｐｆａｍドメインについてのライブラリー及び対照にわたる、アミノ酸頻度の、ドメイン発現レベルとの相関である（ピアソンのｒ値を示す）。ＣＲＩＳＰＲｉにおいて使用された、ＺＮＦ１０ＫＲＡＢについての高深度突然変異スキャンを示す図である。Ｋ５６２へのレンチウイルス送達の後における、ＦＬＡＧタグ付けｒＴｅｔＲ－ＫＲＡＢ融合体についてのウェスタンブロットである。ブラストサイジンにより、細胞を、送達について選択し、フローサイトメトリーにより、＞８０％が、ｍＣｈｅｒｒｙ陽性であることを確認した。ＩｍａｇｅＪを使用して、Ｈ３ローディング対照と比べた発現レベルを定量した。最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。磁性分離の前後における、活性化レポーター細胞内のＰｆａｍドメインについてのプールライブラリーに対するフローサイトメトリーである。オン細胞の百分率を、垂直方向の直線により描示された、シトリンレベルゲートの右側に示す。１～２連の生物学的反復を、重複領域に影を付して示す。最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。カウントについてフィルターをかけた後のライブラリー内において、発現良好ドメインを含有する、全てのタンパク質についてのバックグラウンドセットと比較した、ヒット活性化ドメインを含有する遺伝子についてのＧＯタームエンリッチメントである。生のｐ値を示すが、示された全てのＧＯタームは、偽発見率が１０％を下回った。最小プロモーターへのハイスループットリクルートメントが、活性化ドメインを発見することを示す図である。活性化ドメインについての、個別の検証である。ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－ドメイン融合体を、レンチウイルスにより、Ｋ５６２レポーター細胞へと送達し、ブラストサイジンにより選択した。１０００ｎｇ／ｍｌのドキシサイクリンにより、細胞を、２日間にわたり処理し、次いで、フローサイトメトリーにより、シトリンレポーターレベルを測定した。非処理細胞の分布を、ライトグレーにおいて示し、ドキシサイクリン処理細胞を、有色において示し、各条件において、独立に形質導入された、２連の生物学的反復を伴う。垂直方向の直線は、オン細胞の割合を決定するのに使用されたシトリンゲートを示し、ドキシサイクリン処理細胞について、オン細胞の平均の割合を示す。ＶＰ６４は、陽性対照である。各ドメインを、Ｐｆａｍアノテーション領域が、それぞれ、７５～６９アミノ酸であるため、最小の伸長を有した、Ｍｅｄ９及びＤＵＦ３４４６を除き、いずれもが、ライブラリー配列又はトリミングＰｆａｍアノテーションドメイン配列から伸長した配列である、８０アミノ酸の配列として調べた。ＫＲＡＢドメインについての８０アミノ酸のライブラリー配列についての、対応する結果を、図１４に示す。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。フローサイトメトリーは、合成表面マーカーに結合するＰｒｏＧＤｙｎａＢｅａｄを使用する磁性分離の前後における、タイリングライブラリーを発現する細胞のプール内の、シトリンレポーターレベルの分布を示す。重複ヒストグラムを、２連の生物学的反復について示す。オフ細胞の平均百分率を、シトリンレベルゲートを示す、垂直方向の直線の左側に示す。１０００ｎｇ／ｍｌのドキシサイクリンを、０日目に添加し、５日目に除去した。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ドキシサイクリン処理の５日目及びドキシサイクリン除去の８日後である１３日目における、核タンパク質タイリングライブラリーについての、２連の生物学的反復による、ハイスループットリクルートメントの測定値である。ヒット判定閾値は、ランダム対照及びＤＭＤタイリング対照の平均値を２標準偏差上回る値である。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ＫＲＡＢの亜鉛フィンガータンパク質である、ＺＮＦ５７及びＺＮＦ４６１についてのタイリング結果である。各バーは、８０アミノ酸のタイルであり、垂直方向の誤差バーは、２連の生物学的反復による範囲である。タンパク質のアノテーションは、ＵｎｉＰｒｏｔを出典とする。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ＲＹＢＰのタイリングである。概略図は、上方に記載されたＵｎｉＰｒｏｔＩＤを使用して検索された、タンパク質のアノテーションを示す。垂直方向の誤差バーは、２連の生物学的反復による標準誤差を示す。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ＲＥＳＴのタイリングである。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ＣＢＸ７のタイリングである。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。ＤＮＭＴ３Ｂのタイリングである。タイリングスクリーンによる、核タンパク質内のコンパクト抑制ドメインの同定を示す図である。（上）ＤＭＤのタイリングである。（下）ＤＭＤヒットタイルのリクルートメントの後における、サイレンシング及びメモリーの動態である。細胞を、最初の５日間にわたり、１０００ｎｇ／ｍｌのドキシサイクリンにより処理し、シトリンレポーターレベルをフローサイトメトリーにより測定した。バックグラウンドサイレンシングを説明するように、オフ細胞の百分率を正規化し、データ（ドット）を、遺伝子サイレンシングモデル（曲線）によりフィッティングした（生物学的反復のＮ＝２）。

コンパクト転写エフェクタードメインのカタログを生成するシステム及び方法が提供される。さらに、一部の実施形態において、このドメインのカタログは、合成転写因子を操作するように、ＤＮＡ結合性ドメインへと融合される。これらは、真核（又は他の）細胞内の遺伝子発現の、ターゲティングされた、微調整可能な調節を実施するのに使用される。この技術は、ハイスループットプラットフォームを利用して、細胞内の数万の合成転写因子をスクリーニングし、性質決定する。これらの合成転写因子は、ＤＮＡ結合性ドメインと、転写エフェクタードメインとの融合体である。システムは、数百の短鎖エフェクタードメイン（例えば、８０アミノ酸）を作出し、それらを、送達（例えば、ウイルスベクター内のパッケージング）のための利点である、最小限に十分な配列（例えば、１０アミノ酸）へと、さらに短縮するためのハイスループットステップを実施するのに使用されている。これらの融合体のターゲティングは、エフェクタードメインに応じて、ｍＲＮＡ転写の、負又は正への局所的調節をもたらす。これらの合成転写因子の一部は、因子自体が標的から放出された後においても遷延する、長期にわたるエピジェネティック調節を媒介する。

かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、ＤＮＡ結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体を同定するのにも使用される。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用される。

例示的な適用は、以下を含むがこれらに限定されない：
プログラム可能なＤＮＡ結合性ドメイン（例えば、ｄＣａｓ９、ｄＣａｓ１２ａ、亜鉛フィンガー、ＴＡＬＥ）の、転写エフェクタードメインとの融合体による、内因性遺伝子の抑制／活性化のターゲティング；
遺伝子治療及び細胞療法（例えば、患者における病原性転写物をサイレンシングする）又は調査研究；
合成転写因子は、複数の遺伝子の発現を、同時に摂動させる（例えば、複数のガイドＲＮＡを使用して、ＣＲＩＳＰＲｉ／ａスクリーニングによる、ハイスループットの遺伝子相互作用マッピングを実施する）のに使用される；
遺伝回路内、例えば、誘導型遺伝子発現又はより複雑な回路内の合成転写因子の使用。これらの回路は、環境からの小分子インプットに応答する、治療的遺伝子発現アウトプットを達成するための、遺伝子治療（例えば、ＡＡＶによる抗体の送達）及び細胞療法（例えば、エクスビボにおけるＣＡＲ－Ｔ細胞の操作）において使用される。

本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。短鎖ドメイン（例えば≦８０アミノ酸）が同定され、それらを、送達（例えば、ウイルスベクター内のパッケージング）のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップがもたらされた。場合によって、１０アミノ酸という短鎖である、強力なエフェクタードメインが同定された。一部の実施形態において、ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。生成されたドメインの大半は未だ、転写エフェクターとして報告されていない。加えて、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットプロセスも提供される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく支援される。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。

同定されたドメインのコレクションは、膨大かつ多様であり、プラットフォームは、新たな特性を伴う、合成転写因子（例えば、高速サイレンシングと、恒久的サイレンシングとの組合せを達成する、２つの抑制ドメインの組成物）を創出するように、ハイスループットにおいて、ドメインの新たな組合せを、融合体として調べることをたやすく可能とする。

転写をサイレンシングする又は活性化させることができる、数百に及ぶ未だ性質決定されていない又は未知であるエフェクタードメインは、ＤＮＡ結合性ドメインへと融合されうる。例えば、ヒト細胞内において、レンチウイルススクリーニングを使用して、単一ドメイン及びドメイン対をスクリーニングするためのハイスループット法が提供される。ハイスループット法は、磁性分離を使用する、より効率的かつ廉価かつ迅速な、これらのライブラリーのスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能となる。

１．定義
本明細書において使用された、「～を含む（ｃｏｍｐｒｉｓｅ、ｉｎｃｌｕｄｅ）」、「～を有すること」、「～を有する」、「～しうる」、「～を含有する」という用語及びこれらの変化形は、さらなる行為又は構造の可能性を除外しない、オープンエンドの移行句、用語又は語句であることが意図される。文脈により別途明示されない限り、単数形の「ある（ａ）」、「ある（ａｎ）」及び「その」は、複数の指示対象を含む。明示される場合であれ、そうでない場合であれ、本開示はまた、本明細書において提示された態様又は要素「を含み」、これら「からなり」、これら「から本質的になる」他の態様も想定する。

本明細書における数値範囲の列挙のために、その間に介在する各数が、同じ程度の精度により想定される。例えば、６～９の範囲について、６及び９に加えて、数である７及び８も想定され、６．０～７．０の範囲について、数である、６．０、６．１、６．２、６．３、６．４、６．５、６．６、６．７、６．８、６．９及び７．０も、明示的に想定される。

本明細書において別途規定されない限りにおいて、本開示において使用された、学術用語及び技術用語は、当業者により一般に理解された意味と同じ意味を有するものとする。例えば、本明細書において記載される細胞及び組織培養、分子生物学、免疫学、遺伝学並びにタンパク質化学及び核酸化学及びハイブリダイゼーションの技術との関連において使用される任意の用語法は、周知であり、当技術分野において一般的に使用されている。用語の意味及び範囲は、明確であるものとするが、万一、任意の潜在的曖昧さが生じた場合、本明細書において提供された定義が、任意の辞書又は外部の定義に対して優先される。さらに、文脈により、別途要求されない限りにおいて、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。

本明細書において使用された、「抗体」という用語は、細菌及びウイルスなどの異物を同定し、中和するように、免疫系により、内因的に使用されたタンパク質を指す。典型的に、抗体は、少なくとも１つの相補性決定領域（ＣＤＲ）を含むタンパク質である。ＣＤＲは、抗原への結合の一因をなす、抗体の「超可変領域」（下記において、さらに論じられる）を形成する。全抗体は、典型的に、４つのポリペプチド：重（Ｈ）鎖ポリペプチドの、２つの同一なコピー及び軽（Ｌ）鎖ポリペプチドの、２つの同一なコピーからなる。重鎖の各々は、１つのＮ末端の可変（Ｖ_Ｈ）領域及び３つのＣ末端定常（Ｃ_Ｈ１、Ｃ_Ｈ２及びＣ_Ｈ３）領域を含有し、各軽鎖は、１つのＮ末端可変（Ｖ_Ｌ）領域及び１つのＣ末端定常（Ｃ_Ｌ）領域を含有する。抗体の軽鎖は、それらの定常ドメインのアミノ酸配列に基づき、２つの顕著に異なる種類のうちの１つ、カッパ（κ）又はラムダ（λ）へと割り当てられうる。典型的抗体において、各軽鎖は、ジスルフィド結合により、重鎖へと連結され、２つの重鎖は、ジスルフィド結合により、互いへと連結される。軽鎖可変領域は、重鎖の可変領域とアライメントされ、軽鎖定常領域は、重鎖の第１の定常領域とアライメントされる。重鎖の定常領域の残余は、互いとアライメントされる。軽鎖と重鎖の各対の可変領域は、抗体の抗原結合性部位を形成する。Ｖ_Ｈ領域と、Ｖ_Ｌ領域とは、各領域が、４つのフレームワーク（ＦＷ又はＦＲ）領域を含む、同じ一般的構造を有する。本明細書において使用された、「フレームワーク領域」という用語は、ＣＤＲ間に配置された、可変領域内において比較的保存的なアミノ酸配列を指す。各可変ドメイン内に、４つのフレームワーク領域が存在し、これらは、ＦＲ１、ＦＲ２、ＦＲ３及びＦＲ４と称されている。フレームワーク領域は、可変領域の構造フレームワークをもたらすβシートを形成する（例えば、Ｃ．Ａ．Ｊａｎｅｗａｙら（編）、「Ｉｍｍｕｎｏｂｉｏｌｏｇｙ」、第５版、ＧａｒｌａｎｄＰｕｂｌｉｓｈｉｎｇ、ＮｅｗＹｏｒｋ、Ｎ．Ｙ．（２００１）を参照されたい）。フレームワーク領域は、３つのＣＤＲにより接続される。上記において論じられた通り、ＣＤＲ１、ＣＤＲ２及びＣＤＲ３として公知である、３つのＣＤＲは、抗原への結合の一因をなす、抗体の「超可変領域」を形成する。ＣＤＲは、フレームワーク領域により形成されたベータ－シート構造を接続し、場合によって、これらの一部を含む、ループを形成する。軽鎖及び重鎖の定常領域が、抗体の、抗原への結合に直接関与しないのに対し、定常領域は、可変領域の配向性に影響を及ぼしうる。定常領域はまた、エフェクター分子及び細胞との相互作用を介する、抗体依存性補体媒介溶解又は抗体依存性細胞傷害作用への参与など、多様なエフェクター機能も呈する。

本明細書において、「抗体の断片」、「抗体断片」及び抗体の「抗原結合性断片」という用語は、抗原に特異的に結合する能力を保持する、１つ以上の抗体の断片を指すように、互換的に使用される（一般に、Ｈｏｌｌｉｇｅｒら、Ｎａｔ．Ｂｉｏｔｅｃｈ．、２３（９）：１１２６～１１２９（２００５）を参照されたい）。本明細書において記載された、抗体の任意の抗原結合性断片は、本発明の範囲内にある。抗体断片は、例えば、１つ以上のＣＤＲ、可変領域（又はこれらの部分）、定常領域（又はこれらの部分）又はこれらの組合せを含むことが所望される。抗体断片の例は、（ｉ）Ｖ_Ｌドメイン、Ｖ_Ｈドメイン、Ｃ_Ｌドメイン及びＣ_Ｈ１ドメインからなる一価断片である、Ｆａｂ断片；（ｉｉ）ヒンジ領域におけるジスルフィド架橋により連結された、２つのＦａｂ断片を含む二価断片である、Ｆ（ａｂ’）_２断片；（ｉｉｉ）抗体の単一のアームのＶ_Ｌドメイン及びＶ_Ｈドメインからなる、Ｆｖ断片；（ｉｖ）穏和な還元条件を使用する、Ｆ（ａｂ’）_２断片のジスルフィド架橋の切断から生じる、Ｆａｂ’断片；（ｖ）ジスルフィド安定化Ｆｖ断片（ｄｓＦｖ）；並びに（ｖｉ）抗原に特異的に結合する、抗体の単鎖可変領域ドメイン（Ｖ_Ｈ又はＶ_Ｌ）ポリペプチドである、ドメイン抗体（ｄＡｂ）を含むがこれらに限定されない。

本明細書において使用された、「核酸」又は「核酸配列」とは、ピリミジン塩基及び／又はプリン塩基、好ましくは、それぞれ、シトシン、チミン及びウラシル並びにアデニン及びグアニンのポリマー又はオリゴマーを指す（ＡｌｂｅｒｔＬ．Ｌｅｈｎｉｎｇｅｒ、「ＰｒｉｎｃｉｐｌｅｓｏｆＢｉｏｃｈｅｍｉｓｔｒｙ」、７９３～８００（ＷｏｒｔｈＰｕｂ．、１９８２）を参照されたい）。本技術は、任意のデオキシリボ核チド、リボ核チド又はペプチド核酸の構成要素及びこれらの塩基のメチル化形態、ヒドロキシメチル化形態又はグリコシル化形態など、これらの任意の化学的変異体を想定する。ポリマー又はオリゴマーは、組成物中において異種の場合もあり、同種の場合もあり、自然発生の供給源から単離される場合もあり、人工的に、又は合成的に作製される場合もある。加えて、核酸は、ＤＮＡ若しくはＲＮＡ又はこれらの混合物であることが可能であり、ホモ二重鎖、ヘテロ二重鎖及びこれらのハイブリッド状態を含む、一本鎖形態又は二本鎖形態において、恒常的に存在する場合もあり、一過性に存在する場合もある。一部の実施形態において、核酸又は核酸配列は、例えば、ＤＮＡ／ＲＮＡヘリックス、ペプチド核酸（ＰＮＡ）、モルホリノ核酸（例えば、Ｂｒａａｓｃｈ及びＣｏｒｅｙ、Ｂｉｏｃｈｅｍｉｓｔｒｙ、４１（１４）：４５０３～４５１０（２００２）並びに米国特許第５，０３４，５０６号を参照されたい）、ロックト核酸（ＬＮＡ；Ｗａｈｌｅｓｔｅｄｔら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．、９７：５６３３～５６３８（２０００）を参照されたい）、シクロヘキシニル核酸（Ｗａｎｇ、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．、１２２：８５９５～８６０２（２０００）を参照されたい）及び／又はリボザイムなど、他の種類の核酸構造を含む。よって、「核酸」又は「核酸配列」という用語はまた、天然ヌクレオチドと同じ機能を呈しうる、非天然ヌクレオチド、修飾ヌクレオチド及び／又は非ヌクレオチド構成要素（例えば、「ヌクレオチド類似体」）を含む鎖も包摂することが可能であり；さらに、本明細書において使用された、「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチド又はポリヌクレオチド及びこれらの断片又は部分並びに一本鎖の場合もあり、二本鎖の場合もあり、センス鎖を表す場合もあり、アンチセンス鎖を表す場合もある、ゲノム由来又は合成由来の、ＤＮＡ又はＲＮＡを指す。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」及び「オリゴヌクレオチド」という用語は、互換的に使用される。これらの用語は、デオキシヌクレオチド若しくはヌクレオチド又はこれらの類似体である、任意の長さのヌクレオチドのポリマー形態を指す。

「ペプチド」又は「ポリペプチド」とは、ペプチド結合により連結された、２つ以上のアミノ酸による連結配列である。ペプチド又はポリペプチドは、天然ペプチド又は天然ポリペプチドの場合もあり、合成ペプチド又は合成ポリペプチドの場合もあり、修飾ペプチド又は修飾ポリペプチドの場合もあり、天然ペプチド又は天然ポリペプチドと、合成ペプチド又は合成ポリペプチドとの組合せの場合もある。ポリペプチドは、結合性タンパク質、受容体及び抗体などのタンパク質を含む。タンパク質は、糖、脂質又はアミノ酸鎖内に含まれない、他の部分の付加により修飾されうる。「ポリペプチド」及び「タンパク質」という用語は、本明細書において、互換的に使用される。

本明細書において使用された、「配列同一性パーセント」という用語は、最大の同一性パーセントを達成するように、２つの配列をアライメントし、必要な場合、ギャップを導入した後における、参照配列内の、対応するヌクレオチド又はアミノ酸と同一である、核酸配列内のヌクレオチド若しくはヌクレオチド類似体又はアミノ酸配列内のアミノ酸の百分率を指す。よって、参照配列より長い、本技術に従う核酸の場合、参照配列とアライメントしない、核酸内のさらなるヌクレオチドは、配列同一性を決定するために考慮されない。最適のアライメントを得、２つ以上の配列の間の同一性を計算するための、多数の数学的アルゴリズムが公知であり、多数の、利用可能なソフトウェアプログラムへと組み込まれている。このようなプログラムの例は、ＣＬＵＳＴＡＬ－Ｗ、Ｔ－Ｃｏｆｆｅｅ及びＡＬＩＧＮ（核酸配列及びアミノ酸配列のアライメントのための）、ＢＬＡＳＴプログラム（例えば、ＢＬＡＳＴ２．１、ＢＬ２ＳＥＱ及びこれらの最新バージョン）及びＦＡＳＴＡプログラム（例えば、ＦＡＳＴＡ３ｘ、ＦＡＳ（商標）及びＳＳＥＡＲＣＨ）（配列アライメント及び配列類似性の検索のための）を含む。配列アライメントアルゴリズムはまた、例えば、Ａｌｔｓｃｈｕｌら、Ｊ．ＭｏｌｅｃｕｌａｒＢｉｏｌ．、２１５（３）：４０３～４１０（１９９０）；Ｂｅｉｇｅｒｔら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、１０６（１０）：３７７０～３７７５（２００９）；Ｄｕｒｂｉｎら編、「ＢｉｏｌｏｇｉｃａｌＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓ：ＰｒｏｂａｂｉｌｉｓｔｉｃＭｏｄｅｌｓｏｆＰｒｏｔｅｉｎｓａｎｄＮｕｃｌｅｉｃＡｃｉｄｓ」、ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ、Ｃａｍｂｒｉｄｇｅ、ＵＫ（２００９）；Ｓｏｄｉｎｇ、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ、２１（７）：９５１～９６０（２００５）；Ａｌｔｓｃｈｕｌら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、２５（１７）：３３８９～３４０２（１９９７）；及びＧｕｓｆｉｅｌｄ、「ＡｌｇｏｒｉｔｈｍｓｏｎＳｔｒｉｎｇｓ、ＴｒｅｅｓａｎｄＳｅｑｕｅｎｃｅｓ」、ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ、ＣａｍｂｒｉｄｇｅＵＫ（１９９７）においても開示されている。

「ベクター」又は「発現ベクター」とは、細胞内における、接合されたセグメントの複製をもたらすように、別のＤＮＡセグメント、例えば、「インサート」が接合される場合もあり、組み込まれる場合もある、プラスミド、ファージ、ウイルス又はコスミドなどのレプリコンである。

「野生型」という用語は、自然発生の供給源から単離されたときの、この遺伝子又は遺伝子産物の特徴を有する、遺伝子又は遺伝子産物を指す。野生型遺伝子は、集団内において、最も高頻度において観察される遺伝子であるので、任意に、遺伝子の「正常」形態又は「野生型」形態と称されている。これに対し、「修飾」、「突然変異体」又は「多型」という用語は、野生型の遺伝子又は遺伝子産物と比較した場合に、配列及び／又は機能的特性（例えば、特徴の変更）の修飾を提示する、遺伝子又は遺伝子産物を指す。自然発生の突然変異体も単離されうることが注目され；これらは、野生型の遺伝子又は遺伝子産物と比較した場合に、特徴が変更されているという事実により同定される。

２．転写修飾ドメインを同定するための方法
本明細書において、転写エフェクター（例えば、活性化及び抑制）ドメインを同定するための方法が開示される。一部の実施形態において、方法は、各々が誘導型ＤＮＡ結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップ；レポーター細胞を、薬剤により、細胞内において、タンパク質及びｍＲＮＡのレベルが変更されるために（例えば、産生に起因する上昇、又は分解に起因する低下のために）必要な長さの時間にわたり処理するステップ；分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びにタンパク質ドメインを、転写抑制因子又は活性化因子として同定するステップを含む。

方法は、各々が誘導型ＤＮＡ結合性ドメインへと連結された、核局在化タンパク質に由来するタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップを含む。タンパク質ドメインは、８０アミノ酸以下でありうる。一部の実施形態において、タンパク質ドメインは、約７５アミノ酸、約７０アミノ酸、約６５アミノ酸、約６０アミノ酸、約５５アミノ酸、約５０アミノ酸、約４５アミノ酸、約４０アミノ酸、約３５アミノ酸、約３０アミノ酸、約２５アミノ酸、約２０アミノ酸、約１５アミノ酸、約１０アミノ酸、又は約５アミノ酸でありうる。

タンパク質ドメインは、任意の公知のタンパク質に由来しうる。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する。核局在化タンパク質は、タンパク質の寿命において、核へと、完全に、又は部分的に局在化された、又は局在化されうる核局在化タンパク質を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む。一部の実施形態において、タンパク質ドメインは、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む。

誘導型ＤＮＡ結合性ドメインは、Ｔｅｔ／ＤＯＸテトラサイクリン誘導型システム、光誘導型システム、アブシシン酸（ＡＢＡ）誘導型システム、クメートシステム、４０ＨＴ／エストロゲン誘導型システム、エクジソンベース誘導型システム及びＦＫＢＰ１２／ＦＲＡＰ（ＦＫＢＰ１２－ラパマイシン複合体）誘導型システムを含むがこれらに限定されない、ＤＮＡへの結合の誘導のための、任意のシステムを使用しうる。

一部の実施形態において、誘導型ＤＮＡ結合性ドメインはタグを含む。タグは、化学的手段又は酵素的手段により除去可能なタグを含む、当技術分野において公知である、任意のタグを含みうる。本方法における使用に適するタグは、キチン結合性タンパク質（ＣＢＰ）、マルトース結合性タンパク質（ＭＢＰ）、Ｓｔｒｅｐタグ、グルタチオン－Ｓ－トランスフェラーゼ（ＧＳＴ）、ポリヒスチジン（ＰｏｌｙＨｉｓ）タグ、ＡＬＦＡタグ、Ｖ５タグ、Ｍｙｃタグ、ヘマグルチニン（ＨＡ）タグ、スポットタグ、Ｔ７タグ、ＮＥタグ、カルモデュリンタグ、ポリグルタミン酸タグ、ポリアルギニンタグ、ＦＬＡＧタグなどを含む。

方法は、レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、プロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写エフェクタードメインによりモジュレートすることが可能である、ステップを含む。

プロモーターは、高転写速度を付与する（強いプロモーター）場合もあり、低転写速度を付与する（弱いプロモーター）場合もある。多くのプロモーターライブラリーが、実験により確立されており、プロモーター及びプロモーター強度の選出は、細胞型に依存する。一部の実施形態において、転写活性化ドメインを同定する場合、弱いプロモーターが使用されうる。一部の実施形態において、転写抑制ドメインを同定する場合、強いプロモーターが使用されうる。

細胞表面マーカーは、細胞膜へと接合された、タンパク質及び炭水化物を含む。当技術分野において、細胞表面マーカーは、一般に、様々な細胞型について公知であり、公知の分子生物学法に基づき、選り抜きのレポーター細胞内において発現されうる。表面マーカーは、膜貫通ドメインへと接合されたマーカーポリペプチドを含む、合成表面マーカーでありうる。例えば、マーカーポリペプチドは、膜貫通ドメインへと接合された、抗体又はその断片（例えば、Ｆｃ領域）を含みうる。一部の実施形態において、マーカーポリペプチドは、ヒトＩｇＧ１Ｆｃ領域であり、合成表面マーカーは、膜貫通ドメインへと接合された、ヒトＩｇＧ１Ｆｃ領域を含む。

当技術分野において、蛍光タンパク質は、周知であり、多様な細胞のコンパートメント内において、入射光の波長の変動の結果として蛍光発光するように適合されたタンパク質を含む。蛍光タンパク質の例は、フィコビリタンパク質、シアン蛍光タンパク質（ＣＦＰ）、緑色蛍光タンパク質（ＧＦＰ）、黄色蛍光タンパク質（ＹＦＰ）、増強オレンジ蛍光タンパク質（ＯＦＰ）、増強緑色蛍光タンパク質（ｅＧＦＰ）、改変緑色蛍光タンパク質（ｅｍＧＦＰ）、増強黄色蛍光タンパク質（ｅＹＦＰ）及び／又は単量体赤色蛍光タンパク質（ｍＲＦＰ）並びにこれらの誘導体及び変異体を含む。

方法は、表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップを含む。当技術分野において、本明細書において開示された方法による使用に適する、多数の細胞分離法が公知であり、例えば、免疫磁性細胞分離、蛍光活性化細胞分取（ＦＡＣＳ）及びマイクロ流体細胞分取を含む。一部の実施形態において、細胞分離は、免疫磁性細胞分離を含む。

一部の実施形態において、方法は、レポーター細胞の薬剤による処理を停止し、分離するステップ、シーケンシングするステップ、計算するステップ及び同定するステップを、１回以上にわたり反復するステップをさらに含む。一部の実施形態において、ステップは、レポーター細胞の薬剤による処理を停止した後に、少なくとも４８時間にわたり反復される。

一部の実施形態において、方法は、タンパク質ドメインの発現レベルを測定するステップをさらに含む。タンパク質ドメインの発現レベルは、タンパク質自体又はその任意のタグ若しくは標識についての免疫ブロット法及びイムノアッセイを含む、当技術分野において公知である、任意の方法を使用して決定されうる。一部の実施形態において、発現レベルは、ＤＮＡ結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される。

一部の実施形態において、方法は、転写抑制ドメインを同定する。一部の実施形態において、方法は、ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子を、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ；ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの分解に必要な長さの時間にわたり処理するステップ；ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びにｇ）タンパク質ドメインを、転写抑制因子として同定するステップを含む。

一部の実施形態において、レポーター細胞は、薬剤により、少なくとも３日間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも３日間、少なくとも４日間、少なくとも５日間、少なくとも６日間、少なくとも７日間、少なくとも８日間、少なくとも９日間、少なくとも１０日間、少なくとも１４日間以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、薬剤により、３～１２日間、３～１０日間、３～７日間、又は３～５日間にわたり処理される。

タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のｌｏｇ２が、陰性対照の平均値から少なくとも２標準偏差である（例えば、大きい）場合に、転写抑制因子として同定される（例えば、図１Ｃを参照されたい）。

一部の実施形態において、方法は、転写活性化ドメインを同定する。一部の実施形態において、方法は、ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、二部構成型レポーター遺伝子が、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ；ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの産生に必要な長さの時間にわたり処理するステップ；ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びにｇ）タンパク質ドメインを、転写抑制因子として同定するステップを含む。

一部の実施形態において、レポーター細胞は、薬剤により、少なくとも２４時間にわたり処理される。例えば、レポーター細胞は、薬剤により、少なくとも２４時間（１日間）、少なくとも３６時間、少なくとも４８時間（２日間）、少なくとも６０時間、少なくとも７２時間（３日間）、少なくとも９４時間、少なくとも１０６時間（４日間）以上にわたり処理されうる。一部の実施形態において、レポーター細胞は、２４～７２時間の間又は３６～６０時間の間にわたり処理される。

タンパク質ドメインは、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比のｌｏｇ２が、陰性対照の平均値から少なくとも２標準偏差である（例えば、小さい）場合に、転写活性化因子として同定される（例えば、図５Ｂを参照されたい）。

３．転写因子
本開示においてまた、異種ＤＮＡ結合性ドメインへと融合した１つ以上の転写エフェクタードメインを含む合成転写因子も提供される。本明細書において使用された、「転写因子」という用語は、目的のゲノム遺伝子座又は遺伝子と関連づけられた、特異的ＤＮＡ配列と、直接的に、又は間接的に相互作用して、ＲＮＡポリメラーゼ活性を、遮断する、又は遺伝子若しくは遺伝子セットのためのプロモーター部位へとリクルートする、タンパク質又はポリペプチドを指す。

一部の実施形態において、合成転写因子は、異種ＤＮＡ結合性ドメインへと融合した１つ以上の転写活性化ドメイン、１つ以上の転写抑制ドメイン又はこれらの組合せを含む。一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つ又は１つ以上の転写抑制ドメインのうちの少なくとも１つは、配列番号１～８９６のうちのいずれかに対する少なくとも７０％（例えば、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９５％、少なくとも９８％、９９％）の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写活性化ドメイン、１つ以上の転写抑制ドメイン又はこれらの組合せは、本明細書において開示された方法により同定される。

一部の実施形態において、合成転写因子は、異種ＤＮＡ結合性ドメインへと融合した２つ以上の転写エフェクタードメイン（例えば、転写活性化ドメイン、転写抑制ドメイン又はこれらの組合せ）を含む。一部の実施形態において、合成転写因子は、異種ＤＮＡ結合性ドメインへと融合した２つ以上の転写活性化ドメイン又は２つ以上の転写抑制ドメインを含む。２つ以上のエフェクタードメインは、任意の配向性において、ＤＮＡ結合性ドメインへの融合が可能であり、アミノ酸リンカーにより、互いから隔てられうる。

一部の実施形態において、合成転写因子が、１つを超える転写エフェクタードメインを含む場合、合成転写因子は、当技術分野において公知である、少なくとも１つのさらなるエフェクタードメインと共に、本明細書において開示された少なくとも１つの転写活性化ドメイン又は少なくとも１つの転写抑制ドメインを含みうる。例えば、参照によりその全体において本明細書に組み込まれた、ＴｙｃｋｏＪ．ら、Ｃｅｌｌ、２０２０年１２月２３日、１８３（７）：２０２０～２０３５を参照されたい。一部の実施形態において、１つ以上の転写活性化ドメイン、１つ以上の転写抑制ドメインは、本明細書において記載された方法により同定される。

一部の実施形態において、合成転写因子が、１つを超える転写エフェクタードメインを含む場合、１つ以上の転写活性化ドメインのうちの少なくとも１つは、配列番号５６３～６６４のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つは、配列番号５６３～５９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写活性化ドメインのうちの少なくとも１つは、表２において見出されるものから選択される。

一部の実施形態において、合成転写因子が、１つを超える転写エフェクタードメインを含む場合、１つ以上の転写抑制ドメインのうちの少なくとも１つは、配列番号１～５６２及び６６５～８９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写抑制ドメインのうちの少なくとも１つは、配列番号６６６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む。一部の実施形態において、１つ以上の転写抑制ドメインのうちの少なくとも１つは、表１、３又は４において見出されるものから選択される。

ＤＮＡ結合性ドメインは、二本鎖ＤＮＡ又は一本鎖ＤＮＡに、全般的に、又は配列特異的に結合することが可能である、任意のポリペプチドである。ＤＮＡ結合性ドメインは、ヘリックス－ターン－ヘリックスモチーフ、亜鉛フィンガー、ロイシンジッパー、ＨＭＧボックス（ｈｉｇｈｍｏｂｉｌｉｔｙｇｒｏｕｐｂｏｘ）ドメイン、ウィングドヘリックス領域、ウィングドヘリックス－ターン－ヘリックス領域、ヘリックス－ループ－ヘリックス領域、免疫グロブリンフォールド、Ｂ３ドメイン、Ｗｏｒ３ドメイン、ＴＡＬエフェクターＤＮＡ結合性ドメインなどを有するポリペプチドを含む。異種ＤＮＡ結合性ドメインは、天然結合性ドメインでありうる。一部の実施形態において、異種ＤＮＡ結合性ドメインは、プログラム可能なＤＮＡ結合性ドメイン、例えば、所定のヌクレオチド配列に結合するように、天然ＤＮＡ結合性ドメインの、１つ以上のアミノ酸を変更することにより操作された、例えば、ＤＮＡ結合性ドメインを含む。

一部の実施形態において、ＤＮＡ結合性ドメインは、標的ＤＮＡ配列に、直接結合することが可能である。

ＤＮＡ結合性ドメインは、ＡｖｒＢｓ３、Ｈａｘ２、Ｈａｘ３又はＨａｘ４（Ｂｏｎａｓら、１９８９、ＭｏｌＧｅｎＧｅｎｅｔ、２１８（１）：１２７～３６；Ｋａｙら、２００５、ＭｏｌＰｌａｎｔＭｃｒｏｂｅＩｎｔｅｒａｃｔ１８（８）：８３８～４８）など、自然発生の転写活性化因子様エフェクター（ＴＡＬＥ）内に見出されたドメインに由来しうる。ＴＡＬＥは、残基の反復配列からなる、モジュラーＤＮＡ結合性ドメインを有し、各リピート領域は、３４アミノ酸からなる。各リピート領域の第１２位及び第１３位における残基対は、ヌクレオチドの特異性を決定し、領域の組み合わせは、配列特異的ＴＡＬＥＤＮＡ結合性ドメインの合成を可能とする。一部の実施形態において、ＴＡＬＥＤＮＡ結合性ドメインは、ＤＮＡ結合性ドメインに、任意の標的配列に対する、選り抜きの特異性をもたらすように、公知の方法を使用して操作されうる。ＤＮＡ結合性ドメインは、複数の（例えば、２つ、３つ、４つ、５つ、６つ、１０、２０以上の）ＴａｌエフェクターＤＮＡ結合性モチーフを含みうる。特に、本転写因子において援用される、配列特異的ＤＮＡ結合性ドメインを形成するように、任意の数のヌクレオチド特異的Ｔａｌエフェクターモチーフが、組み合わされうる。

一部の実施形態において、ＤＮＡ結合性ドメインは、外因性因子と呼応して、標的ＤＮＡと会合する。

一部の実施形態において、ＤＮＡ結合性ドメインは、クラスター化規則的間隔短鎖回文反復配列関連（Ｃａｓ）タンパク質（例えば、触媒不活化Ｃａｓ９）に由来し、ガイドＲＮＡを介して、標的ＤＮＡと会合する。ｇＲＮＡ自体は、ＤＮＡ標的配列の１つの鎖及び足場配列と相補性の配列であって、標的ＤＮＡ配列に結合し、これを、Ｃａｓ９へとリクルートする配列を含む。本明細書において記載された転写因子は、ＣＲＩＳＰＲ干渉（ＣＲＩＳＰＲｉ）又はＣＲＩＳＰＲ活性化（ＣＲＩＳＰＲａ）に有用でありうる。

ガイドＲＮＡ（ｇＲＮＡ）は、ｃｒＲＮＡ、ｃｒＲＮＡ／ｔｒａｃｒＲＮＡ（又は単鎖ガイドＲＮＡ、ｓｇＲＮＡ）でありうる。ｇＲＮＡは、非自然発生ｇＲＮＡでありうる。「ｇＲＮＡ」、「ガイドＲＮＡ」及び「ガイド配列」という用語は、本明細書を通して互換的に使用される場合があり、Ｃａｓタンパク質の特異性への結合を決定する配列を含む核酸を指す。ｇＲＮＡは、ＤＮＡ標的配列とハイブリダイズする（部分的に、又は完全に相補性である）。

標的核酸（標的部位）とハイブリダイズする、ｇＲＮＡ又はその一部は、選択的ハイブリダイゼーションに必要な、任意の長さでありうる。ｇＲＮＡ又はｓｇＲＮＡ（複数可）は、約５～約１００ヌクレオチドの間の長さ、又はそれ以上（例えば、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００ヌクレオチドの長さ以上）でありうる。

ｇＲＮＡのデザインを容易とするために、多くの計算ツールが開発されている（Ｐｒｙｋｈｏｚｈｉｊら（ＰＬｏＳＯＮＥ、１０（３）：（２０１５））；Ｚｈｕら（ＰＬｏＳＯＮＥ、９（９）（２０１４））；Ｘｉａｏら（Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．、１月２１日（２０１４））；Ｈｅｉｇｗｅｒら（ＮａｔＭｅｔｈｏｄｓ、１１（２）：１２２～１２３（２０１４））を参照されたい）。ガイドＲＮＡをデザインするための方法及びツールについて、参照により本明細書に組み込まれる、Ｚｈｕ（ＦｒｏｎｔｉｅｒｓｉｎＢｉｏｌｏｇｙ、１０（４）、２８９～２９６頁（２０１５））により論じられている。加えて、ＧｅｎｓｃｒｉｐｔＩｎｔｅｒａｃｔｉｖｅＣＲＩＳＰＲｇＲＮＡＤｅｓｉｇｎＴｏｏｌ、ＷＵ－ＣＲＩＳＰＲ、ａｎｄＢｒｏａｄＩｎｓｔｉｔｕｔｅＧＰＰｓｇＲＮＡＤｅｓｉｇｎｅｒを含むがこれらに限定されない、ｓｇＲＮＡのデザイン（複数可）を容易とするのに使用されうる、多くのソフトウェアツールが公表されている。ゲノムワイドのｇＲＮＡのデータベースである、ＩＤＴＤＮＡＰｒｅｄｅｓｉｇｎｅｄＡｌｔ－ＲＣＲＩＳＰＲ－Ｃａｓ９ｇｕｉｄｅＲＮＡ、ＡｄｄｇｅｎｅＶａｌｉｄａｔｅｄｇＲＮＡＴａｒｇｅｔＳｅｑｕｅｎｃｅｓ及びＧｅｎＳｃｒｉｐｔを含むがこれらに限定されない、多くの種（ヒト、マウス、ラット、ゼブラフィッシュ、Ｃ．エレガンス（Ｃ．ｅｌｅｇａｎｓ））の、ゲノム内の、多くの遺伝子及び位置をターゲティングするようにあらかじめデザインされたｇＲＮＡ配列もまた、公表されている。

本開示はまた、本明細書において開示された、合成転写因子又は転写エフェクタードメイン（例えば、活性化ドメイン又は抑制ドメイン）をコードする核酸も提供する。例えば、エフェクタードメインは、表１～３に開示された核酸によりコードされうる。一部の実施形態において、エフェクタードメインは、配列番号８９７～１３２９のうちのいずれかに対して、少なくとも７０％の同一性を有する核酸コードされうる。一部の実施形態において、核酸は、１つ以上の合成転写因子又は１つ以上のエフェクタードメインをコードする。

本開示の核酸は、当技術分野に公知の多数のプロモーターのうちのいずれかを含む場合があり、この場合、プロモーターは、構成的プロモーター、調節的プロモーター又は誘導型プロモーター、細胞型特異的プロモーター、組織特異的プロモーター又は種特異的プロモーターである。転写を方向付けるのに十分な配列に加えて、本発明のプロモーター配列はまた、転写をモジュレートすることに関与する、他の調節的エレメントの配列（例えば、エンハンサー、Ｋｏｚａｋ配列及びイントロン）も含みうる。当技術分野において、遺伝子の構成的発現を駆動するために有用な、多くのプロモーター／調節配列が利用可能であり、例えば、ＣＭＶ（サイトメガロウイルスプロモーター）、ＥＦ１ａ（ヒト伸長因子１アルファプロモーター）、ＳＶ４０（サル空胞化ウイルス４０プロモーター）、ＰＧＫ（哺乳動物のホスホグリセリン酸キナーゼプロモーター）、Ｕｂｃ（ヒトユビキチンＣプロモーター）、ヒトベータ－アクチンプロモーター、齧歯動物ベータ－アクチンプロモーター、ＣＢｈ（ニワトリベータ－アクチンプロモーター）、ＣＡＧ（ハイブリッド体プロモーターは、ＣＭＶエンハンサー、ニワトリベータアクチンプロモーター及びウサギベータ－グロビンスプライスアクセプターを含有する）、ＴＲＥ（テトラサイクリン応答エレメントプロモーター）、Ｈ１（ヒトポリメラーゼＩＩＩＲＮＡプロモーター）、Ｕ６（ヒトＵ６小核プロモーター）などを含むがこれらに限定されない。本システムの構成要素の発現のために使用されうる、さらなるプロモーターは、限定せずに述べると、サイトメガロウイルス（ＣＭＶ）中間初期プロモーター、ラウス肉腫ウイルスＬＴＲ、ＨＩＶ－ＬＴＲ、ハイスループットＬＶ－１ＬＴＲ、モロニーマウス白血病ウイルス（ＭＭＬＶ）ＬＴＲ、骨髄増殖性肉腫ウイルス（ＭＰＳＶ）ＬＴＲ、脾臓フォーカス形成ウイルス（ＳＦＦＶ）ＬＴＲなどのウイルスＬＴＲ、サルウイルス４０（ＳＶ４０）初期プロモーター、単純ヘルペスｔｋウイルスプロモーター、ＥＦ１－αイントロンを伴う、又は伴わない、伸長因子１アルファ（ＥＦ１－α）プロモーターを含む。さらなるプロモーターは、任意の構成的に活性のプロモーターを含む。代替的に、任意の調節的プロモーターは、その発現が、細胞内においてモジュレートされうるように使用されうる。

さらに、誘導型発現は、このような分子をコードする核酸を、誘導型プロモーター／調節配列の制御下に置くことにより達せられうる。当技術分野において周知のプロモーターは、金属、グルココルチコイド、テトラサイクリン、ホルモンなどの誘導剤に応答した誘導が可能であり、また、本発明による使用のためにも想定される。したがって、本開示は、これらへと作動可能に連結された、所望のタンパク質の発現を駆動することが可能である、当技術分野において公知の、任意のプロモーター／調節配列の使用を含むことが察知される。

本開示はまた、核酸を含有するベクター及び核酸又はそのベクターを含有する細胞も提供する。ベクターは、適切な細胞内において、核酸を繁殖させるのに使用される場合もあり、かつ／又は核酸（例えば、発現ベクター）からの発現を可能とするのに使用される場合もある。当業者は、核酸配列の繁殖及び発現に利用可能な、多様なベクターについて承知している。

本転写因子を発現させる細胞を構築するために、常套的な方法を介して、本システムの、安定的発現又は一過性発現のための発現ベクターを構築し、細胞へと導入することができる。例えば、本開示の転写因子の構成要素をコードする核酸又は他の核酸若しくはタンパク質を、適切なプロモーターへの作動可能な連結下において、プラスミド又はウイルスベクターなど、適切な発現ベクターへとクローニングすることができる。発現ベクター／プラスミド／ウイルスベクターの選択は、真核細胞内の組込み及び複製に適するものとする。

ある特定の実施形態において、本開示のベクターは、哺乳動物用発現ベクターを使用して、哺乳動物細胞内の、１つ以上の配列の発現を駆動しうる。哺乳動物用発現ベクターの例は、ｐＣＤＭ８（参照により本明細書に組み込まれる、Ｓｅｅｄ、Ｎａｔｕｒｅ（１９８７）、３２９：８４０）及びｐＭＴ２ＰＣ（参照により本明細書に組み込まれる、Ｋａｕｆｍａｎら、ＥＭＢＯＪ．（１９８７）６：１８７）を含む。哺乳動物細胞内において使用される場合、発現ベクターの制御機能は、典型的に、１つ以上の調節エレメントによりもたらされる。例えば、一般に使用されているプロモーターは、ポリオーマウイルス、２型アデノウイルス、サイトメガロウイルス、サルウイルス４０及び本明細書において開示され、当技術分野において公知である、他のウイルスに由来する。原核細胞及び真核細胞のいずれにも適する、他の発現系について、例えば、参照により本明細書に組み込まれる、Ｓａｍｂｒｏｏｋら、「ＭＯＬＥＣＵＬＡＲＣＬＯＮＩＮＧ：ＡＬＡＢＯＲＡＴＯＲＹＭＡＮＵＡＬ」、２版、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ、Ｎ．Ｙ．、１９８９の１６及び１７章を参照されたい。

本開示のベクターは、特定の細胞型内の核酸の発現を方向付けうる（例えば、組織特異的調節エレメントは、核酸を発現させるのに使用される）。このような調節エレメントは、組織特異的の場合もあり、細胞特異的の場合もあるプロモーターを含む。プロモーターへと適用された場合の、「組織特異的」という用語は、異なる組織型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、目的のヌクレオチド配列の選択的発現を、特異的組織型（例えば、種子）へと方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語は、同じ組織内の、異なる細胞型内の、目的の同じヌクレオチド配列の発現の相対的非存在下において、特異的細胞型内の、目的のヌクレオチド配列の選択的発現を方向付けることが可能なプロモーターを指す。プロモーターへと適用された場合の、「細胞型特異的」という用語はまた、単一組織内の領域において、目的のヌクレオチド配列の選択的発現を促進することが可能なプロモーターも意味する。プロモーターの細胞型特異性は、当技術分野において周知の方法、例えば、免疫組織化学的染色を使用して評価されうる。

加えて、ベクターは、例えば、以下の一部又は全部：宿主細胞内における、安定的形質転換体又は一過性形質転換体を選択するための、選択用マーカー遺伝子；転写終結シグナル及びＲＮＡプロセシングシグナル；５’非翻訳領域及び３’非翻訳領域；多目的の多重クローニング部位である、内部リボソーム結合部位（ＩＲＥＳ）；並びにキメラ受容体の発現を評価するためのレポーター遺伝子を含有しうる。トランス遺伝子を含有するベクターを作製するために適する、ベクター及び方法は、周知であり、当技術分野において利用可能である。選択用マーカーは、クロラムフェニコール耐性、テトラサイクリン耐性、スペクチノマイシン耐性、ネオマイシン、ストレプトマイシン耐性、エリスロマイシン耐性、リファンピシン耐性、ブレオマイシン耐性、熱適合カナマイシン耐性、ゲンタマイシン耐性、ヒグロマイシン耐性、トリメトプリム耐性、ジヒドロ葉酸レダクターゼ（ＤＨＦＲ）、ＧＰＴ；Ｓ．セレビシエ（Ｓ．ｃｅｒｅｖｉｓｉａｅ）の遺伝子である、ＵＲＡ３、ＨＩＳ４、ＬＥＵ２及びＴＲＰ１を含む。

細胞へと導入された場合、ベクターは、自律的複製配列又は染色体外エレメントとして維持される場合もあり、宿主ＤＮＡへと組み込まれる場合もある
したがって、本開示は、本明細書において開示された、合成転写因子、核酸又はベクターを含む細胞をさらに提供する。

常套的なウイルスベースの遺伝子導入法及び非ウイルスベースの遺伝子導入法は、核酸を、細胞、組織又は対象へと導入するのに使用されうる。このような方法は、核酸を、培養物中の細胞又は宿主生物における細胞へと投与するのに使用されうる。非ウイルスベクター性の送達システムは、ＤＮＡプラスミド、コスミド、ＲＮＡ（例えば、本明細書において記載されたベクターの転写物）、核酸及び送達媒体と複合体化された核酸を含む。

ウイルスベクター性の送達システムは、細胞へと送達された後において、エピソーム性である又はゲノムへと組み込まれたＤＮＡウイルス及びＲＮＡウイルスを含む。様々なウイルス構築物は、本核酸を、細胞、組織及び／又は対象へと送達するのに使用されうる。ウイルスベクターは、例えば、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター及び単純ヘルペスウイルスベクターを含む。このような組換えウイルスの非限定例は、組換えアデノ随伴ウイルス（ＡＡＶ）、組換えアデノウイルス、組換えレンチウイルス、組換えレトロウイルス、組換え単純ヘルペスウイルス、組換えポックスウイルス、ファージなどを含む。本開示は、レトロウイルス又はレンチウイルスなど、宿主ゲノムへの組込みが可能なベクターを提示する。参照により本明細書に組み込まれる、例えば、Ａｕｓｕｂｅｌら、「ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ」、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ、１９８９；Ｋａｙ，Ｍ．Ａ．ら、２００１、Ｎａｔ．Ｍｅｄｉｃ．、７（１）：３３～４０；並びにＷａｌｔｈｅｒＷ．及びＳｔｅｉｎＵ．、２０００、Ｄｒｕｇｓ、６０（２）：２４９～７１を参照されたい。

核酸又は転写因子は、任意の適切な手段により送達されうる。ある特定の実施形態において、核酸又はそのタンパク質は、インビボにおいて送達される。他の実施形態において、核酸又はそのタンパク質は、疾患又は状態を患う患者へのインビボ送達に有用な、改変細胞をもたらすように、インビトロ又はエクスビボにおいて、分離／培養細胞へと送達される。

多種多様な宿主細胞が、本開示に従うベクターにより形質転換される場合もあり、トランスフェクトされる場合もあり、本開示に従うベクターが、他の方式において、多種多様な宿主細胞へと導入される場合もある。トランスフェクションとは、任意のコード配列が、実際に発現されるのであれ、発現されないのであれ、ベクターが細胞に取り込まれることを指す。当業者に、多数のトランスフェクション法、例えば、リポフェクタミン、リン酸カルシウム共沈殿、電気穿孔、ＤＥＡＥデキストラン処理、マイクロインジェクション、ウイルス感染及び当技術分野において公知である、他の方法が公知である。形質導入とは、ウイルスの、細胞への侵入及びウイルスベクターゲノムにより送達された配列の発現（例えば、転写及び／又は翻訳）を指す。組換えベクターの場合、「形質導入」とは、一般に、組換えウイルスベクターの、細胞への侵入及びベクターゲノムにより送達された目的の核酸の発現を指す。

当技術分野において、ベクターを、細胞へと送達する方法が周知であり、ＤＮＡ又はＲＮＡの電気穿孔、リポソームなどのトランスフェクション試薬又はＤＮＡ若しくはＲＮＡを送達するためのナノ粒子；機械的変形による、ＤＮＡ、ＲＮＡ、又はタンパク質の送達（例えば、参照により本明細書に組み込まれる、Ｓｈａｒｅｉら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ（２０１３）、１１０（６）：２０８２～２０８７を参照されたい）；又はウイルスによる形質導入を含みうる。一部の実施形態において、ベクターは、ウイルスによる形質導入を介して、宿主細胞へと送達される。核酸は、プラスミド又はウイルスベクターなど、大型の構築物の一部として送達される場合もあり、例えば、電気穿孔、脂質小胞、ウイルス輸送体、マイクロインジェクション及びバイオリスティック法（高速粒子ボンバードメント）により直接送達される場合もある。同様に、１つ以上のトランス遺伝子を含有する構築物は、核酸を、細胞へと導入するために適切な、任意の方法により送達されうる。一部の実施形態において、本システムの構成要素をコードする構築物又は核酸は、ＤＮＡ分子である。一部の実施形態において、本システムの構成要素をコードする核酸は、ＤＮＡベクターであり、細胞へと電気穿孔されうる。一部の実施形態において、本システムの構成要素をコードする核酸は、細胞へと電気穿孔されうる、ＲＮＡ分子である。

加えて、ナノ粒子ベースの送達システム及び脂質ベースの送達システムなどの送達媒体も使用されうる。さらなる送達媒体の例は、レンチウイルスベクター、リボ核タンパク質（ＲＮＰ）複合体、脂質ベースの送達システム、遺伝子銃、流体力学法、電気穿孔又はヌクレオフェクション、マイクロインジェクション及びバイオリスティック法を含む。多様な遺伝子送達法は、参照により本明細書に組み込まれる、Ｎａｙｅｒｏｓｓａｄａｔら（ＡｄｖＢｉｏｍｅｄＲｅｓ．、２０１２、１：２７）及びＩｂｒａｈｅｅｍら（ＩｎｔＪＰｈａｒｍ．、２０１４年１月１日、４５９（１～２）：７０～８３）により、詳細に論じられている。

このように、本開示は、本明細書において開示されたベクター（複数可）又は核酸（複数可）を含む分離細胞を提供する。好ましい細胞は、容易に、かつ、信頼できる形において増殖し、増殖速度が、妥当な程度に高速であり、発現系が、十分に特徴づけられており、容易に、かつ、効率的に形質転換又はトランスフェクトされうる細胞である。適切な原核細胞の例は、バチルス属（Ｂａｃｉｌｌｕｓ）（バチルス・スブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）及びバチルス・ブレビス（Ｂａｃｉｌｌｕｓｂｒｅｖｉｓ）など）、エシェリキア属（Ｅｓｃｈｅｒｉｃｈｉａ）（Ｅ．コリー（Ｅ．ｃｏｌｉ）など）、シュードモナス属（Ｐｓｅｕｄｏｍｏｎａｓ）、ストレプトマイセス属（Ｓｔｒｅｐｔｏｍｙｃｅｓ）、サルモネラ属（Ｓａｌｍｏｎｅｌｌａ）及びエルウィニア属（Ｅｒｗｉｎｉａ）に由来する細胞を含むがこれらに限定されない。適切な真核細胞は、当技術分野において公知であり、例えば、酵母細胞、昆虫細胞及び哺乳動物細胞を含む。適切な酵母細胞の例は、クルイベロマイセス属（Ｋｌｕｙｖｅｒｏｍｙｃｅｓ）、ピキア属（Ｐｉｃｈｉａ）、リノスポリジウム属（Ｒｈｉｎｏｓｐｏｒｉｄｉｕｍ）、サッカロマイセス属（Ｓａｃｃｈａｒｏｍｙｃｅｓ）及びスキゾサッカロマイセス属（Ｓｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓ）に由来する酵母細胞を含む。例示的な昆虫細胞は、Ｓｆ－９細胞及びＨＩＳ細胞（Ｉｎｖｉｔｒｏｇｅｎ、Ｃａｒｌｓｂａｄ、Ｃａｌｉｆ．）を含み、例えば、参照により本明細書に組み込まれる、Ｋｉｔｔｓら、Ｂｉｏｔｅｃｈｎｉｑｕｅｓ、１４：８１０～８１７（１９９３）；Ｌｕｃｋｌｏｗ、Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．、４：５６４～５７２（１９９３）並びにＬｕｃｋｌｏｗら、Ｊ．Ｖｉｒｏｌ．、６７：４５６６～４５７９（１９９３）において記載されている。細胞は、哺乳動物細胞であることが所望され、一部の実施形態において、細胞は、ヒト細胞である。当技術分野において、多数の適切な哺乳動物宿主細胞及びヒト宿主細胞が公知であり、これらのうちの多くは、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎ（ＡＴＣＣ、Ｍａｎａｓｓａｓ、Ｖａ．）から入手可能である。適切な哺乳動物細胞の例は、チャイニーズハムスター卵巣細胞（ＣＨＯ）（ＡＴＣＣ受託番号：ＣＣＬ６１）、ＣＨＯＤＨＦＲ細胞（Ｕｒｌａｕｂら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、９７：４２１６～４２２０（１９８０））、ヒト胎児性腎臓（ＨＥＫ）２９３細胞又はＨＥＫ２９３Ｔ細胞（ＡＴＣＣ受託番号：ＣＲＬ１５７３）及び３Ｔ３細胞（ＡＴＣＣ受託番号：ＣＣＬ９２）を含むがこれらに限定されない。他の適切な哺乳動物細胞系は、サルＣＯＳ－１細胞系（ＡＴＣＣ受託番号：ＣＲＬ１６５０）及びＣＯＳ－７細胞系（ＡＴＣＣ受託番号：ＣＲＬ１６５１）のほか、ＣＶ－１細胞系（ＡＴＣＣ受託番号：ＣＣＬ７０）である。さらなる例示的な哺乳動物宿主細胞は、形質転換細胞系を含む、霊長動物細胞系、齧歯動物細胞系及びヒト細胞系を含む。正常二倍体細胞、初代組織のインビトロ培養物に由来する細胞株のほか、初代外植片もまた適する。他の適切な哺乳動物細胞系は、マウス神経芽細胞腫Ｎ２Ａ細胞、ＨｅＬａ細胞、ＨＥＫ細胞、Ａ５４９細胞、ＨｅｐＧ２細胞、マウスＬ－９２９細胞及びＢＨＫハムスター細胞系又はＨａＫハムスター細胞系を含むがこれらに限定されない。

当技術分野において、細胞の形質転換、培養物、増幅、スクリーニング及び精製に適する哺乳動物細胞及び方法を選択するための方法が公知である。

本発明はまた、本明細書において記載された合成転写因子、核酸、ベクター又は細胞を含む組成物又はシステムも対象とする。一部の実施形態において、組成物又はシステムは、２つ以上の合成転写因子、核酸、ベクター又は細胞を含む。

一部の実施形態において、組成物又はシステムは、ｇＲＮＡをさらに含む。ｇＲＮＡは、合成転写因子と同じ核酸上においてコードされる場合もあり、異なる核酸上においてコードされる場合もある。一部の実施形態において、合成転写因子をコードするベクターは、同じプロモーター下において、ｇＲＮＡをさらにコードする場合もあり、異なるプロモーター下において、ｇＲＮＡをさらにコードする場合もある。一部の実施形態において、ｇＲＮＡは、転写因子のベクターと隔てられた、その固有のベクター上においてコードされる。

４．遺伝子発現をモジュレートする方法
本開示はまた、細胞内の少なくとも１つの標的遺伝子の発現をモジュレートする方法であって、細胞へと、本明細書において記載された少なくとも１つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを導入するステップを含む方法も提供する。一部の実施形態において、少なくとも２つの遺伝子の遺伝子発現がモジュレートされる。

発現のモジュレーションは、標的遺伝子についての正常な遺伝子発現と比較した、遺伝子発現の増大又は低下を含む。少なくとも２つの遺伝子の遺伝子発現がモジュレートされる場合、いずれの遺伝子の遺伝子発現も増大する場合もあり、いずれの遺伝子の遺伝子発現も低下する場合もあり、一方の遺伝子の遺伝子発現は増大するが、他方の遺伝子の遺伝子発現は低下する場合もある。

細胞は、原核細胞の場合もあり、真核細胞の場合もある。好ましい実施形態において、細胞は、真核細胞である。一部の実施形態において、細胞は、インビトロにおける細胞である。一部の実施形態において、細胞は、エクスビボにおける細胞である。

一部の実施形態において、細胞は、開示されたシステム、組成物、ベクターの、細胞への導入が、対象への投与を含むように、生物又は宿主における細胞である。方法は、インビボにおいて、又はエクスビボにおいて処理された細胞の移入により、本明細書において記載された少なくとも１つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと提供又は投与するステップを含みうる。

「対象」は、ヒトの場合もあり、ヒト以外の場合もあり、例えば、本明細書において記載されたマウスモデルなど、調査研究を目的とする「モデル系」として使用された、動物株又は動物種を含みうる。同様に、対象は、成人又は若年者（例えば、小児）を含みうる。さらに、対象とは、本明細書において想定された組成物の投与から利益を得うる、任意の生物、好ましくは、哺乳動物（例えば、ヒト又は非ヒト哺乳動物）を意味しうる。哺乳動物の例は、哺乳動物のクラス：ヒト、チンパンジー並びに他の類人猿種及びサル種などの非ヒト霊長動物；ウシ、ウマ、ヒツジ、ヤギ、ブタなどの農場動物；ウサギ、イヌ及びネコなどの愛玩動物；ラット、マウス及びモルモットなどの齧歯動物を含む実験動物などのうちの任意のメンバーを含むがこれらに限定されない。非哺乳動物の例は、鳥類、魚類などを含むがこれらに限定されない。本明細書で提供された方法及び組成物についての一実施形態において、哺乳動物は、ヒトである。

本明細書において使用された、「～を施すこと」、「～を投与すること」、「～を導入すること」という用語は、本明細書において、互換的に使用され、所望の部位への、システムの少なくとも部分的な局在化を結果としてもたらす方法又は経路による、本開示のシステムの、対象への留置を指す。システムは、対象における所望の位置への送達を結果としてもたらす、任意の適切な経路により投与されうる。

５．キット
エフェクタードメイン若しくはＤＮＡ結合性ドメイン又はこれらの組合せをコードする、少なくとも１つの核酸のうちの少なくとも１つ又は全て、少なくとも１つの合成転写因子又はこれをコードする核酸、少なくとも１つのエフェクタードメイン又は少なくとも１つの合成転写因子をコードするベクター、本明細書において記載された組成物又はシステム、エフェクタードメイン、ＤＮＡ結合性ドメイン、合成転写因子、又はこれらのうちのいずれかをコードする核酸を含む細胞、本明細書において記載されたレポーター細胞及び本明細書において記載された、二部構成型レポーター遺伝子又はこれをコードする核酸を含むキットもまた、本開示の範囲内にある。

キットはまた、キットの構成要素を使用するための指示書も含みうる。指示書とは、キットに関する、関与性の材料又は方法である。材料は、以下：背景情報、構成要素の一覧、組成物を使用するための、略式プロトコール又は詳細プロトコール、トラブルシューティング、参考文献、テクニカルサポート及び他の任意の関連文献の、任意の組合せを含みうる。指示書は、キットと共に提供される場合もあり、別個のメンバー構成要素である、紙形態として提供される場合もあり、コンピューター読取り型メモリーデバイス上において提供される場合もあり、インターネット上のウェブサイトからダウンロードされる場合もあり、表示の記録として提示される場合もある、電子的形態として提供される場合もある。

開示されたキットは、開示された方法との関連において援用されうることが理解される。キットは、本明細書において記載された方法のうちのいずれかにおける使用のための指示書を含みうる。指示書は、抑制ドメインを同定する方法又は遺伝子発現をモジュレートする方法のための構成要素の使用についての記載を含みうる。

本明細書において提供されたキットは、適切にパッケージングされている。適切なパッケージングは、バイアル、ボトル、ジャー、可撓性パッケージングなどを含むがこれらに限定されない。

キットは、任意選択的に、緩衝液解釈のための情報などの、さらなる構成要素を提供しうる。通常、キットは、容器及び容器上の表示又は容器に付属するパッケージ添付文書（複数可）を含む。一部の実施形態において、本開示は、上記において記載されたキットの内容物を含む製品を提供する。

キットは、本システム又は本組成物を保持又は投与するためのデバイスをさらに含みうる。デバイスは、注入デバイス、静脈内溶液バッグ、皮下注射針、バイアル及び／又はシリンジを含みうる。

本開示はまた、インビトロにおいて、方法を実施する、又は構成要素を作製するためのキットも提供する。キットは、本システムの構成要素を含みうる。キットの任意選択的な成分は、以下：（１）緩衝液構成成分、（２）対照プラスミド、（３）シーケンシングプライマーのうちの１つ以上を含む。

６．実施例
ヒト遺伝子の発現は、転写を活性化させる、又は抑制する、数千のタンパク質により調節されている。我々は、これらのタンパク質の遺伝子発現の変化を媒介するのに十分なドメインである、エフェクタードメインについての、完全かつ定量的な記載を欠いている。ヒト細胞内の転写エフェクタードメインを体系的に測定するために、本明細書において、タンパク質ドメインのライブラリーが、ＤＮＡ結合性ドメインへと融合され、レポーター遺伝子へとリクルートされる、ハイスループットアッセイが提供される。次いで、細胞が、レポーターの発現レベルにより分離され、タンパク質ドメインのライブラリーが、シーケンシングされる。レポーターは、磁性ビーズを使用する、細胞数千万個の、高発現集団及び低発現集団への、単純な分離を容易とする、合成表面マーカーである。

遺伝子サイレンシング及びエピジェネティックメモリーを、≦８０アミノ酸である、全ての核タンパク質ドメインのリクルートメントの後において定量した。＞３００のＫＲＡＢドメイン及び＞２００のホメオドメインの全ファミリーについての測定を使用して、転写因子の抑制ドメイン強度と、それらの進化履歴及び発生的役割との関係を発見した。さらに、ＺＮＦ１０ＫＲＡＢエフェクター機能について、高深度突然変異スキャンを行い、ＣＲＩＳＰＲｉにおいて使用されたＫＲＡＢドメインと比較して、安定性及び抑制を増強する置換を同定した。既存のアノテーション領域を越えて、エフェクタードメインを探索するために、２３８の抑制性複合体タンパク質の配列をタイリングし、非カノニカルのポリコーム１．６リクルートメントタンパク質であるＭＧＡを含む、大型のクロマチン調節因子の、非アノテーション領域内において、１０アミノ酸という短鎖の、新規の抑制ドメインを発見した。２０を超える抑制因子を、個別に特徴づけ、それらの全てが、サイレンシング及びエピジェネティックメモリーの動態は、顕著に異なるが、レポーター遺伝子を、単一細胞レベルにおいて、全部又はゼロ式にサイレンシングすることを見出した。

加えて、高度に分岐的な、酸性ＫＲＡＢドメイン変異体を含む、核タンパク質内の、新たな活性化ドメインも発見した。

まとめると、これらの結果は、ヒト細胞内の転写エフェクタードメイン活性の体系的測定のための戦略を裏付け、合成転写技術及びエピジェネティック摂動技術において適用されうる、コンパクト転写エフェクタードメインの数を拡張する。

本技術により取り扱われる問題は、
ｉ．どの遺伝子が、エフェクター機能を有するのかという、未知の問題
ｉｉ．どのドメインがこの機能を有するのか未知であることが多い、公知のＴＦ／ＣＲ遺伝子内の問題
ｉｉｉ．どのファミリーメンバーが、この機能を有するのか、未知である、公知のエフェクタードメインを含むドメインファミリー内の問題
ｉｖ．どの残基が必要であり、突然変異が、どのようにして機能を低減又は増強するのか未知である、公知のエフェクタードメイン内の問題
である。

本明細書において提供されるシステム及び方法は、レポータープロモーターからのアウトプットを変化させる、活性化能及び抑制能に対する調節ドメインを測定しうる。歴史的に、これは、ロースループットの作業を要求し、比較的少数のエフェクタードメインが測定されている。本明細書において提供されるシステム及び方法は、代替的ハイスループットアッセイを提供する。

システム及び方法は、例えば、ａ．遺伝子調節を理解し、これらのタンパク質が結合する非コード調節エレメントの機能を予測すること；及びｂ．エピゲノム摂動ツールのためのエフェクタードメインを同定するために使用される。

かつて、合成転写因子の操作のために、限定数の転写エフェクタードメインが利用可能であった。この限界に取り組むために、本明細書において、転写エフェクタードメインの機能をスクリーニングし、定量するためのハイスループット法が提供される。この手法は、ＤＮＡ結合性ドメインへと融合した場合に、転写を、ターゲティングされた形において、上方調節する場合もあり、下方調節する場合もある、数百のエフェクタードメインの発見を可能とした。このステップはまた、活性が増強されたエフェクタードメインの突然変異体も同定する。これらのエフェクタードメインは、遺伝子治療及び細胞療法、合成生物学並びに機能的ゲノミクスにおける適用のために、合成転写因子を操作するのに使用されうる。

本明細書において提供される新たな転写エフェクタードメインは、合成転写因子に依拠する適用のための、いくつかの利点を有する。本発明者らは、短鎖ドメイン（≦８０アミノ酸）及び送達（例えば、ウイルスベクター内のパッケージング）のための利点である、最小限に十分な配列へと、さらに短縮するためのハイスループットステップを同定する。場合によって、本発明者らは、１０アミノ酸という短鎖である、強力なエフェクタードメインを同定する。ドメインは、ヒトタンパク質から抽出され、これは、ウイルス性エフェクタードメインと比較して、免疫原性を低減する利点をもたらす。これらのドメインの大半は未だ、転写エフェクターとして報告されていない。

強力なｐＥＦプロモーター及び弱いｍｉｎＣＭＶプロモーターの両方に対して、Ｐｆａｍドメインライブラリーを伴う、ハイスループットリクルートメントを実施することにより、抑制ドメイン及び活性化ドメインの両方の測定が可能であった。多くのさらなる抑制因子が見出された、１つの可能な理由は、ＴＡＤが、よりしばしば、Ｐｆａｍによるドメイン定義を満たす、自律的な安定フォールディング配列でありながら、よりしばしば、ドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることである。別の可能な理由は、核内において、活性化補因子が、抑制補因子より限定的であり（Ｇｉｌｌｅｓｐｉｅ、ＭｏｌＣｅｌｌ、２０２０）、これは、活性化ドメインの発現の低下が、活性化強度の増大を結果としてもたらす場合もあることを含意するが、この効果が、スクリーン内のシグナルを、完全に遮蔽するとは予測されないことでありうる。転写因子をタイリングする、又はＴＡＤ様署名（例えば、酸性度）を伴う領域に焦点を当てる、新たなライブラリーデザインは、さらなる活性化ドメインを明らかにする。

加えて、本明細書において、増強変異体を同定するために、これらのドメイン内の突然変異について調べるためのハイスループットステップも開示される。ハイスループット法は、磁性分離を使用する、これらのライブラリーの、より効率的であり、廉価であり、急速なスクリーニングをもたらす、人工細胞表面マーカーの開発により、よりたやすく可能とされる。これは、蛍光レポーター遺伝子の発現に基づき、ライブラリーを分取する、より常套的な手法を上回る利点である。

［実施例１］
ハイスループットリクルートメントは、ヒトタンパク質内の、数百の抑制ドメインを同定する
転写ドメインについての、古典的リクルートメントレポーターアッセイを、ハイスループットアッセイへと転換するために、２つの問題：（１）レポーターを、数万ドメインを有するライブラリーの急速なスクリーニングに適合性とするための、レポーターの修飾；及び（２）候補エフェクタードメインのライブラリーを作出する戦略の開発を解決した。既に公表されている蛍光レポーター（Ｂｉｎｔｕら、２０１６）に対する改善のために、合成表面マーカーを操作して、多数の細胞の容易な磁性分離を可能とし、レポーターを、大容量のスピナーフラスコ内の細胞培養に適する、懸濁細胞系内に組み込んだ。具体的に、合成表面マーカー（Ｉｇκリーダー及びＰＤＧＦＲβ膜貫通ドメインへと連結された、ヒトＩｇＧ１Ｆｃ領域）と、蛍光シトリンタンパク質とからなる、二部構成レポーター（図１）の発現を駆動する、強い構成的ｐＥＦ１ａプロモーターの上流に、９×ＴｅｔＯ結合性部位を伴う、Ｋ５６２レポーター細胞を作出した。フローサイトメトリーは、５日以内に、亜鉛フィンガー転写因子であるＺＮＦ１０に由来する、公知の抑制ドメインである、ＫＲＡＢドメインの、ＴｅｔＯ部位におけるリクルートメントが、このレポーターを、ドキシサイクリン依存的にサイレンシングすることを確認した（図７並びに１６Ａ及び１６Ｂ）。合成表面マーカーに結合するＰｒｏＧＤｙｎａｂｅａｄによる磁性分離は、レポーターオン細胞を、レポーターオフ細胞から分離した（図７及び１６Ｃ）。

配列は、核へと局在化されうる、ヒトタンパク質（核局在化タンパク質だけに限られない、ヒトタンパク質を含む）内の、Ｐｆａｍアノテーションドメインについて、ＵｎｉＰｒｏｔデータベースから取り出した。合計、１４，６５７ドメインを検索した。これらのうち、７２％は、８０アミノ酸（ＡＡ）長以下であった（図１）が、これは、これらのドメインを、３００塩基のオリゴヌクレオチドとしてプールされた合成オリゴヌクレオチドに適合性とした。８０アミノ酸より短いドメインについて、ドメイン配列を、両末端において、８０アミノ酸の長さに到達させ、ＰＣＲ増幅バイアスを回避するために、天然タンパク質配列に由来する隣接残基により伸長させた。８０アミノ酸のランダム配列又はタイリングウィンドウを１０アミノ酸として、ＤＭＤタンパク質に沿ってタイリングされた、８０アミノ酸の配列である、８６１の陰性対照を追加した。ＤＭＤタンパク質は、核内に局在化しなかった（Ｃｈｅｖｒｏｎら、１９９４）ので、転写活性を伴うドメインを特徴づける可能性は小さかった。ライブラリーは、レンチウイルスによる発現のために、ｒＴｅｔＲドキシサイクリン誘導性ＤＮＡ結合性ドメイン単独との融合タンパク質又は３×ＦＬＡＧタグ付けｒＴｅｔＲとの融合タンパク質としてクローニングされ（図１７Ａ及び８）、Ｋ５６２レポーター細胞へと送達された（図１）。

転写活性についてアッセイする前に、ハイスループット法を使用して、Ｋ５６２細胞内において、どのタンパク質ドメインが発現良好であるのかを決定した（図１７Ａ及び８）。細胞ライブラリーを、抗ＦＬＡＧ蛍光標識化抗体により染色し、細胞を、２つのビンへと分取し（図１７Ｂ及び８）、ゲノムＤＮＡを抽出し、単位複製配列シーケンシングにより、各ドメインの頻度をカウントした。シーケンシングカウントを使用して、各ドメインについて、発現レベルの測定値として、ＦＬＡＧ_ｌｏｗ集団と対比される、ＦＬＡＧ_ｈｉｇｈ集団のエンリッチメント比を計算した。これらの測定は、個別に形質導入された生物学的反復間において、再現可能であり（ｒ^２＝０．８２、図１７Ｃ及び８）、ウェスタンブロットにより測定された、個々のドメイン融合体の発現レベルと高度に相関した（ｒ^２＝０．９２、図１７Ｄ及び１７Ｅ並びに８）。天然Ｐｆａｍドメインが、ランダム配列対照より、有意に発現良好（マンホイットニー検定によるｐ＜１×１０^－５である）であるのに対し、Ｐｆａｍドメイン及びＤＭＤタイリング対照は、同等に発現良好であった（図１７Ｆ及び８）。ランダム対照の中央値を、１標準偏差上回る、ＦＬＡＧ_ｈｉｇｈ：ＦＬＡＧ_ｌｏｗ比により、発現良好ドメインを同定するように、閾値を設定した。この定義により、Ｐｆａｍドメインのうちの６６％が、発現良好であり、これらのドメインを、さらなる解析の焦点とした。

Ｐｆａｍドメインライブラリーを、転写抑制因子についてスクリーニングした。プールされた細胞ライブラリーを、ドキシサイクリンにより、転写サイレンシング後に、細胞分裂のために、レポーターのｍＲＮＡ及びタンパク質が分解及び希釈される結果として、「オン」細胞と、「オフ」細胞との、透明な二相性混合物をもたらすのに十分な時間をもたらす、５日間にわたり処理した（図１８Ａ及び９）。次いで、磁性細胞分離（図１８Ａ及び９）及びドメインシーケンシングを実施し、次いで、非結合集団内及びビーズ結合集団内のリードカウントを使用して、各ライブラリーメンバーについて、ｌｏｇ_２（オフ：オン）比を計算した（図１）。明確さのために述べると、ビーズ結合集団を、「オン」集団と称し、非結合集団を、「オフ」集団と称した。測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった（ｒ^２＝０．９６、図１）。ドメインが、発現不良陰性対照の平均値を、２標準偏差を超える抑制を引き起こした場合に、ヒットと判定した。これは、６３のドメインファミリーに由来するドメインについて、５日目において、４４６の抑制因子ヒットを結果としてもたらした（図１２Ａ）。場合によって、正確な同じドメイン配列が、複数の遺伝子内において生じるため、これらの抑制ドメインは、４５１のヒトタンパク質内において見出される。１０のドメインファミリーに由来し、Ｐｆａｍにより、抑制因子又は抑制補因子結合性ドメインとして記載された、公知の抑制ドメイン（例えば、ヒトＺＮＦ１０に由来するＫＲＡＢ、ＣＢＸ５に由来するＣｈｒｏｍｏｓｈａｄｏｗ）は、ヒットの中にあった。エピジェネティックメモリーを測定するために、９及び１３日目に、さらなる時点を設定した。ヒットを含有するタンパク質のセットは、転写因子及びクロマチン調節因子について、ライブラリー内において使用された、全ての核タンパク質と比較した場合に、有意にエンリッチされたが、異なるカテゴリーのタンパク質も、それらのメモリーレベルにより分類された場合に、示差的にエンリッチされた（図１８Ｂ及び９）。具体的に、１３日目において、メモリーが高度である抑制因子（細胞は、オフ状態を維持する）は、ＫＲＡＢＺＮＦタンパク質を含む、Ｃ２Ｈ２型亜鉛フィンガー転写因子について、最も高度にエンリッチされ、メモリーが低度である抑制因子は、Ｈｏｘタンパク質を含む、ホメオドメイン転写因子について、最も高度にエンリッチされた。全体として、ヒット間における、極めて高度の再現性及び予測された陽性対照抑制ドメインの同定は、ハイスループットリクルートメントと呼ばれるスクリーニング法が、信頼できる結果をもたらすことを示唆した。核Ｐｆａｍドメインライブラリー内において同定された抑制因子についてのアミノ酸配列及び核酸配列を、表１に示すが、高スコアは、高度の抑制を指し示す。

最強のヒットのうちの１つは、いずれも、ポリコーム抑制複合体１（ＰＲＣ１）の構成要素である（Ｃｈｉｔｔｏｃｋら、２０１７；Ｇａｒｃｉａら、１９９９）、ＲＩＮＧ１／ＹＹ１結合性タンパク質（ＲＹＢＰ）及びそのパラログであるＹＹ１関連因子２（ＹＡＦ２）に存在するドメインである、ＹＡＦ２＿ＲＹＢＰであった。ＰｆａｍによりアノテーションされたＲＹＢＰタンパク質ドメイン（わずか３２アミノ酸であるので、８０アミノ酸のドメインライブラリー内において合成された短鎖形である）を、個別に調べ、レポーター遺伝子の急速なサイレンシングを確認した（図１２Ｂ）。ＲＹＢＰ媒介サイレンシングはまた、マウス胚性幹細胞内の全長ＲＹＢＰタンパク質のリクルートメントについての近年の報告においても裏付けられた（Ｍｏｕｓｓａら、２０１９；Ｚｈａｏら、２０２０）。結果は、表面プラズモン共鳴により、ポリコームヒストン修飾酵素であるＲＩＮＧ１Ｂに結合するのに要求される最小ドメインであることが示された、３２アミノ酸のＲＹＢＰドメイン（Ｗａｎｇら、２０１０）が、細胞内のサイレンシングを媒介するのに十分であることを確立した。

抑制反応速度を定量するために、シトリンレベルの分布にゲートをかけて、非処理細胞内の、均一の低レベルのバックグラウンドサイレンシングにより正規化された、サイレンシング細胞の百分率を計算し、次いで、データを、ドキシサイクリン処理時における指数関数的サイレンシング速度と、ドキシサイクリン除去の後における指数関数的減衰（又は再活性化）とを伴い、細胞の不可逆的サイレント百分率を一定とするプラトーに達するモデルに照らしてフィッティングした（図１２Ｃ）。この手法を使用して、全て、リクルートメントアッセイ又は抑制補因子結合アッセイにより、抑制機能についての裏付けがなされている、ＳＵＭＯ３、ＭＰＰ８に由来するＣｈｒｏｍｏドメイン、ＣＢＸ１に由来するＣｈｒｏｍｏｓｈａｄｏｗドメイン及びＳＣＭＨ１に由来するＳＡＭ＿１／ＳＰＭドメイン（図１８Ｃ～１８Ｆ及び９）の抑制機能もまた、検証した（Ｃｈａｎｇら、２０１１；Ｃｈｕｐｒｅｔａら、２００５；Ｆｒｅｙら、２０１６；Ｌｅｃｈｎｅｒら、２０００）。個々の測定値の全てによるサイレンシング速度（上記の抑制因子ヒット及び下記において論じられる他のヒットについて；図１８Ｃ～１８Ｋ及び９）は、５日目におけるサイレンシングのハイスループット測定値とよく相関した（Ｒ^２＝０．８６；図１２Ｄ）。これらの個別の検証は、酵母内のドキシサイクリンの非存在下において漏洩度を軽減するように操作され（Ｒｏｎｅｙら、２０１６）、ヒト細胞内において漏洩しないことが見出され（図１９Ａ及び１９Ｂ）、哺乳動物合成生物学に有用なツールとなった、ＤＮＡ結合性ドメインであるｒＴｅｔＲの新たな変異体（ＳＥ－Ｇ７２Ｐ）を使用して実施した。この新たなｒＴｅｔＲ変異体は、最大のドキシサイクリンリクルートメントにおいて、元のｒＴｅｔＲと同じサイレンシング強度を有し（図１９Ｃ）、これはまた、個別の検証と、スクリーンスコアとの、高度の相関によっても証拠立てられた（図１２Ｄ）。まとめると、これらの検証実験は、ハイスループットリクルートメントが、真正の抑制因子の同定及び各ドメインについての抑制強度の定量の両方に、個別のフローサイトメトリー実験と同等の精度により成功したことを裏付けた。

［実施例２］
転写を抑制する、機能未知ドメインの同定
Ｐｆａｍドメインファミリーのうちの２２％を超えるドメインが、機能未知ドメイン（ＤＵＦ）として分類されているのに対し、他のドメインは、この分類を使用して分類されていないが、これにもかかわらず、ＤＵＦである（Ｅｌ－Ｇｅｂａｌｉら、２０１９）。これらのドメインは、認識可能な配列の保存を有するが、実験による性質決定を欠いている。このように、本明細書において記載されたハイスループットドメインスクリーンは、初期機能を、ＤＵＦと関連づける機会をもたらした。まず、ＤＵＦ３６６９ドメインを、抑制因子ヒットとして同定し、フローサイトメトリーにより、個別に検証した（図１２Ａ～１２Ｃ）。これらのＤＵＦは、多くの抑制性転写因子を含有する遺伝子ファミリーである、ＫＲＡＢ亜鉛フィンガータンパク質内の天然において見出される。これと符合して、２つのＤＵＦ３６６９ファミリードメインのリクルートメントの後における、転写の抑制を裏付ける結果が、近年公表され（ＡｌＣｈｉｂｌａｋら、２０１９）、ハイスループット結果は、この所見を、残る４つの未験ＤＵＦ３６６９配列を含むように拡張する。ＨＮＦ３のＣ末端ドメインである、ＨＮＦ＿Ｃは、肝細胞核因子３アルファ及び肝細胞核因子３ベータ（また、ＦＯＸＡ１及びＦＯＸＡ２としても公知である）だけにおいて見出されるため、より特異的な名称を有するが、別のＤＵＦである。ＦＯＸＡ１及びＦＯＸＡ２のいずれに由来するＨＮＦ＿Ｃドメインもまた、抑制因子ヒットとして見出された。これらのいずれも、抑制性モチーフの候補に挙げられている（Ｃｏｐｌｅｙ、２００５）、ＦｘＩｘｘＩＬ配列により特徴づけられた、ＥＨ１（ｅｎｇｒａｉｌｅｄｈｏｍｏｌｏｇｙ１）モチーフを含む。

３つのいずれもが、ＩＲＦ－２ＢＰ１＿２のＮ末端亜鉛フィンガードメイン（Ｃｈｉｌｄｓ及びＧｏｏｄｂｏｕｒｎ、２００３）である、インターフェロン調節因子２（ＩＲＦ２）の抑制補因子である、ＩＲＦ２ＢＰ１、ＩＲＦ２ＢＰ２及びＩＲＦ２ＢＰＬにおいて見出された、性質決定されていないドメインは、抑制因子ヒットであった。ＤＮＡ修復因子である、ＨＥＲＣ２Ｅ３リガーゼ内のＣｙｔ－ｂ５ドメイン（Ｍｉｆｓｕｄ及びＢａｔｅｍａｎ、２００２）は、強力な抑制因子ヒットとして検証されたが、機能的に性質決定されていない、別のドメインであった（図１８Ｇ及び９）。ＢＩＮ１内のＳＨ３＿９ドメインは、ＳＨ３タンパク質結合性ドメインの、大部分が性質決定されていない変異体であるが、これもまた、抑制因子として検証された（図１８Ｈ及び９）。ＢＩＮ１は、アルツハイマー病の危険性ともまた関連する（Ｎｏｔｔら、２０１９）、Ｍｙｃ相互作用性タンパク質及び腫瘍抑制因子（Ｅｌｌｉｏｔｔら、１９９９）である。全長ＢＩＮ１及びＭｙｃ結合性ドメイン欠失突然変異体のいずれも、ＨｅＬａ細胞内のＧａｌ４リクルートメントアッセイにおいて、転写を抑制することが既に示されており（Ｅｌｌｉｏｔｔら、１９９９）、ＢＩＮ１酵母ホモログであるｈｏｂ１が、転写の抑制及びヒストンのメチル化と連関した（Ｒａｍａｌｉｎｇａｍ及びＰｒｅｎｄｅｒｇａｓｔ、２００７）ことは、この結果と符合する。加えて、転写因子であるＴＯＸに由来するＨＭＧボックスドメイン及びポリコームの構成要素であるＰＣＧＦ２に由来するｚｆ－Ｃ３ＨＣ４＿２ＲＩＮＧフィンガードメインの抑制活性も検証した（図１８Ｉ及び１８Ｊ）。最後に、ＤＵＦ１０８７は、クロマチンリモデラーであるＣＨＤ内において見出され、そのハイスループット測定値は、スクリーン有意性閾値をわずかに下回った（図１２Ａ）が、ＣＨＤ３ＤＵＦ１０８７を、個別のフローサイトメトリーにより、弱い抑制因子として検証した（図１２Ｂ及び１２Ｃ）。まとめると、これらの結果は、ハイスループットタンパク質ドメインスクリーニングが、初期機能を、ＤＵＦへと割り当て、特徴づけが不完全なドメインの機能の理解を拡張しうることを裏付けた。

［実施例３］
抑制活性が強力なランダム配列
ランダム配列は未だ、抑制活性について調べられていない。驚くべきことに、陰性対照としてデザインされた、８０アミノ酸のランダム配列のうちの１つは、閾値を下回る、低度の発現レベルを有するにもかかわらず、平均ｌｏｇ_２（オフ：オン）を、４．０とする、強力な抑制因子ヒットであった。フローサイトメトリーによる、個別の検証は、この配列が、５日間にわたるリクルートメントの後に、レポーター細胞の集団を、完全にサイレンシングし、ドキシサイクリン除去の後も、２週間以下にわたる、中程度のエピジェネティックメモリーをもたらすことを確認した（図１８Ｋ及び９）。１つさらなるランダム配列は、ヒット閾値をわずかに上回る抑制スコアを示した。

［実施例４］
抑制性ＫＲＡＢドメインは、より近年のタンパク質内において見出される
データは、最大の転写因子ファミリー：ＫＲＡＢドメイン内において、全てのエフェクタードメインの機能を解析する機会をもたらした。ＫＲＡＢ遺伝子ファミリーは、最強の公知の抑制ドメイン（ＺＮＦ１０内のＫＲＡＢなど）の一部を示した。抑制性ＫＲＡＢドメインのサブセットについての先行研究は、これらが、抑制補因子であるＫＡＰ１と相互作用し、ＫＡＰ１が、ＳＥＴＤＢ１及びＨＰ１などのクロマチン調節因子と相互作用することにより転写を抑制しうることを明らかにした（Ｃｈｅｎｇら、２０１４）。しかし、ＫＲＡＢドメインのうちのどれほど多くが抑制因子であり、ＫＡＰ１のリクルートメントが、全てのＫＲＡＢにわたる抑制に必要又は十分であるのかどうかは不明である。

ライブラリーは、３３５のヒトＫＲＡＢドメインを含み、発現良好ドメインについてのフィルタリングの後に、９２．１％を、抑制因子ヒットとして見出した。９つのヒット抑制性ＫＲＡＢドメイン及び２つのヒットなしＫＲＡＢドメインを、フローサイトメトリーにより個別に検証し、あらゆる場合に、これらの類別化を確認した（図１９Ｄ）。次いで、ドメインリクルートメントの結果を、全長ＫＲＡＢタンパク質プルダウンから生成された、既に公表されている免疫沈降質量分析データ（Ｈｅｌｌｅｂｏｉｄら、２０１９）と比較したところ、１つを除く非抑制性ＫＲＡＢの全ては、ＫＡＰ１と相互作用しないタンパク質内にあり（１つの例外的ＫＲＡＢは、発現が低度であった）、ヒット抑制性ＫＲＡＢドメインの全ては、ＫＡＰ１相互作用性であった（ｐ＜１×１０^－９；フィッシャーの正確検定；図２）。さらに、利用可能なＣｈｉＰ－ｓｅｑデータセット及びＣｈＩＰ－ｅｘｏデータセットを解析した（ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０；Ｉｍｂｅａｕｌｔら、２０１７；Ｎａｊａｆａｂａｄｉら、２０１５；Ｓｃｈｍｉｔｇｅｓら、２０１６）ところ、抑制性ＫＲＡＢドメインは、非抑制性ＫＲＡＢドメインと対称的に、ＫＡＰ１と共局在化する、ＫＲＡＢ亜鉛フィンガータンパク質に由来した（図２）。

興味深いことに、抑制性ＫＲＡＢドメインが、大半が、ＫＲＡＢドメイン及び亜鉛フィンガーアレイだけからなる、極めて単純なドメインアーキテクチャーを伴うタンパク質内において見出されたのに対し、非抑制性ＫＲＡＢドメインは、大半が、ＤＵＦ３６６９ドメイン又はＳＣＡＮドメインもまた含む遺伝子内において見出された（図２）。実際、ＤＵＦ３６６９含有遺伝子内において、１つのＫＲＡＢである、ＺＮＦ７８３だけが、抑制因子であった。ＺＮＦ７８３は、亜鉛フィンガーアレイを固有な形において欠く（その名称にもかかわらず）、性質決定されていないＤＵＦ３６６９－ＫＲＡＢ含有遺伝子であり、これが、そのエフェクター機能及び標的へと局在化する、その方式の両方において、この転写因子のクラスの間において、顕著に異なることを示唆する。

ＳＣＡＮ又はＤＵＦ３６６９を含んだ、複合ドメインアーキテクチャーは、進化年代が古いＫＲＡＢ遺伝子内において、より一般的である（Ｉｍｂｅａｕｌｔら、２０１７）。本実施例において、ＫＲＡＢ遺伝子の進化年代と、ＫＲＡＢの抑制強度との間の明確な関係が観察され、有袋類－ヒトに共通の祖先以前に遡る遺伝子に由来するＫＲＡＢドメインは、抑制活性を有さず、この後において進化した遺伝子に由来するＫＲＡＢドメインは、これに符合して、強い抑制因子として機能する（図２）。まとめると、これらの結果は、旧世代の非抑制性ＫＲＡＢ遺伝子に、ＫＡＰ１をリクルートして、ゲノム標的をサイレンシングする、抑制性ＫＲＡＢ遺伝子の、より後世代における大規模な拡大が後続するモデルを裏付ける。

［実施例５］
遺伝子サイレンシングをモジュレートする突然変異を同定する、ＣＲＩＳＰＲｉＺＮＦ１０ＫＲＡＢエフェクターについての高深度突然変異スキャン
ＺＮＦ１０に由来するＫＲＡＢドメインは、遺伝子抑制のための合成生物学適用において、広範に使用されており、ＣＲＩＳＰＲ干渉として公知である、プログラム可能なエピジェネティック／転写制御ツールにおいて、ｄＣａｓ９へと融合している（Ｇｉｌｂｅｒｔら、２０１４）。その配列－機能関係を、よりよく理解するために、ハイスループットリクルートメントを使用して、このＫＲＡＢドメインについての高深度突然変異スキャン（ＤＭＳ）を実施した。全ての可能な単一置換並びに全ての連続二重置換及び三重置換を伴うライブラリーをデザインした（図３）。シーケンシングリードを、明確にアライメントする能力を改善するために、ＤＮＡ配列が、アミノ酸配列より大きな固有性を有するように、可変的コドン使用を使用して、サイレントバーコードを、ドメインのコード配列内に実装した（図３）。図１におけるレポーター及びワークフローを使用して、ハイスループットリクルートメント：５日間にわたるドキシサイクリン誘導並びに５、９及び１３日目における、オン細胞と、オフ細胞との磁性分離を実施した（図２０Ａ及び１０）。これらの測定は、高度に再現可能であり、予測された通り、突然変異の長さが、単一から三重へと増大するのに伴い、有害性を増大させる、一般的傾向を示した（図２０Ｂ及び１０）。さらに、これらの結果を、ＫＲＡＢアミノ酸の保存と比較したところ、保存と、突然変異の有害性との間において、目覚ましい相関が見出された（図３）。同定されたＫＲＡＢ抑制性突然変異体についてのアミノ酸配列及び核酸配列を、表３に示す。各抑制性突然変異体のスコアを、野生型配列についての０と比べて示すと、高スコアは、ＫＲＡＢ転写の抑制の増強を表す。

ＺＮＦ１０ＫＲＡＢエフェクターは、３つの構成要素：ＫＡＰ１への結合に必要であるＡボックス（Ｐｅｎｇら、２００９）、ＫＡＰ１への結合を強化する考えられるＢボックス（Ｐｅｎｇら、２００７）及び天然において、ＫＲＡＢドメインの上流の、別個のエクソン上に見出されるＮ末端伸長部を有する（図３）。Ａボックス内の多数の位置における突然変異は、抑制活性を、野生型配列と比べて、劇的に低下させた（図３）。これらの突然変異のうちのいくつかはＣＯＳ細胞内及び３Ｔ３細胞内におけるＣＡＴリクルートメントアッセイにより、既に調べられており；それらのデータは、Ｋ５６２細胞内の、高深度突然変異スキャンによる測定値と、よく相関した（図３）。ＫＲＡＢＡボックスの突然変異体内における、サイレンシング機能の完全な欠如もまた、個別に検証した（図３）。Ａボックスにわたる突然変異の影響が、周期的であると考えられることは、アルファヘリックスに沿った、これらの残基の角度が、機能的に関与性であることを示唆する（図３）。これらの残基を、サイレンシングに必要な残基であると指定し（ｐ＜１×１０^－５；５日目において、全ての置換の分布を、野生型に対して比較するウィルコクソンランクサム検定）、Ａボックス内の突然変異の影響が大きい、１２の必要な残基と、Ｂボックス内の影響が有意であるが、弱い、１つの残基を見出した（図３）。

これらの置換を、アライメントされたマウスＫＲＡＢＡボックス構造（ＰＤＢ：１ｖ６５：Ａボックス［Ｖ１３～Ｙ５４］内における同一性が５５％であり、類似性が６９％である；図２０Ｃ及び１０）へとマッピングし、必要な残基は、３Ｄ空間内の配向性が同様であることが見出されたことは、結合インターフェースを示唆する（図３及び２０Ｄ；赤色；並びに図１０）。これらの残基は、これらのＡボックス残基１２のうち、１０残基は、必要な残基のうちの１２全てを含有する領域（赤色のＫＲＡＢ－Ｏ残基；図２０Ｃ及び１０）内の、ＺＮＦ１０ＫＲＡＢの１２～７１（５０％の同一性、７５％の類似性）に照らしてアライメントされる、ＫＲＡＢ－Ｏを使用する、以前の組換えタンパク質結合アッセイ（Ｐｅｎｇら、２００９）において、ＫＡＰ１への結合を容易とすることが、実際に示されたので、ＫＡＰ１への結合に重要でありうる。結合に不要であることが既に見出されている、残る８残基のうちの８残基はまた、ＤＭＳにおいても、抑制に不要であった（ｐ＜１×１０^－４；フィッシャーの正確検定；グレーＫＲＡＢ－Ｏ残基；図２０Ｃ及び１０）。５日目におけるＤＭＳサイレンシングスコアを、結合アッセイにおいて使用された、個々の単一アラニン置換、二重アラニン置換及び三重アラニン置換について精査したところ、完全な一致が見出された：結合を剥離させた突然変異はまた、サイレンシングも失効化させ（野生型分布と比較したＺスコア＜－４）、結合に影響を及ぼさない突然変異はまた、サイレンシングにも影響を及ぼさなかった（｜Ｚスコア｜＜０．６）（ｐ＜０．０１；突然変異のｎ＝１２；フィッシャーの正確検定）。この高度の検証率及び３Ｄ構造内のそれらの位置は、ＤＭＳによる、残る１２の、必要なＡボックス残基のうち、２残基（Ｖ４１及びＮ４５）がまた、ＫＡＰ１への結合にも関与しうることを示唆する。

Ａボックスと対称的に、Ｂボックスの突然変異は、リクルートメントの終了時（５日目）において、比較的小さな影響を示し、統計学的に有意な、１つの位置（Ｐ５９）だけが、一貫した影響であるが、弱い影響を示した。他方、Ｐ５９及び他の４つの位置（Ｋ５８、Ｉ６２、Ｌ６５、Ｅ６６）は、９日目に測定された通り、ドキシサイクリン除去の後、メモリーに対する有意な影響を示した（図３）。４つの有意な位置について、個別の検証を実施したところ、ハイスループット実験における通り、Ｂボックスの突然変異体は、リクルートメントの５日後において、強力な遺伝子サイレンサーであったが、ドキシサイクリンの放出後において、メモリーの低減を示した（図３及び２０Ｅ及び１０）。この結果を解釈するために、サイレンシングされた細胞は、「不可逆的サイレント」状態に入る前に、「可逆的サイレント」状態を通過するという、かつて提起された遺伝子サイレンシングモデル（Ｂｉｎｔｕら、２０１６）を検討した。Ｂボックス突然変異体のメモリー低減は、５日目までに不可逆的サイレント状態にコミットする、少数の細胞を結果としてもたらす、中程度のサイレンシング速度低減の結果であることが可能であり、５日目において、可逆的サイレント細胞と、不可逆的サイレント細胞とは、識別不可能であるため、突然変異の、サイレンシング速度に対する影響は遮蔽されたということでありうる。リクルートメント強度を下方に微調整して、この可能性について調べるために、サイレンシングの時間経過を、１００分の１の低用量ドキシサイクリンにより反復した。このレジメにおいて、Ｂボックスの突然変異は、５日目以前に、サイレンシング速度を低減した（図２０Ｅ及び１０）。この結果は、Ｂボックスが、ＫＲＡＢサイレンシング速度に対して、部分的に寄与していることを示す。

最後に、ＫＲＡＢのＮ末端は、多くの置換が、サイレンシングを、野生型と比べて、一貫して増強する残基を含有した（図３；青色；１３日目のパネル）。特に、８位におけるトリプトファンの、ほぼ全ての置換は、１３日目（大半のダイナミックレンジが、野生型を上回るレベルのサイレンシングを検出する時点である）において、野生型と比べた、サイレンシング細胞数の増大をもたらした。これは、サイレンシングを増強するための、唯一の有意な位置であった（図３）。これらの突然変異体のうち、ランク付けが最高度である２つ（ＷＳＲ８ＥＥＥ及びＡＷ７ＥＥ）について、メモリー増強を、高量ドキシサイクリンリクルートメントにより個別に検証した（図３及び２０Ｅ及び１０）。

このサイレンシングの増強は、ＫＲＡＢタンパク質発現レベルの増強の結果でありうる。タンパク質の発現レベルと、ＫＲＡＢのサイレンシング強度との関係について探索するために、ＫＡＰ１結合性ＫＲＡＢドメインのセットについて、ハイスループットＦＬＡＧタグ発現レベル測定値を精査し、１３日目において、ＫＲＡＢの発現レベルと、サイレンシングとの有意な相関を見出した（ｒ^２＝０．４９、図２０Ｆ及び１０）。ＺＮＦ１０ＫＲＡＢが、１３日目において、高度のサイレンシングレベルを示した、他のＫＲＡＢドメインと比較して、発現レベルが低度であったことは、高深度突然変異スキャン結果と、極めて大きく関与し、この結果が、突然変異を介して改善されうることを含意する。とりわけ、Ｎ末端は、極めて保存不良であり（図３）、このことが、ＢＬＡＳＴにより、実際に、ＺＮＦ１０に由来するＫＲＡＢ内において、固有に見出されたことは、Ｎ末端における、安定性を改善する突然変異が、ＫＲＡＢ機能に干渉しそうにないことを示唆する。加えて、ドメイン発現の全体にわたり、発現レベルと負に相関するドメイン内において、高トリプトファン（Ｗ）頻度を観察したのに対し、発現レベルと正に相関するドメイン内において、高グルタミン酸（Ｅ）頻度を観察した（図２０Ｇ及び１０）。このアミノ酸組成の傾向は、ＫＲＡＢの８位からの、トリプトファンの置換による除去が、そのエフェクター機能を増強し、この増強は、グルタミン酸により置換する場合に、最も顕著であったので、Ｎ末端のＫＲＡＢ突然変異体の増強は、発現レベルの改善に起因しうることをさらに示唆した。ＺＮＦ１０ＫＲＡＢ変異体についてのウェスタンブロットは、Ｎ末端のグルタミン酸置換突然変異体が、野生型より高度に発現されることを確認した（図２０Ｈ及び１０）。まとめると、これらの結果は、高深度突然変異スキャンの使用が、ヒト転写抑制因子について、配列を、機能と対比してマッピングし、かつ、発現増強置換を、保存不良位置へと組み込むことにより、エフェクターを改善することを裏付けた。

［実施例６］
ホメオドメイン抑制強度は、Ｈｏｘ遺伝子の編成と共直線性である
スクリーンにおいて、抑制因子ヒットを含んだ、２番目に大きなドメインファミリーは、ホメオドメインファミリーであった。ホメオドメインは、３つのヘリックスから構成され、ヘリックス３を介して、塩基を接触させる、配列特異的ＤＮＡ結合性ドメインである（Ｌｙｎｃｈら、２００６）。場合によって、ホメオドメインはまた、抑制因子として作用することも公知でもある（Ｈｏｌｌａｎｄら、２００７；Ｓｃｈｎａｂｅｌ及びＡｂａｔｅ－Ｓｈｅｎ、１９９６）。ライブラリーは、２１６のヒト遺伝子に由来するホメオドメインを含み、２６％は、抑制因子ヒットであった。抑制因子は、ホメオドメインの１１のサブクラス中４つのサブクラス：ＰＲＤ、ＮＫＬ、ＨＯＸＬ及びＬＩＭにおいて見出された（図１３Ａ）。これらのリクルートメントアッセイ結果は、転写の抑制が、ホメオドメイン転写因子の、遍在的な機能ではないにせよ、広範にわたりうる機能であることを示唆した。

次いで、ＨＯＸＬサブクラスについての結果を、より克明に精査した。このサブクラスは、細胞運命の主要な調節因子であり、胚発生時に、前後軸に沿って、体制領域を指定する、３９のホメオドメイン転写因子のうちのサブセットである、Ｈｏｘ遺伝子を含有した。これらの遺伝子は、前後軸に沿った、それらの発現の時間的順序及び空間的パターン化に対応して、３’から５’へと共直線的に配置された、４つのＨｏｘパラログクラスター（Ａ～Ｄ）内に見出される（Ｇｉｌｂｅｒｔ、１９７１）。興味深いことに、それらのホメオドメインの抑制強度はまた、５’側の遺伝子ホメオドメインほど、強力な抑制因子であるように、Ｈｏｘクラスター内における、それらの配置とも共直線性であった（スピアマンによるρ＝０．８２；図１３Ｂ）。この相関は、ホメオドメイン抑制機能と、Ｈｏｘ遺伝子発現のタイミング及び前後軸に沿った空間的パターン化との、可能な連関を示唆した。

Ｈｏｘホメオドメインの複数の配列アライメントは、１１の最も強力な抑制ドメイン内のＮ末端アームに存在するＲＫＫＲ（配列番号１３３０）モチーフを明らかにした（図１３Ｃ）。ＲＫＫＲモチーフが、塩基の文脈において、最も強力な抑制因子内に存在するのに対し、ランク付けが低位のドメインも、ＲＫＫＲモチーフは欠くが、抑制強度と、正帯電アミノ酸であるアルギニン及びリシンの数との、有意な相関を結果としてもたらす、無秩序Ｎ末端アーム内の一部の塩基をやはり含有した（Ｒ^２＝０．８５、図１３Ｃ～１３Ｅ）。

Ｈｏｘホメオドメインの外部において、Ｐｆａｍ核タンパク質ドメインライブラリー内の抑制因子ヒットのうちの９９．５％が、ＲＫＫＲ（配列番号１３３０）モチーフを含有しなかったのに対し、多くのヒットなしドメインは、ＲＫＫＲモチーフを含有した。また、ドメインの全ライブラリーを検討したところ、５日目における、正味のドメイン電荷と、抑制強度との相関も見られなかった（Ｒ^２＝０．０４）。まとめると、これらの結果は、リクルートメントアッセイにおいて、ＲＫＫＲ（配列番号１３３０）モチーフ及び電荷が、Ｈｏｘホメオドメインの抑制に寄与するが、他のドメインの文脈において見出された場合の抑制には十分でないことを示唆した。

［実施例７］
最小プロモーターへのハイスループットリクルートメントによる、転写活性化因子の発見
弱い最小ＣＭＶ（ｍｉｎＣＭＶ）プロモーターを伴うレポーターＫ５６２細胞系は、ｒＴｅｔＲと、活性化ドメインとの融合体が、リクルートされると活性化されうることが確立された（図１４Ａ）。活性化因子スクリーンを実施するために、レンチウイルスを使用して、核Ｐｆａｍドメインライブラリーを、これらのレポーター細胞へと送達し、ドキシサイクリンにより、４８時間にわたり、ｒＴｅｔＲ媒介リクルートメントを誘導し、細胞（図２１Ａ）を、磁性的に分離し、結果として得られる２つの細胞集団内のドメインをシーケンシングした。各ドメインについて、ビーズ結合集団（オン）内のシーケンシングカウントと、非結合集団（オフ）内のシーケンシングカウントとのエンリッチメント比を、転写活性化強度の尺度として計算し、発現不良陰性対照の平均値を、２標準偏差超えたドメインをヒットとした（図１４Ｂ）。ヒットは、ライブラリー内に存在する、３つの既に公知の転写活性化ドメインファミリー：ＦＯＸＯ１／３／６に由来するＦＯＸＯ－ＴＡＤ、Ｍｙｂ／Ｍｙｂ－Ａに由来するＬＭＳＴＥＮ及びＣＲＴＣ１／２／３に由来するＴＯＲＣ＿Ｃを含んだ。ヒットについての活性化強度の測定値は、個別に形質導入された生物学的反復間において、高度に再現可能であった（ｒ^２＝０．８９、図１４Ｂ）。短鎖核ドメインライブラリーによる、この第２のスクリーンは、ハイスループットリクルートメントが、レポーターのプロモーターを変化させることにより、活性化又は抑制を測定するのに使用されうることを確立した。核Ｐｆａｍドメインライブラリー内において同定された活性化因子についてのアミノ酸配列及び核酸配列を、表２に示すが、低値のスコアは、強力な活性化因子を指し示した。

２６のドメインファミリーに由来する、合計４８のヒットを見出した。上記の、３つの公知の活性化ドメインファミリーを越えると、活性化性ヒットを伴う、残りのファミリーは、Ｐｆａｍ上において、未だ、活性化ドメインとしてアノテーションされていなかった（図１４Ｃ）。全体として、抑制因子より少数の活性化因子を見出したが、これは、単純に、活性化因子が、しばしば、Ｐｆａｍドメインとしてアノテーションされていない、無秩序領域又は低複雑性領域であることが多い（Ｌｉｕら、２００６）ためでありうる。しかし、活性化ドメインを含有するタンパク質は、「転写の正の調節」などの遺伝子オントロジータームについて、有意にエンリッチされ、最も強力なエンリッチメントは、「シグナル伝達」についてであったが、これは、それらの供給源タンパク質のうちの多くが、活性化因子であることを反映する（図２１Ｂ）。さらに、ヒットは、活性化ドメイン内の共通の特性である（Ｍｉｔｃｈｅｌｌ及びＴｊｉａｎ、１９８９；Ｓｔａｌｌｅｒら、２０１８）が、ヒットなしより、有意に酸性度が強かった（ｐ≦１×１０^－５；マンホイットニー検定；図１４Ｄ）。

いくつかのヒットは、古典的活性化ドメインが予測された、配列特異的転写因子を供給源とはせず、活性化補因子と、Ｍｅｄ９、ＴＦＩＩＥβ及びＮＣＯＡ３を含む転写機構タンパク質とに由来する、非古典的活性化因子を供給源とした。特に、そのオーソログが、酵母内の、他のメディエーター複合体構成要素に直接結合する、Ｍｅｄ９ドメイン（Ｔａｋａｈａｓｈｉら、２００９）は、その弱い発現レベルにもかかわらず、平均ｌｏｇ_２（オフ：オン）を、－５．５とする、強い活性化因子であった。非古典的活性化因子は、酵母内において、個別に働くことが、既に報告されている（Ｇａｕｄｒｅａｕら、１９９９）が、哺乳動物細胞内において、個別にリクルートされた場合、弱く働くに過ぎない（Ｎｅｖａｄｏら、１９９９）。１つの例外は、ＴＡＴＡ結合性タンパク質である（Ｄｏｒｒｉｓ及びＳｔｒｕｈｌ、２０００）。より多くの非古典的配列をスクリーニングすることにより、この概念に対する、より多くの例外を見出した。

全ての被験ドメインについて、ライブラリーから伸長した８０アミノ酸の配列及びトリミングされたＰｆａｍアノテーションドメインとの両方を使用して、レポーター遺伝子のドキシサイクリン依存性活性化を確認した（図２１Ｃ）。既にアノテーションされているＦＯＸＯ－ＴＡＤ及びＬＭＳＴＥＮは、それらの伸長形及びトリミング形のいずれにおいても、強い活性化因子であった。転写因子ＥＧＲ３に由来するＤＵＦ３４４６及びＳＷＩ／ＳＮＦファミリーのＳＭＡＲＣＡ２タンパク質に由来し、大部分が性質決定されていない、ＱＬＱドメインの活性化機能もまた確認した。さらに、Ｄｐｙ－３０タンパク質内において見出されたＤＵＦである、Ｄｐｙ－３０モチーフドメインが、弱い活性化因子であることも確認された。Ｄｐｙ－３０は、転写活性クロマチン領域と関連するクロマチンマーク（Ｓｉｍｓら、２００３）である、Ｈ３Ｋ４ｍｅ３と表記される、ヒストンメチルトランスフェラーゼ複合体のコアサブユニット（Ｈｙｕｎら、２０１７）であった。合計１１のヒットドメイン（非古典的ヒットである、Ｍｅｄ９及びＮＣＯＡ３に由来するＮｕｃ＿ｒｅｃ＿ｃｏ－ａｃｔを含む）を調べ、ライブラリーから伸長した８０アミノ酸の配列を使用した場合、全てが、レポーターを、有意に活性化させることを見出した。まとめると、スクリーン及び検証は、不偏核タンパク質ドメインライブラリーが、顕著に異なる機能を伴うドメインを明らかにする、生産的な再スクリーニングが可能であり、古典的活性化ドメインを越える（かつ、ＤＵＦを含む）ドメインの多様なセットが、リクルートされると、転写を活性化させうることを裏付けた。

［実施例８］
ＫＲＡＢ活性化ドメインの発見
驚くべきことに、ライブラリー内の、最も強力な活性化因子は、ＺＮＦ４７３に由来するＫＲＡＢドメインであった（図５Ｂ）。他の３つのＫＲＡＢドメイン（ＺＦＰ２８、ＺＮＦ４９６及びＺＮＦ５９７に由来する）もまた、活性化性ヒットであり、これらの全ては、安定的に発現され、抑制因子ではなかった。ＺＮＦ４９６に由来する、これらのドメインのうちの１つは、ＨＴ１０８０細胞内において個別にリクルートされた場合に、活性化因子として、既に報告されていた（Ｌｏｓｓｏｎ及びＮｉｅｌｓｅｎ、２０１０）。興味深いことに、ＺＦＰ２８は、２つのＫＲＡＢドメインを含有するが、ＫＲＡＢ＿１は、抑制因子であり、ＫＲＡＢ＿２は、活性化因子であった。全長ＺＦＰ２８に対して実施された、既存のアフィニティー精製／質量分析は、抑制性タンパク質及び活性化性タンパク質の両方との、有意な相互作用を同定した（Ｓｃｈｍｉｔｇｅｓら、２０１６）。活性化性ＫＲＡＢドメインは、非活性化性ＫＲＡＢより、有意に強く酸性であった（ｐ＝０．０１、マンホイットニー検定、図１４Ｄ）。配列解析は、活性化性ＫＲＡＢドメインが、互いに対する相同性を共有する一方、コンセンサスのＫＲＡＢ配列から分岐的であり、変異体ＫＲＡＢサブクラスターを形成することを示した（図１４Ｅ）。既存の系統発生的解析は、変異体ＫＲＡＢクラスターを、ＫＡＰ１への結合の欠如及び進化年代の古さと連関させた（Ｈｅｌｌｅｂｏｉｄら、２０１９）。より具体的に、活性化性ＫＲＡＢ供給源タンパク質のうちの２つ（ＺＮＦ４９６及びＺＮＦ５９７）は、共免疫沈降質量分析により、既に調べられたが、ＫＡＰ１と相互作用することは見出されなかった（Ｈｅｌｌｅｂｏｉｄら、２０１９）。

ライブラリー内において使用されたＫＲＡＢドメインを中心とする、同じ８０アミノ酸の配列を使用して、ＺＮＦ４７３に由来するＫＲＡＢが、強力な活性化因子であり、ＺＦＰ２８に由来するＫＲＡＢ＿２が、強度が中程度の活性化因子であることが個別に検証された（図１４Ｆ）。さらに、ＺＮＦ４７３からトリミングされた、４１アミノ酸のＫＲＡＢが、強力な活性化のために十分であるのに対し、ＺＦＰ２８からトリミングされた、３７アミノ酸のＫＲＡＢ＿２は、活性化させなかったことは、周囲の配列の一部が、活性化に要求されたことを含意する（図２１Ｃ）。次いで、利用可能なＣｈｉＰ－ｓｅｑデータセット及びＣｈＩＰ－ｅｘｏデータセットを精査したところ、（ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０；Ｉｍｂｅａｕｌｔら、２０１７；Ｎａｊａｆａｂａｄｉら、２０１５；Ｓｃｈｍｉｔｇｅｓら、２０１６）抑制性ＺＮＦ１０と対称的に、ＺＮＦ４７３は、活性クロマチンマークである、Ｈ３Ｋ２７ａｃと共局在化することが見出された（図１４Ｇ）。手作業により精査したところ、遺伝子（ＣＡＳＣ３、ＳＴＡＴ６、ＷＡＳＦ２、ＺＫＳＣＡＮ２）の転写開始部位及びｌｎｃＲＮＡ（ＬＩＮＣ００４３１）の近傍において、最も著明なＺＮＦ４７３ピークを見出した。一方、ＺＦＰ２８は、Ｈ３Ｋ２７ａｃと共局在化しなかったが、これはおそらく、そのＫＡＰ１結合性抑制性ＫＲＡＢ＿１ドメインが、一般に、強度が中程度である、その活性化性ＫＲＡＢ＿２ドメインを上回る、主要なエフェクターであったことを指し示す。これらの個々のＫＲＡＢタンパク質を越えて検討すると、抑制性ＫＲＡＢを含有する亜鉛フィンガータンパク質が、Ｈ３Ｋ２７ａｃと共局在化しなかったのに対し、群としての非抑制性ＫＲＡＢタンパク質は、共局在化ピークを、確かに含んだ（図１４Ｇ）。まとめると、結果は、変異体ＫＲＡＢタンパク質が、機能的に多様であり、場合により、転写活性化因子としても機能することを裏付ける。

［実施例９］
タイリングライブラリーは、核タンパク質の、非アノテーション領域内のエフェクタードメインを明らかにする
Ｐｆａｍアノテーションは、核プロテオームをフィルタリングして、比較的コンパクトなライブラリーを作出する、１つの有用な手段をもたらしたが、Ｐｆａｍは、現在のところ、ヒトエフェクタードメインのうちの多くを逸失する可能性が高い。タンパク質の非アノテーション領域内において、エフェクタードメインを発見するために、サイレンサー複合体に由来する２３８のタンパク質のリストをキュレーションし、それらの配列を、１０アミノ酸のタイリングウィンドウにより隔てられた、８０アミノ酸によりタイリングすることにより、タイリングライブラリーをデザインした（図１５Ａ）。強力なｐＥＦレポーターへのハイスループットリクルートメントを実施し、５日間にわたるドキシサイクリンの後に、サイレンシングを測定する時点を設定し、１３日目（ドキシサイクリンを放出した８日後）に、再度、エピジェネティックメモリーを測定する時点を設定した（図２２Ａ）。タイルのうちの４．３％は、５日目において、ヒットとして評定され（図１５Ｂ）それらの抑制強度測定は、再現可能であった（ｒ^２＝０．７２、図２２Ｂ）。まとめると、タイリングスクリーンは、タンパク質２３８例中１４１例において、短鎖抑制ドメインを見出した。これらのヒットのうちの一部は、アノテーションドメインに重複する陽性対照を含む：例えば、ＺＮＦ５７及びＺＮＦ４６１をタイリングすることにより、これらの転写因子のＫＲＡＢドメインを、抑制性エフェクターとして同定したが、配列の残りの部分は、抑制性エフェクターとして同定しなかった（図２２Ｃ）。同様に、タイリング戦略は、Ｐｆａｍによりアノテーションされた、ＲＹＢＰ抑制性ドメインを同定し、個別の検証においても、８０アミノ酸のタイル及び３２アミノ酸Ｐｆａｍドメインのいずれもが、同様の強度及びエピジェネティックメモリーを伴って、サイレンシングした（図２２Ｄ）。ＲＥＳＴ（ＣｏＲＥＳＴ結合性ドメインと重複する（Ｂａｌｌａｓら、２００１））、ＤＮＭＴ３ｂ（ＤＮＭＴ１結合性ドメイン及びＤＮＭＴ３ａ結合性ドメインと重複する（Ｋｉｍら、２００２））及びＣＢＸ７（ＰＲＣ１をリクルートするＰｃＢｏｘと重複する（Ｌｉら、２０１０））における抑制因子もまた、同定及び検証した（図２２Ｅ～２２Ｇ）。タイリングヒットについての、別のカテゴリーは、Ｐｆａｍ内のドメインとしてアノテーションされていなかったが、文献において、それらの抑制機能についての以前の報告が見出された。例えば、ＣＴＣＦのアミノ酸１２１～２２０は、スクリーンにおいて、強い抑制機能を有し、個別に検証したところ（図１５Ｃ及び１５Ｅ）、ＨｅＬａ細胞、ＨＥＫ２９３細胞及びＣＯＳ－７細胞における、以前のリクルートメント研究と符合した（Ｄｒｕｅｐｐｅｌら、２００４）。まとめると、これらの結果は、タンパク質タイルのハイスループットリクルートメントが、真正の抑制性ドメインを同定する有効な戦略であることを確立した。タイリングライブラリーにおいて同定された抑制因子についてのアミノ酸配列を、表４に示すが、高スコアは、高度の抑制を指し示す。

アノテーションされていない、新規の抑制ドメインもまた、発見した。例えば、ＢＡＺ２Ａ（また、ＴＩＰ５としても公知である）は、一部のｒＤＮＡの転写サイレンシングを媒介する、核リモデリング複合体（ＮｏＲＣ）の構成要素である（Ｇｕｅｔｇら、２０１０）が、アノテーションエフェクタードメインを有さない。ＢＡＺ２Ａについてのタイリングデータは、グルタミンリッチ領域内の抑制機能のピークを示したが、強度が中程度である抑制因子として、個別に検証された（図１５Ｄ及び１５Ｅ）。抑制性タイルは、３つのＴＥＴＤＮＡデメチラーゼ（ＴＥＴ１／２／３）の非アノテーション領域内に見出された。予測外に、抑制因子タイルはまた、対照タンパク質であるＤＭＤ内においても同定されたが、これは、フローサイトメトリーにより検証された（図２２Ｈ）。

Ｅ－ボックスモチーフにおいてゲノムに結合し、非カノニカルのポリコーム１．６複合体をリクルートすることにより、転写を抑制すると考えられる（Ｂｌａｃｋｌｅｄｇｅら、２０１４；Ｊｏｌｍａら、２０１３；Ｓｔｉｅｌｏｗら、２０１８）ＭＧＡ内において、タイリング実験は、抑制機能を伴い、２つの公知のＤＮＡ結合性ドメインに隣接して配置され、本明細書において、抑制因子１及び抑制因子２と呼ばれた、２つのドメインを明らかにした（図１５Ｆ）。これらの抑制ドメインを、個別に検証し、顕著に異なるサイレンシング動態及びメモリーの程度を観察した；第１のドメイン（アミノ酸３４１～４２０）が、緩徐なサイレンシングの反面、強いメモリーを特徴としたのに対し、第２のドメイン（アミノ酸２３８１～２４６０）は、急速なサイレンシングの反面、高速の再活性化を伴う、弱いメモリーを特徴とした（図１５Ｇ）。これらは、ｎｃＰＲＣ１．６サイレンシング複合体内のタンパク質から単離された、第１のエフェクタードメインであると考えられる。

次いで、抑制機能を示すタンパク質領域をカバーする、全てのタイル内の重複を検討し、どのアミノ酸連続配列が、全ての抑制性タイル内に存在するのかを決定することにより、各非依存性ドメイン内の抑制機能に必要最小限の配列を同定しようと試みた（図１５Ｈ）。この手法を使用して、ＭＧＡについての、２つの候補最小化エフェクタードメイン：いずれもが、ＣｏｎＳｕｒｆにより予測された機能的露出残基を伴い、保存領域内において重複した、１０アミノ酸のＭＧＡ配列［３８１～３９０］と、３０アミノ酸のＭＧＡ配列［２４３１～２４６０］とを生成した。個別の検証実験は、いずれの最小化候補配列も、レポーターを、効率的にサイレンシングしうることを裏付けた（図１５Ｉ）。

材料及び方法
細胞株及び細胞培養
全ての実験は、Ｋ５６２細胞（ＡＴＣＣＣＣＬ－２４３）において行った。細胞を、１０％のＦＢＳ（Ｈｙｃｌｏｎｅ）、ペニシリン（１０，０００Ｉ．Ｕ．／ｍＬ）、ストレプトマイシン（１０，０００ｕｇ／ｍＬ）及びＬ－グルタミン（２ｍＭ）で補充されたＲＰＭＩ１６４０（Ｇｉｂｃｏ）培地中、３７℃及び５％のＣＯ_２の制御された加湿インキュベーターにおいて培養した。ＨＥＫ２９３ＦＴ細胞及びＨＥＫ２９３Ｔ－ＬｅｎｔｉＸ細胞を、１０％のＦＢＳ（Ｈｙｃｌｏｎｅ）、ペニシリン（１０，０００Ｉ．Ｕ．／ｍＬ）及びストレプトマイシン（１０，０００ｕｇ／ｍＬ）で補充されたＤＭＥＭ（Ｇｉｂｃｏ）培地中で成長させ、レンチウイルスを産生させるために使用した。レポーター細胞株を、以下の通り、ＴＡＬＥＮ媒介相同性指向修復によって作出して、ＡＡＶＳ１遺伝子座にドナー構築物を組み込んだ。１．２×１０^６個のＫ５６２細胞を、１０００ｎｇのレポータードナープラスミド、並びに５００ｎｇの各ＴＡＬＥＮ－Ｌ（Ａｄｄｇｅｎｅ＃３５４３１）及びＴＡＬＥＮ－Ｒ（Ａｄｄｇｅｎｅ＃３５４３２）プラスミド（それぞれ、意図するＤＮＡ切断部位の上流及び下流を標的にする）を有するＡｍａｘａ溶液（ＬｏｎｚａＮｕｃｌｅｏｆｅｃｔｏｒ２ｂ、設定Ｔ０－１６）中で電気穿孔した。７日後、細胞を、１０００ｎｇ／ｍＬのピューロマイシン抗生物質により５日間にわたり処理して、ドナーが意図される遺伝子座に安定に組み込まれた集団について選択し、これは、ＰｕｒｏＲ耐性遺伝子を発現するプロモーターを提供する。蛍光レポーター発現を、顕微鏡法によって、及びフローサイトメトリー（ＢＤＡｃｃｕｒｉ）によって測定した。

核タンパク質Ｐｆａｍドメインライブラリーデザイン
ＵｎｉＰｒｏｔデータベース（ＵｎｉＰｒｏｔＣｏｎｓｏｒｔｉｕｍ、２０１５）に、核を局在化し得るヒト遺伝子についてクエリを行った。ＵｎｉＰｒｏｔにおける細胞内位置情報を、公開から、又は類似の遺伝子（例えば、オルソログ）においてのみ公開が存在する場合に「類似性によって」、決定し、手動でレビューした。次いで、Ｐｆａｍアノテーションドメインを、ＰｒｏＤｙｓｅａｒｃｈＰｆａｍ機能（Ｂａｋａｎら、２０１１）を使用して探索した。８０アミノ酸又はそれよりも短いドメインをフィルター処理し、非常に豊富で反復性のＣ２Ｈ２亜鉛フィンガーＤＮＡ結合ドメインを、排除し、転写エフェクターとしての機能は予想されなかった。アノテーションドメインの配列を検索し、それを、合計８０アミノ酸に到達するまでいずれかの側鎖において伸長させた。重複配列を除去し、次いで、コドン最適化をヒトコドン使用について行い、ＢｓｍＢＩ部位を除去し、ＧＣ含有量を５０ヌクレオチドウィンドウごとに２０％～７５％に制限した（ＤＮＡチゼル（Ｚｕｌｋｏｗｅｒ及びＲｏｓｓｅｒ、２０２０）により行った）。終止コドンを欠く８０アミノ酸の４９９のランダム対照を、対照として、コンピューターで作出した。ＤＭＤが転写調節因子であると思われなかったので、１０アミノ酸スライディングウィンドウを有する８０アミノ酸タイルにおいてＤＭＤタンパク質をタイリングした３６２エレメントも、対照として含めた。合計で、ライブラリーは、５，９５５エレメントからなる。

サイレンサータイリングライブラリーデザイン
転写サイレンシングに関与する２１６タンパク質を、転写調節因子のデータベース（Ｌａｍｂｅｒｔｆら、２０１８）から精選した。転写サイレンシングに関与する可能性がある３２タンパク質を手動で加え、次いで、不偏性タンパク質タイリングライブラリーを作出した。これを行うために、各遺伝子についてのカノニカルの転写物を、ＰｙｔｈｏｎＡＰＩを使用して、ＥｎｓｅｍｂｌＢｉｏＭａｒｔ（Ｋｉｎｓｅｌｌａら、２０１１）から検索した。カノニカルの転写物が見出されなかった場合、ＣＤＳを有する最も長い転写物を検索した。コード配列を、タイル間で、１０アミノ酸スライディングウィンドウを有する８０アミノ酸のタイルに分割した。各遺伝子について、Ｃ末端領域がライブラリーに含まれるように、最後の残基の８０アミノ酸上流からその最後の残基に及ぶ最終タイルを含めた。重複タンパク質配列を除去し、コドン最適化をヒトコドン使用について行い、ＢｓｍＢＩ部位を除去し、ＧＣ含有量を５０ヌクレオチドウィンドウごとに２０％～７５％に制限した（ＤＮＡチゼル（Ｚｕｌｋｏｗｅｒ及びＲｏｓｓｅｒ、２０２０）により行った）。３６１タイリング陰性対照を、以前のライブラリーデザインにおけるように含め、合計で１５，７３７ライブラリーエレメントを得た。

ＫＲＡＢ高深度突然変異スキャンライブラリーデザイン
ＣＲＩＳＰＲｉ（Ｇｉｌｂｅｒｔら、２０１４）において使用されるＺＮＦ１０ＫＲＡＢドメイン配列の高深度突然変異スキャンを、全ての可能な単一置換及び同じアミノ酸の全ての連続した二重及び三重置換（例えば、ＡＡＡによる置換）を用いてデザインした。これらのアミノ酸配列を、各ＤＮＡ配列が置換された残基を超えていくつかの変動を含有するように、確率コドン最適化アルゴリズムを使用して、ＤＮＡ配列に逆翻訳し、これは、一意的なライブラリーメンバーに対してシーケンシングリードを明確に整列させる能力を改善する。加えて、ＩｎｔｅｒＰｒｏにおいて見出されるヒトＫＲＡＢ由来の全てのＰｆａｍアノテーションＫＲＡＢドメインを、以前の核Ｐｆａｍドメインライブラリーにおけるのと類似して、含めた。以前のタイリングライブラリーにおいてデザインされたタイリング配列も、５個のＫＲＡＢ亜鉛フィンガー遺伝子のために含まれた。３００ランダム対照配列及びＤＭＤ遺伝子由来の２００タイルを、陰性対照として含めた。コドン最適化時に、ＢｓｍＢＩ部位は除去され、ＧＣ含有量を８０ヌクレオチドウィンドウごとに３０％～７０％に制限した（ＤＮＡチゼル（Ｚｕｌｋｏｗｅｒ及びＲｏｓｓｅｒ、２０２０）により行った）。合計のライブラリーサイズは、５，７３１エレメントであった。

ドメインライブラリークローニング
最高で３００ヌクレオチドまでの長さのオリゴヌクレオチドを、プールライブラリー（ＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅｓ）として合成し、次いで、ＰＣＲ増幅した。６×５０ｕｌの反応を、混入ＤＮＡの増幅を回避するために、クリーンＰＣＲフードにおいてセットした。各反応について、５ｎｇの鋳型、０．１μｌの各１００μＭのプライマー、１μｌのＨｅｒｃｕｌａｓｅＩＩポリメラーゼ（Ａｇｉｌｅｎｔ）、１μｌのＤＭＳＯ、１μｌの１０ｎＭのｄＮＴＰ及び１０μｌの５×Ｈｅｒｃｕｌａｓｅ緩衝液を使用した。サーモサイクリングプロトコールは、９８℃で３分、次いで、９８℃で２０秒間、６１℃で２０秒間、７２℃で３０秒間、次いで、７２℃で３分間の最終ステップのサイクルであった。デフォルトのサイクル数は２９回であり、これを各ライブラリーについて最適化して、ゲル抽出のためのきれいな可視生成物をもたらす最も少ないサイクルを見出した（実際には、２５サイクルが最小であった）。ＰＣＲ後、得られたｄｓＤＮＡライブラリーを、２％のＴＢＥゲルの≧４レーンにローディングし、予想される長さ（３００ｂｐ周辺）でバンドを切り取り、ＱＩＡｇｅｎゲル抽出キットを使用することによって、ゲル抽出した。ライブラリーを、４×１０μｌのＧｏｌｄｅｎＧａｔｅ反応（７５ｎｇの消化前のゲル抽出された骨格プラスミド、５ｎｇのライブラリー、０．１３μｌのＴ４ＤＮＡリガーゼ（ＮＥＢ、２００００Ｕ／μｌ）、０．７５μｌのＥｓｐ３Ｉ－ＨＦ（ＮＥＢ）及び１μｌの１０×Ｔ４ＤＮＡリガーゼ緩衝液）による３７℃での３０サイクルの消化により、レンチウイルスリクルートメントベクターｐＪＴ０５０にクローニングし、各々５分間にわたり１６℃でライゲーションし、それに続いて、３７℃での最後の５分の消化、次いで７０℃での２０分の熱失活を行った。次いで、反応をプールし、ＭｉｎＥｌｕｔｅカラム（ＱＩＡｇｅｎ）により精製し、６ｕｌのｄｄＨ２Ｏで溶出させた。チューブあたり２μｌを、製造業者の説明書に従って、２つのチューブの５０μｌのエレクトロコンピテントセル（ＬｕｃｉｇｅｎＤＵＯ）に形質転換した。回収後、細胞を、カルベニシリンを有する３～７の大型１０インチ×１０インチＬＢプレートに蒔いた。３７℃での終夜成長後、細菌コロニーを、収集ボトルにかき集め、プラスミドプールを、ＨｉＳｐｅｅｄＰｌａｓｍｉｄＭａｘｉｐｒｅｐキット（ＱＩＡｇｅｎ）により抽出した。２～３の小型プレートを、コロニーをカウントするために希釈された形質転換細胞と並行して調製し、形質転換効率が少なくとも３０×ライブラリーカバレッジを維持するのに十分であったかを確認した。ライブラリーの品質を決定するために、ドメインを、プラスミドプールから、及び元のオリゴプールから、Ｉｌｌｕｍｉｎａアダプターを含む伸長を有するプライマーを用いるＰＣＲによって増幅し、シーケンシングした。ＰＣＲ及びシーケンシングのプロトコールは、これらのＰＣＲが１０ｎｇのインプットＤＮＡ及び１７サイクルを使用する以外は、ゲノムＤＮＡからのシーケンシングについて下記に記載されるものと同じであった。これらのシーケンシングデータを、下記に記載されるようにして解析して、カバレッジの均一性及びライブラリーの合成品質を決定した。加えて、形質転換からの２０～３０コロニーを、サンガーシーケンシング（Ｑｕｉｎｔａｒａ）して、クローニング効率及びプール中の空骨格プラスミドの割合を推定した。

抑制因子活性を測定するためのハイスループットリクルートメント
大スケールのレンチウイルス産生及びＫ５６２細胞のスピンフェクションを行った。ライブラリーをＫ５６２細胞に感染させるのに十分なレンチウイルスを作出するために、ＨＥＫ２９３Ｔ細胞を、４つの１５ｃｍ組織培養プレートに蒔いた。各プレートにおいて、９×１０５個のＨＥＫ２９３Ｔ細胞を、３０ｍＬのＤＭＥＭに蒔き、終夜成長させ、次いで、５０μｌのポリエチレンイミン（ＰＥＩ、Ｐｏｌｙｓｃｉｅｎｃｅｓ＃２３９６６）を使用して、８μｇの３つの第三世代パッケージングプラスミドの等モル混合物及び８μｇのｒＴｅｔＲ－ドメインライブラリーベクターによりトランスフェクトした。インキュベーションの４８時間及び７２時間後、レンチウイルスを採取した。プールされたレンチウイルスを、０．４５μｍのＰＶＤＦフィルター（Ｍｉｌｌｉｐｏｒｅ）を通して濾過して、任意の細胞残屑を除去した。核Ｐｆａｍドメイン抑制因子スクリーンのために、４．５×１０^７個のＫ５６２レポーター細胞に、感染の２連の別々の生物学的反復を用いて、２時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を３日間にわたり成長させ、次いで、細胞をブラストサイジン（１０μｇ／ｍＬ、Ｓｉｇｍａ）により選択した。感染及び選択の効率を、ｍＣｈｅｒｒｙ（ＢＤＡｃｃｕｒｉＣ６）を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり合計で少なくとも１．５×１０^８個細胞を残すとともに、細胞濃度を元の５×１０^５個細胞／ｍＬに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり＞２５，０００個細胞であった（不完全なブラストサイジン選択、ライブラリー調製、及びライブラリー合成エラーからの損失を補償する非常に高いカバレッジレベル）。感染後６日目に、リクルートメントを、１０００ｎｇ／ｍｌのドキシサイクリン（ＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）により細胞を５日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理ＲＰＭＩ培地中でさらに８日間にわたり維持し、ドキシサイクリンの添加から最長で１３日目に、カウントした。２．５×１０^８個細胞を、各時点（５日目、９日目及び１３日目）に測定のために採取した。プロトコールは、ＫＲＡＢＤＭＳについてと同様であったが、ドキシサイクリンを感染後８日目に添加し、＞１２，５００×カバレッジで、２×１０^８～２．２×１０^８個細胞を各時点で採取した。プロトコールは、タイリングスクリーンについてと同様であったが、９．６×１０^７個細胞を感染させ、ドキシサイクリンを感染後８日目に添加し、少なくとも２×１０^８個細胞を、＞１２，５００×カバレッジのために各継代で維持し、２×１０^８～２．７×１０^８個細胞を各時点で採取した。

転写活性化の活性を測定するためのハイスループットリクルートメント
核Ｐｆａｍドメイン活性化因子スクリーンのために、ｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）－３ＸＦＬＡＧベクターにおける核Ｐｆａｍライブラリーのためのレンチウイルスを、レポータースクリーンに関して作出し、３．８×１０^７個のＫ５６２－ｐＤＹ３２ｍｉｎＣＭＶレポーター細胞に、感染の２連の別々の生物学的反復を用いて、２時間にわたるスピンフェクションによってレンチウイルスライブラリーを感染させた。感染細胞を２日間にわたり成長させ、次いで、細胞をブラストサイジン（１０μｇ／ｍＬ、Ｓｉｇｍａ）により選択した。感染及び選択の効率を、ｍＣｈｅｒｒｙ（ＢＤＡｃｃｕｒｉＣ６）を測定するフローサイトメトリーを使用して、毎日にモニターした。細胞を、スピナーフラスコにおいて、複製あたり少なくとも１×１０^８個の合計細胞を残すとともに、細胞濃度を元の５×１０^５個細胞／ｍＬに希釈することによって毎日対数成長条件を維持し、その結果、最も低い維持カバレッジは、ライブラリーエレメントあたり＞１８，０００個細胞であった。感染後７日目に、リクルートメントを、１０００ｎｇ／ｍｌのドキシサイクリン（ＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）により細胞を２日間にわたり処理することによって誘導し、次いで、細胞を、ドキシサイクリン及びブラストサイジンからスピンダウンし、非処理ＲＰＭＩ培地中でさらに４日間にわたり維持した。２×１０^８個細胞を、２日目の時点で測定のために採取した。フローサイトメトリーによるシトリン陽性細胞の非存在によって決定されるように、ドキシサイクリン除去後４日目に活性化メモリーの証拠はなく、その結果、さらなる時点で収集しなかった。

レポーター細胞の磁気分離
各時点で、細胞を、３００×ｇで５分間にわたりスピンダウンして、培地を吸引した。次いで、細胞を、同じ体積のＰＢＳ（Ｇｉｂｃｏ）に再懸濁させ、スピンダウン及び吸引を繰り返して、細胞を洗浄し、血清から任意のＩｇＧを除去した。Ｄｙｎａｂｅａｄｓ（商標）Ｍ－２８０プロテインＧ（ＴｈｅｒｍｏＦｉｓｈｅｒ１０００３Ｄ）を、３０秒間にわたるボルテックスによって再懸濁させた。２×１０^８個細胞あたり、５０ｍＬのブロッキング緩衝液を、１グラムの無ビオチンＢＳＡ（ＳｉｇｍａＡｌｄｒｉｃｈ）及び２００μｌの０．５ＭｐＨ８．０ＥＤＴＡ（ＴｈｅｍｏＦｉｓｈｅｒ１５５７５０２０）をＤＰＢＳ（Ｇｉｂｃｏ）に添加すること、０．２２μｍフィルター（Ｍｉｌｌｉｐｏｒｅ）による真空濾過、及び氷上での保持によって、調製した。６０μｌのビーズを、２００μｌのビーズあたり１ｍＬの緩衝液を添加し、５秒間にわたりボルテックスし、磁気チューブラック（Ｅｐｐｅｎｄｏｒｆ）上に蒔き、１分間待ち、上清を除去し、最後にビーズを磁石から除去し、初期の６０μｌのビーズあたり１００～６００μｌのブロッキング緩衝液に再懸濁させることによって、全て１×１０^７個細胞について調製した。ＫＲＡＢＤＭＳのみについて、３０μｌのビーズを、同じ方法で、全て１×１０^７個細胞について調製した。ビーズを、１００μｌの再懸濁ビーズあたり１×１０^７個細胞以下で細胞に添加し、次いで、３０分間にわたり揺り動かしながら、室温でインキュベートした。２×１０^８個細胞を有する試料について、１５ｍＬのＦａｌｃｏｎチューブ及び大型磁気ラックにおいて、１．２ｍＬのビーズを使用し、１２ｍＬのブロッキング緩衝液に再懸濁させた。＜５×１０^７個細胞を有する試料について、非スタックＡｍｂｉｏｎ１．５ｍＬチューブ及び小型磁気ラックを使用した。インキュベーション後、ビーズ及び細胞混合物を、＞２分間にわたり磁気ラックに置いた。未結合上清を、新しいチューブに移し、再び＞２分間にわたり磁石上に置いて、任意の残ったビーズを除去し、次いで、上清を移し、未結合画分として保存した。次いで、ビーズを、同じ体積のブロッキング緩衝液に再懸濁させ、磁気的に再度分離し、上清を廃棄し、ビーズを有するチューブを、結合画分として保持した。結合画分を、ブロッキング緩衝液又はＰＢＳに再懸濁させて、細胞を希釈した（未結合画分は既に希釈されている）。フローサイトメトリー（ＢＤＡｃｃｕｒｉ）を、各画分のごく一部を使用して行って、各画分中の細胞数を推定し（ライブラリーカバレッジが維持されるのを確実にするため）、シトリンレポーターレベルに基づいて分離を確認した（結合画分は、＞９０％シトリン陽性であるはずであるが、未結合画分は、レポーターレベルの初期分布に応じてより変動する）。最後に、試料をスピンダウンし、ペレットを、ゲノムＤＮＡ抽出まで－２０℃で凍結させた。

ドメイン融合タンパク質発現レベルのハイスループット測定
発現レベル測定を、３×ＦＬＡＧタグ付け核Ｐｆａｍドメインライブラリーに感染したＫ５６２－ｐＤＹ３２細胞（シトリンオフを有する）において行った。生物学的反復あたり１×１０^８個細胞を、ブラストサイジン選択（１０μｇ／ｍＬ、Ｓｉｇｍａ）の５日後に使用し、これは、感染７日後であった。１×１０^６個の対照Ｋ５６２－ＪＴ０３９細胞（シトリンオン、レンチウイルス感染なし）を、各反復に添加した。固定緩衝液Ｉ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ、ＢＤＢ５５７８７０）を、３７℃で１５分間にわたり予熱し、透過処理緩衝液ＩＩＩ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ、ＢＤＢ５５８０５０）、及び１０％のＦＢＳ（Ｈｙｃｌｏｎｅ）を有するＰＢＳ（Ｇｉｂｃｏ）を氷上で冷やした。ドメインを発現する細胞のライブラリーを収集し、細胞密度を、フローサイトメトリー（ＢＤＡｃｃｕｒｉ）によってカウントした。固定のために、細胞を、１００万個細胞あたり２０μｌで、３７℃で１０～１５分間にわたり、ペレット体積に対応する体積の固定緩衝液Ｉ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ、ＢＤＢ５５７８７０）に再懸濁させた。細胞を、１ｍＬの１０％のＦＢＳを含有する冷ＰＢＳで洗浄し、５００×ｇで５分間にわたりスピンダウンし、次いで、上清を吸引した。細胞を、１００万個細胞あたり２０μｌで、ゆっくりと添加し、ボルテックスすることによって混合した冷ＢＤ透過処理緩衝液ＩＩＩ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ、ＢＤＢ５５８０５０）を使用して、氷上で３０分間にわたり透過処理した。次いで、細胞を、これまでのように１ｍｌのＰＢＳ＋１０％のＦＢＳ中で２回洗浄し、次いで、上清を吸引した。抗体染色を、α－ＦＬＡＧ－Ａｌｅｘａ６４７（ＲＮＤｓｙｓｔｅｍｓ、ＩＣ８５２９Ｒ）の５μｌ／１×１０^６個細胞を使用して、光から保護して、室温で１時間にわたり行った。細胞を、洗浄し、ＰＢＳ＋１０％のＦＢＳに３×１０^７個細胞の濃度で再懸濁させた。細胞を、ｍＣｈｅｒｒｙ陽性生存細胞についてゲートをかけた後、ＡＰＣ－Ａ蛍光（ＳｏｎｙＳＨ８００Ｓ）のレベルに基づいて２つのビンに分取した。少数の未染色対照細胞も、ソーターにおいて解析して、染色がバックグラウンドを上回ったかを確認した。シトリン陽性細胞の急増を使用して、３×ＦＬＡＧタグを欠いていることが公知の細胞における染色のバックグラウンドレベルを評価し、分取のためにゲートをかけることで、そのレベルの上に導いた。分取後、細胞カバレッジは、試料にわたるライブラリーエレメントあたり３３６～１，２９５個細胞の範囲であった。分取された細胞を、５００×ｇで５分間にわたりスピンダウンし、次いで、ＰＢＳに再懸濁させた。ゲノムＤＮＡ抽出を、製造業者の説明書に従って、プロテイナーゼＫ＋ＡＬ緩衝液インキュベーションを５６℃で終夜行ったという１つの改変を伴って、行った（ＱＩＡｇｅｎＢｌｏｏｄＭａｘｉキットを、＞１×１０^７個細胞を有する試料のために使用し、ＱＩＡａｍｐＤＮＡＭｉｎｉキットと最高で５×１０^６個細胞あたり１カラムを、≦１×１０^７個細胞を有する試料のために使用した）。

ライブラリー調製及びシーケンシング
ゲノムＤＮＡを、カラムあたり最高で１．２５×１０^８個細胞を用いて、Ｂｌｏｏｄ＆Ｔｉｓｓｕｅキット（ＱＩＡｇｅｎ）を使用して、製造業者の説明書に従って、抽出した。サブシーケンスＰＣＲ阻害を回避するために、ＤＮＡは、ＡＥではなくＥＢで溶出させた。ドメイン配列を、伸長としてＩｌｌｕｍｉｎａアダプターを含有するプライマーによるＰＣＲによって増幅した。テストＰＣＲを、５０μｌ（半分のサイズ）の反応において５μｇのゲノムＤＮＡを使用して行って、ＰＣＲ条件が、各試料について予想されるサイズで可視バンドをもたらすかを検証した。次いで、１２～２４×１００μｌの反応を、各実験において利用可能なゲノムＤＮＡの量に応じた反応の数で、氷上にセットした（混入ＤＮＡの増幅を回避するためにクリーンＰＣＲフード中）。１０μｇのゲノムＤＮＡ、０．５μｌの各１００μＭのプライマー、及び５０μｌのＮＥＢｎｅｘｔ２×ＭａｓｔｅｒＭｉｘ（ＮＥＢ）を、各反応において使用した。サーモサイクリングプロトコールは、９８℃へのサーモサイクラーの予熱、次いで９８℃で３分にわたり試料を添加し、次いで、９８℃で１０秒間、６３℃で３０秒間、７２℃で３０秒間、次いで、７２℃で２分間の最終ステップの３２回のサイクルであった。全てのその後のステップは、ＰＣＲフード外で行った。ＰＣＲ反応物をプールし、≧１４０μｌを、１００ｂｐのラダーと並行して２％のＴＢＥゲルの少なくとも３つのレーンにおいて、少なくとも１時間にわたり流し、３９５ｂｐ周辺のライブラリーバンドを切断し、ＤＮＡを、ＱＩＡｑｕｉｃｋＧｅｌＥｘｔｒａｃｔｉｏｎキット（ＱＩＡｇｅｎ）を使用して、非スティックチューブ（Ａｍｂｉｏｎ）への３０ｕｌの溶出により、精製した。確認ゲルを流して、小さな生成物が除去されたことを検証した。次いで、これらのライブラリーを、ＱｕｂｉｔＨＳキット（ＴｈｅｒｍｏＦｉｓｈｅｒ）により定量化し、１５％のＰｈｉＸ対照（Ｉｌｌｕｍｉｎａ）によりプールし、シングルエンドフォワードリード（２６６又は３００サイクル）及び８サイクルのインデックスリードを使用して、Ｈｉｇｈアウトプットキットを用いるＩｌｌｕｍｉｎａＮｅｘｔＳｅｑにおいてシーケンシングした。

ドメインシーケンシング解析
シーケンシングリードを、ｂｃｌ２ｆａｓｔｑ（Ｉｌｌｕｍｉｎａ）を使用して、逆多重化した。Ｂｏｗｔｉｅ参照を、スクリプト「ｍａｋｅＩｎｄｉｃｅｓ．ｐｙ」によるデザインされたライブラリー配列を使用して、作出し、リードを、スクリプト「ｍａｋｅＣｏｕｎｔｓ．ｐｙ」を使用して、０のミスマッチを許容して整列させた。オフ試料及びオン試料（又はＦＬＡＧｈｉｇｈ及びＦＬＡＧｌｏｗ）の間の各ドメインについてのエンリッチメントを、スクリプト「ｍａｋｅＲｈｏｓ．ｐｙ」を使用して、計算した。所与の反復について両方の試料において＜５リードのドメインを、反復からドロップさせた（０カウントを割り当てた）一方、一試料中に＜５リードのドメインを、低深度からのエンリッチメント値の暴騰を回避するために、これらのリードを５に調節した。全ての核ドメインスクリーンについて、所与の条件の両方の反復において≦５カウントのドメインを、下流の解析からフィルター除去した。核ドメイン発現スクリーンについて、発現良好ドメインは、ｌｏｇ２（ＦＬＡＧｈｉｇｈ：ＦＬＡＧｌｏｗ）が、ランダム対照の中央値を≧１標準偏差上回るドメインであった。核Ｐｆａｍドメイン抑制因子スクリーンについて、ヒットは、ｌｏｇ２（オフ：オン）が、発現不良ドメインの平均を≧２標準偏差上回るドメインであった。核ドメイン活性化因子スクリーンについて、ヒットは、ｌｏｇ２（オフ：オン）が、発現不良ドメインの平均を≦２標準偏差下回るドメインであった。サイレンサータイリングスクリーンについて、所与の条件の両方の反復において≦２０カウントのタイルを、フィルター除去し、ヒットは、ｌｏｇ２（オフ：オン）が、ランダム対照及びＤＭＤタイリング対照の平均を≧２標準偏差上回るタイルであった。遺伝子オントロジー解析エンリッチメントを、ＰａｎｔｈｅｒＤＢウェブツール（ｗｗｗ．ｐａｎｔｈｅｒｄｂ．ｏｒｇ）を使用して、計算した。バックグラウンドセットは、発現良好であり、カウントフィルターが適用された後に実験において測定されたドメインを含有する全てのタンパク質であった。統計的有意性についてのＰ値を、フィッシャーの正確確率検定を使用して計算し、偽発見率（ＦＤＲ）を計算し、全てＦＤＲ＜１０％の最も有意な結果のみを示した。

ウェスタンブロット及び共免疫沈降
ｒＴｅｔＲ－ｆｕｓｉｏｎ－Ｔ２Ａ－ｍＣｈｅｒｒｙ－ＢＳＤを含有するレンチウイルスベクターで形質導入された細胞を、ブラストサイジン（１０μｇ／ｍＬ）により選択し、ｍＣｈｅｒｒｙが＞８０％まで選択した。細胞を、溶解緩衝液（１％のＴｒｉｔｏｎＸ－１００、１５０ｍＭのＮａＣｌ、５０ｍＭのＴｒｉｓｐＨ７．５、１ｍＭのＥＤＴＡ、プロテアーゼ阻害剤カクテル）に溶解した。タンパク質の量を、ＤＣＰｒｏｔｅｉｎＡｓｓａｙキット（Ｂｉｏ－Ｒａｄ）を使用して、定量した。等量を、ゲル上にロードし、ニトロセルロース又はＰＶＤＦ膜に移した。一次抗体として、ＧＡＴＡ１抗体（１：１０００、ウサギ、ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｉｅｓカタログ番号３５３５Ｓ）及びＧＡＰＤＨ抗体（１：２０００、マウス、ＴｈｅｒｍｏＦｉｓｈｅｒカタログ番号ＡＭ４３００）又はＦＬＡＧＭ２モノクローナル抗体（１：１０００、マウス、Ｓｉｇｍａ－Ａｌｄｒｉｃｈ、カタログ番号Ｆ１８０４）及びヒストン３抗体（１：１０００、マウス、Ａｂｃａｍカタログ番号ＡＢ１７９１）を使用して、膜を探査した。二次抗体として、それぞれ、ロバ抗ウサギＩＲＤｙｅ６８０ＬＴ及びヤギ抗マウスＩＲＤｙｅ８００ＣＷ（１：２０，０００希釈、ＬＩ－ＣＯＲＢｉｏｓｃｉｅｎｃｅｓ、それぞれ、カタログ番号９２６－６８０２３及び９２６－３２２１０）又はヤギ抗マウスＩＲＤｙｅ６８０ＲＤ及びヤギ抗ウサギＩＲＤｙｅ８００ＣＷ（１：２０，０００希釈、ＬＩ－ＣＯＲＢｉｏｓｃｉｅｎｃｅｓ、それぞれ、カタログ番号９２６－６８０７０及び９２６－３２２１１）を使用した。

ブロットを、ＬｉＣｏｒＯｄｙｓｓｅｙＣＬｘにおいて画像化した。バンド強度を、ＩｍａｇｅＪを使用して、定量した。

個々の抑制因子リクルートメントアッセイ
個々のエフェクタードメインを、骨格ｐＪＴ０５０又はｐＪＴ１２６へのＧｏｌｄｅｎＧａｔｅクローニングを使用して、Ｔ２Ａ－ｍＣｈｅｒｒｙ－ＢＳＤマーカーの上流の３×ＦＬＡＧタグ（図の凡例を参照されたい）を伴う又は伴わないｒＴｅｔＲ又はｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）との融合物としてクローニングした。次いで、Ｋ５６２－ｐＪＴ０３９－ｐＥＦ－シトリンレポーター細胞を、このレンチウイルスベクターにより形質導入し、３日後、細胞の＞８０％がｍＣｈｅｒｒｙ陽性まで（６～７日）、ブラストサイジン（１０μｇ／ｍＬ）により選択した。細胞を、２４ウェルプレートの別々のウェルに分割し、ドキシサイクリン（ＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）により処理した又は非処理のまま放置した。処理の５日後、ドキシサイクリンを、細胞からスピンダウンすることによって除去し、培地をＤＰＢＳ（Ｇｉｂｃｏ）で交換して、任意の残ったドキシサイクリンを希釈し、次いで、再び細胞からスピンダウンし、それらを新鮮な培地に移した。＞７，０００個細胞のフローサイトメトリー解析（ＢＤＡｃｃｕｒｉＣ６又はＢｅｃｋｍａｎＣｏｕｌｔｅｒＣｙｔｏＦＬＥＸのいずれか）によって、２～３日ごとに時点を測定した。データを、Ｃｙｔｏｆｌｏｗ及びカスタムＰｙｔｈｏｎスクリプトを使用して、解析した。事象を、生存率についての、及び送達マーカーとしてのｍＣｈｅｒｒｙについてのゲートをかけた。ドキシサイクリン処理時のオフ細胞の画分を計算するために、２成分ガウシアン混合モデルを、非処理ｒＴｅｔＲのみの陰性対照細胞にフィッティングさせ、これを、オンピーク及びバックグラウンドのサイレンシングされたオフ細胞のサブ集団の両方にフィッティングさせ、次いで、オフとしてサイレンシングされた細胞を表示するために、オンピークの平均を２標準偏差下回った閾値を設定した。時間がマッチした非処理対照を使用して、細胞のバックグラウンドの正規化された百分率を計算した。細胞_{オフ、正規化}＝細胞_{オフ＋ドキシサイクリン}／（１－細胞_{オフ、非処理}）。２つの独立に形質導入された物学的反復を使用した。ドキシサイクリン処理フェーズ時の指数関数的減衰（例えば、１から減算された指数関数的減衰）、並びにサイレンシング及び再活性化開始の前のラグタイムについての追加パラメーターを伴うドキシサイクリン除去フェーズ時の指数関数的減衰の増加形態からなる遺伝子サイレンシングモデルを、ＳｃｉＰｙを使用して、正規化されたデータにフィッティングさせた。

個々の活性化因子リクルートメントアッセイ
ドメインを、骨格ｐＪＴ１２６におけるＧｏｌｄｅｎＧａｔｅクローニングを使用して、Ｔ２Ａ－ｍＣｈｅｒｒｙ－ＢＳＤマーカーの上流のｒＴｅｔＲ（ＳＥ－Ｇ７２Ｐ）との融合物としてクローニングした。次いで、Ｋ５６２ｐＤＹ３２ｍｉｎＣＭＶシトリンレポーター細胞を、各レンチウイルスベクターにより形質導入し、３日後、細胞の＞８０％がｍＣｈｅｒｒｙ陽性まで（６～７日）、ブラストサイジン（１０μｇ／ｍＬ）により選択した。細胞を、２４ウェルプレートの別々のウェルに分割し、ドキシサイクリンにより処理した又は非処理のまま放置した。＞１５，０００個細胞のフローサイトメトリー解析（ＢｉｏｒａｄＺＥ５）によって、時点を測定した。ドキシサイクリン処理時のオン細胞の画分を計算するために、ガウシアンモデルを、非処理ｒＴｅｔＲのみの陰性対照細胞にフィッティングさせ、これを、オフピークにフィッティングさせ、次いで、オンとして活性化された細胞を表示するために、オフピークの平均を２標準偏差上回った閾値を設定した。２つの独立に形質導入された生物学的反復を使用した。

ＦＬＡＧタグ付けタンパク質レベルについてのフローサイトメトリー
ＦＬＡＧタグ付け融合タンパク質レベルの染色を行った。具体的には、Ｋ５６２細胞を、レンチウイルスを用いて形質導入して、融合タンパク質を発現させ、ブラストサイジンにより選択し、次いで、固定緩衝液Ｉ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ）により、３７℃で１５分間にわたり固定した。細胞を、１０％のＦＢＳを有する冷ＰＢＳで１回洗浄し、次いで、Ｐｅｒｍ緩衝液ＩＩＩ（ＢＤＢｉｏｓｃｉｅｎｃｅｓ）を使用して、氷上で３０分間にわたり透過処理した。細胞を、２回洗浄し、次いで、抗ＦＬＡＧ（ＸＸ）により、４℃で１時間にわたり染色した。最終ラウンドの洗浄後、フローサイトメトリーを、ＣｙｔｏＦＬＥＸ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）フローサイトメーターを使用して、行った。データを、細胞をｍＣｈｅｒｒｙ発現に対してゲートをかけることによって、ＣｙｔｏＦｌｏｗにより解析し、次いで、ｍＣｈｅｒｒｙ＋及び非形質導入細胞におけるＦＬＡＧタグ付けタンパク質レベルをプロットした。２つの細胞群として染色効率における変動性についてのこの手法の対照を、同じ試料内で混合した。

系統学的解析及びアライメント解析
周囲の天然配列を使用して、ＫＲＡＢ及びホメオドメイン配列を、８０ＡＡに到達するように、Ｐｆａｍから検索し、抽出した。発現良好ドメインを、アライメントのために選択した。系統樹及び配列アライメントを、デフォルトパラメーターを使用するアライメントウェブサイトＣｌｕｓｔａｌＯｍｅｇａ（ＭｃＷｉｌｌｉａｍら、２０１３；Ｓｉｅｖｅｒｓら、２０１１）を使用して得て、距離補正なしの５２の系統学的な近隣結合樹を、Ｊａｌｖｉｅｗ（Ｗａｔｅｒｈｏｕｓｅら、２００９）におけるデフォルトパラメーターにより構築した。アライメントの可視化を、Ｊａｌｖｉｅｗにおいて行った。

アミノ酸残基保存の解析
タンパク質配列を、ＣｏｎＳｕｒｆウェブサーバーに提出し、ＣｏｎＳｅｑ法を使用して、解析した。簡潔には、ＣｏｎＳｅｑは、３５～９５％の配列同一性を有するホモログのリストからのサンプリングによって、多重ストリングアライメントのために最大で１５０のホモログを選択する。次いで、系統樹を再構築し、保存を、Ｒａｔｅ４Ｓｉｔｅを使用して、スコア付けする。ＣｏｎＳｕｒｆは、正規化されたスコアを提供し、その結果、全ての残基についての平均スコアは、ゼロであり、標準偏差は、１である。ＣｏｎＳｕｒｆによって計算された保存スコアは、タンパク質中の各残基の進化的保存の相対的尺度であり、最も低いスコアは、タンパク質中の最も保存された位置を表す。ＺＮＦ１０ＫＲＡＢＮ末端伸長の一意性を、全てのヒトタンパク質に対するタンパク質ＢＬＡＳＴ、及びＢＬＡＳＴマッチ（Ｊｏｈｎｓｏｎら、２００８）の中の他の亜鉛フィンガータンパク質について探索することによって決定した。

ＣｈＩＰ－ｓｅｑ及びＣｈｉＰ－ｅｘｏ解析
外部ＣｈＩＰデータセットを、複数のソースから検索した。ＥＮＣＯＤＥＣｈＩＰ－ｓｅｑデータを、ＥＮＣＯＤＥ（ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０）の均一な処理パイプラインで処理し、０．０５のＩＤＲ閾値を下回る狭いピークを、検索した。ＨＥＫ２９３細胞におけるタグ付けされたＫＲＡＢＺＮＦの過剰発現からのＫＲＡＢＺＮＦＣｈＩＰ－ｅｘｏデータ、及びＨ１ｈＥＳＣからのＫＡＰ１ＣｈＩＰ－ｅｘｏデータを、ＧＥＯアクセッションＧＳＥ７８０９９（Ｉｍｂｅａｕｌｔら、２０１７）から得た。リードを、Ｂｏｗｔｉｅ（バージョン１．０．１；（Ｌａｎｇｍｅａｄら、２００９））を使用して、３６塩基対の均一な長さにトリミングし、ヒトゲノムのｈｇ３８バージョンにマッピングし、最大で２のミスマッチ及び一意的アライメントのみを保持することを可能にした。ピークを、以下の設定：「－ｇｈｓ－ｆＢＡＭ－－ｋｅｅｐ－ｄｕｐａｌｌ－－ｓｈｉｆｔ－７５－－ｅｘｔｓｉｚｅ１５０－－ｎｏｍｏｄｅｌ」によるＭＡＣＳ２（バージョン２．１．０）（Ｆｅｎｇら、２０１２）を使用して、コールした。ブラウザートラックを、Ｐｙｔｈｏｎスクリプトを使用して、作出した。ＣｈＩＰ－ｅｘｏデータが利用可能でなかったいくつかのＫＲＡＢＺＮＦのために、ＨＥＫ２９３細胞におけるタグ付けされたＫＲＡＢＺＮＦの過剰発現からのＣｈＩＰ－ｓｅｑデータを、ＧＥＯアクセッションＧＳＥ７６４９６（Ｓｃｈｍｉｔｇｅｓら、２０１６）及びＧＳＥ５２５２３（Ｎａｊａｆａｂａｄｉら、２０１５）から得た。ＫＲＡＢＺＮＦピークを、データセット中の他のＫＲＡＢＺＮＦが２５０塩基対未満離れたピークを有していなかった場合に、単独結合部位として定義した。Ｈ１細胞についてのＥＮＣＯＤＥＨ３Ｋ２７ａｃＣｈＩＰ－ｓｅｑデータセットを、ＥＮＣＯＤＥパイプライン（ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０）で処理し、狭いピークを、ＭＡＣＳ２によりコールし、０．０５のＩＤＲ閾値を下回るピークを、検索した。

外部のデータセット
ＫＲＡＢＺＮＦ、ＫＡＰ１及びＨ３Ｋ２７ａｃについての、ＣｈＩＰ－ｓｅｑ及びＣｈＩＰ－ｅｘｏデータ（ＥＮＣＯＤＥＰｒｏｊｅｃｔＣｏｎｓｏｒｔｉｕｍら、２０２０；Ｉｍｂｅａｕｌｔら、２０１７；Ｎａｊａｆａｂａｄｉら、２０１５；Ｓｃｈｍｉｔｇｅｓら、２０１６）、ＫＲＡＢＺＮＦ遺伝子の進化年代（Ｉｍｂｅａｕｌｔら、２０１７）、ＫＲＡＢＺＮＦタンパク質の共免疫沈降／質量分析データ（Ｈｅｌｌｅｂｏｉｄら、２０１９）及びＫＲＡＢ抑制活性についてのＣＡＴアッセイ（Ｍａｒｇｏｌｉｎら、１９９４；Ｗｉｔｚｇａｌｌら、１９９４）は、既に公表されている研究から検索した。

本明細書において引用される、刊行物、特許出願及び特許を含む、全ての参考文献は、各参考文献が、参照により組み込まれることが、個別に、かつ、具体的に指し示され、その全体において、本明細書に明示された場合と同じ程度において、参照により本明細書に組み込まれる。

本明細書において、本発明者らに公知である、本発明を実行するための、最良の方式を含む、本発明の、好ましい実施形態が記載される。前出の記載を読めば、これらの好ましい実施形態に対する変動は、当業者に明らかとなりうる。本発明者らは、当業者が、必要に応じて、このような変動を援用することを期待しており、本発明者らは、本発明が、本明細書において具体的に記載された方式以外の方式において実施されることを意図する。したがって、本発明は、本明細書に付属の特許請求の範囲において列挙された対象物に対する、全ての改変及びこれらの同等物を、適用可能な法規により許容されたものとして含む。さらに、本明細書においてそうでないことが指し示されない限り、又は、文脈により、逆の記載がない限り、上記において記載された要素の、これらの全ての可能な変動における、任意の組合せも、本発明に包含される。

Claims

転写抑制ドメインを同定するための方法であって、
ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；
ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、強いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
二部構成型レポーター遺伝子を、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写抑制ドメインによりサイレンシングすることが可能である、ステップ；
ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの分解に必要な長さの時間にわたり処理するステップ；
ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；
ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；
ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びに
ｇ）タンパク質ドメインを、転写抑制因子として同定するステップ
を含む方法。
レポーター細胞の薬剤による処理を停止し、ステップｄ～ｇを、１回以上にわたり反復するステップをさらに含む、請求項１に記載の方法。
ステップｄ～ｇが、レポーター細胞の薬剤による処理を停止した後に、少なくとも４８時間にわたり反復される、請求項２に記載の方法。
各タンパク質ドメインが、８０アミノ酸以下である、請求項１～３のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来する、請求項１～４のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項１～５のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項１～５のいずれかに記載の方法。
誘導型ＤＮＡ結合性ドメインがタグを含む、請求項１～７のいずれかに記載の方法。
タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項１～８のいずれかに記載の方法。
発現レベルが、ＤＮＡ結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項９に記載の方法。
レポーター細胞が、薬剤により、少なくとも３日間にわたり処理される、請求項１～１０のいずれかに記載の方法。
レポーター細胞が、薬剤により、５日間にわたり処理される、請求項１～１１のいずれかに記載の方法。
タンパク質ドメインが、比のｌｏｇ２が発現不良陰性対照の平均値から少なくとも２標準偏差である場合に、転写抑制因子として同定される、請求項１～１２のいずれかに記載の方法。
転写活性化ドメインを同定するための方法であって、
ａ）各々が誘導型ＤＮＡ結合性ドメインへと連結されたタンパク質ドメインを含む融合タンパク質を発現するように構成された複数の核酸配列を含むドメインライブラリーを調製するステップ；
ｂ）レポーター細胞をドメインライブラリーで形質変換するステップであって、レポーター細胞が、弱いプロモーターの制御下で表面マーカーと蛍光タンパク質とを含む二部構成型レポーター遺伝子を含み、
二部構成型レポーター遺伝子が、誘導型ＤＮＡ結合性ドメインを誘導するように構成された薬剤による処理後において、推定転写活性化ドメインにより活性化することが可能である、ステップ；
ｃ）レポーター細胞を、薬剤により、細胞内のタンパク質及びｍＲＮＡの産生に必要な長さの時間にわたり処理するステップ；
ｄ）表面マーカー、蛍光タンパク質又はこれらの組合せの存在又は非存在に基づき、レポーター細胞を分離するステップ；
ｅ）分離されたレポーター細胞から、タンパク質ドメインをシーケンシングするステップ；
ｆ）各タンパク質ドメインの配列について、表面マーカー、蛍光タンパク質又はこれらの組合せを有さないレポーター細胞からのシーケンシングカウントの、表面マーカー、蛍光タンパク質又はこれらの組合せを有するレポーター細胞からのシーケンシングカウントに対する比を計算するステップ；並びに
ｇ）タンパク質ドメインを、転写抑制因子として同定するステップ
を含む方法。
レポーター細胞の薬剤による処理を停止し、ステップｄ～ｇを、１回以上にわたり反復するステップをさらに含む、請求項１４に記載の方法。
ステップｄ～ｇが、レポーター細胞の薬剤による処理を停止した後に、少なくとも４８時間にわたり反復される、請求項１５に記載の方法。
各タンパク質ドメインが、８０アミノ酸以下である、請求項１４～１６のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来する、請求項１４～１７のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来する野生型タンパク質ドメインのアミノ酸配列を含む、請求項１４～１８のいずれかに記載の方法。
タンパク質ドメインが、核局在化タンパク質に由来するタンパク質ドメインの突然変異アミノ酸配列を含む、請求項１４～１９のいずれかに記載の方法。
誘導型ＤＮＡ結合性ドメインがタグを含む、請求項１４～２０のいずれかに記載の方法。
タンパク質ドメインの発現レベルを測定するステップをさらに含む、請求項１４～２１のいずれかに記載の方法。
発現レベルが、ＤＮＡ結合性ドメイン上のタグの相対的な存在又は非存在を測定することにより決定される、請求項２２に記載の方法。
レポーター細胞が、薬剤により、少なくとも２４時間にわたり処理される、請求項１４～２３のいずれかに記載の方法。
レポーター細胞が、薬剤により、４８時間にわたり処理される、請求項１４～２４のいずれかに記載の方法。
タンパク質ドメインが、比のｌｏｇ２が低発現陰性対照の平均値から少なくとも２標準偏差である場合に、転写活性化因子として同定される、請求項１４～２５のいずれかに記載の方法。
異種ＤＮＡ結合性ドメインへと融合した１つ以上の転写活性化ドメイン、１つ以上の転写抑制ドメイン又はこれらの組合せを含み、
１つ以上の転写活性化ドメインのうちの少なくとも１つ又は１つ以上の転写抑制ドメインのうちの少なくとも１つが、配列番号１～８９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む、合成転写因子。
異種ＤＮＡ結合性ドメインへと融合した２つ以上の転写活性化ドメイン又は２つ以上の転写抑制ドメインを含む、請求項２７に記載の合成転写因子。
１つ以上の転写活性化ドメインのうちの少なくとも１つが、配列番号５６３～６６４のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む、請求項２７～２８のいずれかに記載の合成転写因子。
１つ以上の転写活性化ドメインのうちの少なくとも１つが、表２において見出されるものから選択される、請求項２７～２９のいずれかに記載の合成転写因子。
１つ以上の転写抑制ドメインのうちの少なくとも１つが、配列番号１～５６２及び６６５～８９６のうちのいずれかに対する少なくとも７０％の同一性を有するアミノ酸配列を含む、請求項２７～３０のいずれかに記載の合成転写因子。
１つ以上の転写抑制ドメインのうちの少なくとも１つが、表１、３又は４において見出されるものから選択される、請求項２７～３１に記載の合成転写因子。
１つ以上の転写活性化ドメイン又は１つ以上の転写抑制ドメインが、請求項１～２６のいずれか一項に記載の方法により同定される、請求項２７～３２のいずれかに記載の合成転写因子。
異種ＤＮＡ結合性ドメインが、プログラム可能なＤＮＡ結合性ドメインを含む、請求項２７～３３のいずれかに記載の合成転写因子。
ＤＮＡ結合性ドメインが、クラスター化規則的間隔短鎖回文反復配列関連（Ｃａｓ）タンパク質に由来する、請求項２７～３４のいずれかに記載の合成転写因子。
請求項２７～３５のいずれかに記載の合成転写因子をコードする核酸。
誘導型プロモーターの制御下にある、請求項３６に記載の核酸。
組織特異的プロモーターの制御下にある、請求項３６に記載の核酸。
少なくとも１つのさらなる転写因子をコードする、請求項３６～３９のいずれかに記載の核酸。
少なくとも１つのさらなる転写因子が、請求項２７～３５のいずれかに記載の合成転写因子を含む、請求項３９に記載の核酸。
請求項３６～４０のいずれかに記載の核酸を含むベクター。
請求項２７～３５のいずれかに記載の合成転写因子、請求項３６～４０のいずれかに記載の核酸、又は請求項４１に記載のベクターを含む細胞。
２つ以上の合成転写因子、核酸又はベクターを含む、請求項４２に記載の細胞。
請求項２７～３５のいずれかに記載の合成転写因子、請求項３６～４０のいずれかに記載の核酸、請求項４１に記載のベクター、又は請求項４２若しくは４３に記載の細胞を含む組成物又はシステム。
前記組成物が、２つ以上の合成転写因子、核酸、ベクター又は細胞を含む、請求項４４に記載の組成物又はシステム。
ガイドＲＮＡ又はガイドＲＮＡをコードする核酸をさらに含む、請求項４４又は４５に記載の組成物又はシステム。
請求項２７～３６のいずれかに記載の少なくとも１つの合成転写因子、請求項３６～４０のいずれかに記載の核酸、請求項４１に記載のベクター、請求項４２若しくは４３に記載の細胞、又は請求項４４～４６に記載の組成物若しくはシステムを含むキット。
細胞内の少なくとも１つの標的遺伝子の発現をモジュレートする方法であって、請求項２７～３５のいずれかに記載の少なくとも１つの合成転写因子、請求項３６～４０のいずれかに記載の核酸、請求項４１に記載のベクター、又は請求項４４～４６に記載の組成物若しくはシステムを、細胞へ導入するステップを含む方法。
合成転写因子が、Ｃａｓタンパク質のＤＮＡ結合性ドメインを含み、前記方法が、前記細胞を少なくとも１つのガイドＲＮＡと接触させるステップをさらに含む、請求項４８に記載の方法。
前記細胞が、対象における細胞である、請求項４８又は４９に記載の方法。
少なくとも１つの合成転写因子、核酸、ベクター又は組成物若しくはシステムを対象へと投与するステップを含む、請求項５０に記載の方法。
少なくとも２つの遺伝子の遺伝子発現がモジュレートされる、請求項４８～５１のいずれかに記載の方法。
少なくとも１つの標的遺伝子の遺伝子発現レベルが少なくとも１つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも１つの標的遺伝子の遺伝子発現がモジュレートされる、請求項４８～５２のいずれかに記載の方法。
細胞内の少なくとも１つの標的遺伝子の発現をモジュレートするための、請求項２７～３５のいずれかに記載の合成転写因子、請求項３６～４０のいずれかに記載の核酸、請求項４１に記載のベクター、又は請求項４４～４６に記載の組成物若しくはシステムの使用。
合成転写因子が、Ｃａｓタンパク質のＤＮＡ結合性ドメインを含む、請求項５４に記載の使用。
少なくとも２つの遺伝子の遺伝子発現がモジュレートされる、請求項５４又は５５に記載の使用。
少なくとも１つの標的遺伝子の遺伝子発現レベルが少なくとも１つの標的遺伝子についての正常遺伝子発現レベルと比較して増大又は低下する場合に、少なくとも１つの標的遺伝子の遺伝子発現がモジュレートされる、請求項５４～５６のいずれかに記載の使用。