[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2024525665A - 効率的なゲノム編集のための組成物及び方法 - Google Patents

効率的なゲノム編集のための組成物及び方法 Download PDF

Info

Publication number
JP2024525665A
JP2024525665A JP2024501179A JP2024501179A JP2024525665A JP 2024525665 A JP2024525665 A JP 2024525665A JP 2024501179 A JP2024501179 A JP 2024501179A JP 2024501179 A JP2024501179 A JP 2024501179A JP 2024525665 A JP2024525665 A JP 2024525665A
Authority
JP
Japan
Prior art keywords
seq
sequence
domain
prime editing
editing composition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024501179A
Other languages
English (en)
Other versions
JPWO2023283092A5 (ja
Inventor
リース,ホリー・エイ
パッカー,マイケル
バーレラ,ルイス
スレイメーカー,イアン
Original Assignee
プライム・メディスン・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プライム・メディスン・インコーポレイテッド filed Critical プライム・メディスン・インコーポレイテッド
Publication of JP2024525665A publication Critical patent/JP2024525665A/ja
Publication of JPWO2023283092A5 publication Critical patent/JPWO2023283092A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本明細書では、標的遺伝子の効率的で正確な編集を可能とする改善されたプライム編集方法及び組成物が提供される。【選択図】図1

Description

相互参照
本出願は、2021年7月06日に出願された米国仮出願番号63/218,744、及び2021年7月08日に出願された米国仮出願番号63/219,623の利益を主張し、これらの出願の各々は、それらの全体が参照により本明細書に組み込まれる。
プライム編集技術は、標的ゲノムにおいて標的とされる挿入、欠失、ならびにすべてのトランスバージョン及びトランジション点変異を為すことができる遺伝子編集技術である。本開示は、標的遺伝子の効率的で正確な編集を可能とする改善されたプライム編集方法及び組成物を提供する。
本明細書では、いくつかの実施形態では、標的DNA、例えば、標的遺伝子における標的配列における改変の効率的なプライム編集のための方法及び組成物が提供される。
いかなる特定の理論にも縛られることなく、プライム編集プロセスは、標的ポリヌクレオチドにおける内因性配列を探し、置き換え得る。図3に例示されるように、プライム編集ガイドRNA(PEgRNA)のスペーサー配列は、二本鎖標的ポリヌクレオチド、例えば、二本鎖標的DNAの標的鎖におけるサーチ標的配列を認識し、それにアニールする。プライム編集複合体は、標的鎖の相補鎖である編集鎖上の標的DNAにおいてニックを生成し得る。次いでプライム編集複合体は、編集鎖のニック部位で形成された遊離3’末端を使用してDNA合成を開始させ得、その場合、PEgRNAのプライマー結合部位配列(PBS)は、遊離3’末端と複合体化し、PEgRNAの編集鋳型を鋳型として使用して一本鎖DNAが合成される。編集鋳型は、内因性二本鎖標的DNA配列と比較して1つ以上の意図されるヌクレオチド編集を含み得る。したがって、新しく合成された一本鎖DNAもまた、編集鋳型によってコードされるヌクレオチド編集(複数可)を含む。二本鎖標的DNAの編集鎖上の編集標的配列の除去及びDNA修復メカニズムを介して、新しく合成された一本鎖DNAは、編集標的配列に置き換わり、所望のヌクレオチド編集(複数可)が二本鎖標的DNAに組み込まれる。
本明細書では、いくつかの実施形態では、修飾されたプライムエディター(PE)ポリペプチド、互いに会合し、かつ二本鎖標的DNAにおいて意図されるヌクレオチド編集を効率的に組み込み得る修飾されたPEgRNA、及び特定の細胞タイプ、例えば、造血幹細胞において標的DNAを編集するためにそれを使用する方法が提供される。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、配列番号289、291、293、294、295、301、302、303、306、309、310、及び311からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、プライム編集組成物が提供される。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、プライム編集組成物が提供される。
いくつかの実施形態では、ペプチドリンカーのアミノ酸配列は、選択される配列と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する。いくつかの実施形態では、選択される配列は、配列番号302である。いくつかの実施形態では、選択される配列は、配列番号309である。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、少なくとも4個の連続SGGSモチーフを含む、プライム編集組成物が提供される。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、4~10個の連続SGGSモチーフを含む、プライム編集組成物が提供される。
いくつかの実施形態では、ペプチドリンカーは、4、5、6、8、または10個の連続SGGSモチーフを含む。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、少なくとも2個の連続EAAAKモチーフを含む、プライム編集組成物が提供される。
一態様では、本明細書では、融合タンパク質または融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、ペプチドリンカーは、2~8個の連続EAAAKモチーフを含む、プライム編集組成物が提供される。
いくつかの実施形態では、ペプチドリンカーは、2、3、4、6、または8個の連続EAAAKモチーフを含む。いくつかの実施形態では、DNAポリメラーゼドメインは、逆転写酵素(RT)ドメインを含む。いくつかの実施形態では、RTドメインは、モロニーマウス白血病ウイルス(M-MLV)RTドメインである。いくつかの実施形態では、M-MLV RTドメインは、配列番号5と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸を含む。いくつかの実施形態では、M-MLV RTドメインは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTドメインは、配列番号36と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む。
いくつかの実施形態では、M-MLV RTドメインは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTドメインは、配列番号54と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む。
一態様では、本開示は、a)DNA結合ドメインまたはDNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたはM-MLV RTドメインをコードするポリヌクレオチドを含むプライム編集組成物であって、M-MLV RTドメインは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたアミノ酸配列を含む、プライム編集組成物を提供する。
一態様では、本明細書では、a)DNA結合ドメインまたはDNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたはM-MLV RTドメインをコードするポリヌクレオチドを含むプライム編集組成物であって、M-MLV RTドメインは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されている、プライム編集組成物が提供される。
いくつかの実施形態では、M-MLV RTドメインは、配列番号1に示される参照M-MLV RTと比較してアミノ酸置換D200N、T306K、W313F、T330P、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、DNA結合ドメインは、融合タンパク質においてM-MLV RTドメインに接続されている。いくつかの実施形態では、DNA結合ドメイン及びM-MLV RTドメインは、ペプチドリンカーによって接続されている。いくつかの実施形態では、ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む。
いくつかの実施形態では、DNA結合ドメインは、CRISPR関連(Cas)タンパク質を含む。いくつかの実施形態では、Casタンパク質は、II型Casタンパク質である。いくつかの実施形態では、Casタンパク質は、Cas9である。いくつかの実施形態では、Cas9タンパク質は、HNHドメインにおける変異を含むニッカーゼである。いくつかの実施形態では、Cas9タンパク質は、配列番号2と比較してH840A変異を含む。いくつかの実施形態では、DNA結合ドメインは、配列番号7と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む。
いくつかの実施形態では、Casタンパク質は、V型Casタンパク質である。いくつかの実施形態では、Casタンパク質は、Cas12a、Cas12b、Cas12c、Cas12d、またはCas12eである。いくつかの実施形態では、融合タンパク質は、DNAポリメラーゼドメイン及びDNA結合ドメインをN末端からC末端へ含む。いくつかの実施形態では、融合タンパク質は、DNAポリメラーゼドメイン及びDNA結合ドメインをC末端からN末端へ含む。いくつかの実施形態では、融合タンパク質は、配列番号78、105、117、125、131、137、143、149、155、161、167、173、179、185、191、197、203、209、215、221、及び227からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、選択される配列は、配列番号78である。
いくつかの実施形態では、選択される配列は、配列番号105である。いくつかの実施形態では、融合タンパク質は、配列番号86、111、122、128、134、140、146、152、158、164、170、176、182、188、194、200、206、212、218、224、及び230からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、選択される配列は、配列番号86である。いくつかの実施形態では、選択される配列は、配列番号111である。いくつかの実施形態では、融合タンパク質は、選択される配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、融合タンパク質は、1つ以上の核局在化シグナル(NLS)を含む。いくつかの実施形態では、1つ以上のNLSは、配列番号8~15または621からなる群から選択されるアミノ酸配列を含む。
いくつかの実施形態では、融合タンパク質は、配列番号77、93、104、116、及び620からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、選択される配列は、配列番号77または配列番号620である。いくつかの実施形態では、選択される配列は、配列番号93である。いくつかの実施形態では、融合タンパク質は、配列番号85、96、110、及び622からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、選択される配列は、配列番号85または配列番号622である。
いくつかの実施形態では、選択される配列は、配列番号110である。いくつかの実施形態では、融合タンパク質は、選択される配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記の態様のいずれか1つのプライム編集組成物は、融合タンパク質をコードするポリヌクレオチドを含み、ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、及び229からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。
いくつかの実施形態では、選択される配列は、配列番号81または82である。いくつかの実施形態では、上記の態様のいずれか1つのプライム編集組成物は、融合タンパク質をコードするポリヌクレオチドを含み、ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号89または90である。
いくつかの実施形態では、上記態様のいずれか1つのプライム編集組成物は、融合タンパク質をコードするポリヌクレオチドを含み、ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、及び119からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、上記態様のいずれか1つのプライム編集組成物は、融合タンパク質をコードするポリヌクレオチドを含み、ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号79または80である。いくつかの実施形態では、選択される配列は、配列番号87または88である。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチドは、3’末端で終止コドンをさらに含む。
いくつかの実施形態では、ポリヌクレオチドは、配列番号276~279の配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号282~285の配列を含む。いくつかの実施形態では、プライム編集組成物は、5’非翻訳領域(UTR)及び/または3’UTRをさらに含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号274、275、592、または593の配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号280、281、594、または595の配列を含む。いくつかの実施形態では、ポリヌクレオチドは、DNAを含む。いくつかの実施形態では、ポリヌクレオチドは、mRNAを含む。いくつかの実施形態では、プライム編集組成物は、制御性要素配列をさらに含み、任意に制御性要素配列は、プロモーターである。
一態様では、本明細書では、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、第2のポリヌクレオチドは、配列番号412~555からなる群から選択される配列のヌクレオチド100~2130に対応する配列と少なくとも80%の同一性を有する配列を含む、プライム編集組成物が提供される。
一態様では、本明細書では、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、第2のポリヌクレオチドは、配列番号83または84と少なくとも80%の同一性を有する配列を含む、プライム編集組成物が提供される。
いくつかの実施形態では、第2のポリヌクレオチドは、配列番号83または84と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む。
一態様では、本明細書では、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、第2のポリヌクレオチドは、配列番号83または84の配列を含む、プライム編集組成物が提供される。
一態様では、本明細書では、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、第2のポリヌクレオチドは、配列番号91または92と少なくとも80%の同一性を有する配列を含む、プライム編集組成物が提供される。
いくつかの実施形態では、第2のポリヌクレオチドは、配列番号91または92と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む。
一態様では、本明細書では、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、第2のポリヌクレオチドは、配列番号91または92の配列を含む、プライム編集組成物が提供される。
いくつかの実施形態では、第1のポリヌクレオチドは、CRISPR関連(Cas)タンパク質をコードする。いくつかの実施形態では、Casタンパク質は、II型Casタンパク質である。いくつかの実施形態では、Casタンパク質は、Cas9である。いくつかの実施形態では、Cas9タンパク質は、HNHドメインにおける変異を含むニッカーゼであり、任意にCas9タンパク質は、配列番号2と比較してH840A変異を含む。いくつかの実施形態では、Casタンパク質は、V型Casタンパク質である。いくつかの実施形態では、Casタンパク質は、Cas12a、Cas12b、Cas12c、Cas12d、またはCas12eである。いくつかの実施形態では、第1のポリヌクレオチド及び第2のポリヌクレオチドは、融合ポリヌクレオチドにおいて接続されている。いくつかの実施形態では、第1のポリヌクレオチド及び第2のポリヌクレオチドは、ペプチドリンカーをコードする配列によって接続されている。いくつかの実施形態では、ペプチドリンカーをコードするポリヌクレオチドは、配列番号235、236または633~636の配列を含む。
いくつかの実施形態では、第1のポリヌクレオチドは、第2のポリヌクレオチドの5’末端に接続されている。いくつかの実施形態では、第1のポリヌクレオチドは、第2のポリヌクレオチドの3’末端に接続されている。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、229、241、及び242からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号81または82である。いくつかの実施形態では、選択される配列は、配列番号241または242である。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号89または90である。いくつかの実施形態では、選択される配列は、配列番号102または103である。いくつかの実施形態では、選択される配列は、配列番号114または115である。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、またはその両方は、核局在化シグナル(NLS)をコードする配列をさらに含む。
いくつかの実施形態では、NLSは、配列番号239または240の配列を含み、第2のポリヌクレオチドの3’末端に接続されている。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、119、233、及び234からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号79または80である。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、選択される配列は、配列番号87または88である。いくつかの実施形態では、融合ポリヌクレオチドは、3’末端で終止コドンをさらに含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号276~279からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号282~285からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、5’非翻訳領域(UTR)及び/または3’UTRを含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号274、275、592、または593の配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号280、281、594、または595の配列を含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、及び/または融合ポリヌクレオチドは、DNAを含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、及び/または融合ポリヌクレオチドは、mRNAを含む。いくつかの実施形態では、融合ポリヌクレオチドは、制御性要素配列をさらに含み、任意に制御性要素配列は、プロモーターである。
いくつかの実施形態では、配列同一性は、存在(Existence):11、伸長(Extension)1に設定されたギャップコストを用いて2つの配列のニードルマン・ウンシュアライメントによって決定され、同一率は、同一の数をアライメントの長さで除算することによって計算される。いくつかの実施形態では、プライム編集組成物は、プライム編集ガイドRNA(PEgRNA)またはPEgRNAをコードするポリヌクレオチドをさらに含む。いくつかの実施形態では、プライム編集組成物は、ニックガイドRNA(ngRNA)またはngRNAをコードするポリヌクレオチドをさらに含む。
一態様では、本明細書では、上記態様のいずれか1つのプライム編集組成物のポリヌクレオチドのうちの1つ以上を含むベクターが提供される。
いくつかの実施形態では、ベクターは、AAVベクターである。いくつかの実施形態では、ベクターは、脂質ナノ粒子(LNP)である。
一態様では、本明細書では、上記態様のいずれか1つのプライム編集組成物または上記態様のいずれか1つのベクター、及び薬学的に許容可能な賦形剤を含む薬学的組成物が提供される。
一態様では、本明細書では、標的遺伝子を編集する方法であって、方法は、標的遺伝子を上記態様のいずれか1つのプライム編集組成物と接触させることを含む、方法が提供される。
いくつかの実施形態では、標的遺伝子は、細胞におけるものである。いくつかの実施形態では、細胞は、ヒト細胞である。いくつかの実施形態では、細胞は、(CD34+)造血幹細胞または造血幹前駆細胞である。いくつかの実施形態では、接触させることは、ex vivoにおけるものである。いくつかの実施形態では、細胞は、対象にある。
参照による組み込み
本明細書で言及されるすべての刊行物、特許、及び特許出願は、各々の個々の刊行物、特許または特許出願が具体的かつ個別に参照により本明細書に組み込まれることが示されているのと同じ程度に参照により本明細書に組み込まれる。
本発明の新規な特徴は、特に添付の特許請求の範囲において示される。本発明の特徴及び利点のより良い理解は、本発明の原理が利用される例示的な実施形態を示す以下の詳細な説明、及び添付の図面を参照することによって得られるであろう。
Cas9ニッカーゼ、逆転写酵素、及びリンカーを含む例示的なプライムエディター融合タンパク質の概略図である。 プライムエディターのために設計されたPEgRNAの例示的な概略図におけるプライム編集ガイドRNA(PEgRNA)構成を示している。 二本鎖標的DNA配列に結合しているプライム編集ガイドRNA(PEgRNA)の概略図を示している。 2つの別々の分子における例示的なガイドRNAのスペーサー及びgRNAコア部分を示す概略図である。PEgRNA構造の残部は示されていない。 操作されたRTドメインを有するプライムエディターのプライム編集効率を示している。「pegRNAのみ」(各プライムエディターについての上部のバー)は、ngRNAと対合されていないpegRNAで達成された編集効率を指す;「pegRNA+ngRNA」(各プライムエディターについての下部のバー)は、pegRNA及びngRNAで達成された編集効率を指す。
本明細書では、いくつかの実施形態では、標的細胞における標的DNAポリヌクレオチドの高度なプライム編集のための組成物及び編集方法が提供される。本明細書で提供される組成物は、標的DNAポリヌクレオチドにおける特定のDNA遺伝子座にPEを標的化するプライム編集ガイドRNA(PEgRNA)と称される操作されたガイドポリヌクレオチド、例えば、CRISPR-CasガイドRNAを使用し得、かつ疾患を引き起こす変異の直接的修正を含む多様な機能を果たし得るDNA編集をコードし得るプライムエディター(PE)を含み得る。
以下の記載及び例は、本開示の実施形態を詳細に説明する。本開示は、本明細書に記載の特定の実施形態に限定されず、そのようなものとして様々であり得ることを理解されたい。当業者は、本開示の多数のバリエーション及び修飾が存在し、これらはその範囲に包含されることを認識するであろう。本開示の様々な特徴は、単一の実施形態の文脈で記載され得るが、特徴はまた、別々にまたは任意の好適な組み合わせで提供され得る。逆に、本開示は、明確性のために別々の実施形態の文脈で記載され得るが、本開示はまた、単一の実施形態で実践され得る。
定義
別途定義されない限り、本明細書で使用されるすべての技術的及び科学的用語は、当業者によって一般的に理解されるものと同じ意味を有する。
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、限定するようには意図されていない。本明細書で使用される場合、単数形「a」、「an」及び「the」には、文脈が別途明らかに示さない限り、複数形も同様に含まれることが意図されている。さらに、用語「含む(including)」、「含む(includes)」、「有する(having)」、「有する(has)」、「伴う」、またはその変化形は、本明細書で使用される場合、「含む」を意味する程度まで。
別途特定されない限り、用語「含む(comprising)」、「含む(comprise)」、「含む(comprises)」、「有する(having)」、「有する(have)」、「有する(has)」、「含む(including)」、「含む(includes)」、「含む(include)」、「含有する(containing)」、「含有する(contains)」及び「含有する(contain)」は、包括的またはオープンエンドであり、追加の記述していない要素または方法工程を排除しない。
「いくつかの実施形態」、「実施形態」、「一実施形態」、または「他の実施形態」に対する言及は、実施形態と組み合わせて記載される特定の特徴または特性が、少なくとも1つ以上の実施形態に含まれるが、かならずしも、本開示のすべての実施形態に含まれるわけではないことを意味する。
用語「約」または「およそ」は、当業者によって決定される特定の値についての許容可能な誤差範囲内を意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの限界に依存することになる。例えば、「約」は、当該技術分野における実践に従って、1標準偏差以内を意味し得る。代替的には、「約」は、所与の値の最大で20%、最大で10%、最大で5%、または最大で1%の範囲を意味し得る。代替的には、特に生物学的システムまたはプロセスに関して、その用語は、値の1桁分以内、好ましくは5倍以内、より好ましくは2倍以内を意味し得る。特定の値が本出願及び特許請求の範囲に記載される場合、別途記述されない限り、特定の値についての許容可能な誤差範囲内を意味する用語「約」が想定されるべきである。
本明細書で使用される場合、「細胞」は通常、生物学的細胞を指し得る。細胞は、生物の基礎構造的、機能的及び/または生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に由来し得る。いくつかの非限定的な例には、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞性真核生物の細胞、原生動物細胞、植物からの細胞、動物細胞、無脊椎動物(例えば、ミバエ、刺胞動物、棘皮動物、線虫等)からの細胞、脊椎動物(例えば、魚類、両生類、爬虫類、鳥類、哺乳動物)からの細胞、哺乳動物(例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒト等)からの細胞等が含まれる。時に細胞は、天然生物に由来しない場合がある(例えば、細胞は、合成的に製造される(時に人工細胞と称される))。
いくつかの実施形態では、細胞は、哺乳動物細胞である。いくつかの実施形態では、細胞は、ヒト細胞である。細胞は、異なる組織、器官、及び/または細胞タイプのものであり、またはそれに由来し得る。いくつかの実施形態では、細胞は、初代細胞である。本明細書で使用される場合、用語「初代細胞」は、生物、例えば、哺乳動物から単離された細胞であって、細分割及び二次培養への移行前に初めて組織培養(すなわち、in vitro)で増殖させられたものを意味する。いくつかの実施形態では、細胞は、幹細胞である。いくつかの非限定的な例では、初代細胞及び幹細胞を含む哺乳動物細胞は、1つ以上のポリヌクレオチド、ポリペプチド、及び/またはプライム編集組成物の導入を介して(例えば、トランスフェクション、形質導入、エレクトロポレーション等を介して)修飾され、さらに継代され得る。そのような修飾される細胞には、造血幹細胞(HSC)、造血前駆細胞、(HSPC)、肝細胞、線維芽細胞、ケラチノサイト、上皮細胞(例えば、乳房上皮細胞、腸上皮細胞)、内皮細胞、グリア細胞、神経細胞、形成された血液の要素(例えば、リンパ球、骨髄細胞、造血幹前駆細胞)、筋肉細胞及びこれらの体細胞タイプの前駆体が含まれ得る。いくつかの実施形態では、細胞は、初代肝細胞である。いくつかの実施形態では、細胞は、初代ヒト肝細胞である。いくつかの実施形態では、細胞は、幹細胞である。いくつかの実施形態では、細胞は、前駆細胞である。いくつかの実施形態では、細胞は、多能性細胞(例えば、多能性幹細胞)である。いくつかの実施形態では、細胞(例えば、幹細胞)は、胚性幹細胞、組織特異的幹細胞、間葉幹細胞、または人工多能性幹細胞である。いくつかの実施形態では、細胞は、人工多能性幹細胞(iPSC)である。いくつかの実施形態では、細胞は、胚性幹細胞(ESC)である。いくつかの実施形態では、細胞は、人工ヒト多能性幹細胞(iPSC)に由来する初代ヒト肝細胞である。いくつかの実施形態では、細胞は、ニューロンである。いくつかの実施形態では、細胞は、大脳基底核からのニューロンである。いくつかの実施形態では、細胞は、ヒト対象の大脳基底核からのニューロンである。いくつかの実施形態では、細胞は、肺、肝臓、胃、または腸からの上皮細胞である。いくつかの実施形態では、細胞は、ヒト対象の肺、肝臓、胃、または腸からの上皮細胞である。いくつかの実施形態では、細胞は、網膜細胞である。いくつかの実施形態では、細胞は、ヒト対象からの網膜細胞である。
いくつかの実施形態では、細胞は、ヒト幹細胞である。いくつかの実施形態では、細胞は、ヒト多能性幹細胞である。いくつかの実施形態では、細胞は、ヒト線維芽細胞である。いくつかの実施形態では、細胞は、人工ヒト多能性幹細胞である。いくつかの実施形態では、細胞は、ヒト幹細胞である。いくつかの実施形態では、細胞は、ヒト胚性幹細胞である。
いくつかの実施形態では、細胞は、CD34+細胞である。いくつかの実施形態では、細胞は、造血幹細胞(HSC)である。いくつかの実施形態では、細胞は、造血前駆細胞(HPC)である。いくつかの実施形態では、造血幹細胞及び造血前駆細胞は、造血幹または前駆細胞(HSPC)と称される。いくつかの実施形態では、細胞は、ヒトHSCである。いくつかの実施形態では、細胞は、ヒトHPCである。いくつかの実施形態では、細胞は、ヒトHSPCである。いくつかの実施形態では、細胞は、長期(LT)-HSCである。いくつかの実施形態では、細胞は、短期(ST)-HSCである。いくつかの実施形態では、細胞は、骨髄前駆細胞である。いくつかの実施形態では、細胞は、リンパ前駆細胞である。いくつかの実施形態では、細胞は、顆粒球単球前駆細胞である。いくつかの実施形態では、細胞は、巨核球赤血球前駆細胞である。いくつかの実施形態では、細胞は、多能性前駆細胞(MPP)である。
いくつかの実施形態では、細胞は、幹細胞である。いくつかの実施形態では、細胞は、ヒト幹細胞である。いくつかの実施形態では、細胞は、造血幹細胞(HSC)または造血幹及び前駆細胞である。いくつかの実施形態では、HSCは、骨髄または動員末梢血からのものであり得る。いくつかの実施形態ではヒト幹細胞は、人工多能性幹細胞(iPSC)である。いくつかの実施形態では、細胞は、ヒトHSCである。いくつかの実施形態では、細胞は、ヒトCD34+細胞である。いくつかの実施形態では、細胞は、造血幹及び前駆細胞(HSPC)である。いくつかの実施形態では、細胞は、ヒト造血幹及び前駆細胞(HSPC)である。いくつかの実施形態では、細胞は、造血前駆細胞、多能性前駆細胞、リンパ前駆細胞、骨髄前駆細胞、巨核球-赤血球前駆細胞、顆粒球-巨核球前駆細胞、顆粒球、前骨髄球、好中球、好酸球、好塩基球、赤血球、網状赤血球、血小板、巨核芽球、血小板産生巨核球、単球、マクロファージ、樹状細胞、ミクログリア、破骨細胞、リンパ球、NK細胞、B細胞、またはT細胞である。いくつかの実施形態では、プライム編集によって編集された細胞は、細胞、例えば、共通リンパ前駆細胞、共通骨髄前駆細胞、巨核球-赤血球前駆細胞、顆粒球-巨核球前駆細胞、顆粒球、前骨髄球、好中球、好酸球、好塩基球、赤血球、網状赤血球、血小板、巨核芽球、血小板産生巨核球、血小板、単球、マクロファージ、樹状細胞、ミクログリア、破骨細胞、リンパ球、例えば、NK細胞、B細胞またはT細胞の集団に分化され、またはその回復を生じさせ得る。いくつかの実施形態では、プライム編集によって編集された細胞は、細胞、例えば、好中球、血小板、赤血球、単球、マクロファージ、抗原提示細胞、ミクログリア、破骨細胞、樹状細胞、内耳細胞、内耳支持細胞、蝸牛細胞及び/またはリンパ球の集団に分化され、またはその回復を生じさせ得る。いくつかの実施形態では、細胞は、対象、例えば、ヒト対象におけるものである。
いくつかの実施形態では、細胞は、生物から単離されないが、生物、例えば、哺乳動物の組織または器官の一部を形成する。いくつかの非限定的な例では、哺乳動物細胞には、形成された血液の要素(例えば、リンパ球、骨髄細胞)、これらの体細胞タイプのいずれかの前駆体、及び幹細胞が含まれる。
いくつかの実施形態では、細胞は、生物から単離される。いくつかの実施形態では、細胞は、生物に由来する。いくつかの実施形態では、細胞は、分化した細胞である。いくつかの実施形態では、細胞は、線維芽細胞である。いくつかの実施形態では、細胞は、人工多能性幹細胞から分化される。いくつかの実施形態では、細胞は、HSCまたはHPSCから分化される。いくつかの実施形態では、細胞は、人工多能性幹細胞(iPSC)から分化される。いくつかの実施形態では、細胞は、胚性幹細胞(ESC)から分化される。
いくつかの実施形態では、細胞は、分化したヒト細胞である。いくつかの実施形態では、細胞は、ヒト線維芽細胞である。いくつかの実施形態では、細胞は、人工ヒト多能性幹細胞から分化される。いくつかの実施形態では、細胞は、ヒトiPSCまたはヒトESCから分化される。
いくつかの実施形態では、細胞は、本明細書に開示されるプライムエディター、PEgRNA、またはプライム編集組成物を含む。いくつかの実施形態では、細胞は、ヒト対象からのものである。いくつかの実施形態では、ヒト対象は、プライム編集によって修正される変異に関連する疾患または病態を有する、またはその疾患または病態を発症するリスクがある。いくつかの実施形態では、細胞は、ヒト対象からのものであり、変異の修正のためのプライムエディターまたはプライム編集組成物を含む。いくつかの実施形態では、細胞は、二本鎖標的DNAにおける変異を含む。いくつかの実施形態では、細胞は、標的遺伝子における変異を含む。いくつかの実施形態では、細胞は、疾患、障害、または病態に関連する変異を含む。いくつかの実施形態では、細胞は、ヒト対象におけるものである。いくつかの実施形態では、細胞は、変異の修正のためのプライムエディターまたはプライム編集組成物を含む。いくつかの実施形態では、細胞は、ヒト対象におけるものであり、変異の修正のための本明細書に開示されるプライムエディター、PEgRNA、またはプライム編集組成物を含む。いくつかの実施形態では、細胞は、ヒト対象からのものである。いくつかの実施形態では、細胞は、ヒト対象からのものであり、変異は、プライム編集によって編集または修正されている。
用語「実質的に」は、本明細書で使用される場合、所与の値の100%に近い値を指し得る。いくつかの実施形態では、その用語は、全量の少なくとも約70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%、または99.99%であり得る量を指し得る。いくつかの実施形態では、その用語は、全量の約100%であり得る量を指し得る。
用語「タンパク質」及び「ポリペプチド」は、三次元コンフォメーションを採用し得る共有結合(例えば、アミド結合)によって接続された2つ以上のアミノ酸のポリマーを指すために互換的に使用され得る。いくつかの実施形態では、タンパク質またはポリペプチドは、共有結合(例えば、アミド結合)によって接続された少なくとも10アミノ酸、15アミノ酸、20アミノ酸、30アミノ酸または50アミノ酸を含む。いくつかの実施形態では、タンパク質は、少なくとも2つのアミド結合を含む。いくつかの実施形態では、タンパク質は、複数のアミド結合を含む。いくつかの実施形態では、タンパク質は、少なくとも10個のアミド結合、15個のアミド結合、20個のアミド結合、30個のアミド結合、または50個のアミド結合を含む。いくつかの実施形態では、タンパク質は、酵素、酵素前駆体タンパク質、制御性タンパク質、構造タンパク質、サイトカイン、ケモカイン、成長因子、受容体、核酸結合タンパク質、バイオマーカー、特異的結合対のメンバー(例えば、リガンドまたはアプタマー)、または抗体を含む。いくつかの実施形態では、タンパク質は、全長タンパク質(例えば、所定の生物学的機能を有する十分に処理されたタンパク質)であり得る。いくつかの実施形態では、タンパク質は、全長タンパク質のバリアントまたは断片であり得る。例えば、いくつかの実施形態では、Cas9タンパク質ドメインは、天然に存在するS.pyogenes Cas9タンパク質と比較してH840Aアミノ酸置換を含む。タンパク質または酵素のバリアント、例えば、バリアント逆転写酵素は、参照タンパク質のアミノ酸配列と約60%同一、約70%同一、約80%同一、約90%同一、約95%同一、約96%同一、約97%同一、約98%同一、約99%同一、約99.5%同一、または約99.9%同一であるアミノ酸配列を有するポリペプチドを含む。
いくつかの実施形態では、タンパク質は、1つ以上のタンパク質ドメインまたはサブドメインを含む。本明細書で使用される場合、用語「ポリペプチドドメイン」、「タンパク質ドメイン」、または「ドメイン」は、タンパク質またはポリペプチドとの関連で使用される場合、1つ以上の生物学的機能、例えば、触媒的機能、タンパク質-タンパク質結合機能、またはタンパク質-DNA機能を有するポリペプチド鎖を指す。いくつかの実施形態では、タンパク質は、複数のタンパク質ドメインを含む。いくつかの実施形態では、タンパク質は、天然に存在する複数のタンパク質ドメインを含む。いくつかの実施形態では、タンパク質は、天然に存在するタンパク質とは異なる複数のタンパク質ドメインを含む。例えば、いくつかの実施形態では、プライムエディターは、S.pyogenesのCas9タンパク質ドメインまたはその断片、変異体、もしくはバリアント及びレトロウイルス(例えば、モロニーマウス白血病ウイルス)の逆転写酵素タンパク質ドメインまたはそのレトロウイルスの変異体、断片、もしくはバリアントを含む融合タンパク質であり得る。異なる起源または天然に存在するタンパク質からのアミノ酸配列を含むタンパク質は、融合体、またはキメラタンパク質と称され得る。
いくつかの実施形態では、タンパク質は、全長野生型タンパク質の機能的バリアントまたは機能的断片を含む。「機能的断片」または「機能的部分」は、本明細書で使用される場合、機能、例えば、触媒的または結合機能の1つ以上を保持しながら、参照タンパク質の全体に満たないアミノ酸配列を包含する参照タンパク質(例えば、野生型タンパク質)の任意の部分を指す。例えば、逆転写酵素の機能的断片は、野生型逆転写酵素の全体に満たないアミノ酸配列を包含し得るが、ポリヌクレオチドの重合を触媒するための少なくとも1つの条件のセット下で能力を保持する。参照タンパク質が複数の機能的ドメインの融合体である場合、その機能的断片は、機能的ドメインの少なくとも1つの機能の1つ以上を保持し得る。例えば、Cas9の機能的断片は、野生型Cas9の全体に満たないアミノ酸配列を包含し得るが、そのDNA結合能力を保持し、そのヌクレアーゼ活性を部分的または完全に欠き得る。
「機能的バリアント」または「機能的変異体」は、本明細書で使用される場合、機能、例えば、触媒的または結合機能の1つ以上を保持しながら、参照タンパク質のアミノ酸配列に対する1つ以上の改変を包含する参照タンパク質(例えば、野生型タンパク質)の任意のバリアントまたは変異体を指す。いくつかの実施形態では、アミノ酸配列に対する1つ以上の改変は、アミノ酸置換、挿入または欠失、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、アミノ酸配列に対する1つ以上の改変は、アミノ酸置換を含む。例えば、逆転写酵素の機能的断片は、野生型逆転写酵素のアミノ酸配列と比較して1つ以上のアミノ酸置換を含み得るが、ポリヌクレオチドの重合を触媒するための少なくとも1つの条件のセット下で能力を保持する。参照タンパク質が複数の機能的ドメインの融合体である場合、その機能的バリアントは、機能的ドメインの少なくとも1つの機能の1つ以上を保持し得る。例えば、いくつかの実施形態では、Cas9の機能的断片は、野生型Cas9のアミノ酸配列と比較して、ヌクレアーゼドメインにおける1つ以上のアミノ酸置換、例えば、H840Aアミノ酸置換を含み得るが、DNA結合能力を保持し、ヌクレアーゼ活性を部分的または完全に欠く。
用語「機能」及びその文法的同等物は、本明細書で使用される場合、意図される目的を遂行する、有する、または発揮する能力を指し得る。機能的は、意図される目的のベースラインから100%までの任意のパーセントを含み得る。例えば、機能的は、意図される目的の約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または最大で約100%を含み得、または含む。いくつかの実施形態では、機能的という用語は、正常な機能の100%超または約100%超、例えば、意図される目的の125%、150%、175%、200%、250%、300%、400%、500%、600%、700%または最大で約1000%を意味し得る。
いくつかの実施形態では、タンパク質またはポリペプチドには、天然に存在するアミノ酸(例えば、天然で合成されたペプチドに一般的に見られ、1文字の略語A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y及びVによって知られている20種のアミノ酸のうちの1つ)が含まれる。いくつかの実施形態では、タンパク質またはポリペプチドには、天然に存在しないアミノ酸(例えば、天然で合成されたペプチドに一般的に見られる20種のアミノ酸のうちの1つではないアミノ酸(合成アミノ酸、アミノ酸アナログ、及びアミノ酸模倣体を含む))が含まれる。いくつかの実施形態では、タンパク質またはポリペプチドは、修飾される。
いくつかの実施形態では、タンパク質は、単離されたポリペプチドを含む。用語「単離された」は、天然状態または環境に見られるように通常付随する成分から遊離しているか、または様々な程度まで取り出されていることを意味する。例えば、生存動物に天然に存在するポリペプチドは、単離されておらず、その天然状態の共存物質から部分的または完全に分離された同じポリペプチドは、単離されている。
いくつかの実施形態では、タンパク質は、細胞、組織、器官、またはウイルス粒子内に存在する。いくつかの実施形態では、タンパク質は、細胞または細胞の一部(例えば、細菌細胞、植物細胞、または動物細胞)内に存在する。いくつかの実施形態では、細胞は、組織、対象、または細胞培養におけるものである。いくつかの実施形態では、細胞は、微生物(例えば、細菌、真菌、原生動物、またはウイルス)である。いくつかの実施形態では、タンパク質は、分析物の混合物(例えば、ライセート)に存在する。いくつかの実施形態では、タンパク質は、複数の細胞からのライセートまたは単一の細胞からのライセートに存在する。
用語「相同」、「相同性」、または「相同率」は、本明細書で使用される場合、アミノ酸と対応する参照アミノ酸配列との間、またはポリヌクレオチド配列と対応する参照ポリヌクレオチド配列との間の配列同一性の程度を指す。「相同性」は、同様のポリマー配列、例えば、ポリペプチドまたはDNA配列を指し得る。相同性は、例えば、少なくとも約50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する核酸配列を意味し得る。他の実施形態では、核酸配列の「相同配列」は、参照核酸配列と少なくとも93%、95%、98%または99%の配列同一性を示し得る。例えば、「ゲノム領域に対して相同性の領域」は、ゲノムにおける所与のゲノム領域と同様の配列を有するDNAの領域であり得る。相同性の領域は、例えば、スペーサーまたはプライマー結合部位配列のゲノム領域への結合を促進するために十分な任意の長さのものであり得る。例えば、相同性の領域は、相同性の領域が、対応するゲノム領域との結合を受けるために十分な相同性を有するように、長さが少なくとも5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100個またはそれを超える塩基を含み得る。
配列相同性または同一性のパーセンテージが特定される場合、2つの核酸配列または2つのポリペプチド配列との関連で、相同性または同一性のパーセンテージは通常、最大一致のために比較及びアライメントされた場合、それらの長さの一部分にわたる2つ以上の配列のアライメントを指す。比較された配列における位置が同じ塩基またはアミノ酸によって占有され得る場合、そのときはその分子は、その位置で相同であり得る。別途記述されない限り、配列相同性または同一性は、核酸、ポリペプチドまたはその一部分の特定された長さにわたって評価される。いくつかの実施形態では、相同性または同一性は、その長さの機能的部分または特定された部分にわたって評価される。
配列相同性の評価のための配列のアライメントは、当該技術分野で知られているアルゴリズム、例えば、Altschul et al,J.Mol.Biol.215:403- 410,1990に記載されているBasic Local Alignment Search Tool(BLAST)アルゴリズムによって実行され得る。BLAST分析を実施するための公共に利用可能なインターネットインターフェースは、National Center for Biotechnology Informarionを介してアクセス可能である。追加の既知のアルゴリズムには、Smith & Waterman,“Comparison of Biosequences”,Adv.Appl.Math.2:482,1981;Needleman & Wunsch,“A general method applicable to the search for similarities in the amino acid sequence of two proteins” J.Mol.Biol.48:443,1970;Pearson & Lipman “Improved tools for biological sequence comparison”,Proc.Natl.Acad.Sci.USA 85:2444,1988で公開されているもの;またはこれらのまたは同様のアルゴリズムの自動化実行によるものが含まれる。グローバルアライメントプログラムもまた、およそ同等のサイズの同様の配列をアライメントするために使用され得る。グローバルアライメントプログラムの例には、EMBOSSパッケージ(Rice P et al.,Trends Genet.,2000;16:276-277)の一部であるNEEDLE(www.ebi.ac.uk/Tools/psa/emboss_needle/で利用可能)、及びFASTAパッケージ(Pearson W and Lipman D,1988,Proc.Natl.Acad.Sci.USA,85:2444-2448)の一部であるGGSEARCHプログラムhttps://fasta.bioch.virginia.edu/fasta_www2/が含まれる。これらのプログラムの両方は、それらの長さ全体に沿って2つの配列の最適なアライメント(ギャップを含む)を発見するために使用されるニードルマン・ウンシュアルゴリズムに基づく。配列分析の詳細な論述はまた、Ausubel et al(“Current Protocols in Molecular Biology ”John Wiley & Sons Inc,1994-1998,Chapter 15,1998)のユニット19.3で見られ得る。いくつかの実施形態では、クエリー配列及び参照配列の間のアライメントは、Altschul et al.(“Gapped BLAST and PSI-BLAST:a new generation of protein database search programs”,Nucleic Acids Res.25:3389-3402,1997)及びAltschul et al,(“Protein database searches using compositionally adjusted substitution matrices”,FEBS J.272:5101-5109,2005)にさらに記載されるように、存在:11、伸長1に設定されたギャップコストを用いてニードルマン・ウンシュアライメントで実施され、同一率は、同一の数をアライメントの長さで除算することによって計算される。
アミノ酸(またはヌクレオチド)位置は、アライメントに基づいて相同配列において決定され得ること、例えば、参照Cas9配列における「H840」は、Cas9ホモログが参照Cas9配列に対してアライメントされた場合、Cas9ホモログにおけるH839、または別の対応する位置に対応し得ることを当業者は理解する。用語「ホモログ」は、本明細書で使用される場合、共通の先祖のDNA配列によって別の遺伝子またはタンパク質と関連する遺伝子またはタンパク質を指す。ホモログは、オルソログまたはパラログであり得る。オルソログは、種形成事象によって別の遺伝子またはタンパク質に関連する遺伝子またはタンパク質を指す。パラログは、ゲノム内の重複事象によって別の遺伝子またはタンパク質に関連する遺伝子またはタンパク質を指す。パラログは、それが関連する遺伝子またはタンパク質の同じ種内にあり得る。パラログはまた、それが関連する遺伝子またはタンパク質の異なる種におけるものであり得る。いくつかの実施形態では、オルソログは、同じ機能を保持し得る。いくつかの実施形態では、パラログは、新たな機能を伴い得る。
用語「ポリヌクレオチド」または「核酸分子」は、DNA、RNA、そのハイブリダイゼーション、またはRNA-DNAキメラ分子を含む、ヌクレオチドの任意のポリマー形態であり得る。いくつかの実施形態では、ポリヌクレオチドは、cDNA、ゲノムDNA、mRNA、tRNA、rRNA、またはマイクロRNAを含む。いくつかの実施形態では、ポリヌクレオチドは、二本鎖、例えば、遺伝子における二本鎖DNAである。いくつかの実施形態では、ポリヌクレオチドは、一本鎖または実質的に一本鎖、例えば、一本鎖DNAまたはmRNAである。いくつかの実施形態では、ポリヌクレオチドは、無細胞核酸分子である。いくつかの実施形態では、ポリヌクレオチドは、血液中を循環する。いくつかの実施形態では、ポリヌクレオチドは、細胞性核酸分子である。いくつかの実施形態では、ポリヌクレオチドは、血液中を循環する細胞における細胞性核酸分子である。
ポリヌクレオチドは、任意の三次元構造を有し得る。以下は、ポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片(例えば、プローブ、プライマー、ESTまたはSAGEタグ)、エクソン、イントロン、遺伝子間DNA(限定されないが、ヘテロクロマチンDNAを含む)、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐状ポリヌクレオチド、プラスミド、ベクター、単離されたDNA、単離されたRNA、sgRNA、ガイドRNA、核酸プローブ、プライマー、snRNA、長鎖ノンコーディングRNA、snoRNA、siRNA、miRNA、tRNA由来小RNA(tsRNA)、アンチセンスRNA、shRNA、または小分子rDNA由来RNA(srRNA)。
いくつかの実施形態では、ポリヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチドまたはそれらのアナログを含む。いくつかの実施形態では、ポリヌクレオチドは、修飾されたヌクレオチド、例えば、メチル化ヌクレオチド及びヌクレオチドアナログを含む。存在する場合、ヌクレオチド構造に対する修飾は、ポリヌクレオチドの構築の前または後に付与され得る。ヌクレオチドの配列は、非ヌクレオチド成分によって中断され得る。ポリヌクレオチドは、例えば、標識成分とのコンジュゲーションによって、重合後にさらに修飾され得る。
いくつかの実施形態では、ポリヌクレオチドは、4つのヌクレオチド塩基:アデニン(A);シトシン(C);グアニン(G);チミン(T);及びポリヌクレオチドがRNAである場合はチミンに代えてウラシル(U)の特定の配列から構成される。いくつかの実施形態では、ポリヌクレオチドは、1つ以上の他のヌクレオチド塩基、例えば、グアニン(G)として翻訳機構によって読み取られるイノシン(I)を含み得る。
いくつかの実施形態では、ポリヌクレオチドは、修飾され得る。本明細書で使用される場合、用語「修飾された」または「修飾」は、A、C、G、T及びUヌクレオチドに関する化学的修飾を指す。いくつかの実施形態では、修飾は、ポリヌクレオチドを構成するヌクレオシドのヌクレオシド塩基及び/または糖部分上にあり得る。いくつかの実施形態では、修飾は、ヌクレオシド間結合(例えば、リン酸骨格)上にあり得る。いくつかの実施形態では、複数の修飾が、修飾された核酸分子に含まれる。いくつかの実施形態では、単一の修飾が、修飾された核酸分子に含まれる。
用語「相補体」、「相補的」、または「相補性」は、本明細書で使用される場合、2つのポリヌクレオチド分子が互いに塩基対合する能力を指す。相補的ポリヌクレオチドは、ワトソンクリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る水素結合を介して塩基対合され得る。例えば、1つのポリヌクレオチド分子上のアデニンは、第2のポリヌクレオチド分子上のチミンまたはウラシルと塩基対合し、1つのポリヌクレオチド分子上のシトシンは、第2のポリヌクレオチド分子上のグアニンと塩基対合する。2つのポリヌクレオチド分子は、第1のヌクレオチド配列を含む第1のポリヌクレオチド分子が、第2のヌクレオチド配列を含む第2のポリヌクレオチド分子と塩基対合し得る場合、互いに相補的である。例えば、2つのDNA分子5’-ATGC-3’及び5’-GCAT-3’は、相補的であり、DNA分子5’-ATGC-3’の相補体は、5’-GCAT-3’である。相補性のパーセンテージは、第2のポリヌクレオチド分子と塩基対合し得るポリヌクレオチド分子におけるヌクレオチドのパーセンテージを示す(例えば、10個のうち5、6、7、8、9、10個は、それぞれ、50%、60%、70%、80%、90%、及び100%相補的である)。「完全に相補的」は、ポリヌクレオチド分子の連続ヌクレオチドのすべてが、第2のポリヌクレオチド分子における同じ数の連続ヌクレオチドと塩基対合することを意味する。「実質的に相補的」は、本明細書で使用される場合、2つのポリヌクレオチド分子のすべてまたは一部分にわたって少なくとも70%、75%、80%、85%、90%、95%、97%、98%、または99%であり得る相補性の程度を指す。いくつかの実施形態では、相補性の一部分は、10、15、20、25、30、35、40、45、50個、またはそれを超えるヌクレオチドの領域であり得る。「実質的に相補的」はまた、2つのポリヌクレオチド分子の一部分または領域にわたって100%の相補性を指し得る。いくつかの実施形態では、2つのポリヌクレオチド分子間の相補性の一部分または領域は、2つのポリヌクレオチド分子またはその機能的もしくは定義される部分のうちの少なくとも1つの長さの少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、または99%である。
本明細書で使用される場合、「発現」は、ポリヌクレオチド、例えば、DNAがmRNA及び/またはプロセスに転写されるプロセス、及び/またはポリヌクレオチド、例えば、転写されたmRNAがペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。ポリヌクレオチドがゲノムDNAに由来する場合、発現には、真核細胞におけるmRNAのスプライシングが含まれ得る。いくつかの実施形態では、ポリヌクレオチド、例えば、タンパク質をコードする遺伝子またはDNAの発現は、遺伝子の転写及び翻訳の後の遺伝子によってコードされるタンパク質の量によって決定される。いくつかの実施形態では、ポリヌクレオチド、例えば、タンパク質をコードする遺伝子またはDNAの発現は、遺伝子の転写及び翻訳の後の遺伝子によってコードされるタンパク質の機能的形態の量によって決定される。いくつかの実施形態では、遺伝子の発現は、遺伝子の転写の後の遺伝子によってコードされるmRNA、または転写産物の量によって決定される。いくつかの実施形態では、ポリヌクレオチド、例えば、mRNAの発現は、mRNAの翻訳の後のmRNAによってコードされるタンパク質の量によって決定される。いくつかの実施形態では、ポリヌクレオチド、例えば、mRNAまたはコードRNAの発現は、ポリヌクレオチドの翻訳の後のポリペプチドによってコードされるタンパク質の機能的形態の量によって決定される。
用語「シーケンシング」は、本明細書で使用される場合、キャピラリーシーケンシング、バイサルファイトフリーシーケンシング、バイサルファイトシーケンシング、TETアシストバイサルファイト(TAB)シーケンシング、ACE-シーケンシング、ハイスループットシーケンシング、マキサム・ギルバートシーケンシング、超並列シグネチャシーケンシング、ポロニーシーケンシング、454パイロシーケンシング、サンガーシーケンシング、Illuminaシーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope単分子シーケンシング、単分子リアルタイム(SMRT)シーケンシング、ナノポアシーケンシング、ショットガンシーケンシング、RNAシーケンシング、またはそれらの任意の組み合わせを含み得る。
用語「同等」または「生物学的同等」は、特定の分子、または生物学的または細胞物質に言及する場合に互換的に使用され、所望の構造または機能性を依然として維持しながら、別の分子に対する最小の相同性を有する分子を意味する。
用語「コードする」は、ポリヌクレオチドに適用される場合、そのネイティブ状態でまたは当業者によく知られている方法によって操作される際に、ポリヌクレオチド合成鋳型として使用され得る場合、例えば、RNAに転写され、DNAまたはcDNAに逆転写され、及び/またはアミノ酸、またはポリペプチドもしくはその断片を生成するように翻訳され得る場合、別のポリヌクレオチド、ポリペプチド、またはアミノ酸を「コードする」と称されるポリヌクレオチドを指す。いくつかの実施形態では、3つの連続ヌクレオチドを含むポリヌクレオチドは、特定のアミノ酸をコードするコドンを形成する。いくつかの実施形態では、ポリヌクレオチドは、ポリペプチドをコードする1つ以上のコドンを含む。いくつかの実施形態では、1つ以上のコドンを含むポリヌクレオチドは、野生型参照ポリヌクレオチドと比較してコドンにおける変異を含む。いくつかの実施形態では、コドンにおける変異は、野生型参照ポリペプチドと比較してポリヌクレオチドによってコードされるポリペプチドにおけるアミノ酸置換をコードする。
用語「変異」は、本明細書で使用される場合、タンパク質のアミノ酸配列またはポリヌクレオチドの核酸配列における変化及び/または改変を指す。そのような変化及び/または改変は、参照アミノ酸または参照核酸配列と比較して、アミノ酸配列の場合は1つ以上のアミノ酸、及び/または核酸配列の場合はヌクレオチドの置換、挿入、欠失及び/または切断を含み得る。いくつかの実施形態では、参照配列は、野生型配列である。いくつかの実施形態では、ポリヌクレオチドの核酸配列における変異は、ポリペプチドのアミノ酸配列における変異をコードする。いくつかの実施形態では、ポリペプチドのアミノ酸配列における変異またはポリヌクレオチドの核酸配列における変異は、疾患状態に関連する変異である。「参照配列」は、配列比較のための基礎として使用される定義された配列である。参照配列は、指定される配列のサブセットまたは全体;例えば、全長cDNA配列、RNA配列、DNA配列、遺伝子配列もしくはポリペプチド配列のセグメント、または完全なcDNA配列、RNA配列、DNA配列、遺伝子配列もしくはポリペプチド配列であり得る。いくつかの実施形態では、参照配列は、対象となるタンパク質の野生型配列またはそのバリアントである。他の実施形態では、参照配列は、野生型タンパク質またはそのバリアントをコードするポリヌクレオチド配列である。
用語「対象」及びその文法的同等物は、本明細書で使用される場合、ヒトまたは非ヒトを指し得る。対象は、哺乳動物であり得る。ヒト対象は、男性または女性であり得る。ヒト対象は、任意の年齢のものであり得る。対象は、ヒト胚であり得る。ヒト対象は、新生児、幼児、小児、青年期、または成人であり得る。ヒト対象は、最大で約100歳であり得る。ヒト対象は、遺伝子疾患または障害のための処置を必要とし得る。
用語「処置」または「処置すること」及びそれらの文法的同等物は、疾患、病態、または障害の症状を治癒、改善、または改善することを目的とした対象の医学的管理を指し得る。処置には、能動的処置、すなわち、疾患、病態、または障害の改善に対して具体的に仕向けられた処置が含まれ得る。処置には、原因処置、すなわち、関連する疾患、病態、または障害の原因の除去に対して仕向けられた処置が含まれ得る。また、この処置には、姑息的処置、すなわち、疾患、病態、または障害の治癒ではなく、症状の軽減のために設計された処置が含まれ得る。処置には、補助的処置、すなわち、疾患、病態、または障害の改善に対して仕向けられた別の特定の療法を補うために用いられる処置が含まれ得る。いくつかの実施形態では、病態は、病理学的であり得る。いくつかの実施形態では、処置は、疾患、病態、または障害を完全に治癒または予防することができない。いくつかの実施形態では、処置は、疾患、病態、または障害を改善するが、完全に治癒または予防しない。いくつかの実施形態では、対象は、12時間、24時間、2日、3日、4日、5日、6日、7日、2週、3週、4週、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、1年、2年、3年、4年、5年、6年、無限に、または対象の人生の間、処置され得る。
用語「改善する」及びその文法的同等物は、疾患の発症または進行を低減、抑制、減弱、軽減、停止、好転、または安定化することを意味する。
用語「予防する」または「予防すること」は、所定の期間、疾患、病態、または障害の開始または発症を遅延、防止、または回避することを意味する。予防するはまた、疾患、障害、または病態を発症するリスクを低減することを意味する。予防には、疾患、病態、または障害の発症を最小化すること、または部分的もしくは完全に阻害することが含まれる。いくつかの実施形態では、組成物、例えば、薬学的組成物は、12時間、24時間、2日、3日、4日、5日、6日、7日、2週、3週、4週、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、1年、2年、3年、4年、5年、6年、無限に、または対象の人生の間、障害の開始を遅延させることによって障害を予防する。
用語「有効量」または「治療的有効量」は、本明細書に開示される対象への導入後に所望の活性をもたらすために十分であり得る組成物、例えば、コンストラクトを含むプライム編集組成物の量を指す。プライム編集組成物の有効量は、細胞がex vivoまたはin vivoであるかどうかにかかわらず、遺伝子または細胞を標的とするために提供され得る。有効量は、陰性対照と比べて観察される標的核酸調節の量が、例えば、少なくとも約2倍以上の変化(増加または低下)を誘導するための量であり得る。有効量または用量は、例えば、標的遺伝子調節(例えば、機能的タンパク質を生成するための標的遺伝子の発現)の約2倍の増加、約3倍の増加、約4倍の増加、約5倍の増加、約6倍の増加、約7倍の増加、約8倍の増加、約9倍の増加、約10倍の増加、約25倍の増加、約50倍の増加、約100倍の増加、約200倍の増加、約500倍の増加、約700倍の増加、約1000倍の増加、約5000倍の増加、または約10,000倍の増加を誘導し得る。標的遺伝子調節の量は、当該技術分野で知られている任意の好適な方法によって測定され得る。いくつかの実施形態では、「有効量」または「治療的有効量」は、未処置患者と比べて疾患の症状を改善するために必要とされる組成物の量である。いくつかの実施形態では、有効量は、細胞(例えば、in vitroまたはin vivoの細胞)における対象となる遺伝子における改変を導入するために十分な組成物の量である。
有効量は、細胞の集団に投与された場合、細胞の集団の所定の割合が変異の修正を有するように誘導するための量であり得る。例えば、いくつかの実施形態では、有効量は、細胞の集団に投与または導入された場合、細胞の集団の少なくとも約1%、2%、5%、約10%、約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、または約99%において、標的遺伝子における変異を修正する1つ以上の意図されるヌクレオチド編集の導入を誘導するための量であり得る。
用語「逆転写酵素」または「RT」は、本明細書で使用される場合、RNA鋳型からDNA分子を合成する酵素のクラスを指す。RTは、露出した3’ヒドロキシル基を有するプライマー分子を必要とし得る。いくつかの実施形態では、RTのプライマー分子は、DNA分子である。いくつかの実施形態では、RTのプライマー分子は、RNA分子である。いくつかの実施形態では、RTは、DNAポリメラーゼ活性及びRNase H活性の両方を含む。2つの活性は、RTにおける2つの別個のドメインに所在し得る。
用語「リンカー」は、本明細書で使用される場合、2つの分子または部位を連結する結合、化学基、または分子、例えば、融合タンパク質を形成するための2つのタンパク質ドメインを指す。いくつかの実施形態では、リンカーは、ペプチドリンカーである。いくつかの実施形態では、リンカーは、ポリヌクレオチドまたはオリゴヌクレオチドリンカーである。例えば、RNA結合タンパク質動員配列、例えば、MS2ポリヌクレオチド配列は、プライムエディターのCas9ドメイン及びDNAポリメラーゼドメインを接続するために使用され得、Cas9ドメイン及びDNAポリメラーゼドメインの一方は、MS2コートタンパク質に融合される。いくつかの実施形態では、ペプチドリンカーは、リンカーまたはリンカーによって連結される配列または分子の用途に応じて、様々な長さを有し得る。
用語「融合タンパク質」は、複数の天然に存在するまたは組換え的に生成されたタンパク質からのドメインを含むタンパク質であって、通常、各ドメインが異なる機能を果たすものを指す。ドメインは、アミノ酸の特定の構成を含み得る。ドメインはまた、本明細書に記載されるタンパク質の構造を含み得る。
本明細書には、いくつかの実施形態では、上述したPEgRNA、上述したニックガイド配列、プライマー編集体、プライム編集組成物またはそれらの任意の組み合わせをコードする核酸を含むポリヌクレオチド及びコンストラクトを含む組成物が開示される。所定の実施形態では、本明細書では、標的ポリヌクレオチド、例えば、標的遺伝子のプログラム可能なプライム編集のためのプライムエディターが提供される。
プライム編集
用語「プライム編集」は、標的プライミング化DNA合成を介して意図されるヌクレオチド編集(本明細書でヌクレオチド変化とも称される)を標的DNAに組み込むためにPEgRNAと複合体化されたプライムエディターを使用した標的DNAのプログラム可能な編集を指す。プライム編集の標的DNAポリヌクレオチド、例えば、標的遺伝子は、2つの相補鎖を有する二本鎖DNA分子を含み得る:第1の鎖は、「標的鎖」または「非編集鎖」と称され得、第2の鎖は、「非標的鎖」、または「編集鎖」と称され得る。いくつかの実施形態では、プライム編集ガイドRNA(PEgRNA)において、スペーサー配列は、「サーチ標的配列」と称され得る、標的鎖上の特定の配列に相補的または実質的に相補的である。いくつかの実施形態では、スペーサー配列は、サーチ標的配列で標的鎖とアニーリングする。標的鎖はまた、「非プロトスペーサー隣接モチーフ(非PAM鎖)」と称され得る。いくつかの実施形態では、非標的鎖はまた、「PAM鎖」と称され得る。いくつかの実施形態では、PAM鎖は、プロトスペーサー配列及び任意にプロトスペーサー隣接モチーフ(PAM)配列を含む。Cas-タンパク質ベースのプライムエディターを使用するプライム編集において、PAM配列は、標的遺伝子のPAM鎖上のプロトスペーサー配列にすぐ隣接する短いDNA配列を指す。PAM配列は、プログラム可能なDNA結合タンパク質、例えば、CasニッカーゼまたはCasヌクレアーゼによって特異的に認識され得る。いくつかの実施形態では、特定のPAMは、特定のプログラム可能なDNA結合タンパク質、例えば、CasニッカーゼまたはCasヌクレアーゼ、例えば、Cas9ニッカーゼまたはCas9ヌクレアーゼに特徴的である。プロトスペーサー配列は、サーチ標的配列に相補的な二本鎖標的DNA(例えば、標的遺伝子)のPAM鎖における特定の配列を指す。PEgRNAにおいて、スペーサー配列は、スペーサー配列がウラシル(U)を含み得、プロトスペーサー配列がチミン(T)含み得ることを除き、二本鎖標的DNA(例えば、標的遺伝子)の編集鎖上のプロトスペーサー配列と実質的に同一の配列を有し得る。
いくつかの実施形態では、二本鎖標的DNAは、PAM鎖(または非標的鎖)上でニック部位を含む。本明細書で使用される場合、「ニック部位」は、二本鎖標的DNAの2つのヌクレオチドまたは2つの塩基対における特定の位置を指す。いくつかの実施形態では、ニック部位の位置は、特定のPAM配列の位置に対して決定される。いくつかの実施形態では、ニック部位は、二本鎖標的DNAが、ニッカーゼ、例えば、特定のPAM配列を認識するCasニッカーゼと接触させられた場合、ニックが生じることになる特定の位置である。いくつかの実施形態では、ニック部位は、二本鎖標的DNAのPAM鎖上の特定のPAM配列の上流にある。いくつかの実施形態では、ニック部位は、二本鎖標的DNAのPAM鎖上の特定のPAM配列の下流にある。いくつかの実施形態では、ニック部位は、Cas9ニッカーゼによって認識されるPAM配列の上流にあり、Cas9ニッカーゼは、ヌクレアーゼ活性RuvCドメイン及びヌクレアーゼ不活性NHNドメインを含む。いくつかの実施形態では、ニック部位は、PAM配列の3ヌクレオチド上流にあり、PAM配列は、ヌクレアーゼ活性RuvCドメイン及びヌクレアーゼ不活性NHNドメインを含むStreptococcus pyogenes Cas9ニッカーゼ、P.lavamentivorans Cas9ニッカーゼ、C.diphtheriae Cas9ニッカーゼ、N.cinerea Cas9、S.aureus Cas9、またはN.lari Cas9ニッカーゼによって認識される。いくつかの実施形態では、ニック部位は、PAM配列の2ヌクレオチド上流にあり、PAM配列は、ヌクレアーゼ活性RuvCドメイン及びヌクレアーゼ不活性NHNドメインを含むS.thermophilus Cas9ニッカーゼによって認識される。
「プライマー結合部位」(PBSまたはプライマー結合部位配列とも称される)は、PAM鎖(すなわち、非標的鎖または編集鎖)に相補的な領域を含むPEgRNAの一本鎖部分である。PBSは、ニック部位のすぐ上流にある二本鎖標的DNAのPAM鎖上の配列に相補的または実質的に相補的である。いくつかの実施形態では、プライム編集のプロセスにおいて、PEgRNA複合体は、プライムエディターと複合体化し、それを二本鎖標的DNAの標的鎖上のサーチ標的配列に結合するように誘導し、二本鎖標的DNAの非標的鎖上のニック部位でニックを生成する。いくつかの実施形態では、PBSは、ニック部位における二本鎖標的DNAの非標的鎖上の遊離3’末端に相補的または実質的に相補的であり、それにアニーリングし得る。いくつかの実施形態では、非標的鎖上の遊離3’にアニーリングされたPBSは、標的プライミング化DNA合成を開始させ得る。
PEgRNAの「編集鋳型」は、PBSの5’にあり、かつPAM鎖(すなわち、非標的鎖または編集鎖)に対して相補性の領域を含むPEgRNAの一本鎖部分であり、二本鎖標的DNAの内因性配列と比較して1つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型及びPBSは、互いにすぐ隣接する。したがって、いくつかの実施形態では、プライム編集におけるPEgRNAは、互いにすぐ隣接するPBS及び編集鋳型を含む一本鎖部分を含む。いくつかの実施形態では、PBS及び編集鋳型の両方を含むPEgRNAの一本鎖部分は、意図されるヌクレオチド編集位置における1つ以上の非相補的ヌクレオチドを除き、二本鎖標的DNAのPAM鎖(すなわち、非標的鎖または編集鎖)上の内因性配列に相補的または実質的に相補的である。本明細書で使用される場合、他の文脈における相対的5’-3’配置にかかわらず、PBSと編集鋳型との間の相対的位置、及びPEgRNAの要素間の相対的位置は、PEgRNAの要素と相補性または同一性を有し得る二本鎖標的DNAにおける配列の位置にかかわらず、単分子としてのPEgRNA5’から3’への順序によって決定される。いくつかの実施形態では、編集鋳型は、意図されるヌクレオチド編集位置における1つ以上の非相補的ヌクレオチドを除き、ニック部位のすぐ下流にあるPAM鎖上の配列と相補的または実質的に相補的である。意図されるヌクレオチド編集に対応する位置における1つ以上の非相補的ヌクレオチドを除き、編集鋳型に相補的または実質的に相補的である内因性、例えば、ゲノム配列は、「編集標的配列」と称され得る。いくつかの実施形態では、編集鋳型は、意図されるヌクレオチド編集位置における1つ以上の挿入、欠失、または置換を除き、編集標的配列と相補的である、または編集標的配列とゲノムにおいて同じ位置を有する標的鎖上の配列と同一性または実質的同一性を有する。いくつかの実施形態では、編集鋳型は、一本鎖DNAをコードし、一本鎖DNAは、1つ以上の意図されるヌクレオチド編集の位置における1つ以上の挿入、欠失、または置換を除き、編集標的配列と同一性または実質的同一性を有する。
いくつかの実施形態では、PEgRNAは、プライムエディターと複合体化し、それを標的遺伝子のサーチ標的配列と結合させるように誘導する。いくつかの実施形態では、結合したプライムエディターは、標的遺伝子の編集鎖(PAM鎖)上でニックを生成する。いくつかの実施形態では、PEgRNAのプライマー結合部位(PBS)は、ニック部位で形成された遊離3’末端とアニーリングし、プライムエディターは、遊離3’末端をプライマーとして使用して、ニック部位からDNA合成を開始させる。その後、PEgRNAの編集鋳型によってコードされる一本鎖DNAが合成される。いくつかの実施形態では、新しく合成された一本鎖DNAは、内因性標的遺伝子配列と比較して1つ以上の意図されるヌクレオチド編集を含む。したがって、いくつかの実施形態では、PEgRNAの編集鋳型は、編集鋳型における意図されるヌクレオチド編集位置における1つ以上のミスマッチを除き、編集鎖における配列と相補的である。いくつかの実施形態では、新しく合成された一本鎖DNAは、意図されるヌクレオチド編集位置における1つ以上の挿入、欠失、または置換を除き、編集標的配列における配列と同一性または実質的同一性を有する。編集鋳型と部分的に相補的である内因性、例えば、ゲノム配列は、「編集標的配列」と称され得る。
いくつかの実施形態では、新しく合成された一本鎖DNAは、標的遺伝子の標的鎖と対合するために二本鎖標的DNA(例えば、標的遺伝子)の編集鎖上の編集標的と平衡化する。いくつかの実施形態では、二本鎖標的DNA(例えば、標的遺伝子)の編集標的配列は、フラップエンドヌクレアーゼ(FEN)、例えば、FEN1によって切除される。いくつかの実施形態では、FENは、例えば、二本鎖標的DNA、例えば、標的遺伝子を含む細胞における、内因性FENである。いくつかの実施形態では、FENは、プライムエディターの他の成分と連結されたまたはトランスで提供される、プライムエディターの一部として提供される。いくつかの実施形態では、意図されるヌクレオチド編集を含む新しく合成された一本鎖DNAは、二本鎖標的DNA(例えば、標的遺伝子)の編集鎖上の内因性一本鎖編集標的配列に置き換わる。いくつかの実施形態では、新しく合成された一本鎖DNA及び標的鎖上の内因性DNAは、二本鎖標的DNA(例えば、標的遺伝子)の編集標的配列に対応する領域でヘテロ二本鎖DNA構造を形成する。いくつかの実施形態では、ヌクレオチド編集を含む新しく合成された一本鎖DNAは、ヌクレオチド編集を含まない標的DNAの標的鎖とヘテロ二本鎖で対合され、それにより2つの他の相補鎖間でミスマッチを生成する。いくつかの実施形態では、ミスマッチは、DNA修復機構、例えば、内因性DNA修復機構によって認識される。いくつかの実施形態では、DNA修復を介して、意図されるヌクレオチド編集は、二本鎖標的DNA(例えば、標的遺伝子)に組み込まれる。
プライムエディター
用語「プライムエディター(PE)」は、プライム編集に関与するポリペプチドまたはポリペプチド成分を指す。様々な実施形態では、プライムエディターには、DNA結合活性を有するポリペプチドドメイン(例えば、DNA結合ドメイン)及びDNAポリメラーゼ活性を有するポリペプチドドメイン(例えば、DNAポリメラーゼドメイン)が含まれる。いくつかの実施形態では、プライムエディターは、DNA結合活性を有するポリペプチドドメイン(例えば、DNA結合ドメイン)を含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメインを含むポリペプチドを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメインを含む。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼ活性を有するポリペプチドドメイン(例えば、DNAポリメラーゼドメイン)を含む。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメインを含むポリペプチドを含む。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメインを含むポリペプチド及びDNAポリメラーゼドメインを含むポリペプチドを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメイン及びDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、リンカー、例えば、ペプチドリンカー、例えば、GSリッチペプチドリンカーによって連結されたDNA結合ドメイン及びDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、リンカー、例えば、ペプチドリンカー、例えば、GSリッチペプチドリンカーによって連結されたDNA結合ドメイン及びDNAポリメラーゼドメインを含む融合ポリペプチドを含む。
いくつかの実施形態では、プライムエディターは、ヌクレアーゼ活性を有するポリペプチドドメインを含む。いくつかの実施形態では、DNA結合活性を有するポリペプチドドメインは、ヌクレアーゼドメインまたはヌクレアーゼ活性を含む。いくつかの実施形態では、DNA結合ドメインは、ヌクレアーゼドメインまたはヌクレアーゼ活性を含む。いくつかの実施形態では、ヌクレアーゼ活性を有するポリペプチドドメインは、ニッカーゼ、または十分に活性なヌクレアーゼを含む。いくつかの実施形態では、DNA結合ドメインは、ニッカーゼ、または十分に活性なヌクレアーゼを含む。本明細書で使用される場合、用語「ニッカーゼ」は、二本鎖DNA標的の一方の鎖のみを切断することが可能なヌクレアーゼを指す。いくつかの実施形態では、プライムエディターは、不活性ヌクレアーゼであるポリペプチドドメインを含む。いくつかの実施形態では、DNA結合ドメインは、不活性ヌクレアーゼ;例えば、dCas9であるヌクレアーゼドメインを含む。いくつかの実施形態では、DNA結合ドメインは、核酸でガイドされるDNA結合ドメイン、例えば、CRISPR-Casタンパク質、例えば、Cas9ニッカーゼ、Cpf1ニッカーゼ、または別のCRISPR-Casヌクレアーゼを含む。いくつかの実施形態では、DNA結合ドメイン(例えば、核酸でガイドされるDNA結合ドメイン)は、Casタンパク質ドメインである。いくつかの実施形態では、Casタンパク質は、Cas9;例えば、Cas9ヌクレアーゼ;例えば、dCas9、Cas9ニッカーゼである。いくつかの実施形態では、Casタンパク質ドメインは、ニッカーゼまたはニッカーゼ活性を含む。いくつかの実施形態では、DNA結合ドメインは、Cas9またはそのバリアント(例えば、ニッカーゼバリアント)である。いくつかの実施形態では、プログラム可能なDNA結合活性を有するポリペプチドドメインは、核酸でガイドされるDNA結合ドメイン、例えば、CRISPR-Casタンパク質、例えば、Cas9ニッカーゼ、Cpf1ニッカーゼ、または別のCRISPR-Casヌクレアーゼを含む。
いくつかの実施形態では、DNAポリメラーゼ活性を有するポリペプチドドメインは、鋳型依存性DNAポリメラーゼ、例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼを含む。いくつかの実施形態では、DNA結合ドメインは、鋳型依存性DNAポリメラーゼ、例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼを含む。いくつかの実施形態では、DNAポリメラーゼドメインは、逆転写酵素ドメイン(RTドメイン)または逆転写酵素(RT)を含む。いくつかの実施形態では、DNAポリメラーゼドメインは、RTドメインまたはRTである。いくつかの実施形態では、プライムエディターは、逆転写酵素(RT)活性を含む。例えば、プライムエディターの第1のポリペプチドは、標的プライミング化逆転写のための活性を有し得る。いくつかの実施形態では、DNAポリメラーゼ活性を有するポリペプチドドメインは、逆転写酵素活性(例えば、標的プライミング化逆転写のための活性)を含む。
いくつかの実施形態では、DNAポリメラーゼは、逆転写酵素である。いくつかの実施形態では、プライムエディターは、プライム編集に関与する追加のポリペプチド、例えば、プライム編集プロセスを編集された生成物形成に向けて誘導することを補助するための5’エンドヌクレアーゼ活性を有するポリペプチドドメイン、例えば、5’内因性DNAフラップエンドヌクレアーゼ(例えば、FEN1)を含む。いくつかの実施形態では、プライムエディターは、RNA-タンパク質動員ポリペプチド、例えば、MS2コートタンパク質をさらに含む。
いくつかの実施形態では、プライムエディターは、異なる種に由来するCasポリペプチド(すなわち、DNA結合ドメイン)及び逆転写酵素ポリペプチド(すなわち、DNAポリメラーゼドメイン)を含む。例えば、プライムエディターは、S.pyogenes Cas9ポリペプチド及びモロニーマウス白血病ウイルス(M-MLV)逆転写酵素ポリペプチドを含み得る。いくつかの実施形態では、プライムエディターは、異なる種に由来するCasポリペプチド(すなわち、DNA結合ドメイン)及び逆転写酵素ポリペプチド(すなわち、DNAポリメラーゼドメイン)を含む融合ポリペプチドを含む。例えば、プライムエディターは、S.pyogenes Cas9ポリペプチド及びモロニーマウス白血病ウイルス(M-MLV)逆転写酵素(RT)ポリペプチドを含み得る。
いくつかの実施形態では、プライムエディターのポリペプチドドメイン(例えば、DNA結合ドメイン及びDNAポリメラーゼドメイン)は、融合タンパク質を形成するためにペプチドリンカーによって融合または連結されている。他の実施形態では、プライムエディターは、非ペプチド結合を介してまたはアプタマーまたは動員配列を介して互いに会合することが可能である、別々のタンパク質としてトランスで提供される1つ以上のポリペプチドドメイン(例えば、DNA結合ドメイン及びDNAポリメラーゼドメイン)を含む。いくつかの実施形態では、プライムエディターは、ペプチドリンカー(例えば、配列番号286~411に示される開示されたリンカー)によって互いに融合または連結されたDNA結合ドメイン及びDNAポリメラーゼドメイン(例えば、逆転写酵素ドメインまたはRT)を含む。
いくつかの実施形態では、プライムエディターは、いくつかの実施形態では、PEgRNAに連結され得るRNA-タンパク質動員アプタマー、例えば、MS2アプタマーによって互いに融合または連結されたDNA結合ドメイン及びDNAポリメラーゼドメイン(例えば、逆転写酵素ドメインまたはRT)を含む。
いくつかの実施形態では、プライムエディターは、1つ以上の核局在化配列(NLS)をさらに含む。いくつかの実施形態では、プライムエディターの1つ以上のポリペプチドは、(例えば、ペプチドリンカーを介して)1つ以上のNLSに融合または連結されている。いくつかの実施形態では、プライムエディターは、トランスで提供されるDNA結合ドメイン及びDNAポリメラーゼドメインを含み、DNA結合ドメイン及び/またはDNAポリメラーゼドメインは、1つ以上のNLSに融合または連結されている。
プライムエディターポリペプチド成分は、1つ以上のポリヌクレオチドによって全体的または部分的にコードされ得る。本開示は、プライムエディター成分をコードするポリヌクレオチド、例えば、DNA結合ドメインをコードするポリヌクレオチド、及びDNAポリメラーゼドメインをコードするポリヌクレオチドを企図する。本開示はまた、DNA結合ドメインをコードするポリヌクレオチド、及びDNAポリメラーゼドメインをコードするポリヌクレオチドを含む単一のポリヌクレオチドを企図する。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、DNAポリメラーゼドメインをコードするポリヌクレオチドは、DNAである。いくつかの実施形態では、DNAポリメラーゼドメインをコードするポリヌクレオチドは、RNA(例えば、mRNA)である。いくつかの実施形態では、プライム編集組成物は、DNA結合ドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチドは、DNAである。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチドは、RNA(例えば、mRNA)である。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチド、及びDNAポリメラーゼドメインをコードするポリヌクレオチドは、ペプチドリンカーによって連結されたDNAポリメラーゼドメイン及びDNA結合ドメインを含む融合タンパク質(例えば、プライムエディター)をもたらすためにリンカーポリヌクレオチド(例えば、ペプチドリンカーをコードする)によって連結される。いくつかの実施形態では、リンカーポリヌクレオチドは、DNAである。いくつかの実施形態では、リンカーポリヌクレオチドは、RNA(例えば、mRNA)である。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチド配列、及びDNAポリメラーゼドメインをコードするポリヌクレオチドは、リンカーポリヌクレオチド(例えば、ペプチドリンカーをコードする)によって連結され、1つ以上のNLSをコードする1つ以上のポリヌクレオチド配列をさらに含むことで、ペプチドリンカーによって連結され、かつ1つ以上のNLSにさらに融合または連結されたDNAポリメラーゼドメイン及びDNA結合ドメインを含む融合タンパク質(例えば、プライムエディター)をもたらす。
いくつかの実施形態では、単一のポリヌクレオチド(例えば、単一のmRNA)コンストラクト、またはベクターが、プライムエディター融合タンパク質をコードする。いくつかの実施形態では、複数のポリヌクレオチド、コンストラクト、またはベクターがそれぞれ、プライムエディターのドメインのポリペプチドドメインもしくは一部分、またはプライムエディター融合タンパク質の一部分をコードする。例えば、プライムエディター融合タンパク質は、インテイン-Nに融合されたN末端部分及びインテイン-Cに融合されたC末端部分を含み得、これらの各々は、AAVベクターによって個々にコードされる。いくつかの実施形態では、本明細書に開示されるプライムエディターの成分(例えば、DNA結合ドメインを含むポリペプチド及び/またはDNAポリメラーゼドメインを含むポリペプチド)は、スプリットインテインを介して翻訳後に一緒にもたらされ得る。
いくつかの実施形態では、プライムエディターポリペプチドは、アミノ酸配列を含み得、最初のメチオニン(位置1)は、任意に存在しない。いくつかの実施形態では、プライムエディターポリペプチド配列は、N末端メチオニン残基を含み得る。いくつかの実施形態では、プライムエディターポリペプチド配列は、N末端メチオニンを欠き得る。いくつかの実施形態では、翻訳開始コドン、例えば、ATGによってコードされるN末端メチオニンは、翻訳後にプライムエディターポリペプチドから除去され得る。いくつかの実施形態では、翻訳開始コドン、例えば、ATGによってコードされるN末端メチオニンは、プライムエディターポリペプチド配列に存在したままであり得る。いくつかの実施形態では、プライムエディターポリペプチドのアミノ酸配列は、1つ以上の処理酵素によって、例えば、メチオニンアミノペプチダーゼ(MAP)によってN末端修飾され得る。
いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメイン及びDNA結合ドメインを含み、DNAポリメラーゼドメイン及び/またはDNA結合ドメインのアミノ酸配列は、N末端メチオニンを含む。いくつかの実施形態では、プライムエディターは、参照DNAポリメラーゼアミノ酸配列と比べてN末端メチオニンを欠くアミノ酸配列を含むDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、参照DNA結合ドメインアミノ酸配列と比べてN末端メチオニンを欠くアミノ酸配列を含むDNA結合ドメインを含む。
いくつかの実施形態では、プライムエディター及び/またはその成分(例えば、DNA結合ドメインまたはDNA結合ドメイン及び/またはDNAポリメラーゼドメインを含むポリペプチドまたはDNAポリメラーゼドメインを含むポリペプチド)は、操作され得る。いくつかの実施形態では、プライムエディターのポリペプチド成分は、同じ生物または細胞環境において自然に発生しない。いくつかの実施形態では、プライムエディターのポリペプチド成分は、異なる起源のものまたは異なる生物からのものであり得る。いくつかの実施形態では、プライムエディターは、異なる種に由来するDNA結合ドメイン及びDNAポリメラーゼドメインを含む。
いくつかの実施形態では、プライムエディターは、合理的に操作されたRTまたはRTドメイン(例えば、M-MLV RT)を含む。そのような操作されたRTまたはRTドメインは、例えば、天然に存在するRTまたはRTドメインとは異なる配列またはアミノ酸変化を含み得る。いくつかの実施形態では、操作されたRTまたはRTドメインは、対応する天然に存在するRTまたはRTドメインと比べて改善されたRT活性を含む。いくつかの実施形態では、操作されたRTまたはRTドメインは、プライムエディターにおいて使用される場合、対応する天然に存在するRTまたはRTドメインと比べて改善されたプライム編集効率を含む。
いくつかの実施形態では、プライムエディターポリペプチドは、表14に記述されるアミノ酸配列のいずれか1つとまたは配列番号2、6、7、または596~613に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNA結合ドメイン(例えば、Cas9)を含む。
いくつかの実施形態では、プライム編集組成物は、a)DNA結合ドメインまたはDNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたはM-MLV RTドメインをコードするポリヌクレオチドを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸L478の後の位置でC末端で切断されている。いくつかの実施形態では、プライム編集組成物は、a)DNA結合ドメインまたはDNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたはM-MLV RTドメインをコードするポリヌクレオチドを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるL478とG504との間の位置で切断された位置でC末端で切断されている。
いくつかの実施形態では、プライムエディターポリペプチドは、MMLV-RTまたはその変異体、断片もしくはバリアントを含むDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、野生型MMLV-RTを含む。いくつかの実施形態では、プライムエディターは、1つ以上のアミノ酸置換、挿入、及び/または欠失を含むMMLV-RTバリアント、例えば、配列番号1に示される参照MMLV-RT配列と比較して1つ以上のアミノ酸置換、挿入、及び/または欠失を含むMMLV-RTバリアントを含む。いくつかの実施形態では、MMLVRTバリアントは、参照MMLVRT配列配列番号1と比較して1つ以上のD200N、T306K、W313F、T330P、L603Wアミノ酸置換を含む。いくつかの実施形態では、MMLVRTバリアントは、参照MMLVRT配列配列番号1と比較してD200N、T306K、W313F、T330P、及びL603Wアミノ酸置換を含む(そのバリアントは、MMLVRT5Mバリアントとも称される)。いくつかの実施形態では、MMLV RTバリアントは、参照MMLVRT配列配列番号1と比較してD524N、L435K、Y133R、Y271Rアミノ酸置換のうちの1つ以上を含む。いくつかの実施形態では、MMLV RTバリアントは、参照MMLVRT配列配列番号1と比較して1つ以上のアミノ酸欠失を有する。例えば、いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されている。C末端で切断されるとは、切断位置に対してC末端のアミノ酸が、参照配列と比較してMMLV RT配列から欠失させられることを意味し、すなわち、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたMMLV RTバリアントは、配列番号1に示される位置1~504におけるアミノ酸のみを含有する(そのような切断は、本明細書で504X、またはG504X切断と称され得る)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されている(L478X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示される位置478と505との間の任意のアミノ酸位置でC末端で切断されている。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸365及び366に対応する位置の間でC末端で切断されている(P365X)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸278及び279に対応する位置の間でC末端で切断されている(R278X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸328及び329に対応する位置の間でC末端で切断されている(T328X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸378及び379に対応する位置の間でC末端で切断されている(K478X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸428及び429に対応する位置の間でC末端で切断されている(M428X末端)。いくつかの実施形態では、プライムエディターポリペプチドは、表67に記述されるアミノ酸配列のいずれか1つとまたは配列番号1、4、5、36、45、54、63、または623に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNAポリメラーゼドメイン(例えば、MMLV-RT)を含む。いくつかの実施形態では、プライムエディターポリペプチドは、アミノ酸配列配列番号5を含むMMLV-RTドメインを含む。いくつかの実施形態では、プライムエディターポリペプチドは、配列番号36のアミノ酸配列を有するC末端切断MMLV-RTドメインを含む。
いくつかの実施形態では、プライムエディターポリペプチドは、DNA結合ドメイン及びDNAポリメラーゼドメインを接続する1つ以上のペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、N末端からC末端へ、DNA結合ドメイン、ペプチドリンカー、及びDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、C末端からN末端へ、DNA結合ドメイン、ペプチドリンカー、及びDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号286~411からなる群から選択されるアミノ酸配列を含むアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号289~311に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号289~311に示されるアミノ酸配列のいずれか1つと少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号289~311からなる群から選択されるアミノ酸配列を含むアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302と少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302と少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302のアミノ酸配列を含むアミノ酸配列を含むペプチドリンカーを含む。
いくつかの実施形態では、プライムエディターポリペプチドは、1つ以上のNLSを含む。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、1つ以上のNLSを含む。いくつかの実施形態では、プライムエディターのDNAポリメラーゼドメインは、1つ以上のNLSを含む。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、2つ以上のNLSを含む。いくつかの実施形態では、プライムエディターのDNAポリメラーゼドメインは、2つ以上のNLSを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメインとDNAポリメラーゼドメインとの間に1つ以上または2つ以上のNLSを含む融合タンパク質を含む。NLS配列は、当該技術分野で知られている任意のNLSであり得る。いくつかの実施形態では、プライムエディターは、表2に記述されるアミノ酸配列のいずれか1つとまたは配列番号8~24、または621に示されるアミノ酸配列のいずれか1つと少なくとも少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むNLSを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメイン及びDNAポリメラーゼドメインを含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、N末端からC末端へDNA結合ドメイン及びDNAポリメラーゼドメインを含む融合タンパク質を含む。いくつかの実施形態では、融合タンパク質は、N末端でNLSを含み、NLSは、配列番号8、9、または10の配列を含む。いくつかの実施形態では、融合タンパク質は、N末端でNLSを含み、NLSは、配列番号11~24からなる群から選択される配列を含む。いくつかの実施形態では、融合タンパク質は、N末端でNLSを含み、NLSは、配列番号11、12、13、または14の配列を含む。いくつかの実施形態では、プライムエディターは、(a)DNA結合ドメイン及び(b)MMLV-RTまたはその変異体、断片もしくはバリアントを含むDNAポリメラーゼドメインを含み、DNA結合ドメイン及びDNAポリメラーゼドメインは、融合タンパク質を形成するためにペプチドリンカーによって接続されている。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメイン及びDNAポリメラーゼドメインをN末端からC末端へ含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメイン及びDNAポリメラーゼドメインをC末端からN末端へ含む。いくつかの実施形態では、DNA結合ドメインは、表14に記述されるアミノ酸配列のいずれか1つとまたは配列番号2、6、7、または596~613に示されるアミノ酸配列のいずれか1つと少なくとも少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、
少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む。いくつかの実施形態では、DNAポリメラーゼドメインは、MMLVRT5Mバリアントを含む。いくつかの実施形態では、DNAポリメラーゼは、参照MMLVRT配列配列番号1と比較してD524N、L435K、Y133R、Y271Rアミノ酸置換のうちの1つ以上を有するMMLV RTバリアントを含む。いくつかの実施形態では、DNAポリメラーゼは、参照MMLVRT配列配列番号1と比較してD200N、T306K、W313F、T330P、及びL603Wアミノ酸置換のうちの1つ以上を有するMMLV RTバリアントを含む。いくつかの実施形態では、DNAポリメラーゼは、MMLV RT G504X切断バリアント、MMLV RT L478切断バリアント、MMLV RT K478X切断バリアント、MMLV RT M428X切断バリアント、MMLV RT T328X切断バリアント、MMLV RT R278X切断バリアントを含む。いくつかの実施形態では、DNAポリメラーゼドメインは、表67に記述されるアミノ酸配列のいずれか1つとまたは配列番号1、4、5、36、45、54、63、または623に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む。いくつかの実施形態では、DNA結合ドメイン及びDNAポリメラーゼドメインを接続するペプチドリンカーは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一を有する配列を含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号289~311に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号289~311に示されるアミノ酸配列のいずれか1つと少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、
プライムエディターは、配列番号289~311からなる群から選択されるアミノ酸配列を含むアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302と少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302と少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号302のアミノ酸配列を含むアミノ酸配列を含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディターは、表2に記述されるアミノ酸配列のいずれか1つとまたは配列番号8~24、または621に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む1つ以上のNLSをさらに含み、NLSは、(例えば、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むリンカーを介して)DNA結合ドメインまたはDNAポリメラーゼドメインのC末端またはN末端に融合または連結されている。
いくつかの実施形態では、プライムエディターポリペプチドは、表14に記述されるアミノ酸配列のいずれか1つとまたは配列番号2、6、7、または596~613に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNA結合ドメインを含み、表67に記述されるアミノ酸配列のいずれか1つとまたは配列番号1、4、5、36、45、54、63、または623に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNAポリメラーゼドメインをさらに含み、任意にDNA結合ドメイン及びDNAポリメラーゼドメインは、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を有するペプチドリンカーによって融合または連結されており、任意に表2に記述されるアミノ酸配列のいずれか1つとまたは配列番号8~23、または621に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む1つ以上のNLSをさらに含み、NLSは、(例えば、表3に記述されるアミノ酸配列のいずれか1つとまたは配列番号286~411に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むリンカーを介して)DNA結合ドメインまたはDNAポリメラーゼドメインのC末端またはN末端に融合または連結されている。
いくつかの実施形態では、プライムエディターは、2、6、7、または596~613から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するDNA結合ドメイン、配列番号1、4、5、36、45、54、63、または623から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するDNAポリメラーゼドメイン、及び任意に配列番号286~411から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するリンカーを含み得る。いくつかの実施形態では、プライムエディターは、本明細書に記載される配列番号8~23、または621から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有する1つ以上の核局在化配列(NLS)をさらに含む。いくつかの実施形態では、NLSは、本明細書に記載のDNAポリメラーゼドメインのN末端に融合されている。いくつかの実施形態では、NLSは、DNAポリメラーゼドメインのC末端に融合されている。いくつかの実施形態では、NLSは、DNA結合ドメインのN末端またはC末端に融合されている。いくつかの実施形態では、リンカー配列、例えば、配列番号286~411から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を含むリンカーが、NLSとプライムエディターのドメインとの間に配置される。
いくつかの実施形態では、プライムエディターポリペプチドは、配列番号7に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNA結合ドメインを含み、配列番号5に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNAポリメラーゼドメインをさらに含み、任意にDNA結合ドメイン及びDNAポリメラーゼドメインは、配列番号289に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を有するペプチドリンカーによって融合または連結されており、任意に表2に記述されるアミノ酸配列のいずれか1つとまたは配列番号9、10、または11に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む1つ以上のNLSをさらに含み、NLSは、(例えば、配列番号288に示される記述されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むリンカーを介して)DNA結合ドメインまたはDNAポリメラーゼドメインのC末端またはN末端に融合または連結されている。
いくつかの実施形態では、プライムエディターポリペプチドは、配列番号7に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNA結合ドメインを含み、配列番号36に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNAポリメラーゼドメインをさらに含み、任意にDNA結合ドメイン及びDNAポリメラーゼドメインは、配列番号289に示されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を有するペプチドリンカーによって融合または連結されており、任意に表2に記述されるアミノ酸配列のいずれか1つとまたは配列番号9、10、または11に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む1つ以上のNLSをさらに含み、NLSは、(例えば、配列番号288に示される記述されるアミノ酸配列と少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むリンカーを介して)DNA結合ドメインまたはDNAポリメラーゼドメインのC末端またはN末端に融合または連結されている。
いくつかの実施形態では、プライムエディターは、配列番号7に示されるアミノ酸配列を有するDNA結合ドメイン、配列番号5または36から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するDNAポリメラーゼドメイン及び任意に配列番号302または309から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するリンカーを含み得る。いくつかの実施形態では、プライムエディターは、本明細書に記載される配列番号9、10または11から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有する1つ以上の核局在化配列(NLS)をさらに含む。いくつかの実施形態では、プライムエディターは、配列番号7に示されるアミノ酸配列を有するDNA結合ドメイン、配列番号5に示されるアミノ酸配列を有するDNAポリメラーゼドメイン、任意に配列番号288、289、または302から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するリンカーを含み得、任意に、本明細書に記載される配列番号9、10または11から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有する1つ以上の核局在化配列(NLS)をさらに含む。いくつかの実施形態では、プライムエディターは、配列番号7に示されるアミノ酸配列を有するDNA結合ドメイン、配列番号36に示されるアミノ酸配列を有するDNAポリメラーゼドメイン、任意に配列番号288、289、または302から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有するリンカーを含み得、任意に、本明細書に記載される配列番号9、10または11から選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を有する1つ以上の核局在化配列(NLS)をさらに含む。
いくつかの実施形態では、プライムエディターは、表14~65のいずれかに記述されるアミノ酸配列のいずれか1つとまたは配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、625、647に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含み得る。いくつかの実施形態では、プライムエディターは、表15~65のいずれかに記述されるアミノ酸配列のいずれか1つまたは配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、625、647に示されるアミノ酸配列のいずれか1つから選択されるアミノ酸配列のいずれかから選択されるアミノ酸配列を含み得る。
いくつかの実施形態では、プライムエディターは、配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、625、または647に示されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個以下の相違、例えば、変異、例えば、アミノ酸欠失、アミノ酸挿入、及び/またはアミノ酸置換を有するアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表15~65のいずれか1つに列挙されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個以下の相違、例えば、変異、例えば、アミノ酸欠失、アミノ酸挿入、及び/またはアミノ酸置換を有するアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、625、または647(表15~65)に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号25、34、35、77、78、85、86、620、622、624、625、または647に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号25、624、または625に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号34、35、647に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号77、78、または620に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号85、86、または622に示される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表15~65のいずれかに列挙される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表15~17のいずれかに列挙される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表15に列挙される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表16に列挙される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、表17に列挙される配列のいずれか1つと同一のアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、または625(表15~65)に示される配列のいずれか1つから選択される対応するプライムエディター配列と比較してN末端メチオニンを欠くアミノ酸配列を含む。
いくつかの実施形態では、プライムエディターは、構造:N-Cas9ニッカーゼ-ペプチドリンカー-RT-Cを含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、構造:N-Cas9ニッカーゼ-ペプチドリンカー-MMLV RTバリアント-Cを含む融合タンパク質を含む。いくつかの実施形態では、Cas9ニッカーゼは、HNHドメインにおける変異を含み、活性RuvCドメインを含む。いくつかの実施形態では、Cas9ニッカーゼは、HHNドメインにおけるH840A変異を含む。いくつかの実施形態では、MMLV RTバリアントは、MMLVRT5Mである。いくつかの実施形態では、MMLV RTバリアントは、MMLVRT5Mと比較して位置504及び505に対応する位置の間で切断されている。いくつかの実施形態では、ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302の配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309の配列を含む。いくつかの実施形態では、プライムエディターは、配列番号78、105、117、125、131、137、143、149、155、161、167、173、179、185、191、197、203、209、215、221、及び227からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号78、105、117、125、131、137、143、149、155、161、167、173、179、185、191、197、203、209、215、221、及び227からなる群から選択される配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号86、111、122、128、134、140、146、152、158、164、170、176、182、188、194、200、206、212、218、224、及び230からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号86、111、122、128、134、140、146、152、158、164、170、176、182、188、194、200、206、212、218、224、及び230からなる群から選択される配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号78と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号78の配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号86と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号86の配列を含む融合タンパク質を含む。
いくつかの実施形態では、プライムエディターは、構造:N末端NLS-Cas9ニッカーゼ-ペプチドリンカー-RT-C末端NLSを含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、構造:Cas9ニッカーゼ-ペプチドリンカー-MMLV RTバリアントを含む融合タンパク質を含む。いくつかの実施形態では、Cas9ニッカーゼは、HNHドメインにおける変異を含み、活性RuvCドメインを含む。いくつかの実施形態では、Cas9ニッカーゼは、HHNドメインにおけるH840A変異を含む。いくつかの実施形態では、MMLV RTバリアントは、MMLVRT5Mである。いくつかの実施形態では、MMLV RTバリアントは、MMLVRT5Mと比較して位置504及び505に対応する位置の間で切断されている。いくつかの実施形態では、ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302の配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309の配列を含む。いくつかの実施形態では、N末端NLSまたはC末端は、配列番号11~24及び621から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、N末端NLSは、配列番号8~10及び621から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、N末端NLSは、配列番号8~10及び621から選択される配列を含む。いくつかの実施形態では、C末端NLSは、配列番号8の配列を含む。いくつかの実施形態では、C末端NLSは、配列番号9の配列を含む。いくつかの実施形態では、C末端NLSは、配列番号11~24から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、C末端NLSは、配列番号11~24から選択される配列を含む。いくつかの実施形態では、C末端NLSは、配列番号11の配列を含む。いくつかの実施形態では、C末端NLSは、配列番号24の配列を含む。いくつかの実施形態では、プライムエディターは、配列番号77、93、104、620、及び116からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号77、93、104、620、及び116からなる群から選択される配列を含む融合タンパク質を含む。
いくつかの実施形態では、プライムエディターは、配列番号85、96、622、及び110からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号85、96、622、及び110からなる群から選択される配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号77と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号77または620の配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号85または622と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号85または622の配列を含む融合タンパク質を含む。
プライムエディターヌクレオチドポリメラーゼドメイン
いくつかの実施形態では、プライムエディターは、DNAポリメラーゼ活性を含むポリペプチドドメイン(例えば、DNAポリメラーゼドメイン)を含む。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメインを含むポリペプチドを含む。いくつかの実施形態では、プライム編集組成物は、ポリメラーゼドメイン、例えば、DNAポリメラーゼドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライムエディターは、ヌクレオチドポリメラーゼドメイン、例えば、DNAポリメラーゼドメインを含む。いくつかの実施形態では、DNAポリメラーゼドメインは、野生型DNAポリメラーゼドメイン、全長DNAポリメラーゼタンパク質ドメインであり得、または機能的変異体、機能的バリアント、またはそれらの機能的断片であり得る。いくつかの実施形態では、DNAポリメラーゼドメインは、鋳型依存性DNAポリメラーゼドメインである。例えば、DNAポリメラーゼは、新たな鎖DNA合成のための鋳型ポリヌクレオチド鎖、例えば、編集鋳型配列に依存し得る。いくつかの実施形態では、プライムエディターは、DNA依存性DNAポリメラーゼであるDNAポリメラーゼドメインを含む。例えば、DNA依存性DNAポリメラーゼを有するプライムエディターは、鋳型としてDNA配列を含むPEgRNA編集鋳型を使用して新たな一本鎖DNAを合成し得る。そのような場合では、PEgRNAは、キメラまたはハイブリッドPEgRNAであり、DNA鎖を含む伸長アームを含む。いくつかの実施形態では、キメラまたはハイブリッドPEgRNAは、RNA部分(スペーサー及びgRNAコアを含む)及びDNA部分(DNAの鎖を含む編集鋳型を含む伸長アーム)を含み得る。
いくつかの実施形態では、プライムエディターは、RNA依存性DNAポリメラーゼであるDNAポリメラーゼドメインを含む。いくつかの実施形態では、DNAポリメラーゼドメインは、例えば、真核、原核生物、古細菌、またはウイルス生物からの野生型ポリメラーゼであり得る。いくつかの実施形態では、DNAポリメラーゼドメインは、修飾されたDNAポリメラーゼ、例えば、遺伝子操作、変異誘発、または指向性進化ベースのプロセスによって修飾された野生型DNAポリメラーゼである。
いくつかの実施形態では、DNAポリメラーゼは、バクテリオファージポリメラーゼ、例えば、T4、T7、またはphi29 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、古細菌ポリメラーゼ、例えば、pol I型古細菌ポリメラーゼまたはpol II型古細菌ポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、熱安定性古細菌DNAポリメラーゼを含む。いくつかの実施形態では、DNAポリメラーゼは、真正細菌DNAポリメラーゼ、例えば、Pol I、Pol II、またはPol IIIポリメラーゼを含む。いくつかの実施形態では、DNAポリメラーゼは、Pol IファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、E.coli Pol I DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol IIファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pyrococcus furiosus(Pfu)Pol II DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol IVファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、E.coli Pol IV DNAポリメラーゼである。
いくつかの実施形態では、DNAポリメラーゼは、真核DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-ベータDNAポリメラーゼ、Pol-ラムダDNAポリメラーゼ、Pol-シグマDNAポリメラーゼ、またはPol-ミューDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-アルファDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLA1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLA2 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-デルタDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLD1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLD2 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、ヒトPOLD1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、ヒトPOLD2 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLD3 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLD4 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-イプシロンDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLE1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLE2 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、POLE3 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-イータ(POLH)DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-イオタ(POLI)DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol-カッパ(POLK)DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Rev1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、ヒトRev1 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、ウイルスDNA依存性DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、BファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、単純ヘルペスウイルス(HSV)UL30 DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、サイトメガロウイルス(CMV)UL54 DNAポリメラーゼである。
いくつかの実施形態では、DNAポリメラーゼは、古細菌ポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、ファミリーB/pol I型DNAポリメラーゼである。例えば、いくつかの実施形態では、DNAポリメラーゼは、Pyrococcus furiosusからのPfuのホモログである。いくつかの実施形態では、DNAポリメラーゼは、pol II型DNAポリメラーゼである。例えば、いくつかの実施形態では、DNAポリメラーゼは、P.furiosus DP1/DP2 2-サブユニットポリメラーゼのホモログである。いくつかの実施形態では、DNAポリメラーゼは、5’から3’へのヌクレアーゼ活性を欠く。好適なDNAポリメラーゼ(pol Iまたはpol II)は、所望のアッセイ温度と同様の最適な成長温度を有する古細菌に由来し得る。
いくつかの実施形態では、DNAポリメラーゼは、熱安定性古細菌DNAポリメラーゼである。いくつかの実施形態では、熱安定性DNAポリメラーゼは、Pyrococcus種(furiosus、種GB-D、woesii、abysii、horikoshii)、Thermococcus種(kodakaraensis KOD1、litoralis、種9度North-7、種JDF-3、gorgonarius)、Pyrodictium occultum、及びArchaeoglobus fulgidusから単離され、またはそれに由来する。
ポリメラーゼはまた、真正細菌種からのものであり得る。いくつかの実施形態では、DNAポリメラーゼは、Pol IファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、E.coli Pol I DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol IIファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pyrococcus furiosus(Pfu)Pol II DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol IIIファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、Pol IVファミリーDNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、E.coli Pol IV DNAポリメラーゼである。いくつかの実施形態では、Pol I DNAポリメラーゼは、5’から3’へのエキソヌクレアーゼ活性を欠き、またはそれが低減しているDNAポリメラーゼ機能的バリアントである。好適な熱安定性pol I DNAポリメラーゼは、Thermus種及びThermotoga maritima、例えば、Thermus aquaticus(Taq)、Thermus thermophilus(Tth)及びThermotoga maritima(Tma UlTma)を含む、多様な好熱性真正細菌から単離され得る。
いくつかの実施形態では、プライムエディターは、RNA依存性DNAポリメラーゼドメイン、例えば、逆転写酵素(RT)を含む。いくつかの実施形態では、DNAポリメラーゼドメインは、RNA依存性DNAポリメラーゼドメイン、例えば、逆転写酵素(RT)である。いくつかの実施形態では、DNAポリメラーゼドメインは、逆転写酵素(RT)ドメイン、例えば、逆転写酵素(RT)である。いくつかの実施形態では、逆転写酵素(RT)、またはRTドメインは、M-MLV RT(例えば、野生型M-MLV RT、参照M-MLV RT、機能的変異体、機能的バリアント、またはそれらの機能的断片)である。RTまたはRTドメインは、野生型RTドメイン、全長RTドメインであり得、または機能的変異体、機能的バリアント、またはそれらの機能的断片であり得る。プライムエディターのRTまたはRTドメインは、野生型RT、全長RT、機能的変異体、機能的バリアント、またはそれらの機能的断片を含み得、または特定のアミノ酸置換、切断、またはバリアントを含有するように操作または発達させられ得る。操作されたRTは、天然に存在するRTまたは対応する参照RTとは異なる配列またはアミノ酸変化を含み得る。いくつかの実施形態では、操作されたRTは、天然に存在するRTまたはRTドメインよりも改善された逆転写活性を有し得る。いくつかの実施形態では、操作されたRTは、天然に存在するRTよりも改善された特徴、例えば、改善された耐熱性、逆転写効率、または標的忠実性を有し得る。いくつかの実施形態では、操作されたRTを含むプライムエディターは、参照天然に存在するRTを有するプライムエディターよりも改善されたプライム編集効率を有する。
いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが200~800アミノ酸、長さが300~700アミノ酸、または長さが少なくとも400~600アミノ酸であり得る。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが少なくとも200アミノ酸、長さが少なくとも300アミノ酸、長さが少なくとも400アミノ酸、長さが少なくとも500アミノ酸、または長さが少なくとも600アミノ酸であり得る。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが250アミノ酸である。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが350アミノ酸である。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが450アミノ酸である。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが550アミノ酸である。いくつかの実施形態では、逆転写酵素ドメインまたはRTは、長さが650アミノ酸である。
いくつかの実施形態では、プライムエディターは、真核性RT、例えば、酵母、ショウジョウバエ、げっ歯類、または霊長類RTを含む。いくつかの実施形態では、プライムエディターは、グループIIイントロンRT、例えば、a.Geobacillus stearothermophilusグループIIイントロン(GsI-IIC)RTまたはEubacterium rectaleグループIIイントロン(Eu.re.I2)RTを含む。いくつかの実施形態では、プライムエディターは、レトロンRTを含む。
いくつかの実施形態では、プライムエディターは、ウイルスRT、例えば、レトロウイルスRTを含む。ウイルスRTの非限定的な例には、モロニーマウス白血病ウイルス(M-MLVまたはMLVRT);ヒトT細胞白血病ウイルス1型(HTLV-1)RT;ウシ白血病ウイルス(BLV)RT;ラウス肉腫ウイルス(RSV)RT;ヒト免疫不全ウイルス(HIV)RT、M-MFV RT、トリ肉腫-白血病ウイルス(ASLV)RT、ラウス肉腫ウイルス(RSV)RT、トリ骨髄芽球症ウイルス(AMV)RT、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV RT、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV RT、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A RT、トリ肉腫ウイルスUR2ヘルパーウイルス(UR2AV)RT、トリ肉腫ウイルスY73ヘルパーウイルスYAV RT、ラウス関連ウイルス(RAV)RT、及び骨髄芽球症関連ウイルス(MAV)RTが含まれ、これらのすべては、本明細書に記載の方法及び組成物において好適に使用され得る。
いくつかの実施形態では、プライムエディターは、野生型M-MLV RT、参照M-MLV RT、機能的変異体、機能的バリアント、またはそれらの機能的断片を含む。いくつかの実施形態では、RTドメインまたはRTは、M-MLV RT(例えば、野生型M-MLV RT、参照M-MLV RT、機能的変異体、機能的バリアント、またはそれらの機能的断片)である。いくつかの実施形態では、参照M-MLV RTは、野生型M-MLV RTである。野生型M-MLV RTの例示的な配列が配列番号623に提供される。参照M-MLV RTの例示的な配列が配列番号1に提供される。例示的なMMLV-RTアミノ酸及びヌクレオチド配列が表67に開示されている。いくつかの実施形態では、MMLVRTバリアントは、参照MMLVRT配列配列番号1と比較してD200N、T306K、W313F、T330P、及びL603Wアミノ酸置換を含む。配列番号5の配列を有するバリアントは、本明細書で「MMLVRT5M」または「MMLVRT5M」と称される。
いくつかの実施形態では、プライムエディターは、対応する参照RT(例えば、参照M-MLV RTまたは野生型M-MLV RT)と比較して操作されたRNaseドメインを含むRTを含む。いくつかの実施形態では、プライムエディターのRTは、参照RTと比較して1つ以上のアミノ酸置換、挿入、または欠失を含む。いくつかの実施形態では、プライムエディターのRTは、対応する参照RT(例えば、参照M-MLV RTまたは野生型M-MLV RT)と比較して切断されている。参照ポリペプチド配列と比較した場合、ポリペプチドが、末端部分、例えば、N末端部分またはC末端部分を欠いている場合、ポリペプチドは「切断されている」。ポリペプチドが、アミノ酸位置nの後に切断されているとは、ポリペプチドが、参照ポリペプチド配列と比較して、アミノ酸nまたはその対応するアミノ酸に対してC末端であるアミノ酸を欠くが、アミノ酸nを保持することを意味する。すなわち、「位置nにおけるアミノ酸の後に切断された」または「位置nとn+1との間でC末端で切断された」は、位置nとn+1との間でのポリペプチドの切断であって、アミノ酸nに対してC末端であるアミノ酸が、参照ポリペプチド配列と比較して欠失したものを指す。いくつかの実施形態では、アミノ酸nの後で切断されたポリペプチドは、参照ポリペプチド配列と比較した場合、アミノ酸n及びアミノ酸nに対してN末端のすべてのアミノ酸を含み、アミノ酸nに対してC末端のアミノ酸、またはその対応するアミノ酸を欠く。
いくつかの実施形態では、アミノ酸nの前で切断されたポリペプチド、または位置n-1及びnの間でN末端で切断されたポリペプチドは、参照ポリペプチド配列と比較した場合、アミノ酸n及びアミノ酸nに対してC末端のすべてのアミノ酸を含み、アミノ酸nに対してN末端のアミノ酸、またはその対応するアミノ酸を欠く。いくつかの実施形態では、切断されたポリペプチドは、N末端、C末端、またはN末端及びC末端の両方で切断されている。C末端切断ポリペプチドはまた、そのN末端で切断され得る。N末端切断ポリペプチドはまた、そのC末端で切断され得る。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTのアミノ酸の95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%または10%からなる。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して切断されたRTを含み、切断は、RTのN末端におけるものである。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して切断されたRTを含み、切断は、RTのC末端におけるものである。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して切断されたRTを含み、切断は、対応する参照RTの中央部内におけるものである。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して切断されたRTを含み、RTドメインは、N末端及びC末端の両方で切断されている。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して切断されたRTを含み、RTは、対応するRTによって参照されるRTのN末端、C末端、及び/または中央部で切断されている。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550個またはそれを超えるアミノ酸は、対応する参照RTと比較してプライムエディターにおけるRTのN末端で切断されている。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550個またはそれを超えるアミノ酸は、対応する参照RTと比較してプライムエディターにおけるRTのC末端で切断されている。いくつかの実施形態では、参照RT配列は、配列番号1の配列を有する。いくつかの実施形態では、参照RT配列は、配列番号5の配列を有する。
いくつかの実施形態では、プライムエディターは、モロニーマウス白血病ウイルス(M-MLV)逆転写酵素(M-MLV RT)であるRTを含む。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RT、参照M-MLV RT、またはMMLVRT5Mと比較して1つ以上のアミノ酸置換、挿入、または欠失を含む。いくつかの実施形態では、プライムエディターは、野生型M-MLV RTまたは参照M-MLV RTまたはMMLVRT5Mと比較して切断されたM-MLV RTを含む。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RTまたはMMLVRT5Mのアミノ酸の95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%または10%からなる。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RT、またはMMLVRT5Mと比較してN末端で切断されている。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RT、またはMMLVRT5Mと比較してC末端で切断されている。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RTと比較して切断されており、切断は、野生型M-MLV RTまたは参照M-MLV RT、またはMMLVRT5Mによって参照されるRTの中央部内におけるものである。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RT、またはMMLVRT5Mと比較して切断されたM-MLV RTを含み、RTは、N末端及びC末端の両方で切断されている。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTまたは参照M-MLV RT、またはMMLVRT5Mと比較して切断されたM-MLV RTを含み、RTは、野生型M-MLVRTまたは参照M-MLV RT、またはMMLVRT5Mによって参照されるRTのN末端、C末端、及び/または中央部で切断されている。
いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400個、またはそれを超えるアミノ酸が、野生型M-MLV RTまたは参照M-MLV RTまたはMMLVRT5Mと比較してプライムエディターにおいてM-MLV RTのN末端で切断されている。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550個、またはそれを超えるアミノ酸が、野生型M-MLV RTまたは参照M-MLV RTまたはMMLVRT5Mと比較してプライムエディターにおいてM-MLV RTのC末端で切断されている。
いくつかの実施形態では、プライムエディターは、RNaseドメインを含む逆転写酵素(RT)を含む。例えば、いくつかの実施形態では、プライムエディターのRTは、RNaseドメインを含むウイルスRTドメインである。いくつかの実施形態では、プライムエディターのRTは、RNase Hドメインを含むウイルスRTドメインである。いくつかの実施形態では、プライムエディターのRTは、5’及び/または3’リボヌクレアーゼ活性を有するRNase Hドメインを含む。いくつかの実施形態では、プライムエディターのRTは、DNA-RNAハイブリッド二本鎖と接触した場合、RNA鎖に対する3’及び/または5’ヌクレアーゼ活性を有するRNase Hドメインを含む。
いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して操作されたRNaseドメインを含むRTを含む。いくつかの実施形態では、プライムエディターは、対応する参照RTと比較して操作されたRNase Hドメインを含むRTを含む。いくつかの実施形態では、プライムエディターのRTは、対応と比較してRNase Hドメインにおいて1つ以上のアミノ酸置換、挿入、または欠失を含む。いくつかの実施形態では、RNase Hドメインにおける1つ以上のアミノ酸置換、挿入、または欠失は、RNase HドメインのRNase活性を低減または無効化する。いくつかの実施形態では、プライムエディターのRTは、低下または無効化したRNase活性を有するRNase Hドメインを含む。いくつかの実施形態では、プライムエディターのRTは、不活性化RNase Hドメインを含む。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較してRNase Hドメインの活性を低下または無効化するRNase Hドメインにおける1つ以上のアミノ酸置換を含む。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含む。いくつかの実施形態では、RNase Hドメインにおける切断は、RNase HドメインのRNase活性を低下または無効化する。いくつかの実施形態では、プライムエディターのRTは、対応する野生型RNase Hドメイン(例えば、参照M-MLV RTまたは野生型M-MLV RTまたはMMLVRT5Mからの野生型RNase Hドメイン)のアミノ酸の95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%または10%からなるRNase Hドメインを含む。いくつかの実施形態では、参照RT配列は、配列番号1の配列を有する。いくつかの実施形態では、参照RT配列は、配列番号5の配列を有する。
いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含み、切断は、RNase HドメインのN末端におけるものである。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含み、切断は、RNase HドメインのC末端におけるものである。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含み、切断は、対応する参照RTのRNase Hドメインによって参照されるRNase Hドメインの中央部内におけるものである。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含み、切断されたRNase Hドメインは、RNase HドメインのN末端及びC末端の両方で切断されているものである。いくつかの実施形態では、プライムエディターのRTは、対応する参照RTと比較して切断されたRNase Hドメインを含み、切断されたRNase Hドメインは、対応する参照RTのRNase Hドメインによって参照されるRNase HドメインのN末端、C末端、及び/または中央部で切断されている。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550個またはそれを超えるアミノ酸は、対応する参照RTのRNase Hドメインと比較してプライムエディターにおけるRTのRNase HドメインのN末端で切断されている。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550個またはそれを超えるアミノ酸は、対応する参照RTのRNase Hドメインと比較してプライムエディターにおけるRTのRNase HドメインのC末端で切断されている。いくつかの実施形態では、プライムエディターのRTは、RNase Hドメインを欠く。いくつかの実施形態では、参照RT配列は、配列番号1の配列を有する。いくつかの実施形態では、参照RT配列は、配列番号5の配列を有する。
いくつかの実施形態では、プライムエディターは、RNase Hドメインを含むモロニーマウス白血病ウイルス(M-MLV)逆転写酵素(M-MLV RT)であるRTを含む。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTのRNase Hドメインと比較してRNase Hドメインにおける1つ以上のアミノ酸置換、挿入、または欠失を含む。いくつかの実施形態では、RNase Hドメインにおける1つ以上のアミノ酸置換、挿入、または欠失は、RNase HドメインのRNase活性を低減または無効化する。いくつかの実施形態では、プライムエディターのM-MLV RTは、野生型M-MLV RTにおけるRNase Hドメインと比較して低減または無効化されたRNase活性を有するRNase Hドメインを含む。いくつかの実施形態では、プライムエディターのM-MLV RTは、不活性化RNase Hドメインを含む。
いくつかの実施形態では、プライムエディターは、配列番号1に示される参照M-MMLV RTと比較してアミノ酸置換P51$、S67、E69$、L139$、T197$、D200$、H204$、F209$、E302$、T306$、F309$、W313$、T330$、L345$、L435$、N454$、D524$、E562$、D583$、H594$、L603$、E607$、またはD653$のうちの1つ以上を含むM-MMLV RTを含み、$は、野生型アミノ酸以外の任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、配列番号1に示される参照M-MMLV RTと比較してアミノ酸置換P51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、及びD653Nのうちの1つ以上を含むM-MMLV RTを含む。いくつかの実施形態では、プライムエディターは、配列番号1に示される参照M-MMLVと比較して1つ以上のアミノ酸置換D200N、T330P、L603W、T306K、及びW313Fを含むM-MLV RTを含む。いくつかの実施形態では、プライムエディターは、配列番号1に示される参照M-MMLV RTと比較してアミノ酸置換D200N、T330P、L603W、T306K、及びW313Fを含むM-MLV RTを含む。
いくつかの実施形態では、配列番号1に示される参照M-MMLV RTと比較してD200N、T330P、L603W、T306K、及びW313Fを保有する逆転写酵素を含むプライムエディターは、「PE2」プライムエディター、及び対応するプライム編集システムPE2プライム編集システムと称され得る。いくつかの実施形態では、プライムエディターは、配列番号1、または配列番号623に示される参照M-MMLV RTと比較してアミノ酸置換D200N、T306K、W313F、T330P、L603W、またはそれらの任意の組み合わせのうちの1つ以上を含むM-MMLV RTを含み、Xは、野生型アミノ酸以外の任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、配列番号1、または配列番号623に示される参照M-MMLV RTと比較してアミノ酸置換Y134X、Y272X、L435X、D524X、またはそれらの任意の組み合わせのうちの1つ以上を含むM-MMLV RTを含み、Xは、野生型アミノ酸以外の任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、配列番号1、または配列番号623に示される参照M-MMLV RTと比較してアミノ酸置換Y134R、Y272R、L435K、D524N、またはそれらの任意の組み合わせのうちの1つ以上を含むM-MMLV RTを含み、Xは、野生型アミノ酸以外の任意のアミノ酸である。
いくつかの実施形態では、MMLVRTバリアントは、参照MMLVRT配列配列番号1と比較してD200N、T306K、W313F、T330P、及びL603Wアミノ酸置換のうちの1つ以上を含む。いくつかの実施形態では、MMLVRTバリアントは、参照MMLVRT配列配列番号1と比較してD200N、T306K、W313F、T330P、及びL603Wアミノ酸置換を含む。いくつかの実施形態では、MMLV RTバリアントは、参照MMLVRT配列配列番号1と比較してD524N、L435K、Y133R、Y271Rアミノ酸置換のうちの1つ以上を含む。いくつかの実施形態では、MMLV RTバリアントは、参照MMLVRT配列配列番号1と比較して1つ以上のアミノ酸欠失を有する。例えば、いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されている(そのような切断は、本明細書で504X、またはG504X切断と称され得る)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されている(L478X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示される位置478と505との間の任意のアミノ酸位置でC末端で切断されている。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸365及び366に対応する位置の間でC末端で切断されている(P365X)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸278及び279に対応する位置の間でC末端で切断されている(R278X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸328及び329に対応する位置の間でC末端で切断されている(T328X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸378及び379に対応する位置の間でC末端で切断されている(K478X末端)。いくつかの実施形態では、MMLV RTバリアントは、配列番号1に示されるアミノ酸428及び429に対応する位置の間でC末端で切断されている(M428X末端)。いくつかの実施形態では、切断されたM-MLV RTバリアントは、配列番号1に示される対応する参照M-MLV RTと比較してD200$、T306$、W313$、及び/またはT330$アミノ酸置換をさらに含み、$は、元のアミノ酸以外の任意のアミノ酸である。いくつかの実施形態では、切断されたM-MLV RTバリアントは、配列番号1に示される対応する参照M-MLV RTと比較してD200N、T306K、W313F、及び/またはT330Pアミノ酸置換をさらに含む。いくつかの実施形態では、プライムエディターポリペプチドは、表67に記述されるアミノ酸配列のいずれか1つとまたは配列番号1、4、5、36、45、54、63、または623に示されるアミノ酸配列のいずれか1つと少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含むDNAポリメラーゼドメイン(例えば、MMLV-RT)を含む。いくつかの実施形態では、プライムエディターポリペプチドは、アミノ酸配列配列番号5を含むMMLV-RTドメインを含む。いくつかの実施形態では、プライムエディターポリペプチドは、配列番号36のアミノ酸配列を有するC末端切断MMLV-RTドメインを含む。
いくつかの実施形態では、M-MLV RTは、配列番号1、4、5、36、45、54、63、または623に示される配列のいずれか1つと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一であるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号1に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号623に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号623に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号4に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号5に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号36に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号45に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号54に示されるアミノ酸配列を含む。いくつかの実施形態では、M-MLV RTは、配列番号63に示されるアミノ酸配列を含む。いくつかの実施形態では、プライム編集組成物は、配列番号1、4、5、36、45、54、63、または623に示される配列のいずれか1つと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一であるアミノ酸配列を含むDNAポリメラーゼドメインをコードするポリヌクレオチドを含む。
いくつかの実施形態では、RTバリアントは、対応するRT(例えば、M-MLV RT)と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、または最大で100個、または最大で200個、または最大で300個、または最大で400個、または最大で500個またはそれを超えるアミノ酸変化を有する対応するRT(例えば、M-MLV RT)の機能的断片であり得る。いくつかの実施形態では、RTバリアントは、断片が、対応するRTの対応する断片と約70%同一、約80%同一、約90%同一、約95%同一、約96%同一、約97%同一、約98%同一、約99%同一、約99.5%同一、または約99.9%同一となるように、対応するRT、例えば、(例えば、M-MLV RT)の断片を含む。いくつかの実施形態では、断片は、対応するRT(例えば、M-MLV RT)のアミノ酸長の30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%同一、96%、97%、98%、99%、または99.5%である。
いくつかの実施形態では、RT機能的断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態では、断片は、長さが少なくとも100、150、200、250、300、350、400、450、500、550、または最大で600またはそれを超えるアミノ酸である。
いくつかの実施形態では、プライムエディターは、真核性RT、例えば、酵母、ショウジョウバエ、げっ歯類、または霊長類RTを含む。いくつかの実施形態では、プライムエディターは、グループIIイントロンRT、例えば、a.Geobacillus stearothermophilusグループIIイントロン(GsI-IIC)RTまたはEubacterium rectaleグループIIイントロン(Eu.re.I2)RTを含む。いくつかの実施形態では、プライムエディターは、レトロンRTを含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133$アミノ酸置換を含み、$は、Yを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133Rアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY271$アミノ酸置換を含み、$は、Yを除く任意のアミノ酸である。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY271Rアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してD524$アミノ酸置換を含み、$は、Dを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してD524Nアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してL435$アミノ酸置換を含み、$は、Lを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してL435Kアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含み、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133$アミノ酸置換を含み、$は、Yを除く任意のアミノ酸である。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY133Rアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY271$アミノ酸置換を含み、$は、Yを除く任意のアミノ酸である。
いくつかの実施形態では、プライムエディターのM-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してY271Rアミノ酸置換を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLVRTを含み、M-MLVRTは、配列番号1に示されるアミノ酸478及び479、478及び479、479及び480、480及び481、481及び482、482及び483、483及び484、484及び485、485及び486、486及び487、487及び488、488及び489、489及び490、490及び491、491及び492、492及び493、493及び494、494及び495、495及び496、496及び497、497及び498、498及び499、499及び500、500及び501、501及び502、502及び503、503及び504、または504及び505に対応する位置の間でC末端で切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLVRTを含み、M-MLVRTは、配列番号1に示されるアミノ酸504に対してC末端である任意のアミノ酸の後に切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLVRTを含み、M-MLVRTは、配列番号1に示されるアミノ酸478に対してC末端である任意のアミノ酸の後に切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置505~679におけるアミノ酸が、配列番号1配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置504に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(G504切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸505~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置504に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTのアミノ酸365に対してC末端の位置におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して欠失している。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置365に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(P365切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸365に対してC末端のアミノ酸の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置365に対してC末端のアミノ酸の欠失を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸365及び366に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623と比較してL478とG504との間のアミノ酸の後のC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623と比較してアミノ酸L478の後のC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸428及び429に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸378及び379に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸366及び367に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸328及び329に対応する位置の間でC末端で切断されたアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTドメインは、配列番号1、5、または623に示されるアミノ酸278及び279に対応する位置の間でC末端で切断されたアミノ酸配列を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置479~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターのM-MLV RTは、切断されたRNase Hドメインを含み、位置478に対してC末端のアミノ酸は、配列番号1、または配列番号623に示される参照M-MLV RTと比較して切断されている(L478切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸479~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置478に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置429~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置428に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(M428切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸429~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置428に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置379~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置378に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(K378切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸379~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置378に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置365に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(P365切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸367~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置365に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置328~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置328に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(T328切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸328~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置328に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置279~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置278に対してC末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている(R278切断)。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸279~679の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置278に対してC末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、M-MLV RTの位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、プライムエディターは、切断されたM-MLV RTを含み、位置24に対してN末端のアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてアミノ酸1~22の欠失を含む。いくつかの実施形態では、M-MLV RT(例えば、切断されたM-MLV RT)は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べて位置24に対してN末端のアミノ酸の欠失を含む。
いくつかの実施形態では、プライムエディターは、対応する参照RTまたは野生型RTと比較して1つ以上のアミノ酸置換及び/または1つ以上のアミノ酸欠失を有するRTドメインを含む。いくつかの実施形態では、プライムエディターは、野生型M-MLV RTまたは参照RT(例えば、配列番号1、配列番号5、または配列番号623)と比較して1つ以上のアミノ酸置換及び1つ以上のアミノ酸欠失を有するM-MLV RTを含む。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して1つ以上のアミノ酸置換及び/または1つ以上のアミノ酸欠失を含むアミノ酸配列を含む。本明細書に記載されているまたは当該技術分野で知られているアミノ酸切断、欠失、及び置換のいずれか1つは、プライムエディターRT、例えば、M-MLV RTにおいて組み合わされ得る。いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置479~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置479~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置429~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置429~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置379~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置379~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置328~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置328~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置279~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置279~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$、Y271$、L435$、及び/またはD524$アミノ酸置換を含むM-MLV RTを含み、位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、L435$アミノ酸置換を含むM-MLV RTを含み、位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Lを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、L435Kアミノ酸置換を含むM-MLV RTを含み、位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、L435$アミノ酸置換を含むM-MLV RTを含み、位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Lを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、L435Kアミノ酸置換を含むM-MLV RTを含み、位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、M-MLV RTを含み、M-MLV RTは、L435$アミノ酸置換を含み、位置1~22におけるアミノ酸及び位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Lを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、M-MLV RTを含み、M-MLV RTは、L435Kアミノ酸置換を含み、位置1~22におけるアミノ酸及び位置505~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$アミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Yを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133Rアミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y271$アミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Yを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y271Rアミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133$及びY271$アミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、Yを除く任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、Y133R及びY271Rアミノ酸置換を含むM-MLV RTを含み、位置367~679におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されている。
いくつかの実施形態では、プライムエディターは、Y133R、Y271R、L435K、及び/またはD524Nアミノ酸置換を含むM-MLV RTを含み、位置1~22におけるアミノ酸は、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して切断されており、$は、元のアミノ酸を除く任意のアミノ酸である。
いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して位置P365に対してC末端のアミノ酸の欠失、Y133$アミノ酸置換、及び/またはY271$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してアミノ酸366~679の欠失、Y133$アミノ酸置換、及び/またはY271$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して位置P365に対してC末端のアミノ酸の欠失、Y133Rアミノ酸置換、及び/またはY271Rアミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して位置G504に対してC末端のアミノ酸の欠失、及び/またはL435$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してアミノ酸残基505~679の欠失、及び/またはL435$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較して位置G504に対してC末端のアミノ酸の欠失、アミノ酸残基1~22の欠失、及び/またはL435$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。いくつかの実施形態では、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比較してアミノ酸残基505~679の欠失、N末端アミノ酸残基1~22の欠失、及び/またはL435$アミノ酸置換を含み、$は、元のもの以外の任意のアミノ酸である。
いくつかの実施形態では、DNAポリメラーゼドメイン、例えば、逆転写酵素ドメイン、例えばM-MLV RTは、1つ以上の変異(例えば、1つ以上のアミノ酸置換、アミノ酸欠失、及び/またはアミノ酸挿入)を含み得る。変異体逆転写酵素は、例えば、部位特異的またはランダム変異誘発によって対象となる逆転写酵素をコードする遺伝子(複数可)を変異させることによって得られ得る。いくつかの実施形態では、変異は、例えば、編集効率を増加させることによって、逆転写酵素活性を増加させることによって、及び/または安定性(例えば、耐熱性)を増加させることによってDNAポリメラーゼドメイン、例えば、逆転写酵素ドメインの効率を増加させる。いくつかの実施形態では、本明細書に開示される1つ以上の変異を含むDNAポリメラーゼドメインを含むプライムエディターは、対応する非変異DNAポリメラーゼを含むプライムエディターと比較して少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも100%、少なくとも150%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、少なくとも600%、少なくとも700%、少なくとも800%、少なくとも900%、または少なくとも1000%の編集効率の増加を示し得る。いくつかの実施形態では、M-MLV RTであるDNAポリメラーゼドメインは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてP51$、S67$、E69$、L139$、T197$、D200$、H204$、F209$、E302$、T306$、F309$、W313$、T330$、L435$、P448$、D449$、N454$、D524$、E562$、D583$、H594$、L603$、E607$、G615$、H634$、G637$、H638$、D653$、またはL671$変異からなる群から選択される1つ以上の変異を含み、$は、野生型アミノ酸以外の任意のアミノ酸である。いくつかの実施形態では、DNAポリメラーゼドメイン、例えば、M-MLV RTは、配列番号1、配列番号5、または配列番号623に示される参照M-MLV RTと比べてP51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、T306K、F309N、W313F、T330P、L435G、P448A、D449G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、G615、H634Y、G637R、H638G、D653N、またはL671Pからなる群から選択される1つ以上のアミノ酸置換を含み得る。
いくつかの実施形態では、操作されたRTは、天然に存在するRTまたはRTドメインよりも改善された安定性、逆転写活性を有し得る。いくつかの実施形態では、操作されたRTは、天然に存在するRTよりも改善された特徴、例えば、改善された耐熱性、逆転写効率、または標的忠実性を有し得る。いくつかの実施形態では、操作されたRTを含むプライムエディターは、参照天然に存在するRTを有するプライムエディターよりも改善されたプライム編集効率を有する。
本明細書に記載の操作されたRTのいずれかを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示される参照RT)を有する参照プライムエディターと比較して改変された機能的特徴を有し得る。いくつかの実施形態では、本明細書に記載の操作されたRTを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示されるような参照RT)を有する参照プライムエディターと比較して改善された安定性を有する。いくつかの実施形態では、本明細書に記載の操作されたRTを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示されるような参照RT)を有する参照プライムエディターと比較して改善された耐熱性を有する。いくつかの実施形態では、本明細書に記載の操作されたRTを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示されるような参照RT)を有する参照プライムエディターと比較して改善された溶解性または低減した凝集を有する。いくつかの実施形態では、操作されたRTを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示されるような参照RT)を有する参照プライムエディターと比較して改善されたプライム編集効率を有する。いくつかの実施形態では、操作されたRTを含むプライムエディターは、対応する参照RT(例えば、または配列番号1に示される参照RT)を有する参照プライムエディターと比較して少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、少なくとも160%、少なくとも170%、少なくとも180%、少なくとも190%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%またはそれを超えて増加したプライム編集効率を有する。いくつかの実施形態では、操作されたRTを含むプライムエディターは、対応する参照RT(例えば、配列番号1に示されるような参照RT)を有する参照プライムエディターと比較して少なくとも1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍、4.9倍、5倍またはそれを超えて増加したプライム編集効率を有する。
プログラム可能なDNA結合ドメイン
いくつかの実施形態では、プライムエディターは、DNA結合活性(例えば、DNA結合ドメイン)を有するポリペプチドドメインを含む。いくつかの実施形態では、プライムエディターは、DNA結合活性(例えば、DNA結合ドメイン)を有するポリペプチドドメインを含む。いくつかの実施形態では、プライムエディターは、DNA結合ドメインを含む。いくつかの実施形態では、DNA結合ドメインは、配列番号2、6、7、596~613(表14)に示されるアミノ酸配列のいずれか1つと少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一、または100%同一であるアミノ酸配列を含む。いくつかの実施形態では、DNA結合ドメインは、配列番号2、6、7、596~613に示されるアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個以下の相違、例えば、変異、例えば、欠失または置換を有するアミノ酸配列を含む。いくつかの実施形態では、DNA結合ドメインは、対応するDNA結合ドメイン(例えば、配列番号2、6、7、596~613のいずれか1つに示されるDNA結合ドメイン)と比較してN末端メチオニンを欠くアミノ酸配列を含む。(表14)。いくつかの実施形態では、DNA結合ドメインのアミノ酸配列は、1つ以上の処理酵素によって、例えば、メチオニンアミノペプチダーゼ(MAP)によってN末端修飾され得る。
いくつかの実施形態では、DNA結合ドメインは、ヌクレアーゼ活性、例えば、CasポリペプチドのRNAでガイドされるDNAエンドヌクレアーゼ活性を含む。いくつかの実施形態では、DNA結合ドメインは、ヌクレアーゼドメインまたはヌクレアーゼ活性を含む。いくつかの実施形態では、DNA結合ドメインは、ニッカーゼ、または十分に活性なヌクレアーゼを含む。本明細書で使用される場合、用語「ニッカーゼ」は、二本鎖DNA標的の一方の鎖のみを切断することが可能なヌクレアーゼを指す。いくつかの実施形態では、DNA結合ドメインは、不活性ヌクレアーゼである。
いくつかの実施形態では、プライムエディターのDNA結合ドメインは、プログラム可能なDNA結合ドメインである。プログラム可能なDNA結合ドメインは、特定の核酸配列、例えば、標的DNAまたは標的RNAを結合させるように設計されたタンパク質ドメインを指す。いくつかの実施形態では、DNA結合ドメインは、DNA結合ドメインを二本鎖標的DNA(例えば、標的遺伝子)における特定のDNA配列、例えば、サーチ標的配列にガイドするガイドポリヌクレオチド(例えば、PEgRNA)と会合し得るプログラム可能なポリヌクレオチドDNA結合ドメインである。いくつかの実施形態では、DNA結合ドメインは、クラスター化規則的インタースペース短パリンドロームリピート(CRISPR)関連(Cas)タンパク質を含む。Casタンパク質は、本明細書に記載の任意のCasタンパク質またはそれらの機能的断片もしくは機能的バリアントを含み得る。いくつかの実施形態では、DNA結合ドメインはまた、ジンクフィンガータンパク質ドメインを含み得る。他の場合では、DNA結合ドメインは、転写活性化因子様エフェクタードメイン(TALE)を含む。いくつかの実施形態では、DNA結合ドメインは、DNAヌクレアーゼを含む。例えば、プライムエディターのDNA結合ドメインは、RNAでガイドされるDNAエンドヌクレアーゼ、例えば、Casタンパク質を含み得る。いくつかの実施形態では、DNA結合ドメインは、ジンクフィンガーヌクレアーゼ(ZFN)または転写活性化因子様エフェクタードメインヌクレアーゼ(TALEN)を含み、1つ以上のジンクフィンガーモチーフまたはTALEモチーフは、1つ以上のヌクレアーゼ、例えば、Fok Iヌクレアーゼドメインと会合する。
いくつかの実施形態では、DNA結合ドメインは、ヌクレアーゼ活性を含む。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、一本鎖DNA切断活性を有するエンドヌクレアーゼドメインを含む。例えば、エンドヌクレアーゼドメインは、FokIヌクレアーゼドメインを含み得る。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、十分なヌクレアーゼ活性を有するヌクレアーゼを含む。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、野生型エンドヌクレアーゼドメインと比較して修飾されたまたは低減されたヌクレアーゼ活性を有するヌクレアーゼを含む。例えば、エンドヌクレアーゼドメインは、野生型エンドヌクレアーゼドメインと比較して1つ以上のアミノ酸置換を含み得る。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、ニッカーゼ活性を有する。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、ニッカーゼであるCasタンパク質ドメインを含む。いくつかの実施形態では、野生型Casタンパク質と比較して、Casニッカーゼは、その二本鎖ヌクレアーゼ活性を低減または無効化するが、DNA結合活性を保持するヌクレアーゼドメインにおける1つ以上のアミノ酸置換を含む。いくつかの実施形態では、Casニッカーゼは、HNHドメインにおけるアミノ酸置換を含む。いくつかの実施形態では、Casニッカーゼは、RuvCドメインにおけるアミノ酸置換を含む。
いくつかの実施形態では、DNA結合ドメインは、CRISPR関連タンパク質(Casタンパク質)ドメインを含む。Casタンパク質は、クラス1またはクラス2Casタンパク質であり得る。Casタンパク質は、I型、II型、III型、IV型、V型Casタンパク質、またはVI型Casタンパク質であり得る。Casタンパク質の非限定的な例には、Cas9、Cas12a(Cpf1)、Cas12e(CasX)、Cas12d(CasY)、Cas12b1(C2c1)、Cas12b2、Cas12c(C2c3)、C2c4、C2c8、C2c5、C2c10、C2c9、Cas14a、Cas14b、Cas14c、Cas14d、Cas14e、Cas14f、Cas14g、Cas14h、Cas14u、Cns2、CasΦ、及びそれらのホモログ、機能的断片、または修飾されたバージョンが含まれる。Casタンパク質は、他のタンパク質またはポリペプチドに融合されたキメラCasタンパク質であり得る。Casタンパク質は、例えば、異なる生物からのCasタンパク質のドメインを含む様々なCasタンパク質のキメラであり得る。
Casタンパク質、例えば、Cas9は、任意の好適な生物からのものであり得る。いくつかの態様では、生物は、Streptococcus pyogenes(S.pyogenes)である。いくつかの態様では、生物は、Staphylococcus aureus(S.aureus)である。いくつかの態様では、生物は、Streptococcus thermophilus(S.thermophilus)である。いくつかの実施形態では、生物は、Staphylococcus lugdunensisである。
Casタンパク質、例えば、Cas9は、野生型または修飾された形態のCasタンパク質であり得る。Casタンパク質、例えば、Cas9は、野生型Casタンパク質のヌクレアーゼ活性バリアント、ヌクレアーゼ不活性バリアント、ニッカーゼ、または機能的バリアントもしくは機能的断片であり得る。いくつかの実施形態では、Casタンパク質、例えば、Cas9は、Casタンパク質の野生型バージョンと比べてアミノ酸変化、例えば、欠失、挿入、置換、融合、キメラ、またはそれらの任意の組み合わせを含み得る。いくつかの実施形態では、Casタンパク質は、野生型の例示的なCasタンパク質と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性または配列類似性を有するポリペプチドであり得る。
Casタンパク質、例えば、Cas9は、1つ以上のドメインを含み得る。Casドメインの非限定的な例には、ガイド核酸認識及び/または結合ドメイン、ヌクレアーゼドメイン(例えば、DNaseまたはRNaseドメイン、RuvC、HNH)、DNA結合ドメイン、RNA結合ドメイン、ヘリカーゼドメイン、タンパク質-タンパク質相互作用ドメイン、及び二量体化ドメインが含まれる。様々な実施形態では、Casタンパク質は、ガイド核酸認識及び/またはガイド核酸と相互作用し得る結合ドメイン、及び核酸切断のための触媒活性を含む1つ以上のヌクレアーゼドメインを含む。
いくつかの実施形態では、Casタンパク質、例えば、Cas9は、1つ以上のヌクレアーゼドメインを含む。Casタンパク質は、野生型Casタンパク質のヌクレアーゼドメイン(例えば、RuvCドメイン、HNHドメイン)と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含み得る。いくつかの実施形態では、Casタンパク質は、単一のヌクレアーゼドメインを含む。例えば、Cpf1は、RuvCドメインを含み得るが、HNHドメインを欠く。いくつかの実施形態では、Casタンパク質は、2つのヌクレアーゼドメインを含み、例えば、Cas9タンパク質は、HNHヌクレアーゼドメイン及びRuvCヌクレアーゼドメインを含み得る。
いくつかの実施形態では、プライムエディターは、Casタンパク質、例えば、Cas9であって、Casタンパク質のすべてのヌクレアーゼドメインが活性であるものを含む。いくつかの実施形態では、プライムエディターは、1つ以上の不活性ヌクレアーゼドメインを有するCasタンパク質を含む。Casタンパク質の1つまたは複数のヌクレアーゼドメイン(例えば、RuvC、HNH)は、もはや機能的でなくなるようにまたは低減したヌクレアーゼ活性を含むように、欠失または変異させられ得る。いくつかの実施形態では、ヌクレアーゼドメインにおける変異を含むCasタンパク質、例えば、Cas9は、ガイド核酸、例えば、PEgRNAと複合体化した場合にサーチ標的配列で核酸遺伝子座を標的とするその能力を維持しながら、低減(例えば、ニッカーゼ)または無効化されたヌクレアーゼ活性を有する。
いくつかの実施形態では、プライムエディターは、配列特異的様式で二本鎖標的DNAに結合し、かつ二本鎖標的DNAにおける二本鎖DNA内のプロトスペーサーで一本鎖破断を生成することができるが、二本鎖破断を生成することができないCasニッカーゼを含む。例えば、Casニッカーゼは、二本鎖標的DNAの編集鎖または非編集鎖を切断し得るが、両方を切断しない場合がある。いくつかの実施形態では、プライムエディターは、2つのヌクレアーゼドメイン(例えば、Cas9)を含むCasニッカーゼを含み、2つのヌクレアーゼドメインのうちの1つは、触媒活性を欠くように修飾されており、または欠失している。いくつかの実施形態では、プライムエディターのCasニッカーゼは、ヌクレアーゼ不活性RuvCドメイン及びヌクレアーゼ活性HNHドメインを含む。いくつかの実施形態では、プライムエディターのCasニッカーゼは、ヌクレアーゼ不活性HNHドメイン及びヌクレアーゼ活性RuvCドメインを含む。いくつかの実施形態では、プライムエディターは、RuvCドメインにおけるアミノ酸置換を有するCas9ニッカーゼを含む。いくつかの実施形態では、Cas9ニッカーゼは、野生型S.pyogenes Cas9と比較してD10$アミノ酸置換を含み、$は、D以外の任意のアミノ酸である。いくつかの実施形態では、プライムエディターは、HNHドメインにおけるアミノ酸置換を有するCas9ニッカーゼを含む。いくつかの実施形態では、Cas9ニッカーゼは、野生型S.pyogenes Cas9と比較してH840$アミノ酸置換を含み、$は、H以外の任意のアミノ酸である。
いくつかの実施形態では、プライムエディターは、配列特異的様式で二本鎖標的DNAに結合し得るCasタンパク質を含むが、ヌクレアーゼ活性を欠き、または無効化されたヌクレアーゼ活性を有し、二本鎖標的DNAにおける二本鎖DNAのいずれの鎖も切断しない場合がある。無効化された活性または欠いた活性は、野生型の例示的な活性(例えば、野生型Cas9ヌクレアーゼ活性)と比較して1%未満、2%未満、3%未満、4%未満、5%未満、6%未満、7%未満、8%未満、9%未満、または10%未満の活性の酵素活性を指し得る。いくつかの実施形態では、プライムエディターのCasタンパク質は、ヌクレアーゼ活性を完全に欠く。ヌクレアーゼ活性を欠くヌクレアーゼ、例えば、Cas9は、ヌクレアーゼ不活性または「ヌクレアーゼ死」(「d」と略される)と称され得る。ヌクレアーゼdead Casタンパク質(例えば、dCas、dCas9)は、標的ポリヌクレオチドに結合し得るが、標的ポリヌクレオチドを切断しない場合がある。いくつかの態様では、dead Casタンパク質は、dead Cas9タンパク質である。いくつかの実施形態では、プライムエディターは、ヌクレアーゼdead Casタンパク質を含み、ヌクレアーゼドメインのすべて(例えば、Cas9タンパク質におけるRuvC及びHNHヌクレアーゼドメインの両方;Cpf1タンパク質におけるRuvCヌクレアーゼドメイン)は、触媒活性を欠くように変異させられ、または欠失している。
Casタンパク質は、修飾され得る。Casタンパク質、例えば、Cas9は、核酸結合親和性、核酸結合特異性、及び/または酵素活性を増加または低下させるように修飾され得る。Casタンパク質はまた、タンパク質の任意の他の活性または特性、例えば、安定性を変化させるように修飾され得る。例えば、Casタンパク質の1つ以上のヌクレアーゼドメインは、修飾、欠失、または不活性化され得、またはCasタンパク質は、タンパク質の機能のために必須ではないドメインを除去するようにまたはCasタンパク質の活性を最適化(例えば、向上または低減する)ように切断され得る。
Casタンパク質は、融合タンパク質であり得る。例えば、Casタンパク質は、切断ドメイン、エピジェネティック修飾ドメイン、転写制御ドメイン、またはポリメラーゼドメインに融合され得る。Casタンパク質はまた、増加または低下した安定性を提供する異種ポリペプチドに融合され得る。融合ドメインまたは異種ポリペプチドは、Casタンパク質内のN末端、C末端、または内部に位置し得る。
Casタンパク質は、任意の形態で提供され得る。例えば、Casタンパク質は、タンパク質の形態、例えば、単独のまたはガイド核酸と複合体化されたCasタンパク質で提供され得る。Casタンパク質は、Casタンパク質をコードする核酸、例えば、RNA(例えば、メッセンジャーRNA(mRNA))またはDNAの形態で提供され得る。Casタンパク質をコードする核酸は、特定の細胞または生物におけるタンパク質への効率的な翻訳のためにコドン最適化され得る。
Casタンパク質をコードする核酸は、細胞のゲノムに安定的に組み込まれ得る。Casタンパク質をコードする核酸は、細胞において活性なプロモーターに機能可能に連結され得る。Casタンパク質をコードする核酸は、発現コンストラクトにおけるプロモーターに機能可能に連結され得る。発現コンストラクトには、対象となる遺伝子または他の核酸配列(例えば、Cas遺伝子)の発現を誘導することが可能であり、かつそのような対象となる核酸配列を標的細胞に移行させ得る任意の核酸コンストラクトが含まれ得る。
いくつかの実施形態では、Casタンパク質は、野生型Casタンパク質の修飾された形態を含み得る。いくつかの実施形態では、野生型Casタンパク質の修飾された形態は、Casタンパク質の核酸切断活性を低減する1つ以上の変異(例えば、アミノ酸欠失、挿入、及び/または置換)を含み得る。例えば、Casタンパク質の修飾された形態は、対応するタンパク質(例えば、S.pyogenesからのCas9)と比較して90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、未満30%、20%未満、10%未満、5%未満、または1%未満の核酸切断活性を有し得る。いくつかの実施形態では、Casタンパク質の修飾された形態は、実質的な核酸切断活性を有しない場合がある。Casタンパク質が、実質的な核酸切断活性を有しない修飾された形態である場合、それは、酵素的に不活性及び/または「dead」(「d」によって略される)と称され得る。dead Casタンパク質(例えば、dCas、dCas9)は、標的ポリヌクレオチドに結合し得るが、標的ポリヌクレオチドを切断しない場合がある。いくつかの実施形態では、dead Casタンパク質は、dead Cas9タンパク質である。
酵素的に不活性とは、配列特異的様式でポリヌクレオチドにおける核酸配列に結合し得るが、標的ポリヌクレオチドを切断しない場合があるポリペプチドを指し得る。酵素的に不活性な部位誘導ポリペプチドは、酵素的に不活性なドメイン(例えば、ヌクレアーゼドメイン)を含み得る。酵素的に不活性は、活性がないことを指し得る。酵素的に不活性は、実質的に活性がないことを指し得る。酵素的に不活性は、本質的に活性がないことを指し得る。酵素的に不活性は、対応する野生型の例示的な活性(例えば、核酸切断活性、野生型Cas9活性)と比較して1%未満、2%未満、3%未満、4%未満、5%未満、6%未満、7%未満、8%未満、9%未満、または10%未満の活性を指し得る。
いくつかの実施形態では、Casタンパク質の1つまたは複数のヌクレアーゼドメイン(例えば、RuvC、HNH)は、もはや機能的でなくなるようにまたは低減したヌクレアーゼ活性を含むように、欠失または変異させられ得る。例えば、少なくとも2つのヌクレアーゼドメイン(例えば、Cas9)を含むCasタンパク質において、ヌクレアーゼドメインのうちの1つが欠失または変異した場合、ニッカーゼとして知られている得られるCasタンパク質は、二本鎖DNA内のCRISPR RNA(crRNA)認識配列で一本鎖破断を生成し得るが、二本鎖破断を生成しない場合がある。そのようなニッカーゼは、相補鎖または非相補鎖を切断し得るが、両方を切断しない場合がある。Casタンパク質のヌクレアーゼドメインのすべて(例えば、Cas9タンパク質におけるRuvC及びHNHヌクレアーゼドメインの両方;Cpf1タンパク質におけるRuvCヌクレアーゼドメイン)が欠失または変異した場合、得られるCasタンパク質は、二本鎖標的DNAの両方の鎖を切断する低減した能力を有し得、またはその能力を有しない場合がある。Cas9タンパク質をニッカーゼに変換し得る変異の例は、S.pyogenesからのCas9のRuvCドメインにおけるD10Aアミノ酸置換(配列番号2に示されるCas9の位置10におけるアスパラギン酸からアラニンへの)変異である。S.pyogenesからのCas9のHNHドメインにおけるH840Aアミノ酸置換(配列番号2に示されるアミノ酸位置840におけるヒスチジンからアラニン)に対応する変異は、Cas9をニッカーゼに変換し得る。Cas9タンパク質をdead Cas9に変換し得る変異の例は、S.pyogenesからのCas9のRuvCドメインにおけるD10A(Cas9の位置10におけるアスパラギン酸からアラニンへの)変異及びHNHドメインにおけるH840A(アミノ酸位置840におけるヒスチジンからアラニン)である。
いくつかの実施形態では、dead Casタンパク質は、そのタンパク質の野生型バージョンと比べて1つ以上の変異を含み得る。変異は、野生型Casタンパク質の複数の核酸切断ドメインの1つ以上における核酸切断活性の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満をもたらし得る。変異は、標的核酸の相補鎖を切断する能力を保持するが、標的核酸の非相補鎖を切断するその能力を低減する複数の核酸切断ドメインの1つ以上をもたらし得る。変異は、標的核酸の非相補鎖を切断する能力を保持するが、標的核酸の相補鎖を切断するその能力を低減する複数の核酸切断ドメインの1つ以上をもたらし得る。変異は、標的核酸の相補鎖及び非相補鎖を切断する能力を欠く複数の核酸切断ドメインの1つ以上をもたらし得る。ヌクレアーゼドメインにおいて変異させられる残基は、ヌクレアーゼの1つ以上の触媒的残基に対応し得る。例えば、野生型の例示的なS.pyogenes Cas9ポリペプチドにおける残基、例えば、Asp10、His840、Asn854及びAsn856は、複数の核酸切断ドメイン(例えば、ヌクレアーゼドメイン)の1つ以上を不活性化するように変異させられ得る。Casタンパク質のヌクレアーゼドメインにおいて変異させられる残基は、例えば、配列及び/または構造アライメントによって決定される場合、野生型S.pyogenes Cas9ポリペプチドにおける残基Asp10、His840、Asn854及びAsn856に対応し得る。
非限定的な例として、配列番号2に示されるSpCas9におけるアミノ酸残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987、または別のCas9タンパク質における対応するアミノ酸残基のうちの1つ以上が変異させられ得る。例えば、Cas9タンパク質バリアントは、配列番号2に示されるD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、及び/またはD986Aアミノ酸置換または対応する変異のうちの1つ以上を含み得る。いくつかの実施形態では、アラニン置換以外の変異が好適であり得る。
いくつかの実施形態では、DNA結合ドメインは、ニッカーゼであるCasタンパク質ドメインを含む。いくつかの実施形態では、Casニッカーゼは、対応するCasタンパク質と比較してヌクレアーゼドメインにおける1つ以上のアミノ酸置換を含む。いくつかの実施形態では、ヌクレアーゼドメインにおける1つ以上のアミノ酸置換は、その二本鎖ヌクレアーゼ活性を低減または無効化するが、DNA結合活性を保持する。いくつかの実施形態では、Casニッカーゼは、対応するCasタンパク質と比較してHNHドメインにおけるアミノ酸置換を含む。いくつかの実施形態では、Casニッカーゼは、対応するCasタンパク質と比較してRuvCドメインにおけるアミノ酸置換を含む。いくつかの実施形態では、Casニッカーゼは、Cas9ニッカーゼである。いくつかの実施形態では、Cas9ニッカーゼは、対応するCas9タンパク質と比較してHNHドメインにおける1つ以上の変異を含む。いくつかの実施形態では、HNHドメインにおける1つ以上の変異は、HNHドメインのヌクレアーゼ活性を低減または無効化する。例示的なCas9ニッカーゼバリアントの配列は、配列番号7、597、598、600、601、603、606、607、609、610、612、または613で提供される。いくつかの実施形態では、Casタンパク質ドメインは、野生型Casタンパク質のヌクレアーゼ活性バリアント、ヌクレアーゼ不活性バリアント、ニッカーゼ、または機能的バリアントもしくは機能的断片である。
いくつかの実施形態では、Casタンパク質ドメインは、長さが800~1500アミノ酸、長さが1400~900アミノ酸、または長さが少なくとも1000~1300アミノ酸であり得る。いくつかの実施形態では、Cas9タンパク質ドメインは、長さが少なくとも800アミノ酸、長さが少なくとも900アミノ酸、長さが少なくとも1000アミノ酸、長さが少なくとも1100アミノ酸、または長さが少なくとも1200アミノ酸であり得る。いくつかの実施形態では、Cas9タンパク質ドメインは、長さが1057アミノ酸である。いくつかの実施形態では、Casタンパク質ドメインは、長さが1069アミノ酸である。いくつかの実施形態では、Casタンパク質ドメインは、長さが1369アミノ酸である。
いくつかの実施形態では、Casタンパク質ドメインは、PAM配列「NGA」(式中、Nは、任意のヌクレオチドである)を認識する。いくつかの実施形態では、Casタンパク質ドメインは、PAM配列「NGN」(式中、Nは、任意のヌクレオチドである)を認識する。いくつかの実施形態では、Casタンパク質ドメインは、PAM配列「NRN」(式中、Nは、任意のヌクレオチドである)を認識する。いくつかの実施形態では、Casタンパク質ドメインは、PAM配列「NNGRRT」(式中、Nは、任意のヌクレオチドである)を認識する。いくつかの実施形態では、Casタンパク質ドメインは、PAM配列「NNGG」(式中、Nは、任意のヌクレオチドである)を認識する。
いくつかの実施形態では、本明細書で提供されるプライムエディターは、改変されたPAM認識を可能とする修飾を含有するCasタンパク質ドメインを含む。Casタンパク質ベースのプライムエディターを使用するプライム編集において、「プロトスペーサー隣接モチーフ(PAM)」、PAM配列、またはPAM様モチーフは、標的遺伝子のPAM鎖上のプロトスペーサー配列にすぐ隣接する短いDNA配列を指すために使用され得る。いくつかの実施形態では、PAMは、プライム編集中にプライムエディターにおけるCasヌクレアーゼによって認識される。所定の実施形態では、PAMは、Casタンパク質ドメインの標的結合のために必要とされる。Casタンパク質ドメイン認識のために必要とされる特定のPAM配列は、特定のタイプのCasタンパク質に依存し得る。PAMは、長さが1、2、3、4、5、6、7、8、9、10またはそれを超えるヌクレオチドであり得る。いくつかの実施形態では、PAMは、長さが2~6ヌクレオチドである。いくつかの実施形態では、PAMは、5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは、3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置する)であり得る。いくつかの実施形態では、プライムエディターのCasタンパク質は、標準的なPAMを認識し、例えば、SpCas9は、5’-NGG-3’PAMを認識する。
いくつかの実施形態では、Casタンパク質ドメインは、1つ以上のヌクレアーゼドメインを含む。いくつかの実施形態では、Casタンパク質ドメインは、野生型Casタンパク質のヌクレアーゼドメインと少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含み得る。いくつかの実施形態では、Casタンパク質ドメインは、参照Casタンパク質(例えば、配列番号2、6、7、596~613のいずれか1つから選択されるCasタンパク質)のヌクレアーゼドメインと少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含み得る。いくつかの実施形態では、Casタンパク質ドメインは、単一のヌクレアーゼドメインを含む。
いくつかの実施形態では、プライムエディターは、配列特異的様式で標的遺伝子に結合し得るCasタンパク質ドメインを含むが、ヌクレアーゼ活性を欠き、または無効化されたヌクレアーゼ活性を有し、標的遺伝子における二本鎖DNAのいずれの鎖も切断しない場合がある。無効化された活性または欠いた活性は、野生型の例示的な活性(例えば、野生型Cas9ヌクレアーゼ活性)と比較して1%未満、2%未満、3%未満、4%未満、5%未満、6%未満、7%未満、8%未満、9%未満、または10%未満の活性の酵素活性を指し得る。
例示的なCasタンパク質ドメインが表14に示されている。いくつかの実施形態では、DNA結合ドメイン(例えば、Casタンパク質ドメインまたはCasタンパク質)は、配列番号2、6、7、596~613からなる群から選択されるアミノ酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である。いくつかの実施形態では、DNA結合ドメイン(例えば、Casタンパク質ドメインまたはCasタンパク質)は、配列番号2、6、7、596~613(例えば、表14)からなる群から選択されるアミノ酸配列を含む。いくつかの実施形態では、Casタンパク質またはCasタンパク質ドメインは、配列番号2、6、7、596~613(例えば、表14)からなる群から選択されるアミノ酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一であるアミノ酸配列を含む。いくつかの実施形態では、Casタンパク質またはCasタンパク質ドメインは、配列番号2、6、7、596~613(例えば、表14)からなる群から選択されるアミノ酸配列を含む。いくつかの実施形態では、Casタンパク質またはCasタンパク質ドメインは、対応するCasタンパク質またはCasタンパク質ドメイン(例えば、配列番号2、6、7、596~613に示されるCasタンパク質またはCasタンパク質ドメインのいずれか1つ)と比較してN末端メチオニンを欠くアミノ酸配列を含む。いくつかの実施形態では、プライム編集組成物は、配列番号2、6、7、596~613のいずれか1つのアミノ酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一であるアミノ酸配列を含むDNA結合ドメイン(例えば、Casタンパク質またはCasタンパク質ドメイン)をコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、配列番号2、6、7、596~613からなる群から選択されるアミノ酸配列を含むDNA結合ドメイン(例えば、Casタンパク質またはCasタンパク質ドメイン)をコードするポリヌクレオチドを含む。いくつかの実施形態では、DNA結合ドメイン(例えば、Casタンパク質またはCasタンパク質ドメイン)をコードするポリヌクレオチドは、DNAポリヌクレオチドである。いくつかの実施形態では、DNA結合ドメイン(例えば、Casタンパク質またはCasタンパク質ドメイン)をコードするポリヌクレオチドは、RNAポリヌクレオチドである。いくつかの実施形態では、DNA結合ドメイン、例えば、Casタンパク質またはCasタンパク質ドメインをコードするポリヌクレオチド(例えば、DNAポリヌクレオチド)は、配列番号627、または配列番号629の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含む。いくつかの実施形態では、DNA結合ドメイン、例えば、Casタンパク質またはCasタンパク質ドメインをコードするポリヌクレオチド(例えば、DNAポリヌクレオチド)は、配列番号627、及び配列番号629からなる群から選択される核酸配列を含む。
いくつかの実施形態では、DNA結合ドメイン、例えば、Casタンパク質またはCasタンパク質ドメインをコードするポリヌクレオチド(例えば、RNAポリヌクレオチド)は、配列番号628、または配列番号630の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含む。いくつかの実施形態では、DNA結合ドメイン、例えば、Casタンパク質またはCasタンパク質ドメインをコードするポリヌクレオチド(例えば、RNAポリヌクレオチド)は、配列番号628、または配列番号630からなる群から選択される核酸配列を含む。
いくつかの実施形態では、プライムエディターのCasタンパク質は、クラス2Casタンパク質である。いくつかの実施形態では、Casタンパク質は、II型Casタンパク質である。いくつかの実施形態では、Casタンパク質は、Cas9タンパク質、Cas9タンパク質の修飾されたバージョン、Cas9タンパク質ホモログ、変異体、バリアント、またはそれらの機能的断片である。本明細書で使用される場合、Cas9、Cas9タンパク質、Cas9ポリペプチドまたはCas9ヌクレアーゼは、1つ以上のCas9ヌクレアーゼドメイン及びガイドポリヌクレオチド、例えば、PEgRNAを結合させる能力を有するCas9 gRNA結合ドメインを含むRNAでガイドされるヌクレアーゼを指す。Cas9タンパク質は、任意の生物からの野生型Cas9タンパク質または任意の生物からのホモログ、オルソログ、もしくはパラログ;その任意の機能的変異体もしくは機能的バリアント;またはその任意の機能的断片もしくはドメインを指し得る。いくつかの実施形態では、プライムエディターは、全長Cas9タンパク質を含む。いくつかの実施形態では、Cas9タンパク質は通常、野生型参照Cas9タンパク質(例えば、S.pyogenesからのCas9)と少なくとも約50%、60%、70%、80%、90%、100%の配列同一性を含み得る。いくつかの実施形態では、Cas9は、野生型参照Cas9タンパク質と比較してアミノ酸変化、例えば、欠失、挿入、置換、融合、キメラ、またはそれらの任意の組み合わせを含む。例示的なCas9配列が表14に提供される。
いくつかの実施形態では、Cas9タンパク質は、Streptococcus pyogenes(Sp)、Staphylococcus aureus(Sa)、Streptococcus canis(Sc)、Streptococcus thermophilus(St)、Staphylococcus lugdunensis(Slu)、Neisseria meningitidis(Nm)、Campylobacter jejuni(Cj)、Francisella novicida(Fn)、またはTreponema denticola(Td)からのCas9タンパク質、または当該技術分野で知られている生物からの任意のCas9ホモログまたはオルソログを含み得る。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_038431314に示されるアミノ酸配列を含むSpCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、Uniprotアクセッション番号J7RUA5に示されるアミノ酸配列を含むSaCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、Uniprotアクセッション番号A0A3P5YA78に示されるアミノ酸配列を含むScCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_007896501.1に示されるアミノ酸配列を含むStCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_230580236.1またはWP_250638315.1またはWP_242234150.1、WP_241435384.1、WP_002460848.1、KAK58371.1に示されるアミノ酸配列を含むSluCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_002238326.1またはWP_061704949.1のいずれかに示されるアミノ酸配列を含むNmCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_100612036.1、WP_116882154.1、WP_116560509.1、WP_116484194.1、WP_116479303.1、WP_115794652.1、WP_100624872.1のいずれかに示されるアミノ酸配列を含むCjCas9ポリペプチドまたはその断片もしくはバリアントである。
いくつかの実施形態では、Cas9ポリペプチドは、例えば、Uniprotアクセッション番号A0Q5Y3に示されるアミノ酸配列を含むFnCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_147625065.1に示されるアミノ酸配列を含むTdCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、本明細書に記載される生物または当該技術分野で知られているものの2つ以上からのドメインを含むキメラである。いくつかの実施形態では、Cas9ポリペプチドは、例えば、NCBIアクセッション番号WP_003079701.1に示されるアミノ酸配列を含むStreptococcus macacaeからのCas9ポリペプチドまたはその断片もしくはバリアントである。いくつかの実施形態では、Cas9ポリペプチドは、SpCas9のPAM相互作用ドメインをStreptococcus macacae Cas9(Spy-mac Cas9)のものと置き換えることによって生成されるCas9ポリペプチドである。
例示的なStreptococcus pyogenes Cas9(SpCas9)アミノ酸配列が配列番号2に提供される。
いくつかの実施形態では、プライムエディターは、Staphylococcus lugdunensis(Slu Cas9)からのCas9タンパク質を含む。Slu Cas9の例示的なアミノ酸配列が配列番号606に提供される。
いくつかの実施形態では、Cas9タンパク質は、1つ以上のアミノ酸置換を含有するバリアントCas9タンパク質を含む。いくつかの実施形態では、野生型Cas9タンパク質は、RuvCドメイン及びHNHドメインを含む。いくつかの実施形態では、プライムエディターは、二本鎖標的DNA配列の両方の鎖を切断し得るヌクレアーゼ活性Cas9タンパク質を含む。いくつかの実施形態では、ヌクレアーゼ活性Cas9タンパク質は、機能的RuvCドメイン及び機能的HNHドメインを含む。いくつかの実施形態では、プライムエディターは、ガイドポリヌクレオチドに結合し、標的DNAを認識し得るが、二本鎖標的DNAの一方の鎖のみを切断し得るCas9ニッカーゼを含む。いくつかの実施形態では、Cas9ニッカーゼは、1つの機能的RuvCドメインまたは1つの機能的HNHドメインのみを含む。いくつかの実施形態では、プライムエディターは、非機能的HNHドメイン及び機能的RuvCドメインを有するCas9を含む。いくつかの実施形態では、プライムエディターは、編集鎖(すなわち、PAM鎖)を切断することができるが、二本鎖標的DNA配列の非編集鎖を切断することができない。いくつかの実施形態では、プライムエディターは、標的鎖(すなわち、非PAM鎖)を切断することができるが、二本鎖標的DNA配列の編集鎖を切断することができない非機能的RuvCドメインを有するCas9を含む。いくつかの実施形態では、プライムエディターは、機能的RuvCドメインも機能的HNHドメインも有しないCas9を有し、これは、二本鎖標的DNA配列のいずれの鎖も切断しない場合がある。
いくつかの実施形態では、プライムエディターは、RuvCドメインのヌクレアーゼ活性を低減または無効化するRuvCドメインにおける変異を有するCas9を含む。いくつかの実施形態では、Cas9は、配列番号2に示される野生型SpCas9と比較してアミノ酸D10における変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9は、配列番号2に示される野生型SpCas9と比較してD10A変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してアミノ酸D10、G12、及び/またはG17における変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してD10A変異、G12A変異、及び/またはG17A変異、またはその対応する変異を含む。
いくつかの実施形態では、プライムエディターは、HNHドメインのヌクレアーゼ活性を低減または無効化するHNHドメインにおける変異を有するCas9ポリペプチドを含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してアミノ酸H840における変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してH840A変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してアミノ酸E762、D839、H840、N854、N856、N863、H982、H983、A984、D986、及び/またはA987における変異、またはその対応する変異を含む。いくつかの実施形態では、Cas9ポリペプチドは、配列番号2に示される野生型SpCas9と比較してE762A、D839A、H840A、N854A、N856A、N863A、H982A、H983A、A984A、及び/またはD986A変異、またはその対応する変異を含む。
いくつかの実施形態では、プライムエディターは、HNHドメイン及びRuvCドメインの両方のヌクレアーゼ活性を低減または無効化するHNHドメイン及びRuvCドメインの両方における1つ以上のアミノ酸置換を有するCas9を含む。いくつかの実施形態では、プライムエディターは、ヌクレアーゼ不活性Cas9、またはヌクレアーゼdead Cas9(dCas9)を含む。いくつかの実施形態では、dCas9は、配列番号2に示される野生型SpCas9と比較してH840$置換及びD10X変異またはその対応する変異を含み、$は、H840$置換のためのH以外の任意のアミノ酸及びD10$置換のためのD以外の任意のアミノ酸である。いくつかの実施形態では、dead Cas9は、配列番号2に示される野生型SpCas9と比較してH840A及びD10A変異、またはその対応する変異を含む。
いくつかの実施形態では、N末端メチオニンは、Cas9ニッカーゼから、または本明細書で開示または企図される任意のCas9バリアント、オルソログ、または同等物から除去される。例えば、メチオニンを欠くCas9ニッカーゼには、以下の配列番号7、598、601、604、607、610、613、またはそれと少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有するアミノ酸配列を有するそのバリアントが含まれる。
dead Cas9及びCas9ニッカーゼバリアントに加えて、本明細書で使用されるCas9タンパク質にはまた、任意の野生型Cas9、または変異体Cas9(例えば、dead Cas9またはCas9ニッカーゼ)、または断片Cas9、または循環置換Cas9、または本明細書に開示されるまたは当該技術分野で知られているCas9の他のバリアントを含む、任意の参照Cas9タンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一を有する他のCas9バリアントが含まれ得る。いくつかの実施形態では、Cas9バリアントは、参照Cas9、例えば、野生型Cas9と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個またはそれを超えるアミノ酸変化を有し得る。いくつかの実施形態では、Cas9バリアントは、参照Cas9、例えば、野生型Cas9に対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一となるように、参照Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含む。いくつかの実施形態では、断片は、対応する野生型Cas9のアミノ酸長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、参照Cas9は、配列番号2、6、7、596~613からなる群から選択されるアミノ酸配列を含む。いくつかの実施形態では、プライムエディターは、改変されたPAM認識を可能とする修飾を含有するCasタンパク質、例えば、Cas9を含む。Casタンパク質ベースのプライムエディターを使用するプライム編集において、「プロトスペーサー隣接モチーフ(PAM)」、PAM配列、またはPAM様モチーフは、二本鎖標的DNA(例えば、標的遺伝子)のPAM鎖上のプロトスペーサー配列の直後の短いDNA配列を指すために使用され得る。いくつかの実施形態では、PAMは、プライム編集中にプライムエディターにおけるCasヌクレアーゼによって認識される。所定の実施形態では、PAMは、Casタンパク質の標的結合のために必要とされる。Casタンパク質認識のために必要とされる特定のPAM配列は、特定のタイプのCasタンパク質に依存し得る。PAMは、長さが1、2、3、4、5、6、7、8、9、10またはそれを超えるヌクレオチドであり得る。いくつかの実施形態では、PAMは、長さが2~6ヌクレオチドである。いくつかの実施形態では、PAMは、5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは、3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置する)であり得る。いくつかの実施形態では、プライムエディターのCasタンパク質は、標準的なPAMを認識し、例えば、SpCas9は、5’-NGG-3’PAMを認識する。いくつかの実施形態では、プライムエディターのCasタンパク質は、改変されたまたは非標準的PAM特異性を有する。例示的なPAM配列及び対応するCasバリアントが以下の表1aに記載されている。提供されるバリアントの各々について、Casタンパク質は、野生型Casタンパク質配列、例えば、配列番号2に示されるCas9と比較して示されるアミノ酸置換の1つ以上を含むことが理解されるべきである。以下の表1aに示されるPAMモチーフは、5’から3’への順序である。

Figure 2024525665000002
いくつかの実施形態では、プライムエディターは、配列番号2に示される野生型SpCas9ポリペプチドと比較してA61R、L111R、D1135V、R221K、A262T、R324L、N394K、S409I、S409I、E427G、E480K、M495V、N497A、Y515N、K526E、F539S、E543D、R654L、R661A、R661L、R691A、N692A、M694A、M694I、Q695A、H698A、R753G、M763I、K848A、K890N、Q926A、K1003A、R1060A、L1111R、R1114G、D1135E、D1135L、D1135N、S1136W、V1139A、D1180G、G1218K、G1218R、G1218S、E1219Q、E1219V、E1219V、Q1221H、P1249S、E1253K、N1317R、A1320V、P1321S、A1322R、I1322V、D1332G、R1332N、A1332R、R1333K、R1333P、R1335L、R1335Q、R1335V、T1337N、T1337R、S1338T、H1349R、及びそれらの任意の組み合わせからなる群から選択される1つ以上の変異を含むCas9ポリペプチドを含む。
いくつかの実施形態では、プライムエディターは、SaCas9ポリペプチドを含む。いくつかの実施形態では、SaCas9ポリペプチドは、野生型SaCas9(例えば、配列番号596)と比較して変異E782K、N968K、及びR1015Hのうちの1つ以上を含む。いくつかの実施形態では、プライムエディターは、FnCas9ポリペプチド、例えば、野生型FnCas9ポリペプチドまたは野生型FnCas9と比較して変異E1369R、E1449H、またはR1556Aのうちの1つ以上を含むFnCas9ポリペプチドを含む。いくつかの実施形態では、プライムエディターは、ScCas9、例えば、野生型ScCas9を含み、またはScCas9ポリペプチドは、野生型ScCas9と比較して変異I367K、G368D、I369K、H371L、T375S、T376G、及びT1227Kのうちの1つ以上を含む。いくつかの実施形態では、プライムエディターは、St1 Cas9ポリペプチド、St3 Cas9ポリペプチド、またはSlu Cas9ポリペプチドを含む。
いくつかの実施形態では、プライムエディターは、循環置換Casバリアントを含むCasポリペプチドを含む。例えば、プライムエディターのCas9ポリペプチドは、Cas9タンパク質(例えば、野生型Cas9タンパク質、またはCas9ニッカーゼ)のN末端及びC末端が、ガイドRNA(gRNA)と複合体化した場合にDNAを結合させる能力を保持するように局所的に再配置されるように操作され得る。例示的な循環置換構成は、N末端-[元のC末端]-[元のN末端]-C末端であり得る。任意のバリアント、オルソログ、または天然に存在するCas9またはその同等物を含むCas9タンパク質のいずれかは、循環置換バリアントとして再構成され得る。
いくつかの実施形態では、本明細書に記載のプライムエディターはまた、Cas9以外のCasタンパク質を含み得る。例えば、いくつかの実施形態では、本明細書に記載されるプライムエディターは、Cas12a(Cpf1)ポリペプチドまたはその機能的バリアントを含み得る。いくつかの実施形態では、Cas12aポリペプチドは、Cas12aポリペプチドのエンドヌクレアーゼドメインを低減または無効化する変異を含む。いくつかの実施形態では、Cas12aポリペプチドは、Cas12aニッカーゼである。いくつかの実施形態では、Casタンパク質は、天然に存在するCas12aポリペプチドと少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を含むアミノ酸配列を含む。
いくつかの実施形態では、プライムエディターは、Cas12b(C2c1)またはCas12c(C2c3)ポリペプチドであるCasタンパク質を含む。いくつかの実施形態では、Casタンパク質は、天然に存在するCas12b(C2c1)またはCas12c(C2c3)タンパク質と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を含むアミノ酸配列を含む。いくつかの実施形態では、Casタンパク質は、Cas12bニッカーゼまたはCas12cニッカーゼである。いくつかの実施形態では、Casタンパク質は、Cas12e、Cas12d、Cas13、Cas14a、Cas14b、Cas14c、Cas14d、Cas14e、Cas14f、Cas14g、Cas14h、Cas14u、またはCasΦポリペプチドである。いくつかの実施形態では、Casタンパク質は、天然に存在するCas12e、Cas12d、Cas13、Cas14a、Cas14b、Cas14c、Cas14d、Cas14e、Cas14f、Cas14g、Cas14h、Cas14u、またはCasΦタンパク質と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を含むアミノ酸配列を含む。いくつかの実施形態では、Casタンパク質は、Cas12e、Cas12d、Cas13、またはCasΦニッカーゼである。
フラップエンドヌクレアーゼ
いくつかの実施形態では、プライムエディターは、追加のポリペプチド成分、例えば、フラップエンドヌクレアーゼ(FEN、例えば、FEN1)をさらに含む。いくつかの実施形態では、フラップエンドヌクレアーゼは、二本鎖標的DNA(例えば、標的遺伝子)の編集鎖の5’一本鎖DNAを切除し、二本鎖標的DNA(例えば、標的遺伝子)への意図されるヌクレオチド編集の組み込みを補助する。いくつかの実施形態では、FENは、別の成分に連結または融合される。いくつかの実施形態では、FENは、トランスで、例えば、FENをコードする別々のポリペプチドまたはポリヌクレオチドとして提供される。
いくつかの実施形態では、プライムエディターまたはプライム編集組成物は、フラップヌクレアーゼを含む。いくつかの実施形態では、フラップヌクレアーゼは、FEN1、またはその任意のFEN1機能的バリアント、機能的変異体、もしくは機能的断片である。いくつかの実施形態では、フラップヌクレアーゼは、本明細書に記載されているまたは当該技術分野で知られているフラップヌクレアーゼのいずれかと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるアミノ酸配列を有する。
核局在化配列
いくつかの実施形態では、プライムエディターは、1つ以上の核局在化配列(NLS)をさらに含む。いくつかの実施形態では、NLSは、細胞核へのタンパク質の転座の促進を補助する。いくつかの実施形態では、プライムエディターは、1つ以上のNLSを含む融合タンパク質、例えば、DNA結合ドメイン及びDNAポリメラーゼを含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターの1つ以上のポリペプチドは、1つ以上のNLSに融合または連結される。いくつかの実施形態では、プライムエディターは、トランスで提供されるDNA結合ドメイン及びDNAポリメラーゼドメインを含み、DNA結合ドメイン及び/またはDNAポリメラーゼドメインは、1つ以上のNLSに融合または連結されている。
所定の実施形態では、プライムエディターまたはプライム編集複合体は、少なくとも1つのNLSを含む。いくつかの実施形態では、プライムエディターまたはプライム編集複合体は、少なくとも2つのNLSを含む。少なくとも2つのNLSを有する実施形態では、NLSは、同じNLSであり得、またはそれらは、異なるNLSであり得る。
いくつかの例では、プライムエディターは、少なくとも1つの核局在化配列(NLS)をさらに含み得る。いくつかの場合では、プライムエディターは、1つのNLSをさらに含み得る。いくつかの場合では、プライムエディターは、2つのNLSをさらに含み得る。
また、NLSは、プライムエディター複合体の一部として発現し得る。いくつかの実施形態では、NLSは、タンパク質のアミノ酸配列におけるほぼ任意の場所に位置し得、通常、3つ以上または4つ以上のアミノ酸の短い配列を含む。NLS融合体の位置は、N末端、C末端であるか、またはプライムエディターまたはその成分の配列内の任意の場所に位置し得る(例えば、N末端からC末端またはC末端からN末端のいずれかの順序で、プライムエディター融合タンパク質のDNA結合ドメインとDNAポリメラーゼドメインとの間、DNA結合ドメインとリンカー配列との間、DNAポリメラーゼとリンカー配列との間、プライムエディター融合タンパク質またはその成分の2つのリンカー配列の間で挿入される)。いくつかの実施形態では、プライムエディターは、N末端でNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、C末端でNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、N末端及びC末端の両方で少なくとも1つのNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、N末端及び/またはC末端で2つのNLSを含む融合タンパク質である。
当該技術分野で知られている任意のNLSも本明細書で企図される。NLSは、任意の天然に存在するNLS、または任意の天然に存在しないNLS(例えば、野生型NLSと比べて1つ以上の変異を有するNLS)であり得る。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、双節型NLSを含む。いくつかの実施形態では、核局在化シグナル(NLS)は、主に塩基性である。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、リジン及びアルギニン残基に富む。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、プロリン残基を含む。いくつかの実施形態では、核局在化シグナル(NLS)は、配列MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号16)、KRTADGSEFESPKKKRKV(配列番号8)、KRTADGSEFEPKKKRKV(配列番号11)を含む。
いくつかの実施形態では、NLSは、単節型NLSである。例えば、いくつかの実施形態では、NLSは、SV40ラージT抗原NLS;PKKKRKV(配列番号12)である。いくつかの実施形態では、NLSは、双節型NLSである。いくつかの実施形態では、双節型NLSは、可変数のアミノ酸を含むスペーサー配列によって隔てられた2つの塩基性ドメインを含む。いくつかの実施形態では、NLSは、双節型NLSである。いくつかの実施形態では、双節型NLSは、可変数のアミノ酸を含むスペーサー配列によって隔てられた2つの塩基性ドメインからなる。いくつかの実施形態では、NLSは、配列番号8~24及び621のいずれか1つのアミノ酸配列と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一であるアミノ酸配列を含む。いくつかの実施形態では、NLSは、8~24及び621からなる群から選択されるアミノ酸配列を含む。いくつかの実施形態では、プライム編集組成物は、配列番号8~24及び621のいずれか1つのアミノ酸配列と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一であるアミノ酸配列を含むNLSをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、8~24及び621からなる群から選択されるアミノ酸配列を含むNLSをコードするポリヌクレオチドを含む。いくつかの実施形態では、NLSをコードするポリヌクレオチド(例えば、DNAポリヌクレオチドまたはRNAポリヌクレオチド)は、配列番号637、638、631または632のいずれか1つの核酸配列と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一である核酸配列を含む。いくつかの実施形態では、NLSをコードするポリヌクレオチド配列(例えば、DNAポリヌクレオチド)は、配列番号637、または631のいずれか1つの核酸配列と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一である核酸配列を含む。いくつかの実施形態では、NLSをコードするポリヌクレオチド配列(例えば、RNAポリヌクレオチド)は、配列番号638、または632のいずれか1つの核酸配列と少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一である核酸配列を含む。
当該技術分野で知られている任意のNLSも本明細書で企図される。NLSは、任意の天然に存在するNLS、または任意の天然に存在しないNLS(例えば、野生型NLSと比べて1つ以上の変異を有するNLS)であり得る。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、双節型NLSを含む。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、リジン及びアルギニン残基に富む。いくつかの実施形態では、プライムエディターの1つ以上のNLSは、プロリン残基を含む。NLS配列の非限定的な例が以下の表2に提供される。
Figure 2024525665000003
リンカー
プライムエディターの成分、例えば、DNA結合ドメイン及びDNAポリメラーゼドメインを含むポリペプチドは、リンカー、例えば、ペプチドまたは非ペプチドリンカーを介して融合され得、または互いに対してトランスで提供され得る。例えば、逆転写酵素は、DNA結合ドメインを有する融合タンパク質の一部ではなく個々の成分として発現され、送達され、またはそうでなければ提供され得る。そのような場合では、プライムエディターの成分は、非ペプチド結合または共局在化機能を介して会合され得る。いくつかの実施形態では、プライムエディターは、プライムエディターまたはプライム編集システムの他の成分と相互作用し、会合することが可能である、またはそれを動員することが可能である追加の成分をさらに含む。例えば、プライムエディターは、RNA-タンパク質動員RNAアプタマーと会合し得るRNA-タンパク質動員ポリペプチドを含み得る。いくつかの実施形態では、RNA-タンパク質動員ポリペプチドは、特定のRNA配列を動員し、またはそれによって動員され得る。
RNA-タンパク質動員ポリペプチド及びRNAアプタマー対の非限定的な例には、MS2コートタンパク質及びMS2 RNAヘアピン、PCPポリペプチド及びPP7 RNAヘアピン、Comポリペプチド及びCom RNAヘアピン、Kuタンパク質及びテロメラーゼKu結合RNAモチーフ、ならびにSm7タンパク質及びテロメラーゼSm7結合RNAモチーフが含まれる。いくつかの実施形態では、プライムエディターは、RNA-タンパク質動員ポリペプチドに融合または連結されたDNA結合ドメインを含む。いくつかの実施形態では、プライムエディターは、RNA-タンパク質動員ポリペプチドに融合または連結されたDNAポリメラーゼドメインを含む。いくつかの実施形態では、RNA-タンパク質動員ポリペプチドに融合されたDNA結合ドメイン及びDNAポリメラーゼドメイン、またはRNA-タンパク質動員ポリペプチド及びDNAポリメラーゼドメインに融合されたDNA結合ドメインは、RNA-タンパク質動員ポリペプチドの対応するRNA-タンパク質動員RNAアプタマーによって共局在化される。いくつかの実施形態では、PEgRNAまたはngRNAの一部分に融合または連結された対応するRNA-タンパク質動員RNAアプタマー。例えば、DNAポリメラーゼ及びRNAでガイドされるDNA結合ドメイン(例えば、Cas9ニッカーゼ)の共局在化のためのDNAポリメラーゼに融合または連結されたMS2コートタンパク質及びPEgRNA上に導入されたMS2ヘアピン。
所定の実施形態では、プライムエディターの成分は、互いに直接的に融合される。所定の実施形態では、プライムエディターの成分は、リンカーを介して互いに会合される。
本明細書で使用される場合、リンカーは、2つの分子または部位、例えば、プライムエディターのDNA結合ドメイン及びDNAポリメラーゼドメインを連結させる任意の化学基または分子であり得る。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部位である。いくつかの実施形態では、リンカーは、非ペプチド部位を含む。リンカーは、共有結合のように単純であり得、またはそれは、長さがポリマー性リンカーの多くの原子、例えば、ポリヌクレオチド配列であり得る。いくつかの実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合等)である。所定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。いくつかの実施形態では、リンカーは、長さがポリマー性リンカーの多くの原子、例えば、ポリペプチド配列である。
いくつかの実施形態では、リンカーは、プライムエディターの2つのドメイン、例えば、DNA結合ドメイン及びDNAポリメラーゼドメインを接続させる。いくつかの実施形態では、リンカーは、プライムエディターの2つ以上のドメイン、例えば、DNA結合ドメイン、DNAポリメラーゼドメイン、RNA結合タンパク質ドメイン(例えば、MS2動員アプタマーRNA配列に結合するMS2コートタンパク質)、及び/またはフラップヌクレアーゼドメインの各々、または少なくとも2つを接続させる。いくつかの実施形態では、リンカーは、プライムエディターの2つ以上のドメイン、例えば、DNA結合ドメイン、DNAポリメラーゼドメイン、RNA結合タンパク質ドメイン(例えば、MS2動員アプタマーRNA配列に結合するMS2コートタンパク質)、フラップヌクレアーゼドメイン、及び/または1つ以上の核局在化配列の各々、または少なくとも2つを接続させる。
いくつかの実施形態では、リンカーは、アミノ酸であり、または複数のアミノ酸を含むペプチドである。所定の実施形態では、プライムエディターの2つ以上の成分は、ペプチドリンカーによって互いに連結される。いくつかの実施形態では、ペプチドリンカーは、長さが5~100アミノ酸、例えば、長さが2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~120、120~130、130~140、140~150、または150~200アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが5~100アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが10~80アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが15~70アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが16アミノ酸、長さが24アミノ酸、長さが64アミノ酸、または長さが96アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが少なくとも50アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが少なくとも40アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが少なくとも30アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが46アミノ酸である。いくつかの実施形態では、ペプチドリンカーは、長さが92アミノ酸である。
例えば、プライムエディターのDNA結合ドメイン及びDNAポリメラーゼドメインは、ペプチドまたはタンパク質リンカーによって接続され得る。いくつかの実施形態では、プライムエディターは、DNA結合ドメイン、例えば、Cas9ニッカーゼドメイン、及びDNAポリメラーゼドメイン、例えば、M-MLV逆転写酵素ドメインを接続させる1つ以上のペプチドリンカーを含む融合タンパク質を含む。
いくつかの他の実施形態では、ペプチドリンカーは、アミノ酸モチーフGGGS、GGSS、GGS(配列番号287)、GGGGS、SGGS(配列番号288)、EAAAK、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列(GGGGS)n(配列番号376)、(G)n(配列番号377)、(EAAAK)n(配列番号378)、(GGS)n(配列番号379)、(SGGS)n(配列番号380)、(GGSS)n(配列番号381)、(XP)n(配列番号382)、またはそれらの任意の組み合わせ(式中、nは、独立して、1~30の整数であり、Xは、任意のアミノ酸である)を含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列(GGS)n(配列番号379)(式中、nは、1、3、または7である)を含む。いくつかの実施形態では、ペプチドリンカーは、XTENモチーフと称され得るアミノ酸配列SGSETPGTSESATPES(配列番号295)を含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、または6個の連続するXTENモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号296)を含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列SGGSGGSGGS(配列番号383)を含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列SGGS(配列番号288)を含む。他の実施形態では、ペプチドリンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号384)を含む。
いくつかの実施形態では、ペプチドリンカーは、少なくとも2個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも3個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも2個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも3個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフをさらに含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続GGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続GGSSモチーフを含む。
いくつかの実施形態では、ペプチドリンカーは、少なくとも2個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも3個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも2個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも3個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフをさらに含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続SGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のSGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続SGGSモチーフを含む。
いくつかの実施形態では、ペプチドリンカーは、少なくとも3個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも3個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも4個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも5個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも6個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも7個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも8個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも9個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフをさらに含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、少なくとも1個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続EAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のEAAAKモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のGGSモチーフ及び3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続EAAAKモチーフを含む。
いくつかの実施形態では、ペプチドリンカーは、(GGSS)m-(GGS)n(式中、m及びnはそれぞれ、0~50の任意の整数である)のアミノ酸配列を含む。いくつかの実施形態では、m及びnは、同じである。いくつかの実施形態では、m及びnは、異なる。いくつかの実施形態では、ペプチドリンカーは、(配列番号385)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号386)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号387)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号388)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号389)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号390)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号391)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号392)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号393)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号394)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号395)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号396)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号397)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号398)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号399)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号400)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号401)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号402)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号403)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号404)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号405)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号406)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号407)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号408)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号409)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号410)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、(配列番号411)のアミノ酸配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号286~411のいずれか1つのアミノ酸配列を含む。
例示的なペプチドリンカー配列は、以下の表3に提供される:

Figure 2024525665000004

Figure 2024525665000005

Figure 2024525665000006

Figure 2024525665000007
いくつかの実施形態では、プライムエディターの2つ以上のポリペプチド成分は、非ペプチドリンカーによって互いに連結されている。いくつかの実施形態では、リンカーは、非ペプチド部位を含む。いくつかの実施形態では、リンカーは、アミド結合の炭素-窒素結合である。所定の実施形態では、リンカーは、環状または非環状、置換または非置換、分岐状または非分岐状脂肪族またはヘテロ脂肪族リンカーである。所定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステル等)である。所定の実施形態では、リンカーは、アミノアルカノール酸のモノマー、ダイマー、またはポリマーを含む。所定の実施形態では、リンカーは、アミノアルカノール酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等)を含む。所定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)のモノマー、ダイマー、またはポリマーを含む。所定の実施形態では、リンカーは、炭素環式部位(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部位(PEG)を含む。所定の実施形態では、リンカーは、アリールまたはヘテロアリール部位を含む。所定の実施形態では、リンカーは、フェニル環に基づく。リンカーには、ペプチドからリンカーへの求核試薬(例えば、チオール、アミノ)の結合を容易化するための官能化部位が含まれ得る。任意の求電子剤が、リンカーの一部として使用され得る。例示的な求電子剤には、活性化エステル、活性化アミド、マイケル受容体、アルキルハライド、アリールハライド、アシルハライド、及びイソチオシアネートが含まれるがこれらに限定されない。
プライムエディターの成分は、互いに任意の順序で接続され得る。いくつかの実施形態では、プライムエディターのDNA結合ドメイン及びDNAポリメラーゼドメインは、N末端からC末端への任意の順序で、融合タンパク質を形成するために融合され得、またはペプチドまたはタンパク質リンカーによって接続され得る。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメインのC末端に融合または連結されたDNA結合ドメインを含む。いくつかの実施形態では、プライムエディターは、DNAポリメラーゼドメインのN末端に融合または連結されたDNA結合ドメインを含む。いくつかの実施形態では、プライムエディターは、構造NH2-[DNA結合ドメイン]-[DNAポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[DNA結合ドメイン]-COOHを含む融合タンパク質であって、「]-[」の各場合は、任意のリンカー配列の存在を示す、融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、トランスで提供される融合タンパク質及びDNAポリメラーゼドメインを含み、融合タンパク質は、構造NH2-[DNA結合ドメイン]-[RNA-タンパク質動員ポリペプチド]-COOHを含む。いくつかの実施形態では、プライムエディターは、トランスで提供される融合タンパク質及びDNA結合ドメインを含み、融合タンパク質は、構造NH2-[DNAポリメラーゼドメイン]-[RNA-タンパク質動員ポリペプチド]-COOHを含む。
また、NLSは、プライムエディター組成物、融合タンパク質、または複合体の一部として表され得る。NLS融合体の位置は、N末端、C末端であるか、またはプライムエディターまたはその成分の配列内の任意の場所に位置し得る(例えば、N末端からC末端またはC末端からN末端のいずれかの順序で、プライムエディター融合タンパク質のDNA結合ドメインとDNAポリメラーゼドメインとの間、DNA結合ドメインとリンカー配列との間、DNAポリメラーゼとリンカー配列との間、プライムエディター融合タンパク質またはその成分の2つのリンカー配列の間で挿入される)。いくつかの実施形態では、プライムエディターは、N末端でNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、C末端でNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、N末端及びC末端の両方で少なくとも1つのNLSを含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、N末端及び/またはC末端で2つのNLSを含む融合タンパク質である。
いくつかの実施形態では、プライム編集は、1つ以上のペプチドリンカー及び1つ以上のNLSを含む融合タンパク質を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、1つ以上の双節型NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、1つ以上の双節型NLS及び1つ以上のペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つの双節型NLS及び1つ以上のペプチドリンカーを含む。いくつかの実施形態では、1つ以上の双節型NLSは、cmyc双節型NLSである。いくつかの実施形態では、2つの双節型NLSは、それぞれ、プライムエディター融合タンパク質のN末端及びC末端にある。いくつかの実施形態では、プライムエディター融合タンパク質は、双節型NLS及びXTENリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つの双節型NLS及びXTENリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、双節型NLS及び(GGSS)モチーフを含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つの双節型NLS及び(GGSS)モチーフを含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、双節型NLS及び1、2、3、4、5、7、8、9、10、11、12個、またはそれを超える(GGSS)モチーフを含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つの双節型NLS及び1、2、3、4、5、7、8、9、10、11、12個、またはそれを超える(GGSS)モチーフを含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、双節型NLS及び1、2、3、4、5、7、8、9、10、11、12個、またはそれを超える(EAAAK)モチーフを含むペプチドリンカーを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つの双節型NLS及び1、2、3、4、5、7、8、9、10、11、12個、またはそれを超える(EAAAK)モチーフを含むペプチドリンカーを含む。
いくつかの実施形態では、プライムエディターは、N末端からC末端へ以下の構造:[NLS]-[Cas9(H840A)]-[ペプチドリンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)](アミノ酸置換は、括弧内に示されている)を有するDNA結合ドメイン(例えば、Cas9(H840A))及び逆転写酵素(例えば、バリアントMMLV RT)を含む融合タンパク質を含む。
いくつかの実施形態では、プライムエディターは、N末端からC末端へ構造:
[NLS1]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素];
[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS1];
[NLS1]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS2];
[NLS1]-[NLS2]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS];
[NLS1]-[NLS2]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS3]-[NLS4];
[NLS1]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS2]-[NLS3];
[NLS1]-[NLS2]-[NLS3]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS4];
[NLS1]-[NLS2]-[NLS3]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS4]-[NLS5];
[NLS1]-[NLS2]-[NLS3]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS4]-[NLS5]-[NLS6];
[NLS1]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS2]-[NLS3]-[NLS4];
[NLS1]-[NLS2]-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS3]-[NLS4]-[NLS5];
[NLS1]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン];
[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS1];
[NLS1]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS2];
[NLS1]-[NLS2]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS];
[NLS1]-[NLS2]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS3]-[NLS4];
[NLS1]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS2]-[NLS3];
[NLS1]-[NLS2]-[NLS3]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS4];
[NLS1]-[NLS2]-[NLS3]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS4]-[NLS5];
[NLS1]-[NLS2]-[NLS3]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS4]-[NLS5]-[NLS6];
[NLS1]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS2]-[NLS3]-[NLS4];または
[NLS1]-[NLS2]-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS3]-[NLS4]-[NLS5]
を含む融合タンパク質を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:
[NLS]n-[DNA結合ドメイン]-[ペプチドリンカー]-[逆転写酵素]-[NLS]m、または[NLS]n-[逆転写酵素]-[ペプチドリンカー]-[DNA結合ドメイン]-[NLS]m(式中、n及びmは、0~50の任意の整数であり、[NLS]nは、n個のNLSモチーフ配列であり、[NLS]mは、m個のNLSモチーフ配列を指す)を含む。n個のNLSモチーフ配列は、同じである場合があり、同じではない場合がある。いくつかの実施形態では、m及びnは、同じである。いくつかの実施形態では、n及びmは、異なる。
DNAポリメラーゼは、本明細書に記載されているまたは当該技術分野で知られているDNAポリメラーゼのいずれかであり得る。いくつかの実施形態では、DNAポリメラーゼは、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態では、DNAポリメラーゼは、HNHドメインにおけるヌクレアーゼ不活性化アミノ酸置換を含むnCas9である。いくつかの実施形態では、DNAポリメラーゼは、野生型SpCas9と比較してH840Aアミノ酸置換を含むnCas9である。
逆転写酵素は、本明細書に記載されているまたは当該技術分野で知られている逆転写酵素のいずれかであり得る。いくつかの実施形態では、逆転写酵素は、M-MLV RTである。いくつかの実施形態では、逆転写酵素は、本明細書に記載されるアミノ酸置換または切断のいずれか1つを有するM-MLV RT機能的バリアントである。いくつかの実施形態では、。
いくつかの実施形態では、NLS1、NLS2、NLS3、NLS4、NLS5、NLS6のいずれか1つは、独立して、当該技術分野で知られているまたは本明細書に記載されるNLSである。いくつかの実施形態では、NLS1、NLS2、NLS3、NLS4、NLS5、NLS6のいずれか1つは、双節型NLSである。いくつかの実施形態では、NLS1、NLS2、NLS3、NLS4、NLS5、NLS6のいずれか1つは、アミノ酸配列PAAKRVKLD(配列番号19)を含むc-Myc NLSである。いくつかの実施形態では、NLS1、NLS2、NLS3、NLS4、NLS5、NLS6のいずれか1つは、単節型NLSである。いくつかの実施形態では、NLS1、NLS2、NLS3、NLS4、NLS5、NLS6のいずれか1つは、SV40NLSである。
いくつかの実施形態では、NLS1~6の2つ以上は、同じである。いくつかの実施形態では、NLS1~6は、互いに異なる。
プライムエディター構造のいずれかでは、ペプチドリンカーは、本明細書に記載されているまたは当該技術分野で知られている任意のペプチドリンカーであり得る。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)m-(GGS)n(式中、m及びnはそれぞれ、0~50の任意の整数である)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGS)n-(GGSS)m(式中、m及びnはそれぞれ、0~50の任意の整数である)を含む。いくつかの実施形態では、m及びnは、同じである。いくつかの実施形態では、m及びnは、異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)6-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)7-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)8-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)9-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)10-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)11-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)12-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)13-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)14-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)15-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)6を含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列(GGSS)-(GGS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)8を含む。いくつかの実施形態では、ペプチドリンカーは、アミノ酸配列(GGSS)-(GGS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)11を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)12を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)13を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)14を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)-(GGS)15を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)3-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)4-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)5-(GGS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)6-(GGS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)7-(GGS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)8-(GGS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)9-(GGS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)10-(GGS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)11-(GGS)11を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)12-(GGS)12を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)13-(GGS)13を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)14-(GGS)14を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へアミノ酸配列:(GGSS)15-(GGS)15を含む。
いくつかの実施形態では、ペプチドリンカーは、(GGSS)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、配列SGSETPGTSESATPES(配列番号295)を含むXTENモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2つ以上の(GGSS)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、XTENモチーフ及び(GGSS)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、1つ以上のXTENモチーフ及び2つ以上の(GGSS)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2つ以上のXTENモチーフ及び2つ以上の(GGSS)モチーフを含む。いくつかの実施形態では、1つ以上または2つ以上のXTENモチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上のXTENモチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上の(GGSS)は、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上の(GGSS)は、ペプチドリンカーのN末端にある。いくつかの実施形態では、ペプチドリンカーは、各末端で(GGSS)モチーフと隣接する1つ以上のXTENモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、各末端で(GGSS)モチーフと隣接する2つ以上のXTENモチーフを含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)n-(XTEN)m-(GGSS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうちの2つは、同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)2-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)2-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)2-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)1-(XTEN)3-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)3-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)3-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)4-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)4-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)5-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)5-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)6-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)6-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)6-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)6-(GGSS)6を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)7-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)7-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)7-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)7-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)8-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)8-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)8-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)8-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)9-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)9-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)9-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)9-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)10-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)10-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)10-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)10-(GGSS)10を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)6-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)7-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)8-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)9-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)10-(XTEN)5を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(GGSS)10-を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(GGSS)10を含む。
いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)n(式中、nは、0~50の任意の整数である)を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)2を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)3を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)4を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)5を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)6を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)7を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)8を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)9を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)10を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)11を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)12を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)13を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)14を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)15を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)16を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)17を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)18を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)19を含む。いくつかの実施形態では、ペプチドリンカーは、配列(GGSS)20を含む。
いくつかの実施形態では、ペプチドリンカーは、GGSSモチーフ、XTENモチーフ、及びGGSモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)n-(XTEN)m-(GGS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、n、m、及びwは、同じ整数である。いくつかの実施形態では、n、m、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)n-(XTEN)m-(GGSS)x-(GGS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、n、m、x、及びwは、同じ整数である。いくつかの実施形態では、n、m、x、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGS)3を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)4-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)5-(GGS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGS)5を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)2-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGSS)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)2-(XTEN)2-(GGSS)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)3-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGSS)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)3-(XTEN)3-(GGSS)3-(GGS)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)4-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGSS)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)4-(XTEN)4-(GGSS)4-(GGS)4を含む。いくつかの実施形態では、ペプチドリンカーは、
N末端からC末端へ配列:(GGSS)5-(XTEN)-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)5-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)-(XTEN)-(GGSS)-(GGS)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGSS)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGSS)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)5-(XTEN)5-(GGSS)5-(GGS)5を含む。
いくつかの実施形態では、ペプチドリンカーは、(EAAAK)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2つ以上の(EAAAK)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、XTENモチーフ及び(EAAAK)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、1つ以上のXTENモチーフ及び2つ以上の(EAAAK)モチーフを含む。いくつかの実施形態では、ペプチドリンカーは、2つ以上のXTENモチーフ及び2つ以上の(EAAAK)モチーフを含む。いくつかの実施形態では、1つ以上または2つ以上のXTENモチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上のXTENモチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上の(EAAAK)モチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、1つ以上または2つ以上の(EAAAK)モチーフは、ペプチドリンカーのN末端にある。いくつかの実施形態では、ペプチドリンカーは、各末端で(EAAAK)モチーフと隣接する1つ以上のXTENモチーフを含む。いくつかの実施形態では、ペプチドリンカーは、各末端で(EAAAK)モチーフと隣接する2つ以上のXTENモチーフを含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)n-(XTEN)m-(EAAAK)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうちの2つは、同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)2-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)2-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)2-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)2-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)2-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)1-(XTEN)3-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)3-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)3-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)3-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)3-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)3-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)3-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)3-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)4-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)4-(EAAAK)を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)4-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)4-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)5-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)5-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)5-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)5-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)6-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)6-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)6-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)6-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)7-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)7-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)7-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)7-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)8-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)8-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)8-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)8-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)9-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)9-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)9-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)9-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)10-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)10-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)10-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)10-(EAAAK)10を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)2-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)3-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)4-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)5-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)3を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)6-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)7-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)8-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)9-(XTEN)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)10-(XTEN)5を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)6を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)-(EAAAK)10-を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)2-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)3-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)4-(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)5-(EAAAK)10を含む。
いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)n(式中、nは、0~50の任意の整数である)を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)2を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)3を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)4を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)5を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)6を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)7を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)8を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)9を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)10を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)11を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)12を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)13を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)14を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)15を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)16を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)17を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)18を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)19を含む。いくつかの実施形態では、ペプチドリンカーは、配列(EAAAK)20を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)n-A(式中、nは、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)2-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)3-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)4-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)5-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)6-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)7-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)8-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)9-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)10-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)11-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)12-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)13-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)14-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)15-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)16-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)17-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)18-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)19-Aを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:A-(EAAAK)20-Aを含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)n-SGGS(式中、nは、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)2-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)3-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)4-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)5-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)6-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)7-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)8-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)9-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)10-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)11-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)12-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)13-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)14-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)15-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)16-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)17-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)18-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)19-SGGSを含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:SGGS-(EAAAK)20-SGGSを含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)n-(EAAAK)m-(GGS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうちの2つは、同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)6-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)7-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)8-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)9-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)10-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)11-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)12-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)13-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)14-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(EAAAK)15-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)3-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)4-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)5-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)6-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)7-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)8-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)9-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)10-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)11-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)12-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)13-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)14-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(EAAAK)15-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)n-(XTEN)m-(EAAAK)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGSS)n-(EAAAK)m-(XTEN)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)n-(XTEN)m-(GGSS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(EAAAK)n-(GGSS)m-(XTEN)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)n-(GGSS)m-(EAAAK)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(XTEN)n-(EAAAK)m-(GGSS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうち2つが同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。
いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)n(式中、nは、0~50の任意の整数である)を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)2を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)3を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)4を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)5を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)6を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)7を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)8を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)9を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)10を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)11を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)12を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)13を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)14を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)15を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)16を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)17を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)18を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)19を含む。いくつかの実施形態では、ペプチドリンカーは、配列(PAPA)20を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)n-(PAPA)m-(GGS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうちの2つは、同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)2-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)3-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)4-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)5-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)6-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)7-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)8-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)9-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)10-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)11-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)12-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)13-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)14-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)15-(GGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)2-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)3-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)4-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)5-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)6-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)7-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)8-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)9-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)10-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)11-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)12-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)13-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)14-(GGS)2を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)2-(PAPA)15-(GGS)2を含む。
いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)n-(PAPA)m-(PSGGS)w(式中、n、m、wはそれぞれ、0~50の任意の整数である)の配列を含む。いくつかの実施形態では、m、n、及びwは、同じであり、またはm、n、及びwのうちの2つは、同じである。いくつかの実施形態では、m、n、及びwはそれぞれ、互いに異なる。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)2-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)3-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)4-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)5-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)6-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)7-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)8-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)9-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)10-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)11-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)12-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)13-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)14-(PSGGS)を含む。いくつかの実施形態では、ペプチドリンカーは、N末端からC末端へ配列:(GGS)-(PAPA)15-(PSGGS)を含む。
いくつかの実施形態では、ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号289~311からなる群から選択される配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号302の配列を含む。いくつかの実施形態では、ペプチドリンカーは、配列番号309の配列を含む。
核局在化シグナル
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で第1のNLS及びC末端で第2のNLSを含む。いくつかの実施形態では第1及び第2のNLSは、同一である。いくつかの実施形態では第1及び第2のNLSは、同一ではない。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインのC末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端で第1のNLS及びDNA結合ドメインのC末端で第2のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのC末端で第1のNLS及びDNA結合ドメインN末端で第2のNLSを含む。いくつかの実施形態では第1及び第2のNLSは、同一である。いくつかの実施形態では第1及び第2のNLSは、同一ではない。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのC末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つ以上のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端及び/またはC末端で2つ以上のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインとDNAポリメラーゼドメインとの間でNLSを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含み、NLSは、配列MKRTADGSEFESPKKKRKV(配列番号9)を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含み、NLSは、配列(KRTADGSEFESPKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含み、NLSは、配列MPAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号15)を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含み、NLSは、配列(PAAKRVKLDGGKRTADGSEFESPKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列KRTADGSEFESPKKKRKV(配列番号8)を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列(KRTADGSEFESPKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列PKKKRKV(配列番号12)を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列(PKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列KRTADSQHSTPPKTKRKV-EFES-PKKKRKVを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列(KRTADSQHSTPPKTKRKV-EFES-PKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列KRTADSQHSTPPKTKRKV-EFE-PKKKRKVを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含み、NLSは、配列(KRTADSQHSTPPKTKRKV-EFE-PKKKRKV)n(式中、nは、0~50、1~50、2~40、2~25、2~10、または2~5の任意の整数である)を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列KRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列KRTADGSEFESPKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列KRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列KRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列KRTADSQHSTPPKTKRKV-EFES-PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列KRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列KRTADSQHSTPPKTKRKV-EFE-PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列PAAKRVKLDGGKRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列PAAKRVKLDGGKRTADGSEFESPKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列PAAKRVKLDGGKRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列PAAKRVKLDGGKRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列KRTADSQHSTPPKTKRKV-EFES-PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で1つ以上のNLS及びC末端で1つ以上のNLSを含み、N末端におけるNLSは、配列PAAKRVKLDGGKRTADGSEFESPKKKRKVを含み、C末端におけるNLSは、配列KRTADSQHSTPPKTKRKV-EFE-PKKKRKVを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:BPNLS-DNA結合ドメイン-(GGSS)2-XTEN-(GGSS2)-逆転写酵素-BPNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:SV40BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素-SV40BPNLS1を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:SV40BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素(G504X)-SV40BPNLS1を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:BPNLS-DNA結合ドメイン-(GGSS)2-XTEN-(GGSS2)-逆転写酵素-BPNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:SV40BPNLS-DNA結合ドメイン-SGGS-(EAAAK)4-SGGS-逆転写酵素-SV40BPNLS1を含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:SV40BPNLS-DNA結合ドメイン-SGGS-(EAAAK)4-SGGS-逆転写酵素(G504X)-SV40BPNLS1を含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:c-MycNLS-BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素-BPNLS-NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:C-mycNLS-BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素-BPNLS-SV40NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:BPNLS-DNA結合ドメイン-(EAAAK)8-逆転写酵素-BPNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:BPNLS-DNA結合ドメイン-(GGSS)2-XTEN-(GGSS)2-逆転写酵素-NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:BPNLS-DNA結合ドメイン-(GGSS)2-XTEN-(GGSS)2-逆転写酵素-SV40NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:C-mycNLS-BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素(G504X)-BPNLS-NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:C-mycNLS-BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素-BPNLS-SV40NLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端からC末端へ構造:C-mycNLS-BPNLS-DNA結合ドメイン-(SGGS)8-逆転写酵素(G504X)-BPNLS-NLSを含む。
いくつかの実施形態では、プライムエディター融合タンパク質は、N末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、C末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端で第1のNLS及びC末端で第2のNLSを含む。いくつかの実施形態では第1及び第2のNLSは、同一である。いくつかの実施形態では第1及び第2のNLSは、同一ではない。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインのC末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端で第1のNLS及びDNA結合ドメインのC末端で第2のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのN末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのC末端で第1のNLS及びDNA結合ドメインN末端で第2のNLSを含む。いくつかの実施形態では第1及び第2のNLSは、同一である。いくつかの実施形態では第1及び第2のNLSは、同一ではない。いくつかの実施形態では、プライムエディター融合タンパク質は、DNAポリメラーゼドメインのC末端でNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、2つ以上のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、N末端及び/またはC末端で2つ以上のNLSを含む。いくつかの実施形態では、プライムエディター融合タンパク質は、DNA結合ドメインとDNAポリメラーゼドメインとの間でNLSを含む。いくつかの実施形態では、NLSまたは2つ以上のNLSは、双節型NLS(BPNLS)を含む。いくつかの実施形態では、BPNLSは、双節型SV40 NLSまたは双節型XenopusヌクレオプラスミンNLSである。いくつかの実施形態では、BPNLSは、配列番号8~23からなる群から選択されるアミノ酸配列を含む。
いくつかの実施形態では、プライムエディター融合タンパク質、プライムエディターのポリペプチド成分、またはプライムエディター融合タンパク質もしくはポリペプチド成分をコードするポリヌクレオチドは、N末端半分及びC末端半分またはN末端半分及びC末端半分をコードするポリペプチドに分割し、細胞において別々に標的DNAに提供され得る。例えば、所定の実施形態では、プライムエディター融合タンパク質は、AAVベクターにおいて別々の送達のためにN末端及びC末端半分に分割し、その後、標的細胞において翻訳及び共局在化されて、完全なポリペプチドまたはプライムエディタータンパク質を再形成し得る。そのような場合では、タンパク質または融合タンパク質の別々の半分はそれぞれ、インテイン容易化トランススプライシングのメカニズムによって完全なタンパク質または融合タンパク質の共局在化及び再形成を容易化するためにスプリットインテインを含み得る。いくつかの実施形態では、プライムエディターは、インテイン-Nに融合されたN末端半分、及びインテイン-Cに融合されたC末端半分、またはその各々をコードするポリヌクレオチドもしくはベクター(例えば、AAVベクター)を含む。標的細胞において送達及び/または発現させられる場合、インテイン-N及びインテイン-Cは、タンパク質トランス-スプライシングを介して切除され得、標的細胞における完全なプライムエディター融合タンパク質をもたらす。
いくつかの実施形態では、プライムエディターは、配列番号77、78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、及び230のいずれか1つのアミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の同一性を有するアミノ酸配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号34、35、77、78、85、86、620、622、624、625、または647のアミノ酸配列を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号2、6、7、または596~613のいずれか1つのアミノ酸配列を含むDNA結合ドメインを含む融合タンパク質含む。いくつかの実施形態では、プライムエディターは、配列番号1、4、5、36、45、54、63、または623のいずれか1つのアミノ酸配列を含む逆転写酵素を含む融合タンパク質を含む。いくつかの実施形態では、プライムエディターは、配列番号77のアミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、配列番号78のアミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、配列番号85のアミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、配列番号86のアミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含む融合タンパク質である。いくつかの実施形態では、プライムエディターは、配列番号79~82、87~90、94~95、97~98、100~103、106~109、112~115、118~121、123、124、126、127、129、130、132、133、135、136、138、139、144、145、147、148、150、151、153、154、156、157、159、160、162、163、165、166、168、169、171、172、174、175、177、178、180、181、183、184、186、187、189、190、192、193、195、196、198、199、201、202、204、205、207、208、210、211、213、214、216、217、219、220、222、223、225、226、228、229、231、232、233、234、241、242、274~285、及び592~595のいずれかに示されるヌクレオチド配列を含むポリヌクレオチドによってコードされる融合タンパク質である。いくつかの実施形態では、プライムエディターは、配列番号79~82、87~90、274~285、または592~595に示されるヌクレオチド配列を含むポリヌクレオチドによってコードされる融合タンパク質である。
プライム編集ガイドRNA(PEgRNA)
用語「プライム編集ガイドRNA」、または「PEgRNA」は、二本鎖標的ポリヌクレオチド、例えば、二本鎖標的DNAへの組み込みのための1つ以上の意図されるヌクレオチド編集を含むガイドポリヌクレオチドを指す。いくつかの実施形態では、PEgRNAは、プライムエディターと会合し、それをプライム編集を介して二本鎖標的DNA、例えば、標的遺伝子に1つ以上の意図されるヌクレオチド編集を組み込むように誘導する。「ヌクレオチド編集」または「意図されるヌクレオチド編集」は、1つの特定の位置における1つ以上のヌクレオチドの特定の欠失、1つの特定の位置における1つ以上のヌクレオチドの挿入、単一のヌクレオチドの置換、または二本鎖標的DNA、例えば、標的遺伝子の配列に組み込まれる1つの特定の位置における他の改変を指す。意図されるヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子の標的鎖上の配列と比較した編集鋳型上の編集を指し得、または編集標的配列と比較して、編集標的配列を置き換える新しく合成された一本鎖DNA上の編集鋳型によってコードされる編集を指し得る。いくつかの実施形態では、PEgRNAは、二本鎖標的DNA、例えば、標的遺伝子の標的鎖上のサーチ標的配列に相補的または実質的に相補的であるスペーサー配列を含む。いくつかの実施形態では、PEgRNAは、プライムエディターのDNA結合ドメイン、例えば、CRISPR-Casタンパク質ドメインと会合するgRNAコアを含む。いくつかの実施形態では、PEgRNAは、二本鎖標的DNA、例えば、標的遺伝子の内因性配列と比較して1つ以上の意図されるヌクレオチド編集を含む伸長したヌクレオチド配列をさらに含み、伸長したヌクレオチド配列は、伸長アームと称され得る。
所定の実施形態では、伸長アームは、標的プライミング化DNA合成を開始させ得るプライマー結合部位配列(PBS)を含む。いくつかの実施形態では、PBSは、プライムエディターによって生成されるニック部位で二本鎖標的DNA、例えば、標的遺伝子の編集鎖上の遊離3’末端に相補的または実質的に相補的である。いくつかの実施形態では、伸長アームは、プライム編集によって二本鎖標的DNA、例えば、標的遺伝子に組み込まれる1つ以上の意図されるヌクレオチド編集を含む編集鋳型をさらに含む。いくつかの実施形態では、編集鋳型は、プライムエディターのRNA依存性DNAポリメラーゼドメインまたはポリペプチド、例えば、逆転写酵素ドメインのための鋳型である。逆転写酵素編集鋳型はまた、本明細書でRT鋳型、またはRTTと称され得る。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子における編集標的配列と部分的な相補性を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子に組み込まれる意図されるヌクレオチド編集の位置を除き、編集標的配列と実質的または部分的相補性を含む。PEgRNA(その成分を含む)の例示的な構成が図2に図示されている。
いくつかの実施形態では、PEgRNAは、RNAヌクレオチドのみを含み、RNAポリヌクレオチドを形成する。いくつかの実施形態では、PEgRNAは、RNA及びDNAヌクレオチドの両方を含むキメラポリヌクレオチドである。例えば、PEgRNAには、スペーサー配列、gRNAコア、または伸長アームにおいてDNAが含まれ得る。いくつかの実施形態では、PEgRNAは、スペーサー配列においてDNAを含む。いくつかの実施形態では、PEgRNAのスペーサー配列の全体が、DNA配列である。いくつかの実施形態では、PEgRNAは、gRNAコアにおいて、例えば、gRNAコアのステム領域においてDNAを含む。いくつかの実施形態では、PEgRNAは、伸長アームにおいて、例えば、編集鋳型においてDNAを含む。DNA配列を含む編集鋳型は、プライムエディターにおけるDNAポリメラーゼ、例えば、DNA依存性DNAポリメラーゼのためのDNA合成鋳型として機能し得る。したがって、PEgRNAは、スペーサー、gRNAコア、及び/またはPBS配列におけるRNA及び編集鋳型におけるDNAを含むキメラポリヌクレオチドであり得る。
PEgRNAの成分は、モジュール様式で配置され得る。いくつかの実施形態では、スペーサーならびにプライマー結合部位配列(PBS)及び編集鋳型、例えば、逆転写酵素鋳型(RTT)を含む伸長アームは、PEgRNAの5’部分、PEgRNAの3’部分、またはgRNAコアの中央部において交換可能に位置し得る。いくつかの実施形態では、PEgRNAは、PBS及び編集鋳型配列を5’から3’の順序で含む。いくつかの実施形態では、本開示のPEgRNAのgRNAコアは、PEgRNAのスペーサーと伸長アームとの間に位置し得る。いくつかの実施形態では、PEgRNAのgRNAコアは、スペーサーの3’末端に位置し得る。いくつかの実施形態では、PEgRNAのgRNAコアは、スペーサーの5’末端に位置し得る。いくつかの実施形態では、PEgRNAのgRNAコアは、伸長アームの3’末端に位置し得る。いくつかの実施形態では、PEgRNAのgRNAコアは、伸長アームの5’末端に位置し得る。いくつかの実施形態では、PEgRNAは、5’から3’へ:スペーサー、gRNAコア、及び伸長アームを含む。いくつかの実施形態では、PEgRNAは、5’から3’へ:スペーサー、gRNAコア、編集鋳型、及びPBSを含む。いくつかの実施形態では、PEgRNAは、5’から3’へ:伸長アーム、スペーサー、及びgRNAコアを含む。いくつかの実施形態では、PEgRNAは、5’から3’へ:編集標的、PBS、スペーサー、及びgRNAコアを含む。
いくつかの実施形態では、PEgRNAは、スペーサー配列、gRNAコア、及び伸長アームを含む単一のポリヌクレオチド分子を含む。いくつかの実施形態では、PEgRNAは、複数のポリヌクレオチド分子、例えば、2つのポリヌクレオチド分子を含む。いくつかの実施形態では、PEgRNAは、スペーサー及びgRNAコアの一部分を含む第1のポリヌクレオチド分子、ならびにgRNAコアの残部及び伸長アームを含む第2のポリヌクレオチド分子を含む。いくつかの実施形態では、第1のポリヌクレオチド分子におけるgRNAコア部分及び第2のポリヌクレオチド分子におけるgRNAコア部分は、少なくとも部分的に互いに相補的である。いくつかの実施形態では、PEgRNAは、スペーサー及びgRNAコアの第1の部分(crRNAとも称され得る)を含む第1のポリヌクレオチドを含み得る。いくつかの実施形態では、PEgRNAは、gRNAコアの第2の部分及び伸長アームを含む第2のポリヌクレオチドを含み、gRNAコアの第2の部分は、トランス活性化crRNA、またはtracrRNAとも称され得る。いくつかの実施形態では、gRNAコアのcrRNA部分及びtracrRNA部分は、少なくとも部分的に互いに相補的である。いくつかの実施形態ではcrRNA及びtracrRNAの部分的に相補的な部分は、図4に例示されるように、下部ステム、バルジ、及び上部ステムを形成する。
いくつかの実施形態では、スペーサー配列は、二本鎖標的DNA、例えば、AT7B遺伝子の標的鎖上のサーチ標的配列と実質的相補性を有する領域を含む。いくつかの実施形態では、PEgRNAのスペーサー配列は、二本鎖標的DNA、例えば、標的遺伝子の編集鎖上のプロトスペーサー配列と同一または実質的に同一である(プロトスペーサー配列がチミンを含み、スペーサー配列がウラシルを含み得る場合を除く)。いくつかの実施形態では、スペーサー配列は、二本鎖標的DNA、例えば、標的遺伝子におけるサーチ標的配列と少なくとも約70%、75%、80%、85%、90%、95%、または100%相補的である。いくつかの実施形態では、スペーサーは、サーチ標的配列と実質的に相補的である。
いくつかの実施形態では、スペーサーの長さは、少なくとも10ヌクレオチド~100ヌクレオチドまで可変である。例えば、スペーサーは、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチドであり得る。いくつかの実施形態では、スペーサーは、長さが16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、20ヌクレオチド、21ヌクレオチド、22ヌクレオチド、23ヌクレオチド、24ヌクレオチド、または25ヌクレオチドである。いくつかの実施形態では、スペーサーは、長さが15ヌクレオチド~30ヌクレオチド、長さが15~25ヌクレオチド、長さが18~22ヌクレオチド、長さが10~20ヌクレオチド、長さが20~30ヌクレオチド、長さが30~40ヌクレオチド、長さが40~50ヌクレオチド、長さが50~60ヌクレオチド、長さが60~70ヌクレオチド、長さが70~80ヌクレオチド、または長さが90ヌクレオチド~100ヌクレオチドである。いくつかの実施形態では、スペーサーは、長さが20ヌクレオチドである。いくつかの実施形態では、スペーサーは、長さが17~18ヌクレオチドである。
本明細書で使用される場合、PEgRNAまたはニックガイドRNA配列、またはその断片、例えば、スペーサー、PBS、またはRTT配列において、別途示されない限り、文字「T」または「チミン」は、PEgRNAまたはガイドRNA配列をコードするDNA配列における核酸塩基を示し、PEgRNAまたはガイドRNAのウラシル(U)核酸塩基または当該技術分野で知られている任意の化学的に修飾されたウラシル核酸塩基、例えば、5-メトキシウラシルを指すことが意図されることが理解されるべきである。
PEgRNAの伸長アームは、プライマー結合部位(PBS)及び編集鋳型(例えば、RTT)を含み得る。伸長アームは、スペーサーと部分的に相補的であり得る。いくつかの実施形態では、編集鋳型(例えば、RTT)は、スペーサーと部分的に相補的であり得る。いくつかの実施形態では、編集鋳型(例えば、RTT)及びプライマー結合部位(PBS)はそれぞれ、スペーサーと部分的に相補的である。
PEgRNAの伸長アームは、プライムエディターでのニッキングによって生成される二本鎖標的DNA、例えば、標的遺伝子における一本鎖DNAの遊離3’末端とハイブリダイズするプライマー結合部位配列(PBS、またはPBS配列)を含み得る。PBS配列の長さは、例えば、プライムエディター成分、サーチ標的配列、及びPEgRNAの他の成分に応じて様々であり得る。いくつかの実施形態では、プライマー結合部位(PBS)の長さは、少なくとも2ヌクレオチド~50ヌクレオチドまで可変である。例えば、プライマー結合部位(PBS)は、長さが少なくとも2ヌクレオチド、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、または少なくとも50ヌクレオチドであり得る。いくつかの実施形態では、PBSは、長さが少なくとも6ヌクレオチドである。いくつかの実施形態では、PBSは、長さが約4~16ヌクレオチド、約6~16ヌクレオチド、約6~18ヌクレオチド、約6~20ヌクレオチド、約8~20ヌクレオチド、約10~20ヌクレオチド、約12~20ヌクレオチド、約14~20ヌクレオチド、約16~20ヌクレオチド、または約18~20ヌクレオチドである。いくつかの実施形態では、PBSは、長さが約7~15ヌクレオチドである。いくつかの実施形態では、PBSは、長さが6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、PBSは、長さが8、9、10、11、12、13、または14ヌクレオチドである。
PBSは、二本鎖標的DNA、例えば、標的遺伝子の編集鎖におけるDNA配列に相補的または実質的に相補的であり得る。プライムエディターニッキングによって生成された遊離ヒドロキシ基、例えば、遊離3’末端での編集鎖とのアニーリングによって、PBSは、ニック部位で編集鋳型によってコードされる新たな一本鎖DNAの合成を開始させ得る。いくつかの実施形態では、PBSは、二本鎖標的DNA、例えば、標的遺伝子の編集鎖の領域と少なくとも約70%、75%、80%、85%、90%、95%、または100%相補的である。いくつかの実施形態では、PBSは、二本鎖標的DNA、例えば、標的遺伝子の編集鎖の領域と完全に相補的、または100%相補的である。
PEgRNAの伸長アームは、プライム編集中にプライムエディターにおけるDNAポリメラーゼのためのDNA合成鋳型として機能する編集鋳型を含み得る。
編集鋳型の長さは、例えば、プライムエディター成分、サーチ標的配列、及びPEgRNAの他の成分に応じて様々であり得る。いくつかの実施形態では、編集鋳型は、逆転写酵素のためのDNA合成鋳型として機能し、編集鋳型は、逆転写編集鋳型(RTT)と称される。
編集鋳型(例えば、RTT)は、いくつかの実施形態では、長さが2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドである。いくつかの実施形態では、RTTは、長さが12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドである。いくつかの実施形態では、RTTは、長さが16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40ヌクレオチドである。
いくつかの実施形態では、編集鋳型(例えば、RTT)配列は、二本鎖標的DNA、例えば、標的遺伝子の編集鎖上の編集標的配列と約70%、75%、80%、85%、90%、95%、または99%相補的である。いくつかの実施形態では、編集鋳型配列(例えば、RTT)は、編集標的配列に対して実質的に相補的である。いくつかの実施形態では、編集鋳型配列(例えば、RTT)は、二本鎖標的DNA、例えば、標的遺伝子に組み込まれる意図されるヌクレオチド編集の位置を除き、編集標的配列と相補的である。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子における編集鎖における編集標的配列と約85%~約95%の相補性を含むヌクレオチド配列を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子の編集鎖における編集標的配列と約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、または約99%の相補性を含む。
PEgRNAの編集鋳型における意図されるヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して様々なタイプの改変を含み得る。いくつかの実施形態では、ヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して単一のヌクレオチド置換である。いくつかの実施形態では、ヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して欠失である。いくつかの実施形態では、ヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して挿入である。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して1~10個の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して1つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して2つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して3つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して4つ以上、5つ以上、または6つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して、2つの単一ヌクレオチド置換、挿入、欠失、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して、3つの単一ヌクレオチド置換、挿入、欠失、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列と比較して、4、5、または6つの単一ヌクレオチド置換、挿入、欠失、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、ヌクレオチド置換は、アデニン(A)からチミン(T)への置換を含む。いくつかの実施形態では、ヌクレオチド置換は、Aからグアニン(G)への置換を含む。いくつかの実施形態では、ヌクレオチド置換は、Aからシトシン(C)への置換を含む。いくつかの実施形態では、ヌクレオチド置換は、T-A置換を含む。いくつかの実施形態では、ヌクレオチド置換は、T-G置換を含む。いくつかの実施形態では、ヌクレオチド置換は、T-C置換を含む。いくつかの実施形態では、ヌクレオチド置換は、GからAへの置換を含む。いくつかの実施形態では、ヌクレオチド置換は、GからTへの置換を含む。いくつかの実施形態では、ヌクレオチド置換は、GからCへの置換を含む。いくつかの実施形態では、ヌクレオチド置換は、CからAへの置換を含む。いくつかの実施形態では、ヌクレオチド置換は、CからTへの置換を含む。いくつかの実施形態では、ヌクレオチド置換は、CからGへの置換を含む。
いくつかの実施形態では、ヌクレオチド挿入は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、または少なくとも20ヌクレオチドである。いくつかの実施形態では、ヌクレオチド挿入は、長さが1~2ヌクレオチド、1~3ヌクレオチド、1~4ヌクレオチド、1~5ヌクレオチド、2~5ヌクレオチド、3~5ヌクレオチド、3~6ヌクレオチド、3~8ヌクレオチド、4~9ヌクレオチド、5~10ヌクレオチド、6~11ヌクレオチド、7~12ヌクレオチド、8~13ヌクレオチド、9~14ヌクレオチド、10~15ヌクレオチド、11~16ヌクレオチド、12~17ヌクレオチド、13~18ヌクレオチド、14~19ヌクレオチド、15~20ヌクレオチドである。いくつかの実施形態では、ヌクレオチド挿入は、単一ヌクレオチド挿入である。いくつかの実施形態では、ヌクレオチド挿入は、2つのヌクレオチドの挿入を含む。
PEgRNAの編集鋳型は、編集される二本鎖標的DNA、例えば、標的遺伝子と比較して、1つ以上の意図されるヌクレオチド編集を含み得る。PEgRNAの他の成分に対する、または二本鎖標的DNA、例えば、標的遺伝子における特定のヌクレオチド(例えば、変異)に対する意図されるヌクレオチド編集(複数可)の位置は、様々であり得る。いくつかの実施形態では、ヌクレオチド編集は、プロトスペーサー配列に対応するまたはそれと相同なPEgRNAの領域におけるものである。いくつかの実施形態では、ヌクレオチド編集は、プロトスペーサー配列の外の二本鎖標的DNAの領域に対応するPEgRNAの領域におけるものである。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子におけるヌクレオチド編集組み込みの位置は、プロトスペーサー隣接モチーフ(PAM)の位置に基づいて決定され得る。例えば、意図されるヌクレオチド編集は、プロトスペーサー隣接モチーフ(PAM)配列に対応する配列において導入され得る。いくつかの実施形態では、編集鋳型におけるヌクレオチド編集は、PAM配列の最も5’のヌクレオチドに対応する位置におけるものである。いくつかの実施形態では、編集鋳型におけるヌクレオチド編集は、PAM配列の最も3’のヌクレオチドに対応する位置におけるものである。いくつかの実施形態では、編集鋳型における意図されるヌクレオチド編集の位置は、編集鋳型を、二本鎖標的DNA、例えば、標的遺伝子の部分的に相補的な編集鎖とアライメントすること、及び意図されるヌクレオチド編集が組み込まれた編集鎖上のヌクレオチド位置を言及することによって言及され得る。いくつかの実施形態では、ヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子の編集鎖におけるPAM配列の最も5’のヌクレオチドの約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40ヌクレオチド上流に対応する位置で組み込まれる。参照位置の0ヌクレオチド上流または下流とは、意図されるヌクレオチドが、参照位置のすぐ上流または下流にあることを意味する。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの約0~2ヌクレオチド、0~4ヌクレオチド、0~6ヌクレオチド、0~8ヌクレオチド、0~10ヌクレオチド、2~4ヌクレオチド、2~6ヌクレオチド、2~8ヌクレオチド、2~10ヌクレオチド、2~12ヌクレオチド、4~6ヌクレオチド、4~8ヌクレオチド、4~10ヌクレオチド、4~12ヌクレオチド、4~14ヌクレオチド、6~8ヌクレオチド、6~10ヌクレオチド、6~12ヌクレオチド、6~14ヌクレオチド、6~16ヌクレオチド、8~10ヌクレオチド、8~12ヌクレオチド、8~14ヌクレオチド、8~16ヌクレオチド、8~18ヌクレオチド、10~12ヌクレオチド、10~14ヌクレオチド、10~16ヌクレオチド、10~18ヌクレオチド、10~20ヌクレオチド、12~14ヌクレオチド、12~16ヌクレオチド、12~18ヌクレオチド、12~20ヌクレオチド、12~22ヌクレオチド、14~16ヌクレオチド、14~18ヌクレオチド、14~20ヌクレオチド、14~22ヌクレオチド、14~24ヌクレオチド、16~18ヌクレオチド、16~20ヌクレオチド、16~22ヌクレオチド、16~24ヌクレオチド、16~26ヌクレオチド、18~20ヌクレオチド、18~22ヌクレオチド、18~24ヌクレオチド、18~26ヌクレオチド、18~28ヌクレオチド、20~22ヌクレオチド、20~24ヌクレオチド、20~26ヌクレオチド、20~28ヌクレオチド、または20~30ヌクレオチド上流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの3ヌクレオチド上流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの4ヌクレオチド上流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの5ヌクレオチド上流に対応する位置で組み込まれる。いくつかの実施形態では、編集鋳型におけるヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの6ヌクレオチド上流に対応する位置におけるものである。
いくつかの実施形態では、意図されるヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子の編集鎖におけるPAM配列の最も5’のヌクレオチドの約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40ヌクレオチド下流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの約0~2ヌクレオチド、0~4ヌクレオチド、0~6ヌクレオチド、0~8ヌクレオチド、0~10ヌクレオチド、2~4ヌクレオチド、2~6ヌクレオチド、2~8ヌクレオチド、2~10ヌクレオチド、2~12ヌクレオチド、4~6ヌクレオチド、4~8ヌクレオチド、4~10ヌクレオチド、4~12ヌクレオチド、4~14ヌクレオチド、6~8ヌクレオチド、6~10ヌクレオチド、6~12ヌクレオチド、6~14ヌクレオチド、6~16ヌクレオチド、8~10ヌクレオチド、8~12ヌクレオチド、8~14ヌクレオチド、8~16ヌクレオチド、8~18ヌクレオチド、10~12ヌクレオチド、10~14ヌクレオチド、10~16ヌクレオチド、10~18ヌクレオチド、10~20ヌクレオチド、12~14ヌクレオチド、12~16ヌクレオチド、12~18ヌクレオチド、12~20ヌクレオチド、12~22ヌクレオチド、14~16ヌクレオチド、14~18ヌクレオチド、14~20ヌクレオチド、14~22ヌクレオチド、14~24ヌクレオチド、16~18ヌクレオチド、16~20ヌクレオチド、16~22ヌクレオチド、16~24ヌクレオチド、16~26ヌクレオチド、18~20ヌクレオチド、18~22ヌクレオチド、18~24ヌクレオチド、18~26ヌクレオチド、18~28ヌクレオチド、20~22ヌクレオチド、20~24ヌクレオチド、20~26ヌクレオチド、20~28ヌクレオチド、または20~30ヌクレオチド下流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの3ヌクレオチド下流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの4ヌクレオチド下流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの5ヌクレオチド下流に対応する位置で組み込まれる。いくつかの実施形態では、ヌクレオチド編集は、PAM配列の最も5’のヌクレオチドの6ヌクレオチド下流に対応する位置で組み込まれる。「上流」及び「下流」は、5’から3’方向で配向した核酸分子における少なくとも2つの領域または配列における相対的位置を定義することが意図される。例えば、第1の配列は、第1の配列が第2の配列に対して5’に位置する場合、DNA分子において第2の配列の上流である。したがって、第2の配列は、第1の配列の下流である。
PEgRNAで言及される場合、1つ以上の意図されるヌクレオチド編集の位置は、PEgRNAの成分に対して言及され得る。例えば、意図されるヌクレオチド編集は、PBSに対して5’または3’であり得る。いくつかの実施形態では、PEgRNAは、5’から3’へ構造:スペーサー、gRNAコア、編集鋳型、及びPBSを含む。いくつかの実施形態では、意図されるヌクレオチド編集は、PBSの最も5’のヌクレオチドの0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40塩基対上流にある。いくつかの実施形態では、意図されるヌクレオチド編集は、PBSの最も5’のヌクレオチドの0~2塩基対、0~4塩基対、0~6塩基対、0~8塩基対、0~10塩基対、2~4塩基対、2~6塩基対、2~8塩基対、2~10塩基対、2~12塩基対、4~6塩基対、4~8塩基対、4~10塩基対、4~12塩基対、4~14塩基対、6~8塩基対、6~10塩基対、6~12塩基対、6~14塩基対、6~16塩基対、8~10塩基対、8~12塩基対、8~14塩基対、8~16塩基対、8~18塩基対、10~12塩基対、10~14塩基対、10~16塩基対、10~18塩基対、10~20塩基対、12~14塩基対、12~16塩基対、12~18塩基対、12~20塩基対、12~22塩基対、14~16塩基対、14~18塩基対、14~20塩基対、14~22塩基対、14~24塩基対、16~18塩基対、16~20塩基対、16~22塩基対、16~24塩基対、16~26塩基対、18~20塩基対、18~22塩基対、18~24塩基対、18~26塩基対、18~28塩基対、20~22塩基対、20~24塩基対、20~26塩基対、20~28塩基対、または20~30塩基対上流にある。
二本鎖標的DNA、例えば、標的遺伝子に組み込まれた意図されるヌクレオチド編集の対応する位置はまた、配列相同性及び相補性に基づいてプライムエディターによって生成されたニッキング位置に基づいて称され得る。例えば、実施形態では、二本鎖標的DNA、例えば、標的遺伝子に組み込まれるヌクレオチド編集と、プライムエディターによって生成されるニックとの間の距離は、スペーサーがサーチ標的配列とハイブリダイズし、伸長アームが編集標的配列とハイブリダイズする場合に決定され得る。所定の実施形態では、ヌクレオチド編集の位置は、ニック部位と意図されるヌクレオチド編集との間の距離が、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドの長さとなるように、プライムエディターによって生成される編集鎖(またはPAM鎖)上のニック部位の下流の任意の位置におけるものであり得る。いくつかの実施形態では、ヌクレオチド編集の位置は、編集鎖上のニック部位の0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド上流にある。いくつかの実施形態では、ヌクレオチド編集の位置は、編集鎖上のニック部位の0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド下流にある。いくつかの実施形態では、ヌクレオチド編集の位置は、編集鎖上のニック部位から0塩基対にあり、すなわち、編集位置は、ニック部位と同じ位置にある。本明細書で使用される場合、ニック部位とヌクレオチド編集との間の距離は、例えば、ヌクレオチド編集が挿入または欠失を含む場合、編集鎖上の3’遊離末端を生成するニックのためのヌクレオチド編集の最も5’の位置(すなわち、ニック部位に対するヌクレオチド編集の「近傍位置」)を指す。同様に、本明細書で使用される場合、ニック部位とPAM位置編集との間の距離は、例えば、ヌクレオチド編集が2つ以上の連続ヌクレオチドの挿入、欠失、または置換を含む場合、ヌクレオチド編集の最も5’の位置及びPAM配列の最も5’の位置を指す。
いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集を超えて伸長する。例えば、いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して3’の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して3’の少なくとも4~30塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して3’の少なくとも4~25塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して3’の少なくとも4~20塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して5’の少なくとも4~30塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して5’の少なくとも4~25塩基対を含む。いくつかの実施形態では、編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子配列に組み込まれるヌクレオチド編集に対して5’の少なくとも4~20塩基対を含む。
いくつかの実施形態では、編集鋳型は、第1の核酸塩基位置でアデニンを含む(例えば、5’-スペーサー-gRNAコア-RTT-PBS-3’配向に従うPEgRNAの場合、最も5’の核酸塩基が「第1の塩基」である)。いくつかの実施形態では、編集鋳型は、第1の核酸塩基位置でグアニンを含む(例えば、5’-スペーサー-gRNAコア-RTT-PBS-3’配向に従うPEgRNAの場合、最も5’の核酸塩基が「第1の塩基」である)。いくつかの実施形態では、編集鋳型は、第1の核酸塩基位置でウラシルを含む(例えば、5’-スペーサー-gRNAコア-RTT-PBS-3’配向に従うPEgRNAの場合、最も5’の核酸塩基が「第1の塩基」である)。いくつかの実施形態では、編集鋳型は、第1の核酸塩基位置でシトシンを含む(例えば、5’-スペーサー-gRNAコア-RTT-PBS-3’配向に従うPEgRNAの場合、最も5’の核酸塩基が「第1の塩基」である)。いくつかの実施形態では、編集鋳型は、第1の核酸塩基位置でシトシンを含まない(例えば、5’-スペーサー-gRNAコア-RTT-PBS-3’配向に従うPEgRNAの場合、最も5’の核酸塩基が「第1の塩基」である)。
PEgRNAの編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子における標的配列を置き換えるための(例えば、逆転写による)新たな一本鎖DNAをコードし得る。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子の編集鎖における編集標的配列は、新しく合成された鎖によって置き換えられ、ヌクレオチド編集(複数可)は、二本鎖標的DNA、例えば、標的遺伝子の領域に組み込まれる。いくつかの実施形態では、新しく合成されたDNA鎖は、二本鎖標的DNA、例えば、標的遺伝子における編集標的配列に置き換わり、編集標的配列(または標的遺伝子の標的鎖上の編集標的配列に相補的な内因性配列)は、同じ遺伝子の野生型配列と比較して変異を含み、1つ以上の意図されるヌクレオチド編集の組み込みは、変異を修正する。
PEgRNAのガイドRNAコア(本明細書でgRNAコア、gRNA骨格、またはgRNA骨格配列とも称される)は、プライムエディターのDNA結合ドメイン(例えば、Cas9)に結合するポリヌクレオチド配列を含有し得る。gRNAコアは、例えば、プライムエディターのDNA結合ドメイン、例えば、DNAニッカーゼとの会合によって、本明細書に記載されるプライムエディターと相互作用し得る。
当業者は、異なるDNA結合タンパク質とは異なるDNA結合ドメインを有する異なるプライムエディターが、DNA結合タンパク質に特異的な異なるgRNAコア配列を必要とし得ることを認識する。いくつかの実施形態では、gRNAコアは、Cas9ベースのプライムエディターに結合することが可能である。いくつかの実施形態では、gRNAコアは、Cpf1ベースのプライムエディターに結合することが可能である。いくつかの実施形態では、gRNAコアは、Cas12bベースのプライムエディターに結合することが可能である。
いくつかの実施形態では、gRNAコアは、特定のCRISPR Casタンパク質との結合に関与する領域及び二次構造を含む。例えば、Cas9ベースのプライム編集システムにおいて、PEgRNAのgRNAコアは、スペーサー配列に隣接する塩基対合した「下部ステム」及び下部ステムの後の塩基対合した「上部ステム」の1つ以上の領域を含み得、下部ステム及び上部ステムは、対合していないRNAを含む「バルジ」によって接続され得る。gRNAコアは、図4に例示されるように、スペーサー配列から遠位の「ネクサス」と、それに続く、例えば、3’末端におけるヘアピン構造をさらに含み得る。いくつかの実施形態では、gRNAコアは、下部ステム、上部ステム、及び/またはヘアピンにおいて野生型gRNAコアと比較して修飾されたヌクレオチドを含む。例えば、下部ステム、上部ステム、及び/またはヘアピン領域におけるヌクレオチドは、修飾、欠失、または置換され得る。いくつかの実施形態では、下部ステム、上部ステム、及び/またはヘアピン領域におけるRNAヌクレオチドは、1つ以上のDNA配列と置き換えられ得る。いくつかの実施形態では、gRNAコアは、ネクサス及び/またはバルジ領域における未修飾または野生型RNA配列を含む。いくつかの実施形態では、gRNAコアは、A-T対の長い伸長部、例えば、GUUUU-AAAAC対合要素を含まない。
いくつかの実施形態では、gRNAコアは、配列:GUUUGAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCC(配列番号556)、または
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号557)を含む。いくつかの実施形態では、gRNAコアは、配列
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号558)を含む。当該技術分野で知られている任意のgRNAコア配列もまた、本明細書に記載のプライム編集組成物において企図される。
PEgRNAはまた、任意の修飾因子、例えば、3’末端修飾因子領域及び/または5’末端修飾因子領域を含み得る。いくつかの実施形態では、PEgRNAは、スペーサー、gRNAコア、または伸長アームの一部ではない少なくとも1つのヌクレオチドを含む。任意の配列修飾因子は、示される他の領域のいずれかの中または間に位置し得、3’及び5’末端に位置することに限定されない。所定の実施形態では、PEgRNAは、二次RNA構造、例えば、限定されないが、アプタマー、ヘアピン、ステム/ループ、トーループ、及び/またはRNA結合タンパク質動員ドメイン(例えば、MS2cpタンパク質を動員し、それに結合するMS2アプタマー)を含む。いくつかの実施形態では、PEgRNAは、5’末端または3’末端でウラシルの短い伸長部を含む。例えば、いくつかの実施形態では、3’伸長アームを含むPEgRNAは、伸長アームの3’末端で「UUU」配列を含む。いくつかの実施形態では、PEgRNAは、3’末端でトーループ配列を含む。いくつかの実施形態では、PEgRNAは、3’伸長アーム及び伸長アームの3’末端におけるトーループ配列を含む。いくつかの実施形態では、PEgRNAは、5’伸長アーム及び伸長アームの5’末端におけるトーループ配列を含む。いくつかの実施形態では、PEgRNAは、配列5’-GAAANNNNN-3’(Nは、任意の核酸塩基である)を有するトーループ要素を含む。いくつかの実施形態では、二次RNA構造は、スペーサー内に位置する。いくつかの実施形態では、二次構造は、伸長アーム内に位置する。いくつかの実施形態では、二次構造は、gRNAコア内に位置する。いくつかの実施形態では、二次構造は、スペーサーとgRNAコアとの間、gRNAコアと伸長アームとの間、またはスペーサーと伸長アームとの間に位置する。いくつかの実施形態では、二次構造は、PBSと編集鋳型との間に位置する。いくつかの実施形態では二次構造は、PEgRNAの3’末端または5’末端に位置する。いくつかの実施形態では、PEgRNAは、PEgRNAの3’末端で転写終結シグナルを含む。二次RNA構造に加えて、PEgRNAは、化学的リンカーまたはポリ(N)リンカーまたはテール(「N」は、任意の核酸塩基であり得る)を含み得る。いくつかの実施形態では、化学的リンカーは、gRNAコアの逆転写を予防するように機能し得る。
PEgRNAの3’末端配列及び5’末端配列は、PEgRNAの機能的成分のいずれか1つであり得、当該技術分野で知られている任意の配列を含み得る。いくつかの実施形態では、PEgRNAは、3’末端で伸長アームを含む。例えば、PEgRNAは、5’から3’へ構造:スペーサー、gRNAコア、編集鋳型(例えば、RTT)、及びPBSを含み得る。いくつかの実施形態では、PEgRNAは、3’末端でgRNAコアを含む。例えば、PEgRNAは、5’から3’へ構造:編集鋳型(例えば、RTT)、PBS、スペーサー、及びgRNAコアを含み得る。いくつかの実施形態では、PEgRNAは、3’末端で特定のヌクレオチド配列を含む。いくつかの実施形態では、PEgRNAの最も3’の3ヌクレオチドは、5’-UUU-3’である。いくつかの実施形態では、PEgRNAの最も3’の4ヌクレオチドは、5’-UUUU-3’である。いくつかの実施形態では、PEgRNAの最も3’の3ヌクレオチドは、5’-UUU-3’ではない。いくつかの実施形態では、PEgRNAの最も3’の4ヌクレオチドは、5’-UUUU-3’ではない。いくつかの実施形態では、PEgRNAは、最も3’の3ヌクレオチドにおいて2つの連続するウラシルを含まない。いくつかの実施形態では、PEgRNAは、最も3’の4ヌクレオチドにおいて2つの連続するウラシルを含まない。いくつかの実施形態では、PEgRNAは、最も3’の4ヌクレオチドにおいてウラシルを含まない。いくつかの実施形態では、PEgRNAは、最も3’の3ヌクレオチドにおいてウラシルを含まない。いくつかの実施形態では、PEgRNAは、化学的に合成される。
いくつかの実施形態では、プライム編集システムまたは組成物は、ニックガイドポリヌクレオチド、例えば、ニックガイドRNA(ngRNA)をさらに含む。いかなる特定の理論にも縛られることなく、二本鎖標的DNA、例えば、標的遺伝子における二本鎖標的DNAの非編集鎖は、ngRNAによって仕向けられるCRISPR-Casニッカーゼによってニッキングされ得る。いくつかの実施形態では、非編集鎖上のニックは、内因性DNA修復機構を、非編集鎖の修復のための鋳型として編集鎖を使用するように誘導し、これはプライム編集の効率を増加させ得る。いくつかの実施形態では、非編集鎖は、ngRNAによって非編集鎖に局在化されたプライムエディターによってニッキングされる。したがって、また、本明細書では、少なくとも1つのPEgRNA及び少なくとも1つのngRNAを含むPEgRNAシステムが提供される。
いくつかの実施形態では、ngRNAは、可変スペーサー配列及び例えば、DNA結合ドメイン、例えば、プライムエディターのCas9と相互作用するガイドRNA骨格またはコア領域を含有するガイドRNAである。いくつかの実施形態では、ngRNAは、編集鎖、または非標的鎖上に位置する第2のサーチ標的配列(またはngサーチ標的配列)に実質的に相補的であるスペーサー配列(本明細書でngスペーサー、または第2のスペーサーと称される)を含む。よって、いくつかの実施形態では、ngスペーサーによって認識されるngサーチ標的配列及びPEgRNAのスペーサー配列によって認識されるサーチ標的配列は、二本鎖標的DNA、例えば、標的遺伝子の二本鎖標的DNAの反対鎖にある。ngRNAを含むプライム編集システムまたは複合体は、「PE3」プライム編集システム、PE3プライム編集組成物またはPE3プライム編集複合体と称され得る。
いくつかの実施形態では、ngサーチ標的配列は、編集鎖上でPEgRNAによって組み込まれる意図されるヌクレオチド編集の10ヌクレオチド~100ヌクレオチド内で非標的鎖上に位置する。いくつかの実施形態では、ng標的サーチ標的配列は、編集鎖上のPEgRNAによって組み込まれる意図されるヌクレオチド編集の10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、91bp、92bp、93bp、94bp、95bp、96bp、97bp、98bp、99bp、または100bp内にある。いくつかの実施形態では、ngサーチ標的配列及びPEgRNAサーチ標的配列の5’末端は、1、2、3、4、5、6、7、8、9、または10bp以内で互いに離れている。いくつかの実施形態では、ngサーチ標的配列及びPEgRNAサーチ標的配列の5’末端は、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、91bp、92bp、93bp、94bp、95bp、96bp、97bp、98bp、99bp、または100bp以内で互いに離れている。
いくつかの実施形態では、意図されるヌクレオチド編集がPEgRNAの編集鋳型によって編集鎖上に組み込まれた後にのみ、ngスペーサー配列は、第2のサーチ標的配列と相補的であり、それにハイブリダイズし得る。そのようなプライム編集システムは、「PE3b」プライム編集システムまたは組成物と称され得る。いくつかの実施形態では、ngRNAは、ヌクレオチド編集の組み込み後に編集鎖のみにマッチするが、編集鎖上の内因性二本鎖標的DNA、例えば、標的遺伝子配列にマッチしないスペーサー配列を含む。したがって、いくつかの実施形態では、意図されるヌクレオチド編集は、ngサーチ標的配列内に組み込まれる。いくつかの実施形態では、意図されるヌクレオチド編集は、ngサーチ標的配列のPAMに対応する位置の約1~10ヌクレオチド内に組み込まれる。
本開示のPEgRNA及び/またはngRNAには、いくつかの実施形態では、修飾されたヌクレオチド、例えば、化学的に修飾されたDNAまたはRNA核酸塩基が含まれ得、また、1つ以上の核酸塩基アナログ(例えば、機能性、例えば、温度耐性を付与する可能性がある修飾)が含まれ得る。いくつかの実施形態では、本明細書に記載されるPEgRNA及び/またはngRNAは、化学的に修飾され得る。語句「化学的修飾」には、本明細書で使用される場合、天然に存在するDNAまたはRNAにおいて見られるものとは異なる化学種を導入する修飾、例えば、共有結合修飾、例えば、修飾されたヌクレオチドの導入(例えば、ヌクレオチドアナログ、またはDNAまたはRNA分子において天然に見られないペンダント基の包含)が含まれ得る。
いくつかの実施形態では、本開示に提供されるPEgRNA及び/またはngRNAは、化学的または生物学的修飾を受けた場合がある。修飾は、PEgRNAまたはngRNA内の任意の位置で行われ得、それには、PEgRNAまたはngRNAの核酸塩基またはリン酸骨格に対する修飾が含まれ得る。いくつかの実施形態では、化学的修飾は、構造ガイド修飾であり得る。いくつかの実施形態では、化学的修飾は、PEgRNAの5’末端及び/または3’末端におけるものである。いくつかの実施形態では、化学的修飾は、ngRNAの5’末端及び/または3’末端におけるものである。いくつかの実施形態では、化学的修飾は、PEgRNAのスペーサー配列、伸長アーム、編集鋳型配列、またはプライマー結合部位内におけるものであり得る。いくつかの実施形態では、化学的修飾は、PEgRNAまたはngRNAのスペーサー配列またはgRNAコア内におけるものであり得る。いくつかの実施形態では、化学的修飾は、PEgRNAまたはngRNAの最も3’のヌクレオチド内におけるものであり得る。いくつかの実施形態では、化学的修飾は、PEgRNAまたはngRNAの最も3’の末端内におけるものであり得る。いくつかの実施形態では、化学的修飾は、PEgRNAまたはngRNAの最も5’の末端内におけるものであり得る。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5、6、7、8、9、10個またはそれを超える化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、3個の連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5、6、7、8、9、10個またはそれを超える化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、もしくは5個またはそれを超える化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、または5個以上の化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、もしくは3個またはそれを超える化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、または3個以上の化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5、6、7、8、9、10個またはそれを超える連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5、6、7、8、9、10個またはそれを超える連続する化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、または5個の連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、または5個の連続する化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、または3個の連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、または3個の連続する化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、3個の連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5個、またはそれを超える化学的に修飾されたヌクレオチドを3’末端の近くで含む。いくつかの実施形態では、PEgRNAまたはngRNAは、3個の連続する化学的に修飾されたヌクレオチドを3’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、3個の連続する化学的に修飾されたヌクレオチドを5’末端で含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5個、またはそれを超える化学的に修飾されたヌクレオチドを3’末端の近くで含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5個、またはそれを超える連続する化学的に修飾されたヌクレオチドを3’末端の近くで含む。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5個、またはそれを超える化学的に修飾されたヌクレオチドを3’末端の近くで含み、最も3’のヌクレオチドは、修飾されておらず、1、2、3、4、5個、またはそれを超える化学的に修飾されたヌクレオチドは、5’から3’の順序で最も3’のヌクレオチドに先行する。いくつかの実施形態では、PEgRNAまたはngRNAは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35個またはそれを超える化学的に修飾されたヌクレオチドを3’末端の近くで含み、最も3’のヌクレオチドは、修飾されておらず、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35個またはそれを超える化学的に修飾されたヌクレオチドは、5’から3’の順序で最も3’のヌクレオチドに先行する。
いくつかの実施形態では、PEgRNAまたはngRNAは、gRNAコアにおいて1つ以上の化学的に修飾されたヌクレオチドを含む。図4に例示されるように、PEgRNAのgRNAコアは、塩基対合した下部ステムの1つ以上の領域、塩基対合した上部ステムを含み得、下部ステム及び上部ステムは、対合していないRNAを含むバルジによって接続され得る。gRNAコアは、スペーサー配列から遠位のネクサスをさらに含み得る。いくつかの実施形態では、gRNAコアは、下部ステム、上部ステム、及び/またはヘアピン領域において1つ以上の化学的に修飾されたヌクレオチドを含む。いくつかの実施形態では、下部ステム、上部ステム、及び/またはヘアピン領域におけるヌクレオチドのすべては、化学的に修飾されている。
PEgRNAまたはngRNAに対する化学的修飾は、2’-O-チオノカルバメートで保護されたヌクレオシドホスホロアミダイト、2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、または2’-O-メチル3’チオPACE(MSP)、またはそれらの任意の組み合わせを含み得る。いくつかの実施形態では、PEgRNAまたはngRNAに対する化学的修飾は、ヌクレオチド糖修飾を含む。いくつかの実施形態では、化学的修飾は、2’O-C1-4アルキル修飾を含む。いくつかの実施形態では、化学的修飾は、2’-O-C1-3アルキル修飾を含む。いくつかの実施形態では、化学的修飾は、2’-O-メチル(2’-OMe)、2’-デオキシ(2’-H)、例えば、2’-フルオロ(2’-F)、2’-メトキシエチル(2’-MOE)、2’-アミノ(「2’-NH2」)、または2’-アラビノシル(「2’-アラビノ」)、2’-F-アラビノシル(「2’-F-アラビノ」)修飾を含む。いくつかの実施形態では、PEgRNA及び/またはngRNAに対する化学的修飾は、ヌクレオチド間結合修飾を含む。いくつかの実施形態では、ヌクレオチド間結合は、ホスホロチオエート(「PS」)、ホスホノカルボキシレート(P(CH2)nCOOR)、ホスホロアセテート(PACE)、(P(CH2COO-))チオホスホノカルボキシレート((S)P(CH2)nCOOR)、チオホスホノアセテート(チオPACE)、((S)P(CH2COO-))、アルキルホスホネート(P(C1-3アルキル)、例えば、メチルホスホネート-P(CH3)、ボラノホスホネート(P(BH3))、またはホスホロジチオエート(P(S)2)修飾である。いくつかの実施形態では、化学的に修飾されたPEgRNAまたはngRNAは、2’-O-メチル(M)RNA、2’-O-メチル3’ホスホロチオエート(MS)RNA、3’チオPACE RNA、2’-O-メチル3’チオPACE(MSP)RNA、2’-F RNA、もしくは当該技術分野で知られている任意の他の化学的修飾を有するRNA、またはそれらの任意の組み合わせである。化学的修飾にはまた、例えば、PEgRNA及び/またはngRNAのへの非ヌクレオチド結合または修飾されたヌクレオチド(例えば、ガイドRNA分子の3’及び5’末端の一方または両方に対する修飾)の組み込みが含まれ得る。そのような修飾には、RNAを薬剤(例えば、タンパク質または相補的核酸分子)と複合体化するRNA配列への塩基の付加、及び(例えば、二次構造を形成する)RNA分子の構造を変化させる要素の包含が含まれ得る。
いくつかの実施形態では、PEgRNAは、5’-mXmXmXmXmX-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mXmXmXmXmX-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。本明細書で使用される場合、PEgRNA配列またはガイドRNA配列化学的修飾との関連で、「m」は、2’-O-メチル修飾を表す。
いくつかの実施形態では、PEgRNAは、5’-mX*mX*mX*mX*mX*-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX*mX*mX*mX*mX*-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。本明細書で使用される場合、PEgRNA配列またはガイドRNA配列化学的修飾との関連で、「*」は、ホスホロチオエート結合を表す。
いくつかの実施形態では、PEgRNAは、5’-mXmXmXmX-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mXmXmXmX-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mX*mX*mX*mX*-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX*mX*mX*mX*-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mXmXmXmXmX-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mXmXmXmXmX-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mX*mX*mX*-スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX*mX*mX*-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mXmX-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mXmX-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mX*mX*-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX*mX*-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mX-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mX*-[スペーサー配列の残部-gRNAコア-伸長アーム配列の残部]-mX*-3’(式中、Xは、任意のヌクレオチドであり、「スペーサー配列の残部」は、スペーサー配列の未修飾ヌクレオチドを表し、「伸長アーム配列の残部」は、伸長アーム配列の未修飾ヌクレオチドを表す)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号559)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGCACUUUU-3’(配列番号560)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGCAC-3’(配列番号561)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGmC*mA*mC*-3’(配列番号562)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGCAC-3’(配列番号563)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号564)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCUUUU-3’(配列番号565)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGC-3’(配列番号566)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGmU*mG*mC*-3’(配列番号567)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGC-3’(配列番号568)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号569)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGCACUUUU-3’(配列番号570)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGCAC-3’(配列番号571)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGmC*mA*mC*-3’(配列番号572)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGCAC-3’(配列番号573)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号574)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3’(配列番号575)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号576)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGmU*mG*mC*-3’(配列番号577)の配列を含む。
いくつかの実施形態では、ngRNAは、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号578)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号579)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACUUUU-3’(配列番号580)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号581)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGmC*mA*mC*-3’(配列番号582)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号583)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号574)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3’(配列番号575)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号576)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGmU*mG*mC-3’(配列番号577)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号578)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号579)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACUUUU-3’(配列番号580)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号581)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGmC*mA*mC*-3’(配列番号582)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号583)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号574)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3’(配列番号575)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号576)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGmU*mG*mC*-3’(配列番号577)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号578)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号579)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACUUUU-3’(配列番号580)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号581)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGmC*mA*mC*-3’(配列番号582)の配列を含む。
いくつかの実施形態では、PEgRNAは、5’-CAUGGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCAC-3’(配列番号583)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号574)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3’(配列番号575)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号576)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGmU*mG*mC*-3’(配列番号577)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)は、5’-CCUUGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’(配列番号578)の配列を含む。
いくつかの実施形態では、PEgRNAをコードするDNAは、5’-GCATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCAGACTTCTCCACAGGAGTCAGGTGCACTTTTTTT-3’(配列番号584)の配列を含む。
いくつかの実施形態では、PEgRNAをコードするDNAは、5’-GCATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCAGACTTCTCTACAGGAGTCAGGTGCACTTTTTTT-3’(配列番号585)の配列を含む。
いくつかの実施形態では、ニックガイドRNA(ngRNA)をコードするDNAは、5’-GCCTTGATACCAACCTGCCCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCTTTTTTT-3’(配列番号586)の配列を含む。
プライム編集組成物
本明細書には、いくつかの実施形態では、プライム編集組成物を使用する組成物、システム、及び方法が開示される。用語「プライム編集組成物」または「プライム編集システム」は、本明細書に記載されるプライム編集方法に関与する組成物を指す。プライム編集組成物には、プライムエディター、例えば、プライムエディター融合タンパク質、及びPEgRNAが含まれ得る。プライム編集組成物は、追加の要素、例えば、第2の鎖ニッキングngRNAをさらに含み得る。プライム編集組成物の成分は、プライム編集のための複合体を形成するために組み合わされ得、または別々に、例えば、投与目的のために維持され得る。いくつかの実施形態では、プライム編集組成物は、PEgRNAと複合体化された、及び任意にngRNAと複合体化されたプライムエディター融合タンパク質を含む。いくつかの実施形態では、プライム編集組成物は、PEgRNAを介して互いに会合するDNA結合ドメイン及びDNAポリメラーゼドメインを含むプライムエディターを含む。例えば、プライム編集組成物は、PEgRNAに連結された、RNA-タンパク質動員アプタマーRNA配列によって互いに連結されたDNA結合ドメイン及びDNAポリメラーゼドメインを含むプライムエディターを含み得る。いくつかの実施形態では、プライム編集組成物は、PEgRNA及びプライムエディター融合タンパク質をコードするポリヌクレオチド、ポリヌクレオチドコンストラクト、またはベクターを含む。いくつかの実施形態では、プライム編集組成物は、PEgRNA、ngRNA、及びプライムエディター融合タンパク質をコードするポリヌクレオチド、ポリヌクレオチドコンストラクト、またはベクターを含む。いくつかの実施形態では、プライム編集組成物は、複数のポリヌクレオチド、ポリヌクレオチドコンストラクト、またはベクターを含み、これらの各々は、1つ以上のプライム編集組成物成分をコードする。いくつかの実施形態では、プライム編集組成物のPEgRNAは、プライムエディターのDNA結合ドメイン、例えば、Cas9ニッカーゼに会合されている。いくつかの実施形態では、プライム編集組成物のPEgRNAは、プライムエディターのDNA結合ドメインと複合体し、プライムエディターを標的DNAに誘導する。
いくつかの実施形態では、プライム編集組成物は、プライムエディター成分及び/またはPEgRNAまたはngRNAをコードする1つ以上のポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、DNA結合ドメイン及びDNAポリメラーゼドメインを含む融合タンパク質をコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)DNA結合ドメイン及びDNAポリメラーゼドメインを含む融合タンパク質をコードするポリヌクレオチド、及び(ii)PEgRNAまたはPEgRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)DNA結合ドメイン及びDNAポリメラーゼドメインを含む融合タンパク質をコードするポリヌクレオチド、(ii)PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び(iii)ngRNAまたはngRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)プライムエディターのDNA結合ドメイン、例えば、Cas9ニッカーゼをコードするポリヌクレオチド、(ii)プライムエディターのDNAポリメラーゼドメイン、例えば、逆転写酵素をコードするポリヌクレオチド、及び(iii)PEgRNAまたはPEgRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)プライムエディターのDNA結合ドメイン、例えば、Cas9ニッカーゼをコードするポリヌクレオチド、(ii)プライムエディターのDNAポリメラーゼドメイン、例えば、逆転写酵素をコードするポリヌクレオチド、(iii)PEgRNAまたはPEgRNAをコードするポリヌクレオチド及び(iv)ngRNAまたはngRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチドまたはDNAポリメラーゼドメインをコードするポリヌクレオチドはさらに、追加のポリペプチドドメイン、例えば、RNA-タンパク質動員ドメイン、例えば、MS2コートタンパク質ドメインをコードする。いくつかの実施形態では、プライム編集組成物は、(i)プライムエディター融合タンパク質のN末端半分及びインテイン-Nをコードするポリヌクレオチド及び(ii)プライムエディター融合タンパク質のC末端半分及びインテイン-Cをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)プライムエディター融合タンパク質のN末端半分及びインテイン-Nをコードするポリヌクレオチド(ii)プライムエディター融合タンパク質のC末端半分及びインテイン-Cをコードするポリヌクレオチド、(iii)PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/または(iv)ngRNAまたはngRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、(i)DNA結合ドメインのN末端部分及びインテイン-Nをコードするポリヌクレオチド、(ii)DNA結合ドメインのC末端部分、インテイン-C、及びDNAポリメラーゼドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、DNA結合ドメインは、Casタンパク質ドメイン、例えば、Cas9ニッカーゼである。いくつかの実施形態では、プライム編集組成物は、(i)DNA結合ドメインのN末端部分及びインテイン-Nをコードするポリヌクレオチド、(ii)DNA結合ドメインのC末端部分、インテイン-C、及びDNAポリメラーゼドメインをコードするポリヌクレオチド、(iii)PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/または(iv)ngRNAまたはngRNAをコードするポリヌクレオチドを含む。
いくつかの実施形態では、プライム編集システムは、1つ以上のプライムエディターポリペプチドをコードする1つ以上のポリヌクレオチドを含み、プライム編集システムの活性は、ベクターが送達されるタイミングをコントロールすることによって時間的に制御され得る。例えば、いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド及びPEgRNAをコードするポリヌクレオチドが同時に送達され得る。例えば、いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド及びPEgRNAをコードするポリヌクレオチドが順次に送達され得る。
プライムエディター成分をコードするポリヌクレオチド
プライム編集組成物成分をコードするポリヌクレオチドは、DNA、RNA、またはそれらの任意の組み合わせであり得る。いくつかの実施形態では、プライム編集組成物成分をコードするポリヌクレオチドは、発現コンストラクトである。いくつかの実施形態では、プライム編集組成物成分をコードするポリヌクレオチドは、ベクターである。いくつかの実施形態では、ベクターは、DNAベクターである。いくつかの実施形態では、ベクターは、プラスミドである。いくつかの実施形態では、ベクターは、ウイルスベクター、例えば、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。
いくつかの実施形態では、プライム編集組成物のポリペプチド成分をコードするポリヌクレオチドは、改善された発現のためにコドン最適化される。コドン最適化は、ネイティブアミノ酸配列を維持しながら、ネイティブポリヌクレオチド配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50個以上、またはそれより多いコドン)を、その宿主細胞の遺伝子においてより頻繁にまたは最も頻繁に使用されるコドンで置き換えることによって対象となる宿主細胞における向上した発現のためにポリヌクレオチド配列を操作することを指し得る。いくつかの実施形態では、コドン最適化は、宿主細胞におけるmRNA安定性を増加させるためにポリヌクレオチド配列のGC含有量を改変することによって向上した発現のためにポリヌクレオチド配列を操作する。
いくつかの実施形態では、コドン最適化は、遺伝子構築または発現を損ない得るタンデムリピートコドンまたはタンデムリピート核酸塩基ランを最小化する。コドン最適化にはまた、転写及び翻訳コントロール領域をカスタマイズすること、タンパク質トラフィッキング配列を挿入することまたは除去すること、コードされるタンパク質における翻訳後修飾部位(例えば、グリコシル化部位)を除去することまたは付加すること、タンパク質ドメインを付加すること、除去することまたはシャッフル化すること、制限部位を挿入することまたは欠失させること、及び/またはリボソーム結合部位及びmRNA分解部位を修飾して宿主細胞におけるプライムエディターポリペプチドの発現及び適切なフォールディングを向上させることが含まれ得る。
いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチド、例えば、DNA配列またはmRNA配列は、例えば、特定の種の細胞における発現のためにコドン最適化される。様々な種は、特定のアミノ酸の所定のコドンについて特定のバイアスを示す。いくつかの実施形態では、ポリヌクレオチドは、コドン使用頻度表を使用して、特定の種の細胞における増加した発現のために最適化され得る。コドン使用頻度表は、当業者に容易に利用可能である。例えば、Nakamura,Y.,et al.“Codon usage tabulated from the international DNA sequence databases:status for the year 2000” Nucl.Acids Res.28:292(2000)。特定の宿主細胞における発現のために特定の配列を最適化するコドンのためのコンピュータアルゴリズム、例えば、GeneArt(Life Technologies)、またはDNA2.0(Menlo Park,CA)もまた利用可能である。
いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチド、例えば、DNA配列またはmRNA配列は、特定の種からの所望の細胞、例えば、細菌細胞、植物細胞、昆虫細胞、または哺乳動物細胞における発現のためにコドン最適化される。いくつかの実施形態では、コドン最適化は、真核細胞における発現のためのものである。いくつかの実施形態では、コドン最適化は、哺乳動物細胞における発現のためのものである。いくつかの実施形態では、コドン最適化は、ヒト細胞における発現のためのものである。いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチドは、所望の細胞タイプにおける発現のためにコドン最適化される。いくつかの実施形態では、コドン最適化は、造血幹細胞(HSC)における発現のためのものである。いくつかの実施形態では、コドン最適化は、CD34HSCにおける発現のためのものである。いくつかの実施形態では、コドン最適化は、ヒト造血幹細胞(HSC)における発現のためのものである。いくつかの実施形態では、コドン最適化は、ヒトCD34HSCにおける発現のためのものである。いくつかの実施形態では、コドン最適化は、ヒトCD34造血幹前駆細胞(HSPC)における発現のためのものである。いくつかの実施形態では、コドン最適化は、肝細胞、線維芽細胞、ケラチノサイト、上皮細胞(例えば、乳房上皮細胞、腸上皮細胞)、内皮細胞、グリア細胞、神経細胞、形成された血液の要素(例えば、リンパ球、骨髄細胞、造血幹前駆細胞)、筋肉細胞及びこれらの体細胞タイプの前駆体における発現のためのものである。いくつかの実施形態では、コドン最適化は、初代肝細胞における発現のためのものである。いくつかの実施形態では、コドン最適化は、多能性幹細胞(iPSC)における発現のためのものである。いくつかの実施形態では、コドン最適化は、ニューロンにおける発現のためのものである。いくつかの実施形態では、コドン最適化は、大脳基底核における発現のためのものである。コドン最適化は、肺、肝臓、胃、または腸からの上皮細胞における発現のためのものである。コドン最適化は、網膜細胞における発現のためのものである。
いくつかの実施形態では、コドン最適化は、宿主細胞における発現を向上させるために二次構造を改変することによって向上した発現のためにポリヌクレオチド配列を操作する。「二次構造」は、ポリヌクレオチド等の生体高分子のローカルセグメントの三次元形態を指す。いくつかの実施形態では、二次構造は、ポリヌクレオチド分子、例えば、DNAまたはRNA分子で形成され得る。いくつかの実施形態では、ポリヌクレオチドにおける二次構造は、単一のポリヌクレオチド分子内の相補的ヌクレオチド配列の塩基対合によって形成される。いくつかの実施形態では、ポリヌクレオチドにおける二次構造は、単一のポリヌクレオチド分子内の相補的ヌクレオチド配列の塩基対合を介して1つ以上の二本鎖領域を含む。いくつかの実施形態では、ポリヌクレオチド、例えば、DNAまたはmRNAの二次構造は、ヘアピン、ステム、ループ、テトラループ、シュードノット、ステムループ、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、ポリヌクレオチドが参照ポリヌクレオチドと比較して改変された二次構造を含有する場合、ポリヌクレオチドは、参照ポリヌクレオチドと比較して低減または増加した程度の二次構造を有する。二次構造の程度は、同じポリヌクレオチド内の相補的塩基対を形成するポリヌクレオチドのヌクレオチドのパーセンテージによって測定され得る。
いくつかの実施形態では、プライムエディター融合タンパク質をコードする最適化されたポリヌクレオチド配列、例えば、mRNAは、参照ポリヌクレオチド配列、例えば、PEタンパク質をコードする未改変参照mRNAと比較して増加した程度の二次構造を示す。いくつかの実施形態では、参照配列は、プライムエディタータンパク質のすべてまたは一部分をコードする野生型ポリヌクレオチド配列である。いくつかの実施形態では、参照配列は、プライムエディタータンパク質のすべてまたは一部分の機能的バリアントをコードするポリヌクレオチド配列であり、参照配列は、機能的バリアントにおける1つ以上のアミノ酸置換をコードするためだけに野生型ポリヌクレオチド配列から改変される。PEタンパク質をコードする例示的な参照ポリヌクレオチド配列が配列番号26、27、32、33に提供される。いくつかの実施形態では、コドン最適化されたポリヌクレオチド配列は、参照ポリヌクレオチド配列と比較して低減された程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較して低減された数の逆位反復モチーフを含む。いくつかの実施形態では、コドン最適化されたポリヌクレオチド配列は、参照ポリヌクレオチド配列と比較して増加した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較して増加した数の逆位反復モチーフを含む。
いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較して特定の部分において改変された程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較して特定の部分において低減された程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してオープンリーディングフレーム(ORF)において改変された程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してORFの5’領域でリボソーム結合部位において低減された程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してORFのN末端で低減した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してORFのC末端で低減した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチド配列は、参照ポリヌクレオチド配列と比較して特定の部分において増加した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してオープンリーディングフレーム(ORF)において増加した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してORFのN末端で増加した程度の二次構造を示す。いくつかの実施形態では、コドン最適化されたポリヌクレオチドは、参照ポリヌクレオチド配列と比較してORFのC末端で増加した程度の二次構造を示す。いくつかの実施形態では、プライムエディターポリペプチドをコードするコドン最適化されたポリヌクレオチド(例えば、mRNA)は、例えば、SpCas9またはM-MLV RTの参照コード配列と比較して増加した程度の二次構造を示す。いくつかの実施形態では、プライムエディターポリペプチドをコードするコドン最適化されたポリヌクレオチド(例えば、mRNA)は、例えば、SpCas9またはM-MLV RTの参照コード配列と比較してオープンリーディングフレーム(ORF)において増加した二次構造を示す。いくつかの実施形態では、プライムエディターポリペプチドをコードするコドン最適化されたポリヌクレオチド(例えば、mRNA)は、ポリヌクレオチドの安定性を増加させる二次構造(複数可)を示す。いくつかの実施形態では、プライムエディターポリペプチドをコードするコドン最適化されたポリヌクレオチド(例えば、mRNA)は、開始コドンでのまたは開始コドンからのポリペプチド合成の開始を増加させる二次構造(複数可)を示す。いくつかの実施形態では、プライムエディターポリペプチドをコードするコドン最適化されたポリヌクレオチド(例えば、mRNA)は、完全なORF以外のポリヌクレオチド内の任意のORFから翻訳されるポリペプチドの量を阻害または低減する二次構造(複数可)を示し、それによりプライムエディターポリペプチドの翻訳忠実性を増加させる。いくつかの実施形態では、二次構造は、ポリヌクレオチド、例えば、mRNA、またはポリヌクレオチドによってコードされるmRNAの安定性を改善する。いくつかの実施形態では、二次構造は、ポリヌクレオチド、例えば、mRNA、またはポリヌクレオチドによってコードされるmRNAの耐熱性を改善する。
プライムエディターポリペプチドまたは成分をコードする最適化されたポリヌクレオチドが提供される。
いくつかの実施形態では、プライムエディターは、配列番号627または配列番号629(例えば、DNAポリヌクレオチド)の核酸配列とまたは配列番号628、または配列番号630(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含む。いくつかの実施形態では、プライムエディターは、配列番号627、または配列番号629からなる群からまたは配列番号628、または配列番号630からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含む。
いくつかの実施形態では、プライムエディターは、配列番号28、41、50、59、68、83、91、245、または257(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号29、42、51、60、69、84、92、246、または258(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、配列番号28、41、50、59、68、83、91、245、または257(例えば、DNAポリヌクレオチド)のいずれかからなる群からまたは配列番号29、42、51、60、69、84、92、246、または258(例えば、RNAポリヌクレオチド)のいずれかからなる群からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、コドン最適化されたポリヌクレオチドによってコードされるDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、配列番号83または91(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号84または92(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインを含む。いくつかの実施形態では、プライムエディターは、配列番号83または91(例えば、DNAポリヌクレオチド)のいずれかからなる群からまたは配列番号84または92(例えば、RNAポリヌクレオチド)のいずれかからなる群からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインを含む。
いくつかの実施形態では、プライムエディターは、配列番号235、247、259、633、または635(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号236、248、260、634、または636(例えば、RNAポリヌクレオチド)のいずれかから選択される核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるリンカーを含む。いくつかの実施形態では、プライムエディターは、配列番号235、247、259、633、または635からなる群からまたは配列番号236、248、260、634、または636からなる群から選択されるポリヌクレオチドによってコードされるリンカーを含む。いくつかの実施形態では、プライムエディターは、コドン最適化されたポリヌクレオチドによってコードされるリンカーを含む。
いくつかの実施形態では、プライムエディターは、配列番号239、251、263、631、または637(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号240、252、264、632、または638(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされる1つ以上のNLSを含む。いくつかの実施形態では、プライムエディターは、配列番号239、251、263、631、または637からなる群からまたは配列番号240、252、264、632、または638からなる群から選択されるポリヌクレオチドによってコードされる1つ以上のNLSを含む。いくつかの実施形態では、プライムエディターは、コドン最適化されたポリヌクレオチドによってコードされるNLSを含む。
いくつかの実施形態では、プライムエディターは、配列番号627または配列番号629(例えば、DNAポリヌクレオチド)の核酸配列とまたは配列番号628、または配列番号630(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号28、41、50、59、68、83、91、245、または257(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号29、42、51、60、69、84、92、246、または258(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号235、247、259、633、または635(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号236、248、260、634、または636(例えば、RNAポリヌクレオチド)のいずれかから選択される核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号239、251、263、631、または637(例えば、DNAポリヌクレオチド)のいずれかから選択される核酸配列とまたは配列番号240、252、264、632、または638(例えば、RNAポリヌクレオチド)の核酸配列と少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一である核酸配列を含むポリヌクレオチドによってコードされるNLSをさらに含む。
いくつかの実施形態では、プライムエディターは、配列番号627、または配列番号629からなる群からまたは配列番号628、または配列番号630からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号28、41、50、59、68、83、91、245、または257(例えば、DNAポリヌクレオチド)のいずれかからなる群からまたは配列番号29、42、51、60、69、84、92、246、または258(例えば、RNAポリヌクレオチド)のいずれかからなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号235、247、259、633、または635からなる群からまたは配列番号236、248、260、634、または636からなる群から選択されるポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号239、251、263、631、または637からなる群からまたは配列番号240、252、264、632、または638からなる群から選択されるポリヌクレオチドによってコードされる1つ以上のNLSをさらに含む。
いくつかの実施形態では、プライムエディターは、配列番号627、または配列番号629(例えば、DNAポリヌクレオチド)からなる群からまたは配列番号628、または配列番号630(例えば、RNAポリヌクレオチド)からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号83、91、245、または257(例えば、DNAポリヌクレオチド)のいずれかからなる群からまたは配列番号84、92、246、または258(例えば、RNAポリヌクレオチド)からなる群から選択される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号235、247、259、633、または635からなる群からまたは配列番号236、248、260、634、または636からなる群から選択されるポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号239、251、263、631、または637からなる群からまたは配列番号240、252、264、632、または638からなる群から選択されるポリヌクレオチドによってコードされる1つ以上のNLSをさらに含む。
いくつかの実施形態では、プライムエディターは、配列番号627(例えば、DNAポリヌクレオチド)に示されるまたは配列番号629(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号83(例えば、DNAポリヌクレオチド)に示されるまたは配列番号84(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号633、または635からなる群からまたは配列番号634、または636からなる群から選択されるポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号631、または637からなる群からまたは配列番号632、または638からなる群から選択されるポリヌクレオチドによってコードされる1つ以上のNLSをさらに含む。
いくつかの実施形態では、プライムエディターは、配列番号629(例えば、DNAポリヌクレオチド)に示されるまたは配列番号630(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号91(例えば、DNAポリヌクレオチド)に示されるまたは配列番号92(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号633、または635からなる群からまたは配列番号634、または636からなる群から選択されるポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号631、または637からなる群からまたは配列番号632、または638からなる群から選択されるポリヌクレオチドによってコードされる1つ以上のNLSをさらに含む。
いくつかの実施形態では、プライムエディターは、配列番号627または629(例えば、DNAポリヌクレオチド)に示されるまたは配列番号628または630(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNA結合ドメイン(例えば、Cas9)を含み、配列番号83または91(例えば、DNAポリヌクレオチド)に示されるまたは配列番号84または92(例えば、RNAポリヌクレオチド)に示される核酸配列を含むポリヌクレオチドによってコードされるDNAポリメラーゼドメインをさらに含み、任意にプライムエディターは、配列番号233に示される、または配列番号236に示される配列から選択されるポリヌクレオチドによってコードされるリンカーをさらに含み、任意にプライムエディターは、配列番号239、631、または637に示されるまたは配列番号240に示されるポリヌクレオチドによってコードされる1つ以上のNLSをさらに含む。
いくつかの実施形態では、プライム編集組成物は、配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、または625に示される配列のいずれか1つと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一であるアミノ酸配列を含むプライムエディターをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、配列番号25、34、35、43、44、52、53、61、62、63、70-78、85、86、93、96、99、104、105、110、111、116、117、122、125、128、131、134、137、140、143、146、149、152、155、158、161、164、170、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、230、620、622、624、または625(表15~66)のいずれか1つから選択されるアミノ酸配列を含むプライムエディターをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチドは、DNAポリヌクレオチドである。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチドは、RNAポリヌクレオチド(例えば、mRNA)である。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド(例えば、DNAポリヌクレオチド)は、26、30、32、34、37、39、46、48、55、57、64、66、79、81、87、89、94、97、100、102、106、108、112、114、118、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、233、241、243、253、255、263、または265(表15~66)に示される配列のいずれか1つとまたは配列番号27、31、33、35、38、40、47、49、56、58、65、67、79、82、88、90、95、98、101、103、107、109、113、115、119、121、124、127、130、133、136、139、142、145、148、151、154、157、160、163、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、242、244、254、256、264、または266(表15~66)に示される配列のうちの1つと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一である核酸配列を含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド(例えば、DNAポリヌクレオチド)は、配列番号26、30、32、34、37、39、46、48、55、57、64、66、79、81、87、89、94、97、100、102、106、108、112、114、118、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、233、241、243、253、255、263、または265(表15~66)(例えば、DNAポリヌクレオチド)のいずれか1つから選択されるまたは配列番号27、31、33、35、38、40、47、49、56、58、65、67、79、82、88、90、95、98、101、103、107、109、113、115、119、121、124、127、130、133、136、139、142、145、148、151、154、157、160、163、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、242、244、254、256、264、または266(表15~66)(例えば、RNAポリヌクレオチド)のいずれか1つから選択される核酸配列を含む。
いくつかの実施形態では、プライムエディターをコードするポリヌクレオチドは、配列番号79、81、87、89、または233(例えば、DNAポリヌクレオチド)に示される配列のいずれか1つとまたは配列番号80、82、88、90、または234(例えば、RNAポリヌクレオチド)に示される配列のいずれか1つと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一である核酸配列を含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド(例えば、RNAポリヌクレオチド)は、配列番号79、81、87、89、または233(例えば、DNAポリヌクレオチド)のいずれか1つから選択されるまたは配列番号80、82、88、90、または234(例えば、RNAポリヌクレオチド)のいずれか1つから選択される核酸配列を含む。
いくつかの実施形態では、プライムエディターをコードするポリヌクレオチドは、配列番号79または81(例えば、DNAポリヌクレオチド)に示される配列のいずれかまたは配列番号80または82に示される配列のいずれかと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一である核酸配列を含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド(例えば、RNAポリヌクレオチド)は、配列番号79または81(例えば、DNAポリヌクレオチド)のいずれか1つから選択されるまたは配列番号80または82(例えば、RNAポリヌクレオチド)のいずれか1つから選択される核酸配列を含む。
いくつかの実施形態では、プライムエディターをコードするポリヌクレオチドは、配列番号88または90(例えば、DNAポリヌクレオチド)に示される配列のいずれかまたは配列番号88または90に示される配列のいずれかと少なくとも約85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%同一である核酸配列を含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド(例えば、RNAポリヌクレオチド)は、配列番号87または89(例えば、DNAポリヌクレオチド)のいずれか1つから選択されるまたは配列番号88または90(例えば、RNAポリヌクレオチド)のいずれか1つから選択される核酸配列を含む。
いくつかの実施形態では、ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、及び119からなる群から選択される配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、及び119からなる群から選択される配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の同一性を有する配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、及び119からなる群から選択される配列と少なくとも80%、少なくとも85%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%の同一性を有する配列を含む。
いくつかの実施形態では、ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の同一性を有する配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも80%、少なくとも85%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%の同一性を有する配列を含む。
いくつかの実施形態では、ポリヌクレオチドは、配列番号274~285または592~595からなる群から選択される配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号274~285または592~595からなる群から選択される配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の同一性を有する配列を含む。いくつかの実施形態では、ポリヌクレオチドは、配列番号274~285または592~595からなる群から選択される配列と少なくとも80%、少なくとも85%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%の同一性を有する配列を含む。
いくつかの実施形態では、本明細書では、1つ以上のプライムエディター成分をコードする1つ以上のポリヌクレオチドを含むプライム編集組成物が提供される。いくつかの実施形態では、プライム編集組成物は、DNA結合ドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメイン、例えば、RTドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、ポリヌクレオチド、例えば、DNA結合ドメインをコードするポリヌクレオチド及びDNAポリメラーゼドメイン、例えば、RTドメインをコードするポリヌクレオチドを含む融合ポリヌクレオチドを含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号412~555からなる群から選択される配列と少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号412~555からなる群から選択される配列のヌクレオチド100~2130に対応する配列と少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号412~555からなる群から選択される配列のヌクレオチド100~2130に対応する配列と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号83または84と少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号83または84と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号83または84の配列を含む。
いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、ポリヌクレオチドは、配列番号91または92と少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号91または92と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、プライム編集組成物は、DNAポリメラーゼドメインをコードするポリヌクレオチドを含み、そのポリヌクレオチドは、配列番号91または92の配列を含む。
いくつかの実施形態では、プライム編集組成物は、DNA結合ドメインをコードするポリヌクレオチドを含む。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチドは、配列番号627~630と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、DNA結合ドメインをコードするポリヌクレオチドは、配列番号627、628、629、または630の配列を含む。
いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、DNA結合ドメインをコードする第1のポリヌクレオチド、DNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含み、任意にリンカーをコードする第3のポリヌクレオチドをさらに含み、任意にNLSをコードする第4のポリヌクレオチドをさらに含む核酸配列を含む。いくつかの実施形態では、プライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、DNAポリメラーゼドメインをコードする第1のポリヌクレオチド、DNA結合ドメインをコードする第2のポリヌクレオチドを含み、任意にリンカーをコードする第3のポリヌクレオチドドメインをさらに含み、任意にNLSをコードする第4のポリヌクレオチドドメインをさらに含む核酸配列を含む。いくつかの実施形態では、第3のポリヌクレオチド配列は、第1と第2のポリヌクレオチド配列の間に位置する。いくつかの実施形態では、DNA結合ドメインをコードする配列の5’末端でNLSをコードする配列(例えば、第4のポリヌクレオチド)を含む。いくつかの実施形態では、DNAポリメラーゼドメインをコードする配列の5’末端でNLSをコードする配列(例えば、第4のポリヌクレオチド)を含む。いくつかの実施形態では、DNA結合ドメインをコードする配列の3’末端でNLSをコードする配列(例えば、第4のポリヌクレオチド)を含む。いくつかの実施形態では、DNAポリメラーゼドメインをコードする配列の3’末端でNLSをコードする配列(例えば、第4のポリヌクレオチド)を含む。いくつかの実施形態では、核酸配列を含むプライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、2つ以上のNLSをコードする2つ以上のヌクレオチド配列を含む。いくつかの実施形態では、核酸配列を含むプライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、3’末端で2つ以上のNLSをコードする2つ以上のヌクレオチド配列を含む。いくつかの実施形態では、核酸配列を含むプライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、5’末端で2つ以上のNLSをコードする2つ以上のヌクレオチド配列を含む。いくつかの実施形態では、核酸配列を含むプライムエディターをコードするポリヌクレオチド、例えば、融合ポリヌクレオチドは、3’末端で少なくとも1つのNLS及び5’末端で少なくとも1つのNLSをコードする少なくとも2つのヌクレオチド配列を含む。いくつかの実施形態では、NLSは、配列番号239、240、251、252、263、及び264に示される配列を含むポリヌクレオチドによってコードされる。
いくつかの実施形態では、プライム編集組成物は、DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含み、第1の及び第2のポリヌクレオチドは、融合ポリヌクレオチドを形成するために接続されている。いくつかの実施形態では、第1の及び第2のポリヌクレオチドは、ペプチドリンカーをコードするポリヌクレオチド配列によって接続されている。いくつかの実施形態では、ペプチドリンカーをコードするポリヌクレオチド配列は、配列番号235または236と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、ペプチドリンカーをコードするポリヌクレオチド配列は、配列番号235または236の配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、5’から3’へ第1の及び第2のポリヌクレオチドを含む。いくつかの実施形態では、融合ポリヌクレオチドは、3’から5’へ第1の及び第2のポリヌクレオチドを含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、229、241、及び242からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、229、241、及び242からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号81または82と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号81または82の配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号241または242と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号241または242の配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号89または90と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号89または90の配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号102または103と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号102または103の配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号114または115と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号114または115の配列を含む。
いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、または融合ポリヌクレオチドは、1つ以上の核局在化シグナル(NLS)をコードする配列をさらに含む。いくつかの実施形態では、NLSをコードする配列は、第1のポリヌクレオチドの5’末端にある。いくつかの実施形態では、NLSをコードする配列は、第1のポリヌクレオチドの3’末端にある。いくつかの実施形態では、NLSをコードする配列は、第2のポリヌクレオチドの5’末端にある。いくつかの実施形態では、NLSをコードする配列は、第2のポリヌクレオチドの3’末端にある。いくつかの実施形態では、NLSをコードする配列は、第1と第2のポリヌクレオチドの間にある。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、その両方は、2つ以上のNLSをコードする2つ以上の配列を含む。第1のポリヌクレオチド及び第2のポリヌクレオチドは接続されており、第1のポリヌクレオチドは、5’末端でNLSをコードする配列を含み、第2のポリヌクレオチドは、3’末端でNLSをコードする配列を含む、先行請求項のいずれか1項に記載のプライム編集組成物。
いくつかの実施形態では、第1のポリヌクレオチド及び第2のポリヌクレオチドは接続されており、第1のポリヌクレオチドは、5’末端で2つ以上のNLSをコードする配列を含み、及び/または第2のポリヌクレオチドは、3’末端で2つ以上のNLSをコードする配列を含む。いくつかの実施形態では、NLSまたは2つ以上のNLSは、双節型NLS(BPNLS)を含む。いくつかの実施形態では、BPNLSは、双節型SV40 NLSまたは双節型XenopusヌクレオプラスミンNLSである。いくつかの実施形態では、BPNLSは、配列番号4~24からなる群から選択されるアミノ酸配列を含む。いくつかの実施形態では、NLSは、配列番号239、240、251、252、263、及び264に示される配列を含むポリヌクレオチドによってコードされる。いくつかの実施形態では、NLSをコードする配列は、配列番号239または240の配列を含み、第2のポリヌクレオチドの3’末端に接続されている。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、119、233、及び234からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、119、233、または234の配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号79または80の配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号79または80の配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、または113の配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号87または88の配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号87または88の配列を含む。
いくつかの実施形態では、融合ポリペプチドは、3’末端で終止コドンをさらに含む。いくつかの実施形態では、終止コドンは、配列番号269~272からなる群から選択される配列を含む。いくつかの実施形態では、終止コドンは、配列UAA、UAG、UGA、及びUAAUAGUGAからなる群から選択される配列を含む。いくつかの実施形態では、終止コドンは、当該技術分野で知られている任意の終止コドンのDNAまたはRNA配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号276~279からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号276~279からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号282~285からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号282~285からなる群から選択される配列を含む。
いくつかの実施形態では、融合ポリヌクレオチドは、5’非翻訳領域配列(5’UTR)または3’非翻訳領域配列(3’UTR)をさらに含む。
いくつかの実施形態では、融合ポリヌクレオチドは、配列番号274、275、592、及び593からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号274、275、592、及び593からなる群から選択される配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号280、281、594、または595からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む。いくつかの実施形態では、融合ポリヌクレオチドは、配列番号280、281、594、または595からなる群から選択される配列を含む。
いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、または融合ポリヌクレオチドは、DNAを含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、または融合ポリヌクレオチドは、制御性要素を含む。いくつかの実施形態では、制御性要素は、プロモーターである。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、または融合ポリヌクレオチドは、RNAを含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、または融合ポリヌクレオチドは、mRNAを含む。
本明細書に記載のタンパク質ドメインをコードするポリヌクレオチド、例えば、DNAまたはmRNAは、DNAを化学的に合成することによって、またはPCR法及びギブソンアセンブリ法を利用することによって合成された部分的に重複するオリゴDNA短鎖を接続してその全長をコードするDNAを構築することによって得られ得る。化学的合成またはPCR法またはギブソンアセンブリ法の組み合わせによって全長DNAを構築する利点は、使用されるコドンが、DNAが導入される宿主に応じてCDS全長において設計され得ることである。異種DNAの発現において、タンパク質発現レベルは、そのDNA配列を、宿主生物において非常に頻繁に使用されるコドンに変換することによって増加することが予期される。使用される宿主におけるコード使用頻度のデータとして、例えば、Kazusa DNA Research Instituteのホームページで開示されている遺伝子コード使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)が使用され得、または各宿主におけるコドン使用頻度を示す文献が参照され得る。得られるデータ及び導入されるDNA配列に対する参照によって、DNA配列のために使用されるものの中で宿主における低い使用頻度を示すコドンは、同じアミノ酸をコードし、かつ高い使用頻度を示すコドンに変換され得る。
いくつかの実施形態では、プライム編集組成物のポリペプチド成分をコードするポリヌクレオチドは、1つ以上の発現制御性要素、例えば、プロモーター、3’UTR、5’UTR、またはそれらの任意の組み合わせに機能可能に連結されている。いくつかの実施形態では、プライム編集組成物成分をコードするポリヌクレオチドは、メッセンジャーRNA(mRNA)である。いくつかの実施形態では、mRNAは、5’末端でCap及び/または3’末端でポリAテールを含む。
薬学的組成物
本明細書には、本明細書に記載のプライム編集組成物成分、例えば、プライムエディター、融合タンパク質、プライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNA、ngRNA、及び/またはプライム編集複合体のいずれかを含む薬学的組成物が開示される。
用語「薬学的組成物」は、本明細書で使用される場合、薬学的使用のために製剤化された組成物を指す。いくつかの実施形態では、薬学的組成物は、薬学的に許容可能な担体をさらに含む。いくつかの実施形態では、薬学的組成物は、例えば、半減期を増加させる、特異的送達のための、追加の薬剤、または他の治療的化合物を含む。
いくつかの実施形態では、薬学的に許容可能な担体は、任意のビヒクル、例えば、液体または固体充填剤、希釈剤、賦形剤、製造助剤(例えば、滑沢剤、タルクマグネシウム、ステアリン酸カルシウムまたは亜鉛、またはステアリン酸)、または化合物を身体のある部位(例えば、送達部位)から別の部位(例えば、身体の器官、組織または一部分)への運搬または輸送に関与する溶媒包含物質を含む。薬学的に許容可能な担体は、製剤の他の成分と適合性があり、対象の組織に対して有害ではない(例えば、生理学的適合性、無菌、生理学的pH等)という意味で「許容可能」である。本明細書に記載の薬学的組成物の製剤は、薬理学の分野で知られているまたは今後開発される任意の方法によって調製され得る。通常、そのような調製方法には、活性成分(複数可)を賦形剤及び/または1つ以上の他の付随成分と会合させ、次いで、必要に応じて及び/または所望により、生成物を所望の単一または複数の用量単位に成形及び/または包装する工程が含まれる。薬学的製剤は、薬学的に許容可能な賦形剤を追加的に含み得、これには、本明細書で使用される場合、所望の特定の投薬形態と適合するように、あらゆる溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、表面活性剤、等張剤、増粘または乳化剤、防腐剤、固体結合剤、滑沢剤等が含まれる。
編集方法
本明細書に開示される方法及び組成物は、プライム編集によって二本鎖標的DNA、例えば、対象となる標的遺伝子を編集するために使用され得る。
いくつかの実施形態では、プライム編集方法は、二本鎖標的DNA、例えば、標的遺伝子をPEgRNA及び本明細書に記載のプライムエディター(PE)ポリペプチドと接触させることを含む。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、二本鎖であり、互いに相補的なDNAの2つの鎖を含む。いくつかの実施形態では、PEgRNAと接触させること及びプライムエディターと接触させることは、順次に実施される。いくつかの実施形態では、プライムエディターと接触させることは、PEgRNAと接触させた後に実施される。いくつかの実施形態では、PEgRNAと接触させることは、プライムエディターと接触させた後に実施される。いくつかの実施形態では、PEgRNAと接触させること、及びプライムエディターと接触させることは、同時に実施される。いくつかの実施形態では、PEgRNA及びプライムエディターは、二本鎖標的DNA、例えば、標的遺伝子を接触させる前に複合体において会合される。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、二本鎖標的DNA、例えば、標的遺伝子の標的鎖へのPEgRNAの結合をもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、PEgRNAとの接触により、二本鎖標的DNA、例えば、標的遺伝子の標的鎖上のサーチ標的配列へのPEgRNAの結合をもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、PEgRNAの前記接触により、サーチ標的配列に対するPEgRNAのスペーサー配列と、二本鎖標的DNA、例えば、標的遺伝子の標的鎖上のサーチ標的配列との結合をもたらす。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、PE組成物と二本鎖標的DNA、例えば、標的遺伝子との接触により、二本鎖標的DNA、例えば、標的遺伝子、例えば、二本鎖標的DNA、例えば、標的遺伝子へのプライムエディターの結合をもたらす。いくつかの実施形態では、PEのDNA結合ドメインは、PEgRNAと会合する。いくつかの実施形態では、PEは、PEgRNAによって仕向けられる二本鎖標的DNA、例えば、標的遺伝子を結合させる。したがって、いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子の接触は、PEgRNAによって仕向けられる二本鎖標的DNA、例えば、標的遺伝子のプライムエディターのDNA結合ドメインの結合をもたらす。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、二本鎖標的DNA、例えば、標的遺伝子と接触し、それにより二本鎖標的DNA、例えば、標的遺伝子の編集鎖上でニックを生成することによりプライムエディターによって、二本鎖標的DNA、例えば、標的遺伝子の編集鎖におけるニックをもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、二本鎖標的DNA、例えば、標的遺伝子の編集鎖のニック部位で遊離3’末端を含む一本鎖DNAをもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、プライムエディターのDNA結合ドメインによって二本鎖標的DNA、例えば、標的遺伝子の編集鎖におけるニックをもたらし、それによりニック部位で遊離3’末端を含む一本鎖DNAを生成する。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、Casドメインである。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、Cas9である。いくつかの実施形態では、プライムエディターのDNA結合ドメインは、Cas9ニッカーゼである。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、PEgRNAと、ニッキングされた一本鎖DNAの3’末端とのハイブリダイゼーションをもたらし、それによりプライムエディターのDNAポリメラーゼドメインによってDNA重合をプライミングする。いくつかの実施形態では、ニック部位で生成された一本鎖DNAの遊離3’末端は、接触したPEgRNAのプライマー結合部位配列(PBS)にハイブリダイズし、それによりDNA重合をプライミングする。いくつかの実施形態では、DNA重合は、プライムエディターの逆転写酵素ドメインによって触媒される逆転写である。いくつかの実施形態では、方法は、二本鎖標的DNA、例えば、標的遺伝子を、プライムエディター融合タンパク質またはプライム編集複合体の一部として(シスで)、または別々のタンパク質として(トランスで)、DNAポリメラーゼ、例えば、逆転写酵素と接触させることを含む。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、ニック部位で一本鎖DNAの3’遊離末端からのDNAポリメラーゼ媒介重合によってPEgRNAの編集鋳型によってコードされる編集された一本鎖DNAを生成する。いくつかの実施形態では、PEgRNAの編集鋳型は、二本鎖標的DNA、例えば、標的遺伝子の内因性配列と比較して1つ以上の意図されるヌクレオチド編集を含む。いくつかの実施形態では、意図されるヌクレオチド編集は、ニック部位で生成された二本鎖標的DNA、例えば、標的遺伝子の編集鎖の5’一本鎖DNAの切除及びDNA修復によって二本鎖標的DNA、例えば、標的遺伝子に組み込まれる。いくつかの実施形態では、意図されるヌクレオチド編集は、編集標的配列の切除及びDNA修復によって二本鎖標的DNA、例えば、標的遺伝子に組み込まれる。いくつかの実施形態では、ニック部位で生成された編集鎖の5’一本鎖DNAの切除は、フラップエンドヌクレアーゼによる。いくつかの実施形態では、フラップヌクレアーゼは、FEN1である。いくつかの実施形態では、方法は、二本鎖標的DNA、例えば、標的遺伝子をフラップエンドヌクレアーゼと接触させることをさらに含む。いくつかの実施形態では、フラップエンドヌクレアーゼは、プライムエディター融合タンパク質の一部として提供される。いくつかの実施形態では、フラップエンドヌクレアーゼは、トランスで提供される。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、編集された一本鎖DNAを含む二本鎖標的DNA、例えば、標的遺伝子の編集鎖、及び二本鎖標的DNA、例えば、標的遺伝子の非編集標的鎖を含むミスマッチヘテロ二本鎖を生成する。理論に縛られることなく、内因性DNA修復及び複製は、所望の編集された二本鎖標的DNA、例えば、標的遺伝子を形成するためにヌクレオチド変化(複数可)を組み込むためにミスマッチの編集されたDNAを解消し得る。
いくつかの実施形態では、方法は、二本鎖標的DNA、例えば、標的遺伝子を本明細書に開示されるニックガイド(ngRNA)と接触させることをさらに含む。いくつかの実施形態では、ngRNAは、二本鎖標的DNA、例えば、標的遺伝子の編集鎖上の第2のサーチ標的配列を結合させるスペーサーを含む。いくつかの実施形態では、接触したngRNAは、PEを、二本鎖標的DNA、例えば、標的遺伝子の標的鎖においてニックを導入するように誘導する。いくつかの実施形態では、標的鎖(非編集鎖)上のニックは、内因性DNA修復機構が編集鎖を使用して非編集鎖を修復することをもたらし、それにより二本鎖標的DNA、例えば、標的遺伝子の両方鎖において意図されるヌクレオチド編集を組み込み、二本鎖標的DNA、例えば、標的遺伝子を修飾する。いくつかの実施形態では、意図されるヌクレオチド編集(複数可)が二本鎖標的DNA、例えば、標的遺伝子の編集鎖に組み込まれた後にのみ、ngRNAは、編集鎖上の第2のサーチ標的配列と相補的であり、それにハイブリダイズし得るスペーサー配列を含む。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、ngRNA、PEgRNA、及びPEによって同時に接触させられる。いくつかの実施形態では、ngRNA、PEgRNA、及びPEは、それらが二本鎖標的DNA、例えば、標的遺伝子を接触させた場合、複合体を形成する。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、ngRNA、PEgRNA、及びプライムエディターと順次に接触させられる。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、二本鎖標的DNA、例えば、標的遺伝子をPEと接触させた後に、ngRNA及び/またはPEgRNAと接触させられる。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、二本鎖標的DNA、例えば、標的遺伝子をプライムエディターと接触させる前に、ngRNA及び/またはPEgRNAと接触させられる。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、細胞におけるものである。したがって、また、本明細書では、細胞を修飾する方法が提供される。
いくつかの実施形態では、プライム編集方法は、PEgRNA、プライムエディター、及び/またはngRNAを二本鎖標的DNA、例えば、標的遺伝子を有する細胞に導入することを含む。いくつかの実施形態では、プライム編集方法は、二本鎖標的DNA、例えば、標的遺伝子を有する細胞に、PEgRNA、プライムエディターポリペプチド、及び/またはngRNAを含むプライム編集組成物に導入することを含む。いくつかの実施形態では、PEgRNA、プライムエディターポリペプチド、及び/またはngRNAは、細胞への導入の前に複合体を形成する。いくつかの実施形態では、PEgRNA、プライムエディターポリペプチド、及び/またはngRNAは、細胞への導入の後に複合体を形成する。プライムエディター、PEgRNA及び/またはngRNA、及びプライム編集複合体は、リボ核タンパク質(RNP)、脂質ナノ粒子(LNP)、ウイルスベクター、非ウイルスベクター、mRNA送達、及び物理的技術、例えば、マイクロフルイディクスデバイスによる細胞膜破壊を含む、本明細書に記載の任意の送達アプローチまたは当該技術分野で知られている任意の送達アプローチによって細胞に導入され得る。プライムエディター、PEgRNA及び/またはngRNA、及びプライム編集複合体は、同時にまたは順次に細胞に導入され得る。
いくつかの実施形態では、プライム編集方法は、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、プライムエディターポリペプチドをコードするプライムエディターポリヌクレオチド、及び任意にngRNAまたはngRNAをコードするポリヌクレオチドを細胞に導入することを含む。いくつかの実施形態では、方法は、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、プライムエディターポリペプチドをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドを同時に細胞に導入することを含む。いくつかの実施形態では、方法は、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、プライムエディターポリペプチドをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドを細胞に順次に導入することを含む。いくつかの実施形態では、方法は、PEgRNAまたはPEgRNAをコードするポリヌクレオチド及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの導入の前に、プライムエディターポリペプチドをコードするポリヌクレオチドを細胞に導入することを含む。いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチドは、PEgRNAまたはPEgRNAをコードするポリヌクレオチド及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの細胞への導入の前に細胞に導入され、発現させられる。いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチドは、PEgRNAまたはPEgRNAをコードするポリヌクレオチド及び/またはngRNAまたはngRNAをコードするポリヌクレオチドが細胞に導入された後に細胞に導入される。プライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドは、本明細書に記載の任意の送達アプローチまたは当該技術分野で知られている任意の送達アプローチ、例えば、RNP、LNP、ウイルスベクター、非ウイルスベクター、mRNA送達、及び物理的送達によって細胞に導入され得る。
いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAをコードするポリヌクレオチド、及び/またはngRNAをコードするポリヌクレオチドは、細胞に導入された後に細胞のゲノムに組み込まれる。いくつかの実施形態では、プライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAをコードするポリヌクレオチド、及び/またはngRNAをコードするポリヌクレオチドは、一過性発現のために細胞に導入される。したがって、また、本明細書では、プライム編集によって修飾された細胞が提供される。
いくつかの実施形態では、細胞は、原核細胞である。いくつかの実施形態では、細胞は、真核細胞である。いくつかの実施形態では、細胞は、哺乳動物細胞である。いくつかの実施形態では、細胞は、非ヒト霊長類細胞、ウシ細胞、ブタ細胞、げっ歯類またはマウス細胞である。いくつかの実施形態では、細胞は、ヒト細胞である。いくつかの実施形態では、細胞は、初代細胞である。いくつかの実施形態では、細胞は、ヒト初代細胞である。いくつかの実施形態では、細胞は、前駆細胞である。いくつかの実施形態では、細胞は、ヒト前駆細胞である。いくつかの実施形態では、細胞は、肝細胞である。いくつかの実施形態では、細胞は、ヒト肝細胞である。いくつかの実施形態では、細胞は、人工ヒト多能性幹細胞(iPSC)に由来する初代ヒト肝細胞である。いくつかの実施形態では、細胞は、造血幹細胞(HSC)である。いくつかの実施形態では、細胞は、ヒトHSCである。いくつかの実施形態では、細胞は、ヒトCD34HSCである。いくつかの実施形態では、コドン最適化は、ヒトCD34造血幹前駆細胞(HSPC)における発現のためのものである。
いくつかの実施形態では、プライム編集によって編集される二本鎖標的DNA、例えば、標的遺伝子は、細胞の染色体におけるものである。いくつかの実施形態では、意図されるヌクレオチド編集は、細胞の染色体に組み込まれ、子孫細胞によって継承可能である。いくつかの実施形態では、プライム編集組成物及び方法によって細胞に導入された意図されるヌクレオチド編集は、細胞及び細胞の子孫もまた、意図されるヌクレオチド編集を含むようなものである。いくつかの実施形態では、細胞は、対象に対して自己、同種、または異種である。いくつかの実施形態では、細胞は、対象からのものであり、またはそれに由来する。いくつかの実施形態では、細胞は、ヒト対象からのものであり、またはそれに由来する。いくつかの実施形態では、細胞は、プライム編集による意図されるヌクレオチド編集の組み込み後に、対象、例えば、ヒト対象に導入して戻される。
いくつかの実施形態では、本明細書で提供される方法は、プライムエディターポリペプチドまたはプライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドを二本鎖標的DNA、例えば、標的遺伝子を含む複数の細胞または細胞の集団に導入することを含む。いくつかの実施形態では、細胞の集団は、同じ細胞タイプのものである。いくつかの実施形態では、細胞の集団は、同じ組織または器官のものである。いくつかの実施形態では、細胞の集団は、異種である。いくつかの実施形態では、細胞の集団は、同種である。いくつかの実施形態では、細胞の集団は、単一の組織または器官からのものであり、細胞は、異種である。いくつかの実施形態では、細胞の集団への導入は、ex vivoにおけるものである。いくつかの実施形態では、細胞の集団への導入は、in vivo、例えば、ヒト対象内へのものである。
いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、集団の各細胞のゲノムにおけるものである。いくつかの実施形態では、プライムエディターポリペプチドまたはプライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの導入は、細胞の集団における細胞の少なくとも1つにおける二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、プライムエディターポリペプチドまたはプライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの導入は、複数の細胞の集団における二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、プライムエディターポリペプチドまたはプライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの導入は、細胞の集団の各細胞における二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、プライムエディターポリペプチドまたはプライムエディターポリペプチドをコードするポリヌクレオチド、PEgRNAまたはPEgRNAをコードするポリヌクレオチド、及び/またはngRNAまたはngRNAをコードするポリヌクレオチドの導入は、疾患または障害が処置、予防または改善されるように十分な数の細胞における二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。
いくつかの実施形態では、プライム編集組成物及び本明細書に記載の方法の編集効率は、プライム編集組成物が導入された細胞の集団における編集された二本鎖標的DNA、例えば、標的遺伝子のパーセンテージを計算することによって測定され得る。いくつかの実施形態では、1時間、2時間、6時間、12時間、24時間、36時間、48時間、3日、4日、5日、7日、10日、または14日の二本鎖標的DNA、例えば、標的遺伝子のプライム編集組成物への曝露の後に編集効率が決定される。いくつかの実施形態では、プライム編集組成物が導入された細胞の集団は、ex vivoにおけるものである。いくつかの実施形態では、プライム編集組成物が導入された細胞の集団は、in vitroにおけるものである。いくつかの実施形態では、プライム編集組成物が導入された細胞の集団は、in vivoにおけるものである。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも約1%、少なくとも約5%、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、または少なくとも約99%の編集効率を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも25%の編集効率を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも35%の編集効率を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも30%の編集効率を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも45%の編集効率を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、好適な対照と比べて少なくとも50%の編集効率を有する。
いくつかの実施形態では、本明細書に開示される方法は、好適な対照初代細胞と比べて初代細胞において少なくとも約1%、少なくとも約5%、少なくとも約7.5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、または少なくとも約95%の編集の編集効率を有する。
いくつかの実施形態では、本明細書に開示される方法は、対応する対照肝細胞と比べて肝細胞において少なくとも約5%、少なくとも約7.5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、または少なくとも約95%の編集の編集効率を有する。いくつかの実施形態では、肝細胞は、ヒト肝細胞である。
いくつかの実施形態では、本明細書に開示される方法は、対応する対照HSCと比べて造血幹細胞(HSC)において少なくとも約5%、少なくとも約7.5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、または少なくとも約95%の編集の編集効率を有する。いくつかの実施形態では、HSCは、ヒトHSCである。
いくつかの実施形態では、本明細書に開示される方法は、配列番号25の及び/または配列番号26によってコードされる配列を有するプライムエディターでのプライム編集と比較して少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、少なくとも160%、少なくとも170%、少なくとも180%、少なくとも190%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%またはそれを超える増加した編集効率を有する。いくつかの実施形態では、本明細書に開示される方法は、配列番号25の及び/または配列番号26によってコードされる配列を有するプライムエディターでのプライム編集と比較して少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、少なくとも160%、少なくとも170%、少なくとも180%、少なくとも190%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%またはそれを超える増加した編集効率を有する。いくつかの実施形態では、増加した編集効率は、ヒト細胞におけるものである。いくつかの実施形態では、増加した編集効率は、初代細胞におけるものである。いくつかの実施形態では、増加した編集効率は、ヒト初代細胞におけるものである。いくつかの実施形態では、増加した編集効率は、前駆細胞におけるものである。いくつかの実施形態では、増加した編集効率は、ヒト前駆細胞におけるものである。いくつかの実施形態では、増加した編集効率は、肝細胞におけるものである。いくつかの実施形態では、増加した編集効率は、ヒト肝細胞におけるものである。いくつかの実施形態では、増加した編集効率は、人工ヒト多能性幹細胞(iPSC)に由来する初代ヒト肝細胞におけるものである。いくつかの実施形態では、増加した編集効率は、造血幹細胞(HSC)におけるものである。いくつかの実施形態では、増加した編集効率は、初代細胞におけるものである。いくつかの実施形態では、増加した編集効率は、ヒトCD34+HSCにおけるものである。
いくつかの実施形態では、本明細書で提供されるプライム編集組成物は、有意な割合のインデルを生成せずに1つ以上の意図されるヌクレオチド編集を組み込むことが可能である。用語「インデル(複数可)」は、本明細書で使用される場合、ポリヌクレオチド、例えば、二本鎖標的DNA、例えば、標的遺伝子内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異をもたらし得る。編集のインデル頻度は、当該技術分野で知られている方法によって計算され得る。いくつかの実施形態では、インデル頻度は、配列アライメント、例えば、Clement et al.,Nat.Biotechnol.37(3):224-226(2019)(その全体が本明細書に組み込まれる)に記載されているCRISPResso 2アルゴリズムに基づいて計算され得る。いくつかの実施形態では、本明細書に開示される方法は、20%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、未満1.5%、または1%未満のインデル頻度を有し得る。いくつかの実施形態では、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日の二本鎖標的DNA、例えば、標的遺伝子の曝露の後に任意の数のインデルが決定される。
いくつかの実施形態では、本明細書で提供されるプライム編集組成物は、有意な割合のインデルを生成せずに1つ以上の意図されるヌクレオチド編集を効率的に組み込むことが可能である。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約1%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、ヒトHSCにおいて少なくとも約1%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約1%の編集効率及び0.1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約5%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約5%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約5%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約7.5%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約7.5%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約7.5%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約10%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約10%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約10%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約15%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約15%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約15%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約20%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約20%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約20%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約30%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約30%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約30%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約40%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約40%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約40%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約50%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約50%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約50%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約60%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約60%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約60%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約70%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約70%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約70%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約80%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約80%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約80%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約90%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約90%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒトHSCにおいて少なくとも約90%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒト細胞において少なくとも約95%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒト細胞において少なくとも約95%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞、例えば、ヒト細胞において少なくとも約95%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団、例えば、ヒト細胞、例えば、ヒト幹細胞の集団において少なくとも約1%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約1%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約5%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約7.5%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約10%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約15%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団、例えば、ヒト幹細胞の集団において少なくとも約20%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約20%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約30%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約40%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約50%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約60%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約70%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約80%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約90%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び10%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び7.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び2.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び1%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び0.5%未満のインデル頻度を有する。いくつかの実施形態では、本明細書に開示されるプライム編集方法は、標的細胞の集団において少なくとも約95%の編集効率及び0.1%未満のインデル頻度を有する。
いくつかの実施形態では、標的遺伝子は、標的細胞におけるものである。したがって、一態様では本明細書では、ポリペプチドをコードした二本鎖標的DNA(例えば、標的遺伝子)を含む標的細胞を編集する方法であって、二本鎖標的DNAは、野生型二本鎖DNA(例えば、野生型遺伝子)と比べて1つ以上の変異を含む、方法が提供される。いくつかの実施形態では、本開示の方法は、PEgRNA、プライムエディターポリペプチド、ngRNA、及び/またはPEgRNA、プライムエディターポリペプチド、またはngRNAをコードするポリヌクレオチドを含むプライム編集組成物を標的遺伝子を有する標的細胞に導入して、標的遺伝子を編集し、それにより編集された細胞を生成することを含む。いくつかの実施形態では、標的細胞は、本明細書に開示される細胞である。いくつかの実施形態では、標的細胞は、哺乳動物細胞である。いくつかの実施形態では、標的細胞は、ヒト細胞である。
いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、in vitroで標的細胞に提供される。いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、ex vivoで標的細胞に提供される。いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、in vivoで標的細胞に提供される。
いくつかの実施形態では、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日の二本鎖標的DNA、例えば、標的遺伝子のプライム編集組成物への曝露の後に任意の数のインデルが決定される。いくつかの実施形態では、1時間、2時間、6時間、12時間、24時間、36時間、48時間、3日、4日、5日、7日、10日、または14日の二本鎖標的DNA、例えば、標的遺伝子のプライム編集組成物への曝露の後に編集効率が決定される。
いくつかの実施形態では、本明細書に記載のプライム編集組成物は、二本鎖標的DNA、例えば、標的遺伝子を含む染色体において50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、未満0.05%、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。いくつかの実施形態では、オフターゲット編集は、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日の二本鎖標的DNA、例えば、標的遺伝子(例えば、細胞のゲノム内の核酸)のプライム編集組成物への曝露の後に決定される。
いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、in vitroで標的細胞に提供される。いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、ex vivoで標的細胞に提供される。いくつかの実施形態では、本明細書に記載のプライム編集組成物の成分は、in vivoで標的細胞に提供される。
いくつかの実施形態では、プライム編集組成物(例えば、本明細書に記載されるPEgRNA及びプライムエディター)及び本明細書に開示されるプライム編集方法は、二本鎖標的DNA、例えば、標的遺伝子を編集するために使用され得る。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、同じ遺伝子の野生型配列と比較して変異を含む。いくつかの実施形態では、変異は、遺伝子疾患または障害に関連する。いくつかの実施形態では、変異は、二本鎖標的DNA、例えば、標的遺伝子のコード領域にある。いくつかの実施形態では、変異は、二本鎖標的DNA、例えば、標的遺伝子のエクソンにある。いくつかの実施形態では、プライム編集方法は、二本鎖標的DNA、例えば、標的遺伝子を、プライムエディター、PEgRNA、及び/またはngRNAを含むプライム編集組成物と接触させることを含む。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、組み込みは、標的遺伝子における編集標的配列に対応する二本鎖標的DNA、例えば、標的遺伝子の領域におけるものである。いくつかの実施形態では、1つ以上の意図されるヌクレオチド編集は、二本鎖標的DNA、例えば、標的遺伝子の内因性配列と比較して、単一のヌクレオチド置換、挿入、欠失、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、1つ以上の意図されるヌクレオチド編集の組み込みは、1つ以上の変異と、対応する野生型タンパク質をコードするDNA配列との置き換えをもたらす。いくつかの実施形態では、1つ以上の意図されるヌクレオチド編集の組み込みは、1つ以上の変異と、対応する野生型遺伝子配列との置き換えをもたらす。いくつかの実施形態では、1つ以上の意図されるヌクレオチド編集の組み込みは、二本鎖標的DNA、例えば、標的遺伝子における変異の修正をもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、変異を含有する編集鋳型配列を含む。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子をプライム編集組成物と接触させることは、二本鎖標的DNA、例えば、標的遺伝子における編集標的配列(または編集標的配列及び標的鎖上の編集標的配列に対する相補的配列を含む二本鎖領域)における変異を修正する二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、1つ以上の変異を含む二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みは、標的遺伝子によってコードされるタンパク質の野生型発現及び機能を回復させる。いくつかの実施形態では、標的遺伝子によってコードされるタンパク質の発現及び/または機能は、標的細胞において発現した場合に測定され得る。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みは、標的遺伝子発現のレベルの倍率変化及び/または標的遺伝子によってコードされる機能的タンパク質のレベル倍率変化をもたらす。いくつかの実施形態では、標的遺伝子発現レベルにおけるレベルの変化は、本明細書に記載のプライム編集組成物が導入されていない好適な対照細胞における発現と比較して、例えば、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍またはそれを超える倍率変化を含み得る。いくつかの実施形態では、1つ以上の変異を含む二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みは、野生型標的遺伝子を含む好適な対照細胞における対応するタンパク質の野生型発現と比較して少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%またはそれを超えて標的遺伝子によってコードされる機能的タンパク質の野生型発現を回復させる。
いくつかの実施形態では、発現増加は、機能性アッセイによって測定され得る。いくつかの実施形態では、タンパク質発現は、タンパク質アッセイを使用して測定され得る。いくつかの実施形態では、タンパク質発現は、抗体試験を使用して測定され得る。いくつかの実施形態では、タンパク質発現は、ELISA、質量分析、ウエスタンブロット、ドデシル硫酸ナトリウムポリアクリルアミドゲル電気泳動(SDS-PAGE)、高速液体クロマトグラフィー(HPLC)、電気泳動、またはそれらの任意の組み合わせを使用して測定され得る。いくつかの実施形態では、タンパク質アッセイは、クマシーブルー染色ゲルのSDS-PAGE及びデンシトメトリー分析を含み得る。
いくつかの実施形態では、標的遺伝子は、遺伝子疾患または障害に関連する1つ以上の変異を含む。したがって、いくつかの実施形態では、本明細書では、プライム編集によって修正され得る1つ以上の病原性変異に関連するまたはそれによって引き起こされる疾患を有すると診断された対象の処置のための方法が提供される。
いくつかの実施形態では、本明細書では、遺伝子疾患を処置するための方法であって、治療的有効量のプライム編集組成物、または本明細書に記載されるプライム編集組成物を含む薬学的組成物を対象に投与することを含む、方法が提供される。いくつかの実施形態では、プライム編集組成物の投与は、対象における二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。いくつかの実施形態では、プライム編集組成物の投与は、対象における疾患に関連する1つ以上の病原性変異、例えば、点変異、挿入、または欠失の修正をもたらす。いくつかの実施形態では、二本鎖標的DNA、例えば、標的遺伝子は、病原性変異を含有する編集標的配列を含む。いくつかの実施形態では、プライム編集組成物の投与は、対象における二本鎖標的DNA、例えば、標的遺伝子における編集標的配列(または編集標的配列及び標的鎖上の編集標的配列に対する相補的配列を含む二本鎖領域)における病原性変異を修正する二本鎖標的DNA、例えば、標的遺伝子における1つ以上の意図されるヌクレオチド編集の組み込みをもたらす。
いくつかの実施形態では、本明細書で提供される方法は、有効量のプライム編集組成物、例えば、PEgRNA、プライムエディター、及び/またはngRNAを対象に投与することを含む。いくつかの実施形態では、方法は、有効量の本明細書に記載のプライム編集組成物、例えば、プライム編集組成物成分をコードするポリヌクレオチド、ベクター、またはコンストラクト、またはプライム編集組成物成分を含むRNP、LNP、及び/またはポリペプチドを対象に投与することを含む。プライム編集組成物は、疾患に罹患している、疾患を有する、疾患に罹患しやすい、または疾患のリスクがある対象、例えば、ヒト対象における病原性変異(複数可)を有する標的遺伝子を標的とするように投与され得る。そのような処置を必要とする対象を同定することは、対象またはヘルスケア専門家の判断であり得、主観的(例えば、意見)または客観的(例えば、検査または診断方法によって測定可能)であり得る。
いくつかの実施形態では、方法は、本明細書で提供されるプライム編集組成物を対象に直接的に投与することを含む。本明細書に記載のプライム編集組成物は、本明細書に記載される任意の形態、例えば、LNP、RNP、ポリヌクレオチドベクター、例えば、ウイルスベクター、またはmRNAで送達され得る。プライム編集組成物は、対象に直接的に投与するために本明細書に記載されているまたは当該技術分野で知られている任意の薬学的に許容可能な担体で製剤化され得る。プライム編集組成物またはその薬学的組成物の成分は、同時にまたは順次に対象に投与され得る。例えば、いくつかの実施形態では、方法は、プライムエディター融合タンパク質及びPEgRNA及び/またはngRNAを含む複合体を含むプライム編集組成物、またはその薬学的組成物を対象に投与することを含む。いくつかの実施形態では、方法は、PEgRNA及び/またはngRNAと同時にプライムエディターをコードするポリヌクレオチドまたはベクターを対象に投与することを含む。いくつかの実施形態では、方法は、PEgRNA及び/またはngRNAの投与の前にプライムエディターをコードするポリヌクレオチドまたはベクターを対象に投与することを含む。
プライム編集組成物を対象に投与する好適な経路には、限定されないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が含まれる。いくつかの実施形態では、記載される組成物は、腹腔内に、静脈内に、または直接的注射もしくは直接的注入によって投与される。いくつかの実施形態では、記載される組成物は、直接的注射または注入または輸液、移植(例えば、本明細書に記載されるプライム編集複合体と接触させられた細胞を使用する同種造血幹細胞移植(HSCT))によって対象に投与される。いくつかの実施形態では、本明細書に記載の組成物は、注射によって、カテーテルを用いて、座剤を用いて、または埋込物を用いて対象に投与される。
いくつかの実施形態では、方法は、本明細書に記載のプライム編集組成物で編集された細胞を対象に投与することを含む。いくつかの実施形態では、細胞は、同種である。いくつかの実施形態では、同種細胞は、プライム編集組成物またはその薬学的組成物とex vivoで接触させられ、または接触させられており、それを必要とするヒト対象に導入される。いくつかの実施形態では、細胞は、対象に対して自己である。いくつかの実施形態では、細胞は、対象から除去され、プライム編集組成物またはその薬学的組成物とex vivoで接触させられ、対象に再導入される。
いくつかの実施形態では、細胞は、プライム編集組成物の1つ以上の成分とex vivoで接触させられる。細胞は、本明細書に記載されているまたは当該技術分野で知られている任意のアプローチでex vivoで接触させられ得る。例えば、いくつかの実施形態では、1つ以上の標的細胞は、エレクトロポレーションによってプライム編集組成物の1つ以上の成分とex vivoで接触させられる。いくつかの実施形態では、1つ以上の標的細胞は、プライム編集組成物またはその成分を含むLNPによってex vivoでプライム編集組成物の1つ以上の成分と接触させられる。いくつかの実施形態では、1つ以上の標的細胞は、プライム編集組成物の1つ以上の成分とex vivoで接触させられ、プライム編集組成物の1つ以上の成分は、細胞浸透性ペプチドに関連する。いくつかの実施形態では、ex vivoで接触させられた細胞は、対象に導入され、対象は、プライム編集組成物の1つ以上の成分とin vivoで投与される。例えば、いくつかの実施形態では、細胞は、プライムエディターとex vivoで接触させられ、対象に導入される。いくつかの実施形態では、対象は、次いでPEgRNA及び/またはngRNA、またはPEgRNA及び/またはngRNAをコードするポリヌクレオチドが投与される。
いくつかの実施形態では、プライム編集組成物と接触させられた細胞は、対象への再導入前にゲノムにおける1つ以上の意図されるヌクレオチド編集の組み込みについて決定される。いくつかの実施形態では、細胞は、対象への再導入前にゲノムにおいて1つ以上の意図されるヌクレオチド編集の組み込みが濃縮される。いくつかの実施形態では、編集される細胞は、初代細胞である。いくつかの実施形態では、編集される細胞は、前駆細胞である。いくつかの実施形態では、編集される細胞は、幹細胞である。いくつかの実施形態では、編集される細胞は、肝細胞である。いくつかの実施形態では、編集される細胞は、初代ヒト細胞である。いくつかの実施形態では、編集される細胞は、ヒト前駆細胞である。いくつかの実施形態では、編集される細胞は、ヒト幹細胞である。いくつかの実施形態では、編集される細胞は、ヒト肝細胞である。いくつかの実施形態では、細胞は、ニューロンである。いくつかの実施形態では、細胞は、大脳基底核からのニューロンである。いくつかの実施形態では、細胞は、対象の大脳基底核からのニューロンである。いくつかの実施形態では、細胞は、対象の大脳基底核におけるニューロンである。
プライム編集組成物またはその成分は、LNP投与、RNP投与、エレクトロポレーション、ヌクレオフェクション、トランスフェクション、ウイルス形質導入、マイクロインジェクション、細胞膜破壊及び拡散を含む本明細書に記載される任意の送達アプローチ、または当該技術分野で知られている任意の他のアプローチによって細胞に導入され得る。
プライム編集で編集された細胞は、当該技術分野で知られている任意の経路によって対象に導入され得る。いくつかの実施形態では、編集された細胞は、直接的注入によって対象に投与される。いくつかの実施形態では、編集された細胞は、静脈内注入によって対象に投与される。いくつかの実施形態では、編集された細胞は、埋込物として対象に投与される。
いくつかの実施形態では、対象における編集される標的遺伝子は、HBB遺伝子である。いくつかの実施形態では、HBB遺伝子は、鎌状赤血球病に関連する変異を含む。いくつかの実施形態では、HBB遺伝子は、野生型ベータグロビンタンパク質と比較してHBB遺伝子によってコードされるベータグロビンタンパク質におけるE6Vアミノ酸置換をコードする変異を含む。いくつかの実施形態では、本明細書では、プライムエディター及びPEgRNAを含むプライム編集組成物であって、PEgRNAは、プライムエディターを、HBB遺伝子における鎌状赤血球病に関連する変異を修正するように誘導することが可能である、プライム編集組成物が提供される。いくつかの実施形態では、PEgRNAは、意図されるヌクレオチド編集を含む編集鋳型を含み、HBB遺伝子における意図されるヌクレオチド編集の組み込みは、鎌状赤血球病に関連するHBB遺伝子における変異を修正する。いくつかの実施形態では、編集鋳型は、野生型HBB遺伝子の野生型配列を含む。したがって、いくつかの実施形態では、本明細書では、HBB遺伝子における鎌状赤血球病に関連する変異を修正する方法が提供される。いくつかの実施形態では、方法は、HBB遺伝子をPEgRNA及びプライムエディターと接触させることを含み、PEgRNAは、プライムエディターが、HBB遺伝子において意図されるヌクレオチド編集を組み込むように誘導し、それによりHBB遺伝子における鎌状赤血球病に関連する変異を修正する。いくつかの実施形態では、HBB遺伝子は、細胞におけるものである。したがって、いくつかの実施形態では、方法は、HBB遺伝子を含む細胞にPEgRNA及びプライムエディターを導入することを含み、PEgRNAは、プライムエディターが、HBB遺伝子において意図されるヌクレオチド編集を組み込むように誘導し、それによりHBB遺伝子における鎌状赤血球病に関連する変異を修正する。いくつかの実施形態では、方法は、HBB遺伝子を含む細胞にPEgRNA及びプライムエディターをコードするポリヌクレオチドを導入することを含み、プライムエディターの発現により、PEgRNAは、プライムエディターが、HBB遺伝子において意図されるヌクレオチド編集を組み込むように誘導し、それによりHBB遺伝子における鎌状赤血球病に関連する変異を修正する。いくつかの実施形態では、細胞は、血液細胞である。いくつかの実施形態では、HBB遺伝子は、造血幹細胞(HSC)である。いくつかの実施形態では、細胞は、in vivoにおけるものである。いくつかの実施形態では、細胞は、ex vivoにおけるものである。いくつかの実施形態では、PEgRNA及びプライムエディターは、同時に細胞に導入される。いくつかの実施形態では、PEgRNA及びプライムエディターをコードするポリヌクレオチドは、同時に細胞に導入される。いくつかの実施形態では、PEgRNA及びプライムエディターは、順次に細胞に導入され、例えば、PEgRNAは、プライムエディターの導入の前または後に導入され得る。いくつかの実施形態では、PEgRNA及びプライムエディターをコードするポリヌクレオチドは、順次に細胞に導入され、例えば、PEgRNAは、プライムエディターをコードするポリヌクレオチドの導入の前または後に導入され得る。
したがって、いくつかの実施形態では、本明細書では、鎌状赤血球病を処置する方法であって、方法は、PEgRNA及びプライムエディターまたはプライムエディターをコードするポリヌクレオチドを、それを必要とする対象に投与することを含み、PEgRNAは、対象におけるHBB遺伝子において意図されるヌクレオチド編集を組み込むように誘導し、それによりHBB遺伝子における変異を修正し、鎌状赤血球病を処置する、方法が提供される。いくつかの実施形態では、鎌状赤血球病を処置する方法は、PEgRNA及びプライムエディターまたはプライムエディターをコードするポリヌクレオチドを細胞または細胞の集団に導入してHBBにおける鎌状赤血球病に関連する変異を修正すること、及びその後、編集された細胞または編集された細胞の集団をそれを必要とする対象に投与することを含む。いくつかの実施形態では、細胞または細胞の集団は、編集の前にそれを必要とする対象から得られる。いくつかの実施形態では、細胞または細胞の集団は、編集前にドナーから得られる。いくつかの実施形態では、細胞または細胞の集団は、造血幹細胞である。いくつかの実施形態では、PEgRNA及びプライムエディターは、同時に投与される。いくつかの実施形態では、PEgRNA及びプライムエディターをコードするポリヌクレオチドは、同時に投与される。いくつかの実施形態では、PEgRNA及びプライムエディターは、順次に投与され、例えば、PEgRNAは、プライムエディターの投与の前または後に投与され得る。いくつかの実施形態では、PEgRNA及びプライムエディターをコードするポリヌクレオチドは、順次に投与され、例えば、PEgRNAは、プライムエディターをコードするポリヌクレオチドの投与の前または後に投与され得る。
本明細書に記載される薬学的組成物、プライム編集組成物、及び細胞は、有効量で投与され得る。いくつかの実施形態では、有効量は、投与様式に依存する。いくつかの実施形態では、有効量は、病態の段階、対象の年齢及び身体的状態、もし存在する場合は、併用療法の特質、ならびに医療実践者によく知られている同様の因子に依存する。
投与される特定の用量は、各対象について均一な用量であり得る。代替的には、対象の用量は、対象のおおよその体重に対して調整され得る。適切な投薬量を決定する際の他の要因には、処置または予防される疾患または病態、疾患の重症度、投与経路、ならびに患者の年齢、性別及び医学的状態が含まれ得る。
プライム編集組成物の成分が順次に投与される実施形態では、逐次投与間の時間は、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日であり得る。
送達
本明細書に記載のプライム編集組成物は、当該技術分野で知られている任意のアプローチで細胞環境に送達され得る。プライム編集組成物の成分は、同じ様式または異なる様式によって細胞に送達され得る。例えば、いくつかの実施形態では、プライムエディターまたはその成分(例えば、DNA結合ドメインまたはDNAポリメラーゼドメイン)は、ポリペプチドまたはポリペプチドをコードするポリヌクレオチド(DNAまたはRNA)としてまたはリボ核タンパク質(RNP)複合体として送達され得る。いくつかの実施形態では、PEgRNAは、RNAとしてまたはPEgRNAをコードするDNAとしてまたはRNP複合体としてPEタンパク質に複合体化されたRNAとして直接的に送達され得る。いくつかの実施形態では、プライム編集組成物の成分は、DNA及びRNAの組み合わせとして送達され得る。いくつかの実施形態では、プライムエディター組成物の成分は、ポリヌクレオチド、例えば、DNA、またはRNA、及びタンパク質の組み合わせとして送達され得る。
いくつかの実施形態では、プライム編集組成物の成分は、ポリヌクレオチド、ベクター、またはコンストラクトによってコードされる。いくつかの実施形態では、プライムエディターポリペプチド、PEgRNA及び/またはngRNAは、ポリヌクレオチドによってコードされる。いくつかの実施形態では、ポリヌクレオチドは、DNA結合ドメイン及びDNAポリメラーゼドメインを含むプライムエディター融合タンパク質をコードする。いくつかの実施形態では、ポリヌクレオチドは、プライムエディターのDNAポリメラーゼドメインをコードする。いくつかの実施形態では、ポリヌクレオチドは、プライムエディターのDNA結合ドメインをコードする。いくつかの実施形態では、ポリヌクレオチドは、プライムエディタータンパク質の一部分、例えば、インテイン-Nに接続されたプライムエディター融合タンパク質のN末端部分をコードする。いくつかの実施形態では、ポリヌクレオチドは、プライムエディタータンパク質の一部分、例えば、インテイン-Cに接続されたプライムエディター融合タンパク質のC末端部分をコードする。いくつかの実施形態では、ポリヌクレオチドは、PEgRNA及び/またはngRNAをコードする。いくつかの実施形態では、ポリペプチドは、プライム編集組成物の2つ以上の成分、例えば、プライムエディター融合タンパク質及びPEgRNAをコードする。
いくつかの実施形態では、1つ以上のプライム編集組成物成分をコードするポリヌクレオチドは、例えば、レトロウイルスベクターによって、標的細胞に送達され、長期発現のために細胞のゲノムに組み込まれる。いくつかの実施形態では、標的細胞に送達されたポリヌクレオチドは、一過性に発現する。例えば、ポリヌクレオチドは、mRNA、またはエピソーム発現のための非組み込みベクター(非組み込みウイルス、プラスミド、ミニサークルDNA)の形態で送達され得る。
いくつかの実施形態では、1つ以上のプライム編集システム成分をコードするポリヌクレオチドは、制御性要素、例えば、転写コントロール要素、例えば、プロモーターに機能可能に連結され得る。いくつかの実施形態では、ポリヌクレオチドは、複数のコントロール要素に機能可能に連結される。利用される発現システムに応じて、構成的及び誘導性プロモーター、転写エンハンサー要素、転写ターミネーター等を含む多数の好適な転写及び翻訳コントロール要素のいずれかが、発現ベクターにおいて使用され得る(例えば、U6プロモーター、H1プロモーター)。
いくつかの実施形態では、1つ以上のプライム編集組成物成分をコードするポリヌクレオチドは、ベクター(例えば、プラスミドベクターまたはウイルスベクター)の一部であり、またはそのベクターによってコードされる。いくつかの実施形態では、ベクターは、ウイルスベクターである。いくつかの実施形態では、ベクターは、非ウイルスベクターである。いくつかの実施形態では、送達は、in vivo、in vitro、ex vivo、またはin situにおけるものである。
非ウイルスベクター送達システムには、DNAプラスミド、RNA(例えば、本明細書に記載のベクターの転写産物)、ネイキッド核酸、及び送達ビヒクル、例えば、リポソームに複合体化された核酸が含まれ得る。いくつかの実施形態では、ポリヌクレオチドは、RNA、例えば、mRNAまたは転写産物として提供される。プライム編集システムの任意のRNA、例えば、ガイドRNAまたはプライムエディターをコードするmRNAは、RNAの形態で送達され得る。いくつかの実施形態では、RNAであるプライム編集システムの1つ以上の成分は、直接的化学合成によって生成され、またはDNAからin vitroで転写され得る。いくつかの実施形態では、プライムエディターポリペプチドをコードするmRNAは、in vitro転写を使用して生成される。ガイドポリヌクレオチド(例えば、PEgRNAまたはngRNA)はまた、T7プロモーターと、それに続く配列「GG」、及びガイドポリヌクレオチド配列を含有するカセットからin vitro転写を使用して転写され得る。いくつかの実施形態では、プライムエディターをコードするmRNA、PEgRNA、及び/またはngRNAは、RNAポリメラーゼ酵素(例えば、T7ポリメラーゼ、T3ポリメラーゼ、SP6ポリメラーゼ等)を使用してin vitroで合成される。合成されると、RNAは、二本鎖標的DNA、例えば、標的遺伝子を直接的に接触させ得、または核酸を細胞に導入するための任意の好適な技術(例えば、マイクロインジェクション、エレクトロポレーション、トランスフェクション)を使用して細胞に導入され得る。いくつかの実施形態では、プライムエディターをコードする配列、PEgRNA、及び/またはngRNAは、例えば、シュード-Uまたは5-メチル-Cを使用して、1つ以上の修飾されたヌクレオシドを含むように修飾される。
核酸の非ウイルスの送達の方法には、リポフェクション、ヌクレオフェクション、エレクトロポレーション、マイクロインジェクション、遺伝子銃、ビロソーム、リポソーム、免疫リポゾーム、細胞浸透性ペプチド、ポリカチオンまたは脂質:核酸コンジュゲート、ネイキッドDNA、人工ビリオン、マイクロフルイディクスデバイスによる細胞膜破壊、及びDNAの薬剤向上取り込みが含まれ得る。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオン性及び中性脂質が使用され得る。送達は、細胞(例えば、in vitroまたはex vivo投与)または標的組織(例えば、in vivo投与)へのものであり得る。標的化リポソームを含む脂質:核酸複合体、例えば、免疫脂質複合体の調製物が使用され得る。
ウイルスベクター送達システムには、細胞への送達後にエピソームゲノムまたは組み込まれたゲノムのいずれかを有し得るDNA及びRNAウイルスが含まれ得る。RNAまたはDNAウイルスベースのシステムは、特定の細胞を標的とし、ウイルスペイロードを細胞の小器官にトラフィッキングするために使用され得る。ウイルスベクターは、直接的に(in vivoで)投与され得、またはそれらは、in vitroで細胞を処置するために使用され得、修飾された細胞は、(ex vivoで)任意に投与され得る。
いくつかの実施形態では、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルスまたは単純ヘルペスウイルスベクターである。レトロウイルスベクターには、ネズミ白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、及びそれらの組み合わせに基づくものが含まれ得る。いくつかの実施形態では、レトロウイルスベクターは、レンチウイルスベクターである。いくつかの実施形態では、レトロウイルスベクターは、ガンマレトロウイルスベクターである。いくつかの実施形態では、ウイルスベクターは、アデノウイルスベクターである。いくつかの実施形態では、ウイルスベクターは、アデノ随伴ウイルス(「AAV」)ベクターである。いくつかの実施形態では、AAVは、組換えAAV(rAAV)である。
いくつかの実施形態では、1つ以上のプライム編集組成物成分をコードするポリヌクレオチドは、ウイルス粒子にパッケージングされる。パッケージング細胞が、標的細胞を感染させ得るウイルス粒子を形成するために使用され得る。そのような細胞には、293細胞(例えば、アデノウイルスをパッケージングする場合)、及びψ2細胞またはPA317細胞(例えば、レトロウイルスをパッケージングする場合)が含まれ得る。ウイルスベクターは、核酸ベクターをウイルス粒子にパッケージングする細胞株を生成することによって生成され得る。ベクターは、パッケージング及びその後の宿主への組み込みのために必要とされる最小ウイルス配列を含有し得る。ベクターは、発現されるポリヌクレオチド(複数可)のための発現カセットによって置き換えられる他のウイルス配列を含有し得る。欠いているウイルス機能は、パッケージング細胞株によってトランスで供給され得る。例えば、AAVベクターは、パッケージング及び宿主ゲノムへの組み込みのために必要とされるAAVゲノムからのITR配列を含み得る。
いくつかの実施形態では、二重AAVベクターは、大きな導入遺伝子発現カセットを2つの別個の半分(例えば、プライムエディターポリペプチドのN末端部分及びC末端部分をコードする5’及び3’末端)に分割することによって生成され、カセットの各半分は、長さが5kb以下、任意に長さが4.7kb以下であり、単一のAAVベクターにパッケージングされる。いくつかの実施形態では、全長導入遺伝子発現カセットは、両方の二重AAVベクターによる同じ細胞の共感染により再構築され得る。いくつかの実施形態では、プライムエディターポリペプチド、例えば、Cas9ニッカーゼの一部分または断片は、インテインに融合される。ポリペプチドの一部分または断片は、インテインのN末端またはC末端に融合され得る。いくつかの実施形態では、ポリペプチドのN末端部分は、インテイン-Nに融合され、ポリペプチドのC末端部分は、インテイン-Cに別々に融合される。いくつかの実施形態では、プライムエディター融合タンパク質の一部分または断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ及びカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼ等)で一緒に融合され得る。いくつかの実施形態では、プライムエディター融合タンパク質をコードするポリヌクレオチドは、2つの別々の半分(それぞれがプライムエディター融合タンパク質の一部分をコードする)に分割され、インテインに別々に融合される。いくつかの実施形態では、ポリヌクレオチドの2つの半分の各々は、二重AAVベクターシステムの個々のAAVベクターにおいてパッケージングされる。いくつかの実施形態では、ポリヌクレオチドの2つの半分の各々は、長さが5kb以下、任意に長さが4.7kb以下である。いくつかの実施形態では、全長プライムエディター融合タンパク質は、両方の二重AAVベクターによる同じ細胞の共感染、プライムエディター融合タンパク質の両方の半分の発現、及びインテインの自己切除により再構築される。いくつかの実施形態では、二重AAVベクターのin vivo使用は、全長プライムエディター融合タンパク質の発現をもたらす。いくつかの実施形態では、二重AAVベクタープラットフォームの使用は、サイズが約4.5、4.6、4.7、4.8、4.9、または5.0kbを超える導入遺伝子の実行可能な送達を可能とする。標的細胞は、本明細書に記載の1つ以上のベクターで一過性または非一過性でトランスフェクションされ得る。細胞は、対象において自然に生じるようにトランスフェクションされ得る。細胞は、対象から取得され、またはそれに由来し、トランスフェクションされ得る。細胞は、対象から取得された細胞、例えば、細胞株に由来し得る。いくつかの実施形態では、本明細書に記載の1つ以上のベクターでトランスフェクションされた細胞は、1つ以上のベクターに由来する配列を含む新たな細胞株を樹立するために使用され得る。いくつかの実施形態では、本開示の組成物で一過性にトランスフェクション(例えば、1つ以上のベクターの一過性トランスフェクション、またはRNAでのトランスフェクションによる)され、かつプライムエディターの活性を介して修飾された細胞は、修飾を含有するが、任意の他の外因性配列を欠く新たな細胞株を樹立するために使用され得る。宿主細胞と適合性がある任意の好適なベクターは、本開示の方法と共に使用され得る。ベクターの非限定的な例には、pXT1、pSG5、pSVK3、pBPV、pMSG、及びpSVLSV40が含まれる。
いくつかの実施形態では、プライムエディタータンパク質は、ポリペプチドとして細胞に提供され得る。いくつかの実施形態では、プライムエディタータンパク質は、タンパク質の溶解性を増加させるポリペプチドドメインに融合される。いくつかの実施形態では、プライムエディタータンパク質は、タンパク質の溶解性を改善するように製剤化される。
いくつかの実施形態では、プライムエディターポリペプチドは、細胞による取り込みを促進するためにポリペプチド浸透ドメインに融合される。いくつかの実施形態では、浸透ドメインは、包含ペプチド、ペプチド模倣体、または非ペプチド担体である。例えば、浸透ペプチドは、アミノ酸配列RQIKIWFQNRRMKWKKを含む、ペネトラチンと称される、Drosophila melanogaster転写因子アンテナペディアの第3のアルファヘリックスに由来し得る。別の例として、浸透ペプチドは、HIV-1 tat塩基性領域アミノ酸配列を含み得、これには、例えば、天然に存在するtatタンパク質のアミノ酸49~57が含まれ得る。他の浸透ドメインには、ポリ-アルギニンモチーフ、例えば、HIV-1 revタンパク質のアミノ酸34~56の領域、ノナ-アルギニン、及びオクタ-アルギニンが含まれ得る。ノナ-アルギニン(R9)配列が使用され得る。融合が行われ得る部位は、ポリペプチドの生物学的活性、分泌または結合特性を最適化するために選択され得る。
いくつかの実施形態では、プライムエディターポリペプチドは、in vitroでまたは宿主細胞によって生成され、それは、アンフォールディング、例えば、熱変性、DTT還元等によってさらに処理され、さらに再フォールディングされ得る。いくつかの実施形態では、プライムエディターポリペプチドは、in vitro合成によって調製される。様々な市販の合成装置が使用され得る。合成機を使用することによって、天然に存在するアミノ酸は、非天然アミノ酸で置換され得る。いくつかの実施形態では、プライムエディターポリペプチドは、組換え合成方法に従って、例えば、宿主細胞における発現によって単離及び精製され、ライセートは、HPLC、排除クロマトグラフィー、ゲル電気泳動、アフィニティークロマトグラフィー、または他の精製技術を使用して精製される。
いくつかの実施形態では、プライム編集組成物、例えば、プライムエディターポリペプチド成分及びPEgRNA/ngRNAは、ナノ粒子によって標的細胞に導入される。いくつかの実施形態では、プライムエディターポリペプチド成分及びPEgRNA及び/またはngRNAは、ナノ粒子において複合体を形成する。任意の好適なナノ粒子設計が、ゲノム編集システム成分またはそのような成分をコードする核酸を送達するため使用され得る。いくつかの実施形態では、ナノ粒子は、無機である。いくつかの実施形態では、ナノ粒子は、有機である。いくつかの実施形態では、プライム編集組成物は、有機ナノ粒子、例えば、脂質ナノ粒子(LNP)またはポリマーナノ粒子中で標的細胞、例えば、肝細胞に送達される。
いくつかの実施形態では、LNPは、カチオン性、アニオン性、中性脂質、またはそれらの組み合わせから製剤化される。いくつかの実施形態では、中性脂質、例えば、フソゲン性リン脂質DOPEまたは膜成分コレステロールは、トランスフェクション活性及びナノ粒子安定性を向上させるために含まれる。いくつかの実施形態では、LNPは、疎水性脂質、親水性脂質、またはそれらの組み合わせを用いて製剤化される。脂質は、LNPを生成するために広範囲のモル比で製剤化され得る。当該技術分野で知られている任意の脂質または脂質の組み合わせが、LNPを生成するために使用され得る。LNPを生成するために使用される例示的な脂質が以下の表4に提供される。
いくつかの実施形態では、プライム編集組成物の成分は、標的細胞への送達前に複合体を形成する。例えば、プライムエディター融合タンパク質、PEgRNA、及び/またはngRNAは、標的細胞への送達前に複合体を形成し得る。いくつかの実施形態では、プライム編集ポリペプチド(例えば、プライムエディター融合タンパク質)及びガイドポリヌクレオチド(例えば、PEgRNAまたはngRNA)は、標的細胞への送達のためのリボ核タンパク質(RNP)を形成する。いくつかの実施形態では、RNPは、PEgRNAと複合したプライムエディター融合タンパク質を含む。RNPは、既知の方法、例えば、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質媒介法、または当該技術分野で知られている任意の他のアプローチを使用して細胞に送達され得る。いくつかの実施形態では、標的細胞へのプライム編集組成物または複合体の送達は、細胞への外来DNAの送達を必要としない。いくつかの実施形態では、プライム編集複合体を含むRNPは、標的細胞において経時的に分解する。ナノ粒子製剤及び/または遺伝子移行において使用するための例示的な脂質が以下の表4に示されている。
Figure 2024525665000008

Figure 2024525665000009
ナノ粒子製剤及び/または遺伝子移行において使用するための例示的なポリマーが以下の表5に示されている。

Figure 2024525665000010
プライム編集組成物成分をコードするポリヌクレオチドのための例示的な送達方法が以下の表6に示されている。

Figure 2024525665000011
本開示のプライム編集組成物は、ポリヌクレオチドまたはポリペプチドとして導入されるかどうかにかかわらず、約30分~約24時間、例えば、1時間、1.5時間、2時間、2.5時間、3時間、3.5時間 4時間、5時間、6時間、7時間、8時間、12時間、16時間、18時間、20時間、または約30分~約24時間の任意の他の時間の間、細胞に提供され、これは、約1日毎~約4日毎の頻度、例えば、1.5日毎、2日毎、3日毎、または約1日毎~約4日毎の任意の他の頻度で繰り返され得る。組成物は、1回以上、例えば、1回、2回、3回、または3回を超えて対象細胞に提供され得、細胞は、各接触事象の後のいくらかの時間、例えば、16~24時間、薬剤(複数可)とインキュベートさせられる。2つ以上の異なるプライム編集システム成分、例えば、2つの異なるポリヌクレオチドコンストラクトが細胞に提供される場合(例えば、同じプライム編集システムの異なる成分、または同じまたは異なる二本鎖標的DNA、例えば、標的遺伝子内の異なる配列と相補的である2つの異なるガイド核酸)、組成物は、(例えば、2つのポリペプチド及び/または核酸として)同時に送達され得る。代替的には、それらは、順次に提供され得、例えば、1つの組成物が最初に提供され、それに続いて第2の組成物が提供される。
本開示のプライム編集組成物及び薬学的組成物は、ポリヌクレオチドまたはポリペプチドとして導入されるかどうかにかかわらず、約30分~約24時間、例えば、1時間、1.5時間、2時間、2.5時間、3時間、3.5時間 4時間、5時間、6時間、7時間、8時間、12時間、16時間、18時間、20時間、または約30分~約24時間の任意の他の時間の間、必要とする対象に投与され、これは、約1日毎~約4日毎の頻度、例えば、1.5日毎、2日毎、3日毎、または約1日毎~約4日毎の任意の他の頻度で繰り返され得る。組成物は、1回以上、例えば、1回、2回、3回、または3回を超えて対象に提供され得る。2つ以上の異なるプライム編集システム成分、例えば、2つの異なるポリヌクレオチドコンストラクトが対象に投与される場合(例えば、同じプライム編集システムの異なる成分、または同じまたは異なる二本鎖標的DNA、例えば、標的遺伝子内の異なる配列に相補的である2つの異なるガイド核酸)、組成物は、(例えば、2つのポリペプチド及び/または核酸として)同時に投与され得る。代替的には、それらは、順次に提供され得、例えば、1つの組成物が最初に提供され、それに続いて第2の組成物が提供される。

Figure 2024525665000012

Figure 2024525665000013

Figure 2024525665000014

Figure 2024525665000015

Figure 2024525665000016

Figure 2024525665000017

Figure 2024525665000018

Figure 2024525665000019

Figure 2024525665000020

Figure 2024525665000021

Figure 2024525665000022

Figure 2024525665000023

Figure 2024525665000024

Figure 2024525665000025

Figure 2024525665000026

Figure 2024525665000027

Figure 2024525665000028

Figure 2024525665000029

Figure 2024525665000030

Figure 2024525665000031

Figure 2024525665000032

Figure 2024525665000033

Figure 2024525665000034

Figure 2024525665000035

Figure 2024525665000036

Figure 2024525665000037

Figure 2024525665000038

Figure 2024525665000039

Figure 2024525665000040

Figure 2024525665000041

Figure 2024525665000042

Figure 2024525665000043

Figure 2024525665000044

Figure 2024525665000045

Figure 2024525665000046

Figure 2024525665000047

Figure 2024525665000048

Figure 2024525665000049

Figure 2024525665000050

Figure 2024525665000051

Figure 2024525665000052

Figure 2024525665000053

Figure 2024525665000054

Figure 2024525665000055

Figure 2024525665000056

Figure 2024525665000057

Figure 2024525665000058

Figure 2024525665000059

Figure 2024525665000060

Figure 2024525665000061

Figure 2024525665000062

Figure 2024525665000063

Figure 2024525665000064

Figure 2024525665000065

Figure 2024525665000066

Figure 2024525665000067

Figure 2024525665000068

Figure 2024525665000069

Figure 2024525665000070

Figure 2024525665000071

Figure 2024525665000072

Figure 2024525665000073

Figure 2024525665000074

Figure 2024525665000075
Figure 2024525665000076

Figure 2024525665000077
Figure 2024525665000078

Figure 2024525665000079

Figure 2024525665000081

Figure 2024525665000082
Figure 2024525665000083

Figure 2024525665000084

Figure 2024525665000085

Figure 2024525665000086

Figure 2024525665000087

Figure 2024525665000088

Figure 2024525665000089
Figure 2024525665000090

Figure 2024525665000091

Figure 2024525665000092
Figure 2024525665000093

Figure 2024525665000094

Figure 2024525665000095

Figure 2024525665000096
Figure 2024525665000097

Figure 2024525665000098
Figure 2024525665000099

Figure 2024525665000100

Figure 2024525665000101

Figure 2024525665000102

Figure 2024525665000103

Figure 2024525665000104

Figure 2024525665000105

Figure 2024525665000106

Figure 2024525665000107

Figure 2024525665000108

Figure 2024525665000109

Figure 2024525665000110

Figure 2024525665000111

Figure 2024525665000112

Figure 2024525665000113

Figure 2024525665000114

Figure 2024525665000115

Figure 2024525665000116

Figure 2024525665000117

Figure 2024525665000118

Figure 2024525665000119

Figure 2024525665000120

Figure 2024525665000121

Figure 2024525665000122

Figure 2024525665000123

Figure 2024525665000124

Figure 2024525665000125

Figure 2024525665000126

Figure 2024525665000127

Figure 2024525665000128

Figure 2024525665000129

Figure 2024525665000130

Figure 2024525665000131

Figure 2024525665000132

Figure 2024525665000133

Figure 2024525665000134

Figure 2024525665000135

Figure 2024525665000136

Figure 2024525665000137

Figure 2024525665000138

Figure 2024525665000139
Figure 2024525665000140

Figure 2024525665000141

Figure 2024525665000142

Figure 2024525665000143

Figure 2024525665000144

Figure 2024525665000145

Figure 2024525665000146

Figure 2024525665000147

Figure 2024525665000148

Figure 2024525665000149

Figure 2024525665000150

Figure 2024525665000151

Figure 2024525665000152

Figure 2024525665000153

Figure 2024525665000154

Figure 2024525665000155

Figure 2024525665000156

Figure 2024525665000157

Figure 2024525665000158

Figure 2024525665000159

Figure 2024525665000160

Figure 2024525665000161

Figure 2024525665000162

Figure 2024525665000163

Figure 2024525665000164

Figure 2024525665000165

Figure 2024525665000166

Figure 2024525665000167

Figure 2024525665000168

Figure 2024525665000169

Figure 2024525665000170

Figure 2024525665000171

Figure 2024525665000172

Figure 2024525665000173

Figure 2024525665000174

Figure 2024525665000175

Figure 2024525665000176

Figure 2024525665000177

Figure 2024525665000178

Figure 2024525665000179

Figure 2024525665000180

Figure 2024525665000181

Figure 2024525665000182

Figure 2024525665000183

Figure 2024525665000184

Figure 2024525665000185

Figure 2024525665000186

Figure 2024525665000187

Figure 2024525665000188

Figure 2024525665000189

Figure 2024525665000190

Figure 2024525665000191

Figure 2024525665000192

Figure 2024525665000193

Figure 2024525665000194

Figure 2024525665000195

Figure 2024525665000196

Figure 2024525665000197

Figure 2024525665000198

Figure 2024525665000199

Figure 2024525665000200

Figure 2024525665000201

Figure 2024525665000202

Figure 2024525665000203

Figure 2024525665000204

Figure 2024525665000205

Figure 2024525665000206

Figure 2024525665000207

Figure 2024525665000208

Figure 2024525665000209

Figure 2024525665000210

Figure 2024525665000211

Figure 2024525665000212

Figure 2024525665000213

Figure 2024525665000214

Figure 2024525665000215

Figure 2024525665000216

Figure 2024525665000217

Figure 2024525665000218

Figure 2024525665000219

Figure 2024525665000220

Figure 2024525665000221

Figure 2024525665000222

Figure 2024525665000223

Figure 2024525665000224

Figure 2024525665000225

Figure 2024525665000226

Figure 2024525665000227

Figure 2024525665000228

Figure 2024525665000229

Figure 2024525665000230

Figure 2024525665000231

Figure 2024525665000232

Figure 2024525665000233
以下の例は、例示の目的のためにのみ提供され、本明細書で提供される特許請求の範囲の範囲を限定することは意図されていない。
実施例1.コドン最適化された逆転写酵素ドメインを含むプライムエディター。
SV40BPNLS-Cas9H840A-[(SGGS)2-XTEN-(SGGS)2-S]-MMLVRT5M-SGGS-SV40BPNLS1(アミノ酸配列番号25)の構造を有するプライムエディター融合タンパク質をコードするポリヌクレオチド配列を操作した。融合タンパク質のC末端部分である[(SGGS)2-XTEN-(SGGS)2-S]-MMLVRT5M-SGGS-SV40BPNLS1]をコードするポリヌクレオチド配列についてコドン最適化を実施した。融合タンパク質の示されるC末端部分をコードするコドンを、ヒトゲノムにおける頻繁なコドンを使用するために及びmRNA安定性を改善するために最適化した。融合タンパク質の残りのN末端部分(SV40BPNLS-Cas9H840A)のため、Anzalone Nature 576(7785):149-157(2019)で公開されているものと同じ融合タンパク質をコードするポリヌクレオチド配列を使用した。
上述したプライムエディター融合タンパク質をコードする144種のコドン最適化RNA配列を設計し、コード配列が配列番号412~555に提供される。PE-C2(配列番号244)、PE-C3(配列番号234)、及びPE-C4(配列番号256)という名称の3種のコドン最適化されたmRNAを、配列番号27の配列を含み、かつ以後PE-AA2019 mRNAと称される同じ融合タンパク質をコードする上方最適化された対照mRNA配列と比較した。PE-C2、PE-C3、及びPE-C4の各々のRT部分をコードするコドン最適化された配列がそれぞれ配列番号245、83、及び257に提供される。PE-C2、PE-C3、PE-C4、及びPE-AA2019 mRNAをin vitroで転写した。Streptococcus pyogenes Cas9(SpCas9)ヌクレアーゼをコードするmRNAもまた、陰性対照として機能するためにin vitroで転写した。PE-C2、PE-C3、PE-C4、及びPE-AA2019の各々のRNA配列及び対応するDNA配列、ならびに各成分をコードする配列が表15に提供される。in vitro転写に起因するmRNAのため、5’末端に5’UTRを付加し、mRNAの各々の3’末端に「TAA」終止コドンと、それに続く3’UTRを付加した。UTR配列をコードする配列が配列番号640及び645、表68に提供される。
各mRNAを、T>Aヌクレオチド置換(鎌状赤血球疾患に関連する「E6V」として知られているアミノ酸置換をもたらす鎌状赤血球変異)を野生型HBB遺伝子に導入するように設計されたプライム編集ガイドRNA(pegRNA)及びニックガイドRNA(ngRNA)と共に健康なヒトドナーCD34+細胞にエレクトロポレーション(ATx,Maxcyte)した。pegRNA及びngRNAの配列が以下に提供される:
pegRNA配列:(5’-3’)
mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCAGACUUCUCCACAGGAGUCAGGUGCACmU*mU*mU*U(配列番号559)
ngRNA配列:(5’-3’)
mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCmU*mU*mU*U(配列番号564)
ガイドRNA配列が列挙される任意の場合において、*は、ホスホロチオエート結合を示し、「m」は、2’OMe修飾を示す。
200nMのプライムエディターをコードするmRNA、20μMのpegRNA及び11μMのニックガイドRNAを各エレクトロポレーションのために使用した。プライム編集効率を3つの時点:エレクトロポレーションから24時間、72時間、及び120時間後にそれぞれ試験した。各時点について、2つの生物学的反復物がプライムエディターをコードするmRNAの各々について含まれ、1つの反復物をSpCas9対照のために使用した。ゲノムDNAを抽出し、3つの時点の各々でIllumina Miseq次世代シーケンシング(NGS)でシーケンシングした。
mRNAをコードするプライムエディターの各々のプライム編集効率が表7にまとめられている。コドン最適化されたコンストラクトで、特にPE-C3において改善されたプライム編集効率が観察された。
Figure 2024525665000234
Figure 2024525665000235
CD34+細胞におけるプライムエディタータンパク質(またはSpCas9対照)のレベルも評価した。エレクトロポレーションの24時間後、タンパク質をCD34+細胞から収集し、抗Cas9一次抗体を使用してキャピラリーウエスタンブロットアッセイ(Jess,ProteinSimple)によって定量した。PE-C3について、2つの生物学的反復物の一方のみをプライムエディタータンパク質レベルについて測定した。キャピラリーウエスタンブロットを実行する前にビシンコニン酸(BCA)定量(ThermoFisher)を使用して総タンパク質濃度によってサンプルを正規化した。Cas9定量についての160kDa(±10%)またはプライムエディターピークについての230kDa(±10%)における検出されたピークについて曲線下面積を測定することによってタンパク質を定量した。結果が表8にまとめられている:
Figure 2024525665000236
実施例2.最適化されたリンカーを有するプライムエディター。
この実験では、プライムエディター融合タンパク質のCas9ドメイン及びRTドメインを接続するペプチドリンカーを最適化した。以下の構造をそれぞれ有する22種のプライムエディター融合タンパク質を設計した:
SV40BPNLS-Cas9H840A-[リンカー]-MMLVRT5M-SGGS-SV40BPNLS1
[リンカー]は、22種の融合タンパク質の各々における異なるペプチドリンカーを示す。SV40BPNLS-Cas9H840A-[(SGGS)2-XTEN-(SGGS)2-S]-MMLVRT5M-SGGS-SV40BPNLS1の構造を有する、実施例1に記載されるプライムエディター融合タンパク質を、代替リンカーを有する22種のプライムエディター融合タンパク質との比較のための対照として使用した。22種の融合タンパク質及び対照融合タンパク質の各々をコードするmRNA配列をin vitroで転写した。リンカーバリアント融合タンパク質をコードする22種のmRNA配列の各々において、MMLVRTをコードする部分をコドン最適化し、それは、実施例1に記載されるPE-C3におけるMMLVRTをコードする配列(配列番号234)と同じ配列を有する。MMLVRT-C3と称される、MMLVRT5Mをコードするコドン最適化されたRNA配列が配列番号84に提供され、対応するDNA配列が配列番号83に提供される。対照プライムエディター融合タンパク質は、PE-C3最適化mRNAによってコードされ、そのコード配列は配列番号234にある。in vitro転写に起因するmRNAのため、5’末端に5’UTRを付加し、mRNAの各々の3’末端に「TAA」終止コドンと、それに続く3’UTR(表68に提供される配列)を付加した。
HEK293T細胞株を、ホモ接合性様式でHBB遺伝子における鎌状赤血球変異を含有するように生成した。pegRNA及びngRNA対を、HEK293T細胞における鎌状赤血球変異遺伝子座を編集するために設計し、化学的に合成した:
pegRNA配列:(5’-3’)
mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUUCAGGAGUCAGGUGCACmU*mU*mU*U(配列番号569)
ngRNA配列:(5’-3’)
mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(配列番号574)
22種の融合タンパク質及び対照融合タンパク質をコードするmRNAを、MessengerMax(商標)脂質試薬(ThermoFisher)を使用して、リポフェクションによってHEK293T細胞に導入した。4000ngのmRNA、250ngのpegRNA及び75ngのng RNAを各ウェルのために使用した。プライムエディターをコードするmRNAの各々について、2つの技術的反復物を試験した。リポフェクションの3日後に、ゲノムDNAを収集し、上述したようにIllumina NGSを使用してシーケンシングしてプライム編集効率及びインデル頻度を測定した。結果が表9にまとめられている。対照リンカー(SGGS)2-XTEN(SGGS)2-Sと比較して、代替リンカーを有するプライムエディターは、改善された編集効率を示す。

Figure 2024525665000237
最適化されたリンカーを有するプライムエディターのサブセットを、HBB遺伝子座を編集するために健康なヒトドナーCD34+細胞においてさらに試験した。pegRNA及びngRNAをHBB遺伝子座を標的とするように設計した:
pegRNA配列:(5’-3’)
mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U(配列番号579)
ニックRNA配列:(5’-3’)
mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(配列番号574)
150nMのプライムエディターをコードするmRNA、20μMのpegRNA、及び10μMのngRNAを各CD34+細胞エレクトロポレーションのために使用した。プライム編集効率及びインデル頻度をエレクトロポレーションから24時間、48時間、及び96時間後にそれぞれ試験した。ゲノムDNAを3つの時点の各々で抽出し、記載したようにIllumina MiSeq次世代シーケンシングで分析した。プライム編集効率及びインデル頻度が表10にまとめられている。CD34+細胞における最大で41%のプライム編集がエレクトロポレーションから96時間後に観察された。
Figure 2024525665000238
実施例3.最適化されたpegRNAを有するプライム編集
3’末端ウラシルを欠く化学的に合成されたpegRNAをCD34+細胞における編集効率について試験し、3’末端で4つの追加のウラシルヌクレオチド(5’-「UUUU」-3’)を有する化学的に合成されたpegRNAと比較した。pegRNA及びngRNAをHBB遺伝子座を標的とするように設計した。実施例2において使用された同じpegRNAを、pegRNAの3’末端で4ウラシルヌクレオチドを除去することによって生成されたpegRNAと比較した。上の実施例2において使用されたngRNAを、4つの3’ウラシルを有する及び有しないpegRNAとそれぞれ対合させて、プライム編集効率を試験した。pegRNA及びngRNAを合成し、以下に示されるように5’及び3’末端を保護するように化学的に修飾した:
末端Uを有するpegRNA配列:
5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U-3’(配列番号579)
末端Uを有しないpegRNA配列:
5’-mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUmG*mC*mA*C-3’(配列番号587)
ニックガイドRNA配列:
5’-mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U-3’(配列番号574)
2つの異なるプライムエディターをコードする2つのmRNAを使用した:1)実施例1に記載されるPE-C3コドン最適化mRNA(配列番号233)、及び2)実施例2に記載されるPE-C3と同じコドン最適化されたMMLVRT5M部分を有する、構造(SV40BPNLS-Cas9H840A-(SGGS)8- MMLVRT5MC3-SGGS-SV40BPNLS1)を有する(SGGS)8リンカーを有するプライムエディター融合タンパク質をコードするmRNA(配列番号80)。異なる量のmRNAも試験した。PEタンパク質をコードするmRNA、pegRNA、及びngRNAをヒト健康ドナーCD34+細胞においてエレクトロポレーションした。各エレクトロポレーションについて、20μMのpegRNA及び11μMのngRNAを使用した。プライム編集効率及びインデル頻度をエレクトロポレーションから48時間及び96時間後にそれぞれ試験した。ゲノムDNAを各時点で抽出し、プライム編集効率及びインデル頻度をIllumina Miseq次世代シーケンシングで分析した。使用された編集条件、プライム編集効率及びインデル頻度が表11にまとめられている。

Figure 2024525665000239
実施例4.操作された逆転写酵素ドメインを有するプライムエディター
MMLVRT RNaseHドメインにおける切断及び変異を含む、操作された逆転写酵素ドメインを有するプライムエディター融合タンパク質をプライム編集効率について試験した。11種のプライムエディター融合タンパク質を設計し、RTドメインタンパク質構造配列に対する修飾が以下の表12に示されている。
pegRNA及びngRNAを、HBB遺伝子遺伝子座における鎌状赤血球変異を標的とするように設計した。2つの異なるプライム編集標的化ストラテジーを使用した:i)鎌状赤血球変異の組み込み;及びii)鎌状赤血球変異に加えてサイレントPAM変異の組み込み。pegRNA及びngRNA配列をコードするDNA配列は、以下に示されるとおりである(転写に関連し、HBB標的化に関与しないpegRNA及びngRNAをコードするDNA配列における5’グアニン及び3’配列TTTTTTT(配列番号646)):
pegRNA配列をコードするDNA配列:
GCATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCAGACTTCTCCACAGGAGTCAGGTGCACTTTTTTT(配列番号588)
pegRNA配列をコードするDNA配列(サイレントPAM変異を有する)
GCATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCAGACTTCTCTACAGGAGTCAGGTGCACTTTTTTT(配列番号589)
ニックRNA配列をコードするDNA配列(サイレントPAM変異及びngRNA結合を有する):
GCCTTGATACCAACCTGCCCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTGCTTTTTTT(配列番号590)
プライムエディターをコードする配列を、サイトメガロウイルス(CMV)プロモーターのコントロール下で発現プラスミドにおいてそれぞれ構築した。表68に提供される5’UTR、及び「TAA」終止コドンと、それに続く3’UTRも、プラスミドにおいてプライムエディターをコードする配列に付加した。PEgRNA配列及びngRNA配列を、hU6プロモーターのコントロール下でプラスミドにおいてそれぞれ構築した。プライムエディターをコードするプラスミドをそれぞれ個々に、2つの追加のプラスミド(各々がPEgRNA及びngRNAをコードする)と共に野生型HEK293T細胞にリポフェクションした。1ウェル当たり750ngのプライムエディターをコードするプラスミド、25ngのPEgRNAをコードするプラスミド、及び83ngのngRNAをコードするプラスミドをリポフェクション(リポフェクタミン2000、Thermo Fisher)のために使用した。SpCas9ヌクレアーゼをコードするプラスミド、及び配列番号25の配列を有する全長MMLVRT5Mを有するプライムエディターをコードするプラスミドを2つの対照として使用した。ゲノムDNAをリポフェクションから3日後に収集し、PCR増幅し、Illumina MiseqNext Generationシーケンシングを使用してシーケンシングした。各処置について、2つの技術的反復物を試験した。結果が以下の表12にまとめられている。MMLV-RT五変異体(配列番号5)を、表12に列挙されるコンストラクトを生成するためにさらに修飾した。アミノ酸置換は、「元のアミノ酸「位置」置換されたアミノ酸」として示されている。例えば、D524Nは、配列番号1、5または623と比較して位置524におけるAspからAsnへの置換を指す。文字X及びXに先行する数字は、切断の位置を示す。例えば、G504Xは、配列番号5と比較してアミノ酸Gly504の後の切断を指す;Gly504は、切断されたアミノ酸配列において保持されている。22aa_del_N末端は、配列番号5のN末端で22アミノ酸の欠失を指す。対応するCas9-RT融合タンパク質配列及びRTバリアント配列、ならびにバリアントG504X、D524N、及びL478Xのための実験において使用されたものと同じものをコードするポリペプチド配列も表18~20にそれぞれ提供される。この実施例及び本明細書に記載の以下の実施例4において、MMLVRTに対する修飾は、MMLVRT5Mに対するものであること、及びMMLVRT5Mにおける変異は、切断されない限り、MMLVRTバリアントにおいて保持されることが留意されるべきである。
結果が以下の表12にまとめられている。位置G504またはL478の後にRNAseHドメインを除去するためプライムエディターの切断は、元の全長コンストラクトと比較して活性の増加をもたらし、L435K変異の包含もよく耐容される。
Figure 2024525665000240
標準的なSpCas9ガイドRNA骨格と一致するように配列番号589及び590における84番目のヌクレオチドグアニンを置き換えることによって作製されたpegRNA及びngRNAの異なる対を用いてHEK293T細胞において実験を繰り返した。各プライムエディターバリアントについて3つの技術的反復物を試験した。結果が図5に示されている。
複数のリンカー及びNLS配列と組み合わせた位置G504の後の切断を有するM-MLV RTを含むプライムエディターを、配列番号5の全長M-MLV RTを有するプライムエディターと比較したCD34+細胞における編集効率についてさらに試験した。融合タンパク質の各々の成分及び構造が表13の第1のカラムに示されている。融合タンパク質をコードするアミノ酸配列及び対応するDNA/RNA配列が表15、16、17、23、24、28、及び53に提供される。表53について、NLS配列が表2に提供される。プライムエディター融合タンパク質の各々をコードするポリヌクレオチド配列において、逆転写酵素をコードする部分を、PE-C3におけるMMLVRT5Mをコードする対応する配列(またはその部分)としてコドン最適化した(配列番号83及び84に示される全長のコドン最適化されたMMLVRT5MのDNA及びRNA配列)。プライムエディター融合タンパク質の各々をコードするmRNAをin vitro転写した。in vitro転写のため、5’末端に5’UTRを付加し、mRNAの各々の3’末端に「TAA」終止コドンと、それに続く3’UTR(表68に提供される配列)を付加した。pegRNA及びngRNAを合成し、以下のとおりの末端保護されたPEgRNA及びngRNAを使用して鎌状赤血球変異をHBB遺伝子に導入した
mC*mA*mU*GGUGCACCUGACUCCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCAGACUUCUCUACAGGAGUCAGGUGCACmU*mU*mU*U(配列番号591)
ニックRNA配列:
mC*mC*mU*UGAUACCAACCUGCCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(配列番号574)
150nM mRNA、20μM PEgRNA、及び10μM ngRNAをヒト健康ドナーCD34+細胞におけるエレクトロポレーションのために使用した。ゲノムDNAをエレクトロポレーションから24時間、48時間、72時間、及び96時間後にそれぞれ収集し、Miseqベースのシーケンシング方法で分析した。編集効率及びインデル頻度が以下の表13にまとめられている。

Figure 2024525665000241
PE-C3 mRNA及び上の表13におけるプライムエディター融合タンパク質(SV40BPNLS-Cas9H840A-(SGGS)2-XTEN-(SGGS)2-MMLVRT(G504X)-NLS)をコードするmRNA(配列番号92の配列を有するコドン最適化された切断されたMMLVRT(G504X)を含有する)を使用してmRNA用量反応をさらに実施した。200nMのmRNAで、全長及び切断された編集体は、同様に挙動した(エレクトロポレーションから72時間後に、35.7%及び36.6%のプライム編集の平均)が、切断されたプライムエディターは、150nMのmRNAで全長編集体よりもわずかに効率的であった(全長について28.7%及び切断されたプライムエディターについて34.3%の平均)。

Claims (120)

  1. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、配列番号289、291、293、294、295、301、302、303、306、309、310、及び311からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、前記プライム編集組成物。
  2. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、前記プライム編集組成物。
  3. 前記ペプチドリンカーの前記アミノ酸配列は、前記選択される配列と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する、請求項1または2に記載のプライム編集組成物。
  4. 選択される配列は、配列番号302である、請求項1~3のいずれか1項に記載のプライム編集組成物。
  5. 選択される配列は、配列番号309である、請求項1~3のいずれか1項に記載のプライム編集組成物。
  6. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、少なくとも4個の連続SGGSモチーフを含む、前記プライム編集組成物。
  7. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、少なくとも4~10個の連続SGGSモチーフを含む、前記プライム編集組成物。
  8. 前記ペプチドリンカーは、4、5、6、8、または10個の連続SGGSモチーフを含む、請求項7に記載のプライム編集組成物。
  9. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、少なくとも2個の連続EAAAKモチーフを含む、前記プライム編集組成物。
  10. 融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを含むプライム編集組成物であって、前記融合タンパク質は、ペプチドリンカーを介して接続されたDNA結合ドメイン及びDNAポリメラーゼドメインを含み、前記ペプチドリンカーは、2~8個の連続EAAAKモチーフを含む、前記プライム編集組成物。
  11. 前記ペプチドリンカーは、2、3、4、6、または8個の連続EAAAKモチーフを含む、請求項10に記載のプライム編集組成物。
  12. 前記DNAポリメラーゼドメインは、逆転写酵素(RT)ドメインを含む、請求項1~11のいずれか1項に記載のプライム編集組成物。
  13. 前記RTドメインは、モロニーマウス白血病ウイルス(M-MLV)RTドメインである、請求項12に記載のプライム編集組成物。
  14. 前記M-MLV RTドメインは、配列番号5と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸を含む、請求項13に記載のプライム編集組成物。
  15. 前記M-MLV RTドメインは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたアミノ酸配列を含む、請求項13に記載のプライム編集組成物。
  16. 前記M-MLV RTドメインは、配列番号36と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む、請求項15に記載のプライム編集組成物。
  17. 前記M-MLV RTドメインは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されたアミノ酸配列を含む、請求項13に記載のプライム編集組成物。
  18. 前記M-MLV RTドメインは、配列番号54と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む、請求項17に記載のプライム編集組成物。
  19. a)DNA結合ドメインまたは前記DNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたは前記M-MLV RTドメインをコードするポリヌクレオチドを含むプライム編集組成物であって、前記M-MLV RTドメインは、配列番号1に示されるアミノ酸504及び505に対応する位置の間でC末端で切断されたアミノ酸配列を含む、前記プライム編集組成物。
  20. a)DNA結合ドメインまたは前記DNA結合ドメインをコードするポリヌクレオチド、及びb)モロニーマウス白血病逆転写酵素(M-MLV RT)ドメインまたは前記M-MLV RTドメインをコードするポリヌクレオチドを含むプライム編集組成物であって、前記M-MLV RTドメインは、配列番号1に示されるアミノ酸478及び479に対応する位置の間でC末端で切断されている、前記プライム編集組成物。
  21. 前記M-MLV RTドメインは、配列番号1に示される参照M-MLV RTと比較してアミノ酸置換D200N、T306K、W313F、T330P、またはそれらの任意の組み合わせを含む、請求項19または20に記載のプライム編集組成物。
  22. 前記DNA結合ドメインは、融合タンパク質において前記M-MLV RTドメインに接続されている、請求項19~21のいずれか1項に記載のプライム編集組成物。
  23. 前記DNA結合ドメイン及び前記M-MLV RTドメインは、ペプチドリンカーによって接続されている、請求項22に記載のプライム編集組成物。
  24. 前記ペプチドリンカーは、配列番号286~411からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む、請求項23に記載のプライム編集組成物。
  25. 前記DNA結合ドメインは、CRISPR関連(Cas)タンパク質を含む、請求項1~24のいずれか1項に記載のプライム編集組成物。
  26. 前記Casタンパク質は、II型Casタンパク質である、請求項25に記載のプライム編集組成物。
  27. 前記Casタンパク質は、Cas9である、請求項26に記載のプライム編集組成物。
  28. 前記Cas9タンパク質は、HNHドメインにおける変異を含むニッカーゼである、請求項27に記載のプライム編集組成物。
  29. 前記Cas9タンパク質は、配列番号2と比較してH840A変異を含む、請求項28に記載のプライム編集組成物。
  30. 前記DNA結合ドメインは、配列番号7と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む、請求項29に記載のプライム編集組成物。
  31. 前記Casタンパク質は、V型Casタンパク質である、請求項25に記載のプライム編集組成物。
  32. 前記Casタンパク質は、Cas12a、Cas12b、Cas12c、Cas12d、またはCas12eである、請求項31に記載のプライム編集組成物。
  33. 前記融合タンパク質は、前記DNAポリメラーゼドメイン及び前記DNA結合ドメインをN末端からC末端へ含む、請求項1~18及び22~32のいずれか1項に記載のプライム編集組成物。
  34. 前記融合タンパク質は、前記DNAポリメラーゼドメイン及び前記DNA結合ドメインをC末端からN末端へ含む、請求項1~18及び22~32のいずれか1項に記載のプライム編集組成物。
  35. 前記融合タンパク質は、配列番号78、105、117、125、131、137、143、149、155、161、167、173、179、185、191、197、203、209、215、221、及び227からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項34に記載のプライム編集組成物。
  36. 前記選択される配列は、配列番号78である、請求項35に記載のプライム編集組成物。
  37. 前記選択される配列は、配列番号105である、請求項35に記載のプライム編集組成物。
  38. 前記融合タンパク質は、配列番号86、111、122、128、134、140、146、152、158、164、170、176、182、188、194、200、206、212、218、224、及び230からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項34に記載のプライム編集組成物。
  39. 前記選択される配列は、配列番号86である、請求項38に記載のプライム編集組成物。
  40. 前記選択される配列は、配列番号111である、請求項38に記載のプライム編集組成物。
  41. 前記融合タンパク質は、前記選択される配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有するアミノ酸配列を含む、請求項35~40のいずれか1項に記載のプライム編集組成物。
  42. 前記融合タンパク質は、1つ以上の核局在化シグナル(NLS)を含む、請求項34~41のいずれか1項に記載のプライム編集組成物。
  43. 前記1つ以上のNLSは、配列番号8~15または621からなる群から選択されるアミノ酸配列を含む、請求項42に記載のプライム編集組成物。
  44. 前記融合タンパク質は、配列番号77、93、104、116、及び620からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項42に記載のプライム編集組成物。
  45. 前記選択される配列は、配列番号77または配列番号620である、請求項44に記載のプライム編集組成物。
  46. 前記選択される配列は、配列番号93である、請求項44に記載のプライム編集組成物。
  47. 前記融合タンパク質は、配列番号85、96、110、及び622からなる群から選択される配列と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項42に記載のプライム編集組成物。
  48. 前記選択される配列は、配列番号85または配列番号622である、請求項47に記載のプライム編集組成物。
  49. 前記選択される配列は、配列番号110である、請求項48に記載のプライム編集組成物。
  50. 前記融合タンパク質は、前記選択される配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有するアミノ酸配列を含む、請求項44~49のいずれか1項に記載のプライム編集組成物。
  51. 前記融合タンパク質をコードする前記ポリヌクレオチドを含み、前記ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、及び229からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項1~18及び22~50のいずれか1項に記載のプライム編集組成物。
  52. 前記選択される配列は、配列番号81または82である、請求項51に記載のプライム編集組成物。
  53. 前記融合タンパク質をコードする前記ポリヌクレオチドを含み、前記ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項1~18及び22~50のいずれか1項に記載のプライム編集組成物。
  54. 前記選択される配列は、配列番号89または90である、請求項53に記載のプライム編集組成物。
  55. 前記融合タンパク質をコードする前記ポリヌクレオチドを含み、前記ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、及び119からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項1~18及び22~50のいずれか1項に記載のプライム編集組成物。
  56. 前記融合タンパク質をコードする前記ポリヌクレオチドを含み、前記ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項1~18及び22~50のいずれか1項に記載のプライム編集組成物。
  57. 前記選択される配列は、配列番号79または80である、請求項55に記載のプライム編集組成物。
  58. 前記選択される配列は、配列番号87または88である、請求項56に記載のプライム編集組成物。
  59. 前記融合タンパク質をコードする前記ポリヌクレオチドは、3’末端で終止コドンをさらに含む、請求項51~58のいずれか1項に記載のプライム編集組成物。
  60. 前記ポリヌクレオチドは、配列番号276~279の配列を含む、請求項59に記載のプライム編集組成物。
  61. 前記ポリヌクレオチドは、配列番号282~285の配列を含む、請求項59に記載のプライム編集組成物。
  62. 5’非翻訳領域(UTR)及び/または3’UTRをさらに含む、請求項51~61のいずれか1項に記載のプライム編集組成物。
  63. 前記ポリヌクレオチドは、配列番号274、275、592、または593の配列を含む、請求項62に記載のプライム編集組成物。
  64. 前記ポリヌクレオチドは、配列番号280、281、594、または595の配列を含む、請求項62に記載のプライム編集組成物。
  65. 前記ポリヌクレオチドは、DNAを含む、請求項51~64のいずれか1項に記載のプライム編集組成物。
  66. 前記ポリヌクレオチドは、mRNAを含む、請求項51~64のいずれか1項に記載のプライム編集組成物。
  67. 制御性要素配列をさらに含み、任意に前記制御性要素配列は、プロモーターである、請求項65に記載のプライム編集組成物。
  68. DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、前記第2のポリヌクレオチドは、配列番号412~555からなる群から選択される配列のヌクレオチド100~2130に対応する配列と少なくとも80%の同一性を有する配列を含む、前記プライム編集組成物。
  69. DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、前記第2のポリヌクレオチドは、配列番号83または84と少なくとも80%の同一性を有する配列を含む、前記プライム編集組成物。
  70. 前記第2のポリヌクレオチドは、配列番号83または84と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む、請求項69に記載のプライム編集組成物。
  71. DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、前記第2のポリヌクレオチドは、配列番号83または84の配列を含む、前記プライム編集組成物。
  72. DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、前記第2のポリヌクレオチドは、配列番号91または92と少なくとも80%の同一性を有する配列を含む、前記プライム編集組成物。
  73. 前記第2のポリヌクレオチドは、配列番号91または92と少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含む、請求項72に記載のプライム編集組成物。
  74. DNA結合ドメインをコードする第1のポリヌクレオチド及びDNAポリメラーゼドメインをコードする第2のポリヌクレオチドを含むプライム編集組成物であって、前記第2のポリヌクレオチドは、配列番号91または92の配列を含む、前記プライム編集組成物。
  75. 前記第1のポリヌクレオチドは、CRISPR関連(Cas)タンパク質をコードする、請求項68~74のいずれか1項に記載のプライム編集組成物。
  76. 前記Casタンパク質は、II型Casタンパク質である、請求項75に記載のプライム編集組成物。
  77. 前記Casタンパク質は、Cas9である、請求項76に記載のプライム編集組成物。
  78. 前記Cas9タンパク質は、HNHドメインにおける変異を含むニッカーゼであり、任意に前記Cas9タンパク質は、配列番号2と比較してH840A変異を含む、請求項77に記載のプライム編集組成物。
  79. 前記Casタンパク質は、V型Casタンパク質である、請求項75に記載のプライム編集組成物。
  80. 前記Casタンパク質は、Cas12a、Cas12b、Cas12c、Cas12d、またはCas12eである、請求項79に記載のプライム編集組成物。
  81. 前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドは、融合ポリヌクレオチドにおいて接続されている、請求項68~80のいずれか1項に記載のプライム編集組成物。
  82. 前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドは、ペプチドリンカーをコードする配列によって接続されている、請求項81に記載のプライム編集組成物。
  83. 前記ペプチドリンカーをコードするポリヌクレオチドは、配列番号235、236または633~636の配列を含む、請求項82に記載のプライム編集組成物。
  84. 前記第1のポリヌクレオチドは、前記第2のポリヌクレオチドの5’末端に接続されている、請求項81~83のいずれか1項に記載のプライム編集組成物。
  85. 前記第1のポリヌクレオチドは、前記第2のポリヌクレオチドの3’末端に接続されている、請求項81~83のいずれか1項に記載のプライム編集組成物。
  86. 前記融合ポリヌクレオチドは、配列番号81、82、108、109、120、121、126、127、132、133、138、139、144、145、150、151、156、157、162、163、168、169、174、175、180、181、186、187、192、193、198、199、204、205、210、211、216、217、222、223、228、229、241、及び242からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項81~85のいずれか1項に記載のプライム編集組成物。
  87. 前記選択される配列は、配列番号81または82である、請求項86に記載のプライム編集組成物。
  88. 前記選択される配列は、配列番号241または242である、請求項86に記載のプライム編集組成物。
  89. 前記融合ポリヌクレオチドは、配列番号89、90、102、103、114、115、123、124、129、130、135、136、141、142、147、148、153、154、159、160、165、166、171、172、177、178、183、184、189、190、195、196、201、202、207、208、213、214、219、220、225、226、231、及び232からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項81~85のいずれか1項に記載のプライム編集組成物。
  90. 前記選択される配列は、配列番号89または90である、請求項89に記載のプライム編集組成物。
  91. 前記選択される配列は、配列番号102または103である、請求項89に記載のプライム編集組成物。
  92. 前記選択される配列は、配列番号114または115である、請求項89に記載のプライム編集組成物。
  93. 前記第1のポリヌクレオチド、前記第2のポリヌクレオチド、またはその両方は、核局在化シグナル(NLS)をコードする配列をさらに含む、請求項68~92のいずれか1項に記載のプライム編集組成物。
  94. 前記NLSをコードする配列は、配列番号239または240の配列を含み、前記第2のポリヌクレオチドの3’末端に接続されている、請求項68~93のいずれか1項に記載のプライム編集組成物。
  95. 前記融合ポリヌクレオチドは、配列番号79、80、94、95、106、107、118、119、233、及び234からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項81~94のいずれか1項に記載のプライム編集組成物。
  96. 前記選択される配列は、配列番号79または80である、請求項95に記載のプライム編集組成物。
  97. 前記融合ポリヌクレオチドは、配列番号87、88、97、98、100、101、112、及び113からなる群から選択される配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性を有する配列を含む、請求項81~94のいずれか1項に記載のプライム編集組成物。
  98. 前記選択される配列は、配列番号87または88である、請求項97に記載のプライム編集組成物。
  99. 前記融合ポリヌクレオチドは、3’末端で終止コドンをさらに含む、請求項81~98のいずれか1項に記載のプライム編集組成物。
  100. 前記融合ポリヌクレオチドは、配列番号276~279からなる群から選択される配列を含む、請求項99に記載のプライム編集組成物。
  101. 前記融合ポリヌクレオチドは、配列番号282~285からなる群から選択される配列を含む、請求項99に記載のプライム編集組成物。
  102. 前記融合ポリヌクレオチドは、5’非翻訳領域(UTR)及び/または3’UTRを含む、請求項81~101のいずれか1項に記載のプライム編集組成物。
  103. 前記ポリヌクレオチドは、配列番号274、275、592、または593の配列を含む、請求項102に記載のプライム編集組成物。
  104. 前記ポリヌクレオチドは、配列番号280、281、594、または595の配列を含む、請求項102に記載のプライム編集組成物。
  105. 前記第1のポリヌクレオチド、前記第2のポリヌクレオチド、及び/または前記融合ポリヌクレオチドは、DNAを含む、請求項68~104のいずれか1項に記載のプライム編集組成物。
  106. 前記第1のポリヌクレオチド、前記第2のポリヌクレオチド、及び/または前記融合ポリヌクレオチドは、mRNAを含む、請求項68~104のいずれか1項に記載のプライム編集組成物。
  107. 前記融合ポリヌクレオチドは、制御性要素配列をさらに含み、任意に前記制御性要素配列は、プロモーターである、請求項105に記載のプライム編集組成物。
  108. 配列同一性は、存在:11、伸長1に設定されたギャップコストを用いて2つの配列のニードルマン・ウンシュアライメントによって決定され、同一率は、同一の数を前記アライメントの長さで除算することによって計算される、請求項1~107のいずれか1項に記載のプライム編集組成物。
  109. 前記プライム編集組成物は、プライム編集ガイドRNA(PEgRNA)またはPEgRNAをコードするポリヌクレオチドをさらに含む、請求項1~108のいずれか1項に記載のプライム編集組成物。
  110. 前記プライム編集組成物は、ニックガイドRNA(ngRNA)またはngRNAをコードするポリヌクレオチドをさらに含む、請求項1~109のいずれか1項に記載のプライム編集組成物。
  111. 請求項1~110のいずれか1項に記載のプライム編集組成物のポリヌクレオチドのうちの1つ以上を含むベクター。
  112. 前記ベクターは、AAVベクターである、請求項111に記載のベクター。
  113. 前記ベクターは、脂質ナノ粒子(LNP)である、請求項112に記載のベクター。
  114. 請求項1~110のいずれか1項に記載のプライム編集組成物または請求項111~113に記載のベクター、及び薬学的に許容可能な賦形剤を含む薬学的組成物。
  115. 標的遺伝子を編集する方法であって、前記方法は、前記標的遺伝子を請求項1~110のいずれか1項に記載のプライム編集組成物と接触させることを含む、前記方法。
  116. 前記標的遺伝子は、細胞におけるものである、請求項115に記載の方法。
  117. 前記細胞は、ヒト細胞である、請求項116に記載の方法。
  118. 前記細胞は、(CD34+)造血幹細胞または造血幹前駆細胞である、請求項116に記載の方法。
  119. 前記接触させることは、ex vivoにおけるものである、請求項115~118のいずれか1項に記載の方法。
  120. 前記細胞は、対象におけるものである、請求項115~118のいずれか1項に記載の方法。
JP2024501179A 2021-07-06 2022-06-29 効率的なゲノム編集のための組成物及び方法 Pending JP2024525665A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163218744P 2021-07-06 2021-07-06
US63/218,744 2021-07-06
US202163219623P 2021-07-08 2021-07-08
US63/219,623 2021-07-08
PCT/US2022/035613 WO2023283092A1 (en) 2021-07-06 2022-06-29 Compositions and methods for efficient genome editing

Publications (2)

Publication Number Publication Date
JP2024525665A true JP2024525665A (ja) 2024-07-12
JPWO2023283092A5 JPWO2023283092A5 (ja) 2025-07-07

Family

ID=84800962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024501179A Pending JP2024525665A (ja) 2021-07-06 2022-06-29 効率的なゲノム編集のための組成物及び方法

Country Status (6)

Country Link
US (1) US20240228988A1 (ja)
EP (1) EP4367227A4 (ja)
JP (1) JP2024525665A (ja)
AU (1) AU2022306377A1 (ja)
CA (1) CA3224970A1 (ja)
WO (1) WO2023283092A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
CA3174483A1 (en) 2020-03-04 2021-09-10 Flagship Pioneering Innovations Vi, Llc Improved methods and compositions for modulating a genome
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
EP4399292A2 (en) 2021-09-08 2024-07-17 Flagship Pioneering Innovations VI, LLC Methods and compositions for modulating a genome
EP4444362A2 (en) 2021-12-10 2024-10-16 Flagship Pioneering Innovations VI, LLC Cftr-modulating compositions and methods
WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
WO2024170778A1 (en) 2023-02-17 2024-08-22 Anjarium Biosciences Ag Methods of making dna molecules and compositions and uses thereof
WO2024178144A1 (en) * 2023-02-22 2024-08-29 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
US20250034548A1 (en) * 2023-05-31 2025-01-30 University Of Massachusetts Improved modular prime editing with modified effectors and templates
WO2024259051A1 (en) * 2023-06-14 2024-12-19 The Children's Medical Center Corporation Systems and methods for modifying a polynucleotide
WO2025038881A1 (en) * 2023-08-16 2025-02-20 Beam Therapeutics Inc. Prime editing of single base mutations in sickle cell disease
WO2025076306A1 (en) * 2023-10-06 2025-04-10 University Of Massachusetts Prime editors having improved prime editing efficiency

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3775239A4 (en) * 2018-03-25 2022-01-05 Genetether, Inc MODIFIED NUCLEIC ACID EDITING SYSTEM FOR BINDING DONOR DNA
US20210355475A1 (en) * 2018-08-10 2021-11-18 Cornell University Optimized base editors enable efficient editing in cells, organoids and mice
JP7646552B2 (ja) * 2019-01-31 2025-03-17 ビーム セラピューティクス インク. 低減された非標的脱アミノ化を有する核酸塩基エディターおよび核酸塩基エディターの特徴づけのためのアッセイ
BR112021015092A2 (pt) * 2019-02-02 2022-10-11 Univ Shanghai Technology Proteína de fusão, sistema de rna guia duplo, e, rna guia
AU2020242032A1 (en) * 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
EP4022053A4 (en) * 2019-08-30 2023-05-31 The General Hospital Corporation C-TO-G TRANSVERSION DNA BASE EDITORS
EP4081635A4 (en) * 2019-12-26 2024-03-27 Agency for Science, Technology and Research Nucleobase editors

Also Published As

Publication number Publication date
CA3224970A1 (en) 2023-01-12
WO2023283092A1 (en) 2023-01-12
EP4367227A4 (en) 2025-04-30
EP4367227A1 (en) 2024-05-15
US20240228988A1 (en) 2024-07-11
AU2022306377A1 (en) 2024-01-25

Similar Documents

Publication Publication Date Title
US20240228988A1 (en) Compositions and methods for efficient genome editing
US20240011007A1 (en) Genome editing compositions and methods for treatment of chronic granulomatous disease
US20240067940A1 (en) Methods and compositions for editing nucleotide sequences
US20240360476A1 (en) Genome Editing Compositions and Methods for Treatment of Myotonic Dystrophy
US20240229038A1 (en) Genome editing compositions and methods for treatment of wilson's disease
AU2022283964A1 (en) Genome editing compositions and methods for treatment of wilson's disease
EP4419688A2 (en) Genome editing compositions and methods for treatment of usher syndrome type 3
US20240424138A1 (en) Genome editing compositions and method for treatment of retinitis pigmentosa
EP4437103A2 (en) Modified prime editing guide rnas
US20250011766A1 (en) Genome Editing Compositions and Methods for Treatment of Amyotrophic Lateral Sclerosis
EP4430185A1 (en) Genome editing compositions and methods for treatment of fuchs endothelial corneal dystrophy
EP4504921A2 (en) Methods and compositions for editing nucleotide sequences
WO2024178144A1 (en) Methods and compositions for editing nucleotide sequences
CN117999347A (zh) 用于高效基因组编辑的组合物和方法
WO2025038881A1 (en) Prime editing of single base mutations in sickle cell disease
US20240376466A1 (en) Genome editing compositions and methods for treatment of fanconi anemia
WO2024163680A2 (en) Genome editing compositions and methods for treatment of cystic fibrosis
US20250179483A1 (en) Genome editing compositions and methods for treatment of glycogen storage disease type 1b
US20240352453A1 (en) Genome editing compositions and methods for treatment of retinopathy
WO2024163679A1 (en) Genome editing compositions and methods for treatment of cystic fibrosis
WO2025090637A2 (en) Genome editing compositions and methods for treatment of retinitis pigmentosa

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250627

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250627