[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2022520428A - Enzyme with RUVC domain - Google Patents

Enzyme with RUVC domain Download PDF

Info

Publication number
JP2022520428A
JP2022520428A JP2021547336A JP2021547336A JP2022520428A JP 2022520428 A JP2022520428 A JP 2022520428A JP 2021547336 A JP2021547336 A JP 2021547336A JP 2021547336 A JP2021547336 A JP 2021547336A JP 2022520428 A JP2022520428 A JP 2022520428A
Authority
JP
Japan
Prior art keywords
seq
sequence
endonuclease
nuclease system
engineered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2021547336A
Other languages
Japanese (ja)
Other versions
JPWO2020168291A5 (en
Inventor
トーマス,ブライアン
ブラウン,クリストファー
カンター,ローズ
デヴォート,オードラ
バターフィールド,クリスティーナ
アレクサンダー,リサ
エス.エー. ゴルツマン,ダニエラ
リュー,ジェイソン
Original Assignee
メタゲノミ アイピー テクノロジーズ,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メタゲノミ アイピー テクノロジーズ,エルエルシー filed Critical メタゲノミ アイピー テクノロジーズ,エルエルシー
Publication of JP2022520428A publication Critical patent/JP2022520428A/en
Publication of JPWO2020168291A5 publication Critical patent/JPWO2020168291A5/ja
Priority to JP2023146414A priority Critical patent/JP7502537B2/en
Priority to JP2024091759A priority patent/JP2024133476A/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)

Abstract

【解決手段】本開示は、際立ったドメイン特徴を有するエンドヌクレアーゼ酵素、ならびにそのような酵素またはその変異体を使用する方法を提供する。【選択図】図1The present disclosure provides endonuclease enzymes with distinctive domain characteristics, as well as methods of using such enzymes or variants thereof. [Selection diagram] Fig. 1

Description

相互参照
本出願は、2019年2月14日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,868号、および2019年7月15日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/874,414号、および、2019年2月14日に出願された「MG2 ENZYMES CONTAINING RUVC DOMAINS」と題される米国仮出願第62/805,878号、および2019年2月14日に出願された「MG3 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,899号の利益を主張し、これらの各々は、参照により完全に本明細書に組み込まれる。
Mutual Reference This application is filed in US Provisional Application No. 62 / 805,868 entitled "MG1 ENZYMES WITH RUVC DOMAINS" filed February 14, 2019, and filed July 15, 2019. US Provisional Application No. 62 / 874,414 entitled "MG1 ENZYMES WITH RUVC DOMAINS" and US Provisional Application No. 62 / entitled "MG2 ENZYMES CONTAING RUVC DOMAINS" filed on February 14, 2019. Claim the interests of US Provisional Application Nos. 805, 878, and US Provisional Application No. 62 / 805,899 entitled "MG3 ENZYMES WITH RUVC DOMAINS" filed February 14, 2019, each of which is by reference. Fully incorporated herein.

Cas酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート(CRISPR)ガイドリボ核酸(RNA)とともに、原核生物免疫系に広がる(~45%の細菌、~84%の古細菌)構成成分であり、CRISPR-RNAガイド核酸切断(CRISPR-RNA guided nucleic acid cleavage)によって、感染性ウイルスおよびプラスミドなどの非自己核酸からそのような微生物を保護する役割を果たすように思われる。CRISPR RNAエレメントをコードするデオキシリボ核酸(DNA)エレメントは、構造と長さが比較的保存されている場合があるが、それらのCRISPR関連(Cas)タンパク質は非常に多様であり、種々様々な核酸相互作用ドメインを含有している。CRISPR DNAエレメントは早くとも1987年には観察されていたが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって認識され、多様なDNA操作および遺伝子編集の用途における、組換えCRISPR/Casシステムの使用につながっている。 Cas enzymes spread to the prokaryotic immune system (~ 45% bacteria, ~ 84% paleobacilli), along with their associated clustered and regularly arranged short circular sequence repeat (CRISPR) -guided ribonucleic acid (RNA). ) It is a component and appears to play a role in protecting such microorganisms from non-self-nucleic acids such as infectious viruses and plasmids by CRISPR-RNA guided nucleic acid cleavage. Deoxyribonucleic acid (DNA) elements encoding CRISPR RNA elements may be relatively conserved in structure and length, but their CRISPR-related (Cas) proteins are very diverse and vary from nucleic acid to each other. Contains an action domain. Although the CRISPR DNA element was observed as early as 1987, the programmable endonuclease cleavage capacity of the CRISPR / Cas complex has been recognized relatively recently and has been used in a variety of DNA manipulation and gene editing applications. It has led to the use of recombinant CRISPR / Cas systems.

配列表
本出願は配列表を含んでおり、この配列表はASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる。前記ASCIIのコピーは、2020年2月13日に作成され、55921-703_601_SL.txtというファイル名であり、23,363,113バイトのサイズである。
Sequence Listing This application contains a sequence listing, which is submitted electronically in ASCII format and is incorporated herein by reference in its entirety. A copy of the ASCII was made on February 13, 2020, and 55921-703_601_SL. The file name is txt and the size is 23,363,113 bytes.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼは難培養性微生物(uncultivated microorganism)に由来し、ここで、上記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列とを含む、操作されたガイドリボ核酸構造と、を含む。いくつかの実施形態では、RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む。 In some embodiments, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system is: (a) an endonuclease comprising a RuvC_III domain and an HNH domain, wherein the endonuclease is. Derived from a refractory nucleic acid, where the endonuclease is a class 2 type II Cas endonuclease, and is configured to form a complex with the endonuclease; (b) the endonuclease. The engineered guide ribonucleic acid structure to which the engineered guide ribonucleic acid structure is: (i) with a guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence; (ii) to the endonuclease. Includes an engineered guide ribonucleic acid structure, including a tracr ribonucleic acid sequence configured to bind. In some embodiments, the RuvC_III domain comprises a sequence having at least 70%, at least 75%, at least 80%, or at least 90% sequence identity to any one of SEQ ID NOs: 1827-3637. ..

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、ガイドリボ核酸構造と、を含む。 In some embodiments, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system has at least 75% sequence identity to any one of: (a) SEQ ID NO: 1827-3637. With an endonuclease containing a RuvC_III domain; (b) an engineered guide ribonucleic acid structure configured to form a complex with the endonuclease: (i). Includes a guide ribonucleic acid structure comprising a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence; (ii) a tracr ribonucleic acid sequence configured to bind to the endonuclease.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む。 In some embodiments, the present disclosure provides an engineered nuclease system such that the engineered nuclease system binds to a protospacer flanking motif (PAM) sequence comprising: (a) SEQ ID NO: 5512-5537. Constituted end nucleases, wherein the end nuclease is a class 2 type II Cas end nuclease with an end nuclease; (b) an operation configured to form a complex with the end nuclease. The guided guide ribonucleic acid structure, wherein the engineered guide ribonucleic acid structure is: (i) a guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence; (ii) to bind to the end nuclease. Includes an engineered guide ribonucleic acid structure, including a constructed tracr ribonucleic acid sequence.

いくつかの実施形態では、エンドヌクレアーゼは難培養性微生物に由来する。いくつかの実施形態では、エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する。いくつかの実施形態では、エンドヌクレアーゼはHNHドメインをさらに含む。いくつかの実施形態では、tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。 In some embodiments, endonucleases are derived from refractory microorganisms. In some embodiments, the endonuclease has not been engineered to bind to a different PAM sequence. In some embodiments, the endonucleases are Cas9 endonucleases, Cas14 endonucleases, Cas12a endonucleases, Cas12b endonucleases, Cas12c endonucleases, Cas12d endonucleases, Cas12e endonucleases, Cas13a endonucleases, Cas13b endonucleases, Cas13c endonucleases. , Or Cas13d endonuclease. In some embodiments, the endonuclease has less than 80% identity to the Cas9 endonuclease. In some embodiments, the endonuclease further comprises an HNH domain. In some embodiments, the tracr ribonucleic acid sequence is at least 80% sequence identical to about 60-90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. Includes sex sequences.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは、(a)操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、上記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と;を含む、操作されたガイドリボ核酸構造と、(b)操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される。 In some embodiments, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system is (a) an engineered guide ribonucleic acid structure and the engineered guide ribonucleic acid structure is: (i). ) A guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence; (ii) a tracr ribonucleic acid sequence configured to bind to an endonuclease, wherein the tracr ribonucleic acid sequence is here. With a tracr ribonucleic acid sequence comprising a sequence having at least 80% sequence identity to about 60-90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538; Includes an engineered guide ribonucleic acid structure comprising (b) a class 2 type II Cas endonuclease configured to bind to the engineered guide ribonucleic acid. In some embodiments, the endonuclease is configured to bind to a protospacer flanking motif (PAM) sequence selected from the group comprising SEQ ID NO: 5512-5537.

いくつかの実施形態では、操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列とtracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む。 In some embodiments, the engineered guide ribonucleic acid structure comprises at least two ribonucleic acid polynucleotides. In some embodiments, the engineered guide ribonucleic acid structure comprises one ribonucleic acid polynucleotide comprising a guide ribonucleic acid sequence and a tracr ribonucleic acid sequence.

いくつかの実施形態では、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である。いくつかの実施形態では、ガイドリボ核酸配列は、15~24ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。 In some embodiments, the guideribonucleic acid sequence is complementary to a prokaryotic, bacterial, archaeal, eukaryotic, fungal, plant, mammalian, or human genomic sequence. In some embodiments, the guideribonucleic acid sequence is 15-24 nucleotides in length. In some embodiments, the endonuclease comprises one or more nuclear localization sequences (NLS) located proximal to the N-terminus or C-terminus of the endonuclease. In some embodiments, the NLS comprises a sequence selected from SEQ ID NO: 5597-5612.

いくつかの実施形態では、操作されたヌクレアーゼシステムは、5’から3’に、標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む。いくつかの実施形態では、第1または第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む。 In some embodiments, the engineered nuclease system comprises a first homology arm comprising a sequence of at least 20 nucleotides in 5'of the target deoxyribonucleic acid sequence from 5'to 3'and at least 10 nucleotides. It further comprises a single-stranded or double-stranded DNA repair template comprising a synthetic DNA sequence and a second homology arm comprising a sequence of at least 20 nucleotides in 3'of the target deoxyribonucleic acid sequence. In some embodiments, the first or second homology arm comprises a sequence of at least 40, 80, 120, 150, 200, 300, 500, or 1,000 nucleotides.

いくつかの実施形態では、上記操作されたヌクレアーゼシステムは、Mg2+の供給源(source)をさらに含む。 In some embodiments, the engineered nuclease system further comprises a source of Mg 2+ .

いくつかの実施形態では、エンドヌクレアーゼおよびtracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する。 In some embodiments, the endonuclease and tracr ribonucleic acid sequences are derived from distinct bacterial species within the same phylum. In some embodiments, the endonuclease is derived from a bacterium belonging to the genus Dermabacter. In some embodiments, the endonuclease is derived from a bacterium belonging to the phylum Verrucomicrobiota, the phylum Candidatus Peregrinibacteria, or the phylum Candidatus Melainabacteria. In some embodiments, the endonuclease is derived from a bacterium containing a 16S rRNA gene having at least 90% identity to any one of SEQ ID NOs: 5592-5595.

いくつかの実施形態では、HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-1826またはそれらに対して少なくとも55%の同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the HNH domain comprises a sequence having at least 70% or at least 80% identity to any one of SEQ ID NOs: 5638-5460. In some embodiments, the endonuclease comprises SEQ ID NO: 1-1826 or a variant thereof having at least 55% identity to them. In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1827-1830 or SEQ ID NO: 1827-2140. include.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3638-3461 or SEQ ID NO: 3638-3954. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5615-5632. In some embodiments, the endonuclease is a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1-4 or SEQ ID NO: 1-319. include.

いくつかの実施形態では、ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対以内の非対称バルジを含む。 In some embodiments, the guide RNA structure is at least 70%, 80% relative to a sequence selected from the group consisting of SEQ ID NO: 5461-5464, SEQ ID NO: 5476-5479, or SEQ ID NO: 5476-5489. , Or sequences that are 90% identical. In some embodiments, the guide RNA structure comprises an RNA sequence that is expected to include a hairpin consisting of a stem and a loop, wherein the stem is at least 10, at least 12, or at least 14 base pair ribos. Includes nucleotides and asymmetric bulges within the four base pairs of the loop.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される。 In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5512-5515 or SEQ ID NO: 5527-5530.

いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される。 In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1827; (b) the guide RNA structure is SEQ ID NO: : 5461 or contains a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5476; and (c) the endonuclease is SEQ ID NO: 5512 or SEQ ID NO: 5527. Is configured to bind to a PAM containing. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1828; (b) the guide RNA structure is SEQ ID NO: : 5462 or contains a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5477; and (c) the endonuclease is SEQ ID NO: 5513 or SEQ ID NO: 5528. Is configured to bind to a PAM containing. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1829; (b) the guide RNA structure is SEQ ID NO: : 546 or contains a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5478; and (c) the endonuclease is SEQ ID NO: 5514 or SEQ ID NO: :. It is configured to bind to a PAM containing 5259. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1830; (b) the guide RNA structure is SEQ ID NO: : 5464 or contains a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5479; and (c) the endonuclease is SEQ ID NO: 5515 or SEQ ID NO: :. It is configured to bind to a PAM containing 5530.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される。 In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2141-2142 or SEQ ID NO: 2141-2241. include. In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3955-3965 or SEQ ID NO: 3955-4055. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5632-5638. In some embodiments, the endonuclease is a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 320-321 or SEQ ID NO: 320-420. include. In some embodiments, the guide RNA structure is at least 70%, 80%, or at least 70%, or 80% of a sequence selected from the group consisting of SEQ ID NO: 5465, SEQ ID NO: 5490-5491, or SEQ ID NO: 5490-5494. Contains sequences that are 90% identical. In some embodiments, the guide RNA structure comprises a tracr ribonucleic acid sequence comprising a hairpin containing at least 8, at least 10, or at least 12 base pair ribonucleotides. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5516 and SEQ ID NO: 5531. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2141; (b) the guide RNA structure is SEQ ID NO: 5490. Containing sequences that are at least 70%, 80%, or 90% identical relative to; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5531. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2142; (b) the guide RNA structure is SEQ ID NO: 5465. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5491; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5516.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2245-2246. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4059-4060. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5639-5648. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 424-425. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5498-5499 and SEQ ID NO: 5539. .. In some embodiments, the guide RNA structure is expected to include a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. Includes a sequence, wherein the tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin at 5'to 3'where the first hairpin is more than the second hairpin. Has a long stem.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される。 In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2242-2244 or SEQ ID NO: 2247-2249. include. In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to the sequence selected from the group consisting of SEQ ID NO: 4056-4058 and SEQ ID NO: 4061-4063. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5639-5648. In some embodiments, the endonuclease is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 421-423 or SEQ ID NO: 426-428. include. In some embodiments, the guide RNA structure is at least for a sequence selected from the group consisting of SEQ ID NO: 5466-5467, SEQ ID NO: 5495-5497, SEQ ID NO: 5500-5502, and SEQ ID NO: 5539. Contains sequences that are 70%, 80%, or 90% identical. In some embodiments, the guide RNA structure is expected to include a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. Includes a sequence, wherein the tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin at 5'to 3'where the first hairpin is more than the second hairpin. Has a long stem. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5517-5518 or SEQ ID NO: 5532-5534. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2247; (b) the guide RNA structure is SEQ ID NO: 5500. Containing sequences that are at least 70%, 80%, or 90% identical relative to; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5517 or SEQ ID NO: 5532. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2248; (b) the guide RNA structure is SEQ ID NO: 5501. Containing sequences that are at least 70%, 80%, or 90% identical relative to; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5518 or SEQ ID NO: 5533. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2249; (b) the guide RNA structure is SEQ ID NO: 5502. Containing sequences that are at least 70%, 80%, or 90% identical relative to; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5534.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2253 or SEQ ID NO: 2253-2481. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4067 or SEQ ID NO: 4067-4295. In some embodiments, the endonuclease comprises a peptide motif of SEQ ID NO: 5649. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 432 or SEQ ID NO: 432-660. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5468 or SEQ ID NO: 5503. In some embodiments, the endonuclease is configured to bind to a PAM containing a sequence selected from the group consisting of SEQ ID NO: 5519. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2253; (b) the guide RNA structure is SEQ ID NO: 5468. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5503; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5519.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to the sequence selected from the group consisting of SEQ ID NO: 2482-2489. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to the sequence selected from the group consisting of SEQ ID NO: 4296-4303. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 661-668. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2490-2498. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to the sequence selected from the group consisting of SEQ ID NO: 4304-4212. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 669-677. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to the sequence selected from the group consisting of SEQ ID NO: 5504.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2499 or SEQ ID NO: 2499-2750. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4313 or SEQ ID NO: 4313-4564. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5650-5667. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 678 or SEQ ID NO: 678-929. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2499; (b) the guide RNA structure is SEQ ID NO: 5469. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5505; and (c) the endonuclease binds to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. It is composed.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2751 or SEQ ID NO: 2751-2913. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4565 or SEQ ID NO: 4565-4727. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5668-5678. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 930 or SEQ ID NO: 930-1092. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5521 or SEQ ID NO: 5536. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2751; (b) the guide RNA structure is SEQ ID NO: 5470. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5506; and (c) the endonuclease binds to a PAM comprising SEQ ID NO: 5521 or SEQ ID NO: 5536. It is composed.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2914 or SEQ ID NO: 2914-3174. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4728 or SEQ ID NO: 4728-4988. In some embodiments, the endonuclease comprises at least one, at least two, or at least three peptide motifs selected from the group consisting of SEQ ID NO: 5676-5678. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1093 or SEQ ID NO: 1093-1353. In some embodiments, the guide RNA structure is at least 70%, 80%, or 90% of the sequence selected from the group consisting of SEQ ID NO: 5471, SEQ ID NO: 5507, and SEQ ID NO: 5540-5542. Contains sequences that are identical. In some embodiments, the guide RNA structure comprises a tracr ribonucleic acid sequence that is expected to contain at least two hairpins containing less than five base pair ribonucleotides. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2914; (b) the guide RNA structure is SEQ ID NO: 5471. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5507; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3175 or SEQ ID NO: 3175-3330. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4989 or SEQ ID NO: 4989-5146. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5679-5686. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1354 or SEQ ID NO: 1354-1511. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5472 or SEQ ID NO: 5508. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5523 or SEQ ID NO: 5537. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175; (b) the guide RNA structure is SEQ ID NO: 5472. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5508; and (c) the endonuclease binds to a PAM comprising SEQ ID NO: 5523 or SEQ ID NO: 5537. It is composed.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3331 or SEQ ID NO: 3331-3474. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5147 or SEQ ID NO: 5147-5290. In some embodiments, the endonuclease is at least one, at least two, at least three, at least four, or at least five selected from the group consisting of SEQ ID NO: 5674-5675 and SEQ ID NO: 5687-5693. Contains two peptide motifs. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1512 or SEQ ID NO: 1512-1655. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5473 or SEQ ID NO: 5509. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3331; (b) the guide RNA structure is SEQ ID NO: 5473. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5509; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3475 or SEQ ID NO: 3475-3568. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5291 or SEQ ID NO: 5291-5389. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5694-569. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1656 or SEQ ID NO: 1656-1755. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3475; (b) the guide RNA structure is SEQ ID NO: 5474. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5510; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される。いくつかの実施形態では、配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用して、ならびに条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTP相同性検索アルゴリズムによって決定される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3569 or SEQ ID NO: 3569-3637. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5390 or SEQ ID NO: 5390-5460. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5700-5717. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1756 or SEQ ID NO: 1756-1826. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526. In some embodiments, (a) the endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3569; (b) the guide RNA structure is SEQ ID NO: 5475. Alternatively, it comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5511; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526. In some embodiments, sequence identity is determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, or Smith-Waterman homology search algorithms. In some embodiments, sequence identity uses parameters from the BLASTUM62 scoring matrix that set the gap cost at 3 wordlength (W), 10 extraction (E) parameters, and 11 extensions and 1 extensions. And, as well as using a conditional compositional score matrix adjustment, it is determined by the BLASTP homology search algorithm.

いくつかの態様では、本開示は操作されたガイドリボ核酸ポリヌクレオチドを提供し、上記操作されたガイドリボ核酸ポリヌクレオチドは:(a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含むDNA標的化セグメントと;(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含むタンパク質結合セグメントであって、ここで、上記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、ここで、上記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、上記複合体を標的DNA分子の標的配列に標的化するように構成される。いくつかの実施形態では、DNA標的化セグメントは、ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する。 In some embodiments, the present disclosure provides an engineered guide ribonucleic acid polynucleotide, wherein the engineered guide ribonucleic acid polynucleotide comprises: (a) a DNA target comprising a nucleotide sequence complementary to the target sequence in the target DNA molecule. A protein binding segment comprising two complementary stretches of a nucleotide that hybridizes with a modified segment to form a double-stranded RNA (dsRNA) duplex, wherein the two complements of the above nucleotide. Stretches covalently bind to each other at intervening nucleotides, wherein the engineered guide ribonucleic acid polynucleotide has at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637. It is configured to form a complex with an endonuclease containing the above complex and target the complex to the target sequence of the target DNA molecule. In some embodiments, the DNA targeting segment is located at 5'both of the two complementary stretches of the nucleotide.

いくつかの実施形態では、(a)タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(b)タンパク質結合セグメントは、(配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(c)タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(d)タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(e)タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(f)タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(g)タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(j)タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(k)タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(l)タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;あるいは、(m)タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む。 In some embodiments, (a) the protein binding segment is at least 70%, at least 80%, or at least 90 of the sequence selected from the group consisting of SEQ ID NO: 5476-5479 or SEQ ID NO: 5476-5489. Includes a sequence having% identity; (b) the protein binding segment is at least relative to a sequence selected from the group consisting of (SEQ ID NO: 5490-5491 or SEQ ID NO: 5490-5494) and SEQ ID NO: 5538. Containing sequences with 70%, at least 80%, or at least 90% identity; (c) protein binding segments are at least 70%, at least 70%, at least relative to the sequence selected from the group consisting of SEQ ID NO: 5498-5499. Containing sequences with 80%, or at least 90% identity; (d) the protein binding segment is at least 70 relative to the sequence selected from the group consisting of SEQ ID NO: 5495-5497 and SEQ ID NO: 5500-5502. Containing sequences having%, at least 80%, or at least 90% identity; (e) the protein binding segment has at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5503. Containing the sequence having; (f) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5504; (g) the protein binding segment comprises the sequence. Includes sequences having at least 70%, at least 80%, or at least 90% identity to number: 5505; (h) protein binding segments are at least 70%, at least 80%, to SEQ ID NO: 5506. Or contains a sequence having at least 90% identity; (i) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5507; ( j) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5508; (k) the protein binding segment to SEQ ID NO: 5509. Containing sequences with at least 70%, at least 80%, or at least 90% identity; (l) protein binding segments are at least 70% less than SEQ ID NO: 5510. Both contain sequences having 80%, or at least 90% identity; or (m) the protein binding segment has at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5511. Includes sequences with.

いくつかの実施形態では、(a)ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対内の非対称バルジを含み;(b)ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み;(c)ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有し;あるいは、(d)ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。 In some embodiments, (a) a guide ribonucleic acid polynucleotide comprises an RNA sequence comprising a hairpin comprising a stem and a loop, wherein the stem is at least 10, at least 12, or at least 14 base pairs. Includes ribonucleotides and asymmetric bulges within the four base pairs of the loop; (b) Guided ribonucleic acid polynucleotides are expected to include hairpins containing at least 8, at least 10, or at least 12 base pairs of ribonucleotides. Containing the tracr ribonucleic acid sequence; (c) the guide ribonucleic acid polynucleotide comprises a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. It comprises the expected guide ribonucleic acid sequence, wherein the tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin in 5'to 3', where the first hairpin is the first. It has a stem longer than 2 hairpins; or (d) the guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence that is expected to contain at least 2 hairpins containing ribonucleotides of less than 5 base pairs.

いくつかの態様では、本開示は、本明細書に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードするデオキシリボ核酸ポリヌクレオチドを提供する。 In some embodiments, the present disclosure provides a deoxyribonucleic acid polynucleotide that encodes one of the engineered guide ribonucleic acid polynucleotides described herein.

いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、上記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。 In some embodiments, the present disclosure provides a nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein the nucleic acid is a class 2 comprising a RuvC_III domain and an HNH domain. Encodes the type II Cas endonuclease of, where the class 2 type II Cas endonuclease is derived from a refractory microorganism.

いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。 In some embodiments, the present disclosure provides a nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein the nucleic acid is any one of SEQ ID NOs: 1827-3637. It encodes an endonuclease containing a RuvC_III domain with at least 70% sequence identity to one. In some embodiments, the endonuclease comprises an HNH domain having at least 70% or at least 80% sequence identity to any one of SEQ ID NOs: 3638-5460. In some embodiments, the endonuclease comprises SEQ ID NO: 5571-5591 or a variant thereof having at least 70% sequence identity relative to them. In some embodiments, the endonuclease comprises a sequence encoding one or more nuclear localization sequences (NLS) located proximal to the N-terminus or C-terminus of the endonuclease. In some embodiments, the NLS comprises a sequence selected from SEQ ID NO: 5597-5612.

いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。いくつかの実施形態では、生物は大腸菌であり、および:(a)核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(b)核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(c)核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(d)核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する;(e)核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する;(f)核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する;(g)核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する;(h)核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する;(i)核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(j)核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する。いくつかの実施形態では、生物はヒトであり、および:(a)核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(b)核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する。 In some embodiments, the organism is a prokaryote, bacterium, eukaryote, fungus, plant, mammal, rodent, or human. In some embodiments, the organism is E. coli, and: (a) the nucleic acid sequence is at least 70%, 80%, or 90% of the sequence selected from the group consisting of SEQ ID NO: 5571-5575. Have identity; (b) the nucleic acid sequence has at least 70%, 80%, or 90% identity to the sequence selected from the group consisting of SEQ ID NO: 5576-5571; (c) nucleic acid sequence. Has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5578-5580; (d) Nucleic acid sequence is at least relative to SEQ ID NO: 5581. Has 70%, 80%, or 90% identity; (e) Nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5582; (f) Nucleic acid sequence. Has at least 70%, 80%, or 90% identity to SEQ ID NO: 5583; (g) the nucleic acid sequence is at least 70%, 80%, or 90% to SEQ ID NO: 5584. Have identity; (h) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5585; (i) the nucleic acid sequence has at least 70% to SEQ ID NO: 5586. It has 70%, 80%, or 90% identity; or (j) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5587. In some embodiments, the organism is human and: (a) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5588 or SEQ ID NO: 5589; Alternatively, (b) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5590 or SEQ ID NO: 5591.

いくつかの態様では、本開示は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターを提供し、ここで、上記エンドヌクレアーゼは難培養性微生物に由来する。 In some embodiments, the present disclosure provides a vector comprising a nucleic acid sequence encoding a class 2 type II Cas endonuclease comprising a RuvC_III domain and an HNH domain, wherein the endonuclease is here for refractory microorganisms. Derived from.

いくつかの態様では、本開示は、本明細書に記載される核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、エンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、上記操作されたガイドリボ核酸構造は:(a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(b)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである。 In some embodiments, the present disclosure provides a vector comprising any of the nucleic acids described herein. In some embodiments, the vector further comprises a nucleic acid encoding an engineered guide ribonucleic acid structure configured to form a complex with an endonuclease, wherein the engineered guide ribonucleic acid structure is: (a) target. It comprises a guide ribonucleic acid sequence configured to hybridize to a deoxyribonucleic acid sequence; (b) a tracr ribonucleic acid sequence configured to bind to an endonuclease. In some embodiments, the vector is a plasmid, minicircle, CELiD, adeno-associated virus (AAV) -derived virion, or lentivirus.

いくつかの態様では、本開示は、本明細書に記載されるベクターのいずれかを含む細胞を提供する。 In some embodiments, the present disclosure provides cells comprising any of the vectors described herein.

いくつかの態様では、本開示は、エンドヌクレアーゼを製造する方法を提供し、上記方法は、本明細書に記載される細胞のいずれかを培養する工程を含む。 In some embodiments, the disclosure provides a method of producing an endonuclease, which method comprises culturing any of the cells described herein.

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供し、上記方法は:(a)クラス2のII型Casエンドヌクレアーゼおよび上記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、上記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み;(b)ここで、上記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み;(c)上記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む。いくつかの実施形態では、PAMは、操作されたガイドリボ核酸構造の配列に相補的な配列の3’末端に直接隣接している。 In some embodiments, the present disclosure provides methods for binding, cleaving, labeling, or modifying double-stranded deoxyribonucleic acid polynucleotides, wherein: (a) Class 2 type II Cas endonuclease and The step of contacting the double-stranded deoxyribonucleic acid polynucleotide with a class 2 type II Cas endonuclease that forms a complex with an engineered guide ribonucleic acid structure configured to bind to the double-stranded deoxyribonucleic acid polynucleotide. (B) Here, the double-stranded deoxyribonucleic acid polynucleotide comprises a protospacer flanking motif (PAM); (c) the PAM is from SEQ ID NO: 5512-5526 or SEQ ID NO: 5527-5537. Contains sequences selected from the group of In some embodiments, the double-stranded deoxyribonucleic acid polynucleotide comprises a first strand comprising a sequence complementary to the sequence of the engineered guide ribonucleic acid structure and a second strand comprising PAM. In some embodiments, the PAM is directly flanking the 3'end of a sequence complementary to the sequence of the engineered guide ribonucleic acid structure.

いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。 In some embodiments, class 2 type II Cas endonucleases are Cas9 endonucleases, Cas14 endonucleases, Cas12a endonucleases, Cas12b endonucleases, Cas12c endonucleases, Cas12d endonucleases, Cas12e endonucleases, Cas13a endonucleases, Cas13b. Not an endonuclease, Cas13c endonuclease, or Cas13d endonuclease. In some embodiments, class 2 type II Cas endonucleases are derived from refractory microorganisms. In some embodiments, the double-stranded deoxyribonucleic acid polynucleotide is a double-stranded deoxyribonucleic acid polynucleotide of eukaryote, plant, fungus, mammal, rodent, or human.

いくつかの実施形態では、(a)PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む;(b)PAMは配列番号:5516あるいは配列番号:5531を含む;(c)PAMは配列番号:5539を含む;(d)PAMは配列番号:5517あるいは配列番号:5518を含む;(e)PAMは配列番号:5519を含む;(f)PAMは配列番号:5520あるいは配列番号:5535を含む;(g)PAMは配列番号:5521あるいは配列番号:5536を含む;(h)PAMは配列番号:5522を含む;(i)PAMは配列番号:5523あるいは配列番号:5537を含む;(j)PAMは配列番号:5524を含む;(k)PAMは配列番号:5525を含む;または、(l)PAMは配列番号:5526を含む。 In some embodiments, (a) PAM comprises a sequence selected from the group consisting of SEQ ID NO: 5512-5515 and SEQ ID NO: 5527-5530; (b) PAM comprises SEQ ID NO: 5516 or SEQ ID NO: :. Includes 5531; (c) PAM comprises SEQ ID NO: 5539; (d) PAM comprises SEQ ID NO: 5517 or SEQ ID NO: 5518; (e) PAM comprises SEQ ID NO: 5519; (f) PAM comprises. SEQ ID NO: 5520 or SEQ ID NO: 5535; (g) PAM comprises SEQ ID NO: 5521 or SEQ ID NO: 5536; (h) PAM comprises SEQ ID NO: 5522; (i) PAM comprises SEQ ID NO: 5523. Alternatively, the SEQ ID NO: 5537 is included; (j) PAM comprises SEQ ID NO: 5524; (k) PAM comprises SEQ ID NO: 5525; or (l) PAM comprises SEQ ID NO: 5526.

いくつかの態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供し、上記方法は、本明細書に記載される操作されたヌクレアーゼシステムのいずれかを上記標的核酸遺伝子座に送達する工程を含み、ここで、エンドヌクレアーゼは、操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、上記複合体は、上記複合体が上記標的核酸遺伝子座に結合すると、上記複合体が標的核酸遺伝子座を改変するように構成される。いくつかの実施形態では、標的核酸遺伝子座を改変することは、標的核酸遺伝子座を結合、ニッキング、切断、標識することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座はインビトロである。いくつかの実施形態では、標的核酸遺伝子座は細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。 In some embodiments, the present disclosure provides a method for modifying a target nucleic acid locus, wherein the method incorporates any of the engineered nuclease systems described herein into the target nucleic acid locus. Containing a step of delivery, where the endonuclease is configured to form a complex with the engineered guide ribonucleic acid structure, where the complex is associated with the binding of the complex to the target nucleic acid locus. , The complex is configured to modify the target nucleic acid locus. In some embodiments, modifying the target nucleic acid locus comprises binding, nicking, cleaving, and labeling the target nucleic acid locus. In some embodiments, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). In some embodiments, the target nucleic acid comprises genomic DNA, viral DNA, viral RNA, or bacterial DNA. In some embodiments, the target nucleic acid locus is in vitro. In some embodiments, the target nucleic acid locus is intracellular. In some embodiments, the cell is a prokaryotic cell, a bacterial cell, a eukaryotic cell, a fungal cell, a plant cell, an animal cell, a mammalian cell, a rodent cell, a primate cell, or a human cell.

いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む。いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたmRNA(capped mRNA)を送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす。 In some embodiments, delivering the engineered nuclease system to the target nucleic acid locus delivers the nucleic acid of any of claims 135-140 or the vector of any of claims 142-146. Including doing. In some embodiments, delivering the engineered nuclease system to the target nucleic acid locus comprises delivering a nucleic acid comprising an open reading frame encoding an endonuclease. In some embodiments, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. In some embodiments, the engineered nuclease system to the target nucleic acid locus comprises delivering a capped mRNA containing an open reading frame encoding an endonuclease. In some embodiments, the engineered nuclease system to the target nucleic acid locus comprises delivering the translated polypeptide. In some embodiments, the engineered nuclease system to the target nucleic acid locus is a deoxyribonucleic acid (DNA) that encodes an engineered guide ribonucleic acid structure that is operably linked to the ribonucleic acid (RNA) pol III promoter. Includes delivery. In some embodiments, endonucleases cause single-strand or double-strand breaks at or proximal to the target locus.

本開示のさらなる態様および利点は、以下の詳細な説明から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、説明されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。 Further aspects and advantages of the present disclosure will be readily apparent to those of skill in the art from the detailed description below, wherein only exemplary embodiments of the present disclosure are shown and described. As will be appreciated, this disclosure is possible in other embodiments as well as in different embodiments, the various details of which may be modified in various obvious ways without departing from the present disclosure. can. Therefore, the drawings and descriptions are by nature considered exemplary and not limiting.

参照による組み込み
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が参照によって組み込まれるよう具体的かつ個別に示されるかのように、同じ程度まで参照により本明細書に組み込まれる。
Incorporation by Reference All publications, patents, and patent applications referred to herein are as if the individual publications, patents, or patent applications are specifically and individually indicated to be incorporated by reference. , To the same extent incorporated herein by reference.

本発明の新規な特徴は、とりわけ、添付の特許請求の範囲内に明記される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(”Figure”および”FIG.”)」とも称される)とを参照することによって得られるであろう。 The novel features of the invention are specified, among other things, within the appended claims. A better understanding of the features and advantages of the invention is the following detailed description illustrating exemplary embodiments in which the principles of the invention are used and the following accompanying drawings (in the present specification, "Figure" and ". It will be obtained by referring to FIG. ")").

様々なクラスおよび型のCRISPR/Cas遺伝子座の典型的な組織を示す。Shows typical tissues of CRISPR / Cas loci of various classes and types. 両方が結合されるハイブリッドsgRNAと比較した、天然のクラス2/II型crRNA/tracrRNAペアの構造を示す。Shown is the structure of a native Class 2 / II type crRNA / tracrRNA pair compared to a hybrid sgRNA to which both are bound. MG1ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the composition of the CRISPR locus encoding an enzyme from the MG1 family is shown. MG2ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the composition of the CRISPR locus encoding an enzyme from the MG2 family is shown. MG3ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the composition of the CRISPR locus encoding an enzyme from the MG3 family is shown. 黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG1-1)の酵素の構造に基づいたアラインメントを示す。An alignment based on the structure of the enzyme of the present disclosure (MG1-1) with respect to Cas9 (SEQ ID NO: 5613) from Staphylococcus aureus is shown. 黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG2-1)の酵素の構造に基づいたアラインメントを示す。An alignment based on the structure of the enzyme of the present disclosure (MG2-1) with respect to Cas9 (SEQ ID NO: 5613) from Staphylococcus aureus is shown. Actinomyces naeslundiiからのCas9(配列番号:5614)に対する、本開示(MG3-1)の酵素の構造に基づいたアラインメントを示す。The alignment based on the structure of the enzyme of the present disclosure (MG3-1) with respect to Cas9 (SEQ ID NO: 5614) from Actinomyces naeslundii is shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Alignments based on the structure of the MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3) are shown. 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG1-4による、DNAのインビトロ切断を示す。In vitro cleavage of DNA by MG1-4 complexing with its corresponding sgRNA containing targeting sequences of various lengths is shown. MG1-4とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG1-4で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。A cell cleavage of E. coli genomic DNA using MG1-4 and its corresponding sgRNA is shown. Diluted sequences of MG1-4 transformed cells with targeted or non-targeted spacers are shown (top); lower panel shows quantified data, left bar represents non-targeted sgRNA, right bar Represents the target sgRNA. ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例11に記載されるMG1-4またはMG1-6の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。HEK cells using the MG1-4 or MG1-6 constructs described in Example 11 with their corresponding sgRNAs containing various different targeting sequences targeting different locations in the human genome. It shows the cell indel formation produced by transfection. 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG3-6によるDNAのビトロ切断を示す。Vitro cleavage of DNA by MG3-6 forming a complex with its corresponding sgRNA containing targeting sequences of various lengths is shown. MG3-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG3-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。A cell cleavage of E. coli genomic DNA using MG3-7 and its corresponding sgRNA is shown. Diluted sequences of MG3-7 transformed cells with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, left bar represents non-targeted sgRNA, right bar Represents the target sgRNA. ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例13に記載されるMG3-7の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。Generated by transfection of HEK cells with the MG3-7 construct described in Example 13 together with their corresponding sgRNAs containing various different targeting sequences targeting different positions in the human genome. Shows cell indel formation. 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG15-1によるDNAのインビトロ切断を示す。In vitro cleavage of DNA by MG15-1, which forms a complex with its corresponding sgRNA containing targeting sequences of various lengths, is shown. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Shown is an agarose gel showing the results of cleavage of the PAM vector library in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Shown is an agarose gel showing the results of cleavage of the PAM vector library in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Shown is an agarose gel showing the results of cleavage of the PAM vector library in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Shown is an agarose gel showing the results of cleavage of the PAM vector library in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。The expected structure of the corresponding sgRNA of the MG enzyme described herein (eg, as in Example 7) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。The seqLogo representation of the PAM sequence derived via NGS described herein (eg, described in Example 6) is shown. MG2-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG2-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。A cell cleavage of E. coli genomic DNA using MG2-7 and its corresponding sgRNA is shown. Diluted sequences of MG2-7 transformed cells with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, right bar represents non-targeted sgRNA, left bar Represents the target sgRNA. MG14-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG14-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。A cell cleavage of E. coli genomic DNA using MG14-1 and its corresponding sgRNA is shown. The dilution series of cells transformed with MG14-1 with the target spacer or non-target spacer is shown (top); the lower panel shows the quantified data, the right bar represents the non-target sgRNA, and the left bar shows. Represents the target sgRNA. MG15-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG15-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。A cell cleavage of E. coli genomic DNA using MG15-1 and its corresponding sgRNA is shown. Diluted sequences of MG15-1 transformed cells with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, right bar represents non-targeted sgRNA, left bar Represents the target sgRNA.

配列表の簡単な説明
本明細書とともに出願された配列表は、本開示の方法、組成物、およびシステムで使用される例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は配列表における配列の例示的な説明である。
Brief Description of Sequence Listing The sequence listing, filed with this specification, provides exemplary polynucleotide and polypeptide sequences used in the methods, compositions, and systems of the present disclosure. The following is an exemplary description of the sequences in the sequence listing.

MG1 MG1

配列番号:1-319は、MG1ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1-319 show the full length peptide sequence of MG1 nuclease.

配列番号:1827-2140は、上記のMG1ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 1827-2140 shows the peptide sequence of the RuvC_III domain of the above MG1 nuclease.

配列番号:3638-3955は、上記のMG1ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 3638-3955 represent peptides in the HNH domain of the above MG1 nuclease.

配列番号:5476-5479は、上記のMG1ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:1-4と同じ遺伝子座)に由来するMG1 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5476-5479 represents the nucleotide sequence of MG1 tracrRNA derived from the same locus as MG1 nuclease above (eg, the same locus as SEQ ID NO: 1-4, respectively).

配列番号:5461-5464は、MG1ヌクレアーゼ(例えば、それぞれ配列番号:1-4)と機能するように操作されたsgRNAのヌクレオチド配列を示し、ここで、Nsは標的化配列のヌクレオチドを表示する。 SEQ ID NO: 5461-5464 represent the nucleotide sequence of the sgRNA engineered to function with the MG1 nuclease (eg, SEQ ID NO: 1-4, respectively), where Ns represents the nucleotide of the targeting sequence.

配列番号:5572-5575は、MG1ファミリー酵素(配列番号:1-4)の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5571-5575 represents the nucleotide sequence of the E. coli codon-optimized coding sequence of the MG1 family enzyme (SEQ ID NO: 1-4).

配列番号:5588-5589は、MG1ファミリー酵素(配列番号:1および3)のヒトのコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5588-5589 represent the nucleotide sequence of the human codon-optimized coding sequence for the MG1 family of enzymes (SEQ ID NOs: 1 and 3).

配列番号:5616-5632は、MG1ファミリー酵素のペプチドモチーフ特性を示す。 SEQ ID NO: 5616-5632 show the peptide motif properties of the MG1 family of enzymes.

MG2 MG2

配列番号:320-420は、MG2ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 320-420 shows the full length peptide sequence of MG2 nuclease.

配列番号:2141-2241は、上記のMG2ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2141-2241 shows the peptide sequence of the RuvC_III domain of the above MG2 nuclease.

配列番号:3955-4055は、上記のMG2ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 3955-4055 represent peptides in the HNH domain of the above MG2 nuclease.

配列番号:5490-5494は、上記のMG2ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:320、321、323、325、および326と同じ遺伝子座)に由来するMG2 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5490-5494 represents the nucleotide sequence of MG2 tracrRNA derived from the same locus as MG2 nuclease above (eg, the same locus as SEQ ID NOs: 320, 321, 323, 325, and 326, respectively).

配列番号:5465は、MG2ヌクレアーゼ(例えば、上記の配列番号:321)と機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5465 represents the nucleotide sequence of the sgRNA engineered to function with the MG2 nuclease (eg, SEQ ID NO: 321 above).

配列番号:5572-5575は、MG2ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5571-5575 represents the nucleotide sequence of the E. coli codon-optimized coding sequence of the MG2 family of enzymes.

配列番号:5631-5638は、MG2ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5631-5638 show peptide sequence characteristics of MG2 family enzymes.

MG3 MG3

配列番号:421-431は、MG3ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 421-431 shows the full length peptide sequence of MG3 nuclease.

配列番号:2242-2251は、上記のMG3ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2242-2251 shows the peptide sequence of the RuvC_III domain of the above MG3 nuclease.

配列番号:4056-4066は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4056-4066 represent peptides in the HNH domain of the MG3 nuclease above.

配列番号:5495-5502は、上記のMG3ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:421-428と同じ遺伝子座)に由来するMG3 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5495-5502 shows the nucleotide sequence of MG3 tracrRNA derived from the same locus as the above MG3 nuclease (eg, the same locus as SEQ ID NO: 421-428, respectively).

配列番号:5466-5467は、MG3ヌクレアーゼ(例えば、配列番号:421-423)と機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5466-5467 represents the nucleotide sequence of the sgRNA engineered to function with the MG3 nuclease (eg, SEQ ID NO: 421-423).

配列番号:5578-5580は、MG3ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5578-5580 show the nucleotide sequence of the E. coli codon-optimized coding sequence of the MG3 family of enzymes.

配列番号:5639-5648は、MG3ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5639-5648 show peptide sequence characteristics of MG3 family enzymes.

MG4 MG4

配列番号:432-660は、MG4ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 432-660 shows the full-length peptide sequence of MG4 nuclease.

配列番号:2253-2481は、上記のMG4ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2253-2481 shows the peptide sequence of the RuvC_III domain of the above MG4 nuclease.

配列番号:4067-4295は、上記のMG4ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4067-4295 represents the peptide in the HNH domain of the above MG4 nuclease.

配列番号:5503は、上記のMG4ヌクレアーゼと同じ遺伝子座に由来するMG4 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5503 shows the nucleotide sequence of MG4 tracrRNA derived from the same locus as the above MG4 nuclease.

配列番号:5468は、MG4ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5468 represent the nucleotide sequence of the sgRNA engineered to function with the MG4 nuclease.

配列番号:5649は、MG4ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5649 shows peptide sequence characteristics of MG4 family enzymes.

MG6 MG6

配列番号:661-668は、MG6ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 661-668 show the full length peptide sequence of MG6 nuclease.

配列番号:2482-2489は、上記のMG6ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2482-2489 shows the peptide sequence of the RuvC_III domain of the above MG6 nuclease.

配列番号:4296-4303は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4296-4303 represent peptides in the HNH domain of the above MG3 nuclease.

MG7 MG7

配列番号:669-677は、MG7ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 669-677 show the full length peptide sequence of MG7 nuclease.

配列番号:2490-2498は、上記のMG7ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2490-2498 represent the peptide sequence of the RuvC_III domain of the MG7 nuclease above.

配列番号:4304-4312は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4304-4212 shows the peptide of the HNH domain of the above MG3 nuclease.

配列番号:5504は、上記のMG7ヌクレアーゼと同じ遺伝子座に由来するMG7 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5504 shows the nucleotide sequence of MG7 tracrRNA derived from the same locus as MG7 nuclease above.

MG14配列番号:678-929は、MG14ヌクレアーゼの完全長ペプチド配列を示す。 MG14 SEQ ID NO: 678-929 shows the full length peptide sequence of MG14 nuclease.

配列番号:2499-2750は、上記のMG14ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2499-2750 shows the peptide sequence of the RuvC_III domain of the above MG14 nuclease.

配列番号:4313-4564は、上記のMG14ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4313-4564 represent peptides in the HNH domain of the above MG14 nuclease.

配列番号:5505は、上記のMG14ヌクレアーゼと同じ遺伝子座に由来するMG14 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5505 shows the nucleotide sequence of MG14 tracrRNA derived from the same locus as the above MG14 nuclease.

配列番号:5581は、MG14ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5581 shows the nucleotide sequence of the codon-optimized coding sequence of E. coli of the MG14 family of enzymes.

配列番号:5650-5667は、MG14ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5650-5667 show peptide sequence characteristics of MG14 family enzymes.

MG15 MG15

配列番号:930-1092は、MG15ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 930-1092 shows the full-length peptide sequence of MG15 nuclease.

配列番号:2751-2913は、上記のMG15ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2751-2913 show the peptide sequence of the RuvC_III domain of the above MG15 nuclease.

配列番号:4565-4727は、上記のMG15ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4565-4727 represents the peptide of the HNH domain of the above MG15 nuclease.

配列番号:5506は、上記のMG15ヌクレアーゼと同じ遺伝子座に由来するMG15 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5506 represents the nucleotide sequence of MG15 tracrRNA derived from the same locus as the MG15 nuclease above.

配列番号:5470は、MG15ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5470 represents the nucleotide sequence of the sgRNA engineered to function with the MG15 nuclease.

配列番号:5582は、MG15ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5582 show the nucleotide sequence of the E. coli codon-optimized coding sequence of the MG15 family of enzymes.

配列番号:5668-5675は、MG15ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5668-5675 shows the peptide sequence characteristics of MG15 family enzymes.

MG16 MG16

配列番号:1093-1353は、MG16ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1093-1353 show the full length peptide sequence of MG16 nuclease.

配列番号:2914-3174は、上記のMG16ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2914-3174 shows the peptide sequence of the RuvC_III domain of the above MG16 nuclease.

配列番号:4728-4988は、上記のMG16ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4728-4988 represent peptides in the HNH domain of the above MG16 nuclease.

配列番号:5507は、上記のMG3ヌクレアーゼと同じ遺伝子座に由来するMG16 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5507 shows the nucleotide sequence of MG16 tracrRNA derived from the same locus as the MG3 nuclease above.

配列番号:5471は、MG16ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5471 represents the nucleotide sequence of the sgRNA engineered to function with the MG16 nuclease.

配列番号:5583は、MG16ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5583 shows the nucleotide sequence of the codon-optimized coding sequence of E. coli of the MG16 family of enzymes.

配列番号:5676-5678は、MG16ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5676-5678 show the peptide sequence characteristics of MG16 family enzymes.

MG18 MG18

配列番号:1354-1511は、MG18ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1354-1511 shows the full length peptide sequence of MG18 nuclease.

配列番号:3175-3330は、上記のMG18ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3175-3330 shows the peptide sequence of the RuvC_III domain of the above MG18 nuclease.

配列番号:4989-5146は、上記のMG18ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4989-5146 represent peptides in the HNH domain of the above MG18 nuclease.

配列番号:5508は、上記のMG18ヌクレアーゼと同じ遺伝子座に由来するMG18 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5508 shows the nucleotide sequence of MG18 tracrRNA derived from the same locus as the above MG18 nuclease.

配列番号:5472は、MG18ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5472 represents the nucleotide sequence of the sgRNA engineered to function with the MG18 nuclease.

配列番号:5584は、MG18ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5584 shows the nucleotide sequence of the codon-optimized coding sequence of E. coli of the MG18 family of enzymes.

配列番号:5679-5686は、MG18ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5679-5686 show peptide sequence characteristics of MG18 family enzymes.

MG21 MG21

配列番号:1512-1655は、MG21ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1512-1655 show the full length peptide sequence of MG21 nuclease.

配列番号:3331-3474は、上記のMG21ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3331-3474 shows the peptide sequence of the RuvC_III domain of the above MG21 nuclease.

配列番号:5147-5290は、上記のMG21ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 5147-5290 represent peptides in the HNH domain of the above MG21 nuclease.

配列番号:5509は、上記のMG21ヌクレアーゼと同じ遺伝子座に由来するMG21 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5509 shows the nucleotide sequence of MG21 tracrRNA derived from the same locus as the above MG21 nuclease.

配列番号:5473は、MG21ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5473 represents the nucleotide sequence of the sgRNA engineered to function with the MG21 nuclease.

配列番号:5585は、MG21ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5585 shows the nucleotide sequence of the codon-optimized coding sequence of E. coli of the MG21 family of enzymes.

配列番号:5687-5692および5674-5675は、MG21ファミリー酵素のペプチド配列特性を示す。 SEQ ID NOs: 5687-5692 and 5674-5675 show peptide sequence characteristics of MG21 family enzymes.

MG22 MG22

配列番号:1656-1755は、MG22ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1656-1755 shows the full length peptide sequence of MG22 nuclease.

配列番号:3475-3568は、上記のMG22ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3475-3568 show the peptide sequence of the RuvC_III domain of the above MG22 nuclease.

配列番号:5291-5389は、上記のMG22ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 5291-5389 represent peptides in the HNH domain of the above MG22 nuclease.

配列番号:5510は、上記のMG22ヌクレアーゼと同じ遺伝子座に由来するMG22 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5510 shows the nucleotide sequence of MG22 tracrRNA derived from the same locus as the above MG22 nuclease.

配列番号:5474は、MG22ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5474 represents the nucleotide sequence of the sgRNA engineered to function with the MG22 nuclease.

配列番号:5586は、MG22ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5586 shows the nucleotide sequence of the E. coli codon-optimized coding sequence of the MG22 family of enzymes.

配列番号:5694-5699は、MG22ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5694-5699 show the peptide sequence characteristics of the MG22 family of enzymes.

MG23 MG23

配列番号:1756-1826は、MG23ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1756-1826 shows the full length peptide sequence of MG23 nuclease.

配列番号:3569-3637は、上記のMG23ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3569-3637 shows the peptide sequence of the RuvC_III domain of the above MG23 nuclease.

配列番号:5390-5460は、上記のMG23ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 5390-5460 represent peptides in the HNH domain of the above MG23 nuclease.

配列番号:5511は、上記のMG23ヌクレアーゼと同じ遺伝子座に由来するMG23 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5511 shows the nucleotide sequence of MG23 tracrRNA derived from the same locus as the above MG23 nuclease.

配列番号:5475は、MG23ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5475 represents the nucleotide sequence of the sgRNA engineered to function with the MG23 nuclease.

配列番号:5587は、MG23ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5587 shows the nucleotide sequence of the codon-optimized coding sequence of E. coli of the MG23 family of enzymes.

配列番号:5700-5717は、MG23ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5700-5717 show the peptide sequence characteristics of the MG23 family of enzymes.

本発明の様々な実施形態が本明細書中で示され、かつ説明されているが、このような実施形態はほんの一例として提供されるものであることは、当業者には明らかであろう。多数の変形、変更、および置き換えは、本発明から逸脱することなく、当業者によって想到され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。 Although various embodiments of the invention are shown and described herein, it will be apparent to those skilled in the art that such embodiments are provided by way of example only. Numerous modifications, modifications, and replacements can be conceived by one of ordinary skill in the art without departing from the present invention. It should be understood that various alternatives of the embodiments of the invention described herein may be utilized.

本明細書で開示されるいくつかの方法の実施は、特段の定めのない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの技術を利用する。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010)))(これらは、参照によりその全体が本明細書に組み込まれる)。 Implementations of some of the methods disclosed herein include immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA techniques, unless otherwise specified. Use. For example, Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular System (F. ), PCR 2: A Practical Aproch (MJ MacPherson, BD Hames and GR Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications (see R. Freshney, 20th Incorporated in the statement).

本明細書で使用されるように、単数形「1つ(a)」、「1つ(an)」、および「その(the)」は、文脈上他の意味を明白に示すものでない限り、同様に複数形を含むことを意図している。さらに、用語「含んでいる(including)」、「含む(includes)」、「有している(having)」、「有する(has)」、「含んだ(with)」、または、その変異形態が詳細な記載および/または請求項のいずれかで使用される程度には、上記のような用語は「含んでいる(comprising)」との用語に類似する手法で包括的であることを意図している。 As used herein, the singular forms "one (a)", "one (an)", and "the" unless the context clearly indicates other meanings. It is also intended to include the plural. In addition, the terms "inclusion", "includes", "having", "has", "with", or variants thereof. To the extent used in any of the details and / or claims, such terms are intended to be inclusive in a manner similar to the term "comprising". There is.

「約」または「およそ」との用語は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、その誤差範囲は、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存する。例えば、「約」とは、当該技術分野での実践につき1または1を超える標準偏差を意味し得る。代替的に、「約」は、任意の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味する場合がある。 The term "about" or "approximately" means that a particular value is within the permissible margin of error as determined by one of ordinary skill in the art, and that error range is how the value is measured or measured. It is determined, that is, it depends in part on the limitations of the measurement system. For example, "about" can mean a standard deviation of 1 or more than 1 per practice in the art. Alternatively, "about" may mean a range of up to 20%, up to 15%, up to 10%, up to 5%, or up to 1% of any value.

本明細書で使用されるように、「細胞」とは一般に、生体細胞を指す。細胞は、生体の基本構造単位、機能単位、および/または生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に起源を持つ場合がある。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原生動物細胞、植物の細胞(例えば、作物、果物、野菜、穀類、ダイズ、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、アサ、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ類、ツノゴケ類、苔類、蘚類の細胞)、藻細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardti、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens C.Agardhなど)、海草(例えば、ケルプ)、真菌細胞(例えば、酵母菌細胞、キノコからの細胞)、動物細胞、無脊髄動物(例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など)の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥、哺乳動物)の細胞、哺乳動物(例えば、ブタ、雌ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)の細胞などが挙げられる。細胞は、天然の生物に起源を持たないこともある(例えば、細胞は合成的に作られ、人工細胞と呼ばれることもある)。 As used herein, "cell" generally refers to a living cell. A cell can be a basic structural unit, a functional unit, and / or a biological unit of an organism. Cells may originate from any organism that has one or more cells. Some non-limiting examples are prokaryotic cells, eukaryotic cells, bacterial cells, paleobacterial cells, single-cell eukaryotic cells, protozoan cells, plant cells (eg, crops, fruits, vegetables). , Grain, soybean, corn, corn, corn, wheat, seed, tomato, rice, cassaba, sugar cane, pumpkin, hay, potato, cotton, asa, tobacco, flowering plant, conifer, nude plant, fern, Hikagenokazura, Tsunogoke, Moss, 蘚 cells), Algae cells (eg, Botryococcus braunii, Chlamydomonas reinhardti, Nannochlopsis gaditana, Chlorella pyre), etc. , Yeast cells, cells from mushrooms), animal cells, spinal cord animals (eg, gypsum flies, spores, thorns, nematodes, etc.), vertebrates (eg, fish, amphibians, reptiles, birds, mammals, etc.) Examples include cells of animals), cells of mammals (eg, pigs, cows, goats, sheep, rodents, rats, mice, non-human primates, humans, etc.). Cells may not have their origin in natural organisms (eg, cells are synthetically produced and are sometimes called artificial cells).

「ヌクレオチド」との用語は、本明細書で使用されるように、一般に、塩基-糖-リン酸塩の組み合わせを指す。ヌクレオチドは合成ヌクレオチドを含むことがある。ヌクレオチドは合成ヌクレオチドアナログを含むことがある。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))の単量体単位である場合がある。ヌクレオチドとの用語には、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)、およびデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、またはそれらの誘導体が含まれ得る。そのような誘導体は、例えば、[αS]dATP、7-デアザ-dGTPおよび7-デアザ-dATP、および、それらを含有する核酸分子にヌクレアーゼ耐性を与えるヌクレオチド誘導体を含む場合がある。ヌクレオチドとの用語は、本明細書に使用されるように、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されないが、ddATP、ddCTP、ddGTP、ddITP、およびddTTPが挙げられ得る。ヌクレオチドは標識されない場合があるか、または、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなどして、検出できるように標識される場合がある。標識化はまた、量子ドットを用いて実施されてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、および酵素標識が挙げられ得る。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、5-カルボキシフルオセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’,N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、Cascade Blue、Oregon Green、Texas Red、シアニン、および5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)が挙げられ得る。蛍光標識されたヌクレオチドの特定の例としては、Perkin Elmer(Foster City,Calif)から利用可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham(Arlington Heights,Ill)から利用可能なFluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、およびFluoroLink Cy5-dUTP;Boehringer Mannheim(Indianapolis,Ind.)から利用可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-rodamine-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2’-dATP;および、Molecular Probes(Eugene,Oreg)から利用可能なChromosome Labeled Nucleotides、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-UTP、Cascade Blue-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、Oregon Green 488-5-dUTP、ローダミン Green-5-UTP、ローダミン Green-5-dUTP、テトラメチルローダミン6-UTP、テトラメチルローダミン6-dUTP、Texas Red-5-UTP、Texas Red-5-dUTP、およびTexas Red-12-dUTPが挙げられ得る。ヌクレオチドも化学修飾によって標識(labeled)または標識(marked)され得る。化学的に修飾された単一ヌクレオチドはビオチンdNTPである場合がある。ビオチン化されたdNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、bio-N6-ddATP、biotin-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられ得る。 The term "nucleotide", as used herein, generally refers to a base-sugar-phosphate combination. Nucleotides may include synthetic nucleotides. Nucleotides may include synthetic nucleotide analogs. Nucleotides can be monomeric units of nucleic acid sequences (eg, deoxyribonucleic acid (DNA) and ribonucleic acid (RNA)). The term nucleotide includes ribonucleoside triphosphate adenosine triphosphate (ATP), uridine triphosphate (UTP), cytosine triphosphate (CTP), guanosine triphosphate (GTP), and deoxyribonucleoside triphosphate. For example, dATP, dCTP, dITP, dUTP, dGTP, dTTP, or derivatives thereof may be included. Such derivatives may include, for example, [αS] dATP, 7-deaza-dGTP and 7-deaza-dATP, and nucleotide derivatives that confer nuclease resistance on nucleic acid molecules containing them. The term nucleotide can refer to dideoxyribonucleoside triphosphate (ddNTP) and its derivatives, as used herein. Exemplary examples of dideoxyribonucleoside triphosphates include, but are not limited to, ddATP, ddCTP, ddGTP, ddITP, and ddTTP. Nucleotides may be unlabeled or labeled for detection, such as by using moieties that contain optically detectable moieties (eg, fluorophores). Labeling may also be performed using quantum dots. Detectable labels may include, for example, radioisotopes, fluorescent labels, chemiluminescent labels, bioluminescent labels, and enzyme labels. Fluorescent labels for nucleotides include, but are not limited to, fluorescein, 5-carboxyfluorescein (FAM), 2'7'-dimethoxy-4'5-dichloro-6-carboxyfluorosein (JOE), rhodamine, 6-carboxyrhodamine. (R6G), N, N, N', N'-Tetramethyl-6-Rhodamine (TAMRA), 6-carboxy-X-Rhodamine (ROX), 4- (4'dimethylaminophenylazo) benzoic acid (DABCYL) ), Cascade Blue, Fluorescein, Texas Red, cyanine, and 5- (2'-aminoethyl) aminonaphthalene-1-sulfonic acid (EDANS). Specific examples of fluorescently labeled nucleotides include [R6G] dUTP, [TAMRA] dUTP, [R110] dCTP, [R6G] dCTP, [TAMRA] dCTP, available from Perkin Elmer (Foster City, Calif). JOE] ddATP, [R6G] ddATP, [FAM] ddCTP, [R110] ddCTP, [TAMRA] ddGTP, [ROX] ddTTP, [dR6G] ddATP, [dR110] ddCTP, [dTAMRA] ddGTP, and [dROX] d Amersham (Arlington Heights, Ill) available from a FluoroLink DeoxyNucleotides, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink Fluor X-dCTP, FluoroLink Cy3-dUTP, and FluoroLink Cy5-dUTP; Boehringer Mannheim (Indianapolis, Ind.) from Available fluorescein-15-dATP, fluorescein-12-dUTP, tetramethyl-rodamine-6-dUTP, IR770-9-dATP, fluorescein-12-ddUTP, fluorescein-12-UTP, and fluorescein-15-2'- dATP; and Chromosome Labeled Nucleotidines, BODICY-FL-14-UTP, BODICY-FL-4-UTP, BODICY-TMR-14-UTP, BODICY-TM available from Molecular Probes (Eugene, Oreg). , BODICY-TR-14-UTP, BODICY-TR-14-dUTP, Cascade Blue-7-UTP, Cascade Blue-7-dUTP, Fluolecein-12-UTP, Fluolecein-12-dUTP, Oregon Green 488-5-dUTP , Rhodamine Green-5-UTP, Rhodamine Green-5-dUTP, Tetramethyl Rhodamine 6-UTP, Tetramethyl Rhodamine 6-dUTP, Texas Red-5-UTP, Texas Red-5-dUTP, and Texas Red-12-dUTP. Listed Can be. Nucleotides can also be labeled or marked by chemical modification. The single chemically modified nucleotide may be biotin dNTP. Some non-limiting examples of biotinylated dNTPs include bio-dATP (eg, bio-N6-ddATP, biotin-14-dATP), biotin-dCTP (eg, biotin-11-dCTP, biotin-). 14-dCTP), and biotin-dUTP (eg, biotin-11-dUTP, biotin-16-dUTP, biotin-20-dUTP) can be mentioned.

「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」との用語は、一般に、一本鎖、二本鎖、あるいは多重鎖(multi-stranded)の形態のいずれかの、任意の長さのヌクレオチドの高分子形態((デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか)、またはそのアナログを指すために交換可能に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であり得る。ポリヌクレオチドは、無細胞環境に存在することがある。ポリヌクレオチドは、遺伝子またはその断片であることがある。ポリヌクレオチドはDNAであることがある。ポリヌクレオチドはRNAであることがある。ポリヌクレオチドは、任意の三次元構造も有していてもよく、任意の機能を実施してもよい。ポリヌクレオチドは、1つ以上のアナログ(例えば、改変された骨格、糖、または核酸塩基)を含むことがある。存在する場合、ヌクレオチド構造に対する改変は、ポリマーのアセンブリの前または後で与えられ得る。アナログのいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、xeno核酸、モルフォリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミンまたはフルオレセイン)、ヌクレオチドを含有するチオール、ビオチン結合ヌクレオチド、蛍光塩基アナログ(fluorescent base analogs)、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン(pseudourdine)、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子あるいは遺伝子断片のコード領域あるいは非コード領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、無細胞DNA(cfDNA)を含む無細胞のポリヌクレオチド、および無細胞RNA(cfRNA)、核酸プローブ、およびプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成要素によって中断される場合がある。 The terms "polynucleotide", "oligonucleotide", and "nucleic acid" generally refer to nucleotides of any length, either in the form of single-stranded, double-stranded, or multi-stranded. Used interchangeably to refer to the high molecular weight form of (either deoxyribonucleotide or ribonucleotide), or its analogs. Polynucleotides can be exogenous or endogenous to cells. The polynucleotide may be a gene or fragment thereof. The polynucleotide may be DNA. The polynucleotide may be RNA. The polynucleotide may be optional. It may also have a three-dimensional structure of, and may perform any function. A polynucleotide may contain one or more analogs (eg, a modified skeleton, sugar, or nucleobase). Modifications to the nucleotide structure, if present, can be given before or after assembly of the polymer. Some non-limiting examples of analogs are 5-bromouracil, peptide nucleic acid, xeno nucleic acid, morpholino, locked. Nucleic Acids, Glycol Nucleic Acids, Treose Nucleic Acids, Dideoxynucleotides, Cordisepines, 7-Daza-GTP, Fluorophores (eg, Sugar-Binding Rhodamine or Fluolecein), Nucleotide-Containing Thiols, Biotin-Binding Nucleotides, Fluorescent Base Analogs ), CpG islands, methyl-7-guanosine, methylated nucleotides, inosin, thiouridine, pseudourdine, dihydrouridine, cuosin, and wyosine. Non-limiting examples of polynucleotides include genes or genes. Coding or non-coding regions of the fragment, nucleotides defined from linkage analysis, exons, introns, messenger RNAs (mRNAs), translocated RNAs (tRNAs), ribosome RNAs (rRNAs), small interfering RNAs (siRNAs), small molecules Hairpin-type RNA (shRNA), microRNA (miRNA), ribozyme, cDNA, recombinant polynucleotide, branched polynucleotide, plasmid, vector, isolated DNA of any sequence, isolated RNA of any sequence, Cell-free polynucleoti containing cell-free DNA (cfDNA) And cell-free RNA (cfRNA), nucleic acid probes, and primers. The sequence of nucleotides may be interrupted by non-nucleotide components.

「トランスフェクション」または「トランスフェクトされた」との用語は、一般に、非ウイルスベースの方法あるいはウイルスベースの方法によって、核酸を細胞内に導入することを指す。核酸分子は、完全タンパク質あるいはその機能性部分をコードする遺伝子配列であり得る。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88を参照されたい。 The term "transfected" or "transfected" generally refers to the introduction of nucleic acid into a cell by a non-virus-based method or a virus-based method. A nucleic acid molecule can be a complete protein or a gene sequence encoding a functional portion thereof. For example, Sambrook et al. , 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88.

「ペプチド」、「ポリペプチド」、および「タンパク質」との用語は、一般に、ペプチド結合によって結合された少なくとも2つのアミノ酸残基のポリマーを指すために、本明細書において交換可能に使用される。この用語は、ポリマーの特定の長さを暗示せず、また、ペプチドが組換え技術、化学的合成あるいは酵素的合成を使用して産生されるか、または天然に存在するかを暗示または識別することを意図しない。この用語は、天然に存在するアミノ酸ポリマー、ならびに、少なくとも1つの修飾されたアミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーが非アミノ酸によって中断される場合がある。この用語には、完全長のタンパク質を含む任意の長さのアミノ酸鎖、ならびに、2次構造および/または3次構造(例えば、ドメイン)を有するまたは有していないタンパク質が含まれる。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および他の操作、例えば、標識化成分とのコンジュゲートによって修飾されたアミノ酸ポリマーを包含する。「アミノ酸」との用語は、本明細書で使用されるように、一般に、天然アミノ酸、および、修飾されたアミノ酸およびアミノ酸アナログを含む非天然アミノ酸を指す。修飾されたアミノ酸は、天然アミノ酸および非天然アミノ酸を含むことがあり、これは自然に存在しない基あるいは化学的部分をアミノ酸上に含むように化学的に修飾されている。アミノ酸アナログはアミノ酸誘導体を指すこともある。「アミノ酸」との用語には、D-アミノ酸とL-アミノ酸の両方が含まれる。 The terms "peptide", "polypeptide", and "protein" are used interchangeably herein to refer to a polymer of at least two amino acid residues linked by a peptide bond. The term does not imply a particular length of polymer and also implies or identifies whether the peptide is produced using recombinant techniques, chemical or enzymatic synthesis, or is naturally occurring. Not intended. The term applies to naturally occurring amino acid polymers as well as amino acid polymers containing at least one modified amino acid. In some cases, the polymer may be interrupted by non-amino acids. The term includes amino acid chains of any length, including full-length proteins, as well as proteins with or without secondary and / or tertiary structures (eg, domains). The term also includes amino acid polymers modified, for example, by disulfide bond formation, glycosylation, lipid modification, acetylation, phosphorylation, oxidation, and other operations, eg, conjugates with labeled components. The term "amino acid", as used herein, generally refers to natural amino acids and unnatural amino acids, including modified amino acids and amino acid analogs. Modified amino acids may include natural and unnatural amino acids, which are chemically modified to include non-naturally occurring groups or chemical moieties on the amino acids. Amino acid analogs may also refer to amino acid derivatives. The term "amino acid" includes both D-amino acids and L-amino acids.

本明細書で使用されるように、「非天然」とは、一般に、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を指す。非天然はアフィニティータグを指すことがある。非天然は融合を指すことがある。非天然は、突然変異、挿入、および/または欠失を含む天然に存在する核酸またはポリペプチド配列を指すことがある。非天然の配列は、非天然の配列が融合される核酸および/またはポリペプチド配列によって示される可能性がある活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示す、および/またはコードする場合がある。非天然の核酸またはポリペプチド配列は、遺伝子操作によって、天然に存在する核酸またはポリペプチド配列(あるいは、その変異体)に結合され、キメラ核酸、および/または、キメラ核酸ならびに/あるいはポリペプチドをコードするポリペプチド配列を生成する場合がある。 As used herein, "non-natural" generally refers to nucleic acid or polypeptide sequences not found in natural nucleic acids or proteins. Non-natural may refer to affinity tags. Non-natural may refer to fusion. Non-natural may refer to a naturally occurring nucleic acid or polypeptide sequence containing mutations, insertions, and / or deletions. Non-natural sequences include activities that may be exhibited by nucleic acid and / or polypeptide sequences to which the non-natural sequences are fused (eg, enzyme activity, methyltransferase activity, acetyltransferase activity, kinase activity, ubiquitination activity, etc. ) May be indicated and / or coded. Non-natural nucleic acid or polypeptide sequences are genetically engineered to bind to naturally occurring nucleic acid or polypeptide sequences (or variants thereof) and encode chimeric nucleic acids and / or chimeric nucleic acids and / or polypeptides. May produce a polypeptide sequence.

「プロモーター」との用語は、本明細書で使用されるように、一般に、遺伝子の転写または発現を制御する調節DNA領域を指し、RNA転写が開始されるヌクレオチドあるいはヌクレオチドの領域に隣接または重複して位置する場合がある。プロモーターは、しばしば転写因子とも呼ばれる、タンパク質因子に結合する特異的DNA配列を含有する場合があり、これは、DNAへのRNAポリメラーゼの結合を促進し、遺伝子転写を引き起こす。「コアプロモーター」とも呼ばれる「基本プロモーター」は、一般に、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な基本的な要素をすべて含有しているプロモーターを指す。真核生物の基本プロモーターは典型的に、必ずしもそうとは限らないが、TATAボックスおよび/またはCAATボックスを含有している。 As used herein, the term "promoter" generally refers to a regulatory DNA region that controls transcription or expression of a gene, adjacent to or overlapping a nucleotide or region of nucleotide in which RNA transcription is initiated. May be located. Promoters may contain specific DNA sequences that bind to protein factors, often referred to as transcription factors, which facilitate the binding of RNA polymerase to DNA and trigger gene transcription. A "basic promoter," also referred to as a "core promoter," generally refers to a promoter that contains all the basic elements necessary to promote transcriptional expression of operably linked polynucleotides. Eukaryotic basal promoters typically, but not necessarily, contain TATA boxes and / or CAAT boxes.

「発現」との用語は、本明細書で使用されるように、一般に、DNA鋳型から核酸配列またはポリヌクレオチドが(mRNAあるいは他のRNA転写物などに)転写されるプロセス、および/または、転写されたmRNAがその後、ペプチド、ポリペプチド、あるいはタンパク質へと翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞におけるmRNAのスプライシングを含むことがある。 The term "expression", as used herein, generally refers to the process by which a nucleic acid sequence or polynucleotide is transcribed (such as mRNA or other RNA transcript) from a DNA template and / or transcription. Refers to the process by which the resulting mRNA is subsequently translated into a peptide, polypeptide, or protein. Transcripts and encoded polypeptides are sometimes collectively referred to as "gene products." If the polynucleotide is derived from genomic DNA, expression may include splicing of mRNA in eukaryotic cells.

本明細書で使用されるように、「動作可能に連結する」、「動作可能な連結」、または「動作可能なように連結する」、またはその文法的等価物は一般に、遺伝要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並置を指し、これらの要素は、それらが予期された方法で動作することを可能にする関係にある。例えば、プロモーターおよび/またはエンハンサー配列を含み得る調節エレメントは、その調節エレメントがコード配列の転写を始めるのを支援する場合、コード領域に動作可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域の間に介在する残基が存在する場合がある。 As used herein, "operably concatenated", "operable concatenation", or "operably concatenated", or grammatical equivalents thereof, are generally genetic elements, eg, eg. It refers to juxtaposition of promoters, enhancers, polyadenylation sequences, etc., and these elements are in a relationship that allows them to operate in the expected manner. For example, a regulatory element that may include a promoter and / or enhancer sequence is operably linked to the coding region if it assists the regulatory element in initiating transcription of the coding sequence. As long as this functional relationship is maintained, there may be residues intervening between the regulatory element and the coding region.

「ベクター」とは、本明細書で使用されるように、一般に、ポリヌクレオチドを含むか、あるいはポリヌクレオチドと会合する高分子または高分子の集合体(association)を指し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および他の遺伝子送達ビヒクルが挙げられる。ベクターは一般に、標的中の遺伝子の発現を促進するために遺伝子に動作可能に連結された遺伝エレメント、例えば、調節エレメントを含む。 As used herein, "vector" generally refers to a macromolecule or macromolecular assembly that contains or associates with a polynucleotide, which is a polynucleotide to a cell. Can be used to mediate delivery. Examples of vectors include plasmids, viral vectors, liposomes, and other gene delivery vehicles. Vectors generally include genetic elements operably linked to the gene to promote expression of the gene in the target, eg, regulatory elements.

本明細書で使用されるように、「発現カセット」および「核酸カセット」は一般に、ともに発現されるか、あるいは発現のために動作可能に連結される核酸配列または要素の組み合わせを指すために交換可能に使用される。場合によっては、発現カセットは、調節エレメントと、それらが発現のために動作可能に連結される遺伝子との組み合わせを指す。 As used herein, "expression cassette" and "nucleic acid cassette" are generally exchanged to refer to a combination of nucleic acid sequences or elements that are expressed together or operably linked for expression. Used as possible. In some cases, an expression cassette refers to a combination of regulatory elements and genes to which they are operably linked for expression.

DNAまたはタンパク質配列の「機能的断片」とは一般に、完全長のDNAまたはタンパク質配列の生物学的活性に実質的に類似する生物学的活性(機能的または構造的)を保持する断片を指す。DNA配列の生物学的活性は、完全長の配列に起因すると知られている様式で発現に影響を与えるその能力であり得る。 A "functional fragment" of a DNA or protein sequence generally refers to a fragment that retains a biological activity (functional or structural) that is substantially similar to the biological activity of a full-length DNA or protein sequence. The biological activity of a DNA sequence can be its ability to influence expression in a manner known to be due to the full-length sequence.

本明細書で使用されるように、「操作された」対象は一般に、その対象がヒトの介入によって改変されていることを示す。非限定的な例によると、核酸は、その配列を自然界で生じない配列に変更することによって改変される場合がある;核酸は、ライゲーションされた産物がもとの核酸には存在しない機能を保有するように、その核酸を、その核酸が自然界では会合しない核酸にライゲーションすることによって改変される場合がある;操作された核酸は、自然界では存在しない配列とインビトロで合成される場合がある;タンパク質は、そのアミノ酸配列を自然界では存在しない配列に変更することによって改変される場合がある;操作されたタンパク質は、新しい機能あるいは特性を得る場合がある。「操作された」システムは、少なくとも1つの操作された構成要素を含む。 As used herein, a "manipulated" subject generally indicates that the subject has been modified by human intervention. According to a non-limiting example, a nucleic acid may be modified by changing its sequence to a sequence that does not occur in nature; the nucleic acid possesses a function that the ligated product does not exist in the original nucleic acid. As such, the nucleic acid may be modified by ligating the nucleic acid to a nucleic acid that the nucleic acid does not associate with in nature; the engineered nucleic acid may be synthesized in vitro with a sequence that does not exist in nature; May be modified by changing its amino acid sequence to a sequence that does not exist in nature; the engineered protein may gain new functions or properties. An "operated" system comprises at least one manipulated component.

本明細書で使用されるように、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質またはそのドメインを指すために交換可能に使用される。例えば、VPRとVP64のドメインは、合成トランス活性化ドメインである。 As used herein, "synthetic" and "artificial" have low sequence identity (eg, less than 50% sequence identity, less than 25% sequence identity) with respect to naturally occurring human proteins. Used interchangeably to refer to a protein or domain thereof having less than 10% sequence identity, less than 5% sequence identity, less than 1% sequence identity). For example, the VPR and VP64 domains are synthetic transactivation domains.

「tracrRNA」または「tracr配列」との用語は、本明細書で使用されるように、一般に、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA、または配列番号:5476-5511)に対して少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)に対して最大で約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、あるいは100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、欠失、挿入、または置換などのヌクレオチド変化、変異体、突然変異、あるいはキメラを含む、tracrRNAの改変された形態を指す場合がある。tracrRNAは、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一である核酸を指す場合がある。例えば、tracrRNA配列は、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えばS.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一、少なくとも約65%同一、少なくとも約である70%同一、少なくとも約である75%同一、少なくとも約である80%同一、少なくとも約である85%同一、少なくとも約である90%同一、少なくとも約である95%同一、少なくとも約である98%、少なくとも約99%同一、または100%同一である場合がある。II型tracrRNA配列は、隣接したCRISPRアレイ中の反復配列の一部に相補性を有する領域を同定することによって、ゲノム配列上で予測することができる。 The term "tracrRNA" or "tracr sequence", as used herein, is generally a wild-type exemplary tracrRNA sequence (eg, tracrRNA, or sequence from S. pyogenes, Staphylococcus aureus, etc.). Number: 5476-5511) with at least about 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, or 100% sequence identical. It may refer to a nucleic acid having sex and / or a sequence similar to the exemplary tracrRNA sequence of its wild form. TracrRNA is up to about 5%, 10%, 20%, 30%, 40%, 50%, relative to wild-type exemplary tracrRNA sequences (eg, tracrRNA from S. pyogenes, Staphylococcus aureus, etc.). It may refer to a nucleic acid having 60%, 70%, 80%, 90%, or 100% sequence identity and / or a sequence similar to its wild-type exemplary tracrRNA sequence. TracrRNA may refer to a modified form of tracrRNA, including nucleotide changes such as deletions, insertions, or substitutions, variants, mutations, or chimeras. When a tracrRNA refers to a nucleic acid that is at least about 60% identical to a wild-type exemplary tracrRNA (eg, tracrRNA from S. pyogenes, Staphylococcus aureus, etc.) sequence over a stretch of at least 6 consecutive nucleotides. There is. For example, the tracrRNA sequence is at least about 60% identical to, at least about 65, the wild-type exemplary tracrRNA (eg, tracrRNA from S. pyogenes, Staphylococcus aureus, etc.) sequence over a stretch of at least 6 consecutive nucleotides. % Identical, at least about 70% identical, at least about 75% identical, at least about 80% identical, at least about 85% identical, at least about 90% identical, at least about 95% identical , At least about 98%, at least about 99% identical, or 100% identical. Type II tracrRNA sequences can be predicted on genomic sequences by identifying regions of complementarity to some of the repetitive sequences in adjacent CRISPR arrays.

本明細書で使用されるように、「ガイド核酸」は一般に、別の核酸にハイブリダイズすることができる核酸を指す場合がある。ガイド核酸はRNAであることがある。ガイド核酸はDNAであることがある。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされてもよい。標的とされた核酸または標的核酸は、ヌクレオチドを含むことがある。ガイド核酸はヌクレオチドを含むことがある。標的核酸の一部は、ガイド核酸の一部に相補的であり得る。ガイド核酸に相補的であり、そのガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と呼ばれることがある。相補鎖に相補的であり、したがって、ガイド核酸に相補的でない場合がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖(noncomplementary strand)と呼ばれることがある。ガイド核酸は、1つのポリヌクレオチド鎖を含む場合があり、「単一ガイド核酸(single guide nucleic acid)」と呼ばれることがある。ガイド核酸は、2つのポリヌクレオチド鎖を含む場合があり、「二重ガイド核酸(double guide nucleic acid)」と呼ばれることがある。特に明記しない限り、「ガイド核酸」との用語は包括的であり、単一ガイド核酸および二重ガイド核酸の両方を指す場合がある。ガイド核酸は、「核酸を標的とするセグメント」または「核酸を標的とする配列」と呼ばれることがある、セグメントを含んでいてもよい。核酸を標的とするセグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と呼ばれることがあるサブセグメントを含んでいてもよい。 As used herein, "guide nucleic acid" may generally refer to a nucleic acid that can hybridize to another nucleic acid. The guide nucleic acid may be RNA. The guide nucleic acid may be DNA. The guide nucleic acid may be programmed to bind site-specifically to the sequence of nucleic acids. The targeted nucleic acid or target nucleic acid may contain nucleotides. The guide nucleic acid may contain nucleotides. The portion of the target nucleic acid may be complementary to the portion of the guide nucleic acid. The strand of the double-stranded target polynucleotide that is complementary to the guide nucleic acid and hybridizes to the guide nucleic acid is sometimes referred to as the complementary strand. The strands of a double-stranded target polynucleotide that are complementary to the complementary strand and therefore may not be complementary to the guide nucleic acid are sometimes referred to as noncomplementary strands. The guide nucleic acid may contain one polynucleotide chain and may be referred to as a "single guide nucleic acid". The guide nucleic acid may contain two polynucleotide chains and may be referred to as a "double guide nucleic acid". Unless otherwise stated, the term "guide nucleic acid" is comprehensive and may refer to both single and double guide nucleic acids. The guide nucleic acid may include a segment, which may be referred to as a "nucleic acid targeting segment" or a "nucleic acid targeting sequence". Nucleic acid targeting segments may include subsegments that may be referred to as "protein binding segments" or "protein binding sequences" or "Cas protein binding segments".

2つ以上の核酸あるいはポリペプチド配列の文脈において、「配列同一性」または「パーセント同一性」との用語は一般に、2つ(例えば、ペアワイズアラインメント)、またはそれ以上(例えば、多重配列アライメント)の配列を指し、それらの配列は、配列比較アルゴリズムを使用して測定されるように、局所的または全体的な比較ウィンドウにわたる最大の対応のために比較または整列されたとき、同じであるか、あるいは同じアミノ酸残基またはヌクレオチドの指定された割合を有する。ポリペプチド配列に適切な配列比較アルゴリズムには、例えば、3のwordlength(W)、10のexpectation(E)、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用する、および30の残基よりも長いポリペプチド配列の条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用するBLASTP;2のwordlength(W)、1000000のexpectation(E)のパラメータ、および30残基未満の配列に対してギャップを開くために9で、ギャップを拡張するために1でギャップコストを設定するPAM30スコアリングマトリックスを使用するBLASTP(これらは、https://blast.ncbi.nlm.nih.govで利用可能なBLAST suiteにおけるBLASTPのデフォルトパラメータである);パラメータを用いるCLUSTALW;2のmatch、-1のmismatch、および-1のgapのパラメータを用いるSmith-Waterman相同性検索アルゴリズム;デフォルトパラメータを用いるMUSCLE;2のretreeおよび1000のmaxiterationsのパラメータを用いるMAFFT;デフォルトパラメータを用いるNovafold;デフォルトパラメータを用いるHMMER hmmalignが含まれる。 In the context of two or more nucleic acid or polypeptide sequences, the term "sequence identity" or "percent identity" generally refers to two (eg, pairwise alignment) or more (eg, multiple sequence alignment). Refers to sequences, which are the same or the same when compared or aligned for maximum correspondence across the local or overall comparison window, as measured using the sequence comparison algorithm. Has the same amino acid residue or specified proportion of nucleotides. Suitable sequence comparison algorithms for polypeptide sequences use, for example, BLASTUM62 scoring matrix parameters that set the gap cost at 3 wordsth (W), 10 exposure (E), and 11 extensions and 1 extensions. And using BLASTP using conditional compositional score matrix algorithm for polypeptide sequences longer than 30 residues; 2 wordlength (W), 10000 extraction (E) parameters, and 30. BLASTP using a PAM30 scoring matrix that sets the gap cost at 9 to open the gap and 1 to extend the gap for sequences less than residues (these are https://blast.ncbi.nlm). It is the default parameter of BLASTP in BLAST suite available in .nih.gov); CLASTALW with parameters; Smith-Waterman homology search algorithm with parameters of 2 match, -1 mismatch, and -1 gap; Includes MUSCLE with default parameters; MAFFT with 2 regions and 1000 maxiterations parameters; Novafold with default parameters; HMMER hmmalign with default parameters.

本明細書で使用されるように、「RuvC_IIIドメイン」との用語は一般に、RuvCエンドヌクレアーゼドメイン(3つの不連続セグメントであるRuvC_I、RuvC_II、およびRuvC_IIIで構成されているRuvCヌクレアーゼドメイン)の3つ目の不連続セグメントを指す。RuvCドメインまたはそのセグメントは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、RuvC_IIIではPfam HMM PF18541)との比較によって、同定することができる。 As used herein, the term "RuvC_III domain" is generally three of the RuvC endonuclease domain (the RuvC nuclease domain composed of the three discontinuous segments RuvC_I, RuvC_II, and RuvC_III). Refers to the discontinuous segment of the eye. A RuvC domain or segment thereof is generally a Hidden Markov Model (HMM) constructed by alignment to a known domain sequence, structural alignment to a protein having an annotated domain, or based on a known domain sequence (eg, in RuvC_III). It can be identified by comparison with Pfam HMM PF18541).

本明細書で使用されるように、「HNHドメイン」との用語は一般に、特徴的なヒスチジンおよびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、ドメインHNHではPfam HMM PF01844)との比較によって同定することができる。 As used herein, the term "HNH domain" generally refers to an endonuclease domain with characteristic histidine and asparagine residues. HNH domains are generally Hidden Markov Models (HMMs) constructed by alignment to known domain sequences, structural alignments to proteins with annotated domains, or based on known domain sequences (eg, Pfam HMM in domain HNH). It can be identified by comparison with PF01844).

概要 Overview

特有の機能および構造を有する新しいCas酵素の発見は、デオキシリボ核酸(DNA)編集技術をさらに混乱させる(disrupt)可能性を提示し、速度、特異性、機能性、および使いやすさを改善することができる。微生物における、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)システムの予測された有病率(prevalence)および多種多様な微生物種と比較して、機能的に特徴づけられたCRISPR/Cas酵素は、文献には比較的ほとんど存在しない。これは部分的に、莫大な数の微生物種が実験室条件で容易に培養されない可能性があるためである。多くの微生物種を表す自然環境的ニッチからのメタゲノム配列決定により、既知の新しいCRISPR/Casシステムの数が急激に増加し、新しいオリゴヌクレオチド編集機能の発見が促進される可能性が提示され得る。そのようなアプローチの有益さの最近の例は、天然微生物群のメタゲノム解析からのCasX/CasY CRISPRシステムの2016年の発見によって示される。 The discovery of a new Cas enzyme with a unique function and structure presents the potential to further disrupt deoxyribonucleic acid (DNA) editing techniques, improving speed, specificity, functionality, and ease of use. Can be done. CRISPR / functionally characterized in comparison to the predicted prevalence and diverse microbial species of clustered and regularly arranged short palindromic sequence repeat (CRISPR) systems in microorganisms. Cas enzymes are relatively rare in the literature. This is partly because huge numbers of microbial species may not be easily cultivated in laboratory conditions. Metagenomic sequencing from natural environmental niches representing many microbial species may suggest that the number of known new CRISPR / Cas systems may increase exponentially and facilitate the discovery of new oligonucleotide editing functions. A recent example of the benefits of such an approach is demonstrated by the 2016 discovery of the CasX / CasY CRISPR system from metagenomic analysis of natural microorganisms.

CRISPR/Casシステムは、微生物中の適応免疫系として機能すると説明されている、RNA指向性ヌクレアーゼ複合体である。それらの自然な文脈では、CRISPR/CasシステムがCRISPR(クラスター化して規則的な配置の短い回文配列リピート)オペロンまたは遺伝子座に生じ、これは一般に2つの部分:(i)RNAベースの標的化要素をコードする、等しく短いスペーサー配列によって分離された短い反復配列のアレイ(30-40bp)と;(ii)アクセサリータンパク質/アクセサリー酵素とともに、RNAベースの標的化要素によって向けられたヌクレアーゼポリペプチドをコードするCasをコードするORFとを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は一般に、(i)標的の最初の6~8の核酸(標的シード(target seed))とcrRNAガイドとの間の相補的なハイブリダイゼーションと;(ii)標的シードの定義された近傍内のプロトスペーサー隣接モチーフ(PAM)配列の存在(PAMは一般に、宿主ゲノム内では一般的に表されない配列である)との両方を必要とする。上記システムの正確な機能および構成に応じて、CRISPR-Casシステムは、共有される機能特性および進化の類似性に基づいて、2つのクラス、5つの型、および16の亜型へと一般的に組織化される。 The CRISPR / Cas system is an RNA-directed nuclease complex described to function as an adaptive immune system in microorganisms. In their natural context, a CRISPR / Cas system occurs at a CRISPR (clustered, regularly arranged short palindromic sequence repeat) operon or locus, which generally has two parts: (i) RNA-based targeting. An array of short repeats (30-40bp) separated by equally short spacer sequences encoding the elements; (ii) encoding CRISPR polypeptides directed by RNA-based targeting elements, along with accessory proteins / accessory enzymes. Includes an ORF that encodes Cas. Efficient nuclease targeting of a particular target nucleic acid sequence generally involves (i) complementary hybridization between the first 6-8 nucleic acids of the target (target seeded) and the crRNA guide; ii) It requires both the presence of a protospacer-adjacent motif (PAM) sequence within the defined neighborhood of the target seed (PAM is generally a sequence that is not commonly represented within the host genome). Depending on the exact function and configuration of the system, the CRISPR-Cas system will generally be divided into two classes, five types, and 16 subtypes, based on shared functional characteristics and evolutionary similarities. Be organized.

クラスIのCRISPR-Casシステムは、大きなマルチサブユニットエフェクター複合体を有しており、I型、III型、およびIV型を含む。 Class I CRISPR-Cas systems have large multi-subunit effector complexes, including type I, type III, and type IV.

I型のCRISPR-Casシステムは、構成要素の観点から中程度の複雑さであると考えられる。I型のCRISPR-Casシステムでは、RNAを標的とする要素のアレイは長い前駆体crRNA(プレcrRNA)として転写され、これは反復要素で処理されて、短く成熟したcrRNAを遊離し、この短く成熟したcrRNAは、それらの後にプロトスペーサー隣接モチーフ(PAM)と呼ばれる適切な短いコンセンサス配列が続くと、ヌクレアーゼ複合体を核酸標的に向ける。この処理は、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して行われ、これはさらに、crRNA指向性ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質成分を含む。Cas Iヌクレアーゼは、DNAヌクレアーゼとして主に機能する。 Type I CRISPR-Cas systems are considered to be of moderate complexity in terms of components. In the CRISPR-Cas system of type I, an array of elements targeting RNA is transcribed as a long precursor crRNA (pre-crRNA), which is processed with repetitive elements to release the short mature crRNA, which is short and mature. The resulting crRNAs are followed by a suitable short consensus sequence called a protospacer flanking motif (PAM), which directs the nuclease complex to the nucleic acid target. This treatment is carried out via the endoribonuclease subunit (Cas6) of a large endonuclease complex called cascade, which further comprises the nuclease (Cas3) protein component of the crRNA-directed nuclease complex. Cas I nuclease mainly functions as a DNA nuclease.

III型のCRISPRシステムは、CsmまたはCmrのタンパク質サブユニットを含むリピート関連ミステリアスタンパク質(repeat-associated mysterious protein)(RAMP)とともに、Cas10として知られる中央ヌクレアーゼの存在を特徴とする場合がある。I型のシステムのように、成熟したcrRNAは、Cas6のような酵素を使用してプレcrRNAから処理される。I型およびII型のシステムとは異なり、III型のシステムは、DNA-RNA二重鎖(RNAポリメラーゼの鋳型として使用されるDNA鎖など)を標的とし、切断するように思われる。 The CRISPR system of type III may be characterized by the presence of a central nuclease known as Cas10, along with a repeat-associated mysterious protein (RAMP) containing a protein subunit of Csm or Cmr. Like the type I system, mature crRNA is processed from pre-crRNA using an enzyme such as Cas6. Unlike the Type I and Type II systems, the Type III system appears to target and cleave DNA-RNA duplexes, such as the DNA strand used as a template for RNA polymerase.

IV型のCRISPR-Casシステムは、高度に還元された(highly reduced)大サブユニットヌクレアーゼ(csf1)と、Cas5(csf3)とCas7(csf2)の群のRAMPタンパク質の2つの遺伝子と、場合によっては、予測された小サブユニットの1つの遺伝子とからなるエフェクター複合体を持ち;そのようなシステムは一般的に、内因性のプラスミド上で見られる。 The type IV CRISPR-Cas system consists of two genes, a highly reduced large subunit nuclease (csf1) and a plasmid protein in the Cas5 (csf3) and Cas7 (csf2) groups, and in some cases, the RAMP protein. Has an effector complex consisting of one gene of the predicted small subunit; such systems are commonly found on endogenous plasmids.

クラスIIのCRISPR-Casシステムは一般に、単一のポリペプチドのマルチドメインヌクレアーゼエフェクターを有しており、II型、V型、およびVI型を含む。 Class II CRISPR-Cas systems generally have a single polypeptide multidomain nuclease effector, including type II, type V, and type VI.

II型のCRISPR-Casシステムは、構成要素の観点から最も単純であると考えられる。II型のCRISPR-Casシステムでは、CRISPRアレイを成熟したcrRNAに処理するには、アレイ反復配列に相補的な領域を有する小さなトランスコードされた(trans-encoded)crRNA(tracrRNA)ではなく、特別なエンドヌクレアーゼサブユニットの存在が必要となり;tracrRNAは、その対応するエフェクターヌクレアーゼ(例えば、Cas9)と反復配列の両方と相互作用することで前駆体dsRNA構造を形成し、この前駆体dsRNA構造は、内因性のRNAse IIIによって切断されて、tracrRNAとcrRNAの両方がロードされた成熟したエフェクター酵素を生成する。Cas IIヌクレアーゼはDNAヌクレアーゼとして知られている。2型エフェクターは一般に、無関係なHNHヌクレアーゼドメインがRuvC様ヌクレアーゼドメインのフォールド内に挿入されたRNase Hフォールドを採用する、RuvC様エンドヌクレアーゼドメインからなる構造を示す。RuvC様ドメインは、標的(例えば、crRNA相補的な)DNA鎖の切断の原因となり、一方で、HNHドメインは置換されたDNA鎖の切断の原因となる。 The type II CRISPR-Cas system is considered to be the simplest in terms of components. In the type II CRISPR-Cas system, processing a CRISPR array into a mature crRNA is not a small transcoded crRNA (tracrRNA) with regions complementary to the array repeats, but a special one. The presence of an endonuclease subsystem is required; tracrRNA interacts with both its corresponding effector nuclease (eg Cas9) and repetitive sequences to form a precursor dsRNA structure, which is an intrinsic cause. It is cleaved by sex RNAse III to produce a mature effector enzyme loaded with both tracrRNA and crRNA. Cas II nucleases are known as DNA nucleases. Type 2 effectors generally exhibit a structure consisting of a RuvC-like endonuclease domain that employs an RNase H fold in which an irrelevant HNH nuclease domain is inserted within the fold of the RuvC-like nuclease domain. The RuvC-like domain causes cleavage of the target (eg, crRNA-complementary) DNA strand, while the HNH domain causes cleavage of the substituted DNA strand.

V型のCRISPR-Casシステムは、RuvC様ドメインを含む、II型エフェクターのヌクレアーゼエフェクターと類似するヌクレアーゼエフェクター(例えば、Cas12)構造を特徴とする。II型と同様に、ほとんどの(しかし、すべてでない)V型のCRISPRシステムは、プレcrRNAを成熟したcrRNAへと処理するためにtracrRNAを使用する;しかし、プレcrRNAを切断して複数のcrRNAにするためにRNAse IIIを必要とするII型のシステムとは異なり、V型のシステムは、プレcrRNAを切断するために、エフェクターヌクレアーゼそれ自体を使用することができる。II型のCRISPR-Casシステムと同様に、V型のCRISPR-CasシステムはDNAヌクレアーゼとしても知られている。II型のCRISPR-Casシステムとは異なり、いくつかのV型酵素(例えば、Cas12a)は、二本鎖標的配列の第1のcrRNA指向性切断によって活性化される、頑強な一本鎖の非特異的なデオキシリボヌクレアーゼ活性を有するように思われる。 The V-type CRISPR-Cas system features a nuclease effector (eg, Cas12) structure similar to the nuclease effector of type II effectors, including the RuvC-like domain. Like type II, most (but not all) V-type CRISPR systems use tracrRNAs to process pre-crRNAs into mature crRNAs; however, they cleave the pre-crRNAs into multiple crRNAs. Unlike type II systems, which require RNAse III to do so, type V systems can use the effector nuclease itself to cleave precrRNA. Similar to the type II CRISPR-Cas system, the type V CRISPR-Cas system is also known as a DNA nuclease. Unlike the Type II CRISPR-Cas system, some V-type enzymes (eg, Cas12a) are robust single-stranded non-strands activated by the first crRNA-directed cleavage of the double-stranded target sequence. It appears to have specific deoxyribonuclease activity.

VI型のCRIPSR-Casシステムは、RNAガイドRNAエンドヌクレアーゼ(RNA-guided RNA endonucleases)を有する。RuvC様ドメインの代わりに、VI型のシステム(例えば、Cas13)の単一のポリペプチドエフェクターは、2つのHEPNリボヌクレアーゼドメインを含む。II型およびV型のシステムの両方とは異なり、VI型のシステムは、プレcrRNAをcrRNAへと処理するために、tracrRNAを必要としないように思われる。しかし、V型のシステムと同様に、いくつかのVI型のシステム(例えば、C2C2)は、標的RNAの第1のcrRNA指向性切断によって活性化された、頑強な一本鎖の非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を持つように思われる。 The VI-type CRISPR-Cas system has an RNA-guided RNA endonuclease. Instead of a RuvC-like domain, a single polypeptide effector in a VI-type system (eg, Cas13) comprises two HEPN ribovocrim domains. Unlike both type II and type V systems, the type VI system does not appear to require tracrRNA to process pre-crRNA into crRNA. However, like the V-type system, some VI-type systems (eg, C2C2) are robust single-stranded non-specific nucleases activated by the first crRNA-directed cleavage of the target RNA. Seems to have (ribonuclease) activity.

クラスIIのCRISPR-Casは、そのより単純な構造ゆえに、デザイナーヌクレアーゼ(designer nuclease)/ゲノム編集用途として、エンジニアリングおよび開発のために最も広く採用されている。 Class II CRISPR-Cas, due to its simpler structure, is most widely adopted for engineering and development as a designer nucleose / genome editing application.

インビトロでの使用のためのそのようなシステムの初期の適応のうちの1つは、Jinekら(Science.2012 Aug 17;337(6096):816-2、これは参照によって完全に本明細書に組み込まれる)において見ることができる。Jinekの試験では、(i)S.pyogenes SF370から単離された、組換え的に(recombinantly)発現されて精製された完全長のCas9(例えば、クラスIIのII型Cas酵素)、(ii)切断されることが望まれる標的DNA配列に相補的な~20nt5’配列と、それに続く3’tracr結合配列とを有する、精製された成熟~42nt crRNA(crRNA全体が、T7プロモーター配列を有する合成DNA鋳型からインビトロで転写される);(iii)T7プロモーター配列を有する合成DNA鋳型からインビトロで転写された、精製されたtracrRNA、および(iv)Mg2+を含むシステムが最初に説明された。Jinekは、その後、改善された操作されたシステムを説明し、そのシステムでは、それ自体でCas9を標的に向けることができる単一の融合された合成ガイドRNA(sgRNA)を形成するために、(ii)のcrRNAが、リンカー(例えば、GAAA)によって、(iii)の5’末端に結合される(図2の上パネルと下パネルを比較する)。 One of the early adaptations of such a system for in vitro use is Jinek et al. (Science. 2012 Aug 17; 337 (6096): 816-2, which is hereby fully by reference. Can be seen in (embedded). In Jinek's test, (i) S. Full-length Cas9 (eg, Class II Type II Casenase) isolated from pyogenes SF370, recombinantly expressed and purified, (ii) a target DNA sequence desired to be cleaved. Purified mature to 42 nt crRNA with a ~ 20 nt 5'sequence complementary to, followed by a 3'tracr binding sequence (the entire crRNA is transcribed in vitro from a synthetic DNA template with the T7 promoter sequence); A system containing purified tracrRNA, transcribed in vitro from a synthetic DNA template with the iii) T7 promoter sequence, and (iv) Mg2 + was first described. Jinek then described an improved engineered system in which to form a single fused synthetic guide RNA (sgRNA) capable of targeting Cas9 on its own. The crRNA of ii) is bound to the 5'end of (iii) by a linker (eg, GAAA) (compare the upper and lower panels of FIG. 2).

Maliら(Science.2013 Feb 15;339(6121):823-826.)(これは、参照により完全に本明細書に組み込まれる)は、その後、(i)C末端の核局在化配列(例えば、SV40 NLS)および適切なポリアデニル化シグナル(例えば、TK pAシグナル)を有する適切な哺乳動物プロモーター下で、コドン最適化Cas9(例えば、クラスIIのII型Cas酵素)をコードするORFと;(ii)適切なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下でsgRNAをコードするORF(Gで始まる5’配列と、それに続く相補的な標的化核酸配列の20ntと、それに結合した3’tracr結合配列と、リンカーと、tracrRNA配列とを有する)とをコードするDNAベクターを提供することによって、哺乳動物細胞で使用するためにこのシステムを適合させた。 Mari et al. (Science. 2013 Feb 15; 339 (6121): 823-826.), Which is fully incorporated herein by reference, are then described in (i) C-terminal nuclear localization sequences (i) For example, with an ORF encoding codon-optimized Cas9 (eg, Class II type II Cas enzyme) under a suitable mammalian promoter with SV40 NLS) and a suitable polyadenylation signal (eg, TK pA signal); ii) An ORF (starting with G, 5'sequence followed by a complementary targeting nucleic acid sequence, 20 nt, followed by a 3'tracr binding sequence bound to it, under the appropriate polymerase III promoter (eg, U6 promoter). The system was adapted for use in mammalian cells by providing a DNA vector encoding (with a linker and a promoter RNA sequence).

MG1酵素 MG1 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:1827-2140のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、上記RuvC_IIIドメインは、配列番号:1827-2140.のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、配列番号:1827-2140のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827に対して少なくとも約70%、、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1828に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1829に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1830に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1831に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NO: 1827-2140. In some cases, the endonuclease may contain a RuvC_III domain, wherein the RuvC_III domain is described in SEQ ID NO: 1827-2140. At least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about about any one of them. 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about about It has 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. In some cases, endonucleases may contain the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 1827-2140. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 1827-1831. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45 relative to any one of SEQ ID NOs: 1827-1831. %, At least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 %, At least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, including RuvC_III domains having at least about 99% identity. In some cases. In some cases, endonucleases may contain the RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 1827-1831. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92% relative to SEQ ID NO: 1827. May include a RuvC_III domain having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1828. It may contain a RuvC_III domain having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1829. It may contain a RuvC_III domain having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1830. It may contain a RuvC_III domain having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1831. It may contain a RuvC_III domain having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity.

エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3955. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 relative to any one of SEQ ID NOs: 3638-3955. %, At least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% HNH domains with identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 3638-3955. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3955. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 relative to any one of SEQ ID NOs: 3638-3955. %, At least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% HNH domains with identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 3638-3955. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3461. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 relative to any one of SEQ ID NOs: 3638-3461. %, At least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% HNH domains with identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 3638-3461. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NO: 3638. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, relative to any one of SEQ ID NO: 3638. When containing an HNH domain having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. There is. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NO: 3638. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NO: 3639. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, relative to any one of SEQ ID NO: 3639. When containing an HNH domain having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. There is. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NO: 3639. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NO: 3640. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, relative to any one of SEQ ID NO: 3640. When containing an HNH domain having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. There is. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NO: 3640. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NO: 3641. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, relative to any one of SEQ ID NO: 3641. When containing an HNH domain having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. There is. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NO: 3641.

場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つと実質的に同一である場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つと実質的に同一の場合がある。場合によっては、エンドヌクレアーゼは、配列番号:5615、5616、あるいは5617のいずれか1つと実質的に同一のペプチドモチーフを含む場合がある。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50% with respect to any one of SEQ ID NOs: 1-6 or 9-319. , At least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96% May contain variants having at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1-6 or 9-319. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, and at least about 55 relative to any one of SEQ ID NOs: 1-4. %, At least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97 %, At least about 98%, or at least about 99% of variants may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1-4. In some cases, endonucleases may contain a peptide motif that is substantially identical to any one of SEQ ID NOs: 5615, 5616, or 5617.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含むことがある。NLSは、前記エンドヌクレアーゼのN末端またはC末端の近位にあり得る。NLSは、配列番号:1-6あるいは9-319のいずれか1つのN末端あるいはC末端に付加され得るか、あるいは、配列番号:1-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端あるいはC末端に付加され得る。NLSはSV40ラージT抗原NLSである場合がある。NLSはc-myc NLSである場合がある。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含む場合がある。NLSは、配列番号:5593-5608のいずれか1つと実質的に同一の配列を含む場合がる。NLSは、下記の表1中の配列のいずれか、またはその組み合わせを含み得る。 In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS can be proximal to the N-terminus or C-terminus of the endonuclease. NLS can be added to the N-terminus or C-terminus of any one of SEQ ID NOs: 1-6 or 9-319, or at least about 30% of any one of SEQ ID NOs: 1-319. At least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, Addition to the N-terminus or C-terminus of a variant having at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity Can be done. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. When the NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. There is. The NLS may contain a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS may include any or a combination of the sequences in Table 1 below.

Figure 2022520428000002
場合によっては、エンドヌクレアーゼは、組換え型であり得る(例えば、大腸菌中の発現とそれに続くエピトープタグ精製などの適切な方法によって、クローン化され、発現され、および精製される)。場合によっては、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも約90%の同一性を有する16S rRNA遺伝子を有する細菌に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと少なくとも約80%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと実質的に同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、Verrucomicrobia門またはCandidatus Peregrinibacteria門に属する細菌に由来する場合がある。
Figure 2022520428000002
In some cases, endonucleases can be recombinant (eg, cloned, expressed, and purified by appropriate methods such as expression in E. coli followed by epitope tag purification). In some cases, the endonuclease may be derived from a bacterium having a 16S rRNA gene with at least about 90% identity to any one of SEQ ID NOs: 5592-5595. Endonucleases are at least about 80%, at least about 82%, at least about 83%, at least about 84%, at least about 85%, at least about 86%, at least about 87%, with any one of SEQ ID NOs: 5592-5595. At least about 88%, at least about 89%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, It may be derived from a species that has at least about 98%, or at least about 99%, the same 16S rRNA gene. The endonuclease may be derived from a species having a 16S rRNA gene that is substantially identical to any one of SEQ ID NOs: 5592-5595. Endonucleases may be derived from bacteria belonging to the phylum Verrucomicrobiota or the phylum Candidatus Peregrinibacteria.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定され得る。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用して、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、および条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTPアルゴリズムによって決定される場合がある。 In some cases, sequence identity can be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity is determined using the BLASTUM62 scoring matrix, which sets the gap cost using the parameters of 3 wordlength (W), 10 extraction (E), and 11 exhibitions, 1 extension, and conditions. It may be determined by the BLASTP algorithm using a combined composition score matrix adjustment.

場合によっては、上記のシステムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含む場合がある。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含み得る。場合によっては、標的化領域の最も5’側(5’most nucleotide)のヌクレオチドはGである場合がある。場合によっては、5’標的化領域は15~23ヌクレオチド長である場合がある。ガイド配列およびtracr配列は、別個のリボ核酸(RNA)あるいは単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでいてもよい。sgRNAは、5’から3’に:細胞中の標的配列にハイブリダイズすることができる非天然のガイド核酸配列と;tracr配列とを含み得る。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system described above may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). ) May be included. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, the nucleotide on the 5'most side of the targeting region (5'most nucleotide) may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence can be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA can include from 5'to 3': an unnatural guide nucleic acid sequence capable of hybridizing to a target sequence in the cell; and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特定の配列を有する場合がある。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有する。tracr配列は、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有することがある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する場合がある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一である場合がある。tracrRNAは、配列番号:5476-5489のいずれかを含む場合がある。 In some cases, the tracr sequence may have a particular sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). With respect to at least about 80%. The tracr sequence is at least about 60-100 of any one of SEQ ID NOs: 5476-5489 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about about. It may have at least about 80% sequence identity to the contiguous nucleotides of 90). In some cases, the tracrRNA is at least about 60-90 of any one of SEQ ID NOs: 5476-5489 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Or at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about about 90) contiguous nucleotides. They may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60-100 of any one of SEQ ID NOs: 5476-5489 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Or it may be substantially identical to at least about 90) contiguous nucleotides. The tracrRNA may contain any of SEQ ID NOs: 5476-5489.

場合によっては、エンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5461-5464のいずれか1つに対して少なくとも約80%の同一性を有する配列を含む場合がある。sgRNAは、配列番号:5461-5464のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む場合がる。sgRNAは、配列番号:5461-5464のいずれか1つと実質的に同一の配列を含む場合がある。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease is at least about 80% identical to any one of SEQ ID NOs: 5461-5464. May contain sequences of sex. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94% with respect to any one of SEQ ID NOs: 5461-5464. %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% of sequences having the same identity. The sgRNA may contain a sequence that is substantially identical to any one of SEQ ID NOs: 5461-5464.

場合によっては、上記のシステムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含む場合があり、ここで、第2の部位は第1の部位の3’である。場合によっては、上記のシステムは、5’~3’まで、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第1の相同性アームと、少なくとも約10のヌクレオチドの合成DNA配列と、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型を含む場合がある。 In some cases, the above system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second site is the second. It is 3'of 1 part. In some cases, the above system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) in 5'of the first region, from 5'to 3'. A first homology arm containing a sequence of nucleotides, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 3'in the second region. It may contain a single-stranded or double-stranded DNA repair template, including a second homology arm containing a sequence of 300, 500, or 1 kb) nucleotides.

他の態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供する。上記方法は、酵素および本明細書で開示される少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書で開示される非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し、その複合体が標的核酸遺伝子座に結合すると、標的核酸遺伝子座を改変する場合がある。前記遺伝子座に酵素を送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含み得る。前記遺伝子座にヌクレアーゼを送達することは、上記システムまたは上記システムをコードする核酸で細胞を電気穿孔することを含み得る。前記遺伝子座にヌクレアーゼを送達することは、対象の遺伝子座を含む核酸と上記システムを緩衝液中でインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含むことがある。標的核酸遺伝子座は細胞内にあることがある。標的核酸遺伝子座はインビトロであることがある。標的核酸遺伝子座は、真核細胞または原核細胞内にあることがある。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であることがある。酵素は、対象の標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こすことがある。 In another aspect, the present disclosure provides a method for modifying a target nucleic acid locus. The method comprises delivering any of the unnatural systems disclosed herein to a target nucleic acid locus, comprising an enzyme and at least one synthetic guide RNA (sgRNA) disclosed herein. Can include. The enzyme forms a complex with at least one sgRNA, and when the complex binds to the target nucleic acid locus, it may modify the target nucleic acid locus. Delivering an enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering a nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering a nuclease to the locus may include incubating the nucleic acid containing the locus of interest with the system in buffer. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic or prokaryotic cells. The cell may be an animal cell, a human cell, a bacterial cell, a paleobacterial cell, or a plant cell. Enzymes can cause single-strand or double-strand breaks at or proximal to the target locus of interest.

標的核酸遺伝子座が細胞内にある可能性がある場合、酵素は、配列番号:1827-2140のいずれか1つに対して少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含有する核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号:5572-5575のいずれか1つ、または、配列番号:5572-5575のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、あるいは少なくとも約99%の同一性を有するその変異体と実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターである場合がある。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有する、キャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして供給されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有するデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物を真核生物であってもよい。場合によっては、生物を真菌であってもよい。場合によっては、生物をヒトであってもよい。 If the target nucleic acid locus may be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NO: 1827-2140. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease is at least about 30 relative to any one of SEQ ID NO: 5571-5575 or any one of SEQ ID NO: 5571-5575. %, At least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80 %, At least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% of the variant having the same identity. Can contain an array of. In some cases, the nucleic acid comprises a promoter to which the open reading frame encoding the endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be supplied as a translated polypeptide. Even if the at least one engineered sgRNA is supplied as a deoxyribonucleic acid (DNA) containing a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. good. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

場合によっては、本開示は、本明細書で開示されるシステムを含む発現カセット、または本明細書に記載される核酸を提供し得る。場合によっては、発現カセットまたは核酸はベクターとして供給されてもよい。場合によっては、発現カセット、核酸、またはベクターは、細胞中で供給されてもよい。場合によっては、細胞は、配列番号:5592-5595のいずれか1つに対して少なくとも約90%(例えば、少なくとも約99%)の同一性を有する16S rRNA遺伝子を有する、細菌細胞である。 In some cases, the disclosure may provide an expression cassette comprising the systems disclosed herein, or the nucleic acids described herein. In some cases, the expression cassette or nucleic acid may be supplied as a vector. In some cases, the expression cassette, nucleic acid, or vector may be supplied intracellularly. In some cases, the cell is a bacterial cell having a 16S rRNA gene with at least about 90% (eg, at least about 99%) identity to any one of SEQ ID NOs: 5592-5595.

MG2酵素 MG2 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、配列番号:2141-2142のいずれか1つと実質的に同一である。エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する、RuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2141-2241. In some cases, the endonuclease may contain a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30% with respect to any one of SEQ ID NOs: 2141-2241. At least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80% , At least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%. , Have at least about 99% identity. In some cases, the endonuclease may contain the RuvC_III domain and is substantially identical to any one of SEQ ID NOs: 2141-2142. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2141-2142. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45 relative to any one of SEQ ID NOs: 2141-2142. %, At least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 RuvC_III domain having an identity of at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May include. In some cases, endonucleases may contain the RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2141-2142.

エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-3956のうちのいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つと実質的に同一のHNHドメインを含む場合がある。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3955-4055. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91 relative to any one of SEQ ID NOs: 3955-4055. %, At least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% if it contains HNH domains that are identical. There is. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 3955-4055. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3955-3956. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least for any one of SEQ ID NOs: 3955-3956. HNH domains that are about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identical. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 3955-3956.

場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 320-420. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 320-420. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 320-321. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 320-321.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:320-420のいずれか1つのN末端またはC末端で、あるいは、配列番号:320-420のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 for any one of SEQ ID NOs: 320-420 at the N-terminus or C-terminus, or for any one of SEQ ID NOs: 320-420. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5490-5494のいずれかを含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is at least about 60-100 of any one of SEQ ID NOs: 5490-5494 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about about. It may have at least about 80% sequence identity to the contiguous nucleotides of 90). In some cases, the tracrRNA is at least about 60-90 of any one of SEQ ID NOs: 5490-5494 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Or at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about about 90) contiguous nucleotides. It may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60-100 of any one of SEQ ID NOs: 5490-5494 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Alternatively, it may be substantially identical to at least about 90) contiguous nucleotides. The tracrRNA may comprise any of SEQ ID NOs: 5490-5494.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5465に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5465に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5465と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5465. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5465. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5465.

いくつかの態様では、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some embodiments, the system may include two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region. Is 3'for the first region. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2141-2241のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5576-5577のいずれか1つと実質的に同一の配列、あるいは、配列番号:5576-5577のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2141-2241. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially the same as any one of SEQ ID NO: 5576-5571, or any one of SEQ ID NO: 5576-5571. At least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75. %, At least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% of variants having identity. It may be included. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG3酵素 MG3 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2242-2251のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2242-2251. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2242-2251. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2242-2251. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2242-2244. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2242-2244. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2242-2244.

エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4058のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4056-4066. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4056-4066. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4056-4066. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4056-4058. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4056-4058. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4056-4058.

場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 421-431. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 421-431. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 421-423. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 421-423.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:421-431のいずれか1つのN末端またはC末端で、あるいは、配列番号:421-431のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 421-431 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 421-431. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5495-5502のいずれかを含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is at least about 60-100 of any one of SEQ ID NOs: 5495-5502 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about about. It may have at least about 80% sequence identity to the contiguous nucleotides of 90). In some cases, the tracrRNA is at least about 60-90 of any one of SEQ ID NOs: 5495-5502 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Or at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about about 90) contiguous nucleotides. It may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60-100 of any one of SEQ ID NOs: 5495-5502 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, Alternatively, it may be substantially identical to at least about 90) contiguous nucleotides. The tracrRNA may comprise any of SEQ ID NOs: 5495-5502.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5466-5467のいずれか1つに対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5466-5467のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5466-5467のいずれか1つと実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease has at least about 80% identity to any one of SEQ ID NOs: 5466-5467. May include sequences having. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94% with respect to any one of SEQ ID NOs: 5466-5467. %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% of sequences having the same identity. The sgRNA may contain a sequence that is substantially identical to any one of SEQ ID NOs: 5466-5467.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2242-2251のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5578-5580のいずれか1つと実質的に同一の配列、あるいは、配列番号:5578-5580のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2242-2251. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially the same as any one of SEQ ID NO: 5578-5580, or any one of SEQ ID NO: 5578-5580. At least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75. %, At least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% of variants having identity. It may be included. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG4酵素 MG4 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2253-2481のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NO: 2253-2481. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NO: 2253-2481. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2253-2481. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2253-2481. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2253-2481. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2253-2481.

エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4067-4295. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4067-4295. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4067-4295. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4067-4295. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4067-4295. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4067-4295.

場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 432-660. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 432-660. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 432-660. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 432-660.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:432-660のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 432-660 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 432-660. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5503を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5503 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5503 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5503 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5503.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5468に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5468に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5468と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5468. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5468. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5468.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2253-2481のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NO: 2253-2481. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG6酵素 MG6 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2482-2489のいずれか1つに実質的に同一である。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NO: 2482-2489. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2482-2489. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2482-2489.

エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4296-4303. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4296-4303. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4056-4066.

場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 661-668. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 661-668.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:661-668のいずれか1つのN末端またはC末端で、あるいは、配列番号:661-668のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 661-668 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 661-668. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるガイドRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different guide RNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is. 3'for the first region. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2482-2489のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NO: 2482-2489. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG7酵素 MG7 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2490-2498のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2490-2498. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2490-2498. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2490-2498. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2490-2498. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2490-2498. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2490-2498.

エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4304-4212. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4304-4212. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4304-4212. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4304-4212. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4304-4212. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4304-4212.

場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 669-677. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 669-677. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 669-677. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 669-677.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:669-677のいずれか1つのN末端またはC末端で、あるいは、配列番号:669-677のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 669-677 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 669-677. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5504を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5504 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5504 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5504 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5504.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2490-2498のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2490-2498. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG14酵素 MG14 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2499-2750のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2499-2750. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2499-2750. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2499-2750. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2499-2750. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2499-2750. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2499-2750.

エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4313-4564. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4313-4564. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4313-4564. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4313-4564. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4067-4295. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4313-4564.

場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 678-929. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 678-929. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 678-929. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 678-929.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:678-929のいずれか1つのN末端またはC末端で、あるいは、配列番号:678-929のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 678-929 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 678-929. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5505を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5505 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5505 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5505 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5505.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5469に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5469に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5469と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5469. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5469. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5469.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2499-2750のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5581と実質的に同一の配列、あるいは、配列番号:5581に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2499-2750. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5581, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5581. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG15酵素 MG15 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2751-2913のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2751-2913. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2751-2913. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2751-2913. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2751-2913. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2751-2913. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2751-2913.

エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4565-4727. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4565-4727. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4565-4727. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4565-4727. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4565-4727. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4565-4727.

場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 930-1092. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 930-1092. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 930-1092. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 930-1092.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:930-1092のいずれか1つのN末端またはC末端で、あるいは、配列番号:930-1092のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 930-1092 at the N-terminus or C-terminus, or to any one of SEQ ID NOs: 930-1092. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5506を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5506 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5506 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5506 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5506.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5470に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5470に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5470と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5470. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5470. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5470.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2751-2913のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5582と実質的に同一の配列、あるいは、配列番号:5582に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2751-2913. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5582, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5582. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG16酵素 MG16 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2914-3174のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2914-3174. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 2914-3174. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 2914-3174. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2914-3174. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 2914-3174. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2914-3174.

エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4728-4988. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4728-4988. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4728-4988. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4728-4988. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4728-4988. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4728-4988.

場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1093-1353. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1093-1353. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1093-1353. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1093-1353.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1093-1353のいずれか1つに対してN末端またはC末端で、あるいは、配列番号:1093-1353のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体に、付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at the N-terminus or C-terminus to any one of SEQ ID NO: 1093-1353, or at least about 30%, at least about 35%, to any one of SEQ ID NO: 1093-1353. At least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, It may be added to a variant having at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5507を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5507 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5507 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5507 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5507.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5471に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5471に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5471と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5471. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5471. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence substantially identical to SEQ ID NO: 5471.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2914-3174のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5583と実質的に同一の配列、あるいは、配列番号:5583に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 2914-3174. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5583, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5583. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG18酵素 MG18 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3175-3300のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3175-3300. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 3175-3300. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 3175-3300. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3175-3300. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 3175-3300. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3175-3300.

エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4989-5146. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4989-5146. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4989-5146. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4989-5146. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 4989-5146. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 4989-5146.

場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1354-1511. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1354-1511. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1354-1511. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1354-1511.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1354-1511のいずれか1つのN末端またはC末端で、あるいは、配列番号:1354-1511のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 1354-1511 at the N-terminus or C-terminus, or to any one of SEQ ID NO: 1354-1511. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5508を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5508 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5508 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5508 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5508.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5472に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5472に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5472と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5472. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5472. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5472.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3175-3300のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5584と実質的に同一の配列、あるいは、配列番号:5584に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 3175-3300. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5584, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5584. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG21酵素 MG21 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3331-3474のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3331-3474. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 3331-3474. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 3331-3474. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3331-3474. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 3331-3474. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3331-3474.

エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5147-5290. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5147-5290. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5147-5290. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5147-5290. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5147-5290. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5147-5290.

場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1512-1655. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1512-1655. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1512-1655. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1512-1655.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1512-1655のいずれか1つのN末端またはC末端で、あるいは、配列番号:1512-1655のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 1512-1655 at the N-terminus or C-terminus, or to any one of SEQ ID NOs: 1512-1655. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5509を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5509 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5509 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5509 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5509.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5473に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5473に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5473と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5473. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5473, It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5473.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3331-3474のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5585と実質的に同一の配列、あるいは、配列番号:5585に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 3331-3474. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5585, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5585. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG22酵素 MG22 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3475-3568のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3475-3568. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 3475-3568. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 3475-3568. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3475-3568. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 3475-3568. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3475-3568.

エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5291-5389. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5291-5389. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5291-5389. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5291-5389. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5291-5389. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5291-5389.

場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1656-1755. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1656-1755. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1656-1755. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1656-1755.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:1656-1755のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 432-660 at the N-terminus or C-terminus, or to any one of SEQ ID NOs: 1656-1755. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5510を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5510 of at least about 60-100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5510 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5510 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5510.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5474に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5474に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5474と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5474. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5474. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5474.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3475-3568のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5586と実質的に同一の配列、あるいは、配列番号:5586に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 3475-3568. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5586, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5586. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

MG23酵素 MG23 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3569-3637のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system comprising (a) endonucleases. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3569-3637. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least for any one of SEQ ID NOs: 3569-3637. About 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least About 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least It has about 98%, at least about 99% identity. In some cases, the endonuclease may include the RuvC_III domain, which is substantially identical to any one of SEQ ID NOs: 3569-3637. The endonuclease may contain a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3569-3637. In some cases, endonucleases are at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about about any one of SEQ ID NOs: 3569-3637. 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about RuvC_III domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, and at least about 99% identity. It may be included. In some cases, the endonuclease may contain a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3569-3637.

エンドヌクレアーゼは、配列番号:5390-5640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5390-5640. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5390-5460. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5390-5460. The endonuclease may contain an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5390-5460. In some cases, endonucleases are at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about about any one of SEQ ID NOs: 5390-5460. HNH domains with 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. The endonuclease may contain an HNH domain that is substantially identical to any one of SEQ ID NOs: 5390-5460.

場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。 In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1756-1826. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1756-1826. In some cases, endonucleases are at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about about any one of SEQ ID NOs: 1756-1826. 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about It may contain variants having 97%, at least about 98%, or at least about 99% identity. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1756-1826.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1756-1826のいずれか1つのN末端またはC末端で、あるいは、配列番号:1756-1826のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, endonucleases may contain variants with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40 to any one of SEQ ID NOs: 1756-1826 at the N-terminus or C-terminus, or to any one of SEQ ID NOs: 1756-1826. %, At least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, At least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% may be added at the N-terminus or C-terminus of the variant. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, and at least about 99% identity to any one of SEQ ID NOs: 5593-5608. Can be done. The NLS can comprise a sequence that is substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any or a combination of the sequences in Table 1.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity uses the BLASTUM62 scoring matrix, which uses parameters of 3 wordlength (W), 10 extraction (E), and sets the gap cost at 11 exhibitions, 1 extension, and conditional composition. Score matrix adjustments can be used to determine with the BLASTP algorithm.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 In some cases, the system may (b) form a complex with an endonuclease having a 5'targeting region complementary to the desired cleavage sequence, at least one engineered synthetic guide ribonucleic acid (sgRNA). May include. In some cases, the 5'targeting region may contain PAM sequences compatible with endonucleases. In some cases, most of the 5'nucleotides in the targeting region may be G. In some cases, the 5'targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be supplied as separate ribonucleic acid (RNA) or single ribonucleic acid (RNA). The guide RNA may contain a crRNA tracrRNA binding sequence in 3'of the targeting region. The guide RNA may contain a tracrRNA sequence in which the 4-nucleotide linker precedes the 3'of the crRNA tracrRNA binding region. The sgRNA may contain, from 5'to 3', an unnatural guide nucleic acid sequence capable of hybridizing to the cell's target sequence, and a tracr sequence. In some cases, the unnatural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5511を含んでもよい。 In some cases, the tracr sequence may have a special sequence. The tracr sequence is a contiguous nucleotide of at least about 60-100 of the native tracrRNA sequence (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). May have at least about 80% with respect to. The tracr sequence is a contiguous nucleotide of SEQ ID NO: 5511 of at least about 60-100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may have at least about 80% sequence identity with respect to. In some cases, the tracrRNA is at least about 60-90 of SEQ ID NO: 5511 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 relative to consecutive nucleotides. %, At least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60-100 of SEQ ID NO: 5511 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90). It may be substantially identical to a contiguous nucleotide. The tracrRNA may comprise SEQ ID NO: 5511.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5475に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5475に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5475と実質的に同一の配列を含んでもよい。 In some cases, at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may contain a sequence having at least about 80% identity to SEQ ID NO: 5475. .. The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5475. It may contain sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may contain a sequence that is substantially identical to SEQ ID NO: 5475.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may contain two different sgRNAs that target the first and second regions for cleavage at the target DNA locus, where the second region is the second. It is 3'for the region of 1. In some cases, the system may have at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides from 5'to 3'and 5'in the first region. A first homology arm containing the sequence of, a synthetic DNA sequence of at least about 10 nucleotides, and at least about 20 (eg, at least about 40, 80, 120, 150, 200, 300, 3'in the second region. It may include a single-stranded or double-stranded DNA repair template containing a second homology arm containing a sequence of 500, or 1 kb) nucleotides.

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In another aspect, the present disclosure provides a method for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including the enzyme disclosed herein and at least one synthetic guide RNA (sgRNA), to the target nucleic acid locus. But it may be. The enzyme may form a complex with at least one sgRNA and may modify the desired target nucleic acid locus when the complex binds to the desired target nucleic acid locus. Delivering the enzyme to the locus may include transfecting the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include electroporating the cell with the system or nucleic acid encoding the system. Delivering the nuclease to the locus may include incubating the system in a buffer containing the nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be in eukaryotic cells or in prokaryotic cells. The cells may be animal cells, human cells, bacterial cells, paleobacterial cells, or plant cells. The enzyme may induce single-strand or double-strand breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3569-3637のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5587と実質的に同一の配列、あるいは、配列番号:5587に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 Where the locus of the target nucleic acid can be intracellular, the enzyme is at least about 75% (eg, at least about 90%, at least about 91%, at least) relative to any one of SEQ ID NOs: 3569-3637. Enzymes with a RuvC_III domain with identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may be supplied as a nucleic acid containing an open reading frame to encode. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5587, or at least about 30%, at least about 35%, or at least relative to SEQ ID NO: 5587. About 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least It may contain variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the nucleic acid comprises a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be supplied as a deoxyribonucleic acid (DNA) comprising a gene sequence encoding the at least one engineered sgRNA operably linked to the ribonucleic acid (RNA) pol III promoter. .. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be human.

実施例1.-新規なタンパク質のためのメタゲノム解析
メタゲノム試料を堆積物、土壌、および動物から集めた。デオキシリボ核酸(DNA)を、ZymobiomicsのDNA mini-prep kitを用いて抽出し、Illumina HiSeqR 2500で配列決定した。所有者の同意を得て試料を採取した。公的な情報源からの生の配列データは、動物のマイクロバイオーム、堆積物、土壌、温泉、熱水噴出孔、海洋、泥炭湿地、永久凍土、および下水のシーケンスを含んでいた。メタゲノム配列データは、タイプIIのCasエフェクタータンパク質を含む既知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを用いて検索された。検索により同定された新規なエフェクタータンパク質を、既知のタンパク質にアラインメントして、潜在的な活性部位を特定した。このメタゲノムワークフローにより、本明細書に記載されるクラスII、タイプIIのCRISPRエンドヌクレアーゼのMG1、MG2、MG3、MG4、MG6、MG14、MG15、MG16、MG18、MG21、MG22、およびMG23のファミリーを解明した。
Example 1. -Metagenomic analysis for novel proteins Metagenomic samples were collected from sediments, soil, and animals. Deoxyribonucleic acid (DNA) was extracted using the Zymobilics DNA mini-prep kit and sequenced on Illumina HiSeqR 2500. Samples were taken with the consent of the owner. Raw sequence data from public sources included sequences of animal microbiomes, sediments, soils, hot springs, hydrothermal vents, oceans, peat swamps, permafrost, and sewage. Metagenomic sequence data were retrieved using a hidden Markov model generated based on known Cas protein sequences, including Type II Cas effector proteins. The novel effector proteins identified by the search were aligned with known proteins to identify potential active sites. This metagenomic workflow elucidates a family of class II, type II CRISPR endonucleases MG1, MG2, MG3, MG4, MG6, MG14, MG15, MG16, MG18, MG21, MG22, and MG23 described herein. did.

実施例2A.-CRISPRシステムのMG1ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、当初は6つのメンバー(それぞれ配列番号:5、6、1、2、および3として記録されたMG1-1、MG1-2、MG1-3、MG1-4、MG1-5、およびMG1-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかとなった。このファミリーは、HNHドメインとRuvCドメインを有する酵素を特徴としている。このファミリーのRuvCドメインは、これまでに記載されたCas9ファミリーメンバーとの相同性が低いRuvC_III部分を有している。当初のファミリーメンバーは最大56.8%の同一性を有しているが、6つの酵素はすべてRuvCドメインのRuvC_III部分が分岐しており、RHHALDAMV(配列番号:5615)、KHHALDAMC(配列番号:5616)、またはKHHALDAIC(配列番号:5617)の共通モチーフを持っている。これらのモチーフは、記載されている他のCas9様酵素には見られないものである。これらの新しい酵素とその関連するサブドメインに対応するタンパク質と核酸の配列は、配列表に提示されている。推定tracrRNA配列は、他の遺伝子との相対的な位置関係に基づいて同定され、配列番号:5476-5479として提示されている。酵素システムは、CRISPRシステムを含むゲノムビンからの16S rRNAの配列に基づいて、Phylum Verrucomicrobia、Phylum Candidatus Peregrinibacteria、またはPhylum Candidatus Melainabacteriaに由来すると思われる。16S rRNAの配列は、配列番号:5592-5596として提示されている。Shmakovらによって記載された特徴を呼び起こすCRISPRシステム配列の詳細なドメインレベルのアラインメント(Mol Cell.2015 Nov 5;60(3):385-97)が図9A、9B、9C、9D、9E、9F、9G、および9Hに描かれている。MG1-1、1-2、および1-3と、追加の独自のタンパク質データセットとを比較すると、配列番号:7-319として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。これらのMG1タンパク質の配列により、配列番号:5618-5632に示されるような追加のMG1モチーフが発見された。
Example 2 A. -Discovery of the MG1 family of the CRISPR system When the metagenomic analysis data of Example 1 were analyzed, initially 6 members (MG1-1, MG1-, respectively recorded as SEQ ID NOs: 5, 6, 1, 2, and 3 respectively). 2. A new cluster of previously undescribed putative CRISPR systems including MG1-3, MG1-4, MG1-5, and MG1-6) has been identified. This family features enzymes with HNH and RuvC domains. The RuvC domain of this family has a RuvC_III moiety that is less homologous to previously described Cas9 family members. Although the initial family members have up to 56.8% identity, all six enzymes have the RuvC_III portion of the RuvC domain branched, RHHALDAMV (SEQ ID NO: 5615), KHHALDAMC (SEQ ID NO: 5616). ), Or has a common motif of KHHALDAIC (SEQ ID NO: 5617). These motifs are not found in the other Cas9-like enzymes described. The sequences of proteins and nucleic acids corresponding to these new enzymes and their associated subdomains are presented in the sequence listing. The putative tracrRNA sequence has been identified based on its relative positional relationship with other genes and is presented as SEQ ID NO: 5476-5479. The enzymatic system appears to be derived from Phyllum Verrucomicrobiota, Phylum Candidatus Peregrinibacteria, or Phylum Candidatus Melainabacteria, based on the sequence of 16S rRNA from the phylum bin containing the CRISPR system. The sequence of 16S rRNA is presented as SEQ ID NO: 5592-5596. A detailed domain-level alignment of the CRISPR system sequence that evokes the features described by Shmakov et al. (Mol Cell. 2015 Nov 5; 60 (3): 385-97) is shown in FIGS. 9A, 9B, 9C, 9D, 9E, 9F, It is drawn on 9G and 9H. Comparing MG1-1, 1-2, and 1-3 with additional proprietary protein datasets reveals additional protein sequences with a similar architecture presented as SEQ ID NO: 7-319. rice field. The sequences of these MG1 proteins revealed additional MG1 motifs as set forth in SEQ ID NO: 5618-5632.

実施例2B.-CRISPRシステムのMG2ファミリーの発見
実施例1のメタゲノム解析からのデータを解析すると、6つのメンバー(MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかになった。これらの新しい酵素と例示的なサブドメインに対応するタンパク質と核酸の配列は、配列番号:320、322-325として提示されている。他の遺伝子との相対的な位置関係から、推定tracrRNA配列がオペロン内で同定され、配列番号:5490、5492-5494、および5538として提示されている。これらの配列対Cas9の詳細なドメインレベルのアラインメントは、Shmakovらにより示されているように(Mol Cell. 2015 Nov 5;60(3):385-97.)、図7に描かれている。
Example 2 B. -Discovery of the MG2 family of the CRISPR system Analyzing the data from the metagenomic analysis of Example 1, so far it contains 6 members (MG2-1, MG2-2, MG2-3, MG2-5, and MG2-6). A new cluster of putative CRISPR systems not listed in is revealed. The protein and nucleic acid sequences corresponding to these new enzymes and exemplary subdomains are presented as SEQ ID NOs: 320, 322-325. Estimated tracrRNA sequences have been identified within the operon from their relative positional relationships with other genes and are presented as SEQ ID NOs: 5490, 5492-5494, and 5538. Detailed domain-level alignments of these sequences vs. Cas9 are depicted in FIG. 7 as shown by Shmakov et al. (Mol Cell. 2015 Nov 5; 60 (3): 385-97.).

MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6の組み合わせと、追加の独自のタンパク質データセットとを比較すると、配列番号:321および326-420として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。MG2ファミリーメンバーによく見られるモチーフは、配列番号:5631-5638として提示されている。 Comparing the combination of MG2-1, MG2-2, MG2-3, MG2-5, and MG2-6 with an additional proprietary protein dataset, the similarities presented as SEQ ID NOs: 321 and 326-420. Additional protein sequences with the same architecture have been revealed. A common motif among MG2 family members is presented as SEQ ID NO: 5631-5638.

実施例2C.-CRISPRシステムのMG3ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、新たにこれまでに記載されていない推定CRISPRシステム:MG3-1が明らかになった。この新しい酵素とその例示的なサブドメインの対応するアミノ酸配列は、配列番号:424、2245、および4059として提示されている。オペロンの他の要素との近接性に基づいて、推定tracrRNA含有配列が同定され、配列番号:5498として含まれている。この配列対Actinomyces naeslundii由来のCas9とのドメインレベルの詳細なアラインメントが図8に示されている。
Example 2 C.I. -Discovery of MG3 family of CRISPR system Analysis of the data of the metagenome analysis of Example 1 revealed a newly undescribed estimated CRISPR system: MG3-1. The corresponding amino acid sequences of this new enzyme and its exemplary subdomains are presented as SEQ ID NOs: 424, 2245, and 4059. A putative tracrRNA-containing sequence has been identified based on its proximity to other elements of the operon and is included as SEQ ID NO: 5498. A detailed domain-level alignment of this sequence with Cas9 from Actinomyces naeslundii is shown in FIG.

MG3-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:421-423、425-431として提示されている、類似した構造のさらなるタンパク質配列が明らかになった。 Comparing MG3-1 with other proprietary protein datasets revealed additional protein sequences with similar structures, presented as SEQ NO: 421-423, 425-431.

実施例2D.-CRISPRシステムのMG4、7、14、15、16、18、21、22、23ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、1メンバーずつの9ファミリー(MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1)を含む、これまでに記載されていない推定CRISPRシステムの新たなクラスターが明らかになった。これらの新しい酵素とその例示的なサブドメインに対応するタンパク質および核酸の配列は、配列番号:432、669、678、930、1093、1354、1512、1656、1756として提示されている。オペロンの他の要素との近接性に基づいて、各ファミリーについて推定tracr含有配列が同定された。これらの配列は、それぞれ配列番号:5503-5511として配列表に提示されている。
Example 2D. -Discovery of MG4, 7, 14, 15, 16, 18, 21, 22, 23 families of CRISPR system When the data of metagenomic analysis of Example 1 is analyzed, 9 families (MG4-5, MG7-2) of 1 member each are analyzed. , MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1), revealing a new cluster of previously undescribed estimated CRISPR systems. rice field. The sequences of proteins and nucleic acids corresponding to these new enzymes and their exemplary subdomains are presented as SEQ ID NOs: 432, 669, 678, 930, 1093, 1354, 1512, 1656, 1756. Estimated tracr-containing sequences were identified for each family based on their proximity to other elements of the operon. Each of these sequences is presented in the sequence listing as SEQ ID NO: 5503-5511.

MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:433-660、670-677、679-929、931-1092、1094-1353、1355-1511、1513-1655、1657-1755、および1757-1826として提示されている、類似のアーキテクチャを持つ追加のタンパク質配列が明らかになった。これらのセットのCRISPRシステムのヌクレアーゼに共通するモチーフは、MG4については配列番号:5649、MG14については配列番号:5650-5667、MG15については配列番号:5668-5675、MG16については配列番号:5676-5678、MG18については配列番号:5679-5686、MG21については配列番号:5687-5693および配列番号:5674-5675、MG22については配列番号:5694-5699、ならびにMG23については配列番号:5700-5717として提示されている。 Comparing MG4-5, MG7-2, MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1 with other proprietary protein datasets, SEQ NO. : Additional with similar architectures presented as 433-660, 670-677, 679-929, 931-1092, 1094-1353, 1355-1511, 1513-1655, 1657-1755, and 1757-1826. The protein sequence was revealed. Common motifs in these sets of CRISPR system nucleases are SEQ ID NO: 5649 for MG4, SEQ ID NO: 5650-5667 for MG14, SEQ ID NO: 5668-5675 for MG15, and SEQ ID NO: 5676- for MG16. 5678, SEQ ID NO: 5679-5686 for MG18, SEQ ID NO: 5678-5693 and SEQ ID NO: 5674-5675 for MG21, SEQ ID NO: 5694-569 for MG22, and SEQ ID NO: 5700-5717 for MG23. It has been presented.

実施例3.-予言的(Prophetic)--プロトスペーサー隣接モチーフ(Protospacer-Adjacent Motif)の決定.
実験は、Karvelis et al. Methods. 2017 May 15;121-122:3-8(参照により本明細書に全体として組み込まれる)の例のいずれかのように行われ、本明細書に記載される新規の酵素に対するプロトスペーサー隣接モチーフ(PAM)配列特異性を特定して、最適な合成配列の標的化を可能にする。
Example 3. -Prophetic --- Determination of Protospacer-Adjacent Motif.
The experiment was carried out by Karvelis et al. Methods. Protospacer flanking motifs for novel enzymes described herein, performed as in any of the examples of 2017 May 15; 121-122: 3-8 (incorporated herein as a whole by reference). PAM) Identify sequence specificity and allow targeting of optimal synthetic sequences.

一例(インビボスクリーン)では、本明細書に記載されている酵素のいずれかをコードするプラスミドと、プロトスペーサーを標的とするガイドRNAとを有する細胞は、抗生物質耐性遺伝子を含むプラスミドライブラリ、およびランダム化されたPAM配列と隣接しているプロトスペーサー配列で同時形質転換される。機能的なPAMを含むプラスミドは、酵素によって切断され、細胞死に至る。生き残った細胞から単離された酵素切断抵抗性プラスミドプールをディープシーケンシングすると、機能的な切断を可能にするPAMを含む枯渇したプラスミドのセットが示される。 In one example (in vivo screen), cells having a plasmid encoding any of the enzymes described herein and a guide RNA targeting a protospacer are a plasmid library containing an antibiotic resistance gene, and random. It is co-transformed with a plasmid sequence adjacent to the plasmidized PAM sequence. The plasmid containing the functional PAM is enzymatically cleaved, leading to cell death. Deep sequencing of a pool of enzyme cleavage-resistant plasmids isolated from surviving cells reveals a set of depleted plasmids containing PAM that allows functional cleavage.

別の例(インビトロスクリーニング)では、DNAプラスミドまたは鎖状体リピートの形態のPAMライブラリは、インビトロまたは細胞溶解物中で組み立てられたRNP複合体(例えば、酵素、tracrRNAおよびcrRNA、または酵素およびハイブリッドsgRNAを含む)による切断に晒される。成功した切断事象から生じる遊離DNA末端は、アダプターライゲーションによって捕捉され、その後、PAM側の生成物のPCR増幅に晒される。増幅された機能的PAMのライブラリは、ディープシーケンシングにかけられ、DNAの切断をライセンス化するPAMが同定される。 In another example (in vitro screening), the PAM library in the form of a DNA plasmid or strand repeat is an RNP complex assembled in vitro or in cytolytic (eg, enzyme, tracrRNA and crRNA, or enzyme and hybrid sgRNA). (Including) exposed to cutting. Free DNA ends resulting from a successful cleavage event are captured by adapter ligation and then exposed to PCR amplification of the product on the PAM side. The library of amplified functional PAMs is subjected to deep sequencing to identify PAMs that license DNA cleavage.

実施例4.-予言的--ゲノム編集のための哺乳動物細胞における本明細書に記載される合成CRISPRシステムの使用例
i)細胞適合性のあるC末端核局在化配列(例えば、ヒト細胞の場合はSV40 NLS)および適切なポリアデニル化シグナル(例えば、ヒト細胞の場合はTK pAシグナル)を有する細胞適合性のあるプロモーターの下で、コドン最適化酵素をコードするORF、および、(ii)適切なポリメラーゼIIIプロモーター(例えば、哺乳動物細胞の場合はU6プロモーター)の下で、sgRNA(Gで始まる5’配列と、続いてゲノムDNAを標的とする相補的な標的化核酸配列20ntと、その後、実施例3を介して同定された対応する適合性のあるPAMと、3’tracr結合配列、リンカー、およびtracrRNA配列を有する)をコードするORF、をコードするDNA/RNA配列が調製される。いくつかの実施形態では、これらの配列は、同じまたは別々のプラスミドベクター上で調製され、これらのプラスミドベクターは、適切な技術を介して真核細胞にトランスフェクトされる。いくつかの実施形態では、これらの配列は、別々のDNA配列として調製され、これが細胞にトランスフェクトされるか、または微量注入される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクトされるか、微量注入される、合成RNAまたはインビトロ転写RNAとして調製される。いくつかの実施形態では、これらの配列は、タンパク質に翻訳され、細胞にトランスフェクトされるか、または微量注入される。
Example 4. -Predictive--Examples of use of the synthetic CRISPR system described herein in mammalian cells for genome editing i) Cell-compatible C-terminal nuclear localization sequences (eg, SV40 for human cells) An ORF encoding a codon-optimizing enzyme under a cell-compatible promoter with NLS) and a suitable polyadenylation signal (eg, TK pA signal for human cells), and (ii) a suitable polymerase III. Under a promoter (eg, U6 promoter in the case of mammalian cells), sgRNA (a 5'sequence starting with G, followed by a complementary targeting nucleic acid sequence 20 nt targeting genomic DNA, followed by Example 3 A DNA / RNA sequence encoding an ORF, which has a 3'tracr binding sequence, a linker, and a tracrRNA sequence) is prepared with the corresponding compatible PAM identified via. In some embodiments, these sequences are prepared on the same or separate plasmid vectors, which are transfected into eukaryotic cells via appropriate techniques. In some embodiments, these sequences are prepared as separate DNA sequences, which are transfected into cells or microinjected. In some embodiments, these sequences are prepared as synthetic RNA or in vitro transcribed RNA that is transfected or microinjected into cells. In some embodiments, these sequences are translated into proteins, transfected into cells, or microinjected.

いずれのトランスフェクション方法が選択されても、(i)と(ii)は細胞内に導入される。酵素および/またはsgRNAが活性形態に転写および/または翻訳されるように、インキュベーション期間を経過させる。インキュベーション期間後、標的化配列の近傍にあるゲノムDNAが(例えば、配列決定によって)解析される。酵素を媒介とした切断と非相同末端結合の結果、標的化配列の近傍にあるゲノムDNAにインデルが導入される。 Regardless of which transfection method is selected, (i) and (ii) are introduced into cells. The incubation period is allowed to elapse so that the enzyme and / or sgRNA is transcribed and / or translated into the active form. After the incubation period, genomic DNA in the vicinity of the targeting sequence is analyzed (eg, by sequencing). As a result of enzyme-mediated cleavage and non-homologous end binding, indels are introduced into genomic DNA near the targeting sequence.

いくつかの実施形態では、(i)および(ii)は、25bp以上のサイズの切断部位に隣接しているゲノムの領域をコードする第3の修復ヌクレオチドとともに細胞に導入されることで、相同性指向の修復が促進される。これらの隣接配列内には、単一の塩基対突然変異、機能的な遺伝子断片、発現のための外来性または天然の遺伝子、あるいは生化学的経路を構成する複数の遺伝子が含まれることがある。 In some embodiments, (i) and (ii) are homologous by being introduced into cells with a third repair nucleotide encoding a region of the genome flanking a cleavage site with a size of 25 bp or greater. Oriented restoration is facilitated. Within these flanking sequences may be a single base pair mutation, a functional gene fragment, an exogenous or natural gene for expression, or multiple genes that make up a biochemical pathway. ..

実施例5.-予言的--インビトロの本明細書に記載される合成CRISPRシステムの使用
本明細書に記載される酵素のいずれかは、精製タグを含む適切な大腸菌発現プラスミドにクローン化され、大腸菌で組換え発現され、組換えタグを用いて精製される。5’Gと、続いて20ntの標的化配列とPAM配列、適合性のあるcrRNAのtracrRNA結合領域、GAAAリンカー、および適合性のあるtracrRNAを含むRNAは、適切な固相RNA合成方法によって合成される。組換え酵素とsgRNAは、Mg2+を含む適切な切断緩衝液(例えば、20mMのHEPES pH7.5、100mMのKCl、5mMのMgCl、1mMのDTT、5%グリセロール)に配合され、標的化配列とPAM配列に相補的な配列を含む標的DNAを導入することで、反応が開始する。DNAの切断は、適切なアッセイ(例えば、アガロースゲル電気泳動と、その後の臭化エチジウム染色(または同様に作用するDNA挿入剤)およびUV可視化)によってモニタリングされる。
Example 5. -Predictive--Use of the synthetic CRISPR system described herein In vitro Any of the enzymes described herein is cloned into a suitable E. coli expression plasmid containing a purification tag and recombined with E. coli. It is expressed and purified using a recombinant tag. RNA containing 5'G followed by a 20 nt targeting and PAM sequence, a compatible crRNA tracrRNA binding region, a GAAA linker, and a compatible tracrRNA was synthesized by a suitable solid phase RNA synthesis method. To. The recombinant enzyme and sgRNA were formulated with a suitable cleavage buffer containing Mg2 + (eg, 20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl 2 , 1 mM DTT, 5% glycerol) and with the targeting sequence. The reaction is initiated by introducing a target DNA containing a sequence complementary to the PAM sequence. DNA cleavage is monitored by appropriate assays (eg, agarose gel electrophoresis followed by ethidium bromide staining (or similarly acting DNA inserts) and UV visualization).

実施例6.-(一般プロトコル)本明細書に記載されるエンドヌクレアーゼのPAM配列同定/確認
PAM配列は、大腸菌ライセートベースの発現システム(myTXTL、Arbor Biosciences)で発現した推定エンドヌクレアーゼで切断できるランダムに生成されたPAM配列を含むプラスミドを配列決定することによって決定された。このシステムでは、大腸菌コドン最適化ヌクレオチド配列が、T7プロモーターの制御下でPCR断片から転写および翻訳された。T7プロモーター下でtracr配列と、T7プロモーターとその後のリピート-スペーサー-リピート配列から構成される最小CRISPRアレイとを有する第2のPCR断片が同じ反応で転写された。TXTLシステムにおけるエンドヌクレアーゼとtracr配列の発現に成功し、その後のCRISPRアレイ処理を行うことで、インビトロで活性のCRISPRヌクレアーゼ複合体が得られた。
Example 6. -(General Protocol) PAM Sequence Identification / Confirmation of Endonucleases Described herein PAM sequences were randomly generated that could be cleaved with putative endonucleases expressed on E. coli lysate-based expression systems (myTXTL, Arbor Biosciences). It was determined by sequencing a plasmid containing the PAM sequence. In this system, E. coli codon-optimized nucleotide sequences were transcribed and translated from PCR fragments under the control of the T7 promoter. A second PCR fragment with a tracr sequence under the T7 promoter and a minimal CRISPR array consisting of the T7 promoter followed by a repeat-spacer-repeat sequence was transcribed in the same reaction. Successful expression of endonucleases and tracr sequences in the TXTL system and subsequent CRISPR array treatment yielded an active CRISPR nuclease complex in vitro.

最小限のアレイに一致するスペーサー配列と、その後の8Nの混合塩基(推定PAM配列)とを含む標的プラスミドのライブラリは、TXTL反応の出力と一緒にインキュベートされた。1-3時間後に反応を停止し、DNAクリーンアップキット、例えば、Zymo DCC、AMPure XP beads、QiaQuickなどを用いてDNAを回収した。アダプター配列は、エンドヌクレアーゼによって切断された活性なPAM配列を持つDNAに平滑末端ライゲーションされ、一方、切断されなかったDNAはライゲーションに利用できなかった。次に、活性なPAM配列を含むDNAセグメントは、ライブラリとアダプター配列に特異的なプライマーを用いてPCRで増幅された。PCR増幅産物をゲル上で分離させ、切断事象に対応するアンプリコンを同定した。切断反応の増幅セグメントは、NGSライブラリを調製するための鋳型としても使用された。最初の8Nライブラリのサブセットであった、この結果として生じたライブラリを配列決定することで、活性なCRISPR複合体の正確なPAMを含む配列が明らかになった。単一のRNAコンストラクトを用いたPAMテストでは、インビトロで転写されたRNAがプラスミドライブラリとともに加えられ、tracr/最少CRISPRアレイ鋳型が省略された以外は、同じ手順が繰り返された。NGSライブラリが調製されたエンドヌクレアーゼについては、seqLogo(例えば、Huber et al.Nat Methods.2015 Feb;12(2):115-21)の表現が構築され、図27、38、29、30、31、32、33、34、および35で提示されている。これらの表現を構築するために使用されるseqLogoモジュールは、DNA配列モチーフ(例えば、PAM配列)の位置特異的重み行列(position weight matrix)を取り、SchneiderとStephensが導入した対応する配列ロゴをプロットする(例えば、Schneider et al.Nucleic Acids Res.1990 Oct 25;18(20):6097-100を参照)。seqLogo表現における配列を表す文字は,アラインメントされた配列(例えば、PAM配列)の各位置について互いに重ねられている。各文字の高さはその頻度に比例しており、最も多いものが上にくるように文字を並べ替えている。 A library of target plasmids containing a spacer sequence matching the minimal array followed by a mixed base of 8N (estimated PAM sequence) was incubated with the output of the TXTL reaction. After 1-3 hours, the reaction was stopped and DNA was recovered using a DNA cleanup kit such as Zymo DCC, AMPure XP beads, QiaQuick and the like. The adapter sequence was blunt-ended ligated to DNA with the active PAM sequence cleaved by the endonuclease, while the uncleaved DNA was not available for ligation. The DNA segment containing the active PAM sequence was then amplified by PCR using primers specific for the library and adapter sequence. The PCR amplification product was separated on the gel to identify the amplicon corresponding to the cleavage event. The amplified segment of the cleavage reaction was also used as a template for preparing the NGS library. Sequencing the resulting library, which was a subset of the first 8N library, revealed a sequence containing the exact PAM of the active CRISPR complex. In the PAM test with a single RNA construct, the same procedure was repeated except that the RNA transcribed in vitro was added with the plasmid library and the tracr / minimal CRISPR array template was omitted. For the endonucleases for which the NGS library was prepared, the representation of seqLogo (eg, Huber et al. Nat Methods. 2015 Feb; 12 (2): 115-21) was constructed and FIGS. 27, 38, 29, 30, 31 , 32, 33, 34, and 35. The seqLogo module used to construct these representations takes a position weight matrix of DNA sequence motifs (eg, PAM sequences) and plots the corresponding sequence logos introduced by Schneider and Stephens. (See, for example, Schneider et al. Nucleic Acids Res. 1990 Oct 25; 18 (20): 6097-100). The characters representing the sequences in the seqLogo representation are superimposed on each other for each position of the aligned sequence (eg, PAM sequence). The height of each letter is proportional to its frequency, and the letters are rearranged so that the most common one is on top.

実施例7.-(一般的なプロトコル)tracrRNAとsgRNAの構造のRNA折り畳み
ガイドRNA配列の37℃での折り畳み構造は、Andronescu et al. Bioinformatics.2007 Jul 1;23(13):i19-28の方法を用いて計算された。本明細書に記載される例示的なsgRNAの予測構造を、図21、22、23、24、25、および26に示す。
Example 7. -(General protocol) RNA folding of tracrRNA and sgRNA structures The folding structure of the guide RNA sequence at 37 ° C. is described in Andronescu et al. Bioinformatics. 2007 Jul 1; 23 (13): Calculated using the method i19-28. Exemplary sgRNA predictive structures described herein are shown in FIGS. 21, 22, 23, 24, 25, and 26.

実施例8.-(一般的なプロトコル)MG CRISPR複合体のインビトロ切断効率
エンドヌクレアーゼは、プロテアーゼ欠損大腸菌B株において、誘導性T7プロモーターからHisタグ付けされた融合タンパク質として発現した。Hisタグ付けされたタンパク質を発現する細胞を超音波で溶解し、Hisタグ付けされたタンパク質は、AKTA Avant FPLC(GE Lifescience)上のHisTrap FFカラム(GE Lifescience)でのNi-NTAアフィニティークロマトグラフィーによって精製された。溶出物をアクリルアミドゲル(Bio-Rad)上でSDS-PAGEにより分解し、InstantBlue Ultrafastクーマシー(Sigma-Aldrich)で染色した。純度は、ImageLabソフトウェア(Bio-Rad)を用いたタンパク質バンドの濃度測定を用いて決定された。精製されたエンドヌクレアーゼは、50mMのTris-HCl、300mMのNaCl、1mMのTCEP、5%グリセロール;pH7.5からなる保存緩衝液に透析され、-80℃で保存された。
Example 8. -(General protocol) In vitro cleavage efficiency endonuclease of MG CRISPR complex was expressed in protease-deficient E. coli strain B as a His-tagged fusion protein from the inducible T7 promoter. Cells expressing the His-tagged protein are lysed with ultrasound and the His-tagged protein is subjected to Ni-NTA affinity chromatography on a HisTrap FF column (GE Lifescience) on an AKTA Avant FPLC (GE Lifecare). Purified. The eluate was decomposed by SDS-PAGE on an acrylamide gel (Bio-Rad) and stained with InstantBlue Ultrafast Coomassie (Sigma-Aldrich). Purity was determined using protein band concentration measurements using ImageLab software (Bio-Rad). The purified endonuclease was dialyzed against a storage buffer consisting of 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP, 5% glycerol; pH 7.5 and stored at -80 ° C.

スペーサー配列とPAM配列(例えば、実施例6のように決定される)を含む標的DNAはDNA合成により構築された。代表的な1つのPAMは、PAMが縮重塩基を有する場合に、試験のために選択された。標的DNAは、一端から700bpに位置するPAMとスペーサーを用いたPCR増幅によってプラスミドから得られた2200bpの直鎖状DNAを含んでいた。切断に成功すると、700bpと1500bpの断片が得られた。標的DNA、インビトロ転写された単一のRNA、および精製された組換えタンパク質を、余剰なタンパク質とRNAを含む切断緩衝液(10mMのTris、100mMのNaCl、10mMのMgCl)で組み合わせ、5分から3時間、通常は1時間インキュベートした。反応を、RNAse Aの添加と60分でのインキュベーションによって停止させた。その後、反応物を1.2%TAEアガロースゲルで分解し、ImageLabソフトウェアで切断された標的DNAの割合を定量化する。 The target DNA containing the spacer sequence and the PAM sequence (eg, as determined in Example 6) was constructed by DNA synthesis. One representative PAM was selected for testing when the PAM had a degenerate base. The target DNA contained 2200 bp linear DNA obtained from the plasmid by PCR amplification with PAM located 700 bp from one end and spacers. Successful cleavage yielded 700 bp and 1500 bp fragments. The target DNA, a single RNA transcribed in vitro, and the purified recombinant protein are combined with a cleavage buffer containing excess protein and RNA (10 mM Tris, 100 mM NaCl, 10 mM MgCl 2 ) from 5 minutes. Incubated for 3 hours, usually 1 hour. The reaction was stopped by the addition of RNAse A and incubation at 60 minutes. The reactants are then degraded on a 1.2% TAE agarose gel and the percentage of target DNA cleaved with ImageLab software is quantified.

実施例9.-(一般的なプロトコル)大腸菌中のMG CRISPR複合体のゲノム切断活性の試験
大腸菌は、二本鎖DNAの切断を効率的に修復する能力を持っていない。そのため、ゲノムDNAの切断は致死的な事象となり得る。この現象を利用して、ゲノムDNAにスペーサー/標的配列とPAM配列を組み込んだ標的株でエンドヌクレアーゼとtracrRNAを組換え発現させることによって、大腸菌においてエンドヌクレアーゼ活性を試験した。
Example 9. -(General Protocol) Testing the Genome Cleavage Activity of the MG CRISPR Complex in E. coli E. coli does not have the ability to efficiently repair double-stranded DNA cleavage. Therefore, cleavage of genomic DNA can be a fatal event. Utilizing this phenomenon, endonuclease activity was tested in E. coli by recombinantly expressing endonucleases and tracrRNAs in target strains in which a spacer / target sequence and a PAM sequence were incorporated into genomic DNA.

このアッセイでは、PAM配列は、実施例6に記載される方法で決定されたように試験対象のエンドヌクレアーゼに特異的である。sgRNA配列は、tracrRNAの配列と予測される構造に基づいて決定された。リピートの5’末端から始めて、8~12bp(一般的には10bp)のリピート-アンチリピートの対を選択した。残りのリピートの3’末端とtracrRNAの5’末端をテトラループに置き換えた。一般に、テトラループはGAAAであったが、特にGAAA配列が折り畳みを阻害すると予測される場合には、他のテトラループを使用することができる。このような場合には、TTCGテトラループを用いた。 In this assay, the PAM sequence is specific to the endonuclease under test as determined by the method described in Example 6. The sgRNA sequence was determined based on the expected structure of the traceRNA sequence. Starting from the 5'end of the repeat, a repeat-anti-repeat pair of 8-12 bp (typically 10 bp) was selected. The 3'end of the remaining repeats and the 5'end of tracrRNA were replaced with tetraloop. Generally, the tetraloop was GAAA, but other tetraloops can be used, especially if the GAAA sequence is expected to inhibit folding. In such a case, TTCG Tetraloop was used.

ゲノムDNAにPAM配列を組み込んだ組換え株を、エンドヌクレアーゼをコードするDNAで形質転換した。その後、形質転換体を化学的に適合させ、標的配列に特異的(「オンターゲット(on target)」)または標的に非特異的(「ノンターゲット(non target)」)な単一のガイドRNA50ngを用いて、形質転換した。熱ショック後、形質転換体をSOC中で37℃にて2時間回収した。その後、ヌクレアーゼ効率は、誘導培地で培養した5倍希釈系列によって決定された。コロニーは3連で(in triplicate)希釈系列から定量化された。 A recombinant strain in which the PAM sequence was incorporated into genomic DNA was transformed with DNA encoding an endonuclease. The transformant is then chemically matched to give 50 ng of a single guide RNA that is specific for the target sequence (“on target”) or non-target (“non target”). Used to transform. After heat shock, the transformants were recovered in SOC at 37 ° C. for 2 hours. The nuclease efficiency was then determined by a 5-fold dilution series cultured in induction medium. Colonies were quantified from the intriplicate dilution series.

実施例10.-(一般的なプロトコル)哺乳動物細胞中のMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的化および切断活性を示すために、MG Casエフェクタータンパク質配列を2つの哺乳動物発現ベクター:(a)C末端のSV40 NLSと2A-GFPタグを有するものと、(b)GFPタグを持たず、N末端に1つとC末端に1つの、2つのSV40 NLS配列を有するもので試験した。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、哺乳動物細胞での発現にコドン最適化されている。
Example 10. -(General Protocol) Testing the Genome Cryptonic Activity of the MG CRISPR Complex in Mammalian Cells To show the targeting and cleaving activity in Mammalian cells, the MG Cas effector protein sequence was presented in two mammalian expression vectors: ( A) C-terminal SV40 NLS and 2A-GFP tags were tested, and (b) two SV40 NLS sequences, one at the N-terminus and one at the C-terminus, without the GFP tag. In some examples, the nucleotide sequence encoding the endonuclease is codon-optimized for expression in mammalian cells.

標的化配列が付加された対応する単一のガイドRNA配列(sgRNA)を、第2の哺乳動物発現ベクターにクローン化する。2つのプラスミドをHEK293T細胞にコトランスフェクトする。発現プラスミドとsgRNA標的化プラスミドをHEK293T細胞にコトランスフェクトしてから72時間後に、DNAを抽出し、NGS-ライブラリの作成に使用する。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列決定におけるインデルを介してパーセントNHEJを測定する。各タンパク質の活性を試験するために、少なくとも10の異なる標的部位が選択された。 The corresponding single guide RNA sequence (sgRNA) to which the targeting sequence has been added is cloned into a second mammalian expression vector. Two plasmids are cotransfected into HEK293T cells. 72 hours after cotransfection of the expression plasmid and sgRNA targeting plasmid into HEK293T cells, DNA is extracted and used to create the NGS-library. To demonstrate the efficiency of enzyme targeting in mammalian cells, percent NHEJ is measured via the indel in sequencing the target site. At least 10 different target sites were selected to test the activity of each protein.

実施例11.-MG1ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNA検証
Example 11. -Characterization of MG1 family members PAM specificity, tracrRNA / sgRNA validation

MG1ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載したmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17-20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG1-4(二重ガイド:ゲル1、レーン3を参照、単一ガイド:ゲル6、レーン2を参照)、MG1-5(ゲル2、レーン10)、MG1-6(二重ガイド:ゲル5、レーン6を参照、単一ガイド:ゲル6、レーン5を参照)、MG1-7(二重ガイド:ゲル3、レーン13を参照、単一ガイド:ゲル3、レーン2を参照)(それぞれタンパク質配列番号:1-4)について観察された。PCR産物の配列決定により、表2に示されるように、これらの酵素の活性PAM配列が明らかになった。 The target endonuclease activity of the MG1 family endonuclease system was confirmed using the myTXTL system described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in Figure 17-20. Amplification products are MG1-4 (double guide: see gel 1, lane 3, single guide: see gel 6, lane 2), MG1-5 (gel 2, lane 10), MG1-6 (double). Guide: see gel 5, lane 6, single guide: see gel 6, lane 5, MG1-7 (double guide: see gel 3, lane 13, single guide: see gel 3, lane 2) ) (Each protein SEQ ID NO: 1-4) was observed. Sequencing of the PCR products revealed the active PAM sequences of these enzymes, as shown in Table 2.

Figure 2022520428000003
Figure 2022520428000003

合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5461-5464として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表2にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。 Synthetic single guide RNAs (sgRNAs) are designed based on the sequence of tracrRNA and the expected structure and are presented as SEQ ID NO: 5461-5464. The PAM sequence screen of Example 6 was repeated with sgRNA. The results of this experiment are also shown in Table 2 and show that the use of sgRNA changed the specificity of PAM slightly.

インビトロでの標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in vitro

PAM配列CAGGAAGGを有する標的DNAに対する、MG1-4エンドヌクレアーゼシステム(sgRNA 配列番号:5461を有する、タンパク質配列番号:1)のインビトロ活性が、実施例8の方法を用いて実証された。上記で報告されている単一ガイド配列(配列番号:5461)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図10に示す。左パネルは、異なる標的化配列長(18~24nt)を有する対応する単一ガイドsgRNAと組み合わせたMG1-4によるDNA切断を実証するゲルを示し、右パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG1-4/sgRNAシステムで機能的であることを実証した。 The in vitro activity of the MG1-4 endonuclease system (with sgRNA SEQ ID NO: 5461, protein SEQ ID NO: 1) on target DNA with PAM sequence CAGGAAGG was demonstrated using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5461) was used and the Ns of the sequence was replaced to vary the length of the spacer / targeting sequence in the range of 18-24 nt. The results are shown in FIG. The left panel shows a gel demonstrating DNA cleavage by MG1-4 combined with a corresponding single guide sgRNA with different targeted sequence lengths (18-24 nt), and the right panel quantified the same data as a bar graph. Show things. This data demonstrated that the 18-24 nucleotide targeting sequence was functional in the MG1-4 / sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

MG1-4エンドヌクレアーゼシステム(タンパク質配列番号:1、sgRNA 配列番号:5461)のインビボ活性は、実施例9と同様にPAM配列CAGGAAGGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図11に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でエンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG1-4 endonuclease system (protein SEQ ID NO: 1, sgRNA SEQ ID NO: 5461) was tested using the PAM sequence CAGGAAGG as in Example 9. Transformed E. coli are plated with serial dilutions and the results (the left panel shows the serial dilutions of E. coli and the right panel shows the quantified growth) are presented in FIG. Significant reduction in proliferation of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved by endonucleases within E. coli cells.

哺乳動物細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in mammalian cells

実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG1-4(タンパク質配列番号:5527)およびMG1-6(タンパク質配列番号:5529)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLS配列を持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。MG1-6については、オープンリーディングフレームはさらに哺乳動物の発現のためにコドン最適化され(配列番号:5589)、2-NLSプラスミド骨格にクローン化された(MG-16hs)。この実験の結果を図12に示す。エンドヌクレアーゼ発現ベクターは、エンドヌクレアーゼに特異的なtracr配列と表3~4から選択されたガイド配列とを有するsgRNA(例えば、配列番号:5512または5515)を発現させるための第2のベクターとともにHEK293T細胞にコトランスフェクトされた。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の配列に近接の内部欠失(NHEJレムナント)の出現により検出された。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列におけるインデルを介してNHEJの割合を測定し、図12に示した。 The method of Example 10 was used to demonstrate targeting and cleavage activity in mammalian cells. Open reading frames encoding the sequences of MG1-4 (protein SEQ ID NO: 5527) and MG1-6 (protein SEQ ID NO: 5259) are those having a C-terminal SV40 NLS and a 2A-GFP tag (E. coli MG-BB). , GFP-tagged and cloned into two mammalian expression vectors, one at the N-terminus and one at the C-terminus (E. coli pMG5-BB). For MG1-6, the open reading frame was further codon-optimized for mammalian expression (SEQ ID NO: 5589) and cloned into a 2-NLS plasmid backbone (MG-16hs). The results of this experiment are shown in FIG. The endonuclease expression vector is HEK293T with a second vector for expressing an sgRNA (eg, SEQ ID NO: 5512 or 5515) having an endonuclease-specific tracr sequence and a guide sequence selected from Tables 3-4. The cells were cotransfected. Seventy-two hours after cotransfection, DNA was extracted and used to prepare the NGS-library. Cleavage activity was detected by the appearance of an internal deletion (NHEJ remnant) in close proximity to the sequence at the target site. In order to demonstrate the targeting efficiency of the enzyme in mammalian cells, the proportion of NHEJ was measured via the indel in the sequence of the target site and is shown in FIG.

Figure 2022520428000004
Figure 2022520428000004

Figure 2022520428000005
Figure 2022520428000005

実施例12.-MG2ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 12. -Characterization of MG2 family members PAM specificity, validation of tracrRNA / sgRNA

MG2ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されたようにmyTXTLシステムで確認された。このアッセイの結果を図17~20で示す。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。MG2-1(ゲル2、レーン11、およびゲル4、レーン6を参照)およびMG2-7(ゲル11、レーン10を参照)について増幅産物が観察された(それぞれ配列番号:320および321)。PCR産物の配列決定により、以下の表5に示す活性PAM配列が明らかになった。 Targeted endonuclease activity of MG2 family members was confirmed on the myTXTL system as described in Example 6. The results of this assay are shown in FIGS. 17-20. In the assay shown in FIGS. 17-20, the active protein that successfully cleaves the library produces a band of approximately 170 bp in the gel. Amplification products were observed for MG2-1 (see Gel 2, Lane 11 and Gel 4, Lane 6) and MG2-7 (see Gel 11, Lane 10) (SEQ ID NOS: 320 and 321 respectively). Sequencing of the PCR product revealed the active PAM sequences shown in Table 5 below.

Figure 2022520428000006
Figure 2022520428000006

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG2-7エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:321;sgRNA 配列番号:5465)およびAGCGTAAG PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図34に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG2-7 endonuclease system with sgRNA (endonuclease SEQ ID NO: 321; sgRNA SEQ ID NO: 5465) and the AGCGTAAG PAM sequence was confirmed using the method described in Example 9. Transformed E. coli are plated with serial dilutions and the results (the left panel shows the serial dilutions of E. coli and the right panel shows the quantified growth) are presented in FIG. Significant reduction in proliferation of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved in E. coli cells by MG1-4 endonuclease. There is.

実施例13.-MG3ファミリーメンバーの特徴付け Example 13. -Characteristics of MG3 family members

PAM特異性、tracrRNA/sgRNAの検証 Verification of PAM specificity, tracrRNA / sgRNA

MG3ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、tracr配列およびCRISPRアレイを使用して、実施例6に記載されたようなmyTXTLシステムを使用して確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG3-6(二重ガイド:ゲル2、レーン8を参照、単一ガイド:ゲル3、レーン3を参照)、MG3-7(二重ガイド:ゲル2、レーン3を参照、単一ガイド:ゲル3、レーン4を参照)、MG3-8(二重ガイド:ゲル9、レーン5を参照)では、増幅産物が観察された(それぞれ配列番号:421、422、および423)。PCR産物の配列決定により、以下の表6に示す活性PAM配列が明らかになった。 Targeted endonuclease activity of MG3 family members was confirmed using the tracr sequence and the CRISPR array using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. MG3-6 (double guide: see gel 2, lane 8, single guide: see gel 3, lane 3), MG3-7 (double guide: see gel 2, lane 3, single guide: gel) 3. Amplification products were observed in MG3-8 (dual guides: see gel 9, lane 5) (see lanes 4) (SEQ ID NOs: 421, 422, and 423, respectively). Sequencing of the PCR product revealed the active PAM sequences shown in Table 6 below.

Figure 2022520428000007
Figure 2022520428000007

合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5466-5467として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表6にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。 Synthetic single guide RNAs (sgRNAs) are designed based on the sequence of tracrRNA and the expected structure and are presented as SEQ ID NO: 5466-5467. The PAM sequence screen of Example 6 was repeated with sgRNA. The results of this experiment are also shown in Table 6 and show that the use of sgRNA changed the specificity of PAM slightly.

インビトロでの標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in vitro

MG3-6(エンドヌクレアーゼ配列番号:421)のインビトロ活性は、実施例8の方法を使用して、PAM配列GTGGGTTAで実証された。上記で報告されている単一ガイド配列(配列番号:5466)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図13に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG3-6によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG3-6/sgRNAシステムで機能的であることを実証した。 In vitro activity of MG3-6 (endonuclease SEQ ID NO: 421) was demonstrated with the PAM sequence GTGGGTTA using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5466) was used, substituting the Ns of the sequence and varying the length of the spacer / targeting sequence in the range of 18-24 nt. The result is shown in FIG. The upper panel shows a gel demonstrating DNA cleavage by MG3-6 in combination with various sgRNAs with different targeted sequence lengths (18-24 nt), and the lower panel shows the same data quantified as a bar graph. .. This data demonstrated that the 18-24 nucleotide targeting sequence was functional in the MG3-6 / sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

MG3-7エンドヌクレアーゼシステム(タンパク質配列番号:422、sgRNA 配列番号:5467)のインビボ活性は、実施例9の方法を使用してPAM配列TGGACCTGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(上パネルに大腸菌の連続希釈を示し、下パネルに定量化した成長を示す)を図14に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAがMG3-7エンドヌクレアーゼシステムによって特異的に切断されていたことを示している。 The in vivo activity of the MG3-7 endonuclease system (protein SEQ ID NO: 422, sgRNA SEQ ID NO: 5467) was tested using the PAM sequence TGGACCTG using the method of Example 9. Transformed E. coli are plated with serial dilutions and the results (upper panel showing serial dilutions of E. coli and lower panel showing quantified growth) are presented in FIG. Significant reduction in proliferation of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved by the MG3-7 endonuclease system.

哺乳動物細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in mammalian cells

実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG3-7(タンパク質配列番号:422)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLSを持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。エンドヌクレアーゼ発現ベクターは、表7から選択されたガイド配列を用いて上記のsgRNAを発現するための第2のベクターでHEK293T細胞へコトランスフェクトされた。この実験の結果を図12に示す。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の近傍にある内部欠失(NHEJレムナント)の出現により検出された。結果を図15に示す。 The method of Example 10 was used to demonstrate targeting and cleavage activity in mammalian cells. The open reading frames encoding the sequence of MG3-7 (protein SEQ ID NO: 422) are those with C-terminal SV40 NLS and 2A-GFP tag (E. coli MG-BB) and those without GFP tag and 1 at the N-terminus. It was cloned into two mammalian expression vectors, one with one and two NLS at the C-terminus (E. coli pMG5-BB). The endonuclease expression vector was co-transfected into HEK293T cells with a second vector for expressing the sgRNA described above using the guide sequence selected from Table 7. The results of this experiment are shown in FIG. Seventy-two hours after cotransfection, DNA was extracted and used to prepare the NGS-library. Cleavage activity was detected by the appearance of an internal deletion (NHEJ remnant) in the vicinity of the target site. The results are shown in FIG.

sgRNAプラスミド上でコードされた標的部位を以下の表7に示す。 The target sites encoded on the sgRNA plasmid are shown in Table 7 below.

Figure 2022520428000008
Figure 2022520428000008

実施例13.-MG4ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 13. -Characterization of MG4 family members PAM specificity, validation of tracrRNA / sgRNA

MG4ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG4-2(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル10、レーン7を参照)について増幅産物が観察された(配列番号:432)。PCR産物の配列決定により、以下の表8に示される活性PAM配列が明らかになった。 Targeted endonuclease activity of the MG4 family endonuclease system was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG4-2 (see Double Guide: Gel 2, Lane 9, Single Guide: Gel 10, Lane 7) (SEQ ID NO: 432). Sequencing of the PCR product revealed the active PAM sequences shown in Table 8 below.

Figure 2022520428000009
Figure 2022520428000009

実施例14.MG14ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 14. Characterization of MG14 family members PAM specificity, validation of tracrRNA / sgRNA

MG14ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG14-1(二重ガイド:ゲル2、1レーン4、単一ガイド:ゲル3、レーン8を参照)について増幅産物が観察された(配列番号:678)。PCR産物の配列決定により、以下の表9に示される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG14 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG14-1 (see Double Guide: Gel 2, 1 Lane 4, Single Guide: Gel 3, Lane 8) (SEQ ID NO: 678). Sequencing of the PCR product revealed the active PAM sequence specificity shown in Table 9 below.

Figure 2022520428000010
Figure 2022520428000010

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG14-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:678;sgRNA 配列番号:5469)およびGGCGGGGA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG14-1 endonuclease system with sgRNA (endonuclease SEQ ID NO: 678; sgRNA SEQ ID NO: 5469) and the GGCGGGGA PAM sequence was confirmed using the method described in Example 9. Transformed E. coli are plated with serial dilutions and the results (the left panel shows the serial dilutions of E. coli and the right panel shows the quantified growth) are presented in FIG. Significant reduction in proliferation of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved in E. coli cells by MG1-4 endonuclease. There is.

実施例15.-MG15ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 15. -Characterization of MG15 family members PAM specificity, validation of tracrRNA / sgRNA

MG15ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG15-1(二重ガイド:ゲル2、レーン7、単一ガイド:ゲル3、レーン9を参照)について増幅産物が観察された(配列番号:930)。PCR産物の配列決定により、以下の表10で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG15 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG15-1 (see Double Guide: Gel 2, Lane 7, Single Guide: Gel 3, Lane 9) (SEQ ID NO: 930). Sequencing of the PCR product revealed the active PAM sequence specificity detailed in Table 10 below.

Figure 2022520428000011
Figure 2022520428000011

インビトロ活性 In vitro activity

MG15-1エンドヌクレアーゼシステム(タンパク質配列番号:930、sgRNA 配列番号:5470)のインビトロ活性は、実施例8の方法を使用してPAM配列GGGTCAAAを用いて試験された。上記で報告されている単一ガイド配列(配列番号:5470)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図16に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG15-1によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG15-1/sgRNAシステムで機能的であることを実証した。 The in vitro activity of the MG15-1 endonuclease system (protein SEQ ID NO: 930, sgRNA SEQ ID NO: 5470) was tested using the PAM sequence GGGTCAAA using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5470) was used and the Ns of the sequence was replaced to vary the length of the spacer / targeting sequence in the range of 18-24 nt. The result is shown in FIG. The upper panel shows a gel demonstrating DNA cleavage by MG15-1 in combination with various sgRNAs with different targeted sequence lengths (18-24 nt), and the lower panel shows the same data quantified as a bar graph. .. This data demonstrated that the 18-24 nucleotide targeting sequence was functional in the MG15-1 / sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG15-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:930;sgRNA 配列番号:5470)およびGGGTCAAA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG15-1 endonuclease system with sgRNA (endonuclease SEQ ID NO: 930; sgRNA SEQ ID NO: 5470) and the GGGTCAAA PAM sequence was confirmed using the method described in Example 9. Transformed E. coli are plated with serial dilutions and the results (the left panel shows the serial dilutions of E. coli and the right panel shows the quantified growth) are presented in FIG. Significant reduction in proliferation of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved in E. coli cells by MG1-4 endonuclease. There is.

実施例16.-MG16ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 16. -Characterization of MG16 family members PAM specificity, validation of tracrRNA / sgRNA

MG16ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG16-2(ゲル11、レーン17を参照)(配列番号:1093)について観察された。PCR産物の配列決定により、以下の表11で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG16 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG16-2 (see Gel 11, Lane 17) (SEQ ID NO: 1093). Sequencing of the PCR product revealed the active PAM sequence specificity detailed in Table 11 below.

Figure 2022520428000012
Figure 2022520428000012

実施例17.-MG18ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 17. -Characterization of MG18 family members PAM specificity, validation of tracrRNA / sgRNA

MG18ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG18-1(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル11、レーン12を参照)について増幅産物が観察された(配列番号:1354)。PCR産物の配列決定により、以下の表12で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG18 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG18-1 (see Double Guide: Gel 2, Lane 9, Single Guide: Gel 11, Lane 12) (SEQ ID NO: 1354). Sequencing of the PCR product revealed the active PAM sequence specificity detailed in Table 12 below.

Figure 2022520428000013
Figure 2022520428000013

実施例18.-MG21ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 18. -Characterization of MG21 family members PAM specificity, validation of tracrRNA / sgRNA

MG21ファミリーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG21-1(ゲル11、レーン2を参照)について観察された(配列番号:1512)。PCR産物の配列決定により、以下の表13で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of the MG21 family was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG21-1 (see Gel 11, Lane 2) (SEQ ID NO: 1512). Sequencing of the PCR product revealed the active PAM sequence specificity detailed in Table 13 below.

Figure 2022520428000014
Figure 2022520428000014

実施例19.-MG22ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 19. -Characterization of MG22 family members PAM specificity, validation of tracrRNA / sgRNA

MG22ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。増幅産物は、MG22-1(ゲル11、レーン3を参照)について観察された(タンパク質配列番号:1656)。PCR産物の配列決定により、以下の表14で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG22 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. In the assay shown in FIGS. 17-20, the active protein that successfully cleaves the library produces a band of approximately 170 bp in the gel. Amplification products were observed for MG22-1 (see Gel 11, Lane 3) (protein SEQ ID NO: 1656). Sequencing of the PCR product revealed the active PAM sequence specificity detailed in Table 14 below.

Figure 2022520428000015
Figure 2022520428000015

実施例20.-MG23ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 20. -Characterization of MG23 family members PAM specificity, validation of tracrRNA / sgRNA

MG23ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG23-1(ゲル11、レーン4を参照)について観察された(配列番号:1756)。PCR産物の配列決定により、以下の表15で詳細に説明されるこれらの酵素について活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG23 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid gives a product that migrates at about 170 bp in the gel, as shown in FIGS. 17-20. Amplification products were observed for MG23-1 (see Gel 11, Lane 4) (SEQ ID NO: 1756). Sequencing of PCR products revealed active PAM sequence specificity for these enzymes, detailed in Table 15 below.

Figure 2022520428000016
本開示のシステムは、例えば、核酸編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)など、様々な用途に使用することができる。このようなシステムは、例えば、ウイルスゲノムを標的とすることでウイルスを不活性化したり、宿主細胞に感染できないようにしたりするために、価値の高い低分子、高分子、または二次代謝産物を生成するように生物を操作するべく遺伝子を追加したり、代謝経路を変更したりするために、進化的選択のための遺伝子駆動要素を確立するために、バイオセンサーとして外来の低分子およびヌクレオチドによる細胞摂動を検出するために、特定のヌクレオチド配列(例えば、細菌における抗生物質耐性をコードする配列)を標的とするとともに検出するためにプローブと組み合わせた不活性化酵素のように、疾患を引き起こす遺伝的要素を検出するための診断ツールとして(例えば、逆転写されたウイルスRNAまたは疾患を引き起こす突然変異をコードする増幅されたDNA配列の切断を介して)、被験体において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異をアドレス指定(例えば、除去または置換)して、遺伝子を不活性化することで細胞内での遺伝子の機能を確認するために使用されてもよい。
Figure 2022520428000016
The systems of the present disclosure can be used for a variety of applications, such as nucleic acid editing (eg, gene editing), binding to nucleic acid molecules (eg, sequence-specific binding), and the like. Such systems provide high-value small, high-molecular-weight, or secondary metabolites, for example, to inactivate the virus by targeting the viral genome or prevent it from infecting host cells. By foreign small molecules and nucleotides as biosensors to establish gene-driving elements for evolutionary selection, to add genes to manipulate organisms to produce, or to alter metabolic pathways. Disease-causing inheritance, such as inactivating enzymes combined with probes to target and detect specific nucleotide sequences (eg, sequences encoding antibiotic resistance in bacteria) to detect cell perturbations. As a diagnostic tool for detecting target elements (eg, through cleavage of reverse transcribed viral RNA or amplified DNA sequences encoding disease-causing mutations), it can cause disease in the subject. It may be used to identify the function of a gene in a cell by addressing (eg, removing or replacing) a genetically inherited mutation to inactivate the gene.

本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを目的としていない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。 Although preferred embodiments of the invention have been shown and described herein, it will be apparent to those skilled in the art that such embodiments are provided by way of example only. The present invention is not intended to be limited by the particular examples provided herein. Although the present invention has been described with respect to the specification described above, the description and illustration of embodiments herein are not intended to be construed in a limited sense. Those skilled in the art will be able to come up with many changes, changes, and substitutions without departing from the invention. Further, it will be appreciated that all aspects of the invention are not limited to the particular depictions, configurations, or relative proportions described herein, which depend on various conditions and variables. It should be understood that various alternatives of the embodiments of the invention described herein may be utilized in the practice of the invention. Therefore, the invention is intended to extend to any such alternatives, modifications, variants, or equivalents. The following claims define the scope of the invention, and it is intended that the methods and structures within the scope of this claim and its equivalents are embraced therein.

Claims (170)

操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼは難培養性微生物に由来し、ここで、前記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, said engineered nuclease system.
(A) An endonuclease containing a RuvC_III domain and an HNH domain, wherein the endonuclease is derived from a refractory microorganism, where the endonuclease is a class 2 type II Cas endonuclease. , Endonucleases,
(B) An engineered guide ribonucleic acid structure configured to form a complex with the endonuclease, wherein the engineered guide ribonucleic acid structure is:
(I) A guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence and
(Ii) Containing an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease.
Manipulated nuclease system.
前記RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む、請求項1に記載の操作されたヌクレアーゼシステム。 13. The RuvC_III domain according to claim 1, wherein the RuvC_III domain comprises a sequence having at least 70%, at least 75%, at least 80%, or at least 90% sequence identity to any one of SEQ ID NOs: 1827-3637. Manipulated nuclease system. 操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, said engineered nuclease system.
(A) An endonuclease containing a RuvC_III domain having at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637.
(B) An engineered guide ribonucleic acid structure configured to form a complex with the endonuclease, wherein the engineered guide ribonucleic acid structure is:
(I) A guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence and
(Ii) Containing an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease.
Manipulated nuclease system.
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, said engineered nuclease system.
(A) An endonuclease configured to bind to a protospacer flanking motif (PAM) sequence comprising SEQ ID NO: 5512-5537, wherein the endonuclease is a class 2 type II Cas endonuclease. , Endonucleases,
(B) An engineered guide ribonucleic acid structure configured to form a complex with the endonuclease, wherein the engineered guide ribonucleic acid structure is:
(I) A guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence and
(Ii) Containing an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease.
Manipulated nuclease system.
前記エンドヌクレアーゼは難培養性微生物に由来する、請求項4に記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of claim 4, wherein the endonuclease is derived from a refractory microorganism. 前記エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない、請求項4-5のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 4-5, wherein the endonuclease has not been engineered to bind to a different PAM sequence. 前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項4に記載の操作されたヌクレアーゼシステム。 The endonucleases are Cas9 endonucleases, Cas14 endonucleases, Cas12a endonucleases, Cas12b endonucleases, Cas12c endonucleases, Cas12d endonucleases, Cas12e endonucleases, Cas13a endonucleases, Cas13b endonucleases, Cas13c endonucleases, or Cas13d endonucleases. No, the engineered nuclease system of claim 4. 前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する、請求項4に記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of claim 4, wherein the endonuclease has less than 80% identity to Cas9 endonuclease. 前記エンドヌクレアーゼはHNHドメインをさらに含む、請求項3-8のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 3-8, wherein the endonuclease further comprises an HNH domain. 前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項1-9のいずれか1つに記載の操作されたヌクレアーゼシステム。 The tracr ribonucleic acid sequence comprises a sequence having at least 80% sequence identity to about 60-90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. , The engineered nuclease system according to any one of claims 1-9. 操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と、を含む、
操作されたガイドリボ核酸構造と、
(b)前記操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, said engineered nuclease system.
(A) An manipulated guide ribonucleic acid structure, wherein the manipulated guide ribonucleic acid structure is:
(I) A guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence and
(Ii) A tracr ribonucleic acid sequence configured to bind to an endonuclease, wherein the tracr ribonucleic acid sequence is selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. Includes a tracr ribonucleic acid sequence, which comprises a sequence having at least 80% sequence identity to about 60-90 contiguous nucleotides.
Manipulated guide ribonucleic acid structure and
(B) Containing a Class 2 Type II Cas endonuclease configured to bind to the engineered guide ribonucleic acid.
Manipulated nuclease system.
前記エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される、請求項1-3または11のいずれかに記載の操作されたヌクレアーゼシステム。 The manipulation according to any one of claims 1-3 or 11, wherein the endonuclease is configured to bind to a protospacer flanking motif (PAM) sequence selected from the group comprising SEQ ID NO: 5512-5537. Nuclease system. 前記操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-11, wherein the engineered guide ribonucleic acid structure comprises at least two ribonucleic acid polynucleotides. 前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列と前記tracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-11, wherein the engineered guide ribonucleic acid structure comprises one ribonucleic acid polynucleotide comprising said guide ribonucleic acid sequence and said tracr ribonucleic acid sequence. 前記ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である、請求項1-14のいずれか1つに記載の操作されたヌクレアーゼシステム。 The operation according to any one of claims 1-14, wherein the guide ribonucleic acid sequence is complementary to a prokaryotic, bacterial, archaeal, eukaryotic, fungal, plant, mammalian, or human genomic sequence. Nuclease system. 前記ガイドリボ核酸配列は15~24ヌクレオチド長である、請求項1-15のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system according to any one of claims 1-15, wherein the guide ribonucleic acid sequence is 15 to 24 nucleotides in length. 前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む、請求項1-16のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered according to any one of claims 1-16, wherein the endonuclease comprises one or more nuclear localization sequences (NLS) located proximal to the N-terminus or C-terminus of the endonuclease. Nuclease system. 前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項1-17のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-17, wherein the NLS comprises a sequence selected from SEQ ID NO: 5597-5612. 5’から3’に、前記標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、前記標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む、請求項1-18のいずれか1つに記載の操作されたヌクレアーゼシステム。 From 5'to 3', a first homology arm containing a sequence of at least 20 nucleotides in 5'of the target deoxyribonucleic acid sequence, a synthetic DNA sequence of at least 10 nucleotides, and 3'of the target deoxyribonucleic acid sequence. The engineered according to any one of claims 1-18, further comprising a single-stranded or double-stranded DNA repair template comprising a second homology arm comprising a sequence of at least 20 nucleotides. Nuclease system. 前記第1の相同性アームまたは前記第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む、請求項19に記載の操作されたヌクレアーゼシステム。 19. The operation of claim 19, wherein the first homology arm or the second homology arm comprises a sequence of at least 40, 80, 120, 150, 200, 300, 500, or 1,000 nucleotides. Nuclease system. 前記操作されたヌクレアーゼシステムは、Mg2+の供給源をさらに含む、請求項1-20のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system according to any one of claims 1-20, wherein the engineered nuclease system further comprises a source of Mg 2+ . 前記エンドヌクレアーゼおよび前記tracrリボ核酸配列は、同じ門内の別個の細菌種に由来する、請求項1-21のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system according to any one of claims 1-21, wherein the endonuclease and the tracr ribonucleic acid sequence are derived from distinct bacterial species within the same phylum. 前記エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system according to any one of claims 1-22, wherein the endonuclease is derived from a bacterium belonging to the genus Dermabacter. 前記エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system according to any one of claims 1-22, wherein the endonuclease is derived from a bacterium belonging to the phylum Verrucomicrobiota, the phylum Candidatus Peregrinibacteria, or the phylum Candidatus Melainabacteria. 前記エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease is described in any one of claims 1-22, wherein the endonuclease is derived from a bacterium comprising a 16S rRNA gene having at least 90% identity to any one of SEQ ID NOs: 5592-5595. Manipulated nuclease system. 前記HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む、請求項1-25のいずれか1つに記載の操作されたヌクレアーゼシステム。 The manipulation of any one of claims 1-25, wherein the HNH domain comprises a sequence having at least 70% or at least 80% identity to any one of SEQ ID NOs: 5638-5460. Nuclease system. 前記エンドヌクレアーゼは、配列番号:1-1826またはそられに対して少なくとも55%の同一性を有するその変異体を含む、請求項1-26のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-26, wherein the endonuclease comprises SEQ ID NO: 1-1826 or a variant thereof having at least 55% identity to it. 前記エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1827-1830 or SEQ ID NO: 1827-2140. 27 The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-28のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3638-3461 or SEQ ID NO: 3638-3954, claim 1-28. The engineered nuclease system according to any one of the above. 前記エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-29のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-29, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5615-5632. The engineered nuclease system according to one. 前記エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-30のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1-4 or SEQ ID NO: 1-319. 30 The engineered nuclease system according to any one of 30. 前記ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-31のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5461-5464, SEQ ID NO: 5476-5479, or SEQ ID NO: 5476-5489. The engineered nuclease system according to any one of claims 1-31, comprising a sequence. 前記ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対以内の非対称バルジを含む、請求項1-32のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises an RNA sequence that is expected to contain a hairpin consisting of a stem and a loop, wherein the stem is at least 10, at least 12, or at least 14 base pair ribonucleotides, and the loop. The engineered nuclease system of any one of claims 1-32, comprising an asymmetric bulge within four base pairs. 前記エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-33のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease is described in any one of claims 1-33, wherein the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5512-5515 or SEQ ID NO: 5527-5530. Manipulated nuclease system. a)前記エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1827.
b) The guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5461 or SEQ ID NO: 5476, and.
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5512 or SEQ ID NO: 5527.
a)前記エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1828.
b) The guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5462 or SEQ ID NO: 5477, and.
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5513 or SEQ ID NO: 5528.
a)前記エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1829.
b) The guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5436 or SEQ ID NO: 5478, and.
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5514 or SEQ ID NO: 5259.
a)前記エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1830.
b) The guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5464 or SEQ ID NO: 5479, and.
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5515 or SEQ ID NO: 5530.
前記エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2141-2142 or SEQ ID NO: 2141-2241. 27 The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3955-3965 or SEQ ID NO: 3955-4055. The engineered nuclease system according to any one of 27 or 39. 前記エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または39-40のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5632-5638, claim 1-27 or 39. The engineered nuclease system according to any one of -40. 前記エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-41のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 320-321 or SEQ ID NO: 320-420, claim 1-. 27 or 39-41 according to any one of the engineered nuclease systems. 前記ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-42のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5465, SEQ ID NO: 5490-5491, or SEQ ID NO: 5490-5494. The engineered nuclease system according to any one of claims 1-27 or 39-42. 前記ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む、請求項1-27または39-43のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises any one of claims 1-27 or 39-43 comprising a tracr ribonucleic acid sequence comprising a hairpin comprising at least 8, at least 10 or at least 12 base pair ribonucleotides. Manipulated nuclease system. 前記エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または39-44のいずれか1つに記載の操作されたヌクレアーゼシステム。 13. Manipulated nuclease system. a)前記エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2141.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5490, and
c) The engineered nuclease system of any one of claims 1-27 or 39-45, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5531.
a)前記エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2142.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5465 or SEQ ID NO: 5491, and
c) The engineered nuclease system of any one of claims 1-27 or 39-45, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5516.
前記エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises any one of claims 1-27 comprising a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2245-2246. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 48, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4059-4060. One of the engineered nuclease systems described. 前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または48-49のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5639-5648, claim 1-27 or 48. The engineered nuclease system according to any one of -49. 前記エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48-50のいずれか1つに記載の操作されたヌクレアーゼシステム Either of claims 1-27 or 48-50, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 424-425. One of the engineered nuclease systems described in 前記ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-27または48-51のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5498-5499 and SEQ ID NO: 5539, claim 1-27 or. The engineered nuclease system according to any one of 48-51. 前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または48-52のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a guide ribonucleic acid sequence that is expected to contain a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. , The tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin at 5'to 3'where the first hairpin has a longer stem than the second hairpin, claimed. The engineered nuclease system according to any one of Items 1-27 or 48-52. 前記エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2242-2244 or SEQ ID NO: 2247-2249. 27 The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4056-4058 and SEQ ID NO: 4061-4063. The engineered nuclease system according to any one of 27 or 54. 前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または54-55のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5639-5648, claim 1-27 or 54. The engineered nuclease system according to any one of -55. 前記エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-56のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 421-423 or SEQ ID NO: 426-428. The engineered nuclease system according to any one of 27 or 54-56. 前記ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-57のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure is at least 70%, 80%, relative to a sequence selected from the group consisting of SEQ ID NO: 5466-5467, SEQ ID NO: 5495-5497, SEQ ID NO: 5500-5502, and SEQ ID NO: 5539. Or the engineered nuclease system of any one of claims 1-27 or 54-57, comprising sequences that are 90% identical. 前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または54-58のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a guide ribonucleic acid sequence that is expected to contain a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. , The tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin at 5'to 3'where the first hairpin has a longer stem than the second hairpin, claimed. The engineered nuclease system according to any one of Items 1-27 or 54-58. 前記エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または54-59のいずれか1つに記載の操作されたヌクレアーゼシステム。 Either of claims 1-27 or 54-59, wherein the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5517-5518 or SEQ ID NO: 5532-5534. One of the engineered nuclease systems described. a)前記エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2247.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5500, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5517 or SEQ ID NO: 5532. ..
a)前記エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2248.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5501, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5518 or SEQ ID NO: 5533. ..
a)前記エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2249.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5502, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5534.
前記エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2253 or SEQ ID NO: 2253-2481. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4067 or SEQ ID NO: 4067-4295, claim 1-27 or. The engineered nuclease system according to any one of 64. 前記エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む、請求項1-27または64-65のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 64-65, wherein the endonuclease comprises a peptide motif of SEQ ID NO: 5649. 前記エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-66のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 432 or SEQ ID NO: 432-660, claim 1-27 or. The engineered nuclease system according to any one of 64-66. 前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-67のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5468 or SEQ ID NO: 5503, claim 1-27 or 64. The engineered nuclease system according to any one of -67. 前記エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または64-68のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease according to any one of claims 1-27 or 64-68, wherein the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5519. system. a)前記エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される、請求項1-27または64-69のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2253.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5468 or SEQ ID NO: 5503, and
c) The engineered nuclease system of any one of claims 1-27 or 64-69, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5519.
前記エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises any one of claims 1-27 comprising a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2482-2489. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 71, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4296-4303. One of the engineered nuclease systems described. 前記エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71-72のいずれか1つに記載の操作されたヌクレアーゼシステム。 Either of claims 1-27 or 71-72, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 661-668. The engineered nuclease system according to one. 前記エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises any one of claims 1-27 comprising a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2490-2498. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 74, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4304-4321. One of the engineered nuclease systems described. 前記エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-75のいずれか1つに記載の操作されたヌクレアーゼシステム。 Either of claims 1-27 or 74-75, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 669-677. The engineered nuclease system according to one. 前記ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-76のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 74-76, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5504. One of the engineered nuclease systems described. 前記エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2499 or SEQ ID NO: 2499-2750, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4313 or SEQ ID NO: 4313-4564, claim 1-27 or. The engineered nuclease system according to any one of 78. 前記エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または78-79のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5650-5667, claim 1-27 or 78. The engineered nuclease system according to any one of -79. 前記エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-80のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 678 or SEQ ID NO: 678-929, claim 1-27 or. The engineered nuclease system according to any one of 78-80. 前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-81のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 78-81, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-82のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 78-82, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. a)前記エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-83のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2499.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505, and
c) The engineered nuclease system of any one of claims 1-27 or 78-83, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. ..
前記エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2751 or SEQ ID NO: 2751-2913, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4565 or SEQ ID NO: 4565-4727, claim 1-27 or. The engineered nuclease system according to any one of 85. 前記エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または85-86のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5668-5678, claim 1-27 or 85. The engineered nuclease system according to any one of -86. 前記エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-87のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 930 or SEQ ID NO: 930-1092, claim 1-27 or. The engineered nuclease system according to any one of 85-87. 前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-88のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 85-88, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または85-89のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease is described in any one of claims 1-27 or 85-89 configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5521 or SEQ ID NO: 5536. Manipulated nuclease system. a)前記エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される、請求項1-27または85-90のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2751.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506, and
c) The engineered nuclease system of any one of claims 1-27 or 85-90, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5521 or SEQ ID NO: 5536. ..
前記エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2914 or SEQ ID NO: 2914-3174, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4728 or SEQ ID NO: 4728-4988, claim 1-27 or. 92. The engineered nuclease system according to any one of 92. 前記エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む、請求項1-27または92-93のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises any one of claims 1-27 or 92-93 comprising at least one, at least two, or at least three peptide motifs selected from the group consisting of SEQ ID NO: 5676-5678. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-94のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1093 or SEQ ID NO: 1093-1353, claim 1-27 or. The engineered nuclease system according to any one of 92-94. 前記ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-95のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5471, SEQ ID NO: 5507, and SEQ ID NO: 5540-5542. , The engineered nuclease system according to any one of claims 1-27 or 92-95. 前記ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項1-27または92-96のいずれか1つに記載の操作されたヌクレアーゼシステム。 13. Manipulated nuclease system. 前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-97のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 92-97, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522. a)前記エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-98のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2914.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5471 or SEQ ID NO: 5507, and
c) The engineered nuclease system of any one of claims 1-27 or 92-98, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522.
前記エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3175 or SEQ ID NO: 3175-3330, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4989 or SEQ ID NO: 4989-5146, claim 1-27 or. The engineered nuclease system according to any one of 100. 前記エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または100-101のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5679-5686, claim 1-27 or 100. The engineered nuclease system according to any one of -101. 前記エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-102のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1354 or SEQ ID NO: 1354-1511, claim 1-27 or. The engineered nuclease system according to any one of 100-102. 前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-103のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5472 or SEQ ID NO: 5508, claim 1-27 or 100. -The engineered nuclease system according to any one of 103. 前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または100-104のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease is described in any one of claims 1-27 or 100-104, configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5523 or SEQ ID NO: 5537. Manipulated nuclease system. a)前記エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される、請求項1-27または100-105のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5472 or SEQ ID NO: 5508, and
c) The engineered nuclease system of any one of claims 1-27 or 100-105, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5523 or SEQ ID NO: 5537. ..
前記エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3331 or SEQ ID NO: 3331-3474, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107のいずれか1つに記載の操作されたヌクレアーゼシステム The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5147 or SEQ ID NO: 5147-5290, claim 1-27 or. The engineered nuclease system according to any one of 107. 前記エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または107-108のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5674-5675 and SEQ ID NO: 5687-5693. The engineered nuclease system according to any one of claims 1-27 or 107-108. 前記エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-109のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1512 or SEQ ID NO: 1512-1655, claim 1-27 or. The engineered nuclease system according to any one of 107-109. 前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-110のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5473 or SEQ ID NO: 5509, claim 1-27 or 107. The engineered nuclease system according to any one of -110. 前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-111のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 107-111, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524. a)前記エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-112のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3331.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5473 or SEQ ID NO: 5509, and
c) The engineered nuclease system of any one of claims 1-27 or 107-112, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524.
前記エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3475 or SEQ ID NO: 3475-3568, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5291 or SEQ ID NO: 5291-5389, claim 1-27 or. The engineered nuclease system according to any one of 114. 前記エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または114-115のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5694-569, claim 1-27 or 114. The engineered nuclease system according to any one of -115. 前記エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-116のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1656 or SEQ ID NO: 1656-1755, claim 1-27 or. The engineered nuclease system according to any one of 114-116. 前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-117のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 114-117, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-118のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 114-118, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525. a)前記エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-119のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3475.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510, and
c) The engineered nuclease system of any one of claims 1-27 or 114-119, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525.
前記エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3569 or SEQ ID NO: 3569-3637, claim 1-27. The engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5390 or SEQ ID NO: 5390-5460, claim 1-27 or. The engineered nuclease system according to any one of 121. 前記エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または121-122のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5700-5717, claim 1-27 or 121-. The engineered nuclease system according to any one of 122. 前記エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-123のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1756 or SEQ ID NO: 1756-1826, claim 1-27 or. The engineered nuclease system according to any one of 121-123. 前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-124のいずれか1つに記載の操作されたヌクレアーゼシステム。 One of claims 1-27 or 121-124, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-125のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 121-125, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526. a)前記エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-126のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) The endonuclease contains a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3569.
b) The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511, and
c) The engineered nuclease system of any one of claims 1-27 or 121-126, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526.
配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される、請求項1-127のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-127, wherein the sequence identity is determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, or the Smith-Waterman homology search algorithm. 前記配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および、11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、ならびに、条件付き組成スコアマトリックス調整を使用して、BLASTP相同性検索アルゴリズムによって決定される、請求項128に記載の操作されたヌクレアーゼシステム。 The sequence identity is conditional using the BLASTUM62 scoring matrix, which sets the gap cost at 3 wordlength (W), 10 extraction (E) parameters, and 11 exhibitions, 1 extension. The engineered nuclease system of claim 128, as determined by the BLASTP homology search algorithm using composition score matrix adjustments. 操作されたガイドリボ核酸ポリヌクレオチドであって、前記操作されたガイドリボ核酸ポリヌクレオチドは、
a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含む、DNAを標的とするセグメントと、
b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含む、タンパク質結合セグメントであって、
ここで、前記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、および、
ここで、前記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、前記複合体を標的DNA分子の標的配列に標的化するように構成される、
操作されたガイドリボ核酸ポリヌクレオチド。
The engineered guide ribonucleic acid polynucleotide, wherein the engineered guide ribonucleic acid polynucleotide is.
a) A DNA-targeted segment that contains a nucleotide sequence that is complementary to the target sequence in the target DNA molecule.
b) A protein-binding segment containing two complementary stretches of nucleotides that hybridize to form a double-stranded RNA (dsRNA) duplex.
Here, the two complementary stretches of said nucleotides are covalently attached to each other at the intervening nucleotides, and
Here, the engineered guide ribonucleic acid polynucleotide forms a complex with an endonuclease containing a RuvC_III domain having at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637, said. Configured to target the complex to the target sequence of the target DNA molecule,
Manipulated guide ribonucleic acid polynucleotide.
前記DNA標的化セグメントは、前記ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する、請求項130に記載の操作されたガイドリボ核酸ポリヌクレオチド。 The engineered guide ribonucleic acid polynucleotide according to claim 130, wherein the DNA targeting segment is located at 5'both of the two complementary stretches of the nucleotide. a)前記タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
b)前記タンパク質結合セグメントは (配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
c)前記タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
d)前記タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
e)前記タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
f)前記タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
g)前記タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
j)前記タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
k)前記タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
l)前記タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、または、
m)前記タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む、請求項130-131のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
a) The protein binding segment is a sequence having at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5476-5479 or SEQ ID NO: 5476-5489. Including
b) The protein binding segment is at least 70%, at least 80%, or at least 90% of the sequence selected from the group consisting of (SEQ ID NO: 5490-5491 or SEQ ID NO: 5490-5494) and SEQ ID NO: 5538. Containing sequences with the same identity of
c) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5498-5499.
d) The protein binding segment is a sequence having at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5495-5497 and SEQ ID NO: 5500-5502. Including
e) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5503.
f) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5504.
g) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5505.
h) Protein binding segments include sequences having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5506.
i) Protein binding segments include sequences having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5507.
j) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5508.
k) The protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5509.
l) The protein binding segment comprises, or contains, a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5510.
m) The engineered according to any of claims 130-131, wherein the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5511. Guide ribonucleic acid polynucleotide.
a)前記ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対内の非対称バルジを含み、
b)前記ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み、
c)前記ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有し、または、
d)前記ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項130-132のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
a) The guide ribonucleic acid polynucleotide comprises an RNA sequence comprising a hairpin comprising a stem and a loop, wherein the stem is at least 10, at least 12, or at least 14 base pair ribonucleotides, and the loop. Contains asymmetric bulges within 4 base pairs
b) The guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence that is expected to contain a hairpin containing at least 8, at least 10, or at least 12 base pair ribonucleotides.
c) The guide ribonucleic acid polynucleotide is expected to contain a hairpin having an uninterrupted base pair region containing at least 8 nucleotides of the guide ribonucleic acid sequence and at least 8 nucleotides of the tracr ribonucleic acid sequence. Containing, where the tracr ribonucleic acid sequence comprises a first hairpin and a second hairpin at 5'to 3'where the first hairpin has a stem longer than the second hairpin. Or have
d) The engineered according to any of claims 130-132, wherein the guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence that is expected to contain at least two hairpins comprising less than five base pairs of ribonucleotides. Guided ribonucleic acid polynucleotide.
請求項130-133のいずれか1つに記載の操作されたガイドリボ核酸ポリヌクレオチドをコードする、デオキシリボ核酸ポリヌクレオチド。 A deoxyribonucleic acid polynucleotide encoding the engineered guide ribonucleic acid polynucleotide according to any one of claims 130-133. 生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、前記クラス2のII型Casエンドヌクレアーゼは難培養性微生物に由来する、核酸。 A nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein said nucleic acid encodes a class 2 type II Cas endonuclease containing a RuvC_III domain and an HNH domain. Here, the class 2 Cas endonuclease is a nucleic acid derived from a refractory microorganism. 生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする、核酸。 A nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein said nucleic acid is at least 70% sequence identical to any one of SEQ ID NOs: 1827-3637. A nucleic acid encoding an endonuclease containing a RuvC_III domain having sex. 前記エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む、請求項135-136のいずれか1つに記載の核酸。 13. Nucleic acid. 前記エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む、請求項135-137のいずれか1つに記載の核酸。 The nucleic acid according to any one of claims 135-137, wherein the endonuclease comprises SEQ ID NO: 5571-5591 or a variant thereof having at least 70% sequence identity to them. 前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項135-138のいずれか1つに記載の核酸。 13. One of claims 135-138, wherein the endonuclease comprises a sequence encoding one or more nuclear localization sequences (NLS) located proximal to the N-terminus or C-terminus of the endonuclease. Nucleic acid. 前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項139に記載の核酸。 The nucleic acid of claim 139, wherein the NLS comprises a sequence selected from SEQ ID NO: 5597-5612. 前記生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである、請求項135-140のいずれか1つに記載の核酸。 The nucleic acid according to any one of claims 135-140, wherein the organism is a prokaryote, a bacterium, a eukaryote, a fungus, a plant, a mammal, a rodent, or a human. 前記生物は大腸菌であり、ここで、
a)前記核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
b)前記核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
c)前記核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
d)前記核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する、
e)前記核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する、
f)前記核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する、
g)前記核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する、
h)前記核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する、
i)前記核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
j)前記核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
The organism is E. coli, where
a) The nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5571-5575.
b) The nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5576-5571.
c) The nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5578-5580.
d) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5581.
e) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5582.
f) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5583.
g) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5584.
h) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5585.
i) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5586, or
j) The nucleic acid of claim 141, wherein the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5587.
前記生物はヒトであり、ここで、
a)前記核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
b)前記核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
The organism is human, where
a) The nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5588 or SEQ ID NO: 5589, or
b) The nucleic acid of claim 141, wherein the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5590 or SEQ ID NO: 5591.
RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターであって、前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、ベクター。 A vector containing a nucleic acid sequence encoding a class 2 type II Cas endonuclease containing a RuvC_III domain and an HNH domain, wherein the class 2 type II Cas endonuclease is a vector derived from a refractory microorganism. 請求項135-143のいずれかに記載の核酸を含むベクター。 A vector comprising the nucleic acid according to any one of claims 135-143. 前記クラス2のII型Casエンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、前記操作されたガイドリボ核酸構造は、
a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
b)前記クラス2のII型Casエンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、
を含む、請求項144-145のいずれかに記載のベクター。
The engineered guide ribonucleic acid structure further comprises a nucleic acid encoding an engineered guide ribonucleic acid structure configured to form a complex with the class 2 type II Cas endonuclease.
a) A guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence and
b) A tracr ribonucleic acid sequence configured to bind to the class 2 Cas endonuclease.
The vector according to any one of claims 144-145.
前記ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである、請求項144-146のいずれかに記載のベクター。 The vector according to any one of claims 144-146, wherein the vector is a plasmid, minicircle, CELiD, adeno-associated virus (AAV) -derived virion, or lentivirus. 請求項144-147のいずれかに記載のベクターを含む細胞。 A cell comprising the vector according to any one of claims 144-147. エンドヌクレアーゼを製造する方法であって、前記方法は、請求項146の前記細胞を培養する工程を含む、方法。 A method for producing an endonuclease, wherein the method comprises the step of culturing the cells of claim 146. 二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法であって、前記方法は、
(a)クラス2のII型Casエンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、前記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み、
(b)前記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、および、
(c)前記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む、
方法。
A method for binding, cleaving, labeling, or modifying a double-stranded deoxyribonucleic acid polynucleotide, said method.
(A) Class 2 type II Cas endonucleases and class 2 type II Cas endonucleases that form a complex with an engineered guide ribonucleic acid structure configured to bind to said double-stranded deoxyribonucleic acid polynucleotide. Including the step of contacting the double-stranded deoxyribonucleic acid polynucleotide.
(B) The double-stranded deoxyribonucleic acid polynucleotide comprises a protospacer flanking motif (PAM) and
(C) The PAM comprises a sequence selected from the group consisting of SEQ ID NO: 5512-5526 or SEQ ID NO: 5527-5537.
Method.
前記二本鎖デオキシリボ核酸ポリヌクレオチドは、前記操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む、請求項149に記載の方法。 The method of claim 149, wherein the double-stranded deoxyribonucleic acid polynucleotide comprises a first strand comprising a sequence complementary to the sequence of the engineered guide ribonucleic acid structure and a second strand comprising PAM. .. 前記PAMは、前記操作されたガイドリボ核酸構造の前記配列に相補的な前記配列の3’末端に直接隣接している、請求項151に記載の方法。 15. The method of claim 151, wherein the PAM is directly adjacent to the 3'end of the sequence complementary to the sequence of the engineered guide ribonucleic acid structure. 前記クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項149-152のいずれか1つに記載の方法。 The Class 2 Type II Cas endonucleases are Cas9 endonuclease, Cas14 endonuclease, Cas12a endonuclease, Cas12b endonuclease, Cas12c endonuclease, Cas12d endonuclease, Cas12e endonuclease, Cas13a endonuclease, Cas13b endonuclease, Cas13c endonuclease. , Or the method of any one of claims 149-152, which is not a Cas13d endonuclease. 前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、請求項149-153のいずれか1つに記載の方法。 The method according to any one of claims 149-153, wherein the class 2 type II Cas endonuclease is derived from a refractory microorganism. 前記二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項149-154のいずれか1つに記載の方法。 The double-stranded deoxyribonucleic acid polynucleotide according to any one of claims 149-154, which is a double-stranded deoxyribonucleic acid polynucleotide of eukaryote, plant, fungus, mammal, rodent, or human. the method of. a)前記PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む、
b)前記PAMは配列番号:5516あるいは配列番号:5531を含む、
c)前記PAMは配列番号:5539を含む、
d)前記PAMは配列番号:5517あるいは配列番号:5518を含む、
e)前記PAMは配列番号:5519を含む、
f)前記PAMは配列番号:5520あるいは配列番号:5535を含む、
g)前記PAMは配列番号:5521あるいは配列番号:5536を含む、
h)前記PAMは配列番号:5522を含む、
i)前記PAMは配列番号:5523あるいは配列番号:5537を含む、
j)前記PAMは配列番号:5524を含む、
k)前記PAMは配列番号:5525を含む、または、
l)前記PAMは配列番号:5526を含む、
請求項149-155のいずれか1つに記載の方法。
a) The PAM comprises a sequence selected from the group consisting of SEQ ID NO: 5512-5515 and SEQ ID NO: 5527-5530.
b) The PAM comprises SEQ ID NO: 5516 or SEQ ID NO: 5531.
c) The PAM comprises SEQ ID NO: 5539.
d) The PAM comprises SEQ ID NO: 5517 or SEQ ID NO: 5518.
e) The PAM comprises SEQ ID NO: 5519.
f) The PAM comprises SEQ ID NO: 5520 or SEQ ID NO: 5535.
g) The PAM comprises SEQ ID NO: 5521 or SEQ ID NO: 5536.
h) The PAM comprises SEQ ID NO: 5522.
i) The PAM comprises SEQ ID NO: 5523 or SEQ ID NO: 5537.
j) The PAM comprises SEQ ID NO: 5524.
k) The PAM comprises or comprises SEQ ID NO: 5525.
l) The PAM comprises SEQ ID NO: 5526.
The method according to any one of claims 149-155.
標的核酸遺伝子座を改変する方法であって、前記方法は、請求項1-129のいずれか1つに記載の前記操作されたヌクレアーゼシステムのいずれかを、前記標的核酸遺伝子座に送達する工程を含み、ここで、前記エンドヌクレアーゼは、前記操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、前記複合体は、前記複合体が前記標的核酸遺伝子座に結合すると、前記複合体が前記標的核酸遺伝子座を改変するように構成される、方法。 A method of modifying a target nucleic acid locus, wherein the method delivers any of the engineered nuclease systems according to any one of claims 1-129 to the target nucleic acid locus. Containing, the endonuclease is configured to form a complex with the engineered guide ribonucleic acid structure, wherein the complex is such that the complex binds to the target nucleic acid locus. A method in which the complex is configured to modify the target nucleic acid locus. 前記標的核酸遺伝子座を改変することは、前記標的核酸遺伝子座を結合、ニッキング、切断、または標識することを含む、請求項156に記載の方法。 156. The method of claim 156, wherein modifying the target nucleic acid locus comprises binding, nicking, cleaving, or labeling the target nucleic acid locus. 前記標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む、請求項156-158のいずれかに記載の方法。 The method of any of claims 156-158, wherein the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). 前記標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む、請求項159に記載の方法。 159. The method of claim 159, wherein the target nucleic acid comprises genomic DNA, viral DNA, viral RNA, or bacterial DNA. 前記標的核酸遺伝子座はインビトロにある、請求項156-160のいずれか1つに記載の方法。 The method of any one of claims 156-160, wherein the target nucleic acid locus is in vitro. 前記標的核酸遺伝子座は細胞内にある、請求項156-160のいずれか1つに記載の方法。 The method according to any one of claims 156-160, wherein the target nucleic acid locus is intracellular. 前記細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である、請求項162に記載の方法。 16. The method of claim 162, wherein the cell is a prokaryotic cell, a bacterial cell, a eukaryotic cell, a fungal cell, a plant cell, an animal cell, a mammalian cell, a rodent cell, a primate cell, or a human cell. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む、請求項162-163のいずれか1つに記載の方法。 The step of delivering the engineered nuclease system to the target nucleic acid locus comprises delivering the nucleic acid of any of claims 135-140 or the vector of any of claims 142-146. The method according to any one of claims 162-163. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項162-163のいずれか1つに記載の方法。 162-1. Method. 前記核酸は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されるプロモーターを含む、請求項164に記載の方法。 164. The method of claim 164, wherein the nucleic acid comprises a promoter to which the open reading frame encoding the endonuclease is operably linked. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAを送達することを含む、請求項162-163のいずれか1つに記載の方法。 One of claims 162-163, wherein the step of delivering the engineered nuclease system to the target nucleic acid locus comprises delivering a capped mRNA comprising the open reading frame encoding the endonuclease. The method described in one. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、翻訳されたポリペプチドを送達することを含む、請求項162-163のいずれか1つに記載の方法。 The method of any one of claims 162-163, wherein the step of delivering the engineered nuclease system to the target nucleic acid locus comprises delivering the translated polypeptide. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される前記操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む、請求項162-163のいずれか1つに記載の方法。 The step of delivering the engineered nuclease system to the target nucleic acid locus delivers deoxyribonucleic acid (DNA) encoding the engineered guide ribonucleic acid structure operably linked to the ribonucleic acid (RNA) pol III promoter. The method of any one of claims 162-163, comprising: 前記エンドヌクレアーゼは、前記標的核酸遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす、請求項156-169のいずれか1つに記載の方法。 The method of any one of claims 156-169, wherein the endonuclease causes single-strand breaks or double-strand breaks at or proximal to the target nucleic acid locus.
JP2021547336A 2019-02-14 2020-02-14 Enzyme with RUVC domain Ceased JP2022520428A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2023146414A JP7502537B2 (en) 2019-02-14 2023-09-08 Enzymes with RUVC domains
JP2024091759A JP2024133476A (en) 2019-02-14 2024-06-05 Enzymes containing RUVC domains

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962805868P 2019-02-14 2019-02-14
US201962805878P 2019-02-14 2019-02-14
US201962805899P 2019-02-14 2019-02-14
US62/805,878 2019-02-14
US62/805,868 2019-02-14
US62/805,899 2019-02-14
US201962874414P 2019-07-15 2019-07-15
US62/874,414 2019-07-15
PCT/US2020/018432 WO2020168291A1 (en) 2019-02-14 2020-02-14 Enzymes with ruvc domains

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023146414A Division JP7502537B2 (en) 2019-02-14 2023-09-08 Enzymes with RUVC domains

Publications (2)

Publication Number Publication Date
JP2022520428A true JP2022520428A (en) 2022-03-30
JPWO2020168291A5 JPWO2020168291A5 (en) 2023-02-21

Family

ID=72045639

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021547336A Ceased JP2022520428A (en) 2019-02-14 2020-02-14 Enzyme with RUVC domain
JP2023146414A Active JP7502537B2 (en) 2019-02-14 2023-09-08 Enzymes with RUVC domains
JP2024091759A Pending JP2024133476A (en) 2019-02-14 2024-06-05 Enzymes containing RUVC domains

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2023146414A Active JP7502537B2 (en) 2019-02-14 2023-09-08 Enzymes with RUVC domains
JP2024091759A Pending JP2024133476A (en) 2019-02-14 2024-06-05 Enzymes containing RUVC domains

Country Status (9)

Country Link
US (1) US20240117330A1 (en)
EP (1) EP3924482A4 (en)
JP (3) JP2022520428A (en)
KR (2) KR20240007322A (en)
CN (2) CN113728098A (en)
AU (2) AU2020223370B2 (en)
CA (2) CA3241703A1 (en)
MX (2) MX2021009886A (en)
WO (1) WO2020168291A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023179468A (en) * 2019-02-14 2023-12-19 メタゲノミ,インク. Enzymes with ruvc domains

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10913941B2 (en) 2019-02-14 2021-02-09 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
GB2617659B (en) * 2020-02-14 2024-05-01 Metagenomi Inc Enzymes with RuvC domains
GB2617658B (en) 2020-03-06 2024-04-17 Metagenomi Inc Class II, type V CRISPR systems
CN116096877A (en) * 2020-03-31 2023-05-09 宏基因组学公司 Class II type II CRISPR system
WO2021226369A1 (en) * 2020-05-08 2021-11-11 Metagenomi Ip Technologies, Llc Enzymes with ruvc domains
GB2615901A (en) * 2020-09-11 2023-08-23 Metagenomi Inc Base editing enzymes
WO2022098681A2 (en) * 2020-11-03 2022-05-12 Caspr Biotech Corporation Novel class 2 crispr-cas rna-guided endonucleases
WO2022159742A1 (en) * 2021-01-22 2022-07-28 Metagenomi, Inc Novel engineered and chimeric nucleases
CA3205865A1 (en) * 2021-01-22 2022-07-28 Brian C. Thomas Novel engineered and chimeric nucleases
CN117203332A (en) * 2021-04-30 2023-12-08 宏基因组学公司 Enzymes with RUVC domains
WO2023122663A2 (en) * 2021-12-23 2023-06-29 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023194359A1 (en) * 2022-04-04 2023-10-12 Alia Therapeutics Srl Compositions and methods for treatment of usher syndrome type 2a
WO2023245141A2 (en) * 2022-06-15 2023-12-21 Beam Therapeutics Inc. Compositions and methods for reducing complement activation
WO2024056880A2 (en) * 2022-09-16 2024-03-21 Alia Therapeutics Srl Enqp type ii cas proteins and applications thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2898075T3 (en) * 2012-12-12 2016-09-30 Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
US10392607B2 (en) * 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
WO2016205759A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2018035250A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
EP3755792A4 (en) * 2018-02-23 2021-12-08 Pioneer Hi-Bred International, Inc. Novel cas9 orthologs
CN113728098A (en) 2019-02-14 2021-11-30 宏基因组学知识产权技术有限责任公司 Enzymes with RUVC domains

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"ID A0A1F0PN46_9MICC", UNIPROT, JPN6023010401, 13 February 2019 (2019-02-13), ISSN: 0005013894 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023179468A (en) * 2019-02-14 2023-12-19 メタゲノミ,インク. Enzymes with ruvc domains
JP7502537B2 (en) 2019-02-14 2024-06-18 メタゲノミ,インク. Enzymes with RUVC domains

Also Published As

Publication number Publication date
EP3924482A4 (en) 2023-04-05
AU2020223370B2 (en) 2023-04-20
JP7502537B2 (en) 2024-06-18
JP2023179468A (en) 2023-12-19
CN116515797A (en) 2023-08-01
CA3241703A1 (en) 2020-08-20
KR20210139254A (en) 2021-11-22
CN113728098A (en) 2021-11-30
EP3924482A1 (en) 2021-12-22
KR20240007322A (en) 2024-01-16
WO2020168291A1 (en) 2020-08-20
MX2021009886A (en) 2021-10-13
JP2024133476A (en) 2024-10-02
MX2023006575A (en) 2023-06-16
AU2023206079A1 (en) 2023-08-10
US20240117330A1 (en) 2024-04-11
KR102623312B1 (en) 2024-01-09
CA3130135A1 (en) 2020-08-20
AU2020223370A1 (en) 2021-10-07

Similar Documents

Publication Publication Date Title
AU2020223370B2 (en) Enzymes with RuvC domains
US12024727B2 (en) Enzymes with RuvC domains
US20240209332A1 (en) Enzymes with ruvc domains
US20220298494A1 (en) Enzymes with ruvc domains
US20240301374A1 (en) Systems and methods for transposing cargo nucleotide sequences
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
US20220220460A1 (en) Enzymes with ruvc domains
EP4165177A1 (en) Enzymes with ruvc domains
US20240110167A1 (en) Enzymes with ruvc domains
GB2617659A (en) Enzymes with RUVC domains

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220404

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20220511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220511

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20221221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230210

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230814

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20231218