[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2019194320A1 - エンジニアリングされたBlCas9ヌクレアーゼ - Google Patents

エンジニアリングされたBlCas9ヌクレアーゼ Download PDF

Info

Publication number
WO2019194320A1
WO2019194320A1 PCT/JP2019/015321 JP2019015321W WO2019194320A1 WO 2019194320 A1 WO2019194320 A1 WO 2019194320A1 JP 2019015321 W JP2019015321 W JP 2019015321W WO 2019194320 A1 WO2019194320 A1 WO 2019194320A1
Authority
WO
WIPO (PCT)
Prior art keywords
amino acid
substitution
protein
lys
arg
Prior art date
Application number
PCT/JP2019/015321
Other languages
English (en)
French (fr)
Inventor
理 濡木
弘志 西増
俊博 中根
Original Assignee
国立大学法人東京大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人東京大学 filed Critical 国立大学法人東京大学
Priority to JP2020512343A priority Critical patent/JP7486189B2/ja
Publication of WO2019194320A1 publication Critical patent/WO2019194320A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)

Definitions

  • the present invention relates to engineered BlCas9 nuclease, genes encoding the nuclease, and their use, preferably having simple PAM recognition.
  • CRISPR Clustered Regularly Arranged Short Palindromic Repeats
  • Cas Cas-associated genes
  • exogenous DNA is cleaved into fragments of about 30 bp by the Cas protein family and inserted into CRISPR.
  • Cas1 and Cas2 proteins which are one of the Cas protein family, recognize a base sequence called proto-spacer adadient motif (PAM) of foreign DNA, cut the upstream, and insert it into the CRISPR sequence of the host. It becomes immune memory of bacteria.
  • RNA generated by transcription of a CRISPR sequence including immune memory (referred to as pre-crRNA) is part of the Cas protein family by pairing with partially complementary RNA (trans-activating crRNA). It is incorporated into Cas9 protein.
  • the pre-crRNA and tracrRNA incorporated into Cas9 are cleaved by RNAaseIII to form small RNA fragments (CRISPR-RNAs: crRNAs) containing a foreign sequence (guide sequence) to form a Cas9-crRNA-tracrRNA complex.
  • CRISPR-RNAs crRNAs
  • the Cas9-crRNA-tracrRNA complex binds to a foreign invading DNA complementary to crRNA, and the Cas9 protein, which is an enzyme (nuclease) that cleaves the DNA, cleaves the foreign invading DNA. Suppress and eliminate the function of
  • Cas9 protein recognizes the PAM sequence in the foreign invading DNA and cleaves the double-stranded DNA upstream of it so as to be a blunt end.
  • the length and base sequence of the PAM sequence vary depending on the bacterial species, and Streptococcus pyogenes (S. pyogenes) recognizes 3 bases of “NGG”.
  • Streptococcus thermophilus (S. thermophilus) has two Cas9 and recognizes 5-6 bases of “NGGNG” or “NNAGAA” as PAM sequences, respectively. (N represents any base).
  • N represents any base).
  • the number of bps upstream of the PAM sequence depends on the bacterial species.
  • crRNA and tracrRNA are fused and expressed as a tracrRNA-crRNA chimera (hereinafter referred to as guide RNA: gRNA) and utilized.
  • guide RNA gRNA
  • a nuclease RNA-guided nuclease: RGN
  • RGN genomic DNA is cleaved at the target site.
  • CRISPR-Cas system There are types I, II, and III in the CRISPR-Cas system, but the type II CRISPR-Cas system is exclusively used for genome editing, and Cas9 protein is used as RGN in type II. S. Since the pyogenes-derived Cas9 protein recognizes three bases, NGG, as a PAM sequence, it can be cleaved upstream as long as there is a sequence of two guanines.
  • the method using the CRISPR-Cas system only needs to synthesize a short gRNA homologous with the target DNA sequence, and genome editing can be performed using the Cas9 protein which is a single protein. Therefore, it is not necessary to synthesize large proteins that differ for each DNA sequence like zinc finger nuclease (ZFN) and transactivator-like activator (TALEN) used in the past, and genome editing can be performed easily and quickly. Can do.
  • ZFN zinc finger nuclease
  • TALEN transactivator-like activator
  • Patent Document 1 S. A genome editing technique utilizing a CRISPR-Cas system derived from pyogenes is disclosed.
  • Patent Document 2 includes S.I. A genome editing technique using a C. thermophilus-derived CRISPR-Cas system is disclosed. Patent Document 2 discloses that the D31A or N891A mutant of Cas9 protein functions as a nickase that is a DNA-cleaving enzyme that nicks only one DNA strand. It has been shown that homologous recombination efficiency comparable to that of the wild-type Cas9 protein is maintained while the incidence of non-homologous end joining that is prone to mutation such as insertion deletion by the repair mechanism remains low.
  • Non-Patent Document 1 includes S. CRISPR-Cas system using Casogen derived from pyogenes, using a D10A mutant of two Cas9 proteins and a pair of target-specific guide RNAs forming a complex with the D10A mutant Is disclosed.
  • the D10A variant of each Cas9 protein and the target-specific guide RNA complex make only one nick in the DNA strand that is complementary to the guide RNA.
  • the pair of guide RNAs is shifted by about 20 bases and recognizes only the target sequence located on the opposite strand of the target DNA.
  • the two nicks created by the D10A mutant of each Cas9 protein and the target-specific guide RNA become mimicking DSB (DNA double-strand breaks), and a high level is achieved by using a pair of guide RNAs. It has been shown that the specificity of Cas9 protein-mediated gene editing can be improved while maintaining the efficiency of.
  • the pyogenes-derived Cas9 protein has 3 bases with a recognizable PAM sequence of “NGG” and is disclosed in S. pylori.
  • the recognizable PAM sequence is 5 to 6 bases of “NGGNG” or “NNAGAA”, and the recognizable PAM sequence is limited, so that the target sequence that can be edited is limited.
  • Non-Patent Document 1 S. Because Pyogenes-derived Cas9 protein is used and two recognizable PAM sequences are required for each of the sense strand and antisense strand in the target sequence, the target sequence that can be edited is further restricted.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a Cas9 protein in which recognition of a PAM sequence is widespread while maintaining a binding force to a target double-stranded polynucleotide. Another object of the present invention is to provide a Cas9 protein with improved guide RNA and / or DNA recognition. Furthermore, an object of the present invention is to provide a genome editing technique specific to a target sequence and a simple and rapid method for gene expression regulation using the Cas9 protein.
  • a protein comprising a sequence containing any one of the following amino acid sequences (a) to (f) and capable of forming a complex with a target-specific guide RNA.
  • A the amino acid sequence represented by SEQ ID NO: 1
  • B an amino acid sequence in which one to several amino acids are deleted, inserted, substituted or added at a site other than the amino acid number 100 position of the amino acid sequence represented by SEQ ID NO: 1
  • C an amino acid sequence having 80% or more identity at a site other than the amino acid number 100 position of the amino acid sequence represented by SEQ ID NO: 1
  • D the amino acid sequence represented by SEQ ID NO: 2
  • E an amino acid sequence in which one to several amino acids are deleted, inserted, substituted or added at a site other than amino acid number 1022 of the amino acid sequence represented by SEQ ID NO: 2
  • F an amino acid sequence having 80% or more identity at a site other than amino acid number 1022 of the amino acid sequence represented by SEQ ID NO:
  • amino acid number 100 position of the amino acid sequence represented by SEQ ID NO: 1 is Asn
  • amino acid number position 1022 of the amino acid sequence represented by SEQ ID NO: 2 is Asn
  • amino acid number position 1022 of the amino acid sequence represented by SEQ ID NO: 2 is Asn
  • a protein comprising a sequence comprising any one of the following amino acid sequences (g) to (i) and capable of forming a complex with a target-specific guide RNA.
  • G the amino acid sequence represented by SEQ ID NO: 13
  • H an amino acid sequence in which one to several amino acids are deleted, inserted, substituted or added at a site other than amino acid number 1025 of the amino acid sequence represented by SEQ ID NO: 13
  • I an amino acid sequence having 80% or more identity at a site other than amino acid number 1025 of the amino acid sequence represented by SEQ ID NO: 13
  • a protein comprising a sequence containing any one of the following amino acid sequences (j) to (l) and capable of forming a complex with a target-specific guide RNA.
  • an amino acid sequence comprising at least one of the following substitutions (1) and / or (2): (1) Lys, Arg, or Glu of amino acid position 52 Substitution to His, substitution of Ser at position 55 to Lys, Arg, or His, substitution of Ser at position 843 to Asn, Gln, or Tyr, substitution of Lys at position 997 to Arg or His, From substitution of Lys at position 1040 to Arg or His, substitution of Lys at position 959 to Ala, substitution of Lys at position 992 to Ala, and substitution of Glu at position 904 to Lys, Arg, or His At least one substitution selected, (2) substitution of His at amino acid number 72 to Lys or Arg, substitution of Gln at position 93 to Lys, Arg, or His, substitution of Glu at position
  • a protein comprising a sequence comprising any one of the following amino acid sequences (m) to (o) and capable of forming a complex with a target-specific guide RNA.
  • the amino acid sequence includes the following substitution (3): protein.
  • substitution (3) Substitution of Asp at amino acid number 8 position to Ala, substitution of Glu at position 503 to Ala, substitution of His at 584 position to Ala, substitution of Asn at position 598 to Ala, Asn at position 607 At least one substitution selected from substitution with Ala and substitution of Asp at position 725 with Ala
  • a protein comprising a sequence comprising any one of the following base sequences (p) to (s) and capable of forming a complex with a target-specific guide RNA: gene.
  • P a base sequence represented by SEQ ID NO: 3 or 4
  • Q a base sequence in which 1 to several bases are deleted, inserted, substituted or added in the base sequence represented by SEQ ID NO: 3 or 4
  • R a base sequence having 80% or more identity with the base sequence represented by SEQ ID NO: 3 or 4
  • S a base sequence capable of hybridizing under stringent conditions with a DNA comprising a base sequence complementary to the DNA comprising the base sequence represented by SEQ ID NO: 3 or 4
  • a protein comprising a sequence comprising any one of the following base sequences (t) to (w) and capable of forming a complex with a target-specific guide RNA: gene.
  • T the base sequence represented by SEQ ID NO: 14;
  • U a base sequence in which 1 to several bases are deleted, inserted, substituted or added in the base sequence represented by SEQ ID NO: 14;
  • V a base sequence having 80% or more identity with the base sequence represented by SEQ ID NO: 14,
  • W a base sequence capable of hybridizing under stringent conditions with a DNA comprising a base sequence complementary to the DNA comprising the base sequence represented by SEQ ID NO: 14
  • composition comprising a guide RNA comprising a polynucleotide comprising a base sequence complementary to a base sequence from 1 base upstream to 20 bases to 24 bases upstream of the PAM sequence in the target double-stranded polynucleotide.
  • a method for site-specific cleavage of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the protein according to any one of [1] to [8] and a guide RNA, The method wherein the protein cleaves the target double-stranded polynucleotide at a cleavage site located upstream of the PAM sequence in the target double-stranded polynucleotide to create a blunt end.
  • a method for site-specific modification of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the protein according to any one of [1] to [8] and a guide RNA, The protein cleaves the target double-stranded polynucleotide at a cleavage site located 3 bases upstream of the PAM sequence in the target double-stranded polynucleotide to create a blunt end; A method wherein the target double-stranded polynucleotide is modified in a region determined by complementary binding of the guide RNA and the target double-stranded polynucleotide.
  • a method for site-specific modification of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the protein according to [9] and a guide RNA, The protein specifically binds to the target double-stranded polynucleotide via the guide RNA, wherein the protein does not cleave the target double-stranded polynucleotide or cleaves only one strand.
  • a method wherein the target double-stranded polynucleotide is modified in a region determined by complementary binding of the guide RNA and the target double-stranded polynucleotide.
  • a method for regulating gene expression comprising: Contacting the target double-stranded polynucleotide associated with the gene, the protein according to [9], a guide RNA, and an effector molecule, The protein specifically binds to the target double-stranded polynucleotide via the guide RNA, whereby the effector molecule specifically acts on the target double-stranded polynucleotide, thereby causing expression of the gene.
  • the present invention it is possible to obtain a Cas9 protein in which recognition of a PAM sequence is widespread while maintaining a binding force to a target double-stranded polynucleotide. Furthermore, the present invention can provide a Cas9 protein with improved recognition of guide RNA and / or target double-stranded polynucleotide. Furthermore, according to the present invention, a target sequence selected from a wide range of sequences, including sequences that have been impossible or difficult to target by the prior art, can be used in a convenient and simple manner for target sequence-specific genome editing and gene expression regulation. A quick method can be provided.
  • the target DNA having various PAM sequences at the time of (A) 5 minutes, (B) 15 minutes, and (C) 30 minutes after the start of the reaction. It is an electrophoresis photograph showing the cleavage activity. It is the graph which quantified the result of T1025A mutant BlCas9 of FIG. It is the graph which showed the DNA cutting
  • the present invention comprises a sequence comprising any one of the following amino acid sequences (a) to (f), and can form a complex with a target-specific guide RNA: To provide a protein.
  • polypeptide means polymers of amino acid residues and are used interchangeably. It also means an amino acid polymer in which one or more amino acids are chemical analogues or modified derivatives of the corresponding naturally occurring amino acids.
  • amino acid polymer in which one or more amino acids are chemical analogues or modified derivatives of the corresponding naturally occurring amino acids.
  • the one-letter code and three-letter code of amino acids as defined in accordance with IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN) are used.
  • substitution mutation when a substitution mutation is represented in an amino acid sequence, it may be represented by one letter of the original amino acid, followed by a position number of 1 to 4 digits, and then by one letter of the substituted amino acid.
  • D aspartic acid
  • N asparagine
  • the present inventors examined an ortholog of Cas9 in order to obtain a Cas9 protein in which recognition of a PAM sequence was widespread, and focused on a Cas9 protein (BlCas9 protein) derived from Brevibacillus laterosporus (B. laterosporus).
  • ortholog means a correspondence between genes derived from a common ancestor gene with species branching, or a group of genes having such a correspondence.
  • the wild type BlCas9 protein is a type II Cas9 endonuclease consisting of 1092 amino acid residues.
  • the full-length amino acid sequence of wild-type BlCas9 protein is shown in SEQ ID NO: 5.
  • FIG. 1 (A) shows a PAM sequence that can be recognized by the BlCas9 protein.
  • the BlCas9 protein recognizes eight bases “5′-NNNNNCDD-3 ′” as a PAM sequence.
  • FIG. 1 (B) shows an example of the sequence and secondary structure of a guide RNA that can be formed into a complex with the BlCas9 protein (Karvelis et al. Genome Biology, 2015).
  • A means adenine
  • G means guanine
  • C means cytosine
  • T means thymine
  • D means adenine
  • N means any one base selected from the group consisting of adenine, cytosine, thymine, and guanine.
  • FIG. 2 is a diagram showing the results of crystal structure analysis of a ternary complex of BlCas9 protein, guide RNA and target double-stranded polynucleotide.
  • a target double-stranded polynucleotide having a strand containing “5′-NNNNNCDD-3 ′” as a PAM sequence and having a base sequence non-complementary to the guide RNA was used.
  • FIG. 3 is a diagram showing a mechanism for recognizing the fifth base of the PAM sequence at the PAM sequence recognition site of the wild-type BlCas9 protein.
  • the 1022nd aspartic acid (Asp1022) and the 1040th lysine (Lys1040) in the BlCas9 protein form a base pair with the fifth cytosine (C) and the cytosine (C) in the PAM sequence. It was revealed that hydrogen bonds were formed with glycine (G).
  • the BlCas9 protein of the present embodiment in which the recognition of the fifth base in the PAM sequence is modified is a protein comprising the following amino acid sequence (a) or (d): is there.
  • SEQ ID NO: 1 is a PI domain (PI: PAM-interacting) sequence (170 residues from Ser 923 to 1092 Arg), which is a PAM sequence recognition site in the BlCas9 protein.
  • a point mutation that modifies the recognition of the second base specifically, a sequence comprising at least substitution of Asp (D) at amino acid position 100 with Asn (N), Gln (Q), or His (H) is there.
  • SEQ ID NO: 1 also optionally includes substitution of Lys (K) at position 118 with Glu (E) or Asp (D) in addition to the above substitutions.
  • SEQ ID NO: 2 is the full-length amino acid sequence of the BlCas9 protein, and is a point mutation that modifies the recognition of the fifth base of the PAM sequence, specifically, Asn (N) of Asp (D) at amino acid number 1022 , Gln (Q), or His (H).
  • SEQ ID NO: 2 also optionally includes substitution of Lys (K) at position 1040 with Glu (E) or Asp (D) in addition to the above substitutions.
  • Asp (D) at amino acid position 1022 (corresponding to position 100 of SEQ ID NO: 1) of wild-type BlCas9 is an amino acid having a side chain capable of forming a hydrogen bond with a nucleotide. It is thought that the type of base that can be recognized can be modified by strengthening the binding force because it directly hydrogen bonds with the 5th base in the PAM sequence in the double-stranded polynucleotide. It is done.
  • Examples of the “amino acid having a side chain capable of forming a hydrogen bond with a nucleotide” include Asn (N), Gln (Q), and His (H), in which Asn (N) is preferable.
  • Lys (K) at position 1040 (corresponding to position 118 of SEQ ID NO: 1) recognizing G forming a base pair with the fifth C in the PAM sequence is changed to Glu.
  • Substitution with (E) or Asp (D), preferably Glu (E) makes the fifth base of the recognized PAM sequence “G” specific.
  • the wild-type B1Cas9 protein recognizes a sequence in which the fifth base in the PAM sequence is “C”
  • the B1Cas9 protein of this embodiment having the above substitution at position 1022 is the fifth in the PAM sequence.
  • a sequence (“5′-NNNNNDDD-3 ′”) having a base of “D” is recognized.
  • the BlCas9 protein of this embodiment having a combination of the above substitutions at positions 1022 and 1040 recognizes a sequence in which the fifth base in the PAM sequence is “G” (“5′-NNNNGNDD-3 ′”).
  • the BlCas9 protein of the present embodiment includes the following (b) or (c), or a protein functionally equivalent to a protein comprising a sequence containing an amino acid sequence containing the substitution (a) or (d): A protein comprising a sequence comprising the amino acid sequence of (e) or (f) is included.
  • “functionally equivalent protein” refers to a modified Cas9 that maintains a function required for an application in which the Cas9 protein is used, among the functions of the wild-type Cas9 protein.
  • protein is meant “required function” may vary depending on the application.
  • the modified BlCas9 protein retains RNA-induced DNA endonuclease activity.
  • the modified BlCas9 protein maintains at least the function of forming a complex with the target specific guide RNA.
  • deletion, insertion, substitution or addition of an amino acid sequence or a base sequence refers to a deletion, insertion, substitution or addition compared to a wild-type amino acid sequence or base sequence.
  • the amino acid sequence of the BlCas9 protein of the present embodiment is, for example, at a position other than the amino acid number position 100 of the amino acid sequence represented by SEQ ID NO: 1 or a position other than the amino acid number position 1022 of the amino acid sequence represented by SEQ ID NO: 2, 1 to 250, 1 to 200, 1 to 150, 1 to 100, preferably 1 to 50, 1 to 40, 1 to 30, more preferably 1 to 15, even more preferably Includes deletions, insertions, substitutions or additions of 1 to 10, particularly preferably 1 to 5 amino acids.
  • the amino acid sequence of the modified BlCas9 protein is 1, 2, 3, 4, 5, 6, 7, 8, 9 at positions other than amino acid number 1022. Or a deletion, insertion, substitution, or addition of 10 amino acids.
  • the amino acid sequence of the BlCas9 protein of this embodiment may contain at least one of the substitutions (1) to (3) described below in addition to the above substitutions.
  • the amino acid sequence of the BlCas9 protein of this embodiment comprises at least one substitution of (1) and / or (2).
  • the amino acid sequence of the modified BlCas9 protein includes all of the substitutions (1)-(3).
  • SEQ ID NO: 6 An example of the amino acid sequence of the full-length BlCas9 protein of the present invention containing the mutation of this embodiment and further containing at least one substitution of (1) to (3) is shown in SEQ ID NO: 6.
  • the amino acid sequence of the BlCas9 protein of this embodiment includes deletion, insertion, substitution, or addition of one or more amino acids at positions other than amino acid number 100 of SEQ ID NO: 1
  • the amino acid sequence Has 80% or more identity with the amino acid sequence of SEQ ID NO: 1 at sites other than position 100 of SEQ ID NO: 1.
  • the amino acid sequence of the BlCas9 protein of the present embodiment includes a deletion, insertion, substitution, or addition of one or more amino acids at positions other than amino acid number 1022 of SEQ ID NO: 2
  • the amino acid sequence is The amino acid sequence of SEQ ID NO: 2 has 80% or more identity at a site other than position 1022 of SEQ ID NO: 2.
  • amino acid sequence of the modified BlCas9 protein of the present invention is preferably 85% or more, more preferably 90% or more, with the amino acid sequence of SEQ ID NO: 1 at a site other than position 100 of SEQ ID NO: 1. Even more preferably 95% or more, for example 96% or more, 97% or more, or 98% or more, most preferably 99% or more.
  • the amino acid sequence of the modified BlCas9 protein of the present invention is preferably 85% or more, more preferably 90% or more with the amino acid sequence of SEQ ID NO: 2 at a site other than position 1022 of SEQ ID NO: 2. Even more preferably, it has an identity of 95% or more, such as 96% or more, 97% or more, or 98% or more, most preferably 99% or more.
  • the BlCas9 protein of the present invention may be a protein consisting of a sequence containing another amino acid sequence in addition to any one amino acid sequence of (a) to (f). In another embodiment, the BlCas9 protein of the present invention is a protein consisting of only one amino acid sequence of (d) to (f).
  • the present invention comprises a sequence comprising any one of the following amino acid sequences (g) to (i), and can form a complex with a target-specific guide RNA: To provide a protein.
  • G the amino acid sequence represented by SEQ ID NO: 13
  • H an amino acid sequence in which one to several amino acids are deleted, inserted, substituted or added at a site other than amino acid number 1025 of the amino acid sequence represented by SEQ ID NO: 13
  • I an amino acid sequence having 80% or more identity at a site other than amino acid number 1025 of the amino acid sequence represented by SEQ ID NO: 13
  • the BlCas9 protein of the present embodiment in which the recognition of the 7th and 8th bases of the PAM sequence has been modified is specifically a protein characterized by consisting of a sequence comprising the following amino acid sequence (g): .
  • SEQ ID NO: 13 is a full-length amino acid sequence of a BlCas9 protein in which recognition of the 7th and 8th bases of the PAM sequence is relaxed compared to wild-type BlCas9, specifically, Thr at amino acid number 1025 ( T) is a sequence comprising at least substitution of Ala (A).
  • the BlCas9 protein of this embodiment is a protein functionally equivalent to a protein comprising a sequence containing an amino acid sequence containing the substitution (g), and a sequence comprising the following amino acid sequence (h) or (i):
  • the amino acid sequence of the BlCas9 protein of this embodiment is, for example, 1 to 250, 1 to 200, 1 to 150, 1 to 100 at positions other than amino acid number 1025 of the amino acid sequence represented by SEQ ID NO: 13. Deletion, preferably 1 to 50, 1 to 40, 1 to 30, more preferably 1 to 15, even more preferably 1 to 10, particularly preferably 1 to 5 amino acids, Includes insertions, substitutions, or additions.
  • the amino acid sequence of the modified BlCas9 protein is one, two, three, four, five, six, seven, eight, nine at positions other than amino acid number 1025. Or a deletion, insertion, substitution, or addition of 10 amino acids.
  • the amino acid sequence of the BlCas9 protein of this embodiment contains a deletion, insertion, substitution, or addition of one or more amino acids at positions other than amino acid number 1025 of SEQ ID NO: 13, the amino acid sequence Is 80% or more, preferably 85% or more, more preferably 90% or more, even more preferably 95% or more, such as 96% or more, at the site other than position 1025 of SEQ ID NO: 13, 97% or more, or 98% or more, most preferably 99% or more.
  • the BlCas9 protein of the present invention may be a protein consisting of a sequence containing another amino acid sequence in addition to any one amino acid sequence of (g) to (i). In another embodiment, the BlCas9 protein of the present invention is a protein consisting of only one amino acid sequence of (g) to (i).
  • the present invention provides a protein comprising at least one of the following substitutions (1) in the full-length amino acid sequence of B1Cas9 protein.
  • substitutions (1) in the full-length amino acid sequence of B1Cas9 protein.
  • (1) Replacement of Glu at amino acid position 52 with Lys, Arg or His, Replacement of Ser at position 55 with Lys, Arg or His, Ser at 843 position with Asn, Gln or Tyr
  • Substitution of Lys at position 997 to Arg or His substitution of Lys at position 1040 to Arg or His, substitution of Lys at position 959 to Ala, substitution of Lys at position 992 to Ala
  • this embodiment in which position 1025 is substituted in the full-length amino acid sequence of BlCas9 protein, and the above embodiment including at least one substitution of (1) (hereinafter simply referred to as “this embodiment”), the wild type A Cas9 protein having an improved DNA sequence recognition activity as compared with BlCas9 can be obtained.
  • the BlCas9 protein of this embodiment has improved DNA sequence recognition activity, and as a result, the preference of the seventh and eighth bases in the PAM sequence is alleviated.
  • the BlCas9 protein of this embodiment has a PAM sequence in which at least either the seventh or eighth base is “N”, and preferably both the seventh and eighth bases are “N”. Recognize
  • Cas9 protein has an ⁇ -helix rich in arginine residues called BH (bridge helix), and a plurality of arginine residues in this BH are PAM sequences called “seed regions” of guide RNA. Is recognized to play an important role in the function of Cas9. Therefore, without being bound by theory, the amino acid residues at positions 52, 55, etc.
  • an amino acid capable of interacting with Glu (E) at amino acid position 904 of wild-type BlCas9 with the phosphate skeleton of the target strand of double-stranded DNA It is considered that the nucleic acid recognition activity can be improved by modifying to.
  • the “amino acid capable of interacting with the phosphate skeleton of DNA” include Arg (R), Lys (K), and His (H), and among these, Arg (R) is preferable.
  • the BlCas9 protein of this embodiment preferably includes the following substitutions or combinations of substitutions.
  • triple mutations particularly combinations of substitutions of E52R, S843N, and K997R are preferred.
  • the BlCas9 protein of the present embodiment having the above mutation has a preference of recognition of the 8th base of the PAM sequence from “D” (A, G, or T) to “N” (A, C, G, or T). ).
  • the BlCas9 protein of this embodiment preferably comprises the following substitutions or combinations of substitutions. ⁇ K959A ⁇ K992A ⁇ K959A / K992A ⁇ T1025A
  • substitution of T1025A is particularly preferable.
  • the BlCas9 protein of the present embodiment having the above mutation has a preference for recognition of the seventh and eighth bases of the PAM sequence from “DD” (A, G, or T) to “NN” (A, C, G Or T).
  • the BlCas9 protein of this embodiment preferably comprises the following substitutions or combinations of substitutions. ⁇ E904R ⁇ S55K / E904R
  • the BlCas9 protein of this embodiment containing at least one substitution at position 1025 and / or (1) is represented by “5′-NNNNNCND-3 ′”, “5′-NNNNCNDN-3 ′”, or “5 A PAM sequence '-NNNNNNNN-3' "can be recognized.
  • the modified Cas9 protein becomes “5′-NNNNNDND- 3 ′ ”,“ 5′-NNNNDNDN-3 ′ ”, or“ 5′-NNNNNNNN-3 ′ ”, or“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNGNDN-3 ′ ”, or“ 5 ′
  • a PAM sequence “-NNNNNN-3 ′” can be recognized.
  • the present invention provides a protein comprising at least one of the following substitutions (2) in the full-length amino acid sequence of a BlCas9 protein.
  • substitutions (2) in the full-length amino acid sequence of a BlCas9 protein.
  • substitution of His at amino acid number 72 to Lys or Arg substitution of Gln at position 93 to Lys, Arg, or His, substitution of Glu at position 95 to Lys, Arg, or His
  • Substitution of His at position 175 with Lys or Arg substitution of Thr at position 811 with Lys, Arg or His, substitution of Ser at position 775 with Lys, Arg or His, and position 1076 Replacement of Asp with Lys, Arg, or His
  • BlCas9 protein is thought to improve the activity of unwinding the double helix structure of the target DNA.
  • basic amino acids include Lys, Arg, and His.
  • at least one substitution selected from the following is preferred: H72K, Q93K, E95K, H175K, T811K, S1075K, and D1076K.
  • the present invention comprises a sequence comprising any one of the following amino acid sequences (j) to (l), and can form a complex with a target-specific guide RNA: To provide a protein.
  • an amino acid sequence comprising at least one of the following substitutions (1) and / or (2): (1) Lys, Arg, or Glu of amino acid position 52 Substitution to His, substitution of Ser at position 55 to Lys, Arg, or His, substitution of Ser at position 843 to Asn, Gln, or Tyr, substitution of Lys at position 997 to Arg or His, From substitution of Lys at position 1040 to Arg or His, substitution of Lys at position 959 to Ala, substitution of Lys at position 992 to Ala, and substitution of Glu at position 904 to Lys, Arg, or His At least one substitution selected, (2) substitution of His at amino acid number 72 to Lys or Arg, substitution of Gln at position 93 to Lys, Arg, or His, substitution
  • the BlCas9 protein of the present invention can contain any combination of all the mutations described above.
  • the present invention comprises a sequence comprising any one of the following amino acid sequences (m) to (o) and is capable of forming a complex with a target-specific guide RNA: Providing a featured protein.
  • BlCas9 protein of the present embodiment include, but are not limited to, proteins including the following substitution combinations, for example.
  • the BlCas9 protein of this embodiment preferably comprises the following combination of substitutions.
  • the amino acid sequence of mutant BlCas9 containing a combination of these substitutions is shown in SEQ ID NO: 15.
  • S55K / E904R / D1022N Cas9 protein containing this mutation combination can recognize the PAM sequence “5′-NNNNNDDD-3 ′”.
  • S55K / E904R / T1025A Cas9 protein containing this combination of mutations can recognize the PAM sequence “5′-NNNNNCNN-3 ′”.
  • S55K / E904R / D1022N / T1025A Cas9 protein containing this combination of mutations can recognize the PAM sequence “5′-NNNNDD-3 ′”.
  • the modified BlCas9 protein of the invention maintains endonuclease activity.
  • “endonuclease” means an enzyme that cleaves the interior of a nucleotide chain, that is, the non-terminal portion. Therefore, in the above-described embodiment, the modified BlCas9 protein of the present invention can cleave a target double-stranded polynucleotide.
  • the modified BlCas9 protein of the invention may be a variant that lacks the ability to cleave one or both strands of the target double-stranded polynucleotide. That is, in the above-described embodiment, the modified BlCas9 protein of the present invention does not cleave the target double-stranded polynucleotide or cleaves only one of the two strands.
  • Cas9 derived from Pyogenes substitution of Asp to Ala at amino acid number 10 in the RuvC I catalytic domain (D10A) causes Cas9 to become a nickase that cleaves a single strand from a nuclease that cleaves both strands. It is known to be converted.
  • Other examples of mutations that make Cas9 a nickase include, but are not limited to, SpCas9 E762A, H840A, N854A, N863A, and D986A.
  • the modified BlCas9 protein of this embodiment may contain one or more of the above mutations at corresponding positions in BlCas9.
  • the amino acid sequence of the protein has the following mutation: (3) Substitution of Asp at amino acid number 8 position to Ala, substitution of Glu at position 503 to Ala, substitution of His at 584 position to Ala, substitution of Asn at position 598 to Ala, Asn at position 607 It may include at least one substitution selected from substitution with Ala and substitution of Asp at position 725 with Ala.
  • modified BlCas9 protein substantially lacks DNA cleavage activity.
  • modified Cas9 DNA cleavage activity is “substantially lacking DNA cleavage activity” means that the DNA cleavage activity of the variant is about 25%, 10%, It indicates less than 5%, 1%, 0.1%, or 0.01%.
  • Cas9 protein lacking the ability to cleave one or both strands of the target double-stranded polynucleotide is highly accurate with individual bases, for example, as described below. This method is particularly advantageous for use in genome editing (single nucleotide editing) that modifies the expression of a gene or a method for regulating gene expression.
  • the modified BlCas9 protein of the present invention can be prepared, for example, by the following method. First, a host is transformed with a vector containing a nucleic acid encoding a modified BlCas9 protein. Subsequently, the transformed host is cultured to express the Cas protein. Conditions such as the composition of the medium, the culture temperature and time, and the addition of the inducer can be determined by those skilled in the art according to known methods so that the transformant grows and the target protein is efficiently produced. For example, when an antibiotic resistance gene is incorporated into an expression vector as a selection marker, a transformant can be selected by adding an antibiotic to the medium.
  • the modified Cas9 protein is obtained by purifying the Cas9 protein expressed by the host by an appropriate method.
  • the host is not particularly limited, and examples include animal cells, plant cells, insect cells, or microorganisms such as Escherichia coli, Bacillus subtilis, and yeast.
  • the present invention provides a gene encoding the protein according to any one of [1] to [9] above.
  • the present invention is a protein comprising a sequence comprising any one of the following base sequences (p) to (s) and capable of forming a complex with a target-specific guide RNA:
  • a gene characterized by encoding is provided.
  • P a base sequence represented by SEQ ID NO: 3 or 4
  • Q a base sequence in which 1 to several bases are deleted, inserted, substituted or added in the base sequence represented by SEQ ID NO: 3 or 4
  • R a base sequence having 80% or more identity with the base sequence represented by SEQ ID NO: 3 or 4
  • S a base sequence capable of hybridizing under stringent conditions with a DNA comprising a base sequence complementary to the DNA comprising the base sequence represented by SEQ ID NO: 3 or 4
  • SEQ ID NO: 3 is the base sequence of the gene encoding the protein consisting of the amino acid sequence of SEQ ID NO: 1.
  • SEQ ID NO: 4 is the base sequence of the gene encoding the protein consisting of the amino acid sequence of SEQ ID NO: 2.
  • the present invention comprises a sequence comprising any one of the following base sequences (t) to (w), and forms a complex with a target-specific guide RNA.
  • T the base sequence represented by SEQ ID NO: 14
  • U a base sequence in which 1 to several bases are deleted, inserted, substituted or added in the base sequence represented by SEQ ID NO: 14
  • V a base sequence having 80% or more identity with the base sequence represented by SEQ ID NO: 14
  • W a base sequence capable of hybridizing under stringent conditions with a DNA comprising a base sequence complementary to the DNA comprising the base sequence represented by SEQ ID NO: 14
  • SEQ ID NO: 14 is the base sequence of the gene encoding the protein consisting of the amino acid sequence of SEQ ID NO: 13.
  • the base sequence of the present embodiment is, for example, 1 to 700, 1 to 500, 1 to 300, 1 to 100, preferably 1 in the base sequence represented by SEQ ID NO: 3, 4, or 14. Deletion, insertion, substitution or addition of -50, 1-40, 1-30, more preferably 1-15, even more preferably 1-10, particularly preferably 1-5 bases including.
  • the base sequence is one, two, three, four, five, six, seven, eight, 9 in the base sequence represented by SEQ ID NO: 3, 4, or 14. Or deletions, insertions, substitutions or additions of 10 or 10 bases.
  • the base sequence of the present embodiment is preferably 85% or more, more preferably 90% or more, even more preferably 95% or more, such as 96% or more, with the base sequence represented by SEQ ID NO: 3, 4, or 14. 97% or more, or 98% or more, most preferably 99% or more.
  • the identity of the base sequence can be determined by a technique known in the art, as in the method for determining the identity of the amino acid sequence described above.
  • stringent conditions includes, for example, a method described in Molecular Cloning-A LABORATORY MANUAL THIRD EDITION (Sambrook et al., Cold Spring Harbor Press). For example, 5 ⁇ SSC (20 ⁇ SSC composition: 3M sodium chloride, 0.3M citric acid solution, pH 7.0), 0.1 wt% N-lauroyl sarcosine, 0.02 wt% SDS, 2 wt% The hybridization can be performed by incubating at 55 to 70 ° C. for several hours to overnight in a hybridization buffer composed of a blocking reagent for nucleic acid hybridization and 50% formamide.
  • the washing buffer used for washing after incubation is preferably a 0.1 ⁇ SSC solution containing 0.1 wt% SDS, more preferably a 0.1 ⁇ SSC solution containing 0.1 wt% SDS.
  • the gene of the present invention may be a gene consisting of a sequence including another base sequence in addition to any one of (p) to (w). In another embodiment, the gene of the present invention is a gene consisting of only one base sequence of (p) to (w).
  • a Cas9 protein having a wide recognition of the PAM sequence while maintaining the binding force to the target double-stranded polynucleotide is obtained. Obtainable.
  • the base sequence encoding Cas9 may be codon-optimized for expression in specific cells such as eukaryotic cells.
  • eukaryotic cells include, but are not limited to, specific organisms such as humans, mice, rats, rabbits, dogs, pigs, or non-human primates.
  • codon optimization is by replacing at least one codon of the native sequence with a codon that is used more frequently or most frequently in the gene of the introduced animal species while maintaining the native amino acid sequence.
  • codon optimization is by replacing at least one codon of the native sequence with a codon that is used more frequently or most frequently in the gene of the introduced animal species while maintaining the native amino acid sequence.
  • Codon bias (difference in codon usage between organisms) often correlates with the translation efficiency of mRNA, which is thought to depend inter alia on the properties of the codon being translated and the availability of a particular tRNA. Yes.
  • the predominance of selected tRNAs in cells is generally a reflection of the most frequently used codons in peptide synthesis.
  • genes can be individualized for optimal gene expression in a given organism based on codon optimization. Codon usage frequency tables are readily available in, for example, “Codon Usage Database” published at www.kazusa.or.jp/codon/ (visited on March 20, 2018). Can be used to optimize codons (see, for example, Nakamura, Y. et al.
  • Computer algorithms for codon optimizing specific sequences for expression in specific animal species are also available, for example, at Gene Forge (Aptagen; Jacobus, PA).
  • the one or more codons in the sequence encoding Cas9 correspond to the most frequently used codons for a particular amino acid.
  • composition containing modified Cas9 protein or gene thereof and guide RNA ⁇ Composition containing modified Cas9 protein or gene thereof and guide RNA>
  • the present invention provides the above-described modified BlCas9 protein or a gene encoding the protein,
  • a composition comprising a guide RNA comprising a polynucleotide comprising a base sequence complementary to a base sequence from 1 base upstream to 20 bases to 24 bases upstream of the PAM sequence in the target double-stranded polynucleotide.
  • target sequence-specific genome editing and gene expression regulation can be carried out easily and quickly in a target sequence selected from a wide range of sequences.
  • sequence of the “target sequence” means a nucleotide sequence having an arbitrary length, which is a deoxyribonucleotide or ribonucleotide, which is linear, circular, or branched. Single-stranded or double-stranded.
  • the “PAM sequence” means a sequence that is present in the target double-stranded polynucleotide and can be recognized by the Cas9 protein.
  • the length and base sequence of the PAM sequence vary depending on the bacterial species.
  • the sequences recognizable by the modified BlCas9 protein of the present embodiment include “5′-NNNNNCND-3 ′”, “5′-NNNNNCDN-3 ′”, “5′-NNNNCNNN-3 ′”, “5′- “NNNNNDD-3 ′”, “5′-NNNNNDND-3 ′”, “5′-NNNNDNDN-3 ′”, “5′-NNNNNNNN-3 ′”, “5′-NNNNNDND-3 ′”, “5′-” "NNNNGNDN-3 '", “5'-NNNNNN-3'", “5'-NNNNNNND-3 '", “5'-NNNNNNND-3'", “5'-NNNNNNDN-3 '", or "5' -NNNNN-3 '”.
  • polynucleotide refers to a deoxyribonucleotide or ribonucleotide polymer that is in a linear or circular conformation and is in either a single-stranded or double-stranded form, and the length of the polymer. Is not to be construed as limiting. Polynucleotides also include known analogs of natural nucleotides, as well as nucleotides that are modified in at least one of a base moiety, a sugar moiety and a phosphate moiety (eg, phosphorothioate backbone). In general, an analog of a particular nucleotide has the same base-pairing specificity as the original nucleotide, eg, an analog of A base-pairs with T.
  • the “guide RNA” is a mimic of the hairpin structure of tracrRNA-crRNA, preferably from 20 to 24 bases from one base upstream of the PAM sequence in the target double-stranded polynucleotide.
  • the 5 ′ terminal region comprises a polynucleotide comprising a base sequence complementary to a target base sequence of 21 bases to 23 bases, more preferably 21 bases or 22 bases, and most preferably 22 bases.
  • it comprises one or more polynucleotides comprising a base sequence that is non-complementary to the target double-stranded polynucleotide, arranged so as to be symmetrically complementary with one point as an axis, and can have a hairpin structure. You may go out.
  • the protein and the guide RNA can form a protein-RNA complex by mixing under mild conditions in vitro and in vivo. Mild conditions indicate conditions where the temperature and pH are such that the protein is not degraded or denatured, and the temperature is preferably 4 ° C. or higher and 40 ° C. or lower, and the pH is preferably 4 or higher and 10 or lower.
  • the composition may include an expression vector encoding a guide RNA.
  • the gene may be provided as a linear (linear) gene fragment, or may be provided in a state of being incorporated into a vector. Good.
  • the gene encoding Cas9 and the gene encoding guide RNA may be provided as the same vector, or a plurality of separate vectors May be provided as
  • the vector is not particularly limited, and conventionally known vectors such as plasmid vectors and virus vectors can be used.
  • viral vectors include, but are not limited to, retrovirus vectors, adenovirus vectors, adeno-associated (AAV) virus vectors, herpes virus vectors, Sindbis virus vectors, and the like.
  • composition of the present embodiment is preferably for pharmaceutical use, and more preferably contains a pharmaceutically acceptable carrier.
  • the pharmaceutical composition of the present embodiment is, for example, orally in the form of tablets, coated tablets, pills, powders, granules, capsules, solutions, suspensions, emulsions, or injections, suppositories. In addition, it can be administered parenterally in the form of an external preparation for skin.
  • binders such as gelatin, corn starch, gum tragacanth and gum arabic; excipients such as starch and crystalline cellulose; swelling agents such as alginic acid; solvents for injections such as water, ethanol and glycerin; Examples thereof include adhesives such as rubber adhesives and silicone adhesives.
  • a pharmaceutically acceptable carrier can be used alone or in combination of two or more.
  • composition of the present embodiment may further contain an additive.
  • Additives include lubricants such as calcium stearate and magnesium stearate; sweeteners such as sucrose, lactose, saccharin and maltitol; flavoring agents such as peppermint and red mono oil; stabilizers such as benzyl alcohol and phenol; phosphoric acid Buffers such as salts and sodium acetate; Solubilizing agents such as benzyl benzoate and benzyl alcohol; Antioxidants; Preservatives and the like.
  • An additive can be used individually by 1 type or in mixture of 2 or more types.
  • composition of the present embodiment is used for treating and / or preventing one or more diseases or symptoms.
  • the disease or symptom is a symptom caused by a genetic disease or genetic abnormality.
  • the present invention is a method for site-specific cleavage of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the Cas protein of the present invention and a guide RNA, Providing a method wherein the protein cleaves the target double-stranded polynucleotide at a cleavage site located upstream of the PAM sequence in the target double-stranded polynucleotide to create a blunt end .
  • site-specific target double-stranded polynucleotide can be cleaved easily and rapidly in a target sequence selected from a wide range of sequences.
  • the BlCas9 protein of this embodiment is brought into contact with a guide RNA.
  • the step of contacting may be performed, for example, by mixing and incubating the Cas9 protein and the guide RNA under mild conditions.
  • the mild conditions are as described above.
  • the incubation time is preferably 0.5 hours or more and 1 hour or less.
  • the complex of the Cas9 protein and the guide RNA is stable and can maintain stability even after being left at room temperature for several hours.
  • the Cas9 protein and guide RNA used in this embodiment are as described above.
  • the target double-stranded polynucleotide is described in the 5 ′ ⁇ 3 ′ direction, NNNNCNNND, NNNNCNDN, NNNNNNNN, NNNNNNDN, NNNNNNN, NNNNDN, NNNNNN, NNNNN , NNNNNDN, and a sequence comprising a PAM sequence selected from the group consisting of NNNNNN, wherein N is any one base selected from the group consisting of adenine, cytosine, thymine, and guanine, and D is , Any one base selected from the group consisting of adenine, thymine, and guanine.
  • the proteins include "5'-NNNNNCND-3 '", “5'-NNNNNCDN-3'", “5'-NNNNNN-3 '", “5'-NNNNNDND-3'", “5'-NNNNNDND-” 3 ′ ”,“ 5′-NNNNDNDN-3 ′ ”,“ 5′-NNNNNNNN-3 ′ ”,“ 5′-NNNNGNDD-3 ′ ”,“ 5′-NNNNGNND-3 ′ ”,“ 5′-NNNNGNDN- ” 3 ′ ”,“ 5′-NNNNNNNN-3 ′ ”,“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNNNND-3 ′ ”,“ 5′-NNNNNNDN-3 ′ ”,“ 5′-NNNNNNDN-3 ′ ”, and“ 5′-NNNNNNNN ” -3 ′ ”to recognize
  • the Cas9 protein recognizes a PAM sequence, the double helix structure of the target double-stranded polynucleotide is peeled off starting from the PAM sequence, and the target double-stranded polynucleotide in the guide RNA By annealing with a complementary base sequence, the double helix structure of the target double-stranded polynucleotide is partially loosened. At this time, the Cas9 protein cleaves the phosphodiester bond of the target double-stranded polynucleotide at a cleavage site located upstream of the PAM sequence to create a blunt end.
  • the cleavage site is, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 bases upstream of the PAM sequence in the target double-stranded polynucleotide.
  • the cleavage site is 3 bases upstream of the PAM sequence in the target double stranded polynucleotide.
  • the method of this embodiment can be performed in any environment in vivo or in vitro. In one embodiment, the method of this embodiment is performed ex vivo, ie ex vivo or in vitro.
  • the present invention is a method for site-specific modification of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the Cas protein of the present invention and a guide RNA, The protein cleaves the target double-stranded polynucleotide at a cleavage site located upstream of the PAM sequence in the target double-stranded polynucleotide to create a blunt end; A method is provided, wherein the target double-stranded polynucleotide is modified in a region determined by complementary binding of the guide RNA and the target double-stranded polynucleotide.
  • site-specific target double-stranded polynucleotide modification can be carried out simply and rapidly in a target sequence selected from a wide range of sequences.
  • the step of bringing the target double-stranded polynucleotide, Cas protein, and guide RNA into contact can be carried out in the same manner as in the above ⁇ Method for cleaving target double-stranded polynucleotide site-specifically>.
  • the target double-stranded polynucleotide, Cas9 protein, and guide RNA used in the present embodiment are as described above.
  • the process until the target double-stranded polynucleotide is cleaved in a site-specific manner is as described above. Subsequently, in the region determined by the complementary binding of the guide RNA and the double-stranded polynucleotide, a target double-stranded polynucleotide that has been modified according to the purpose can be obtained.
  • modification means that the base sequence of the target double-stranded polynucleotide is changed.
  • cleavage of the target double-stranded polynucleotide change of the base sequence of the target double-stranded polynucleotide by insertion of exogenous sequence after cleavage (insertion by physical insertion or replication through homologous directed repair), non-breaking after cleavage
  • non-breaking after cleavage examples thereof include a change in the base sequence of the target double-stranded polynucleotide by homologous end ligation (NHEJ: DNA ends produced by cleavage are recombined).
  • the method of this embodiment can be performed in any environment in vivo or in vitro. In one embodiment, the method of this embodiment is performed ex vivo, ie ex vivo or in vitro.
  • the present invention is a method for site-specific modification of a target double-stranded polynucleotide comprising: Contacting the target double-stranded polynucleotide with the Cas protein of the present invention and a guide RNA, The protein specifically binds to the target double-stranded polynucleotide via the guide RNA, wherein the protein does not cleave the target double-stranded polynucleotide or cleaves only one strand.
  • a method is provided, wherein the target double-stranded polynucleotide is modified in a region determined by complementary binding of the guide RNA and the target double-stranded polynucleotide.
  • site-specific and single-base unit accurate target double-stranded polynucleotide modification can be performed easily and rapidly.
  • the BlCas9 protein of the present invention in which the target sequence is widespread, guide RNA can be freely designed, so that the base to be edited can be freely selected. Therefore, the modified BlCas9 protein of the present invention is particularly advantageous for use in the method of the present embodiment.
  • the step of bringing the target double-stranded polynucleotide, Cas protein, guide RNA, and effector molecule into contact can be performed in the same manner as in the above ⁇ Method for cleaving target double-stranded polynucleotide site-specifically>. it can.
  • the target double-stranded polynucleotide and guide RNA used in this embodiment are as described above.
  • the Cas9 protein used in the present embodiment is a variant lacking the ability to cleave one or both strands of the target double-stranded polynucleotide described in the above ⁇ DNA cleavage activity of Cas9 protein>.
  • the Cas9 protein and the guide RNA form a complex and bind to the target double-stranded polynucleotide.
  • the Cas9 protein modifies the base sequence in the target polynucleotide without cleaving the target double-stranded polynucleotide or cleaving only one strand, that is, without causing double-strand breakage.
  • “Modification” is as defined above.
  • the modification is preferably performed in single base units, for example, changing CG base pairs to TA base pairs or vice versa.
  • the specific and accurate modification (single base editing) of the single base unit is preferably performed using deaminase (deaminase).
  • deaminase for example, cytidine deaminase or adenosine deaminase can be used.
  • the deaminase may be operably linked to the Cas9 protein.
  • operably connected means that the connected components are connected so that they can perform their normal functions.
  • the method of this embodiment can be performed in any environment in vivo or in vitro. In one embodiment, the method of this embodiment is performed ex vivo, ie ex vivo or in vitro.
  • the present invention is a method for modulating gene expression comprising: Contacting the target double-stranded polynucleotide associated with the gene, the Cas protein of the present invention, a guide RNA, and an effector molecule, The Cas protein specifically binds to the target double-stranded polynucleotide via the guide RNA, whereby the effector molecule specifically acts on the target double-stranded polynucleotide, thereby expressing the gene.
  • a method is provided, characterized by adjusting.
  • the present embodiment it is possible to easily and rapidly regulate gene expression using target double-stranded polynucleotide recognition by the CRISPR / Cas9 system in a target sequence selected from a wide range of sequences.
  • the BlCas9 protein of the present invention in which the target sequence is widespread, guide RNA can be freely designed, so that it can be used in a region (hot spot) where gene expression can be most effectively regulated. Effector molecules can be delivered accurately. Therefore, the modified BlCas9 protein of the present invention is particularly advantageous for use in the method of the present embodiment.
  • expression means a process in which a polynucleotide is transcribed into mRNA and / or a process in which transcribed mRNA is translated into a peptide, polypeptide, or protein. If the polynucleotide is a polynucleotide derived from genomic DNA, expression can include splicing of mRNA in eukaryotic cells.
  • gene expression means conversion of information contained in a gene into a gene product.
  • a gene product is a direct transcription product of a gene (eg, mRNA, tRNA, rRNA, antisense RNA, ribozyme, shRNA, microRNA, structural RNA or any other type of RNA) or protein produced by translation of mRNA It can be.
  • Gene products include RNA modified by processes such as capping, polyadenylation, methylation and editing, and modified by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristylation and glycosylation Also included are proteins made.
  • regulation of gene expression means a change in gene activity.
  • the regulation of expression is, for example, gene activation and repression, more specifically, transcription activation or repression, but is not limited thereto.
  • the step of bringing the target double-stranded polynucleotide, Cas protein, guide RNA, and effector molecule into contact can be performed in the same manner as in the above ⁇ Method for cleaving target double-stranded polynucleotide site-specifically>. it can.
  • the target double-stranded polynucleotide and guide RNA used in this embodiment are as described above.
  • the Cas9 protein used in the present embodiment is a modification that lacks the ability to cleave one or both of the target double-stranded polynucleotide, preferably both strands, as described in ⁇ DNA cleavage activity of Cas9 protein> above. Is the body.
  • effector molecule means a molecule such as a protein or a protein domain capable of exerting a localized effect in a cell. Effector molecules can take a variety of different forms, including those that selectively bind to proteins or DNA, eg, to modulate biological activity. Effects of effector molecules include, but are not limited to, nuclease activity, increased or decreased enzyme activity, increased or decreased gene expression, affecting cell signaling, and the like.
  • transcriptional activators or domains such as VP64 or NF- ⁇ B p65, KRAP, ERF repressor domain (ERD), mSin3A interaction domain (SID)
  • chromatin remodeling factors such as DNA methyltransferase, DNA demethylase, histone acetyltransferase, histone deacetylase and the like.
  • the effector molecule is guided to the target double-stranded polynucleotide by specifically binding the complex of the Cas protein and the guide RNA to the target double-stranded polynucleotide.
  • the effector molecule is operably linked to the Cas9 protein, optionally via a linker.
  • the effector molecule regulates the expression of a gene related to the target double-stranded polynucleotide by specifically acting on the target double-stranded polynucleotide.
  • a polynucleotide having the base sequence of the gene whose expression is to be regulated may be selected, or, for example, the expression of the gene whose expression is to be regulated is directly or indirectly selected.
  • a polynucleotide having a base sequence of an upstream gene that is positively or negatively controlled can be selected.
  • the method of this embodiment can be performed in any environment in vivo or in vitro. In one embodiment, the method of this embodiment is performed ex vivo, ie ex vivo or in vitro.
  • the present invention provides a method for performing genome editing using the proteins or compositions described above.
  • the present invention can be performed efficiently and inexpensively and is adaptable to any cell or organism. Any segment of a double stranded nucleic acid of a cell or organism can be modified by the methods of the present invention. This method utilizes both homologous and non-homologous recombination processes that are endogenous to all cells.
  • the present invention provides a gene therapy method comprising administering to a subject a composition comprising a modified BlCas9 protein or a gene encoding the protein and a guide RNA.
  • a composition comprising a modified BlCas9 protein or a gene encoding the protein and a guide RNA.
  • the protein, gene, and / or composition of the above-described embodiment can be used.
  • the administration method of the pharmaceutical composition in the present embodiment is not particularly limited, and may be appropriately determined according to the patient's symptoms, weight, age, sex, and the like.
  • tablets, coated tablets, pills, powders, granules, capsules, solutions, suspensions, emulsions and the like are administered orally.
  • injectables are administered alone or mixed with normal fluids such as glucose and amino acids, and administered intravenously, and further administered intraarterially, intramuscularly, intradermally, subcutaneously or intraperitoneally as necessary.
  • the dosage of the pharmaceutical composition in the present embodiment varies depending on the patient's symptoms, body weight, age, sex, etc., and cannot be determined unconditionally, but in the case of oral administration, for example, 1 ⁇ g to 10 g, for example, 1 day 0.01 to 2000 mg of active ingredient may be administered per unit. In the case of injections, for example, 0.1 ⁇ g to 1 g per day, for example 0.001 to 200 mg per day, may be administered.
  • gene editing refers to a specific gene recombination or targeted mutation performed by a technique such as CRISPR / Cas9 system or Transcribing Activator-Like Effector Nucleases (TALEN). It is a new gene modification technology that performs gene disruption and knock-in of reporter genes.
  • the mutation is caused by partial or complete deletion, substitution, insertion of an arbitrary sequence, or the like in the target genomic DNA or the expression regulatory region of the target genomic DNA.
  • the present invention also provides a method of performing targeted DNA insertion or targeted DNA deletion.
  • This method involves transforming a cell with a nucleic acid construct comprising donor DNA.
  • a scheme relating to DNA insertion and DNA deletion after target gene cleavage can be determined by those skilled in the art according to known methods.
  • the present invention is utilized in both somatic and germ cells and provides genetic manipulation at specific loci.
  • the present invention also provides a method for disrupting a gene in somatic cells.
  • the gene overexpresses a product harmful to the cell or organism and expresses a product harmful to the cell or organism.
  • Such genes can be overexpressed in one or more cell types that occur in the disease. Disruption of the overexpressed gene according to the method of the present invention may lead to better health for an individual suffering from a disease caused by the overexpressed gene. That is, the disruption of only a small percentage of the cells in the cells can work, reducing the expression level and producing a therapeutic effect.
  • the present invention also provides a method for disrupting a gene in a germ cell.
  • Cells in which a particular gene has been disrupted can be selected to create an organism that does not have the function of the particular gene.
  • the gene can be completely knocked out. This loss of function in a particular cell can have a therapeutic effect.
  • the present invention further provides insertion of donor DNA encoding the gene product.
  • This gene product has a therapeutic effect when constitutively expressed.
  • a population of pancreatic cells there is a method of inserting the donor DNA into an individual suffering from diabetes in order to cause insertion of a donor DNA encoding an active promoter and an insulin gene.
  • the population of pancreatic cells containing exogenous DNA can then produce insulin and treat diabetic patients.
  • the donor DNA can be inserted into crops and cause the production of pharmacologically related gene products.
  • Protein product genes eg, insulin, lipase, or hemoglobin
  • regulatory elements consisttitutively active promoters or inducible promoters
  • Transgenic plants or animals use nucleic acid transfer techniques (McCreath, KJ et al. (2000) Nature 405: 1066-1069; Polejaeva, IA et al. (2000) Nature 407: 86-90). Can be made by a method. Tissue type specific cells or cell type specific vectors can be utilized to provide gene expression only in selected cells.
  • the above method can be used in germ cells to select cells where insertion occurs in a planned manner and all subsequent cell divisions produce cells with the designed genetic alterations.
  • the methods of the present invention include either cultured cells, cultured tissues or cultured nuclei (including cells, tissues or nuclei that can be used to regenerate intact organisms), including all prokaryotes and eukaryotes. ) Or in gametes (eg, eggs or sperm at various stages of their development).
  • the method of the invention can be applied to any organism (insects, fungi, rodents, cattle, sheep, goats, chickens, and other agriculturally important animals, as well as other mammals (including dogs, cats and humans). , But not limited to) can be applied to cells derived from).
  • compositions and methods of the present invention can be used in plants.
  • the compositions and methods can be used in any of a variety of plant species, such as monocotyledonous or dicotyledonous plants.
  • Example 1 Broadening of recognition of the fifth base of a PAM sequence
  • Preparation of wild-type and mutant BlCas9 (1) Design of construct Wild-type BlCas9 and a modified BlCas9 having a D1022N mutation that changes the recognition of the fifth base in the PAM sequence from C to D (A, G, T)
  • Each of the B1cas9 genes encoded (base sequence of wild-type B1cas9: SEQ ID NO: 7, base sequence of D1022N mutant B1cas9: SEQ ID NO: 8) was respectively incorporated into pE-SUMO vector (LifeSensors). Furthermore, a TEV recognition sequence was added between the SUMO tag and the Blcas9 gene.
  • the N-terminal of Cas9 expressed from the completed construct is designed such that 6-residue histidine is continuous (His tag), followed by addition of SUMO tag and TEV protease recognition site.
  • the target protein was eluted with 5 column volumes of high imidazole concentration buffer C.
  • the eluted protein was charged into HiTrap SP HP (GE Healthcare) equilibrated with 85% buffer D (0M NaCl) and 15% buffer E (2M NaCl).
  • the buffer E is changed from 15% to 100% (NaCl concentration from 300 mM)
  • the protein of interest was eluted with a linear gradient (to 2M). TEV protease was added to the eluted sample and dialyzed overnight at 20 ° C. against buffer F to remove the tag.
  • the mixture was again mixed with Ni-NTA Superflow resin equilibrated with buffer F, and the flow-through fraction was collected. Subsequently, the column was washed with 3 column volumes of buffer C, and the washing solution was recovered.
  • the eluted protein was passed through Hiload 16/600 Superdex 200 (GE Healthcare) equilibrated with buffer G, and the target protein was eluted with buffer G for one column volume.
  • Table 1 shows the composition of buffers A to G.
  • 2-ME 2-mercaptoethanol
  • DTT dithiothreitol
  • RNA Template DNA into which the target guide RNA sequence (SEQ ID NO: 9) was inserted was prepared.
  • a primer having a T7 promoter sequence added upstream of the guide RNA sequence was prepared, and the primers were annealed using PCR to generate an extension reaction to prepare a template DNA for in vitro transcription reaction.
  • an in vitro transcription reaction with T7 RNA polymerase was performed at 37 ° C. for 4 hours. 1/10 volume of 3M in the reaction solution containing the transcript Sodium acetate and 2.5 volumes of 100% ethanol were added, and the mixture was centrifuged at 4 ° C. (8,000 g, 3 minutes) to precipitate the transcription product.
  • Plasmid DNA cleavage activity measurement test For use in a DNA cleavage activity measurement test, a vector into which a target DNA sequence and a PAM sequence were inserted was prepared. PAM sequences 1 to 4 were added to the target DNA sequence and incorporated into a linearized pUC119 vector. The target DNA sequences and PAM sequences 1-4 are shown in Table 2.
  • E. coli Mach1 strain (Life Technologies) was transformed and cultured at 37 ° C. in LB medium containing 20 ⁇ g / mL ampicillin.
  • the cells were collected by centrifugation (8,000 g, 1 minute), and the plasmid DNA was purified using QIAprep Spin Miniprep Kit (QIAGEN).
  • the sample after the reaction was subjected to electrophoresis using a MultiNA capillary electrophoresis apparatus (SHIMADZU) to confirm the band of the cleavage product.
  • the cleavage activity is expressed as a percentage of the concentration of the cleaved DNA fragment relative to the sum of the concentration of the cleaved DNA fragment (about 2,000 bp) and the concentration of uncut linearized DNA (about 3,000 bp).
  • FIG. 5 shows an electrophoresis photograph in which the DNA cleavage activity containing other PAM sequences was confirmed.
  • wild-type BlCas9 cleaved the target DNA containing PAM sequence 1 in which the fifth was C, but the target DNA containing other PAM sequences was not cleaved even after 10 minutes of incubation.
  • D1022N mutant BlCas9 did not cleave target DNA containing PAM sequence 1, but cleaved target DNA containing all other PAM sequences in a short period of 5 minutes incubation.
  • Example 2 Modification of recognition of 5th base of PAM sequence Preparation of Mutant BlCas9
  • modified BlCas9 having a D1022N / K1040E mutation that modifies the recognition of the fifth base in the PAM sequence from C to G was prepared.
  • Plasmid DNA cleavage activity measurement test The same guide RNA, PAM sequence and target DNA as in Example 1 were used. The reaction solution was the same as in Example 1 except that the Cas9 protein concentration was 0.05 pmol (50 nM) (Table 3), and the reaction time was 10 minutes or 20 minutes. The results are shown in FIG.
  • the D1022N / K1040E mutant BlCas9 specifically cleaves only the target DNA containing the PAM sequence 4 whose 5th is G, while the target DNA containing the other PAM sequences is reacted for 20 minutes. It was not cut later.
  • Example 3 Relationship between guide RNA length and cleavage activity
  • Three types of guide RNAs having the same sequence and structure were prepared except that the length of the portion complementary to the target base sequence was different. Specifically, from 1 base upstream to 20 bases of the PAM sequence in the target DNA sequence (guide RNA (20 bp): SEQ ID NO: 9), from 1 base upstream to 22 bases (guide RNA (22 bp): SEQ ID NO: 11) And a polynucleotide having a base sequence complementary to the base sequence of 1 base upstream to 24 bases (guide RNA (24 bp): SEQ ID NO: 12) in the 5 ′ end region.
  • Plasmid DNA cleavage activity measurement test The same wild-type BlCas9, PAM sequence 1, and target DNA as in Example 1 were used. The reaction solution was the same as in Example 1 (Table 3), and the reaction time was 2 minutes or 5 minutes. The results are shown in FIG.
  • Example 4 Mutations that improve DNA recognition Preparation of Mutant BlCas9 Various modified BlCas9 having the following mutations were prepared in the same manner as in Example 1. ⁇ E52R ⁇ E52K ⁇ S55K ⁇ S844N ⁇ K997R ⁇ E52R and S843N ⁇ E52R and K997R ⁇ E52R and K1040R ⁇ E52K and S844N ⁇ E52K and K997R ⁇ E52K and K1040R ⁇ S55K and K997R ⁇ S55K and K1040R ⁇ S55K, E52R, and K997R ⁇ S55K, E52K, and K997R ⁇ E52R, S843N, and K997R E52K, S843N, and K997R E52K, S843N, and K997R E52K, S843N, and K997R E52K, S843N, and K997R E
  • FIG. 9 shows a single mutant (having a mutation at only one position), and FIG. 10 shows a double mutant (having a mutation at two positions).
  • FIG. 10 also shows the results after 30 seconds and 1 minute. .
  • Example 5 Relaxing palatability of the eighth recognition of the PAM sequence
  • the E52R / S843N mutant BlCas9 used in Example 4 was further tested for the preference of the eighth base of the PAM sequence.
  • Plasmid DNA cleavage activity measurement test The same target DNA and guide RNA as in Example 1 were used. In the same manner as in Example 1, a vector into which the target DNA sequence and the PAM sequence were inserted was prepared. The PAM sequence used is shown below.
  • the reaction solution was the same as in Example 1 (Table 3), and the reaction time was 2 minutes, 5 minutes, or 30 minutes. The results are shown in FIG.
  • the E52R / S843N mutant BlCas9 showed a cleavage activity of 40% or more after 30 minutes at the latest for all tested PAM sequences. From this result, in the wild-type BlCas9, the 8th base of the recognizable PAM sequence is “D”, whereas in the E52R / S843N mutant BlCas9, the 8th base of the PAM sequence is “N”, that is, A , T, C, and G are understood to be able to recognize the target DNA.
  • Example 6 Relaxing palatability of recognition of the seventh and eighth bases of the PAM sequence Preparation of Mutant BlCas9
  • the following preference for recognizing the 7th and 8th bases in the PAM sequence is eased.
  • Various modified BlCas9 having mutations were prepared. ⁇ K959A ⁇ K992A ⁇ K959A and K992A ⁇ T1025A
  • Example 2 Plasmid DNA cleavage activity measurement test The same target DNA and guide RNA as in Example 1 were used. In the same manner as in Example 1, a vector into which the target DNA sequence and the PAM sequence were inserted was prepared. The PAM sequence used is shown below.
  • the reaction solution was the same as in Example 1 (Table 3), and the reaction time was 5 minutes, 15 minutes, or 30 minutes. The results are shown in FIG. Moreover, what was quantified about T1025A mutation is shown in FIG.
  • the seventh and eighth bases are “AA”, “CA”, or “AC” at the latest 30 minutes after the start of the reaction. Two bands were observed indicating that at least a portion of the target DNA having the PAM sequence was cleaved.
  • T1025A mutant BlCas9 has particularly high cleavage activity, and as can be seen from FIG. 13, the cleavage activity was 90% or more at a reaction time of 5 minutes and almost 100% at a reaction time of 15 minutes.
  • the bases of the 7th and 8th bases of the recognizable PAM sequence are “DD”, whereas the mutant BlCas9 tested in this example is the “AA” recognized by the wild-type BlCas9.
  • PAM sequences “CA” and “AC” that wild-type BlCas9 cannot recognize could also be recognized. Therefore, it is understood that all of the mutants tested in this example, particularly the T1025A mutant BlCas9, have a relaxed preference for recognition of the seventh and eighth bases of the PAM sequence.
  • Example 7 Mutations that improve guide RNA recognition Preparation of Mutant BlCas9
  • Various modified BlCas9 having the following mutations were prepared by the same method as in Example 1, respectively: H72K, Q93K, E95K, H175K, T811K, S1075K, and D1076K.
  • Plasmid DNA cleavage activity measurement test The same guide RNA, PAM sequence 1, and target DNA as in Example 1 were used.
  • the concentration of Cas9 was 0.05 pmol (50 nM), and other than that, the same composition as in Example 1 (Table 3) was used, and the reaction time was 1 minute, 2 minutes, Or 10 minutes.
  • the concentration of Cas9 was 0.02 pmol (20 nM), and the reaction time was 2 minutes, 5 minutes, or 15 minutes. It was. The results are shown in FIGS.
  • Example 8 Broadening of recognition of 5th, 7th and / or 8th base of PAM sequence Preparation of Mutant BlCas9 Various modified BlCas9s having the following mutation combinations were prepared by the same method as in Example 1. ⁇ S55K / E904R / D1022N (KRN mutation) ⁇ S55K / E904R / T1025A (KRA mutation) S55K / E904R / D1022N / T1025A (KRNA mutation)
  • Plasmid DNA cleavage activity measurement test for recognition of the fifth base of the PAM sequence Plasmid using wild-type BlCas9, the D1022N mutant BlCas9 prepared in Example 1, and each of the above-mentioned KRN mutant and KRNA mutant mutant BlCas9 A DNA cleavage activity test was performed to evaluate the recognition of the fifth base of the PAM sequence.
  • Example 2 The same guide RNA, PAM sequences 1 to 4 and target DNA as in Example 1 were used.
  • the reaction solution was the same as in Example 1 (Table 3), and the reaction time was 0.5 minutes (30 seconds) or 2 minutes.
  • the results are shown in FIGS. 16A-D. Bars represent standard error (SE).
  • Wild-type BlCas9 specifically cleaved the target DNA containing the PAM sequence in which the fifth base is C (FIG. 16A), while mutant BlCas9 introduced with the D1022N mutation has a fifth base of A
  • the target DNA containing the PAM sequence that is, T, or G is specifically cleaved (FIG. 16B), and this mutation causes recognition of the fifth base of the PAM sequence from “C” to “D” (A, T, or G) was shown to have been modified.
  • the recognition activity of the PAM sequence was generally improved as compared with the mutant BlCas9 into which only the D1022N mutation was introduced. (FIG. 16C). Furthermore, in the mutant BlCas9 introduced with the KRNA mutation, all target DNAs can be cleaved with high activity regardless of the type of the fifth base of the PAM sequence (FIG. 16D). It was shown that the recognition of the PAM sequence was changed from “C” to “N” (C, A, T, and G).
  • Plasmid DNA cleavage activity measurement test for recognition of 7th and 8th bases of PAM sequence Using wild-type BlCas9, T1025A mutant BlCas9 prepared in Example 3, and each of the above KRA mutation and KRNA mutation mutant BlCas9 Then, a plasmid DNA cleavage activity test was performed, and recognition of the seventh and eighth bases of the PAM sequence was evaluated.
  • Example 2 The same target DNA and guide RNA as in Example 1 were used. In the same manner as in Example 1, a vector into which the target DNA sequence and the PAM sequence were inserted was prepared. The PAM sequence used is shown below.
  • the reaction solution was the same as in Example 1 (Table 3), and the reaction time was 0.5 minutes (30 seconds) or 2 minutes. The results are shown in FIGS. 17A-D. Bars represent standard error (SE).
  • Wild-type BlCas9 could hardly cleave the target DNA containing the PAM sequence whose 7th or 8th base was “C” (FIG. 17A).
  • the mutant BlCas9 introduced with the T1025A mutation and the mutant BlCas9 introduced with the KRNA mutation the recognition activity of the PAM sequence was improved (FIGS. 17B and 17D), and the T1025A mutation was detected at the seventh and eighth bases of the PAM sequence. It has been shown to ease awareness.
  • the mutant BlCas9 introduced with the KRA mutation the target DNA containing the 7th and 8th PAM bases of all combinations can be cleaved (FIG. 17C).
  • the 8th base preference was shown to be broadened from “D” (A, T, and G) to “N” (A, T, C, and G).
  • mutant BlCas9 Genome editing using mutant BlCas9 in mammalian cells
  • the DNA cleavage activity of mutant BlCas9 was confirmed by an in vitro test using plasmid DNA.
  • mutant BlCas9 can actually edit the chromosomal genome in mammalian cells (ie in vivo).
  • a human codon-optimized wild-type BlCas9 or D1022N mutant BlCas9-encoding gene and a guide RNA-encoding gene are incorporated into a vector, and a plasmid for expressing the BlCas9 protein and guide RNA in mammalian cells is prepared.
  • a plasmid for expressing the BlCas9 protein and guide RNA in mammalian cells is prepared.
  • the same guide RNA as that used in Example 1 was used.
  • the prepared plasmid was transfected into mammalian cells. 72 hours after transfection, genomic DNA was extracted from the cells, and single-base substitutions and indels (insertions or deletions) introduced into the genome were detected using a next-generation sequencer.
  • the same experiment was conducted using SpCas9 as a control. The results are shown in FIG.
  • wild-type BlCas9 can perform both single-base substitution and insertion or deletion types of genome editing on target sequences containing the PAM sequence TTGGCAA in mammalian cells. It was.
  • the D1022N mutant BlCas9 specifically recognizes a PAM sequence in which the fifth base of the PAM sequence is “G”. Like the wild-type BlCas9, both types of single base substitution and insertion or deletion are recognized. We were able to perform genome editing. From the results of this Example, the BlCas9 protein of the present invention functions also in mammalian cells, and the modification of recognition of the PAM sequence by introduction of mutations into the BlCas9 protein is maintained also in mammalian cells. It has been shown.
  • a Cas9 protein in which recognition of a PAM sequence is widespread while maintaining a binding force to a target double-stranded polynucleotide.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

以下のいずれか一つを含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質:配列番号1で表されるアミノ酸配列;配列番号1で表されるアミノ酸配列の100位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されているか、又は配列番号1と80%以上の同一性を有するアミノ酸配列;配列番号2で表されるアミノ酸配列;配列番号2で表されるアミノ酸配列の1022位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されているか、又は配列番号2と80%以上の同一性を有するアミノ酸配列。

Description

エンジニアリングされたBlCas9ヌクレアーゼ
 本発明は、好ましくは単純なPAM認識を有する、エンジニアリングされたBlCas9ヌクレアーゼ、該ヌクレアーゼをコードする遺伝子、及びそれらの使用に関する。
 クラスター化した規則的な配置の短い回文反復配列(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)は、Cas(CRISPR-associated)遺伝子と共に、細菌及び古細菌において侵入外来核酸に対する獲得耐性を提供する適応免疫系を構成することが知られている。CRISPRは、ファージ又はプラスミドDNAに起因することが多く、大きさの類似するスペーサーと呼ばれる独特の可変DNA配列が間に入った、24~48bpの短い保存された反復配列からなる。また、リピート及びスペーサー配列の近傍には、Casタンパク質ファミリーをコードする遺伝子群が存在する。
 CRISPR-Casシステムにおいて、外来性のDNAは、Casタンパク質ファミリーによって30bp程度の断片に切断され、CRISPRに挿入される。Casタンパク質ファミリーの一つであるCas1及びCas2タンパク質は、外来性DNAのproto-spacer adjacent motif(PAM)と呼ばれる塩基配列を認識して、その上流を切り取って、宿主のCRISPR配列に挿入し、これが細菌の免疫記憶となる。免疫記憶を含むCRISPR配列が転写されて生成したRNA(pre-crRNAと呼ぶ。)は、一部相補的なRNA(trans-activating crRNA:tracrRNA)と対合し、Casタンパク質ファミリーの一つであるCas9タンパク質に取り込まれる。Cas9に取り込まれたpre-crRNA及びtracrRNAはRNAaseIIIにより切断され、外来配列(ガイド配列)を含む小さなRNA断片(CRISPR-RNAs:crRNAs)となり、Cas9-crRNA-tracrRNA複合体が形成される。Cas9-crRNA-tracrRNA複合体はcrRNAと相補的な外来侵入性DNAに結合し、DNAを切断する酵素(ヌクレアーゼ)であるCas9タンパク質が、外来侵入性DNAを切断することよって、外から侵入したDNAの機能を抑制及び排除する。
 Cas9タンパク質は外来侵入性DNA中のPAM配列を認識して、その上流で二本鎖DNAを平滑末端になるように切断する。PAM配列の長さや塩基配列は細菌種によってさまざまであり、Streptococcus pyogenes(S.pyogenes)では「NGG」の3塩基を認識する。Streptococcus thermophilus(S.thermophilus)は2つのCas9を持っており、それぞれ「NGGNG」又は「NNAGAA」の5~6塩基をPAM配列として認識する。(Nは任意の塩基を表す)。PAM配列の上流の何bpのところを切断するかも細菌種によって異なるが、S.pyogenesを含め大部分のCas9オルソログはPAM配列の3塩基上流を切断する。
 近年、細菌でのCRISPR-Casシステムを、ゲノム編集に応用する技術が盛んに開発されている。crRNAとtracrRNAを融合させて、tracrRNA-crRNAキメラ(以下、ガイドRNA(guide RNA:gRNA)と呼ぶ。)として発現させ、活用している。これによりヌクレアーゼ(RNA-guided nuclease:RGN)を呼び込み、目的の部位でゲノムDNAを切断する。
 CRISPR-Casシステムには、typeI、II、IIIがあるが、ゲノム編集で用いるのはもっぱらtypeII CRISPR-Casシステムであり、typeIIではRGNとしてCas9タンパク質が用いられている。S.pyogenes由来のCas9タンパク質はNGGという3つの塩基をPAM配列として認識するため、グアニンが2つ並んだ配列がありさえすればその上流を切断できる。
 CRISPR-Casシステムを用いた方法は、目的のDNA配列と相同な短いgRNAを合成するだけでよく、単一のタンパク質であるCas9タンパク質を用いてゲノム編集ができる。そのため、従来用いられていたジンクフィンガーヌクレアーゼ(ZFN)やトランス活性化因子様作動体(TALEN)のようにDNA配列ごとに異なる大きなタンパク質を合成する必要がなく、簡便かつ迅速にゲノム編集を行うことができる。
 特許文献1には、S.pyogenes由来のCRISPR-Casシステムを活用したゲノム編集技術が開示されている。
 特許文献2には、S.thermophilus由来のCRISPR-Casシステムを活用したゲノム編集技術が開示されている。さらに、特許文献2には、Cas9タンパク質のD31A又はN891A変異体が、一方のDNA鎖のみにニック(nick)を入れるDNA切断酵素であるニッカーゼとして機能することが開示されており、DNA切断後の修復メカニズムで挿入欠失などの変異を起こしやすい非相同末端結合の発生率は少ないままで、野生型Cas9タンパク質と同程度の相同組み換え効率を有することが示されている。
 非特許文献1には、S.pyogenes由来のCas9を使用したCRISPR-Casシステムであって、2つのCas9タンパク質のD10A変異体と、該D10A変異体と複合体を形成する1対の標的特異的ガイドRNAを利用するダブルニッカーゼシステムが開示されている。各Cas9タンパク質のD10A変異体及び標的特異的ガイドRNAの複合体は、ガイドRNAと相補するDNA鎖に1つだけニックを作る。一対のガイドRNAは約20塩基程度ずれており、標的DNAの反対鎖に位置する標的配列のみを認識する。各Cas9タンパク質のD10A変異体及び標的特異的ガイドRNAの複合体によって作られた2つのニックはDSB(DNA二本鎖切断)を模倣する状態になり、一対のガイドRNAを利用することで高レベルの効率を維持しつつ、Cas9タンパク質媒介型遺伝子編集の特異性を改善できることが示されている。
国際公開第2014/093661号 特表2015-510778号公報
Ran, F.A., et al. 2013. Double nicking by RNA―guided CRISPR Cas9 for enhanced genome editing specificity. Cell 154: 1380-1389.
 特許文献1に開示されているS.pyogenes由来のCas9タンパク質は、認識可能なPAM配列が「NGG」の3塩基であり、特許文献2に開示されているS.thermophilus由来のCas9タンパク質では、認識可能なPAM配列が「NGGNG」又は「NNAGAA」の5~6塩基であり、ともに認識可能なPAM配列に制限があるため、編集可能な標的配列が制限される。
 また、非特許文献1に開示されているダブルニッカーゼシステムでは、S.pyogenes由来のCas9タンパク質を使用しており、認識可能なPAM配列が標的配列内のセンス鎖及びアンチセンス鎖に1か所ずつ計2か所必要となるため、さらに編集可能な標的配列が制限される。
 本発明は、上記事情に鑑みてなされたものであって、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列の認識が広範化されたCas9タンパク質を提供することを目的とする。また、本発明は、ガイドRNA及び/又はDNAの認識が向上されたCas9タンパク質を提供することを目的とする。さらに、本発明は、前記Cas9タンパク質を利用した、標的配列に特異的なゲノム編集技術及び遺伝子発現調節の簡便且つ迅速な方法を提供することを目的とする。
 すなわち、本発明は、以下の態様を含む。
[1]以下の(a)~(f)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
 (a)配列番号1で表されるアミノ酸配列、
 (b)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (c)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、80%以上の同一性を有するアミノ酸配列、
 (d)配列番号2で表されるアミノ酸配列、
 (e)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (f)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、80%以上の同一性を有するアミノ酸配列
[2]配列番号1で表されるアミノ酸配列のアミノ酸番号100位がAsnである、又は配列番号2で表されるアミノ酸配列のアミノ酸番号1022位がAsnであることを特徴とする、[1]に記載のタンパク質。
[3]以下の(g)~(i)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
 (g)配列番号13で表されるアミノ酸配列、
 (h)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (i)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、80%以上の同一性を有するアミノ酸配列
[4]配列番号13で表されるアミノ酸配列のアミノ酸番号1025位がAlaであることを特徴とする、[3]に記載のタンパク質。
[5]以下の(j)~(l)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
 (j)配列番号5で表されるアミノ酸配列において、以下の(1)及び/又は(2)の置換を少なくとも一つ含むアミノ酸配列
 (1)アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (2)アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (k)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (l)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
[6]配列番号5で表されるアミノ酸配列において、アミノ酸番号55位のSerのLysへの置換、及び/又はアミノ酸番号904位のGluのArgへの置換を含む、[5]に記載のタンパク質。
[7]以下の(m)~(o)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
 (m)配列番号5で表されるアミノ酸配列において、以下の置換を少なくとも一つ含むアミノ酸配列
 ・アミノ酸番号1022位のAspの、Asn、Gln、又はHisへの置換、
 ・アミノ酸番号1025位のThrのAlaへの置換、
 ・アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 ・アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (n)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (o)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
[8]配列番号5で表されるアミノ酸配列において、以下の置換の組合せのいずれか一つを含む、[7]に記載のタンパク質。
・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、及びアミノ酸番号1022位のAspのAsnへの置換、
・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、アミノ酸番号1025位のThrのAlaへの置換、
・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、アミノ酸番号1022位のAspのAsnへの置換、及びアミノ酸番号1025位のThrのAlaへの置換
[9](d)~(o)のいずれかにおいて、前記アミノ酸配列が、以下の(3)の置換を含むことを特徴とする、[1]~[8]のいずれか一つに記載のタンパク質。
 (3)アミノ酸番号8位のAspのAlaへの置換、503位のGluのAlaへの置換、584位のHisのAlaへの置換、598位のAsnのAlaへの置換、607位のAsnのAlaへの置換、及び725位のAspのAlaへの置換から選択される少なくとも一つの置換
[10][1]~[9]のいずれか一つに記載のタンパク質をコードする遺伝子。
[11]以下の(p)~(s)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子。
 (p)配列番号3又は4で表される塩基配列、
 (q)配列番号3又は4で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
 (r)配列番号3又は4で表される塩基配列と同一性が80%以上である塩基配列、
 (s)配列番号3又は4で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
[12]以下の(t)~(w)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子。
 (t)配列番号14で表される塩基配列、
 (u)配列番号14で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
 (v)配列番号14で表される塩基配列と同一性が80%以上である塩基配列、
 (w)配列番号14で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
[13][1]~[9]のいずれか一つに記載のタンパク質又は[10]~[12]のいずれか一つに記載の遺伝子と、
 標的二本鎖ポリヌクレオチド中のPAM配列の1塩基上流から20塩基以上24塩基以下上流までの塩基配列に相補的な塩基配列からなるポリヌクレオチドを含むガイドRNAとを含む組成物。
[14]標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法であって、
 標的二本鎖ポリヌクレオチドと、[1]~[8]のいずれか一つに記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出することを特徴とする、方法。
[15]標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
 標的二本鎖ポリヌクレオチドと、[1]~[8]のいずれか一つに記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の3塩基上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出し、
 前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法。
[16]標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
 標的二本鎖ポリヌクレオチドと、[9]に記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、ここで、前記タンパク質が、前記標的二本鎖ポリヌクレオチドを切断しないか又は一方の鎖のみを切断し、
 前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法。
[17]遺伝子の発現を調節するための方法であって、
 前記遺伝子に関連する標的二本鎖ポリヌクレオチドと、[9]に記載のタンパク質と、ガイドRNAと、エフェクター分子とを接触させる工程を含み、
 前記タンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、それにより前記エフェクター分子が前記標的二本鎖ポリヌクレオチドに特異的に作用することによって前記遺伝子の発現を調節することを特徴とする、方法。
 本発明によれば、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列の認識が広範化されたCas9タンパク質を得ることができる。また、本発明により、ガイドRNA及び/又は標的二本鎖ポリヌクレオチドの認識が向上されたCas9タンパク質を提供することができる。さらに、本発明により、従来技術では標的とすることが不可能又は困難であった配列を含む、広範な配列から選択された標的配列において、標的配列特異的なゲノム編集及び遺伝子発現調節の簡便且つ迅速な方法を提供することができる。
(A)BlCas9タンパク質が認識することができるPAM配列を示した図である。(B)BlCas9タンパク質と複合体と形成することができるガイドRNAの配列及び二次構造の一例を示した図である。 BlCas9タンパク質、ガイドRNA、及び標的二本鎖ポリヌクレオチドの三者複合体の結晶構造解析の結果を示した図である。図中、「BH」はブリッジヘリックス、「PI」はPIドメイン(PAM配列認識部位)を示す。 野生型BlCas9タンパク質のPAM配列認識部位においてPAM配列の5番目の塩基を認識する機構を示した図である。 天然のPAM配列を含む標的DNAを用いて、野生型BlCas9とD1022N変異型BlCas9のDNA切断活性を比較したグラフである。野生型(WT)の切断活性を1として表した。 野生型BlCas9及びD1022N変異型BlCas9について、認識するPAM配列の5番目の塩基の違いによる切断活性の違いを比較した電気泳動写真である。 野生型BlCas9及びD1022N/K1040E変異型BlCas9について、認識するPAM配列の5番目の塩基の違いによる切断活性の違いを比較した電気泳動写真である。 異なる長さのガイドRNAを用いてCas9の切断活性を確認したグラフである。 DNA認識を向上させる各種変異を導入したCas9タンパク質によるDNA切断活性を示したグラフである。 DNA認識を向上させる単変異体について、DNA切断活性の経時変化を示した図である。 DNA認識を向上させる二重変異体について、DNA切断活性の経時変化を示した図である。 E52R/S843N変異を導入したCas9タンパク質による、各種PAM配列を有する標的DNAの切断活性を示すグラフである。 K959A、K992A、K959A/K992A、及びT1025A変異型BlCas9について、反応開始後(A)5分、(B)15分、(C)30分のそれぞれの時点での、各種PAM配列を有する標的DNAの切断活性を示す電気泳動写真である。 図12のT1025A変異型BlCas9の結果を定量化したグラフである。 ガイドRNA認識を向上させる各種変異を導入したCas9タンパク質によるDNA切断活性を示したグラフである。 ガイドRNA認識を向上させる各種変異を導入したCas9タンパク質によるDNA切断活性を示したグラフである。 野生型BlCas9タンパク質について、PAM配列の5番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 D1022N変異型BlCas9タンパク質について、PAM配列の5番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 S55K/E904R/D1022N(KRN変異)変異型BlCas9タンパク質について、PAM配列の5番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 S55K/E904R/D1022N/T1025A(KRNA変異)変異型BlCas9タンパク質について、PAM配列の5番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 野生型BlCas9タンパク質について、PAM配列の7番目及び8番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 T1025A変異型BlCas9タンパク質について、PAM配列の7番目及び8番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 S55K/E904R/T1025A(KRA変異)変異型BlCas9タンパク質について、PAM配列の7番目及び8番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 S55K/E904R/D1022N/T1025A(KRNA変異)変異型BlCas9タンパク質について、PAM配列の7番目及び8番目の塩基の違いによるDNA切断活性の違いを示したグラフである。 野生型BlCas9タンパク質及びD1022N変異型BlCas9タンパク質の哺乳動物細胞におけるゲノム編集活性(1塩基置換、挿入又は欠失)を示したグラフである。
 以下、必要に応じて図面を参照しながら、本発明の実施形態について詳細に説明する。なお、図面中、同一又は相当部分には同一符号を付し、重複する説明は省略する。
<PAM配列における5番目の塩基の認識が改変されたCas9タンパク質>
 一実施形態において、本発明は、以下の(a)~(f)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質を提供する。
 (a)配列番号1で表されるアミノ酸配列、
 (b)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (c)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、80%以上の同一性を有するアミノ酸配列、
 (d)配列番号2で表されるアミノ酸配列、
 (e)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (f)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、80%以上の同一性を有するアミノ酸配列
 本実施形態によれば、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列における5番目の塩基の認識が改変されたCas9タンパク質を得ることができる。
 本明細書において、「ポリペプチド」、「ペプチド」、及び「タンパク質」とは、アミノ酸残基のポリマーを意味し、互換的に使用される。また、1つ若しくは複数のアミノ酸が、天然に存在する対応アミノ酸の化学的類似体、又は修飾誘導体である、アミノ酸ポリマーを意味する。本明細書においては、IUPAC-IUB Joint Commission on Biochemical Nomenclature(JCBN)に従い定義されるようなアミノ酸の一文字表記及び三文字表記を使用する。
 本明細書において、アミノ酸配列における置換変異を表す場合、元のアミノ酸の一文字表記、続いて1~4桁の数字による位置番号、次に置換されたアミノ酸の一文字表記により表現することがある。例えば、アミノ酸番号1022位においてアスパラギン酸(D)がアスパラギン(N)に置換される変異が生じている場合、「D1022N」と表され、これは、「アミノ酸番号1022位のAspのAsnへの置換」と同義である。
 本発明者らは、PAM配列の認識が広範化されたCas9タンパク質を得るために、Cas9のオルソログを調べ、Brevibacillus laterosporus(B.laterosporus)由来のCas9タンパク質(BlCas9タンパク質)に着目した。
 本明細書において、「オルソログ」とは、共通の祖先遺伝子から種分岐に伴って派生した遺伝子間の対応関係、又はそのような対応関係にある遺伝子群を意味する。
 野生型BlCas9タンパク質は、1092個のアミノ酸残基からなるtypeII Cas9エンドヌクレアーゼである。野生型BlCas9タンパク質の全長アミノ酸配列を、配列番号5に示す。
 図1(A)は、BlCas9タンパク質が認識することができるPAM配列を示した図である。BlCas9タンパク質は「5’-NNNNCNDD-3’」という8つの塩基をPAM配列として認識する。図1(B)は、BlCas9タンパク質と複合体と形成することができるガイドRNAの配列及び二次構造の一例を示した図である(Karvelis et al. Genome Biology,2015)。
 なお、本明細書において、塩基配列を表す場合、「A」はアデニン、「G」はグアニン、「C」はシトシン、「T」はチミンをそれぞれ意味し、「D」は、アデニン、グアニン、及びチミンからなる群から選択された任意の1塩基を意味し、「N」は、アデニン、シトシン、チミン、及びグアニンからなる群から選択された任意の1塩基を意味する。
 続いて、本発明者らは、BlCas9タンパク質、ガイドRNA及び標的二本鎖ポリヌクレオチドの三者複合体について、結晶構造解析を行い、PAM配列認識部位の構造を得た。図2は、BlCas9タンパク質、ガイドRNA及び標的二本鎖ポリヌクレオチドの三者複合体の結晶構造解析の結果を示した図である。PAM配列として「5’-NNNNCNDD-3’」を含み、ガイドRNAと非相補的な塩基配列を含む鎖を有する標的二本鎖ポリヌクレオチドを用いた。図3は、野生型BlCas9タンパク質のPAM配列認識部位においてPAM配列の5番目の塩基を認識する機構を示した図である。PAM配列認識部位において、BlCas9タンパク質中の1022番目のアスパラギン酸(Asp1022)及び1040番目のリシン(Lys1040)が、PAM配列中の5番目のシトシン(C)及び該シトシン(C)と塩基対を形成しているグリシン(G)と、それぞれ水素結合を形成していることが明らかとなった。
 そこで、上述した野生型BlCas9タンパク質中のPAM配列認識部位の改変を試み、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列の認識が広範化されたCas9タンパク質を発明するに至った。
 PAM配列における5番目の塩基の認識が改変された本実施形態のBlCas9タンパク質は、具体的には、以下の(a)又は(d)のアミノ酸配列を含む配列からなることを特徴とするタンパク質である。
 (a)配列番号1で表されるアミノ酸配列
 (d)配列番号2で表されるアミノ酸配列
 配列番号1は、BlCas9タンパク質中のPAM配列認識部位であるPIドメイン(PI:PAM-interacting)の配列(923番目のSerから1092番目のArgまでの170残基)であって、PAM配列の5番目の塩基の認識を改変する点変異、具体的には、アミノ酸番号100位のAsp(D)の、Asn(N)、Gln(Q)、又はHis(H)への置換を少なくとも含む配列である。また、配列番号1は、前記置換に加えて、任意選択で118位のLys(K)の、Glu(E)又はAsp(D)への置換も含む。
 配列番号2は、BlCas9タンパク質の全長アミノ酸配列であって、PAM配列の5番目の塩基の認識を改変する点変異、具体的には、アミノ酸番号1022位のAsp(D)の、Asn(N)、Gln(Q)、又はHis(H)への置換を少なくとも含む配列である。また、配列番号2は、前記置換に加えて、任意選択で1040位のLys(K)の、Glu(E)又はAsp(D)への置換も含む。
 理論に拘束されるものではないが、野生型BlCas9のアミノ酸番号1022位(配列番号1の100位に相当)のAsp(D)を、ヌクレオチドと水素結合を形成することができる側鎖を有するアミノ酸に改変することで、二本鎖ポリヌクレオチド内のPAM配列における5番目の塩基と直接水素結合するため、結合力を強めることができ、それにより認識できる塩基の種類を改変することができると考えられる。「ヌクレオチドと水素結合を形成することができる側鎖を有するアミノ酸」としては、例えば、Asn(N)、Gln(Q)、及びHis(H)が挙げられ、この中で、Asn(N)が好ましい。また、上記1022位における変異に加えて、PAM配列中の5番目のCと塩基対を形成しているGを認識する1040位(配列番号1の118位に相当)のLys(K)をGlu(E)又はAsp(D)、好ましくはGlu(E)に置換することによって、認識されるPAM配列の5番目の塩基が「G」特異的になる。
 したがって、野生型BlCas9タンパク質が、PAM配列における5番目の塩基が「C」である配列を認識するのに対して、1022位における上記置換を有する本実施形態のBlCas9タンパク質は、PAM配列における5番目の塩基が「D」である配列(「5’-NNNNDNDD-3’」)を認識する。また、1022位及び1040位における上記置換の組合せを有する本実施形態のBlCas9タンパク質は、PAM配列における5番目の塩基が「G」である配列(「5’-NNNNGNDD-3’」)を認識する。
 また、本実施形態のBlCas9タンパク質は、前記(a)又は(d)の置換を含むアミノ酸配列を含む配列からなるタンパク質と機能的に同等なタンパク質として、以下の(b)若しくは(c)、又は(e)若しくは(f)のアミノ酸配列を含む配列からなるタンパク質を包含する。
 (b)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (c)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、80%以上の同一性を有するアミノ酸配列、
 (e)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (f)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、80%以上の同一性を有するアミノ酸配列
 本明細書において、「機能的に同等なタンパク質」とは、野生型Cas9タンパク質に備わっている機能のうち、Cas9タンパク質が用いられる用途において必要とされる機能を維持している、改変されたCas9タンパク質を意味し、「必要とされる機能」は、用途によって異なり得る。一実施形態において、改変されたBlCas9タンパク質は、RNA誘導性DNAエンドヌクレアーゼ活性を維持している。別の実施形態において、改変されたBlCas9タンパク質は、少なくとも標的特異的ガイドRNAと複合体を形成する機能を維持している。
 本明細書において、アミノ酸配列又は塩基配列の「欠失、挿入、置換又は付加」は、野生型のアミノ酸配列又は塩基配列と比較しての欠失、挿入、置換又は付加を指す。本実施形態のBlCas9タンパク質のアミノ酸配列は、配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の位置又は配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の位置において、例えば、1~250個、1~200個、1~150個、1~100個、好ましくは、1~50個、1~40個、1~30個、より好ましくは1~15個、さらにより好ましくは1~10個、特に好ましくは1~5個のアミノ酸の欠失、挿入、置換、又は付加を含む。一実施形態において、改変されたBlCas9タンパク質のアミノ酸配列は、アミノ酸番号1022位以外の位置において、1個、2個、3個、4個、5個、6個、7個、8個、9個、又は10個のアミノ酸の欠失、挿入、置換、又は付加を含む。
 より具体的には、本実施形態のBlCas9タンパク質のアミノ酸配列は、上記の置換に加えて、以下に説明する(1)~(3)の置換を少なくとも一つ含んでいてもよい。一実施形態において、好ましくは、本実施形態のBlCas9タンパク質のアミノ酸配列は、(1)及び/又は(2)の置換を少なくとも一つ含む。別の実施形態において、改変されたBlCas9タンパク質のアミノ酸配列は、(1)~(3)の置換を全て含む。本実施形態の変異を含み、さらに(1)~(3)の置換を少なくとも一つ含む本発明の全長BlCas9タンパク質のアミノ酸配列の一例を、配列番号6に示す。
 本実施形態のBlCas9タンパク質のPAM配列認識アミノ酸配列が、配列番号1のアミノ酸番号100位以外の位置において1個又は複数個のアミノ酸の欠失、挿入、置換、又は付加を含む場合、前記アミノ酸配列は、配列番号1の100位以外の部位において、配列番号1のアミノ酸配列と80%以上の同一性を有する。また、本実施形態のBlCas9タンパク質のアミノ酸配列が、配列番号2のアミノ酸番号1022位以外の位置において1個又は複数個のアミノ酸の欠失、挿入、置換、又は付加を含む場合、前記アミノ酸配列は、配列番号2の1022位以外の部位において、配列番号2のアミノ酸配列と80%以上の同一性を有する。本明細書において、「同一性」とは、当技術分野で公知であるように、2以上のアミノ酸配列間又は2以上のポリヌクレオチド配列間の配列を比較することによって決定される関係を意味し、公知のコンピュータープログラムを用いて決定することができる。一実施形態において、本発明の改変されたBlCas9タンパク質のアミノ酸配列は、配列番号1の100位以外の部位において、配列番号1のアミノ酸配列と、好ましくは85%以上、より好ましくは90%以上、更により好ましくは95%以上、例えば96%以上、97%以上、又は98%以上、最も好ましくは99%以上の同一性を有する。別の実施形態において、本発明の改変されたBlCas9タンパク質のアミノ酸配列は、配列番号2の1022位以外の部位において、配列番号2のアミノ酸配列と、好ましくは85%以上、より好ましくは90%以上、更により好ましくは95%以上、例えば96%以上、97%以上、又は98%以上、最も好ましくは99%以上の同一性を有する。
 一実施形態において、本発明のBlCas9タンパク質は、(a)~(f)のいずれか一つのアミノ酸配列に加えて他のアミノ酸配列を含む配列からなるタンパク質であってもよい。別の実施形態において、本発明のBlCas9タンパク質は、(d)~(f)のいずれか一つのアミノ酸配列のみからなるタンパク質である。
<DNA配列の認識活性が向上されたCas9タンパク質/PAM配列における7番目及び/又は8番目の塩基の認識が改変されたCas9タンパク質>
 一実施形態において、本発明は、以下の(g)~(i)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質を提供する。
 (g)配列番号13で表されるアミノ酸配列、
 (h)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (i)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、80%以上の同一性を有するアミノ酸配列
 PAM配列の7番目及び8番目の塩基の認識が改変された本実施形態のBlCas9タンパク質は、具体的には、以下の(g)のアミノ酸配列を含む配列からなることを特徴とするタンパク質である。
 (g)配列番号13で表されるアミノ酸配列
 配列番号13は、PAM配列の7番目及び8番目の塩基の認識が野生型BlCas9と比較して緩和されたBlCas9タンパク質の全長アミノ酸配列であって、具体的には、アミノ酸番号1025位のThr(T)のAla(A)への置換を少なくとも含む配列である。
 また、本実施形態のBlCas9タンパク質は、前記(g)の置換を含むアミノ酸配列を含む配列からなるタンパク質と機能的に同等なタンパク質として、以下の(h)又は(i)のアミノ酸配列を含む配列からなるタンパク質を包含する。
 (h)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (i)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、80%以上の同一性を有するアミノ酸配列
 本実施形態のBlCas9タンパク質のアミノ酸配列は、配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の位置において、例えば、1~250個、1~200個、1~150個、1~100個、好ましくは、1~50個、1~40個、1~30個、より好ましくは1~15個、さらにより好ましくは1~10個、特に好ましくは1~5個のアミノ酸の欠失、挿入、置換、又は付加を含む。一実施形態において、改変されたBlCas9タンパク質のアミノ酸配列は、アミノ酸番号1025位以外の位置において、1個、2個、3個、4個、5個、6個、7個、8個、9個、又は10個のアミノ酸の欠失、挿入、置換、又は付加を含む。
 本実施形態のBlCas9タンパク質のPAM配列認識アミノ酸配列が、配列番号13のアミノ酸番号1025位以外の位置において1個又は複数個のアミノ酸の欠失、挿入、置換、又は付加を含む場合、前記アミノ酸配列は、配列番号13の1025位以外の部位において、配列番号13のアミノ酸配列と80%以上、好ましくは85%以上、より好ましくは90%以上、更により好ましくは95%以上、例えば96%以上、97%以上、又は98%以上、最も好ましくは99%以上の同一性を有する。
 一実施形態において、本発明のBlCas9タンパク質は、(g)~(i)のいずれか一つのアミノ酸配列に加えて他のアミノ酸配列を含む配列からなるタンパク質であってもよい。別の実施形態において、本発明のBlCas9タンパク質は、(g)~(i)のいずれか一つのアミノ酸配列のみからなるタンパク質である。
 また、一実施形態において、本発明は、BlCas9タンパク質の全長アミノ酸配列において、以下の(1)の置換を少なくとも一つ含むことを特徴とする、タンパク質を提供する。
 (1)アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換
 BlCas9タンパク質の全長アミノ酸配列において、1025位が置換された上記実施形態、及び(1)の置換を少なくとも一つ含む上記実施形態(以下、単に「本実施形態」とする)によれば、野生型BlCas9と比較してDNA配列の認識活性が向上されたCas9タンパク質を得ることができる。
 また、本実施形態のBlCas9タンパク質は、DNA配列の認識活性が向上された結果、PAM配列における7番目及び8番目の塩基の嗜好性が緩和されている。具体的には、本実施形態のBlCas9タンパク質は、少なくとも7番目又は8番目のいずれかの塩基が「N」であり、好ましくは、7番目及び8番目の塩基がともに「N」であるPAM配列を認識する。
 Cas9タンパク質のDNA配列の認識活性には様々な要因が関与している。例えば、Cas9タンパク質には、BH(ブリッジヘリックス)と呼ばれるアルギニン残基に富むαヘリックスが存在しているが、このBH中の複数のアルギニン残基が、ガイドRNAの「シード領域」と呼ばれるPAM配列の近傍10~12塩基対のリン酸骨格を認識しており、Cas9の機能に重要な役割を果たしていることが知られている。したがって、理論に拘束されるものではないが、BHドメイン中に存在するBlCas9の52位、55位等におけるアミノ酸残基を、核酸と結合しやすいLys(K)、Arg(R)、His(H)等の塩基性アミノ酸に置換することにより、Cas9タンパク質のDNA配列認識活性を向上させることができると考えられる。また、上述のとおり、PIドメインはPAM配列の認識に関わる部位であるため、このPIドメイン内やその近傍に位置する843位、997位、1040位等のアミノ酸を、核酸と結合しやすいLys(K)、Arg(R)、His(H)等の塩基性アミノ酸、又は任意の核酸中のリン酸基と水素結合し得る、Asn(N)、Glu(E)、Tyr(Y)等のアミノ酸に改変することで、DNAのリン酸骨格との結合を強めることができると考えられる。
 また、理論に拘束されるものではないが、野生型BlCas9のアミノ酸番号904位のGlu(E)を、二本鎖DNAの標的鎖(target strand)のリン酸骨格と相互作用することができるアミノ酸に改変することで、核酸の認識活性を向上させることができると考えられる。「DNAのリン酸骨格と相互作用することができるアミノ酸」としては、例えば、Arg(R)、Lys(K)、及びHis(H)が挙げられ、この中で、Arg(R)が好ましい。
 本実施形態のBlCas9タンパク質は、好ましくは以下の置換又は置換の組合せを含む。
・E52R
・E52K
・S55K
・S844N
・K997R
・E52R及びS843N
・E52R及びK997R
・E52R及びK1040R
・E52K及びS844N
・E52K及びK997R
・E52K及びK1040R
・S55K及びK997R
・S55K及びK1040R
・S55K、E52R、及びK997R
・S55K、E52K、及びK997R
・E52R、S843N、及びK997R
・E52K、S843N、及びK997R
 上記の中でも、三重変異、特にE52R、S843N、及びK997Rの置換の組合せが好ましい。
 上記の変異を有する本実施形態のBlCas9タンパク質は、PAM配列の8番目の塩基の認識の嗜好性が「D」(A、G、又はT)から「N」(A、C、G、又はT)に緩和される。
 上記の変異に代えて、またはこれに加えて、本実施形態のBlCas9タンパク質は、好ましくは以下の置換又は置換の組合せを含む。
・K959A
・K992A
・K959A/K992A
・T1025A
 上記の中でも、特にT1025Aの置換が好ましい。
 上記の変異を有する本実施形態のBlCas9タンパク質は、PAM配列の7番目及び8番目の塩基の認識の嗜好性が「DD」(A、G、又はT)から「NN」(A、C、G、又はT)に緩和される。
 上記の変異に代えて、またはこれに加えて、本実施形態のBlCas9タンパク質は、好ましくは以下の置換又は置換の組合せを含む。
・E904R
・S55K/E904R
 したがって、1025位の置換及び/又は(1)の置換を少なくとも一つ含む本実施形態のBlCas9タンパク質は、「5’-NNNNCNND-3’」、「5’-NNNNCNDN-3’」、又は「5’-NNNNCNNN-3’」というPAM配列を認識することができる。また、1025位の置換及び/又は(1)の置換の少なくとも一つを上記配列番号1又は2で表されるアミノ酸配列に導入することにより、改変されたCas9タンパク質は、「5’-NNNNDNND-3’」、「5’-NNNNDNDN-3’」、若しくは「5’-NNNNDNNN-3’」、又は「5’-NNNNGNND-3’」、「5’-NNNNGNDN-3’」、若しくは「5’-NNNNGNNN-3’」というPAM配列を認識することができる。PAM配列の認識が広範化されたこれらのCas9タンパク質を単独で又は組み合せて用いることにより、理論的には全ての配列について、PAM配列の制限を受けることなく、自由にガイドRNAを設計することが可能となる。
<ガイドRNAの認識活性が向上されたCas9タンパク質>
 一実施形態において、本発明は、BlCas9タンパク質の全長アミノ酸配列において、以下の(2)の置換を少なくとも一つ含むことを特徴とする、タンパク質を提供する。
 (2)アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換
 本実施形態によれば、野生型Cas9と比較してガイドRNAの認識活性が向上されたCas9タンパク質を得ることができる。
 理論に拘束されるものではないが、全長BlCas9の93位、95位、175位、811位、1075位、及び/又は1076位のアミノ酸を、核酸と結合しやすい塩基性アミノ酸に置換することで、Cas9タンパク質が標的DNAの二重らせん構造をほどく活性が向上すると考えられる。塩基性アミノ酸としては、例えば、Lys、Arg、Hisが挙げられる。特に以下から選択される少なくとも一つの置換が好ましい:H72K、Q93K、E95K、H175K、T811K、S1075K、及びD1076K。
 一実施形態において、本発明は、以下の(j)~(l)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質を提供する。
 (j)配列番号5で表されるアミノ酸配列において、以下の(1)及び/又は(2)の置換を少なくとも一つ含むアミノ酸配列
 (1)アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (2)アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (k)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (l)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
 さらに、本発明のBlCas9タンパク質は、上述の全ての変異の任意の組合せを含むことができる。
 したがって、一実施形態において、本発明は、以下の(m)~(o)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質を提供する。
 (m)配列番号5で表されるアミノ酸配列において、以下の置換を少なくとも一つ含むアミノ酸配列
 ・アミノ酸番号1022位のAspの、Asn、Gln、又はHisへの置換、
 ・アミノ酸番号1025位のThrのAlaへの置換、
 ・アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 ・アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
 (n)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
 (o)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
 本実施形態のBlCas9タンパク質の具体例としては、例えば以下の置換の組合せを含むタンパク質が挙げられるが、これらに限定されるものではない。
 BlCas9タンパク質の全長アミノ酸配列における1022位のAsp(D)の、Asn(N)、Gln(Q)、又はHis(H)への置換、好ましくはAsn(N)への置換と、55位のSer(S)のLys(K)への置換と、904位のGlu(E)の、Arg(R)、Lys(K)、又はHis(H)への置換、好ましくはArg(R)への置換。この置換の組合せにより、1022位における置換を単独で有する変異型BlCas9と比較して、PAM配列の認識活性がさらに向上した変異型BlCas9を得ることができる。
 BlCas9タンパク質の全長アミノ酸配列における1025位のThr(T)のAla(A)への置換と、55位のSer(S)のLys(K)への置換と、904位のGlu(E)の、Arg(R)、Lys(K)、又はHis(H)への置換、好ましくはArg(R)への置換。この置換の組合せにより、1025位における置換を単独で有する変異型BlCas9と比較して、PAM配列の認識活性がさらに向上した変異型BlCas9を得ることができる。
 BlCas9タンパク質の全長アミノ酸配列における1022位のAsp(D)の、Asn(N)、Gln(Q)、又はHis(H)への置換、好ましくはAsn(N)への置換と、1025位のThr(T)のAla(A)への置換と、55位のSer(S)のLys(K)への置換と、904位のGlu(E)の、Arg(R)、Lys(K)、又はHis(H)への置換、好ましくはArg(R)への置換とを組み合わせることにより、核酸の認識活性が高く、PAM配列の認識の嗜好性が緩和された変異型BlCas9を得ることができる。
 本実施形態のBlCas9タンパク質は、好ましくは以下の置換の組合せを含む。また、これらの置換の組合せを含む変異型BlCas9のアミノ酸配列を配列番号15に示す。
・S55K/E904R/D1022N:この変異の組合せを含むCas9タンパク質は、「5’-NNNNDNDD-3’」というPAM配列を認識することができる。
・S55K/E904R/T1025A:この変異の組合せを含むCas9タンパク質は、「5’-NNNNCNNN-3’」というPAM配列を認識することができる。
・S55K/E904R/D1022N/T1025A:この変異の組合せを含むCas9タンパク質は、「5’-NNNNNNDD-3’」というPAM配列を認識することができる。
<Cas9タンパク質のDNA切断活性>
 一実施形態において、本発明の改変されたBlCas9タンパク質は、エンドヌクレアーゼ活性を維持している。本明細書において、「エンドヌクレアーゼ」とは、ヌクレオチド鎖の内部、すなわち末端でない部分を切断する酵素を意味する。したがって、前記実施形態において、本発明の改変されたBlCas9タンパク質は、標的二本鎖ポリヌクレオチドを切断することができる。
 別の実施形態において、本発明の改変されたBlCas9タンパク質は、標的二本鎖ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠如している改変体であってもよい。すなわち、前記実施形態において、本発明の改変されたBlCas9タンパク質は、標的二本鎖ポリヌクレオチドを切断しないか、又は二本のうち片方の鎖のみを切断する。
 例えば、S.pyogenes由来のCas9(SpCas9)において、RuvC I触媒ドメイン中のアミノ酸番号10位のAspからAlaへの置換(D10A)により、Cas9が、両方の鎖を切断するヌクレアーゼから一本鎖を切断するニッカーゼに変換されることが知られている。Cas9をニッカーゼにする変異の他の例には、SpCas9のE762A、H840A、N854A、N863A、及びD986Aが含まれるが、これらに限定されない。本実施形態の改変されたBlCas9タンパク質は、BlCas9における対応する位置において、上記の変異を一つ又は複数含んでいてもよい。
 したがって、一実施態様において、改変されたBlCas9タンパク質が、標的二本鎖ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠如している場合、該タンパク質のアミノ酸配列は、以下の変異:
 (3)アミノ酸番号8位のAspのAlaへの置換、503位のGluのAlaへの置換、584位のHisのAlaへの置換、598位のAsnのAlaへの置換、607位のAsnのAlaへの置換、及び725位のAspのAlaへの置換から選択される少なくとも一つの置換
を含んでいてもよい。
 一実施形態において、改変されたBlCas9タンパク質は、DNA切断活性を実質的に欠く。本明細書において、改変されたCas9のDNAの切断活性が「DNA切断活性を実質的に欠く」とは、その改変体のDNA切断活性が、非改変形態に対して約25%、10%、5%、1%、0.1%、又は0.01%未満であることを指す。
 用途を制限するものではないが、標的二本鎖ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠如しているCas9タンパク質は、例えば後述するような、個々の塩基を一塩基単位で高精度に改変するゲノム編集(一塩基編集)や、遺伝子の発現を調節する方法等での使用において、特に有利である。
 本発明の改変されたBlCas9タンパク質は、例えば次のような方法により作製することができる。まず、改変されたBlCas9タンパク質をコードする核酸を含むベクターを用いて、宿主を形質転換する。続いて、形質転換された当該宿主を培養して前記Casタンパク質を発現させる。培地の組成、培養の温度及び時間、誘導物質の添加等の条件は、形質転換体が生育し、目的のタンパク質が効率よく産生されるよう、公知の方法に従って当業者が決定できる。また、例えば、選択マーカーとして抗生物質抵抗性遺伝子を発現ベクターに組み込んだ場合、培地に抗生物質を加えることにより、形質転換体を選択することができる。続いて、宿主が発現した前記Cas9タンパク質を適宜の方法により精製することにより、改変されたCas9タンパク質が得られる。宿主としては、特に限定されず、動物細胞、植物細胞、昆虫細胞、又は、大腸菌、枯草菌、酵母等の微生物が挙げられる。
<タンパク質をコードする遺伝子>
 一実施形態において、本発明は、上記[1]~[9]のいずれか一つに記載のタンパク質をコードする遺伝子を提供する。
 また、一実施形態において、本発明は、以下の(p)~(s)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子を提供する。
 (p)配列番号3又は4で表される塩基配列、
 (q)配列番号3又は4で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
 (r)配列番号3又は4で表される塩基配列と同一性が80%以上である塩基配列、
 (s)配列番号3又は4で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
 配列番号3は、配列番号1のアミノ酸配列からなるタンパク質をコードする遺伝子の塩基配列である。また、配列番号4は、配列番号2のアミノ酸配列からなるタンパク質をコードする遺伝子の塩基配列である。
 また、別の一実施形態において、本発明は、以下の(t)~(w)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子を提供する。
 (t)配列番号14で表される塩基配列、
 (u)配列番号14で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
 (v)配列番号14で表される塩基配列と同一性が80%以上である塩基配列、
 (w)配列番号14で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
 配列番号14は、配列番号13のアミノ酸配列からなるタンパク質をコードする遺伝子の塩基配列である。
 本実施形態の塩基配列は、配列番号3、4、又は14で表される塩基配列において、例えば、1~700個、1~500個、1~300個、1~100個、好ましくは、1~50個、1~40個、1~30個、より好ましくは1~15個、さらにより好ましくは1~10個、特に好ましくは1~5個の塩基の欠失、挿入、置換、又は付加を含む。一実施形態において、塩基配列は、配列番号3、4、又は14で表される塩基配列において、1個、2個、3個、4個、5個、6個、7個、8個、9個、又は10個の塩基の欠失、挿入、置換、又は付加を含む。
 本実施形態の塩基配列は、配列番号3、4、又は14で表される塩基配列と、好ましくは85%以上、より好ましくは90%以上、更により好ましくは95%以上、例えば96%以上、97%以上、又は98%以上、最も好ましくは99%以上の同一性を有する。塩基配列の同一性は、上述のアミノ酸配列の同一性を決定する方法と同様に、当該技術分野において公知の手法により決定することができる。
 本明細書において、「ストリンジェントな条件下」とは、例えば、Molecular Cloning-A LABORATORY MANUAL THIRD EDITION(Sambrookら、Cold Spring Harbor Laboratory Press)に記載の方法が挙げられる。例えば、5×SSC(20×SSCの組成:3M 塩化ナトリウム、0.3M クエン酸溶液、pH7.0)、0.1重量% N-ラウロイルサルコシン、0.02重量%のSDS、2重量%の核酸ハイブルダイゼーション用ブロッキング試薬、及び50%フォルムアミドから成るハイブリダイゼーションバッファー中で、55~70℃で数時間から一晩インキュベーションを行うことによりハイブリダイズさせる条件を挙げることができる。なお、インキュベーション後の洗浄の際に用いる洗浄バッファーとしては、好ましくは0.1重量%SDS含有1×SSC溶液、より好ましくは0.1重量%SDS含有0.1×SSC溶液である。
 一実施形態において、本発明の遺伝子は、(p)~(w)のいずれか一つの塩基配列に加えて他の塩基配列を含む配列からなる遺伝子であってもよい。別の実施形態において、本発明の遺伝子は、(p)~(w)のいずれか一つの塩基配列のみからなる遺伝子である。
 本実施形態の遺伝子を発現ベクターに挿入し、これを用いて宿主を形質転換することにより、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列の認識が広範化されたCas9タンパク質を得ることができる。
 本実施形態において、Cas9をコードする塩基配列は、真核生物細胞等の特定の細胞における発現のためにコドン最適化されていてもよい。真核生物細胞としては、特定の生物、例えば、ヒト、マウス、ラット、ウサギ、イヌ、ブタ、又は非ヒト霊長類等が挙げられ、これらに限定されない。一般に、コドン最適化とは、ネイティブのアミノ酸配列を維持しつつ、ネイティブの配列の少なくとも1つのコドンを、導入される動物種の遺伝子においてより頻繁に又は最も頻繁に使用されるコドンで置き換えることによって、導入される動物種における増強された発現のために核酸配列を改変するプロセスを指す。種々の種が、特定のアミノ酸の特定のコドンについて特定のバイアスを示す。コドンバイアス(生物間のコドン使用頻度における差異)は、mRNAの翻訳効率と相関する場合が多く、これは、翻訳されているコドンの特性及び特定のtRNAの利用可能性にとりわけ依存すると考えられている。細胞中の選択されたtRNAの優勢は、一般に、ペプチド合成において最も頻繁に使用されるコドンの反映である。従って、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現のために個別化され得る。コドン使用頻度表は、例えば、www.kazusa.or.jp/codon/(2018年3月20日に訪問)に掲載されている「Codon Usage Database」において容易に入手可能であり、これらの表を用いて、コドンを最適化することができる(例えば、Nakamura,Y.ら「Codon usage tabulated from the international DNA sequence databases:status for the year 2000」Nucl. Acids Res. 28:292 (2000)、参照)。特定の動物種における発現のために特定の配列をコドン最適化するためのコンピューターアルゴリズムについても、例えば、Gene Forge(Aptagen社;Jacobus、PA)等において入手可能である。本実施形態において、Cas9をコードする配列中の1つ又は複数のコドンは、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。
<改変されたCas9タンパク質またはその遺伝子とガイドRNAとを含む組成物>
 一実施形態において、本発明は、上述の改変されたBlCas9タンパク質又は該タンパク質をコードする遺伝子と、
 標的二本鎖ポリヌクレオチド中のPAM配列の1塩基上流から20塩基以上24塩基以下上流までの塩基配列に相補的な塩基配列からなるポリヌクレオチドを含むガイドRNAとを含む組成物を提供する。
 本実施形態の組成物を使用することにより、広範な配列から選択された標的配列において、標的配列特異的なゲノム編集及び遺伝子発現調節を簡便且つ迅速に行うことができる。
 本明細書中において、「標的配列」の「配列」とは、任意の長さのヌクレオチド配列を意味しており、デオキシリボヌクレオチド又はリボヌクレオチドであり、線状、環状、又は分岐状であり、一本鎖又は二本鎖である。
 また、本明細書中において、「PAM配列」とは、標的二本鎖ポリヌクレオチド中に存在し、Cas9タンパク質により認識可能な配列を意味する。PAM配列の長さや塩基配列は細菌種によって異なる。本実施形態の改変されたBlCas9タンパク質により認識可能な配列は、「5’-NNNNCNND-3’」、「5’-NNNNCNDN-3’」、「5’-NNNNCNNN-3’」、「5’-NNNNDNDD-3’」、「5’-NNNNDNND-3’」、「5’-NNNNDNDN-3’」、「5’-NNNNDNNN-3’」、「5’-NNNNGNDD-3’」、「5’-NNNNGNDN-3’」、「5’-NNNNGNNN-3’」、「5’-NNNNNNDD-3’」、「5’-NNNNNNND-3’」、「5’-NNNNNNDN-3’」、又は「5’-NNNNNNNN-3’」として表すことができる。
 本明細書中において、「ポリヌクレオチド」とは、線状又は環状配座であり、一本鎖又は二本鎖形態のいずれかである、デオキシリボヌクレオチド又はリボヌクレオチドポリマーを意味し、ポリマーの長さに関して制限するものとして解釈されるものではない。また、ポリヌクレオチドには、天然ヌクレオチドの公知の類似体、並びに塩基部分、糖部分及びリン酸部分のうち少なくとも一つの部分において修飾されるヌクレオチド(例えば、ホスホロチエート骨格)も包含される。一般に、特定ヌクレオチドの類似体は、元のヌクレオチドと同一の塩基対合特異性を有し、例えば、Aの類似体は、Tと塩基対合する。
 本明細書中において、「ガイドRNA」とは、tracrRNA-crRNAのヘアピン構造を模倣したものであり、標的二本鎖ポリヌクレオチド中のPAM配列の1塩基上流から、好ましくは20塩基以上24塩基以下、より好ましくは21塩基以上23塩基以下まで、さらに好ましくは21塩基又は22塩基、最も好ましくは22塩基の標的塩基配列に相補的な塩基配列からなるポリヌクレオチドを5’末端領域に含むものである。さらに、標的二本鎖ポリヌクレオチドと非相補的な塩基配列からなり、一点を軸として対称に相補的な配列になるように並び、ヘアピン構造をとり得る塩基配列からなるポリヌクレオチドを1つ以上含んでいてもよい。
 前記タンパク質及び前記ガイドRNAは、in vitro及びin vivoにおいて、温和な条件で混合することで、タンパク質-RNA複合体を形成することができる。温和な条件とは、温度及びpHが、タンパク質が分解又は変性しない程度の温度及びpHである条件を示しており、温度は4℃以上40℃以下が好ましく、pHは4以上10以下が好ましい。
 本実施形態において、組成物は、ガイドRNAをコードする発現ベクターを含んでもよい。また、組成物が、改変されたBlCas9をコードする遺伝子を含む場合、遺伝子は、線状(直鎖状)の遺伝子断片として提供されてもよいし、ベクターに組み込まれた状態で提供されてもよい。改変されたBlCas9をコードする遺伝子がベクターに組み込まれて提供される場合、Cas9をコードする遺伝子と、ガイドRNAをコードする遺伝子は、同一のベクターとして提供されてもよいし、複数の別個のベクターとして提供されてもよい。ベクターとしては、特に限定されず、プラスミドベクター、ウイルスベクター等、従来公知のものを用いることができる。ウイルスベクターの例は、レトロウイルスベクター、アデノウイルスベクター、アデノ随伴(AAV)ウイルスベクター、ヘルペスウイルスベクター、シンドビスウイルスベクター等であるが、これらに限定されない。
 本実施形態の組成物は、医薬用であることが好ましく、薬学的に許容される担体を含むことがより好ましい。本実施形態の医薬用組成物は、例えば、錠剤、被覆錠剤、丸剤、散剤、顆粒剤、カプセル剤、液剤、懸濁剤、乳剤等の形態で経口的に、あるいは、注射剤、坐剤、皮膚外用剤等の形態で非経口的に投与することができる。
 薬学的に許容される担体としては、通常医薬組成物の製剤に用いられるものを特に制限なく用いることができる。より具体的には、例えば、ゼラチン、コーンスターチ、トラガントガム、アラビアゴム等の結合剤;デンプン、結晶性セルロース等の賦形剤;アルギン酸等の膨化剤;水、エタノール、グリセリン等の注射剤用溶剤;ゴム系粘着剤、シリコーン系粘着剤等の粘着剤等が挙げられる。薬学的に許容される担体は、1種を単独で又は2種以上を混合して用いることができる。
 本実施形態の組成物は、更に添加剤を含んでいてもよい。添加剤としては、ステアリン酸カルシウム、ステアリン酸マグネシウム等の潤滑剤;ショ糖、乳糖、サッカリン、マルチトール等の甘味剤;ペパーミント、アカモノ油等の香味剤;ベンジルアルコール、フェノール等の安定剤;リン酸塩、酢酸ナトリウム等の緩衝剤;安息香酸ベンジル、ベンジルアルコール等の溶解補助剤;酸化防止剤;防腐剤等が挙げられる。添加剤は、1種を単独で又は2種以上を混合して用いることができる。
 本実施形態の組成物は、一種又は複数の疾患又は症状を治療及び/又は予防するために用いられる。好ましくは、前記疾患又は症状は、遺伝子疾患又は遺伝子の異常に起因する症状である。
<標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法>
 一実施形態において、本発明は、標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法であって、
 標的二本鎖ポリヌクレオチドと、本発明のCasタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出することを特徴とする、方法を提供する。
 本実施形態の方法によれば、広範な配列から選択された標的配列において、部位特異的な標的二本鎖ポリヌクレオチドの切断を簡便且つ迅速に行うことができる。
 標的二本鎖ポリヌクレオチドを部位特異的に切断するための本実施形態の方法について、以下に詳細に説明する。
 まず、本実施形態のBlCas9タンパク質とガイドRNAとを接触させる。接触させる工程は、例えば、前記Cas9タンパク質とガイドRNAとを温和な条件で混合し、インキュベートすることによって行ってもよい。温和な条件とは、上述のとおりである。インキュベートする時間は、0.5時間以上1時間以下が好ましい。前記Cas9タンパク質及び前記ガイドRNAによる複合体は、安定しており、室温で数時間静置しても安定性を保つことができる。
 本実施形態において用いるCas9タンパク質及びガイドRNAについては、上述のとおりである。
 本実施形態において、標的二本鎖ポリヌクレオチドは、5’→3’の方向で記載される、NNNNCNND、NNNNCNDN、NNNNCNNN、NNNNDNDD、NNNNDNND、NNNNDNDN、NNNNDNNN、NNNNGNDD、NNNNGNND、NNNNGNDN、NNNNGNNN、NNNNNNDD、NNNNNNND、NNNNNNDN、及びNNNNNNNNからなる群から選択されるPAM配列を含む配列が好ましく、ここで、Nは、アデニン、シトシン、チミン、及びグアニンからなる群から選択された任意の1塩基であり、Dは、アデニン、チミン、及びグアニンからなる群から選択された任意の1塩基である。
 次に、前記標的二本鎖ポリヌクレオチド上において、前記タンパク質及び前記ガイドRNAは複合体を形成する。前記タンパク質は、「5’-NNNNCNND-3’」、「5’-NNNNCNDN-3’」、「5’-NNNNCNNN-3’」、「5’-NNNNDNDD-3’」、「5’-NNNNDNND-3’」、「5’-NNNNDNDN-3’」、「5’-NNNNDNNN-3’」、「5’-NNNNGNDD-3’」、「5’-NNNNGNND-3’」、「5’-NNNNGNDN-3’」、「5’-NNNNGNNN-3’」、「5’-NNNNNNDD-3’」、「5’-NNNNNNND-3’」、「5’-NNNNNNDN-3’」、及び「5’-NNNNNNNN-3’」からなる群から選択されるPAM配列を認識し、PAM配列の上流に位置する切断部位で、前記標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出する。
 より詳細には、前記Cas9タンパク質がPAM配列を認識し、PAM配列を起点として、前記標的二本鎖ポリヌクレオチドの二重らせん構造が引き剥され、前記ガイドRNA中の前記標的二本鎖ポリヌクレオチドに相補的な塩基配列とアニーリングすることで、前記標的二本鎖ポリヌクレオチドの二重らせん構造が部分的にほぐれる。このとき、前記Cas9タンパク質は、PAM配列の上流に位置する切断部位で、前記標的二本鎖ポリヌクレオチドのリン酸ジエステル結合を切断し、平滑末端を作出する。
 本実施形態において、切断部位は、例えば、標的二本鎖ポリヌクレオチド中のPAM配列の1、2、3、4、5、6、7、8、9、10塩基上流である。好ましくは、切断部位は、標的二本鎖ポリヌクレオチド中のPAM配列の3塩基上流である。
 本実施形態の方法は、in vivo又はin vitroの任意の環境で行うことができる。一実施形態において、本実施形態の方法は、生体外、すなわちex vivo又はin vitroで行われる。
<標的二本鎖ヌクレオチドを部位特異的に修飾するための方法>
 一実施形態において、本発明は、標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
 標的二本鎖ポリヌクレオチドと、本発明のCasタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出し、
 前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法を提供する。
 本実施形態によれば、広範な配列から選択された標的配列において、部位特異的な標的二本鎖ポリヌクレオチドの修飾を簡便且つ迅速に行うことができる。
 標的二本鎖ヌクレオチドを部位特異的に修飾するための本実施形態の方法について、以下に詳細に説明する。
 標的二本鎖ポリヌクレオチドと、Casタンパク質と、ガイドRNAとを接触させる工程は、上記<標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法>と同様に行うことができる。
 本実施形態において用いる標的二本鎖ポリヌクレオチド、Cas9タンパク質、及びガイドRNAについては、上述のとおりである。
 標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法について、以下に詳細を説明する。標的二本鎖ポリヌクレオチドを部位特異的に切断するまでの工程は上述のとおりである。続いて、前記ガイドRNAと前記二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、目的に応じた修飾が施された標的二本鎖ポリヌクレオチドを得ることができる。
 本明細書中において、「修飾」とは、標的二本鎖ポリヌクレオチドの塩基配列が変化することを意味する。例えば、標的二本鎖ポリヌクレオチドの切断、切断後の外因性配列の挿入(物理的挿入又は相同指向修復を介する複製による挿入)による標的二本鎖ポリヌクレオチドの塩基配列の変化、切断後の非相同末端連結(NHEJ:切断により生じたDNA末端同士が再び結合すること)による標的二本鎖ポリヌクレオチドの塩基配列の変化等が挙げられる。本実施形態における標的二本鎖ポリヌクレオチドの修飾により、標的二本鎖ポリヌクレオチドへの変異の導入、又は、標的二本鎖ポリヌクレオチドの機能を破壊することができる。
 本実施形態の方法は、in vivo又はin vitroの任意の環境で行うことができる。一実施形態において、本実施形態の方法は、生体外、すなわちex vivo又はin vitroで行われる。
<標的二本鎖ヌクレオチドを部位特異的かつ正確に修飾するための方法>
 一実施形態において、本発明は、標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
 標的二本鎖ポリヌクレオチドと、本発明のCasタンパク質と、ガイドRNAとを接触させる工程を含み、
 前記タンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、ここで、前記タンパク質が、前記標的二本鎖ポリヌクレオチドを切断しないか又は一方の鎖のみを切断し、
 前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法を提供する。
 本実施形態によれば、部位特異的かつ一塩基単位の正確な標的二本鎖ポリヌクレオチドの修飾を簡便且つ迅速に行うことができる。特に、標的配列が広範化した本発明のBlCas9タンパク質を使用することにより、自由にガイドRNAを設計することができるため、編集する塩基を自由に選択することができる。そのため、本発明の改変されたBlCas9タンパク質は、本実施形態の方法における使用に関して特に有利である。
 改変されたBlCas9タンパク質を用いて遺伝子の発現を調節するための本実施形態の方法について、以下に詳細に説明する。
 標的二本鎖ポリヌクレオチドと、Casタンパク質と、ガイドRNAと、エフェクター分子とを接触させる工程は、上記<標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法>と同様に行うことができる。
 本実施形態において用いる標的二本鎖ポリヌクレオチド及びガイドRNAについては、上述のとおりである。本実施形態において用いるCas9タンパク質は、上記<Cas9タンパク質のDNA切断活性>に記載している、標的二本鎖ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠如している改変体である。
 標的二本鎖ポリヌクレオチドを部位特異的にかつ正確に修飾するための方法について、以下に詳細を説明する。各構成成分を上述のとおり接触させると、Cas9タンパク質とガイドRNAとが複合体を形成し、標的二本鎖ポリヌクレオチドに結合する。ここで、Cas9タンパク質は、前記標的二本鎖ポリヌクレオチドを切断しないか又は一方の鎖のみを切断して、すなわち、二本鎖切断を起こすことなく、標的ポリヌクレオチド内の塩基配列を修飾する。「修飾」とは、上で定義したとおりである。本実施形態において、修飾は、好ましくは一塩基単位で行われ、例えば、C-G塩基対をT-A塩基対へ変えること、又はその逆を行うことを意味する。
 本実施形態において、上記の一塩基単位の特異的かつ正確な修飾(一塩基編集)は、好ましくは、デアミナーゼ(脱アミノ化酵素)を用いて行われる。デアミナーゼとしては、例えば、シチジンデアミナーゼやアデノシンデアミナーゼを使用することができる。デアミナーゼは、Cas9タンパク質に作動可能に連結されていてもよい。本明細書において、「作動可能に連結されている」とは、連結されている各構成要素が、その通常の機能を果たすことができるように連結されていることを意味する。
 本実施形態の方法は、in vivo又はin vitroの任意の環境で行うことができる。一実施形態において、本実施形態の方法は、生体外、すなわちex vivo又はin vitroで行われる。
<遺伝子の発現を調節するための方法>
 一実施形態において、本発明は、遺伝子の発現を調節するための方法であって、
 前記遺伝子に関連する標的二本鎖ポリヌクレオチドと、本発明のCasタンパク質と、ガイドRNAと、エフェクター分子とを接触させる工程を含み、
 前記Casタンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、それにより前記エフェクター分子が前記標的二本鎖ポリヌクレオチドに特異的に作用することによって前記遺伝子の発現を調節することを特徴とする、方法を提供する。
 本実施形態によれば、広範な配列から選択された標的配列において、CRISPR/Cas9系による標的二本鎖ポリヌクレオチド認識を利用した遺伝子発現の調節を簡便且つ迅速に行うことができる。特に、標的配列が広範化した本発明のBlCas9タンパク質を使用することにより、自由にガイドRNAを設計することができるため、遺伝子発現の調節を最も効果的に行うことができる領域(ホットスポット)にエフェクター分子を正確に送達することができる。そのため、本発明の改変されたBlCas9タンパク質は、本実施形態の方法における使用に関して特に有利である。
 本明細書において、「発現」とは、ポリヌクレオチドがmRNAへと転写されるプロセス、及び/又は転写されたmRNAが、ペプチド、ポリペプチド、若しくはタンパク質へと翻訳されるプロセスを意味する。ポリヌクレオチドがゲノムDNA由来のポリヌクレオチドである場合、発現は、真核生物細胞におけるmRNAのスプライシングを含み得る。
 本明細書において、「遺伝子の発現」とは、遺伝子中に含有される情報の、遺伝子産物への変換を意味する。遺伝子産物は、遺伝子の直接的転写産物(例えば、mRNA、tRNA、rRNA、アンチセンスRNA、リボザイム、shRNA、マイクロRNA、構造RNAまたは任意の他の型のRNA)またはmRNAの翻訳によって産生されたタンパク質であり得る。遺伝子産物には、キャッピング、ポリアデニル化、メチル化および編集などのプロセスによって改変されたRNA、ならびに例えば、メチル化、アセチル化、リン酸化、ユビキチン化、ADP-リボシル化、ミリスチル化およびグリコシル化によって改変されたタンパク質もまた含まれる。
 本明細書において、遺伝子の発現の「調節」とは、遺伝子の活性における変化を意味する。発現の調節は、例えば遺伝子の活性化及び抑制、より具体的には転写の活性化又は抑制であるが、これらに限定されない。
 BlCas9タンパク質を用いて遺伝子の発現を調節するための本実施形態の方法について、以下に詳細に説明する。
 標的二本鎖ポリヌクレオチドと、Casタンパク質と、ガイドRNAと、エフェクター分子とを接触させる工程は、上記<標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法>と同様に行うことができる。
 本実施形態において用いる標的二本鎖ポリヌクレオチド及びガイドRNAについては、上述のとおりである。本実施形態において用いるCas9タンパク質は、上記<Cas9タンパク質のDNA切断活性>に記載している、標的二本鎖ポリヌクレオチドの一方又は両方、好ましくは両方の鎖を切断する能力を欠如している改変体である。
 本明細書において、「エフェクター分子」とは、細胞において局在化した効果を発揮することが可能な、タンパク質又はタンパク質ドメイン等の分子を意味する。エフェクター分子は、例えば生物学的活性を調節するために、タンパク質またはDNAに選択的に結合するものを含む、種々の異なる形態を取り得る。エフェクター分子の作用には、ヌクレアーゼ活性、酵素活性の増大又は低減、遺伝子発現の増大又は低減、細胞シグナル伝達に影響を与えること等が含まれるが、これらに限定されない。本発明において用いることができるエフェクター分子の具体的な例には、例えば、VP64又はNF-κB p65等の転写活性因子又はドメイン、KRAP、ERFリプレッサードメイン(ERD)、mSin3A相互作用ドメイン(SID)等の転写抑制因子又はドメイン、DNAメチルトランスフェラーゼ、DNA脱メチル化酵素、ヒストンアセチルトランスフェラーゼ、ヒストン脱アセチル化酵素等のクロマチンリモデリング因子が含まれるが、これらに限定されない。
 本実施形態において、エフェクター分子は、Casタンパク質とガイドRNAとの複合体が標的二本鎖ポリヌクレオチドに特異的に結合することによって、前記標的二本鎖ポリヌクレオチドへと導かれる。好ましくは、エフェクター分子は、場合によりリンカーを介して、Cas9タンパク質に作動可能に連結されている。
 本実施形態において、エフェクター分子は、標的二本鎖ポリヌクレオチドに特異的に作用することによって、前記標的二本鎖ポリヌクレオチドに関連する遺伝子の発現を調節する。標的とする二本鎖ポリヌクレオチドには、発現を調節しようとする遺伝子自身の塩基配列のポリヌクレオチドを選択してもよいし、あるいは、例えば、発現を調節しようとする遺伝子の発現を直接又は間接に、正又は負に制御している上流の遺伝子の塩基配列のポリヌクレオチドを選択することもできる。
 本実施形態の方法は、in vivo又はin vitroの任意の環境で行うことができる。一実施形態において、本実施形態の方法は、生体外、すなわちex vivo又はin vitroで行われる。
<ゲノム編集及び遺伝子治療方法>
 一実施形態において、本発明は、上述のタンパク質又は組成物を用いて、ゲノム編集を実行するための方法を提供する。以前に知られている標的化された遺伝子組換えの方法と対照的に、本発明は、効率的かつ安価に行うことができ、また任意の細胞又は生物に適応可能である。細胞又は生物の二本鎖核酸の任意のセグメントは、本発明の方法により改変され得る。この方法は、全ての細胞に内在性である相同組換えプロセス及び非相同組換えプロセスの両方を利用する。
 一実施形態において、本発明は、改変されたBlCas9タンパク質又は該タンパク質をコードする遺伝子と、ガイドRNAとを含む組成物を対象に投与することを含む、遺伝子治療方法を提供する。本実施形態においては、上述の実施形態のタンパク質、遺伝子、及び/又は組成物を用いることができる。
 本実施形態における医薬組成物の投与方法は特に限定されず、患者の症状、体重、年齢、性別等に応じて適宜決定すればよい。例えば、錠剤、被覆錠剤、丸剤、散剤、顆粒剤、カプセル剤、液剤、懸濁剤、乳剤等は経口投与される。また、注射剤は、単独で、又はブドウ糖、アミノ酸等の通常の補液と混合して静脈内投与され、更に必要に応じて、動脈内、筋肉内、皮内、皮下又は腹腔内投与される。
 本実施形態における医薬組成物の投与量は、患者の症状、体重、年齢、性別等によって異なり、一概には決定できないが、経口投与の場合には、例えば1日あたり1μg~10g、例えば1日あたり0.01~2000mgの有効成分を投与すればよい。また、注射剤の場合には、例えば1日あたり0.1μg~1g、例えば1日あたり0.001~200mgの有効成分を投与すればよい。
 本明細書において、「ゲノム編集」とは、CRISPR/Cas9システムやTranscription Activator-Like Effector Nucleases(TALEN)等の技術により標的化された遺伝子組換え又は標的化された変異を実行することにより、特異的な遺伝子破壊やレポーター遺伝子のノックイン等を行う新しい遺伝子改変技術である。本実施形態において、変異は、標的ゲノムDNA又は標的ゲノムDNAの発現調節領域における一部又は全部の欠失、置換、任意の配列の挿入等により生じる。
 また、一実施形態において、本発明は、標的化されたDNA挿入又は標的化されたDNA欠失を行う方法を提供する。この方法は、ドナーDNAを含む核酸構築物を用いて、細胞を形質転換する工程を包含する。標的遺伝子切断後のDNA挿入及びDNA欠失に関するスキームについては、公知の方法に従って当業者が決定できる。
 また、一実施形態において、本発明は、体細胞及び生殖細胞の両方で利用され、特定の遺伝子座で遺伝子操作を提供する。
 また、一実施形態において、本発明は、体細胞において遺伝子を破壊するための方法を提供する。ここで、遺伝子は、細胞又は生物に対して有害な産物を過剰発現し、細胞又は生物に対して有害な産物を発現する。このような遺伝子は、疾患において生じる1つ以上の細胞型において過剰発現され得る。本発明の方法による、前記過剰発現した遺伝子の破壊は、前記過剰発現した遺伝子に起因する疾患を被る個体に、より良い健康をもたらし得る。すなわち、細胞のほんの小さな割合の遺伝子の破壊が働き、発現レベルを減少し、治療効果を生じ得る。
 また、一実施形態において、本発明は、生殖細胞において遺伝子を破壊するための方法を提供する。特定の遺伝子が破壊された細胞は、特定の遺伝子の機能を有さない生物を作製するために選択され得る。前記遺伝子が破壊された細胞において、遺伝子は完全にノックアウトされ得る。この特定の細胞における機能の欠損は、治療効果を有し得る。
 また、一実施形態において、本発明は、遺伝子産物をコードするドナーDNAの挿入をさらに提供する。この遺伝子産物は、構成的に発現された場合、治療効果を有する。例えば、膵細胞の個体群において、活性プロモーター及びインシュリン遺伝子をコードするドナーDNAの挿入を引き起こすために、前記ドナーDNAを、糖尿病を被る個体に挿入する方法が挙げられる。次いで、外因性DNAを含む膵細胞の前記個体群は、インシュリンを生成し、糖尿病患者を治療することができる。さらに、前記ドナーDNAは作物に挿入され、薬剤的関連遺伝子産物の生成を引き起こし得る。タンパク質産物の遺伝子(例えば、インシュリン、リパーゼ又はヘモグロビン)は、制御エレメント(構成的活性プロモーター、又は誘導性プロモーター)と一緒に植物に挿入され、植物中で大量の医薬品を生成し得る。
 次いで、このようなタンパク質産物は、植物から単離され得る。トランスジェニック植物又はトランスジェニック動物は、核酸移入技術(McCreath,K.J.ら(2000)Nature 405:1066-1069;Polejaeva,I.A.ら,(2000)Nature 407:86-90)を用いる方法で作製され得る。組織型特異的ベクター又は細胞型特異的ベクターは、選択した細胞内でのみ遺伝子発現を提供するために利用され得る。
 あるいは、上記の方法は、生殖細胞内で利用され、計画された様式で挿入が生じ、後の全ての細胞分裂が、設計された遺伝的変更を有する細胞を生成する細胞を選択し得る。
 本発明の方法は、原核生物及び真核生物を含むすべての生物に対してか、又は培養細胞、培養組織又は培養核(インタクトな生物を再生するために使用され得る細胞、組織又は核を含む)においてか、又は配偶子(例えば、それらの発達の様々な段階の卵又は精子)において、適用され得る。本発明の方法は、任意の生物(昆虫、真菌、げっ歯類、ウシ、ヒツジ、ヤギ、ニワトリ、及び他の農業上重要な動物、ならびに他の哺乳動物(イヌ、ネコ及びヒトが挙げられるが、これらに限定されない)が挙げられるが、これらに限定されない)に由来する細胞に適用され得る。
 さらに、本発明の組成物及び方法は、植物において使用され得る。組成物及び方法が、任意の様々な植物種(例えば、単子葉植物又は双子葉植物等)において使用され得る。
 以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の構成等も含まれる。
 以下に実施例を挙げて本発明を更に詳述するが、本発明はこれらの実施例に限定されるものではない。
[実施例1]PAM配列の5番目の塩基の認識の広範化
1.野生型及び変異型BlCas9の調製
(1)コンストラクトの設計
 野生型BlCas9、及び、PAM配列における5番目の塩基の認識をCからD(A、G、T)に変更するD1022N変異を有する改変BlCas9をそれぞれコードするBlcas9遺伝子(野生型Blcas9の塩基配列:配列番号7、D1022N変異型Blcas9の塩基配列:配列番号8)をそれぞれ、pE-SUMO vector(LifeSensors)に組み込んだ。さらに、SUMOタグとBlcas9遺伝子の間にTEV認識配列を付加した。完成したコンストラクトから発現するCas9のN末端には6残基のヒスチジンが連続し(Hisタグ)、続いてSUMOタグ、TEVプロテアーゼ認識サイトが付加される設計になっている。
(2)大腸菌での発現
 作製したベクターを大腸菌Escherichia coli rosetta2 (DE3)株へ形質転換した。その後、20μg/mlカナマイシン及び20μg/mlクロラムフェニコールを含むLB培地培養した。OD=0.8になるまで培養した時点で、発現誘導剤としてイソプロピル-β-チオガラクトピラノシド(Isopropyl β-D-1-thiogalactopyranoside;IPTG)(終濃度1mM)を添加し、20℃で18時間培養した。培養後、大腸菌を遠心分離(5,000 g、10分間)により回収した。
(3)野生型及び変異型BlCas9の精製
 (2)で回収した菌体を緩衝液Aで懸濁し、超音波破砕した。遠心(40,000g、30分間)により上清を回収し、緩衝液Aで平衡化したNi-NTA Superflow樹脂(QIAGEN)と混合し、1時間穏やかに転倒混和した。素通り画分を回収した後、5カラム容量の緩衝液A、さらに5カラム容量の高塩濃度緩衝液Bで洗浄を行った。
 再度3カラム容量の緩衝液Aで洗浄した後、5カラム容量の高イミダゾール濃度緩衝液Cで目的タンパク質を溶出した。溶出したタンパク質を、緩衝液D(0M NaCl)85%、緩衝液E(2M NaCl)15%で平衡化したHiTrap SP HP(GE Healthcare)にチャージした。2カラム容量分の緩衝液D(0M NaCl)85%及び緩衝液E(2M NaCl)15%の混合溶液で洗浄を行った後、緩衝液Eを15%から100%へ(NaCl濃度は300mMから2Mへ)直線勾配をかけて目的タンパク質を溶出した。溶出したサンプルにTEVプロテアーゼを添加し、緩衝液Fを用いて20℃で一晩透析し、タグの除去を行った。透析後、Hisタグ及びTEVプロテアーゼを目的タンパク質と分離するために、再び緩衝液Fで平衡化したNi-NTA Superflow樹脂と混合し、素通り画分を回収した。引き続いて、3カラム容量の緩衝液Cにてカラム洗浄を行い、洗浄液を回収した。
 溶出したサンプルを緩衝液Gで平衡化したHiload 16/600 Superdex 200(GE Healthcare)に通し、1カラム容量分の緩衝液Gで目的タンパク質を溶出した。
 緩衝液A~Gの組成について、表1に示す。表1中、「2-ME」は、2-メルカプトエタノール(2-mercaptoethanol)を意味し、「DTT」は、ジチオトレイトール(dithiothreitol)を意味する。
Figure JPOXMLDOC01-appb-T000001
2.ガイドRNAの調製
 目的のガイドRNA配列(配列番号9)が挿入された鋳型DNA作製を行った。ガイドRNA配列の上流にT7プロモーター配列を付加したプライマーを用意し、PCRを用いてプライマー同士をアニールさせて伸長反応を起こしてin vitro転写反応の鋳型DNAを作製した。この鋳型DNAを用いて、37℃、4時間、T7 RNAポリメラーゼによるin vitro転写反応を行った。転写産物を含む反応液に1/10量の3M
 酢酸ナトリウム及び2.5倍量の100%エタノールを添加し、4℃にて遠心(8,000g、3分)し、転写産物を沈殿させた。上清を廃棄して70%エタノールを添加し、4℃にて遠心(8,000g、3分)し再び上清を廃棄した。沈殿を風乾後、TBE緩衝液に再懸濁し、7M Urea変性10%PAGEにより精製した。目的RNAの分子量に位置するバンドを切り出し、Elutrap電気溶出システム(GE Healthcare)によりRNAを抽出した。その後、抽出したRNAをPD-10カラム(GE Healthcare)に通し、緩衝液を緩衝液H(10 mM Tris-HCl(pH8.0)、150mM NaCl)に交換した。
3.プラスミドDNA切断活性測定試験
 DNA切断活性測定試験に用いるために、標的DNA配列及びPAM配列が挿入されたベクターの作製を行った。標的DNA配列にPAM配列1~4をそれぞれ付加し、線状化したpUC119ベクターに組み込んだ。標的DNAの配列及びPAM配列1~4を表2に示す。
Figure JPOXMLDOC01-appb-T000002
 作製したベクターを用いて、大腸菌Mach1株(Life Technologies)を形質転換し、20μg/mLアンピシリンを含むLB培地で37℃にて培養した。
 培養後、菌体を遠心(8,000g、1分)により回収し、QIAprep Spin Miniprep Kit(QIAGEN)を用いてプラスミドDNAを精製した。
 精製した4種類のPAM配列が付加した標的プラスミドDNAを用いて切断実験を行った。プラスミドDNAは、制限酵素EcoRIにより1本に線状化した。この線状化DNA中の標的DNA配列をBlCas9が切断すると、約1,000bpと約2,000bpの切断産物が生じる。37℃にて5分間又は10分間反応させた。反応溶液の組成は表3に示す。
Figure JPOXMLDOC01-appb-T000003
 反応後のサンプルについて、MultiNAキャピラリー泳動装置(SHIMADZU)を用いて電気泳動を行い、切断産物のバンドを確認した。切断活性は、切断されたDNA断片(約2,000bp)の濃度と未切断の線状化DNA(約3,000bp)の濃度の合計に対する、切断DNA断片の濃度の割合(%)として表される。
 まず、野生型BlCas9が認識する(5番目がCである)天然のPAM配列1を含む標的DNAを用いて、野生型BlCas9と変異型BlCas9のDNA切断活性を比較した。結果を図4に示す。
 図4からわかるとおり、D1022N変異型BlCas9では、ガイドRNAの切断活性が完全に失われた。このことから、D1022は5番目のCの認識に重要であることが示された。
 その他のPAM配列を含むDNA切断活性を確認した電気泳動写真を図5に示す。
 図5が示すとおり、野生型BlCas9は、5番目がCであるPAM配列1を含む標的DNAを切断したが、その他のPAM配列を含む標的DNAはインキュベーション10分後も切断されなかった。対照的に、D1022N変異型BlCas9は、PAM配列1を含む標的DNAを切断しなかったが、それ以外の全てのPAM配列を含む標的DNAを、5分間のインキュベーションという短時間で切断した。
 以上から、D1022N変異型BlCas9では、認識するPAM配列がCからD(A、G、T)に改変されたことが示された。また、D1022N変異型BlCas9を用いて、簡便かつ迅速に、標的配列に対する標的二本鎖ポリヌクレオチドの特異的切断を導入することができることが示された。
[実施例2]PAM配列の5番目の塩基の認識の改変
1.変異型BlCas9の調製
 実施例1と同様の方法により、PAM配列における5番目の塩基の認識をCからGに改変するD1022N/K1040E変異を有する改変BlCas9を調製した。
2.プラスミドDNA切断活性測定試験
 ガイドRNA、PAM配列、及び標的DNAは、実施例1と同一のものを用いた。反応溶液は、Cas9タンパク質の濃度を0.05pmol(50nM)にした以外は実施例1と同じ配合(表3)のものを用い、反応時間を10分間又は20分間とした。結果を図6に示す。
 図6が示すとおり、D1022N/K1040E変異型BlCas9は、5番目がGであるPAM配列4を含む標的DNAのみを特異的に切断し、一方でその他のPAM配列を含む標的DNAは、反応20分後にも切断されなかった。
 以上から、D1022N/K1040E変異型BlCas9では、認識するPAM配列がCからGに改変されたことが示された。また、D1022N/K1040E変異型BlCas9を用いて、簡便かつ迅速に、標的配列に対する標的二本鎖ポリヌクレオチドの特異的切断を導入することができることが示された。
 5番目のD(A、G、T)を認識するD1022N変異型BlCas9と、5番目のGを認識するD1022N/K1040E変異型BlCas9とを組み合わせて用いることにより、実質的にPAM配列の5番目の塩基に関する制限が解消された。
[実施例3]ガイドRNAの長さと切断活性の関係
1.ガイドRNAの調製
 標的塩基配列に相補的な部分の長さが異なる以外は同一の配列及び構造を有する3種類のガイドRNAを調製した。具体的には、標的DNA配列中のPAM配列の1塩基上流から20塩基まで(ガイドRNA(20bp):配列番号9)、1塩基上流から22塩基まで(ガイドRNA(22bp):配列番号11)、及び1塩基上流から24塩基まで(ガイドRNA(24bp):配列番号12)の塩基配列に相補的な塩基配列からなるポリヌクレオチドを5’末端領域に含むものである。
2.プラスミドDNA切断活性測定試験
 野生型BlCas9、PAM配列1、及び標的DNAは、実施例1と同一のものを用いた。反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は2分間又は5分間とした。結果を図7に示す。
 図7に示すとおり、2分間及び5分間のいずれの反応時間においても、ガイドRNAの長さが22bp、20bp、24bpの順で、良好な切断活性が得られた。このことから、BlCas9と共に用いるガイドRNAの長さは、20pb~24bpの間の長さ、好ましくは22bpとすることが効果的であることが示された。
[実施例4]DNA認識を向上させる変異
1.変異型BlCas9の調製
 実施例1と同様の方法により、以下の変異を有する各種改変BlCas9をそれぞれ調製した。
・E52R
・E52K
・S55K
・S844N
・K997R
・E52R及びS843N
・E52R及びK997R
・E52R及びK1040R
・E52K及びS844N
・E52K及びK997R
・E52K及びK1040R
・S55K及びK997R
・S55K及びK1040R
・S55K、E52R、及びK997R
・S55K、E52K、及びK997R
・E52R、S843N、及びK997R
・E52K、S843N、及びK997R
2.プラスミドDNA切断活性測定試験
 ガイドRNA、PAM配列1、及び標的DNAは、実施例1と同一のものを用いた。反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は30秒間、1分間、又は2分間とした。2分後の全改変BlCas9の結果を図8に示す。また、特に単変異体(変異を1箇所にのみ有する)について図9に、二重変異体(変異を2箇所に有する)について図10に、30秒後及び1分後における結果も併せて示す。
 図8からわかるとおり、本実施例で試験した全ての変異型BlCas9について、野生型と比較して切断活性が向上していることが観察された。また、図9及び図10からわかるとおり、一部の変異型BlCas9では、30秒後、1分後といった時点において既に野生型と比較して十分な活性が観察されたものもあり、これらの変異型BlCas9を用いて、野生型BlCas9よりも簡便かつ迅速に、標的配列に対する標的二本鎖ポリヌクレオチドの特異的切断を導入できる可能性が示された。
[実施例5]PAM配列の8番目の認識の嗜好性緩和
 実施例4で使用したE52R/S843N変異型BlCas9について、PAM配列の8番目の塩基の嗜好性をさらに試験した。
1.プラスミドDNA切断活性測定試験
 標的DNA及びガイドRNAは、実施例1と同一のものを用いた。実施例1と同様に、標的DNA配列及びPAM配列が挿入されたベクターの作製を行った。使用したPAM配列を以下に示す。
Figure JPOXMLDOC01-appb-T000004
 反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は2分間、5分間、又は30分間とした。結果を図11に示す。
 図11からわかるとおり、E52R/S843N変異型BlCas9は、試験した全てのPAM配列について、遅くとも30分後には40%以上の切断活性を示した。この結果から、野生型BlCas9では、認識できるPAM配列の8番目の塩基が「D」であるのに対し、E52R/S843N変異型BlCas9は、PAM配列の8番目の塩基が「N」、すなわちA、T、C、Gのいずれであっても標的DNAを認識できることが理解される。
[実施例6]PAM配列の7番目及び8番目の塩基の認識の嗜好性緩和
1.変異型BlCas9の調製
 実施例1と同様の方法により、実施例4で使用したE52R/S843N/K997R変異に加えて、PAM配列における7番目及び8番目の塩基の認識の嗜好性を緩和する以下の変異を有する各種改変BlCas9をそれぞれ調製した。
・K959A
・K992A
・K959A及びK992A
・T1025A
2.プラスミドDNA切断活性測定試験
 標的DNA及びガイドRNAは、実施例1と同一のものを用いた。実施例1と同様に、標的DNA配列及びPAM配列が挿入されたベクターの作製を行った。使用したPAM配列を以下に示す。
Figure JPOXMLDOC01-appb-T000005
 反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は5分間、15分間、又は30分間とした。結果を図12に示す。また、T1025A変異について定量化したものを図13に示す。
 図12に示されるとおり、本実施例で試験した全ての変異型BlCas9について、遅くとも反応開始30分後には、7番目及び8番目の塩基が「AA」、「CA」、又は「AC」であるPAM配列を有する標的DNAの少なくとも一部が切断されたことを示す2本のバンドが観察された。中でもT1025A変異型BlCas9は特に切断活性が高く、図13からわかるとおり、5分間の反応時間では90%以上、15分間の反応時間ではほぼ100%の切断活性を示した。
 野生型BlCas9では、認識できるPAM配列の7番目及び8番目の塩基の塩基が「DD」であるのに対し、本実施例で試験した変異型BlCas9は、野生型BlCas9が認識する「AA」に加えて、野生型BlCas9が認識することができない「CA」及び「AC」というPAM配列も認識することができた。したがって、本実施例で試験した全ての変異体、特にT1025A変異型BlCas9は、PAM配列の7番目及び8番目の塩基の認識の嗜好性が緩和されていることが理解される。
[実施例7]ガイドRNA認識を向上させる変異
1.変異型BlCas9の調製
 実施例1と同様の方法により、以下の変異を有する各種改変BlCas9をそれぞれ調製した:H72K、Q93K、E95K、H175K、T811K、S1075K、及びD1076K。
2.プラスミドDNA切断活性測定試験
 ガイドRNA、PAM配列1、及び標的DNAは、実施例1と同一のものを用いた。H72K、Q93K、E95K、及びT811Kについては、Cas9の濃度を0.05pmol(50nM)とし、それ以外は実施例1と同じ配合(表3)のものを用い、反応時間を1分間、2分間、又は10分間とした。H175K、S1075K、及びD1076Kについては、Cas9の濃度を0.02pmol(20nM)とした以外は実施例1と同じ配合(表3)のものを用い、反応時間は2分間、5分間、又は15分間とした。結果を図14及び図15に示す。
 図14及び図15からわかるとおり、ガイドRNA認識を向上させる変異を導入することにより、複数の変異型BlCas9において、野生型BlCas9よりも優れたDNA切断活性が観察された。
[実施例8]PAM配列の5番目、7番目、及び/又は8番目の塩基の認識の広範化
1.変異型BlCas9の調製
 実施例1と同様の方法により、以下の変異の組合せを有する各種改変BlCas9をそれぞれ調製した。
・S55K/E904R/D1022N(KRN変異)
・S55K/E904R/T1025A(KRA変異)
・S55K/E904R/D1022N/T1025A(KRNA変異)
2.PAM配列の5番目の塩基の認識に関するプラスミドDNA切断活性測定試験
 野生型BlCas9と、実施例1で作製したD1022N変異型BlCas9、並びに上記KRN変異及びKRNA変異の各変異型BlCas9とを用いて、プラスミドDNA切断活性試験を行い、PAM配列の5番目の塩基の認識を評価した。
 ガイドRNA、PAM配列1~4、及び標的DNAは、実施例1と同一のものを用いた。反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は0.5分間(30秒間)、又は2分間とした。結果を図16A~Dに示す。バーは標準誤差(SE)を表す。
 野生型BlCas9は、5番目の塩基がCであるPAM配列を含む標的DNAを特異的に切断した(図16A)が、一方で、D1022N変異を導入した変異型BlCas9は、5番目の塩基がA、T、又はGであるPAM配列を含む標的DNAを特異的に切断し(図16B)、この変異によりPAM配列の5番目の塩基の認識が「C」から「D」(A、T、又はG)に改変されたことが示された。また、D1022N変異に加えてS55K/E904Rの各変異を導入した変異型BlCas9(KRN変異)では、D1022N変異のみを導入した変異型BlCas9と比較して、PAM配列の認識活性が全体的に向上した(図16C)。さらに、KRNA変異を導入した変異型BlCas9では、PAM配列の5番目の塩基の種類に関わらず、全ての標的DNAを高い活性で切断することができ(図16D)、この変異の組合せにより5番目のPAM配列の認識が「C」から「N」(C、A、T、及びG)に改変されたことが示された。
3.PAM配列の7番目及び8番目の塩基の認識に関するプラスミドDNA切断活性測定試験
 野生型BlCas9と、実施例3で作製したT1025A変異型BlCas9、並びに上記KRA変異及びKRNA変異の各変異型BlCas9とを用いて、プラスミドDNA切断活性試験を行い、PAM配列の7番目及び8番目の塩基の認識を評価した。
 標的DNA及びガイドRNAは、実施例1と同一のものを用いた。実施例1と同様に、標的DNA配列及びPAM配列が挿入されたベクターの作製を行った。使用したPAM配列を以下に示す。
Figure JPOXMLDOC01-appb-T000006
 反応溶液は実施例1と同じ配合(表3)のものを用い、反応時間は0.5分間(30秒間)、又は2分間とした。結果を図17A~Dに示す。バーは標準誤差(SE)を表す。
 野生型BlCas9は、7番目又は8番目の塩基が「C」であるPAM配列を含む標的DNAをほとんど切断することができなかった(図17A)。一方、T1025A変異を導入した変異型BlCas9、及びKRNA変異を導入した変異型BlCas9では、PAM配列の認識活性向上し(図17B、D)、T1025A変異がPAM配列の7番目及び8番目の塩基の認識を緩和することが示された。さらに、KRA変異を導入した変異型BlCas9では、全ての組合せの7番目及び8番目のPAM塩基を含む標的DNAを切断することができ(図17C)、この変異の組合せにより、PAM配列の7番目及び8番目の塩基の嗜好性が「D」(A、T、及びG)から「N」(A、T、C、及びG)に広範化されたことが示された。
[実施例9]哺乳動物細胞における変異型BlCas9を用いたゲノム編集
 実施例1~8では、変異型BlCas9のDNA切断活性を、プラスミドDNAを用いたin vitro試験で確認した。本実施例では、変異型BlCas9が実際に哺乳動物細胞において(すなわちin vivoで)染色体ゲノムを編集することができることを確認した。
1.哺乳動物細胞へのCRISPR/Cas9系の導入
 本実施例においては、ヒトコドン最適化(human codon optimize)したBlCas9を使用した。Cas9タンパク質のヒトコドン最適化は、当業者に周知の手法を用いて行うことができる。例えば、コドン最適化配列の例として国際公開第2014/093622号パンフレット(PCT/US2013/074667号明細書)のSaCas9ヒトコドン最適化配列を参照されたい。
 まず、ヒトコドン最適化した野生型BlCas9又はD1022N変異型BlCas9をコードする遺伝子と、ガイドRNAをコードする遺伝子とをベクターに組み込み、BlCas9タンパク質とガイドRNAとを哺乳動物細胞内で発現させるためのプラスミドを作製した。ガイドRNAは、実施例1と同一のものを用いた。次に、哺乳類細胞に、作製したプラスミドをトランスフェクションした。トランスフェクションの72時間後に、細胞からゲノムDNAを抽出し、次世代シーケンサーを用いて、ゲノムに導入された一塩基置換及びindel(挿入又は欠失)を検出した。また、対照として、SpCas9を用い、同様の実験を行った。結果を図18に示す。
 図18に示されるように、野生型BlCas9は、哺乳動物細胞において、PAM配列TTGGCAAを含む標的配列に対して、1塩基置換、及び挿入又は欠失の両方のタイプのゲノム編集を行うことができた。また、D1022N変異型BlCas9は、前記PAM配列の5番目の塩基が「G」であるPAM配列を特異的に認識し、野生型BlCas9同様に、1塩基置換、及び挿入又は欠失の両方のタイプのゲノム編集を行うことができた。本実施例の結果から、本発明のBlCas9タンパク質が哺乳動物細胞においても機能すること、及び、哺乳動物細胞においても、BlCas9タンパク質への変異の導入によるPAM配列の認識の改変が維持されていることが示された。
 本発明によれば、標的二本鎖ポリヌクレオチドへの結合力を保ちながら、PAM配列の認識が広範化されたCas9タンパク質を提供することができる。また、本発明によれば、ガイドRNA及び/又はDNA認識が向上されたCas9タンパク質を提供することができ、さらに、前記Cas9タンパク質を利用した、標的配列に特異的なゲノム編集技術及び遺伝子発現調節の簡便且つ迅速な方法を提供することができる。

Claims (17)

  1.  以下の(a)~(f)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
     (a)配列番号1で表されるアミノ酸配列、
     (b)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
     (c)配列番号1で表されるアミノ酸配列のアミノ酸番号100位以外の部位において、80%以上の同一性を有するアミノ酸配列、
     (d)配列番号2で表されるアミノ酸配列、
     (e)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
     (f)配列番号2で表されるアミノ酸配列のアミノ酸番号1022位以外の部位において、80%以上の同一性を有するアミノ酸配列
  2.  配列番号1で表されるアミノ酸配列のアミノ酸番号100位がAsnである、又は配列番号2で表されるアミノ酸配列のアミノ酸番号1022位がAsnであることを特徴とする、請求項1に記載のタンパク質。
  3.  以下の(g)~(i)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
     (g)配列番号13で表されるアミノ酸配列、
     (h)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
     (i)配列番号13で表されるアミノ酸配列のアミノ酸番号1025位以外の部位において、80%以上の同一性を有するアミノ酸配列
  4.  配列番号13で表されるアミノ酸配列のアミノ酸番号1025位がAlaであることを特徴とする、請求項3に記載のタンパク質。
  5.  以下の(j)~(l)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
     (j)配列番号5で表されるアミノ酸配列において、以下の(1)及び/又は(2)の置換を少なくとも一つ含むアミノ酸配列
     (1)アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
     (2)アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
     (k)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
     (l)(j)のアミノ酸配列の、前記(1)及び(2)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
  6.  配列番号5で表されるアミノ酸配列において、アミノ酸番号55位のSerのLysへの置換、及び/又はアミノ酸番号904位のGluのArgへの置換を含む、請求項5に記載のタンパク質。
  7.  以下の(m)~(o)のいずれか一つのアミノ酸配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができることを特徴とするタンパク質。
     (m)配列番号5で表されるアミノ酸配列において、以下の置換を少なくとも一つ含むアミノ酸配列
     ・アミノ酸番号1022位のAspの、Asn、Gln、又はHisへの置換、
     ・アミノ酸番号1025位のThrのAlaへの置換、
     ・アミノ酸番号52位のGluの、Lys、Arg、又はHisへの置換、55位のSerの、Lys、Arg、又はHisへの置換、843位のSerの、Asn、Gln、又はTyrへの置換、997位のLysの、Arg又はHisへの置換、1040位のLysの、Arg又はHisへの置換、959位のLysのAlaへの置換、992位のLysのAlaへの置換、及び904位のGluの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
     ・アミノ酸番号72位のHisの、Lys若しくはArgへの置換、93位のGlnの、Lys、Arg、又はHisへの置換、95位のGluの、Lys、Arg、又はHisへの置換、175位のHisの、Lys、又はArgへの置換、811位のThrの、Lys、Arg、又はHisへの置換、1075位のSerの、Lys、Arg、又はHisへの置換、及び1076位のAspの、Lys、Arg、又はHisへの置換から選択される少なくとも一つの置換、
     (n)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、1~数個のアミノ酸が欠失、挿入、置換若しくは付加されたアミノ酸配列、
     (o)(m)のアミノ酸配列の、(m)に規定するアミノ酸番号以外の部位において、80%以上の同一性を有するアミノ酸配列
  8.  配列番号5で表されるアミノ酸配列において、以下の置換の組合せのいずれか一つを含む、請求項7に記載のタンパク質。
    ・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、及びアミノ酸番号1022位のAspのAsnへの置換、
    ・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、アミノ酸番号1025位のThrのAlaへの置換、
    ・アミノ酸番号55位のSerのLysへの置換、アミノ酸番号904位のGluのArgへの置換、アミノ酸番号1022位のAspのAsnへの置換、及びアミノ酸番号1025位のThrのAlaへの置換
  9.  (d)~(o)のいずれかにおいて、前記アミノ酸配列が、以下の(3)の置換を含むことを特徴とする、請求項1~8のいずれか一項に記載のタンパク質。
     (3)アミノ酸番号8位のAspのAlaへの置換、503位のGluのAlaへの置換、584位のHisのAlaへの置換、598位のAsnのAlaへの置換、607位のAsnのAlaへの置換、及び725位のAspのAlaへの置換から選択される少なくとも一つの置換
  10.  請求項1~9のいずれか一項に記載のタンパク質をコードする遺伝子。
  11.  以下の(p)~(s)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子。
     (p)配列番号3又は4で表される塩基配列、
     (q)配列番号3又は4で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
     (r)配列番号3又は4で表される塩基配列と同一性が80%以上である塩基配列、
     (s)配列番号3又は4で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
  12.  以下の(t)~(w)のいずれか一つの塩基配列を含む配列からなり、且つ、標的特異的ガイドRNAと複合体を形成することができるタンパク質をコードすることを特徴とする遺伝子。
     (t)配列番号14で表される塩基配列、
     (u)配列番号14で表される塩基配列において、1~数個の塩基が欠失、挿入、置換又は付加されている塩基配列、
     (v)配列番号14で表される塩基配列と同一性が80%以上である塩基配列、
     (w)配列番号14で表される塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列
  13.  請求項1~9のいずれか一項に記載のタンパク質又は請求項10~12のいずれか一項に記載の遺伝子と、
     標的二本鎖ポリヌクレオチド中のPAM配列の1塩基上流から20塩基以上24塩基以下上流までの塩基配列に相補的な塩基配列からなるポリヌクレオチドを含むガイドRNAとを含む組成物。
  14.  標的二本鎖ポリヌクレオチドを部位特異的に切断するための方法であって、
     標的二本鎖ポリヌクレオチドと、請求項1~8のいずれか一項に記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
     前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出することを特徴とする、方法。
  15.  標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
     標的二本鎖ポリヌクレオチドと、請求項1~8のいずれか一項に記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
     前記タンパク質が、前記標的二本鎖ポリヌクレオチド中のPAM配列の上流に位置する切断部位で該標的二本鎖ポリヌクレオチドを切断して、平滑末端を作出し、
     前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法。
  16.  標的二本鎖ポリヌクレオチドを部位特異的に修飾するための方法であって、
     標的二本鎖ポリヌクレオチドと、請求項9に記載のタンパク質と、ガイドRNAとを接触させる工程を含み、
     前記タンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、ここで、前記タンパク質が、前記標的二本鎖ポリヌクレオチドを切断しないか又は一方の鎖のみを切断し、
     前記ガイドRNAと前記標的二本鎖ポリヌクレオチドの相補的結合によって決定される領域において、前記標的二本鎖ポリヌクレオチドが修飾されることを特徴とする、方法。
  17.  遺伝子の発現を調節するための方法であって、
     前記遺伝子に関連する標的二本鎖ポリヌクレオチドと、請求項9に記載のタンパク質と、ガイドRNAと、エフェクター分子とを接触させる工程を含み、
     前記タンパク質が、前記ガイドRNAを介して前記標的二本鎖ポリヌクレオチドに特異的に結合し、それにより前記エフェクター分子が前記標的二本鎖ポリヌクレオチドに特異的に作用することによって前記遺伝子の発現を調節することを特徴とする、方法。
PCT/JP2019/015321 2018-04-06 2019-04-08 エンジニアリングされたBlCas9ヌクレアーゼ WO2019194320A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020512343A JP7486189B2 (ja) 2018-04-06 2019-04-08 エンジニアリングされたBlCas9ヌクレアーゼ

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-074118 2018-04-06
JP2018074118 2018-04-06

Publications (1)

Publication Number Publication Date
WO2019194320A1 true WO2019194320A1 (ja) 2019-10-10

Family

ID=68100774

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/015321 WO2019194320A1 (ja) 2018-04-06 2019-04-08 エンジニアリングされたBlCas9ヌクレアーゼ

Country Status (2)

Country Link
JP (1) JP7486189B2 (ja)
WO (1) WO2019194320A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022045169A1 (ja) * 2020-08-25 2022-03-03 国立大学法人東京大学 エンジニアリングされたCjCas9タンパク質

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016186953A1 (en) * 2015-05-15 2016-11-24 Pioneer Hi Bred International Inc Guide rna/cas endonuclease systems
WO2017010543A1 (ja) * 2015-07-14 2017-01-19 国立大学法人東京大学 改変されたFnCas9タンパク質及びその使用
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017161068A1 (en) * 2016-03-18 2017-09-21 President And Fellows Of Harvard College Mutant cas proteins
JP2018506987A (ja) * 2015-03-03 2018-03-15 ザ ジェネラル ホスピタル コーポレイション 変更PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼ
WO2018221685A1 (ja) * 2017-05-31 2018-12-06 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途
WO2019026976A1 (ja) * 2017-08-01 2019-02-07 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途
WO2019049913A1 (ja) * 2017-09-05 2019-03-14 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018506987A (ja) * 2015-03-03 2018-03-15 ザ ジェネラル ホスピタル コーポレイション 変更PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼ
WO2016186953A1 (en) * 2015-05-15 2016-11-24 Pioneer Hi Bred International Inc Guide rna/cas endonuclease systems
WO2017010543A1 (ja) * 2015-07-14 2017-01-19 国立大学法人東京大学 改変されたFnCas9タンパク質及びその使用
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017161068A1 (en) * 2016-03-18 2017-09-21 President And Fellows Of Harvard College Mutant cas proteins
WO2018221685A1 (ja) * 2017-05-31 2018-12-06 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途
WO2019026976A1 (ja) * 2017-08-01 2019-02-07 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途
WO2019049913A1 (ja) * 2017-09-05 2019-03-14 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KARVELIS, T. ET AL.: "Rapid characterization of CRISPR-Cas9 protospacer adjacent motif sequence elements", GENOME BIOL., vol. 16, no. 1, 2015, pages 253, XP055551291, ISSN: 1474-7596, DOI: 10.1186/s13059-015-0818-7 *
NAKANE, TOSHIHIKO ET AL.: "Crystal structure of Cas9 derived from B. laterosporus", COLLECTED ABSTRACT, OF THE 2017 OF ANNUAL MEETING OF THE CRYSTALLOGRAPHIC SOCIETY OF JAPAN, 2017, pages 46 *
SPENCER, JM. ET AL.: "Characterizing the Mutational Limits of S. pyogenes Cas9", MOL. THER., vol. 25, no. 5, May 2017 (2017-05-01), ISSN: 1525-0016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022045169A1 (ja) * 2020-08-25 2022-03-03 国立大学法人東京大学 エンジニアリングされたCjCas9タンパク質

Also Published As

Publication number Publication date
JPWO2019194320A1 (ja) 2021-04-08
JP7486189B2 (ja) 2024-05-17

Similar Documents

Publication Publication Date Title
US20240132877A1 (en) Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
JP6780860B2 (ja) 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
JP6628387B2 (ja) 改変されたCas9タンパク質及びその用途
CN118416088A (zh) 经由抑制性tRNAs和脱氨酶对突变进行RNA靶向
CA3009727A1 (en) Compositions and methods for the treatment of hemoglobinopathies
AU2015330699A1 (en) Compositions and methods for promoting homology directed repair
CN107922949A (zh) 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
JP7001272B2 (ja) ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体
JP7138712B2 (ja) ゲノム編集のためのシステム及び方法
WO2022092317A1 (ja) エンジニアリングされたCas12fタンパク質
KR20180074610A (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
WO2017010543A1 (ja) 改変されたFnCas9タンパク質及びその使用
WO2019194320A1 (ja) エンジニアリングされたBlCas9ヌクレアーゼ
KR102151064B1 (ko) 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
JP7133856B2 (ja) 細胞内在性のdna修飾酵素を利用して標的化したdnaの核酸塩基を特異的に変換する、細胞の核酸配列の変換方法、及びそれに用いる分子複合体
WO2019122302A1 (en) Nucleic acid sequence replacement by nhej
WO2022045169A1 (ja) エンジニアリングされたCjCas9タンパク質
KR20220039564A (ko) 신규의 개량된 염기 편집 또는 교정용 융합단백질 및 이의 용도
CN116836962B (zh) 工程化的腺苷脱氨酶及碱基编辑器
WO2019026976A1 (ja) 改変されたCas9タンパク質及びその用途
US12123016B1 (en) Nucleases and compositions, systems, and methods thereof
KR20230016751A (ko) 염기 편집기 및 이의 용도
WO2024026478A1 (en) Compositions and methods for treating a congenital eye disease

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19781216

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020512343

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19781216

Country of ref document: EP

Kind code of ref document: A1