[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2019193205A1 - Chimeric protein having photoactivatable recombinase activity - Google Patents

Chimeric protein having photoactivatable recombinase activity Download PDF

Info

Publication number
WO2019193205A1
WO2019193205A1 PCT/EP2019/058829 EP2019058829W WO2019193205A1 WO 2019193205 A1 WO2019193205 A1 WO 2019193205A1 EP 2019058829 W EP2019058829 W EP 2019058829W WO 2019193205 A1 WO2019193205 A1 WO 2019193205A1
Authority
WO
WIPO (PCT)
Prior art keywords
domain
fusion protein
recombinase
seq
cre
Prior art date
Application number
PCT/EP2019/058829
Other languages
French (fr)
Inventor
Gaël YVERT
Hélène DUPLUS
Martin SPICHTY
Original Assignee
Centre National De La Recherche Scientifique
Ecole Normale Superieure De Lyon
Universite Claude Bernard Lyon 1
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National De La Recherche Scientifique, Ecole Normale Superieure De Lyon, Universite Claude Bernard Lyon 1 filed Critical Centre National De La Recherche Scientifique
Publication of WO2019193205A1 publication Critical patent/WO2019193205A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)

Definitions

  • the present invention relates to a chimeric protein whose recombinase activity is photoinducible. It also relates to the use of such a protein for controlling, via light exposure, recombination events in a host cell or in vitro.
  • the CRE recombinase is very widely used in various prokaryotic and eukaryotic models as a tool for handling DNA in vitro and in vivo.
  • This recombinase is derived from bacteriophage P1 and catalyzes the recombination reaction between two specific LoxP sites.
  • the LoxP site 34 base pairs long, comprises at its ends two palindromic regions of 13 base pairs each called RBE (Recombinase Binding Element) which surround an oriented region of 8 base pairs, which determines the direction of the LoxP site.
  • the recombinase causes irreversible excision of the region between the two sites.
  • the recombinase induces the reversible inversion of the sequence lying between the two sites.
  • LoxP sites are first integrated on either side of an allele of the gene of interest by homologous recombination in embryonic stem cells. These cells are then injected into a mouse blastocyst to obtain a cell line that will be crossed with another line of transgenic mice expressing CRE recombinase under the control of a tissue-specific promoter. The Animals from this cross are "doubly" transgenic and present the desired mutation only in the target tissue. These animals are called “mosaics” in the sense that their genetic inheritance is not unitary and differs according to the cells (Babinet and Cohen-Tannoudji, 2000, Med Sci (Paris), 16, 1, 31-42).
  • the conditional activation of the CRE-LoxP system has also been used in yeast, and in particular S. cerevisae (Sauer, 1987, Mol Cell Biol 7, 2087-2096).
  • the gene coding for the CRE recombinase was placed under the control of the GAL1 promoter whose activity is repressed in the presence of glucose and stimulated in the presence of galactose. It has been demonstrated that the addition of galactose in the culture medium induces the excision of the target gene LEU2 flanked by two LoxP sites of the same orientation and previously integrated into the genome.
  • the kinetics of leucine auxotrophy show that CRE recombinase activity in yeast begins after eight hours of galactose induction to be maximal after 24 hours. This kinetics has been improved by performing a pre-culture in the presence of raffinose.
  • CRE recombinase whose activity is ligand-dependent (Metzger et al., 1995, Proc Natl Acad Sci 92, 6991). -6995).
  • This enzyme is obtained by fusion of the gene coding for the CRE recombinase with a cDNA of the ligand binding domain (LBD) of the steroid hormone receptors and in particular of the human estrogen receptor (hER).
  • LBD ligand binding domain
  • hER human estrogen receptor
  • the CRE recombinase is not or only slightly active.
  • the chimeric protein undergoes a conformational change and exhibits CRE recombinase activity.
  • This system has been improved by introducing different mutations in the LBD domain in order to replace the natural hormones with an artificial steroid, tamoxifen, and / or to increase the specificity and activation efficiency (Indra et al., 1999, Nucleic Acids Res 27, 4324- 4327, Metzger and Chambon, 2001, Methods 24, 71-80).
  • the activity of the CRE-LoxP system can also be controlled by temperature.
  • a "heat shock element” HSE
  • the HSE-CRE system can thus be activated by thermal shock (39 ° C for two hours).
  • the response obtained however, varies according to the different cell types and according to the stage of development during which the thermal shock has occurred.
  • One of these systems is an adaptation of the CRE-ER system made locally photo-activatable by G using a photo-chemical inductor, cyclofen-OH.
  • This substrate whose structure is close to tamoxifen-OH, is surrounded by labile photo groups.
  • the ligand released from these groups can bind to the ER receptor and thereby activate the CRE recombinase.
  • This system has been used in fish (Sinha et al., 2010, Zebrafish, 7, 199-204, Sinha et al., 2010, ChemBioChem 11, 653-663) and in mice (Lu et al., 2012, Bioconjug, Chem 23, 1945-1951).
  • the spatial and temporal control of this activation is, however, particularly complex in that it requires controlling the quality, the quantity and the diffusion of the photoactivatable ligand.
  • the light inducible Light On gene expression system was used to control the expression of CRE recombinase (Wang et al., 2012, Nat Methods 9, 266-269).
  • This system is based on the use of a transactivator which, under the action of light, binds to a transcriptional promoter and activates it.
  • this system has the disadvantage of requiring very long illumination periods (of the order of 22 hours).
  • Cre-LoxP system Another photo-activatable Cre-LoxP system has also been described by Kawano et al. (Nat Chem Biol 2016 Dec 12 (12): 1059-1064). This system uses two fusion proteins, each comprising a fragment of CRE recombinase fused to a switch photo called "Magnet". The illumination of the system causes the dimerization of the "Magnets” and the association of the fragments of the CRE recombinase which thus becomes active.
  • Cre-LoxP A similar system of photoactivatable Cre-LoxP has been described by Taslimi et al. (Nat Chem Biol 2016 June, l2 (6): 425-430).
  • This system also uses two fusion proteins, each comprising a fragment of CRE recombinase fused to a photosensitive dimerization domain called CRY2-CIB.
  • the illumination of the system causes the dimerization of the two chimeric proteins and the association of the fragments of the CRE recombinase which thus becomes active.
  • Cre-LoxP Another photoactivatable Cre-LoxP system has been described in human cells by Zhang et al. (Nature Methods, 2017 l4 (4): 39l-394).
  • This system uses a protein domain called PhoCl which is cleaved upon photoactivation, as well as a ligand binding domain of steroid hormone receptors (SR).
  • SR steroid hormone receptors
  • Protein The described chimeric SR-PhoCl-Cre-PhoCl-SR is inactive due to the SR domains that recruit the Hsp90 inhibitory protein from the host cell. After illumination, the double cleavage of the protein releases the SR domains and thus lifts the inhibition imposed by Hsp90.
  • the object of the present invention is to provide a recombinase system whose use would be simple and inexpensive to be adapted for industrial use, while ensuring a precise temporal and spatial control of recombinase activity.
  • the inventors have developed a photoactivatable recombinase.
  • the recombinase according to the invention is directly activated by light, thus considerably simplifying the process. .
  • the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain and wherein the recombinase activity is photoactivatable.
  • the recombinase domain is fused at the N-terminal to the photoreceptor domain.
  • the photoreceptor domain comprises, or consists of, a domain
  • the photoreceptor domain may be a derivative of a LOV2 domain, preferably an iLID (enhanced light inducing dimer) domain, and more particularly preferably an iLID domain derived from the LOV2 domain of phototropin 1 to Avenu sativa.
  • the photoreceptor domain of the fusion protein is a iLID domain having the sequence SEQ ID NO: 13 wherein X is one to three amino acids, preferably X is A, D, K, L, IL, VV, AI or QPG.
  • the recombinase domain is preferably selected from the group consisting of CRE recombinase (SEQ ID NO: 1), and functional variants thereof.
  • the recombinase domain may be a functional variant of the CRE recombinase comprising or consisting of the sequence SEQ ID NO: 2, or a sequence having at least 80% sequence identity with SEQ ID NO: 2.
  • the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted. N-terminal, and optionally having a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1
  • the present invention also relates to a nucleic acid encoding a fusion protein according to the invention, an expression cassette comprising a nucleic acid according to the invention, an expression vector comprising a nucleic acid according to the invention or a cassette of expression according to the invention, a host cell comprising a nucleic acid, an expression cassette or an expression vector according to the invention.
  • the present invention also relates to a method for inducing recombinase activity in a cell comprising
  • the present invention also relates to a method for modifying a nucleic acid, comprising
  • a fusion protein according to the invention contacting a fusion protein according to the invention with said nucleic acid of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and exposing the fusion protein and said nucleic acid to a light capable of activating the photoreceptor domain of said fusion protein and thus the recombinase activity.
  • This method can in particular be used to modulate the expression of a molecule of interest in the host cell, to induce genetic diversity in the host cell or to modify a biological activity in the context of a gene therapy.
  • the present invention further relates to a kit comprising a fusion protein, a nucleic acid, an expression cassette, an expression vector and / or a host cell according to the invention, and optionally a light source capable of activating the photoreceptor domain of the fusion protein. It also relates to the use of said kit for inducing recombinase activity in a cell according to the method according to the invention and / or for modifying one or more nucleic acids according to the process according to the invention.
  • Figure 1 Reporter system for detecting and quantifying CRE recombinase activity in yeast cells.
  • the left part represents the genetic construction of the system.
  • the right side represents the phenotype of a yeast cell carrying this construct.
  • Figure 2 Representation of CRE recombinase activity test results.
  • A) The histogram shows data produced by flow cytometry. Abscissa: intensity of the FL1-H signal corresponding to the GFP fluorescence. Ordinate: number of cells with this signal strength. The data is analyzed to determine a GFP signal threshold for separating the OFF (low signal) cells of the ON (high signal) cells.
  • B) The recombination efficiency is the proportion of ON cells in a population of cells having expressed the tested protein.
  • Figure 5 Diagram of the construction of iLID-CRE fusions by homologous recombination.
  • Cre / AA coding sequence of the or a portion of the Cre protein or Cre_A340A341 variant.
  • TRP1 S. cerevisiae gene allowing auxotrophic selection of transformed yeasts.
  • Black arrows oligonucleotides (primers) used for amplification.
  • Star mutation possibly carried on the upstream oligonucleotide.
  • PromGAL1 promoter of the S. cerevisiae GAL1 gene for inducing or repressing the expression of the protein of interest.
  • Figure 6 The iLID-Crel9, iLID-Cre27, iLID-Cre32 and iLID-CreAA20 fusions have increased CRE activity after light stimulation.
  • Blue (light): after illumination of cells at 460 nm of 36.3 mW / cm 2 for 30 minutes. Error bars: standard deviation, n 5.
  • Figure 8 Effects of different conditions of illumination of the fusion protein iLID_Cre32 in the context of an expression controlled by the promoter GAL1 (A) or by the promoter MET17 (B).
  • Black without illumination.
  • Blue including an illumination at 460nm during the indicated time (30, 60 or 90) minutes and different intensities: 10, 20, 50, 100 respectively corresponding to 2.2, 5.1, 17.9 and 36.3 mW / cm2.
  • Figure 9 Effects of different conditions of illumination of the fusion protein iLID_CreAA20 in the context of an expression controlled by the promoter MET17.
  • the inventors have designed a chimeric protein endowed with a directly photoactivatable recombinase activity. To do this, they fused a recombinase domain to a photoreceptor domain and demonstrated that activation by light of the photoreceptor domain made it possible to activate the recombinase domain.
  • the recombinase activity of this protein is therefore directly dependent on exposure to light. In the absence of light, the fusion protein according to the invention has little or no recombinase activity. On the other hand, the inventors have demonstrated that a short exposure to light of this protein makes it possible to strongly induce this activity.
  • the fusion protein developed by the inventors thus constitutes a simple and effective genetic tool for carrying out DNA modifications in vivo or in vitro under the impulse of a simple light stimulation.
  • the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain.
  • peptide oligopeptide
  • polypeptide polypeptide
  • protein protein
  • the amino acids are here represented by their one-letter or three-letter code according to the following nomenclature: A: alanine (Ala); C: cysteine (Cys); D: aspartic acid (Asp); E: glutamic acid (Glu); F: phenylalanine (Phe); G: glycine (Gly); H: histidine (His); I: isoleucine (Ile); K: lysine (Lys); L: leucine (Leu); M: methionine (Met); N: asparagine (Asn); P: proline (Pro); Q: glutamine (Gln); R: arginine (Arg); S: serine (Ser); T: threonine (Thr); V: valine (Val); W: tryptophan (Trp) and Y: tyrosine (Tyr).
  • the amino acids constituting the fusion protein according to the invention may be of L or D configuration, preferably of L configuration.
  • fusion protein refers to an artificial protein comprising at least two fused protein domains in a single molecule, it being understood that these two domains are never associated in a natural protein.
  • Each of the domains of this protein may be a natural domain, i.e., a natural protein or a fragment thereof, or a synthetic domain, i.e. a Protein domain does not exist in nature or in a natural protein.
  • the fusion protein is most often the product of a fusion gene in which the coding sequences of the different domains are in phase.
  • the fusion protein according to the invention may have one or more post-translational modifications and / or one or more chemical modifications such as glycosylations, amidations, acylations, acetylations, ubiquitinations, phosphorylations or methylations.
  • protective groups may be added to the C- and / or N-terminal ends.
  • the protecting group at the N-terminus may be acylation or acetylation and the protective group at the C-terminus may be amidation or esterification.
  • the fusion protein may comprise, in addition to the recombinase domain fused to a photoreceptor domain, an additional N-terminal or C-terminal, preferably C-terminal, peptide domain.
  • This additional domain is preferably fused to the recombinase domain of the fusion protein.
  • the additional domain may be a tag (or tag) useful for purification or immobilization of the fusion protein.
  • tags are well known to those skilled in the art and include, for example, the tags histidine (His 6 ), FLAG, HA (epitope derived from the hemagglutinin of the influenza virus), MYC (epitope derived from the proto-oncoprotein MYC) or GST (glutathione-S-transferase).
  • the fusion protein may comprise a protease cleavage site or a chemical agent to suppress this additional domain.
  • the fusion protein does not comprise any additional N-terminal sequence or domain of the photoreceptor or C-terminal domain of the recombinase domain.
  • the recombinase domain of the fusion protein according to the invention may be any protein domain exhibiting recombinase activity. It is understood that the recombinase activity does not require any hetero-dimerization with another domain or another protein. It is intrinsic to the recombinase domain and can easily be tested by any technique known to those skilled in the art (see, for example, one of the techniques described below) applied to the recombinase domain alone (not fused to the photoreceptor domain).
  • recombinase refers to a site-specific recombinase DNA, i.e. a recombinase DNA that recognizes and binds to specific target regions, or recognition sites, of the DNA and catalyzes a recombination reaction between the nucleic acids of these sites.
  • the recognition sites are generally short (about 30 to 40 nucleotides) sequences that are specific for each recombinase.
  • These enzymes exhibit both an endonuclease activity and a ligase activity and catalyze (i) the deletion of a DNA fragment flanked by two compatible recognition sites and in the same orientation and / or (ii) the inversion of a DNA fragment flanked by two compatible recognition sites and in opposite orientations and / or (iii) the intra- or intermolecular translocation of a DNA fragment flanked from one recognition site to another compatible recognition site .
  • the recombinase activity of a protein can be evaluated by any method known to those skilled in the art, in particular by the method described in the experimental part of this document or by one of the many tests described in the literature such as, for example the appearance or the disappearance of a signal relating the presence or the integrity of a nucleic acid targeted by the recombinase, such as a DNA molecule comprising on the one hand a coding sequence for a reporter protein such as beta -galactosidase, GLP (Green Lluorescent Protein), luciferase or mCherry fluorescent protein, and secondly one or more recombinase recognition sites, and whose recombinase rearrangement affects the expression of the reporter protein ( disappearance or appearance of the signal).
  • a signal relating the presence or the integrity of a nucleic acid targeted by the recombinase
  • a DNA molecule comprising on the one hand a coding sequence for a reporter protein
  • the recombinase domain may be a recombinase protein or a functional variant thereof.
  • recombinases have been described in the literature and are useful in the present invention.
  • examples of recombinases include, but are not limited to, phage P1 CRE recombinase, Saccharomyces cerevisiae PLP recombinase, Zygosaccharomyces rouxii R recombinase, Salmonella HIN recombinase, Kluyveromyces drosophilarium recombinase A or Kluyveromyces waltii, int integrase, the Mu phage GIN recombinase, the PhiC3l integrase, the Tn3 resolvase, TRE recombinase, DRE recombinase (Anastassiadis et al., Disease Models & Mechanisms 2009 2: 508-515), and prokaryotic beta-recombinase.
  • the recombinase protein is selected from the group consisting of CRE recombinase and FLP recombinase.
  • the FLP recombinase is an enzyme derived from the Saccharomyces cerevisiae 2-micron plasmid and catalyzes the recombination reaction between two specific FRT sites.
  • the FRT sites consist of an asymmetric 8 bp sequence framed by two 13 bp palindromic arms. There are many variations / mutants of the FRT and LoxP sites.
  • the recombinase protein is CRE recombinase.
  • the recombinase CRE (Uniprot: P06956, NCBI GenelD: 2777477) is a tyrosine recombinase derived from the bacteriophage P1 whose sequence is presented in SEQ ID NO: 1. As mentioned above, this enzyme catalyzes the recombination reaction between two specific LoxP sites.
  • the term "functional variant” refers to a protein whose sequence differs from the parent protein by at least one substitution, insertion or deletion but which retains recombinase activity.
  • recombinase protein variants have been described in the literature, in particular variants of CRE and FLP recombinases, and are useful in the present invention. These variants may be natural or synthetic and have recombinase activity as defined above.
  • thermostability see, for example, the thermostable variants of the FLP recombinase described in the articles by Buchholz et al., 1998, Nat Biotechnol 16, 657-662 and Raymond and Soriano, 2007, PLoS ONE 2, el62
  • increased precision see, for example, the variants of the CRE recombinase described in application WO 2014/158593
  • improved expression in mammalian cells see, for example, the variants of CRE recombinase described in US Patent 6,734,295).
  • the functional variants have at least 80% sequence identity with the parent recombinase protein, more preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with the parent recombinase protein.
  • sequence identity refers to the number (%) of matches (identical amino acid residues) at the positions arising from an alignment of two polypeptide sequences. Sequence identity is determined by comparing sequences when aligned to maximize overlap and identity while minimizing sequence interruptions. In particular, the sequence identity can be determined using any of the many global or local alignment algorithms, depending on the length of the two sequences. Sequences of similar lengths are preferably aligned using global alignment algorithms (eg Needleman & Wunsch, J.
  • the functional variants of a recombinase differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 substitutions, insertions and / or deletions of amino acids, preferably 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 substitutions and / or deletions of amino acids.
  • the functional variants of a recombinase may differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 at 10 or 1-5 amino acid substitutions, preferably with 1 or 2 amino acid substitutions.
  • substitution as used herein with respect to a position or an amino acid means that the amino acid in the particular position has been replaced by another amino acid or amino acid different from that of the wild-type protein is present.
  • substitution may refer to the replacement of an amino acid residue by another one of the 20 natural standard amino acid residues, the rare natural amino acid residues (eg hydroxyproline, hydroxylysine, allohydroxylysine, 6 N-methyllysine, N-ethylglycine, N-methylglycine, N-ethylasparagine, allo-isoleucine, N-methylisoleucine, N-methylvaline, pyroglutamine, aminobutyric acid, omithine) and unnatural amino acids (eg norleucine, norvaline and cyclohexyl-alanine).
  • the rare natural amino acid residues eg hydroxyproline, hydroxylysine, allohydroxylysine, 6 N-methyllysine, N-ethylglycine,
  • substitution refers to the replacement of one amino acid residue with another selected from the 20 standard natural amino acid residues (G, P, A, V, L, I, M, C , F, Y, W, H, K, R, Q, N, E, D, S and T).
  • G, P, A, V, L, I, M, C , F, Y, W, H, K, R, Q, N, E, D, S and T the following terminology is used to denote a substitution: D341A indicates that the amino acid residue at position 341 of SEQ ID NO: 1 (aspartic acid, D) is changed to alanine (A).
  • substitution (s) may be conservative or non-conservative substitutions.
  • conservative substitution refers to a substitution of one amino acid residue for another that has similar chemical or physical properties (size, charge, or polarity). Examples of conservative substitutions are among (i) basic amino acids (arginine, lysine and histidine), (ii) acidic amino acids (glutamic acid and aspartic acid), (iii) polar amino acids (glutamine and asparagine or serine, threonine and tyrosine), (iv) hydrophobic amino acids (methionine, leucine, isoleucine and valine), (v) aromatic amino acids (phenylalanine, tryptophan) and (vi) small amino acids (glycine, alanine).
  • the functional variant is obtained by deleting N-ter and / or C-ter residues of a recombinase to obtain a fragment comprising at least 100, 150, 200, 250 or 300 contiguous amino acids. of said recombinase, while retaining recombinase activity.
  • the fragment is obtained by deletion of 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 amino acids in N-terminal and / or C-terminal of a recombinase protein. .
  • the number of amino acids that can be deleted without affecting recombinase activity depends on the nature of the protein and can be readily determined by those skilled in the art using routine techniques.
  • the recombinase domain is the CRE recombinase or a functional variant thereof.
  • the functional variant may be any variant of the CRE recombinase known to those skilled in the art and described in the literature such as, for example, the variants described in the article by Santoro and Schultz (Proc Natl Acad Sci US A, 2002 Apr 2; 99 (7): 4185-90), in WO 2014/158593, in US 6,734,295, and in the article by Frank Buchholz and A. Francis Stewart (Nature Biotechnology 2001 19: 1047-1052).
  • the functional variant of the CRE recombinase has a sequence having at least 80% sequence identity with SEQ ID NO: 1, preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with SEQ ID NO: 1.
  • the inventors have here demonstrated that the CRE recombinase retains its activity after deletion of 31 residues in N-ter and / or 3 residues in C-ter.
  • the functional variant of the CRE recombinase may comprise, or consist of,
  • the functional variant of the CRE recombinase may also comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which at most 31 successive amino acids have been deleted at the N-terminal and / or at most 3 successive amino acids have been deleted. deleted in C-terminal.
  • the functional variant of the CRE recombinase may comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 successive amino acids have been deleted at the N-terminal.
  • the functional variant of the CRE recombinase may have a substitution at the residue corresponding to the E340 residue of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO.
  • the residues of the variant corresponding to residues E340 and D341 of SEQ ID NO: 1 are readily identified by those skilled in the art by means of a sequence alignment algorithm.
  • substitution residue or residues are independently selected from the group consisting of A, G, V, L, I, P, M, W, C, N, Q, S, T and Y.
  • residue or residues are substituted with an alanine residue.
  • the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted. N-terminal, and optionally having a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1.
  • the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 19 or 31 amino acids have been deleted at the N-terminal, and exhibiting optionally a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1
  • the recombinase domain is
  • the photoreceptor domain of the fusion protein according to the invention is a domain obtained from a photoreceptor protein and which has the property of changing conformation when exposed to light.
  • the domain The photoreceptor is sensitive to blue light, a light having a wavelength between 400 and 500 nm.
  • Photoreceptor proteins are light-sensitive proteins involved in the perception and response to light of a wide variety of organisms. These light sensors have a photoreceptor domain that reacts and triggers a signal transduction cascade. Photoreceptors generally require the presence of co-factors that capture photons, such as flavin adenine dinucleotide (FAD) or flavin mononucleotide (FMN).
  • FAD flavin adenine dinucleotide
  • FMN flavin mononucleotide
  • the photoreceptor domain of the fusion protein according to the invention can be obtained from any photoreceptor protein known to those skilled in the art such as rhodopsin, melanopsin, photopsin, protein kinase C, cryptochrome photolyases 1 and 2 , phototropins, phytochrome, photoconvertible fluorescent proteins, proteins containing a PAS domain (Per-ARNT-Sim) as described in Taylor, IB Zhulin, Microbiol. Mol. Biol. Rev. 63, 479 (1999) or BLUF domain-containing proteins as described in Wu, Q., and Gardner, K.H. (2009) Biochemistry (Mosc.) 48, 2620-2629.
  • the photoreceptor domain of the fusion protein is an LOV (Light Oxygen Voltage) domain.
  • LOV domains belong to the superfamily of PAS domains and are flavin-dependent photoreceptors.
  • the photoreceptor domain of the fusion protein according to the invention comprises, or consists of, a LOV domain of a phototropin, or a variant or derivative thereof.
  • Phototropins are plant photoreceptors that have two LOV domains and one Ser / Thr kinase domain.
  • the photoreceptor domain may be chosen from the LOV domains of Avena Sativa phototropins (UNIPROT Gene ID: 049003), Arabidopsis thaliana (Gene ID: 823721 and 835926), Neurospora crassa (GenBank ID: AAK08514.1), Brucella mellitus or Chlamydomonas reinhardtii (Zoltowski, BD, Vaccaro, B., and Skull, BR (2009) Nat Chem Biol., 5, 827-834).
  • the photoreceptor domain is an LOV domain of phototropin d vena sativa, in particular the LOV1 or LOV2 domain of phototropin 1 d vena sativa, and more particularly preferably the LOV2 domain of phototropin 1 of Avena sativa.
  • Avenu sativa LOV2 domain (asLOV2) consists of 143 amino acids (SEQ ID NO: 14) (residues 404 to 546 of phototropin 1, Genbank ID: AAC05083) and binds to FMN (Flavin MonoNucleotide).
  • the asLOV2 structure reveals a PAS domain consisting of 2 b-strands (A and B) and 3 a-helices (C, D and E), supplemented by a helical connector Fa and 3 sheets b (G, H, I).
  • the 5 strands b form a twisted antiparallel sheet b which with the loop Fa and the propellers allow the insertion of FMN.
  • the structure of this photoreceptor shows a peculiarity at its C-terminal end, a helix Ja of about twenty amino acids as well as an A'a helix at the N-terminus (Halavaty and Moffat, 2007, Biochemistry (Mosc.
  • the photoreceptor domain may also be a functional variant of an LOV phototropin domain, particularly an asLOV2 domain variant.
  • the variant retains the capacity of the LOV domain to change conformation in response to light stimulation and has at least 80% sequence identity with the parent LOV domain, more preferably at least 85%, 90%, 91% , 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with the parent LOV domain.
  • the ability of the variant to change conformation in response to light stimulation can be easily tested by any technique known to those skilled in the art such as, for example, the asLOV2-SsrA binding assay to SspB described in the Lungu et al. 2012, Chem. Biol. 19, 507-517.
  • the photoreceptor domain is a derivative of a LOV domain, preferably a derivative of the asLOV2 domain. Compared with parent LOV domains, these derivatives generally exhibit increased light reactivity, increased expression by the host cell, or different stability.
  • LOV domain derivatives and in particular the asLOV2 domain, have been described in the literature. Such derivatives include, but are not limited to, the LOV-SsrA domain in which the bacterial SsrA peptide has been incorporated into the C-terminal helix of asLOV2 (Lungu et al., 2012, Chem Biol., 19, 507-517). ), the iLID domain (Improved Light Induced Dimer) (Guntas et al., 2015, Proc Natl Acad Sci 112, 112-117), mutants G528A and N358E as described in Strickland et al. Nature Methods (2010), 7 (8) 623-626, and the mutants described in the article by Kawano et al. PLoS One 2013 8 (12): e82693 such as V416T or V416L.
  • LOV-SsrA domain in which the bacterial SsrA peptide has been incorporated into the C-termin
  • the photoreceptor domain of the fusion protein is an iLID domain comprising, or consisting of, the following sequence: : 13), wherein X represents one or more amino acids.
  • X can be any amino acid sequence adopting an alpha helical conformation.
  • X represents one to 10 amino acids, more preferably one to 9, 8, 7, 6, 5 or 4 amino acids, and more preferably one to three amino acids.
  • X is chosen from the group consisting of
  • amino acid chosen from A, D, K and L,
  • X is selected from the group consisting of IL and AI.
  • the photoreceptor domain of the fusion protein may be fused to the N-terminal or C-terminal domain of the recombinase domain.
  • the photoreceptor domain of the fusion protein is fused to the N-terminal of the recombinase domain.
  • the two domains can be immediately adjacent or separated by one or more link sequences.
  • the domains are separated by up to 10 amino acids, preferably at most 6, 5, 4, 3, 2 or 1 amino acids.
  • the binding sequence (s) between the two domains do not comprise a cleavage sequence recognized by a protease, in particular of a sequence recognized by a TEV protease. More particularly preferably, the two domains are directly adjacent, that is to say without a link sequence between them.
  • the fusion protein according to the invention comprises, or consists of, a sequence chosen from the sequences SEQ ID NO: 5 to 12.
  • the fusion protein according to the invention has a photoactivatable recombinase activity. This means that activation of the photoreceptor domain induces activation or enhancement of recombinase domain activity.
  • Activation of the photoreceptor domain is achieved by exposure to a light whose wavelength may vary depending on the nature of the photoreceptor.
  • the photoreceptor domain is preferably sensitive to blue light, ie a light having a wavelength of between 400 nm and 500 nm, preferably a light having a wavelength of between 440 nm and 480 nm.
  • the duration of exposure to light and the light intensity can be easily determined by those skilled in the art.
  • the fusion protein can be exposed to a light intensity of between 0.05 mW / cm 2 and 50 mW / cm 2 , preferably between 1.5 mW / cm 2 and 40 mW / cm 2 , and more particularly preferably between 15 mW / cm 2 and 40 mW / cm 2 .
  • the fusion protein is exposed to a luminous intensity of between 2 mW / cm 2 and 40 mW / cm 2 , preferably between 2 mW / cm 2 and 10 mW / cm 2 .
  • the duration of exposure to light is between 2 minutes and three hours, preferably between 10 minutes and three hours, more preferably between 30 minutes and two hours. Most preferably, the exposure time is between 30 minutes and 90 minutes.
  • the recombinase activity of the fusion protein is induced by an exposure of 10 minutes to three hours, preferably from 30 minutes to two hours, to a blue light with an intensity of between 2 mW / cm. 2 and 40 mW / cm 2 , preferably between 2 mW / cm 2 and 10 mW / cm 2 .
  • the recombinase activity of the fusion protein is induced by an exposure of 2 minutes to two hours, preferably from 30 minutes to 90 minutes, to a blue light of an intensity between 1.5 mW / cm 2 and 40 mW / cm 2 , preferably between 15 mW / cm 2 and 40 mW / cm 2 .
  • the term "photoactivatable” preferably means that exposing the fusion protein according to the invention to light achieves a minimum 15% increase in recombinase activity, preferably an increase in at least 25% of the recombinase activity, and more preferably at least 30%, 40% or 50% increase in recombinase activity, relative to the level without light exposure. More preferably, the exposure of the fusion protein according to the invention to a blue light of an intensity of about 2 mW / cm 2 for 90 min allows to obtain an increase of at least 50% of recombinase activity, relative to the level without light exposure.
  • the exposure of the fusion protein according to the invention to a blue light of an intensity of between 30 mW / cm 2 and 40 mW / cm 2 for 30 min makes it possible to obtain an increase of at least 50% of recombinase activity, relative to the level without light exposure.
  • the present invention also relates to a solid support on which is immobilized a fusion protein according to the invention. It also relates to a process for preparing such a solid support comprising providing a fusion protein according to the invention and a suitable solid support, and immobilizing said protein on said support.
  • the immobilization means are well known to those skilled in the art (see, for example, "Enzyme Technology” by Martin Chaplin and Christopher Bucke, Cambridge University Press, 1990).
  • the fusion protein according to the invention may be immobilized on the solid support by any suitable means such as a covalent or non-covalent bond.
  • a wide variety of materials can be used as an immobilizer. These materials are generally inert polymeric or inorganic matrices.
  • the support may for example be membrane, particulate (e.g., beads, nanobeads, microbeads) or fibrous.
  • carriers include, but are not limited to, polyurethane matrices, activated sepharose, alginate, Amberlite, Sephadex or Duolite resins, acrylic resins, polystyrene resins or macroreticulated resins.
  • the present invention also relates to a nucleic acid encoding a fusion protein according to the invention.
  • the nucleic acid can be DNA (cDNA or gDNA), RNA or a mixture of both. It may be in single-stranded or duplex form or a mixture of both. It may comprise modified nucleotides, comprising, for example, a modified linkage, a modified purine or pyrimidine base, or a modified sugar. It can be prepared by any method known to those skilled in the art, such as chemical synthesis, recombination and mutagenesis.
  • the nucleic acid according to the invention can be deduced from the sequence of the fusion protein according to the invention and the use of the codons can be adapted according to the host cell in which the nucleic acid must be transcribed and / or translated. These steps can be performed according to methods well known to those skilled in the art and some of which are described in the reference manual Sambrook et al. (Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Third Edition).
  • the present invention further relates to an expression cassette comprising a nucleic acid according to the invention,
  • expression cassette herein refers to a nucleic acid construct comprising a coding region comprising a nucleic acid according to the invention and one or more regulatory sequences, the coding region and the regulatory sequence (s) being operably linked.
  • operably linked indicates that the elements are combined so that expression of the coding region is under the control of the regulatory sequence (s).
  • regulatory sequence refers to a nucleic acid sequence necessary to express or control the expression of the coding region. Regulatory sequences may be endogenous or heterologous to the host cell. Such sequences are well known to a person skilled in the art who can easily select the regulatory sequences adapted to each application and in particular to the host cell in which the expression is desired. Without being limited thereto, these sequences may comprise in particular a promoter, a polyadenylation sequence, a transcription terminator, a 3'UTR region, a 5'UTR region and a signal peptide.
  • the expression cassette according to the invention comprises, or consists of, a promoter making it possible to initiate transcription, a nucleic acid according to the invention, and a transcription terminator.
  • the promoter sequence is placed upstream of the coding region and at a distance compatible with the control of the expression of said region.
  • the promoter contains transcriptional control sequences that initiate expression of the nucleic acid encoding a fusion protein of the invention. It may be a promoter recognized by a host cell or an in vitro expression system.
  • the promoter may be any polynucleotide exhibiting transcriptional activity under the envisaged conditions of use, ie in vitro or in vivo, and may in particular be a promoter obtained from genes coding for endogenous or heterologous polypeptides at the host cell, or a mutant, truncated or hybrid promoter.
  • the promoter may be a strong, weak, constitutive or inducible promoter. On the basis of his knowledge, a person skilled in the art can easily choose the adapted promoter.
  • the transcription terminator is recognized by a host cell to complete the transcription.
  • the terminator is functionally linked to the 3 'end of the nucleic acid according to the invention. Any terminator that is functional in the host cell can be used in the present invention.
  • the present invention also relates to an expression vector comprising a nucleic acid or an expression cassette according to the invention.
  • This expression vector can be used to transform a host cell and allow the expression of the nucleic acid according to the invention in said cell.
  • the vector may be a DNA or an RNA, circular or not, single- or double-stranded. It is advantageously chosen from a plasmid, a phage, a phagemid, a virus, a cosmid and an artificial chromosome.
  • the vector is chosen to be compatible with the host cell into which it is to be introduced.
  • the vector may be an autonomously replicating vector, i.e., an existing vector as an extra chromosomal entity whose replication is independent of chromosomal replication, or a vector which, when introduced into the host cell is integrated into the genome and replicated with the chromosome in which it has been integrated.
  • the expression vector comprises regulatory elements allowing the expression of the nucleic acid according to the invention.
  • These elements may comprise, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. Methods for selecting these elements according to the host cell in which the expression is desired, are well known to those skilled in the art.
  • the vector may further comprise elements allowing its selection in the host cell, such as, for example, an antibiotic resistance gene or a selection gene ensuring the complementation of the respective gene deleted in the genome of the host cell.
  • elements allowing its selection in the host cell, such as, for example, an antibiotic resistance gene or a selection gene ensuring the complementation of the respective gene deleted in the genome of the host cell.
  • the vector comprises one or more elements for integrating the vector into the genome of the host cell. This integration may be based on homologous or non-homologous recombination. In the case of targeted integration, the vector may contain sequences homologous to a target region of the genome and which make it possible to target integration by homologous recombination at a specific location in the genome of the host cell.
  • the vector may comprise a replication origin functional in the host cell.
  • the methods for selecting these different elements depending on the vector and the host cell in which the expression is desired are well known to those skilled in the art.
  • the vectors according to the invention can be constructed by standard molecular biology techniques.
  • the present invention relates to the use of a nucleic acid, an expression cassette or an expression vector according to the invention to transform or transfect a cell.
  • the host cell may be transiently / stably transfected / transfected and the nucleic acid, cassette or vector may be contained in the cell as an episome or chromosomal form.
  • the present invention also relates to a host cell comprising a nucleic acid, a cassette or an expression vector according to the invention.
  • the host cell may be a prokaryotic cell or a eukaryotic cell.
  • the host cell is a prokaryotic cell, preferably a bacterium.
  • the host cell is a eukaryotic cell, preferably a yeast, a mushroom cell, an algal cell, a cell of plant or animal cell, and more preferably an animal cell or yeast.
  • the host cell is an animal cell, preferably an insect or mammalian cell, and more preferably a mouse cell, a hamster cell (for example a CHO cell) or a human cell.
  • the cell is non-human and / or is not an embryonic stem cell.
  • the host cell is a non-human mammalian cell.
  • the host cell is an animal cell, preferably human, and is not a human embryonic stem cell.
  • the host cell is a microorganism, preferably a bacterium or a yeast.
  • host cell also includes any offspring of a parent host cell that is not identical to the parent host cell due to mutations that occur during replication.
  • nucleic acid, expression cassette or expression vector according to the invention may be introduced into the host cell by any method known to those skilled in the art, such as infection, electroporation, conjugation, transduction, competent cell transformation, protoplast transformation, protoplast fusion, biolistics or transformation methods involving PEG, lipid agents, lithium acetate or liposomes.
  • one or more copies of a nucleic acid, a cassette or a vector according to the present invention may be inserted into a host cell.
  • the host cell may be an isolated cell (transformation / transfection ex vivo) or a cell present in an organism (transformation / transfection in vivo).
  • the host cell is an isolated cell.
  • isolated cell refers to a separate cell and / or recovered from its natural environment.
  • the cell can be isolated / recovered from a multicellular organism to be manipulated ex vivo.
  • the present invention relates to a method of producing a fusion protein according to the invention comprising expressing a nucleic acid encoding said fusion protein and recovering it.
  • the present invention relates in particular to a process for the in vitro production of a fusion protein according to the invention comprising (a) bringing a nucleic acid, a cassette or a vector according to the invention into contact with an in vitro expression system, and (b) the recovery of the fusion protein.
  • In vitro expression systems are well known to those skilled in the art and many systems are commercially available.
  • the present invention preferably relates to a method for producing a fusion protein according to the invention comprising
  • the host cells are cultured in a nutrient medium suitable for the production of the fusion protein using methods well known to those skilled in the art.
  • the host cell may be cultured in a vial or fermentor in a suitable medium and under conditions allowing the fusion protein to be expressed and / or isolated.
  • the culture is carried out in a suitable nutrient medium comprising in particular carbon, nitrogen and inorganic salt sources, using procedures well known to those skilled in the art.
  • suitable nutrient medium comprising in particular carbon, nitrogen and inorganic salt sources, using procedures well known to those skilled in the art.
  • Such media are available from commercial suppliers or can be prepared according to published compositions (for example, in the catalogs of the American Type Culture Collection).
  • the fusion protein is secreted into the nutrient medium, it can be recovered directly from the culture supernatant. If it is not secreted, it can be recovered from cell lysates or after permeabilization.
  • the fusion protein can be detected and recovered using any method known to those skilled in the art such as chromatography methods and / or electrophoretic methods.
  • the present invention also relates to a method, preferably in vitro or ex vivo, for stimulating recombinase activity in a cell comprising
  • the cell may be a host cell as defined above.
  • the insertion of the nucleic acid, the cassette or the vector according to the invention into the cell can be done by any technique known to those skilled in the art.
  • the cell may possibly have been previously genetically modified to insert one or more recognition sites recognized by the recombinase domain of the fusion protein, and optionally one or more nucleic acids whose expression, number and / or location in the genome will be modified by the action of the recombinase at said recognition sites.
  • the cell may be a microorganism, for example a bacterium or a yeast, in which one or more genes of interest have been introduced (for example genes coding for enzymes giving rise to the production of a compound of interest) in combination with recognition sites recognized by the recombinase domain of the fusion protein.
  • the exposure of this cell to a light capable of activating the photoreceptor domain of the fusion protein generates a chromosomal rearrangement which, according to the configuration of the recognition sites of the recombinase, makes it possible, for example, to activate or inhibit the expression of the gene (s) of interest, and / or deleting, inserting or translocating one or more genes of interest of the host cell.
  • the major advantage of the method according to the invention is to use light as an induction agent for recombinase activity and not a chemical inducer.
  • the present invention also relates to a method, preferably in vitro or ex vivo, for modifying one or more nucleic acids, comprising contacting a fusion protein according to the invention with one or more nucleic acids of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and
  • the modifications made to the nucleic acids can be translocations, inversions, insertions and / or deletions. These may in particular lead to inducing or blocking the expression of a gene, or to introducing a mutation in a coding sequence (wild-type sequence to mutated sequence or vice versa). This type of recombinase modification is well known to those skilled in the art.
  • the contacting of the fusion protein with the nucleic acid (s) of interest can take place in a cell, in vivo or ex vivo, or in vitro.
  • the fusion protein is preferably expressed by said cell which also comprises the nucleic acid (s) to be modified.
  • the fusion protein according to the invention can be brought into contact with the nucleic acid (s) to be modified by administering either a vector or an expression cassette coding for said protein, or directly protein in the body, tissue or target cell.
  • the activation of the recombinase activity can be carried out by phototherapy, photochemotherapy or via light sources offering spatial precision such as optical fibers. This type of application is of particular interest in gene therapy when it is necessary to modify the activity or viability of a cell or a group of cells involved in a pathology or in its evolution (see for example Greco and Gene Therapy Volume 13, pages 206-215 (2006)).
  • the fusion protein is preferably contacted with a reaction mixture comprising the nucleic acid (s) of interest in the form of a purified protein.
  • the fusion protein can be used in solution or in immobilized form.
  • the reaction mixture also comprises an in vitro transcription and translation system.
  • this method is used to generate genetic diversity within a cell or a population of cells, preferably a population of bacteria or yeasts, or in a nucleic acid or mixture of nucleic acids.
  • the genome of the cell or the nucleic acid may be previously synthesized or modified to comprise a plurality of recognition sites inserted in a targeted or random manner and thus generating, under the action of the recombinase, a controlled genetic diversity or random.
  • the methods according to the invention can find application in a very large number of fields, in particular
  • the expression of the molecule of interest can in particular be induced, stopped, increased or decreased.
  • the compound of interest may be in particular any fermentation product, a compound that changes the physiology or viability of the host cell or cells in direct or indirect contact therewith, a compound controlling a molecular or cellular property of said host cell or cells in direct or indirect contact with it.
  • the compound of interest may also be a protein or nucleic acid having a mutation with respect to the version produced by the host cell before the action of the recombinase;
  • the cells thus obtained can then be screened to identify or select cells with new characteristics of interest, such as, for example, synthesis of a new compound, increased resistance to particular culture conditions or productivity. increased; or
  • the present invention also relates to a kit comprising a fusion protein, a nucleic acid, a cassette or an expression vector according to the invention and / or a host cell according to the invention, and optionally a light source. capable of activating the photoreceptor domain of the fusion protein.
  • Reporter system for quantifying CRE recombinase activity in vivo.
  • the reporter system is illustrated in Figure 1. This system is integrated with the HO locus of the yeast cell genome Saccharomyces cerevisiae. It consists of the following consecutive sequence elements:
  • PromTEF promoter conferring constitutive expression (comes from the TEF1 gene of Saccharomyces cerevisiae).
  • -K1LEU2 coding sequence of the K1LEU2 gene of the yeast Kluyveromyces lactis, encoding a beta-isopropylmalate dehydrogenase.
  • -TermADH1 transcription terminator sequence from the ADH1 gene (Alcohol DeHydrogenase 1) of Saccharomyces cerevisiae. This sequence includes one or more STOP codons which also provide termination of the translation.
  • - TermCYCl transcription terminator sequence from the CYC1 gene of Saccharomyces cerevisiae.
  • Yeast cells corresponding to strain GY1761 of genotype MATalpha his3A200 leu2A1 trplA63 ura3A0 hoA :: loxKlLEU2loxGFP and carrying the reporter system described above are transformed with a plasmid carrying an expression cassette of a candidate protein likely to have an CRE recombinase activity.
  • the yeast strain thus transformed is cultured overnight on a selective medium under conditions where the candidate protein is expressed. This medium is called preculture medium below.
  • the next day, 100 ml of this culture are transferred to a flat-bottomed transparent plastic 96-well plate and, where appropriate, illuminated at room temperature under the desired conditions of time, wavelength and light energy.
  • Part of the cells of this sample are then cultured for 4 hours in a medium corresponding to conditions where the candidate protein is not expressed. This medium is called the recovery medium below.
  • a sample of these cells is then transferred to a medium called analysis medium below and analyzed at a rate of 400 events per second on a LACSCalibur flow cytometer (BDBiosciences) in which the GLP was excited with a 488 laser. nm and the fluorescence emitted through a 530/30 filter was quantified to produce data such as those shown in Figure 2A.
  • they are classified into two groups: OLE (low fluorescence) and ON (high fluorescence), which correspond to cells that do not have (OLE) or that have (ON) activated the reporter system. .
  • the proportion of ON cells is used as an indicator of CRE recombinase activity, as shown in Figure 2B.
  • the TBS buffer is a tenth dilution in water of the TBS10X buffer, which corresponds to an aqueous solution (Tris 30 g / L, NaCl 80 g / L, KCI 2 g / L) adjusted to pH 7.4 with water. fuming hydrochloric acid.
  • the yeast cell culture media are prepared from a powdery mixture of amino acids and nucleotides called MixW whose composition is as follows: Adenine (Ad) 1 g, Uracil (U) 2 g, Alanine (A) 2 g, Arginine (R) 2 g, Aspartate (D) 2 g, Asparagine (N) 2 g, Cysteine (C) 2 g, Glutamate (E) 2 g, Glutamine (Q) 2 g, Glycine (G) 2 g, Histidine (H) 2 g, Isoleucine (I) 2 g, Leucine (L) 4 g, Lysine (K) 2 g, Methionine (M) 2 g, Phenylalanine (F) 2 g, Proline (P) 2 g, Serine (S) 2 g, Threonine (T) 2 g, Tyrosine (Y) 2 g, Valine (V) 2 g.
  • MixW X where X denotes one of the compounds of the mixture, are prepared in the same manner but omitting the compound X.
  • the mixture MixW M does not contain methionine.
  • MixW XY are prepared by omitting two compounds designated X and Y.
  • - Preculture medium 6.7 g Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20 g of galactose, 20 g of raffinose, and 2 g of MixW described above diluted in 1L of distilled water, 1 mL of 1M NaOH is added and the solution is autoclaved at 0.5 bar.
  • Recovery medium 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW described above diluted in 1 L of distilled water, 1 ml of 1 M NaOH is added and the solution is autoclaved at 0.5 bar.
  • - Preculture medium 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BDBiosciences), 20 g of glucose, and 2 g of MixW M described above diluted in 1L of distilled water, 1 ml of 1M NaOH is added and the solution is autoclaved at 0.5 bar.
  • Recovery medium 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW H described above, diluted in 1 L of distilled water, 1 ml of 1 M NaOH. added and the solution is autoclaved at 0.5 bar.
  • Protocol P3 TBS buffer.
  • - Preculture medium 6.7 g Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20 g glucose, and 2 g MixW M U described above diluted in
  • Recovery medium 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW HU described above, diluted in 1 ml of distilled water, 1 ml of 1 M NaOH. added and the solution is autoclaved at 0.5 bar.
  • - Analytical medium TBS buffer.
  • the Cre_Stop341 mutant was obtained by site-directed mutagenesis of a plasmid where codon D341 was replaced by a stop codon.
  • the Cre_A340A341 mutant was obtained by site-directed mutagenesis of a plasmid where codons E340 and D341 were replaced by A340 and A341.
  • the expression of the wild-type or mutant recombinase protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
  • the test conditions are those of the protocol Pl without illumination.
  • the results showing the CRE recombinase activity of these mutants are shown in FIG. 3.
  • the Cre_Stop341 mutant mutant exhibits complete activity. This demonstrates that CRE recombinase deleted from 3 C-terminal amino acids is active.
  • the results show that the Cre_A340A341 mutant has a slightly reduced activity compared to the wild-type CRE recombinase. Effects of mutations of the N-terminus of CRE recombinase
  • PCR where the DNA template was the plasmid pGY 115 and where the primers were 1L80 whose sequence is 5'-tggtatctttatagtcctgtcgg-3 '(SEQ ID NO: 15) and, for Cre_A2-1L71 whose sequence is 5 '-gaacatgtccatcaggttcttgcgaacctccatttaacactcagataa-3' (SEQ ID NO: 16), and for Cre_A2-28 1L72 whose sequence is 5'-agaaaacgcctggcgatccctgaacatgtccatttaacactcagataa-3 '(SEQ ID NO: 17).
  • the denomination Dc-y here indicates the deletion of the amino acids located from the included position x to the included position y.
  • the expression of the wild-type or mutant recombinase protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
  • the test conditions are those of the protocol Pl without illumination.
  • the results showing the activity of these mutants are shown in FIG. 4.
  • the CRE activity of the Cre_A2-21 mutant is complete while that of the Cre_A2-28 mutant is reduced by less than 10%.
  • the iLID photoreceptor derived from asLOV2 and described in the article by Guntas et al. 2015 P.N.A.S. 112 (1): 112-117 was fused to the N-terminal of several variants of the CRE recombinase protein.
  • the method used is shown schematically in FIG. 5. It was transferred, by spontaneous homologous recombination into yeast cells, a DNA fragment amplified by PCR and containing the CRE variant sequence as well as, optionally, certain sequence modifications. N-terminal of said variant, in a plasmid containing an expression system and the coding sequence of iLID.
  • the iLID-Crel9 construct (fusion of the iLID domain to the residue at position 19 of SEQ ID NO: 1) was obtained by i) PCR where the DNA template was the plasmid pGY155 and where the primers were 1G42 with the sequence is 5'-AGAAAAGGAGAGGGCC AAGA-3 '(SEQ ID NO: 18) and 1M43 whose sequence is 5'-CTTATTAAGAAAACCGCATTTCAAATCgccacgagtgatgaggttcgcaag-3' (SEQ ID NO: 19), ii) digesting the plasmid pGY408 with the enzymes Mfel and BsiWI and agarose gel purification 1% of the fragment of 4.4Kb, iii) co-transformation of the products of steps i) and ii) in yeast strain GY 1761 and selection on medium without tryptophan.
  • the construct iLID-Cre27 (fusion of the iLID domain to the residue at position 27 of SEQ ID NO: 1) was obtained by applying steps i) to iii) above with the following modification of step i ): use of the 1M51 primer whose sequence is 5'-CTTATTAAGAAAACCGCATTT CAAATCgccctgatggacatgttcagggat-3 '(SEQ ID NO: 20) in place of the 1M43 primer.
  • step i) use of the 1M53 primer whose sequence is 5'-CTTATTAAGAAAACCGCA TTTCAAATCgccagggatcgccaggcgttttctg-3 '(SEQ ID NO: 21) in place of the 1M43 primer.
  • construct iLID-CreAA20 (fusion of the iLID domain to the residue at position 20 of SEQ ID NO: 1 with the double mutation A340A341) contained in plasmid pGY416 was obtained by applying steps i) to v) above. above with the following modifications of step i): use of the 1M44 primer whose sequence is 5'-CTTATTAAG AAAACCGCATTTCAAATCgccagtgatgaggttcgcaagaac-3 '(SEQ ID NO: 22) in place of the 1M43 primer and use of the template pGY372 instead of the pGY15 matrix.
  • the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
  • the activity of the fusion proteins was evaluated by applying or not an illumination of the cells according to the P1 protocol. The results obtained are presented in FIG. 6.
  • the iLID-Crel9 fusion exhibits an activity of 25% without illumination and 32% after illumination
  • the iLID-Cre27 fusion exhibits 50% activity without illumination and 60% after illumination
  • the iLID-Cre32 fusion exhibits 15% activity without illumination and 45% after illumination
  • the iLID-CreAA20 fusion exhibits zero activity without illumination and 18% after illumination.
  • iLID (QI) -xi-Cre32 was generated to introduce a random amino acid at the junction between iLID and Cre32. This series was obtained by PCR amplification of the sequence comprising a portion of CRE recombinase using the 1F14 antisense primer of the 5'-gtgatgacggtgaaacctc-3 'sequence (SEQ ID NO: 23) and the sequence 1N24 sense primer.
  • mutants denoted iLID (QI) -X 2 -Cre32 was similarly generated using the 1N25 sequence primer 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 25) instead of primer 1N24.
  • mutants denoted iLID (QI) -X 3 -Cre32 was generated in a similar manner using the 1N26 primer of 5'-CTT sequence ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 26) instead of primer 1N24.
  • the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
  • FIG. 7 presents the activities without or with illumination for several constructions iLID (QI) -x n -Cre32 thus generated. These constructions show a gain in activity after illumination.
  • Illumination conditions of different times and intensities were applied to yeast cells containing the construct iLID_Cre32 or the construct iLID_CreAA20, placed in two types of expression cassette.
  • the first cassette comprises the promoter of the GAL1 gene.
  • the results obtained with this cassette and according to the protocol P1 by applying or not an illumination of the cells with varying intensities and durations, are presented in FIG. comprises the promoter of the MET17 gene.
  • the results obtained with this cassette and according to the P2 protocol, by applying or not an illumination of the cells according to varying intensities and durations, are presented in FIGS. 8 and 9. These results show that the recombinase activity of the constructs is activatable in very different conditions of time and intensity.
  • NLS_iLID_CreAA20 construct was studied. This construction corresponds to the fusion at the N-terminus of iLID_CreAA20 of a peptide whose sequence VPKKKRKV (SEQ ID NO: 27) (Nuclear Localization Signal, NLS) is known to address proteins to the nucleus of the cells, as indicated in the article by Cheng et al. Endocrinology 157: 127-140, 2016, followed by the sequence GGSGG (SEQ ID NO: 28).
  • VPKKKRKV Nuclear Localization Signal, NLS
  • This construct was obtained by performing PCR amplification with 1080 primers (5'-atgtgagttacctcactcat-3 '(SEQ ID NO: 29)) and 1084 (5'-GCTAAAGAACCGTGATGGTGGTGATGATGTGAACCTCTCATACCTCCGGAac caccgacttttctcttct-3' (SEQ ID NO: 30)) on the plasmid pGY491 and by co-transforming the product of said amplification with the SacI-EcoRI fragment of the plasmid pGY466 in a yeast strain.
  • nMag and pMag activatable recombinase system based on the photoinducible dimerization of peptides called nMag and pMag has been described in the article by Kawano et al. Nat. Chem. Biol. 2016 12 (12): 1059-1064.
  • This system has two distinct fusion proteins that must be expressed in the same cell.
  • two plasmid constructs were made: pMet17-Crel8to59-nMag-NLS-URA (SEQ ID NO: 31) and pMet17-ATG-NLS-pMag-Cre60to343-TRP (SEQ ID NO: 32).
  • each of the fusion proteins is placed under the control of the promoter of the MET gene. of Saccharomyces cerevisiae.
  • the combination of these two plasmids is called nMag / pMag-CRE hereinafter.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

The present invention relates to a chimeric protein, the recombinase activity of which is photo-inducible. It also relates to the use of such a protein for controlling, via exposure to light, recombination events in a host cell or in vitro.

Description

Protéine chimérique présentant une activité recombinase photoactivable  Chimeric protein with photoactivatable recombinase activity
La présente invention concerne une protéine chimérique dont l’activité recombinase est photo-inductible. Elle concerne également l’utilisation d’une telle protéine pour contrôler, via une exposition à la lumière, des évènements de recombinaison dans une cellule hôte ou in vitro. The present invention relates to a chimeric protein whose recombinase activity is photoinducible. It also relates to the use of such a protein for controlling, via light exposure, recombination events in a host cell or in vitro.
ARRIERE-PLAN TECHNOLOGIQUE DE L’INVENTION BACKGROUND OF THE INVENTION
L’essor des biotechnologies est largement basé sur la capacité à contrôler et modifier le patrimoine génétique des cellules. A cet effet, les recombinases comptent parmi les outils les plus efficaces en génie génétique, que ce soit pour manipuler des transgènes dans des cellules eucaryotes ou procaryotes. The rise of biotechnology is largely based on the ability to control and modify the genetic heritage of cells. For this purpose, recombinases are among the most effective tools in genetic engineering, whether for handling transgenes in eukaryotic or prokaryotic cells.
Parmi les recombinases disponibles, la recombinase CRE est très largement utilisée dans différents modèles procaryotes et eucaryotes comme outil de manipulation de l’ADN in vitro et in vivo. Cette recombinase est issue du bactériophage Pl et catalyse la réaction de recombinaison entre deux sites spécifiques LoxP. Le site LoxP, long de 34 paires de bases, comprend à ses extrémités deux régions palindromiques de 13 paires de bases chacune appelées RBE (Recombinase Binding Elément) qui encadrent une région orientée de 8 paires de bases, laquelle détermine la direction du site LoxP. Si les deux sites LoxP sont orientés dans le même sens, la recombinase provoque l’excision irréversible de la région se trouvant entre les deux sites. A contrario, si les deux sites LoxP sont orientés en sens inverse, la recombinase induit l’inversion réversible de la séquence se trouvant entre les deux sites.  Among the available recombinases, the CRE recombinase is very widely used in various prokaryotic and eukaryotic models as a tool for handling DNA in vitro and in vivo. This recombinase is derived from bacteriophage P1 and catalyzes the recombination reaction between two specific LoxP sites. The LoxP site, 34 base pairs long, comprises at its ends two palindromic regions of 13 base pairs each called RBE (Recombinase Binding Element) which surround an oriented region of 8 base pairs, which determines the direction of the LoxP site. If the two LoxP sites are oriented in the same direction, the recombinase causes irreversible excision of the region between the two sites. On the other hand, if the two LoxP sites are oriented in the opposite direction, the recombinase induces the reversible inversion of the sequence lying between the two sites.
De nombreuses techniques permettant l’activation conditionnelle du système CRE-LoxP ont été développées au cours des dernières décennies.  Many techniques for the conditional activation of the CRE-LoxP system have been developed in recent decades.
L’une de ces techniques permet notamment la mutagénèse conditionnelle in vivo chez la souris et ainsi d’étudier l’effet de mutations qui seraient létales si elles étaient non tissu-spécifiques. Brièvement, les sites LoxP sont tout d’abord intégrés de part et d’autre d’un allèle du gène d’intérêt par recombinaison homologue dans des cellules souches embryonnaires. Ces cellules sont ensuite injectées dans un blastocyte de souris pour obtenir une lignée cellulaire qui sera croisée avec une autre lignée de souris transgéniques exprimant la recombinase CRE sous le contrôle d’un promoteur tissu-spécifique. Les animaux issus de ce croisement sont « doublement » transgéniques et présentent la mutation souhaitée uniquement dans le tissu cible. Ces animaux sont dit « mosaïques » en ce sens que leur patrimoine génétique n’est pas unitaire et diffère selon les cellules (Babinet and Cohen-Tannoudji, 2000, Med Sci (Paris), 16, 1, 31-42). One of these techniques allows in vivo conditional mutagenesis in mice and thus to study the effect of mutations that would be lethal if they were non-tissue-specific. Briefly, the LoxP sites are first integrated on either side of an allele of the gene of interest by homologous recombination in embryonic stem cells. These cells are then injected into a mouse blastocyst to obtain a cell line that will be crossed with another line of transgenic mice expressing CRE recombinase under the control of a tissue-specific promoter. The Animals from this cross are "doubly" transgenic and present the desired mutation only in the target tissue. These animals are called "mosaics" in the sense that their genetic inheritance is not unitary and differs according to the cells (Babinet and Cohen-Tannoudji, 2000, Med Sci (Paris), 16, 1, 31-42).
L’activation conditionnelle du système CRE-LoxP a également été utilisée chez la levure, et notamment S. cerevisae (Sauer, 1987, Mol. Cell. Biol. 7, 2087-2096). Le gène codant pour la recombinase CRE a été placé sous le contrôle du promoteur GAL1 dont l’activité est réprimée en présence de glucose et stimulée en présence de galactose. Il a été démontré que l’ajout de galactose dans le milieu de culture induisait l’excision du gène cible LEU2 encadré par deux sites LoxP de même orientation et préalablement intégrés dans le génome. La cinétique d’apparition de l’auxotrophie à la leucine montre que l’activité recombinase de la CRE dans la levure débute après huit heures d’induction en galactose pour être maximale après 24 heures. Cette cinétique a été améliorée en réalisant une pré -culture en présence de raffinose.  The conditional activation of the CRE-LoxP system has also been used in yeast, and in particular S. cerevisae (Sauer, 1987, Mol Cell Biol 7, 2087-2096). The gene coding for the CRE recombinase was placed under the control of the GAL1 promoter whose activity is repressed in the presence of glucose and stimulated in the presence of galactose. It has been demonstrated that the addition of galactose in the culture medium induces the excision of the target gene LEU2 flanked by two LoxP sites of the same orientation and previously integrated into the genome. The kinetics of leucine auxotrophy show that CRE recombinase activity in yeast begins after eight hours of galactose induction to be maximal after 24 hours. This kinetics has been improved by performing a pre-culture in the presence of raffinose.
Un contrôle temporel de l’activité du système CRE-LoxP a également été obtenu en utilisant une recombinase CRE dont l’activité est dépendante d’un ligand (Metzger et al., 1995, Proc. Natl. Acad. Sci. 92, 6991-6995). Cette enzyme est obtenue par fusion du gène codant pour la recombinase CRE avec un cDNA du domaine de liaison au ligand (LBD) des récepteurs aux hormones stéroïdes et en particulier du récepteur humain à l’estrogène (hER). En absence de ligand (progestérone, estrogène), la recombinase CRE n’est pas ou peu active. A l’inverse, en présence du ligand, la protéine chimérique subit un changement conformationnel et présente une activité CRE recombinase. Ce système a été amélioré en introduisant différentes mutations dans le domaine LBD afin de remplacer les hormones naturelles par un stéroïde artificiel, le tamoxifène, et/ou d’augmenter la spécificité et l’efficacité d’activation (Indra et al., 1999, Nucleic Acids Res. 27, 4324- 4327; Metzger and Chambon, 2001, Methods 24, 71-80).  Time control of CRE-LoxP system activity was also obtained using CRE recombinase whose activity is ligand-dependent (Metzger et al., 1995, Proc Natl Acad Sci 92, 6991). -6995). This enzyme is obtained by fusion of the gene coding for the CRE recombinase with a cDNA of the ligand binding domain (LBD) of the steroid hormone receptors and in particular of the human estrogen receptor (hER). In the absence of ligand (progesterone, estrogen), the CRE recombinase is not or only slightly active. Conversely, in the presence of the ligand, the chimeric protein undergoes a conformational change and exhibits CRE recombinase activity. This system has been improved by introducing different mutations in the LBD domain in order to replace the natural hormones with an artificial steroid, tamoxifen, and / or to increase the specificity and activation efficiency (Indra et al., 1999, Nucleic Acids Res 27, 4324- 4327, Metzger and Chambon, 2001, Methods 24, 71-80).
L’activité du système CRE-LoxP peut également être contrôlée par la température. Utilisant un poisson comme modèle d’étude, il a en effet été démontré que l’expression de la recombinase CRE pouvait être contrôlée par un «heat shock element» (HSE) (Kobayashi et al., 2013, Genes. N. Y. N 2000 51, 59-67). Le système HSE-CRE est ainsi activable par choc thermique (39°C pendant deux heures). La réponse obtenue est cependant variable en fonction des différents types cellulaires et en fonction du stade de développement durant lequel le choc thermique a eu lieu. Plusieurs systèmes CRE-LoxP inductibles par la lumière ont également été décrits. The activity of the CRE-LoxP system can also be controlled by temperature. Using a fish as a study model, it has indeed been shown that the expression of CRE recombinase can be controlled by a "heat shock element" (HSE) (Kobayashi et al., 2013, Genoa, NY, N, 2000). , 59-67). The HSE-CRE system can thus be activated by thermal shock (39 ° C for two hours). The response obtained, however, varies according to the different cell types and according to the stage of development during which the thermal shock has occurred. Several light-inducible CRE-LoxP systems have also been described.
L’un de ces systèmes est une adaptation du système CRE-ER rendu localement photo-activable par G utilisation d’un inducteur photo-chimique, le cyclofène-OH. Ce substrat, dont la structure est proche du tamoxifène-OH, est entouré de groupes photo labiles. En réponse à une illumination, le ligand libéré de ces groupes peut se fixer au récepteur ER et ainsi activer la recombinase CRE. Ce système a été utilisé chez le poisson (Sinha et al., 2010, Zebrafish, 7, 199-204 ; Sinha et al., 2010, ChemBioChem 11, 653- 663) et chez la souris (Lu et al., 2012, Bioconjug. Chem. 23, 1945-1951). Le contrôle spatial et temporel de cette activation est toutefois particulièrement complexe en ce qu’il requiert de maîtriser la qualité, la quantité et la diffusion du ligand photoactivable.  One of these systems is an adaptation of the CRE-ER system made locally photo-activatable by G using a photo-chemical inductor, cyclofen-OH. This substrate, whose structure is close to tamoxifen-OH, is surrounded by labile photo groups. In response to illumination, the ligand released from these groups can bind to the ER receptor and thereby activate the CRE recombinase. This system has been used in fish (Sinha et al., 2010, Zebrafish, 7, 199-204, Sinha et al., 2010, ChemBioChem 11, 653-663) and in mice (Lu et al., 2012, Bioconjug, Chem 23, 1945-1951). The spatial and temporal control of this activation is, however, particularly complex in that it requires controlling the quality, the quantity and the diffusion of the photoactivatable ligand.
De la même manière, le système photo-inductible d’expression de gènes Light On a été utilisé pour contrôler l’expression de la recombinase CRE (Wang et al., 2012, Nat. Methods 9, 266-269). Ce système est basé sur l’utilisation d’un transactivateur qui, sous l’action de la lumière, se fixe à un promoteur transcriptionnel et l’active. Ce système présente cependant l’inconvénient de nécessiter des périodes d’illumination très longues (de l’ordre de 22 heures).  Similarly, the light inducible Light On gene expression system was used to control the expression of CRE recombinase (Wang et al., 2012, Nat Methods 9, 266-269). This system is based on the use of a transactivator which, under the action of light, binds to a transcriptional promoter and activates it. However, this system has the disadvantage of requiring very long illumination periods (of the order of 22 hours).
Un autre système Cre-LoxP photo-activable a également été décrit par Kawano et al. (Nat Chem Biol. 2016 Dec;l2(l2):l059-l064). Ce système utilise deux protéines de fusion, chacune comprenant un fragment de la recombinase CRE fusionné à un photo commutateur appelé « Magnet ». L’illumination du système provoque la dimérisation des « Magnets » et l’association des fragments de la recombinase CRE qui devient ainsi active.  Another photo-activatable Cre-LoxP system has also been described by Kawano et al. (Nat Chem Biol 2016 Dec 12 (12): 1059-1064). This system uses two fusion proteins, each comprising a fragment of CRE recombinase fused to a switch photo called "Magnet". The illumination of the system causes the dimerization of the "Magnets" and the association of the fragments of the CRE recombinase which thus becomes active.
Un système similaire de Cre-LoxP photo-activable a été décrit par Taslimi et al. (Nat Chem Biol. 2016 June;l2(6):425-430). Ce système utilise également deux protéines de fusion, chacune comprenant un fragment de la recombinase CRE fusionné à un domaine de dimérisation photosensible appelé CRY2-CIB. L’illumination du système provoque la dimérisation des deux protéines chimériques et l’association des fragments de la recombinase CRE qui devient ainsi active.  A similar system of photoactivatable Cre-LoxP has been described by Taslimi et al. (Nat Chem Biol 2016 June, l2 (6): 425-430). This system also uses two fusion proteins, each comprising a fragment of CRE recombinase fused to a photosensitive dimerization domain called CRY2-CIB. The illumination of the system causes the dimerization of the two chimeric proteins and the association of the fragments of the CRE recombinase which thus becomes active.
Un autre système de Cre-LoxP photo-activable a été décrit dans des cellules humaines par Zhang et al. (Nature Methods. 2017 l4(4):39l-394). Ce système utilise un domaine protéique appelé PhoCl qui est clivé lors de la photoactivation, ainsi qu'un domaine de liaison au ligand des récepteurs aux hormones stéroïdes (SR). La protéine chimérique décrite appelée SR-PhoCl-Cre-PhoCl-SR est inactive à cause des domaines SR qui recrutent la protéine inhibitrice Hsp90 de la cellule hôte. Après illumination, le double clivage de la protéine libère les domaines SR et lève ainsi l'inhibition imposée par Hsp90. Another photoactivatable Cre-LoxP system has been described in human cells by Zhang et al. (Nature Methods, 2017 l4 (4): 39l-394). This system uses a protein domain called PhoCl which is cleaved upon photoactivation, as well as a ligand binding domain of steroid hormone receptors (SR). Protein The described chimeric SR-PhoCl-Cre-PhoCl-SR is inactive due to the SR domains that recruit the Hsp90 inhibitory protein from the host cell. After illumination, the double cleavage of the protein releases the SR domains and thus lifts the inhibition imposed by Hsp90.
Compte -tenu de l’importance des recombinases en tant qu’ outils en génie génétique, de nombreuses études ont été et sont menées pour en améliorer le contrôle. Les différents systèmes inductibles disponibles à ce jour restent cependant complexes, coûteux et/ou imprécis. Il demeure donc un réel besoin pour une technologie simple et efficace assurant le contrôle de l’activité recombinase dans une cellule individuelle ou un ensemble de cellules à un instant donné.  Bearing in mind the importance of recombinases as tools in genetic engineering, many studies have been and are being conducted to improve their control. The various inducible systems available to date, however, remain complex, expensive and / or imprecise. There remains therefore a real need for a simple and effective technology ensuring the control of recombinase activity in an individual cell or a set of cells at a given time.
RÉSUMÉ DE L’INVENTION SUMMARY OF THE INVENTION
L’objectif de la présente invention est de fournir un système recombinase dont l’utilisation serait simple et peu coûteuse afin d’être adaptée à un usage industriel, tout en assurant un contrôle temporel et spatial précis de l’activité recombinase. The object of the present invention is to provide a recombinase system whose use would be simple and inexpensive to be adapted for industrial use, while ensuring a precise temporal and spatial control of recombinase activity.
A cette fin, les inventeurs ont développé une recombinase photoactivable. For this purpose, the inventors have developed a photoactivatable recombinase.
Contrairement aux systèmes développés précédemment où la dépendance à la lumière est indirecte (par exemple via un activateur chimique photo-protégé ou un activateur transcriptionnel photo-inductible), la recombinase selon l’invention est directement activée par la lumière, simplifiant ainsi considérablement le procédé. Unlike the previously developed systems where the light dependence is indirect (for example via a photo-protected chemical activator or a photoinducible transcriptional activator), the recombinase according to the invention is directly activated by light, thus considerably simplifying the process. .
Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur et dans laquelle l'activité recombinase est photoactivable.  Thus, according to a first aspect, the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain and wherein the recombinase activity is photoactivatable.
De préférence, le domaine recombinase est fusionné en N-terminal au domaine photorécepteur.  Preferably, the recombinase domain is fused at the N-terminal to the photoreceptor domain.
De préférence, le domaine photorécepteur comprend, ou consiste en, un domaine Preferably, the photoreceptor domain comprises, or consists of, a domain
LOV2 de phototropine, ou un variant ou dérivé de celui-ci. En particulier, le domaine photorécepteur peut être un dérivé d’un domaine LOV2, de préférence un domaine iLID (improved light inducible dimer), et de manière plus particulièrement préférée un domaine iLID dérivé du domaine LOV2 de la phototropine 1 à' Avenu sativa. Selon certains modes particuliers, le domaine photorécepteur de la protéine de fusion est un domaine iLID présentant la séquence SEQ ID NO : 13 dans laquelle X représente un à trois acides aminés, de préférence X représente A, D, K, L, IL, VV, AI ou QPG. LOV2 of phototropin, or a variant or derivative thereof. In particular, the photoreceptor domain may be a derivative of a LOV2 domain, preferably an iLID (enhanced light inducing dimer) domain, and more particularly preferably an iLID domain derived from the LOV2 domain of phototropin 1 to Avenu sativa. In some particular embodiments, the photoreceptor domain of the fusion protein is a iLID domain having the sequence SEQ ID NO: 13 wherein X is one to three amino acids, preferably X is A, D, K, L, IL, VV, AI or QPG.
Le domaine recombinase est de préférence sélectionné dans le groupe constitué de la recombinase CRE (SEQ ID NO : 1), et des variants fonctionnels de celle-ci. En particulier, le domaine recombinase peut être un variant fonctionnel de la recombinase CRE comprenant, ou consistant en, la séquence SEQ ID NO : 2, ou une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2. The recombinase domain is preferably selected from the group consisting of CRE recombinase (SEQ ID NO: 1), and functional variants thereof. In particular, the recombinase domain may be a functional variant of the CRE recombinase comprising or consisting of the sequence SEQ ID NO: 2, or a sequence having at least 80% sequence identity with SEQ ID NO: 2.
De manière plus particulièrement préférée, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1  More particularly preferably, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted. N-terminal, and optionally having a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1
La présente invention concerne également un acide nucléique codant pour une protéine de fusion selon l’invention, une cassette d’expression comprenant un acide nucléique selon l’invention, un vecteur d’expression comprenant un acide nucléique selon l’invention ou une cassette d’expression selon l’invention, une cellule hôte comprenant un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention.  The present invention also relates to a nucleic acid encoding a fusion protein according to the invention, an expression cassette comprising a nucleic acid according to the invention, an expression vector comprising a nucleic acid according to the invention or a cassette of expression according to the invention, a host cell comprising a nucleic acid, an expression cassette or an expression vector according to the invention.
La présente invention concerne également un procédé pour induire une activité recombinase dans une cellule comprenant  The present invention also relates to a method for inducing recombinase activity in a cell comprising
- la fourniture d’une cellule exprimant une protéine de fusion selon l’invention ou l’insertion d’un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention dans une cellule et  the provision of a cell expressing a fusion protein according to the invention or the insertion of a nucleic acid, an expression cassette or an expression vector according to the invention in a cell and
- l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc G activité recombinase.  exposing said cell to a light capable of activating the photoreceptor domain of said fusion protein and thus recombinase activity.
La présente invention concerne également un procédé pour modifier un acide nucléique, comprenant  The present invention also relates to a method for modifying a nucleic acid, comprising
- la mise en contact d’une protéine de fusion selon l’invention, avec ledit acide nucléique d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, et - l’exposition de la protéine de fusion et dudit acide nucléique à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase. contacting a fusion protein according to the invention with said nucleic acid of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and exposing the fusion protein and said nucleic acid to a light capable of activating the photoreceptor domain of said fusion protein and thus the recombinase activity.
Ce procédé peut notamment être utilisé pour moduler l’expression d’une molécule d’intérêt dans la cellule hôte, pour induire de la diversité génétique dans la cellule hôte ou pour modifier une activité biologique dans le cadre d’une thérapie génique.  This method can in particular be used to modulate the expression of a molecule of interest in the host cell, to induce genetic diversity in the host cell or to modify a biological activity in the context of a gene therapy.
La présente invention concerne en outre un kit comprenant une protéine de fusion, un acide nucléique, une cassette d’expression, un vecteur d’expression et/ou une cellule hôte selon l’invention, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion. Elle concerne également G utilisation dudit kit pour induire une activité recombinase dans une cellule selon le procédé selon l’invention et/ou pour modifier un ou plusieurs acides nucléiques selon le procédé selon l’invention.  The present invention further relates to a kit comprising a fusion protein, a nucleic acid, an expression cassette, an expression vector and / or a host cell according to the invention, and optionally a light source capable of activating the photoreceptor domain of the fusion protein. It also relates to the use of said kit for inducing recombinase activity in a cell according to the method according to the invention and / or for modifying one or more nucleic acids according to the process according to the invention.
BREVE DESCRIPTION DES DESSINS BRIEF DESCRIPTION OF THE DRAWINGS
Figure 1 : Système rapporteur permettant de détecter et quantifier l'activité CRE recombinase dans des cellules de levure. La partie gauche représente la construction génétique du système. La partie droite représente le phénotype d'une cellule de levure portant cette construction. Figure 1: Reporter system for detecting and quantifying CRE recombinase activity in yeast cells. The left part represents the genetic construction of the system. The right side represents the phenotype of a yeast cell carrying this construct.
Figure 2 : Représentation des résultats de test d'activité CRE recombinase. A) L'histogramme montre des données produites par cytométrie en flux. Abscisse: intensité du signal FL1-H correspondant à la fluorescence GFP. Ordonnée: nombre de cellules ayant cette intensité de signal. Les données sont analysées pour déterminer un seuil de signal GFP permettant de départager les cellules OFF (faible signal) des cellules ON (fort signal). B) L'efficacité de recombinaison est la proportion de cellules ON dans une population de cellules ayant exprimé la protéine testée.  Figure 2: Representation of CRE recombinase activity test results. A) The histogram shows data produced by flow cytometry. Abscissa: intensity of the FL1-H signal corresponding to the GFP fluorescence. Ordinate: number of cells with this signal strength. The data is analyzed to determine a GFP signal threshold for separating the OFF (low signal) cells of the ON (high signal) cells. B) The recombination efficiency is the proportion of ON cells in a population of cells having expressed the tested protein.
Figure 3: Résultats du test d'activités de mutants CRE C-Ter. Barres d'erreur: écart-type, n = 3.  Figure 3: CRE C-Ter mutant activity test results. Error bars: standard deviation, n = 3.
Figure 4 : Résultats du test d'activités de mutants CRE N-Ter. Barres d'erreur: écart-type, n = 3. Figure 5 : Schéma de la construction des fusions iLID-CRE par recombinaison homologue. Cre/AA: séquence codante de la ou d'une portion de la protéine Cre ou du variant Cre_A340A34l. TRP1 : gène de S. cerevisiae permettant une sélection auxotrophique des levures transformées. Flèches noires: oligonucléotides (amorces) utilisés pour l'amplification. Etoile: mutation éventuellement portée sur l'oligonucléotide amont. PromGALl: promoteur du gène GAL1 de S. cerevisiae permettant d'induire ou de réprimer l'expression de la protéine d'intérêt. Figure 4: CRE N-Ter mutant activity test results. Error bars: standard deviation, n = 3. Figure 5: Diagram of the construction of iLID-CRE fusions by homologous recombination. Cre / AA: coding sequence of the or a portion of the Cre protein or Cre_A340A341 variant. TRP1: S. cerevisiae gene allowing auxotrophic selection of transformed yeasts. Black arrows: oligonucleotides (primers) used for amplification. Star: mutation possibly carried on the upstream oligonucleotide. PromGAL1: promoter of the S. cerevisiae GAL1 gene for inducing or repressing the expression of the protein of interest.
Figure 6 : Les fusions iLID-Crel9, iLID-Cre27, iLID-Cre32 et iLID-CreAA20 ont une activité CRE accrue après stimulation par la lumière. Noir (obscurité): sans illumination. Bleu (lumière): après illumination des cellules à 460 nm de 36,3 mW/cm2 durant 30 minutes. Barres d'erreur: écart-type, n = 5. Figure 6: The iLID-Crel9, iLID-Cre27, iLID-Cre32 and iLID-CreAA20 fusions have increased CRE activity after light stimulation. Black (darkness): without illumination. Blue (light): after illumination of cells at 460 nm of 36.3 mW / cm 2 for 30 minutes. Error bars: standard deviation, n = 5.
Figure 7 : Activité des fusions iLID-xn-Cre32. Séquence de la jonction: 24A et 24B: iLID-QIA-Cre32, 24F: iLID-QIK-Cre32, 241: iLID-QIL-Cre32, 25C: iLID-QIIL- Cre32, 25F: iLID-QIVV-Cre32, 25X: iLID-QIAI-Cre32, 26R: iLID-QIQPG-Cre32. Noir (obscurité): sans illumination. Bleu (lumière): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 90 minutes. Barres d'erreur: écart-type, n = 3.  Figure 7: Activity of iLID-xn-Cre32 mergers. Sequence of the trunk: 24A and 24B: iLID-QIA-Cre32, 24F: iLID-QIK-Cre32, 241: iLID-QIL-Cre32, 25C: iLID-QIIL-Cre32, 25F: iLID-QIVV-Cre32, 25X: iLID -QIAI-Cre32, 26R: iLID-QIQPG-Cre32. Black (darkness): without illumination. Blue (light): including illumination at 460 nm of 2.2 mW / cm2 for 90 minutes. Error bars: standard deviation, n = 3.
Figure 8 : Effets de différentes conditions d'illumination de la protéine de fusion iLID_Cre32 dans le cadre d'une expression contrôlée par le promoteur GAL1 (A) ou par le promoteur MET17 (B). Noir: sans illumination. Bleu: en incluant une illumination à 460nm durant le temps indiqué (30, 60 ou 90) minutes et différentes intensités: 10, 20, 50, 100 correspondant respectivement à 2,2, 5,1, 17,9 et 36,3 mW/cm2. Barres d'erreur: écart-type, n = 3.  Figure 8: Effects of different conditions of illumination of the fusion protein iLID_Cre32 in the context of an expression controlled by the promoter GAL1 (A) or by the promoter MET17 (B). Black: without illumination. Blue: including an illumination at 460nm during the indicated time (30, 60 or 90) minutes and different intensities: 10, 20, 50, 100 respectively corresponding to 2.2, 5.1, 17.9 and 36.3 mW / cm2. Error bars: standard deviation, n = 3.
Figure 9 : Effets de différentes conditions d'illumination de la protéine de fusion iLID_CreAA20 dans le cadre d'une expression contrôlée par le promoteur MET17. A : illumination à 460nm durant 30 minutes avec différentes intensités. B : illumination à 460nm durant différents temps et avec une intensité de 36,3 mW/cm2. Figure 9: Effects of different conditions of illumination of the fusion protein iLID_CreAA20 in the context of an expression controlled by the promoter MET17. A: illumination at 460nm for 30 minutes with different intensities. B: illumination at 460nm during different times and with an intensity of 36.3 mW / cm 2 .
Figure 10: Comparaison de l'activité de fusion iLID-CreAA20 seule ou avec NLS. Noir (obscurité): sans illumination. Bleu (10%): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 180 minutes. Barres d'erreur: écart-type, n = 3.  Figure 10: Comparison of iLID-CreAA20 fusion activity alone or with NLS. Black (darkness): without illumination. Blue (10%): including illumination at 460 nm of 2.2 mW / cm2 for 180 minutes. Error bars: standard deviation, n = 3.
Figure 11 : Comparaison du système selon l'invention avec le système nMag/pMag-Cre. Noir (obscurité): sans illumination. Bleu (lumière): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 180 minutes. Barres d'erreur: écart-type, n = 3. DESCRIPTION DETAILLEE DE L’INVENTION Figure 11: Comparison of the system according to the invention with the system nMag / pMag-Cre. Black (darkness): without illumination. Blue (light): including illumination at 460 nm of 2.2 mW / cm2 for 180 minutes. Error bars: standard deviation, n = 3. DETAILED DESCRIPTION OF THE INVENTION
Les inventeurs ont conçu une protéine chimérique douée d’une activité recombinase directement photoactivable. Ils ont pour cela fusionné un domaine recombinase à un domaine photorécepteur et ont démontré que l’activation par la lumière du domaine photorécepteur permettait d’activer le domaine recombinase. L’activité recombinase de cette protéine est donc directement dépendante de l’exposition à la lumière. En l’absence de lumière, la protéine de fusion selon l’invention n’a que peu ou pas d’activité recombinase. En revanche, les inventeurs ont démontré qu’une courte exposition à la lumière de cette protéine permettait d’induire fortement cette activité. The inventors have designed a chimeric protein endowed with a directly photoactivatable recombinase activity. To do this, they fused a recombinase domain to a photoreceptor domain and demonstrated that activation by light of the photoreceptor domain made it possible to activate the recombinase domain. The recombinase activity of this protein is therefore directly dependent on exposure to light. In the absence of light, the fusion protein according to the invention has little or no recombinase activity. On the other hand, the inventors have demonstrated that a short exposure to light of this protein makes it possible to strongly induce this activity.
La protéine de fusion développée par les inventeurs constitue ainsi un outil génétique simple et efficace pour procéder à des modifications de l’ADN in vivo ou in vitro sous l’impulsion d’une simple stimulation lumineuse.  The fusion protein developed by the inventors thus constitutes a simple and effective genetic tool for carrying out DNA modifications in vivo or in vitro under the impulse of a simple light stimulation.
Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur. Thus, according to a first aspect, the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain.
Dans le présent document, les termes « peptide », « oligopeptide », « polypeptide » et « protéine » sont utilisés indifféremment et se réfèrent à une chaîne d’acides aminés reliés par des liaisons peptidiques, quel que soit le nombre de résidus d’acide aminé constituant cette chaîne.  In this document, the terms "peptide", "oligopeptide", "polypeptide" and "protein" are used interchangeably and refer to a chain of amino acids linked by peptide bonds, regardless of the number of residues of amino acid constituting this chain.
Les acides aminés sont ici représentés par leur code à une lettre ou à trois lettres selon la nomenclature suivante: A: alanine (Ala); C: cystéine (Cys); D: acide aspartique (Asp); E: acide glutamique (Glu); F: phénylalanine (Phe); G: glycine (Gly); H: histidine (His); I: isoleucine (Ile); K: lysine (Lys); L: leucine (Leu); M: méthionine (Met); N: asparagine (Asn); P: proline (Pro); Q: glutamine (Gln); R: arginine (Arg); S: sérine (Ser); T: thréonine (Thr); V: valine (Val); W: tryptophane (Trp) et Y: tyrosine (Tyr). Les acides aminés constituant la protéine de fusion selon l'invention peuvent être de configuration L ou D, de préférence de configuration L.  The amino acids are here represented by their one-letter or three-letter code according to the following nomenclature: A: alanine (Ala); C: cysteine (Cys); D: aspartic acid (Asp); E: glutamic acid (Glu); F: phenylalanine (Phe); G: glycine (Gly); H: histidine (His); I: isoleucine (Ile); K: lysine (Lys); L: leucine (Leu); M: methionine (Met); N: asparagine (Asn); P: proline (Pro); Q: glutamine (Gln); R: arginine (Arg); S: serine (Ser); T: threonine (Thr); V: valine (Val); W: tryptophan (Trp) and Y: tyrosine (Tyr). The amino acids constituting the fusion protein according to the invention may be of L or D configuration, preferably of L configuration.
Tel qu’utilisé ici, le terme « protéine de fusion » se réfère à une protéine artificielle comprenant au moins deux domaines protéiques fusionnés en une seule molécule, étant entendu que ces deux domaines ne se trouvent jamais associés dans une protéine naturelle. Chacun des domaines de cette protéine peut être un domaine naturel, c’est-à-dire une protéine naturelle ou un fragment de celle-ci, ou un domaine synthétique, c’est-à-dire un domaine protéique n’existant pas dans la nature ou dans une protéine naturelle. La protéine de fusion est le plus souvent le produit d’un gène de fusion dans lequel les séquences codantes des différents domaines sont en phase. As used herein, the term "fusion protein" refers to an artificial protein comprising at least two fused protein domains in a single molecule, it being understood that these two domains are never associated in a natural protein. Each of the domains of this protein may be a natural domain, i.e., a natural protein or a fragment thereof, or a synthetic domain, i.e. a Protein domain does not exist in nature or in a natural protein. The fusion protein is most often the product of a fusion gene in which the coding sequences of the different domains are in phase.
La protéine de fusion selon l’invention peut présenter une ou plusieurs modifications post-traductionnelles et/ou une ou plusieurs modifications chimiques telles que des glycosylations, amidations, acylations, acétylations, ubiquitinations, phosphorylations ou méthylations. Afin d’augmenter la résistance de la protéine de fusion selon l’invention aux protéases, notamment dans le cas d’utilisation in vitro, des groupements protecteurs peuvent être ajoutés aux extrémités C- et/ou N-terminale. Par exemple, le groupement protecteur à l’extrémité N-terminale peut être une acylation ou une acétylation et le groupement protecteur à l’extrémité C -terminale peut être une amidation ou une estérification. La protéine selon l’invention peut également comprendre des liaisons pseudo-peptidiques remplaçant les liaisons peptidiques « classiques » CONH et conférant une résistance accrue aux protéases, telles que CHOH-CH2, NHCO, CH2- O, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH, et CH2-S.  The fusion protein according to the invention may have one or more post-translational modifications and / or one or more chemical modifications such as glycosylations, amidations, acylations, acetylations, ubiquitinations, phosphorylations or methylations. In order to increase the resistance of the fusion protein according to the invention to proteases, especially in the case of in vitro use, protective groups may be added to the C- and / or N-terminal ends. For example, the protecting group at the N-terminus may be acylation or acetylation and the protective group at the C-terminus may be amidation or esterification. The protein according to the invention may also comprise pseudo-peptide bonds replacing the "conventional" CONH peptide bonds and conferring increased resistance to proteases, such as CHOH-CH 2, NHCO, CH 2 -O, CH 2 CH 2, CO-CH 2, NN, CH = CH, CH2NH, and CH2-S.
Selon certains modes de réalisation, la protéine de fusion peut comprendre, outre le domaine recombinase fusionné à un domaine photorécepteur, un domaine peptidique additionnel en N-terminal ou C-terminal, de préférence en C-terminal. Ce domaine additionnel est de préférence fusionné au domaine recombinase de la protéine de fusion. Le domaine additionnel peut être un tag (ou étiquette) utile pour la purification ou l’immobilisation de la protéine de fusion. De tels tags sont bien connus de l’homme du métier et incluent par exemple les tags histidine (His6), FLAG, HA (épitope dérivé de l’hémagglutinine du virus de la grippe), MYC (épitope dérivé de la proto-oncoprotéine humaine MYC) ou GST (glutathion-S-transférase). Optionnellement, la protéine de fusion peut comprendre un site de clivage par une protéase ou un agent chimique permettant de supprimer ce domaine additionnel. According to some embodiments, the fusion protein may comprise, in addition to the recombinase domain fused to a photoreceptor domain, an additional N-terminal or C-terminal, preferably C-terminal, peptide domain. This additional domain is preferably fused to the recombinase domain of the fusion protein. The additional domain may be a tag (or tag) useful for purification or immobilization of the fusion protein. Such tags are well known to those skilled in the art and include, for example, the tags histidine (His 6 ), FLAG, HA (epitope derived from the hemagglutinin of the influenza virus), MYC (epitope derived from the proto-oncoprotein MYC) or GST (glutathione-S-transferase). Optionally, the fusion protein may comprise a protease cleavage site or a chemical agent to suppress this additional domain.
Selon des modes de réalisation préférés, la protéine de fusion ne comprend aucune séquence ou domaine additionnel en N-terminal du domaine photorécepteur ou en C- terminal du domaine recombinase.  According to preferred embodiments, the fusion protein does not comprise any additional N-terminal sequence or domain of the photoreceptor or C-terminal domain of the recombinase domain.
Le domaine recombinase de la protéine de fusion selon l’invention peut être tout domaine protéique présentant une activité recombinase. Il est notamment entendu que l’activité recombinase ne nécessite aucune hétéro-dimérisation avec un autre domaine ou une autre protéine. Elle est intrinsèque au domaine recombinase et peut être aisément testée par toute technique connue de l’homme du métier (cf. par exemple, une des techniques décrites ci-dessous) appliquée au domaine recombinase seul (non fusionné au domaine photorécepteur). The recombinase domain of the fusion protein according to the invention may be any protein domain exhibiting recombinase activity. It is understood that the recombinase activity does not require any hetero-dimerization with another domain or another protein. It is intrinsic to the recombinase domain and can easily be tested by any technique known to those skilled in the art (see, for example, one of the techniques described below) applied to the recombinase domain alone (not fused to the photoreceptor domain).
Tel qu’utilisé ici, le terme « recombinase » se réfère à une ADN recombinase site- spécifique, c’est-à-dire une ADN recombinase qui reconnaît et se lie à des régions cibles spécifiques, ou sites de reconnaissance, de l’ADN et catalyse une réaction de recombinaison entre les acides nucléiques de ces sites. Les sites de reconnaissance sont généralement de courtes séquences (d’environ 30 à 40 nucléotides) qui sont spécifiques de chaque recombinase. Ces enzymes présentent à la fois une activité endonucléase et une activité ligase et catalysent (i) la délétion d’un fragment d’ADN flanqué de deux sites de reconnaissance compatibles et dans la même orientation et/ou (ii) l’inversion d’un fragment d’ADN flanqué de deux sites de reconnaissance compatibles et dans des orientations opposées et/ou (iii) la translocation intra- ou intermoléculaire d'un fragment d'ADN flanqué d’un site de reconnaissance vers un autre site de reconnaissance compatible. L’activité recombinase d’une protéine peut être évaluée par toute méthode connue de l’homme du métier, notamment par la méthode exposée dans la partie expérimentale du présent document ou par l’un des nombreux tests décrits dans la littérature tels que par exemple l'apparition ou la disparition d'un signal rapportant la présence ou l'intégrité d'un acide nucléique ciblé par la recombinase, tel qu’une molécule d’ADN comprenant d'une part une séquence codant une protéine rapportrice telle que la beta-galactosidase, la GLP (Green Lluorescent Protein), la luciférase ou la protéine fluorescente mCherry, et d'autre part un ou plusieurs sites de reconnaissance de la recombinase, et dont le remaniement par la recombinase affecte l'expression de la protéine rapportrice (disparition ou apparition du signal).  As used herein, the term "recombinase" refers to a site-specific recombinase DNA, i.e. a recombinase DNA that recognizes and binds to specific target regions, or recognition sites, of the DNA and catalyzes a recombination reaction between the nucleic acids of these sites. The recognition sites are generally short (about 30 to 40 nucleotides) sequences that are specific for each recombinase. These enzymes exhibit both an endonuclease activity and a ligase activity and catalyze (i) the deletion of a DNA fragment flanked by two compatible recognition sites and in the same orientation and / or (ii) the inversion of a DNA fragment flanked by two compatible recognition sites and in opposite orientations and / or (iii) the intra- or intermolecular translocation of a DNA fragment flanked from one recognition site to another compatible recognition site . The recombinase activity of a protein can be evaluated by any method known to those skilled in the art, in particular by the method described in the experimental part of this document or by one of the many tests described in the literature such as, for example the appearance or the disappearance of a signal relating the presence or the integrity of a nucleic acid targeted by the recombinase, such as a DNA molecule comprising on the one hand a coding sequence for a reporter protein such as beta -galactosidase, GLP (Green Lluorescent Protein), luciferase or mCherry fluorescent protein, and secondly one or more recombinase recognition sites, and whose recombinase rearrangement affects the expression of the reporter protein ( disappearance or appearance of the signal).
Le domaine recombinase peut être une protéine recombinase ou un variant fonctionnel de celle-ci.  The recombinase domain may be a recombinase protein or a functional variant thereof.
De nombreuses recombinases ont été décrites dans la littérature et sont utilisables dans la présente invention. Des exemples de recombinases comprennent, sans y être limités, la recombinase CRE du phage Pl, la recombinase PLP de Saccharomyces cerevisiae, la recombinase R de Zygosaccharomyces rouxii, la recombinase HIN de Salmonella, la recombinase A de Kluyveromyces drosophilarium ou Kluyveromyces waltii, l’intégrase l Int, la recombinase GIN du phage Mu, l’intégrase PhiC3l, la résolvase Tn3, la recombinase TRE, la recombinase DRE (Anastassiadis et al. Disease Models & Mechanisms 2009 2: 508-515) et la beta-recombinase procaryote. Many recombinases have been described in the literature and are useful in the present invention. Examples of recombinases include, but are not limited to, phage P1 CRE recombinase, Saccharomyces cerevisiae PLP recombinase, Zygosaccharomyces rouxii R recombinase, Salmonella HIN recombinase, Kluyveromyces drosophilarium recombinase A or Kluyveromyces waltii, int integrase, the Mu phage GIN recombinase, the PhiC3l integrase, the Tn3 resolvase, TRE recombinase, DRE recombinase (Anastassiadis et al., Disease Models & Mechanisms 2009 2: 508-515), and prokaryotic beta-recombinase.
De préférence, la protéine recombinase est choisie dans le groupe constitué de la recombinase CRE et de la recombinase FLP.  Preferably, the recombinase protein is selected from the group consisting of CRE recombinase and FLP recombinase.
La recombinase FLP est une enzyme dérivée du plasmide 2-micron de Saccharomyces cerevisiae et catalysant la réaction de recombinaison entre deux sites spécifiques FRT. Comme les sites LoxP, les sites FRT sont constitués d’une séquence asymétrique de 8 pb encadrée par deux bras palindromiques de 13 pb. Il existe de nombreuses variations/mutants des sites FRT et LoxP.  The FLP recombinase is an enzyme derived from the Saccharomyces cerevisiae 2-micron plasmid and catalyzes the recombination reaction between two specific FRT sites. Like the LoxP sites, the FRT sites consist of an asymmetric 8 bp sequence framed by two 13 bp palindromic arms. There are many variations / mutants of the FRT and LoxP sites.
De manière plus particulièrement préférée, la protéine recombinase est la recombinase CRE. La recombinase CRE (Uniprot : P06956 ; NCBI GenelD : 2777477) est une tyrosine recombinase issue du bactériophage Pl dont la séquence est présentée en SEQ ID NO : 1. Comme mentionné précédemment, cette enzyme catalyse la réaction de recombinaison entre deux sites spécifiques LoxP.  More preferably, the recombinase protein is CRE recombinase. The recombinase CRE (Uniprot: P06956, NCBI GenelD: 2777477) is a tyrosine recombinase derived from the bacteriophage P1 whose sequence is presented in SEQ ID NO: 1. As mentioned above, this enzyme catalyzes the recombination reaction between two specific LoxP sites.
Le terme « variant fonctionnel » se réfère à une protéine dont la séquence diffère de la protéine parente par au moins une substitution, insertion ou délétion mais qui conserve une activité recombinase.  The term "functional variant" refers to a protein whose sequence differs from the parent protein by at least one substitution, insertion or deletion but which retains recombinase activity.
De nombreux variants de protéines recombinases ont été décrits dans la littérature, en particulier des variants des recombinases CRE et FLP, et sont utilisables dans la présente invention. Ces variants peuvent être naturels ou synthétiques et présentent une activité recombinase telle que définie ci-dessus. Ils peuvent par exemple reconnaître d’autres sites de reconnaissance que l’enzyme sauvage (voir par exemple l’article de Santoro and Schultz, Proc Natl Acad Sci U S A. 2002 Apr 2;99(7):4l 85-90 décrivant des variants de la recombinase CRE), présenter des caractéristiques améliorées telles qu’une thermostabilité accrue (voir par exemple les variants thermostables de la recombinase FLP décrits dans les articles de Buchholz et al., 1998, Nat Biotechnol. 16, 657-662 et Raymond and Soriano, 2007, PLoS ONE 2, el62), une précision accrue (voir par exemple les variants de la recombinase CRE décrits dans la demande WO 2014/158593), une expression améliorée dans les cellules de mammifères (voir par exemple les variants de la recombinase CRE décrits dans le brevet US 6,734,295).  Numerous recombinase protein variants have been described in the literature, in particular variants of CRE and FLP recombinases, and are useful in the present invention. These variants may be natural or synthetic and have recombinase activity as defined above. They may, for example, recognize other recognition sites than the wild-type enzyme (see, for example, the article by Santoro and Schultz, Proc Natl Acad Sci US A, 2002 Apr 2, 99 (7): 41 85-90 describing variants of the CRE recombinase), have improved characteristics such as increased thermostability (see, for example, the thermostable variants of the FLP recombinase described in the articles by Buchholz et al., 1998, Nat Biotechnol 16, 657-662 and Raymond and Soriano, 2007, PLoS ONE 2, el62), increased precision (see, for example, the variants of the CRE recombinase described in application WO 2014/158593), improved expression in mammalian cells (see, for example, the variants of CRE recombinase described in US Patent 6,734,295).
De préférence, les variants fonctionnels présentent au moins 80% d’identité de séquence avec la protéine recombinase parente, de manière plus particulièrement préférée au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la protéine recombinase parente. Preferably, the functional variants have at least 80% sequence identity with the parent recombinase protein, more preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with the parent recombinase protein.
Tel qu'utilisé ici, le terme "identité de séquence" ou "identité" se réfère au nombre (%) d'appariements (résidus d'acides aminés identiques) aux positions provenant d'un alignement de deux séquences polypeptidiques. L'identité de séquence est déterminée en comparant les séquences lorsqu'elles sont alignées de manière à maximiser le chevauchement et l'identité tout en minimisant les interruptions de séquence. En particulier, l'identité de séquence peut être déterminée en utilisant l'un quelconque des nombreux algorithmes d'alignement global ou local, en fonction de la longueur des deux séquences. Des séquences de longueurs similaires sont de préférence alignées en utilisant des algorithmes d'alignement global (e.g. Needleman & Wunsch, J. Mol. Biol 48:443, 1970) qui alignent les séquences de manière optimale sur toute la longueur, tandis que des séquences de longueurs sensiblement différentes sont de préférence alignées en utilisant un algorithme d'alignement local, par exemple l'algorithme de Smith et Waterman (Smith et Waterman, Adv. Appl. Math. 2:482, 1981) ou l'algorithme d'Altschul (Altschul et al (1997) Nucleic Acids Res. 25:3389-3402 ; Altschul et al (2005) FEBS J. 272:5101-5109). L'alignement dans le but de déterminer le pourcentage d'identité de séquence d'acides aminés peut être réalisé par toute méthode connue de l’homme du métier, par exemple en utilisant un logiciel disponible sur des sites Internet tels que http: //blast.ncbi.nlm. nih.gov / ou http://www.ebi.ac.uk/Tools/emboss/. T /homme de l'art peut aisément déterminer les paramètres appropriés pour mesurer l'alignement. Aux fins de la présente invention, les valeurs de pourcentage d'identité de séquence d'acides aminés désignent des valeurs générées en utilisant le programme EMBOSS Needle d'alignement de séquences par paires qui crée un alignement global optimal de deux séquences en utilisant l'algorithme de Needleman-Wunsch dans lequel les paramètres sont les paramètres par défaut : Scoring matrix = BLOSUM62, Gap open = 10, Gap extend = 0.5, End gap penalty = false, End gap open = 10 and End gap extend = 0.5.  As used herein, the term "sequence identity" or "identity" refers to the number (%) of matches (identical amino acid residues) at the positions arising from an alignment of two polypeptide sequences. Sequence identity is determined by comparing sequences when aligned to maximize overlap and identity while minimizing sequence interruptions. In particular, the sequence identity can be determined using any of the many global or local alignment algorithms, depending on the length of the two sequences. Sequences of similar lengths are preferably aligned using global alignment algorithms (eg Needleman & Wunsch, J. Mol Biol 48: 443, 1970) that optimally align the sequences over the entire length, while sequences substantially different lengths are preferably aligned using a local alignment algorithm, for example the Smith and Waterman algorithm (Smith and Waterman, Adv Appl Math 2: 482, 1981) or the Altschul algorithm. (Altschul et al (1997) Nucleic Acids Res 25: 3389-3402, Altschul et al (2005) FEBS J. 272: 5101-5109). The alignment for the purpose of determining the percentage of amino acid sequence identity can be achieved by any method known to those skilled in the art, for example by using software available on Internet sites such as http: // blast.ncbi.nlm. nih.gov / or http://www.ebi.ac.uk/Tools/emboss/. Those skilled in the art can readily determine the appropriate parameters for measuring alignment. For purposes of the present invention, amino acid sequence percent identity values refer to values generated using the pairwise sequence alignment program EMBOSS Needle which creates an optimal overall alignment of two sequences using the Needleman-Wunsch algorithm in which the parameters are the default parameters: Scoring matrix = BLOSUM62, Gap open = 10, Gap extend = 0.5, End gap penalty = false, End gap open = 10 and End gap extend = 0.5.
Alternativement, les variants fonctionnels d’une recombinase diffèrent de cette dernière par 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 substitutions, insertions et/ou délétions d’acides aminés, de préférence par 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 substitutions et/ou délétions d’acides aminés. En particulier, les variants fonctionnels d’une recombinase peuvent différer de cette dernière par 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 substitutions d’acides aminés, de préférence par 1 ou 2 substitutions d’acides aminés. Alternatively, the functional variants of a recombinase differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 substitutions, insertions and / or deletions of amino acids, preferably 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 substitutions and / or deletions of amino acids. In particular, the functional variants of a recombinase may differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 at 10 or 1-5 amino acid substitutions, preferably with 1 or 2 amino acid substitutions.
Le terme « substitution », tel qu'utilisé ici par rapport à une position ou à un acide aminé, signifie que l'acide aminé dans la position particulière a été remplacé par un autre acide aminé ou qu'un acide aminé différent de celui de la protéine de type sauvage est présent. Le terme « substitution » peut désigner le remplacement d'un résidu d'acide aminé par un autre choisi parmi les 20 résidus d'acides aminés standard naturels, les résidus d'acides aminés naturels rares (par exemple hydroxyproline, hydroxylysine, allohydroxylysine, 6-N-méthyllysine, N-éthylglycine, N-méthylglycine, N- éthylasparagine, allo-isoleucine, N-méthylisoleucine, N-méthylvaline, pyroglutamine, acide aminobutyrique, omithine) et d'acides aminés non naturels (par exemple norleucine, norvaline et cyclohexyl-alanine). De préférence, le terme « substitution » se réfère au remplacement d'un résidu d'acide aminé par un autre choisi parmi les 20 résidus d'acides aminés standards naturels (G, P, A, V, L, I, M, C, F, Y, W, H, K, R, Q, N, E, D, S et T). Dans le présent document, la terminologie suivante est utilisée pour désigner une substitution: D341A indique que le résidu d'acide aminé à la position 341 de SEQ ID NO : 1 (acide aspartique, D) est changé en alanine (A).  The term "substitution" as used herein with respect to a position or an amino acid means that the amino acid in the particular position has been replaced by another amino acid or amino acid different from that of the wild-type protein is present. The term "substitution" may refer to the replacement of an amino acid residue by another one of the 20 natural standard amino acid residues, the rare natural amino acid residues (eg hydroxyproline, hydroxylysine, allohydroxylysine, 6 N-methyllysine, N-ethylglycine, N-methylglycine, N-ethylasparagine, allo-isoleucine, N-methylisoleucine, N-methylvaline, pyroglutamine, aminobutyric acid, omithine) and unnatural amino acids (eg norleucine, norvaline and cyclohexyl-alanine). Preferably, the term "substitution" refers to the replacement of one amino acid residue with another selected from the 20 standard natural amino acid residues (G, P, A, V, L, I, M, C , F, Y, W, H, K, R, Q, N, E, D, S and T). In this document, the following terminology is used to denote a substitution: D341A indicates that the amino acid residue at position 341 of SEQ ID NO: 1 (aspartic acid, D) is changed to alanine (A).
La ou les substitutions peuvent être des substitutions conservatives ou non conservatives. Le terme « substitution conservative » tel qu’utilisé dans ce document, se réfère à une substitution d’un résidu d’acide aminé par un autre qui présente des propriétés chimiques ou physiques similaires (taille, charge ou polarité). Des exemples de substitutions conservatives se font parmi (i) les acides aminés basiques (arginine, lysine et histidine), (ii) les acides aminés acides (acide glutamique et acide aspartique), (iii) les acides aminés polaires (glutamine et asparagine ou sérine, thréonine et tyrosine ), (iv) les acides aminés hydrophobes (méthionine, leucine, isoleucine et valine), (v) les acides aminés aromatiques (phénylalanine, tryptophane) et (vi) les petits acides aminés (glycine, alanine).  The substitution (s) may be conservative or non-conservative substitutions. The term "conservative substitution" as used herein refers to a substitution of one amino acid residue for another that has similar chemical or physical properties (size, charge, or polarity). Examples of conservative substitutions are among (i) basic amino acids (arginine, lysine and histidine), (ii) acidic amino acids (glutamic acid and aspartic acid), (iii) polar amino acids (glutamine and asparagine or serine, threonine and tyrosine), (iv) hydrophobic amino acids (methionine, leucine, isoleucine and valine), (v) aromatic amino acids (phenylalanine, tryptophan) and (vi) small amino acids (glycine, alanine).
Selon certains modes de réalisation, le variant fonctionnel est obtenu en délétant des résidus en N-ter et/ou C-ter d’une recombinase de façon à obtenir un fragment comprenant au moins 100, 150, 200, 250 ou 300 acides aminés contigus de ladite recombinase, tout en conservant l'activité recombinase. De préférence, le fragment est obtenu par délétion de 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 acides aminés en N- terminal et/ou C-terminal d’une protéine recombinase. Le nombre d’acides aminés qui peuvent être délétés sans affecter activité recombinase dépend de la nature de la protéine et peut être aisément déterminé par l’homme du métier au moyen de techniques de routine. According to some embodiments, the functional variant is obtained by deleting N-ter and / or C-ter residues of a recombinase to obtain a fragment comprising at least 100, 150, 200, 250 or 300 contiguous amino acids. of said recombinase, while retaining recombinase activity. Preferably, the fragment is obtained by deletion of 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 amino acids in N-terminal and / or C-terminal of a recombinase protein. . The number of amino acids that can be deleted without affecting recombinase activity depends on the nature of the protein and can be readily determined by those skilled in the art using routine techniques.
Dans un mode de réalisation particulier, le domaine recombinase est la recombinase CRE ou un variant fonctionnel de celle-ci. In a particular embodiment, the recombinase domain is the CRE recombinase or a functional variant thereof.
Le variant fonctionnel peut être tout variant de la recombinase CRE connu de l’homme du métier et décrit dans la littérature tel que par exemple les variants décrits dans l’article de Santoro and Schultz (Proc Natl Acad Sci U S A. 2002 Apr 2;99(7):4l85- 90), dans la demande WO 2014/158593, dans le brevet US 6,734,295, et dans l'article de Frank Buchholz and A. Francis Stewart (Nature Biotechnology 2001 19:1047-1052).  The functional variant may be any variant of the CRE recombinase known to those skilled in the art and described in the literature such as, for example, the variants described in the article by Santoro and Schultz (Proc Natl Acad Sci US A, 2002 Apr 2; 99 (7): 4185-90), in WO 2014/158593, in US 6,734,295, and in the article by Frank Buchholz and A. Francis Stewart (Nature Biotechnology 2001 19: 1047-1052).
Selon un mode de réalisation, le variant fonctionnel de la recombinase CRE a une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 1, de préférence au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la SEQ ID NO : 1.  According to one embodiment, the functional variant of the CRE recombinase has a sequence having at least 80% sequence identity with SEQ ID NO: 1, preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with SEQ ID NO: 1.
Les inventeurs ont ici démontré que la recombinase CRE conserve son activité après délétion de 31 résidus en N-ter et/ou de 3 résidus en C-ter. The inventors have here demonstrated that the CRE recombinase retains its activity after deletion of 31 residues in N-ter and / or 3 residues in C-ter.
Ainsi, selon un mode de réalisation particulier, le variant fonctionnel de la recombinase CRE peut comprendre, ou consister en,  Thus, according to a particular embodiment, the functional variant of the CRE recombinase may comprise, or consist of,
- la séquence SEQ ID NO : 2 (résidus 32 à 340 de la SEQ ID NO : 1), ou the sequence SEQ ID NO: 2 (residues 32 to 340 of SEQ ID NO: 1), or
- une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2, de préférence au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la SEQ ID NO : 2. a sequence having at least 80% sequence identity with SEQ ID NO: 2, preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97 %, 98% or 99% sequence identity with SEQ ID NO: 2.
Le variant fonctionnel de la recombinase CRE peut également comprendre, ou consister en, une recombinase CRE de SEQ ID NO : 1 dans laquelle au maximum 31 acides aminés successifs ont été délétés en N-terminal et/ou au maximum 3 acides aminés successifs ont été délétés en C-terminal. En particulier, le variant fonctionnel de la recombinase CRE peut comprendre, ou consister en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés successifs ont été délétés en N- terminal. Dans certains modes de réalisation, le variant fonctionnel de la recombinase CRE peut présenter une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1. Les résidus du variant correspondant aux résidus E340 et D341 de la SEQ ID NO : 1 sont aisément identifiés par l’homme du métier au moyen d’un algorithme d’alignement de séquences. The functional variant of the CRE recombinase may also comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which at most 31 successive amino acids have been deleted at the N-terminal and / or at most 3 successive amino acids have been deleted. deleted in C-terminal. In particular, the functional variant of the CRE recombinase may comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 successive amino acids have been deleted at the N-terminal. In certain embodiments, the functional variant of the CRE recombinase may have a substitution at the residue corresponding to the E340 residue of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO. The residues of the variant corresponding to residues E340 and D341 of SEQ ID NO: 1 are readily identified by those skilled in the art by means of a sequence alignment algorithm.
Le ou les résidus de substitution sont choisis indépendamment dans le groupe constitué de A, G, V, L, I, P, M, W, C, N, Q, S, T et Y. De préférence, le ou les résidus sont substitués par un résidu alanine.  The substitution residue or residues are independently selected from the group consisting of A, G, V, L, I, P, M, W, C, N, Q, S, T and Y. Preferably, the residue or residues are substituted with an alanine residue.
Selon un mode particulier de réalisation, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1. According to a particular embodiment, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted. N-terminal, and optionally having a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1.
De préférence, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 19 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1  Preferably, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 19 or 31 amino acids have been deleted at the N-terminal, and exhibiting optionally a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the residue corresponding to residue D341 of SEQ ID NO: 1
Selon un mode de réalisation préféré, le domaine recombinase est According to a preferred embodiment, the recombinase domain is
- un variant fonctionnel de la recombinase CRE de la SEQ ID NO: 1 obtenu par délétion de 19 acides aminés en N-terminal et substitution des résidus 340 et 341 de la SEQ ID NO: 1 par une alanine (SEQ ID NO : 3), ou  a functional variant of the CRE recombinase of SEQ ID NO: 1 obtained by deletion of 19 amino acids at the N-terminal and substitution of residues 340 and 341 of SEQ ID NO: 1 by an alanine (SEQ ID NO: 3) , or
- un variant fonctionnel de la recombinase CRE de la SEQ ID NO: 1 obtenu par délétion de 31 acides aminés en N-terminal (SEQ ID NO : 4).  a functional variant of the CRE recombinase of SEQ ID NO: 1 obtained by deletion of 31 amino acids at the N-terminal (SEQ ID NO: 4).
Le domaine photorécepteur de la protéine de fusion selon l’invention est un domaine obtenu à partir d’une protéine photoréceptrice et qui a la propriété de changer de conformation lorsqu’il est exposé à la lumière. De préférence, le domaine photorécepteur est sensible à la lumière bleue, soit une lumière d’une longueur d’onde comprise entre 400 et 500 nm. The photoreceptor domain of the fusion protein according to the invention is a domain obtained from a photoreceptor protein and which has the property of changing conformation when exposed to light. Preferably, the domain The photoreceptor is sensitive to blue light, a light having a wavelength between 400 and 500 nm.
Les protéines photoréceptrices sont des protéines sensibles à la lumière impliquées dans la perception et la réponse à la lumière d’une grande variété d’organismes. Ces capteurs de lumière possèdent un domaine photorécepteur qui réagit et déclenche une cascade de transduction de signal. Les photorécepteurs nécessitent généralement la présence de co-facteurs qui captent les photons, comme par exemple la flavine adénine dinucléotide (FAD) ou la flavine mononucléotide (FMN).  Photoreceptor proteins are light-sensitive proteins involved in the perception and response to light of a wide variety of organisms. These light sensors have a photoreceptor domain that reacts and triggers a signal transduction cascade. Photoreceptors generally require the presence of co-factors that capture photons, such as flavin adenine dinucleotide (FAD) or flavin mononucleotide (FMN).
Le domaine photorécepteur de la protéine de fusion selon l’invention peut être obtenu à partir de toute protéine photoréceptrice connue de l’homme du métier telle que la rhodopsine, la mélanopsine, la photopsine, la protéine kinase C, les photolyases cryptochrome 1 et 2, les phototropines, le phytochrome, les protéines fluorescentes photoconvertibles, les protéines contenant un domaine PAS (Per-ARNT-Sim) telles que décrites dans Taylor, I. B. Zhulin, Microbiol. Mol. Biol. Rev. 63, 479 (1999) ou les protéines contenant un domaine BLUF telles que décrites dans Wu, Q., and Gardner, K.H. (2009) Biochemistry (Mosc.) 48, 2620-2629.  The photoreceptor domain of the fusion protein according to the invention can be obtained from any photoreceptor protein known to those skilled in the art such as rhodopsin, melanopsin, photopsin, protein kinase C, cryptochrome photolyases 1 and 2 , phototropins, phytochrome, photoconvertible fluorescent proteins, proteins containing a PAS domain (Per-ARNT-Sim) as described in Taylor, IB Zhulin, Microbiol. Mol. Biol. Rev. 63, 479 (1999) or BLUF domain-containing proteins as described in Wu, Q., and Gardner, K.H. (2009) Biochemistry (Mosc.) 48, 2620-2629.
De préférence, le domaine photorécepteur de la protéine de fusion est un domaine LOV (Light Oxygen Voltage). Les domaines LOV appartiennent à la superfamille des domaines PAS et sont des photorécepteurs flavine-dépendant.  Preferably, the photoreceptor domain of the fusion protein is an LOV (Light Oxygen Voltage) domain. The LOV domains belong to the superfamily of PAS domains and are flavin-dependent photoreceptors.
Selon un mode de réalisation, le domaine photorécepteur de la protéine de fusion selon l’invention comprend, ou consiste en, un domaine LOV d’une phototropine, ou un variant ou dérivé de celui-ci.  According to one embodiment, the photoreceptor domain of the fusion protein according to the invention comprises, or consists of, a LOV domain of a phototropin, or a variant or derivative thereof.
Les phototropines sont des photorécepteurs végétaux qui possèdent deux domaines LOV et un domaine Ser/Thr kinase. En particulier, le domaine photorécepteur peut être choisi parmi les domaines LOV des phototropines d’Avena Sativa (UNIPROT Gene ID : 049003) , Arabidopsis thaliana (Gene ID : 823721 et 835926), Neurospora crassa (GenBank ID: AAK08514.1), Brucella mellitus ou Chlamydomonas reinhardtii (Zoltowski, B.D., Vaccaro, B., and Crâne, B. R. (2009) Nat. Chem. Biol. 5, 827-834).  Phototropins are plant photoreceptors that have two LOV domains and one Ser / Thr kinase domain. In particular, the photoreceptor domain may be chosen from the LOV domains of Avena Sativa phototropins (UNIPROT Gene ID: 049003), Arabidopsis thaliana (Gene ID: 823721 and 835926), Neurospora crassa (GenBank ID: AAK08514.1), Brucella mellitus or Chlamydomonas reinhardtii (Zoltowski, BD, Vaccaro, B., and Skull, BR (2009) Nat Chem Biol., 5, 827-834).
De préférence, le domaine photorécepteur est un domaine LOV de phototropine d vena sativa, en particulier le domaine LOV1 ou LOV2 de la phototropine 1 d vena sativa, et de manière plus particulièrement préférée le domaine LOV2 de la phototropine 1 d Avena sativa. Le domaine LOV2 d 'Avenu sativa (asLOV2) est constitué de 143 acides aminés (SEQ ID NO : 14) (résidus 404 à 546 de la phototropine 1, Genbank ID : AAC05083) et se lie à la FMN (Flavine MonoNucléotide). Comme les autres membres de la famille LOV, la structure de asLOV2 révèle un domaine PAS, formé de 2 brins b (A et B) et de 3 hélices a (C, D et E), complété par un connecteur hélical Fa et de 3 feuillets b (G, H, I). Les 5 brins b forment un feuillet b antiparallèle torsadé qui avec la boucle Fa et les hélices permettent l'insertion de FMN. La structure de ce photorécepteur montre une particularité à son extrémité C-Terminale, une hélice Ja d'une vingtaine d'acide aminés ainsi qu'une hélice A'a en extrémité N-Terminale (Halavaty and Moffat, 2007, Biochemistry (Mosc.) 46, 14001-14009; Harper, 2003, Science 301, 1541-1544; Zayner et al., 2012, L Mol. Biol. 419, 61-74). Sous l'effet de la lumière bleue, le photorécepteur asLOV2 subit une succession de réactions entraînant un changement conformationnel de la protéine et une libération ainsi qu'un relâchement de l'hélice Ja. Lorsque le domaine est intégré dans la phototropine (son contexte naturel), cette modification déclenche l'activité kinase de la phototropine. Preferably, the photoreceptor domain is an LOV domain of phototropin d vena sativa, in particular the LOV1 or LOV2 domain of phototropin 1 d vena sativa, and more particularly preferably the LOV2 domain of phototropin 1 of Avena sativa. Avenu sativa LOV2 domain (asLOV2) consists of 143 amino acids (SEQ ID NO: 14) (residues 404 to 546 of phototropin 1, Genbank ID: AAC05083) and binds to FMN (Flavin MonoNucleotide). Like the other members of the LOV family, the asLOV2 structure reveals a PAS domain consisting of 2 b-strands (A and B) and 3 a-helices (C, D and E), supplemented by a helical connector Fa and 3 sheets b (G, H, I). The 5 strands b form a twisted antiparallel sheet b which with the loop Fa and the propellers allow the insertion of FMN. The structure of this photoreceptor shows a peculiarity at its C-terminal end, a helix Ja of about twenty amino acids as well as an A'a helix at the N-terminus (Halavaty and Moffat, 2007, Biochemistry (Mosc. 46, 14001-14009, Harper, 2003, Science 301, 1541-1544, Zayner et al., 2012, Mol Mol Biol 419, 61-74). Under the effect of blue light, the asLOV2 photoreceptor undergoes a succession of reactions resulting in a conformational change of the protein and a release and a relaxation of the helix Ja. When the domain is integrated in phototropin (its natural context), this modification triggers the kinase activity of phototropin.
Le domaine photorécepteur peut également être un variant fonctionnel d’un domaine LOV de phototropine, en particulier un variant du domaine asLOV2. Le variant conserve la capacité du domaine LOV à changer de conformation en réponse à une stimulation lumineuse et présente au moins 80% d’identité de séquence avec le domaine LOV parent, de manière plus particulièrement préférée au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec le domaine LOV parent. La capacité du variant à changer de conformation en réponse à une stimulation lumineuse peut être aisément testé par toute technique connue de l’homme du métier telle que, par exemple, le test de liaison de asLOV2-SsrA à SspB décrit dans l’article de Lungu et al. 2012, Chem. Biol. 19, 507-517.  The photoreceptor domain may also be a functional variant of an LOV phototropin domain, particularly an asLOV2 domain variant. The variant retains the capacity of the LOV domain to change conformation in response to light stimulation and has at least 80% sequence identity with the parent LOV domain, more preferably at least 85%, 90%, 91% , 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with the parent LOV domain. The ability of the variant to change conformation in response to light stimulation can be easily tested by any technique known to those skilled in the art such as, for example, the asLOV2-SsrA binding assay to SspB described in the Lungu et al. 2012, Chem. Biol. 19, 507-517.
Selon un mode de réalisation préféré, le domaine photorécepteur est un dérivé d’un domaine LOV, de préférence un dérivé du domaine asLOV2. Par comparaison aux domaines LOV parents, ces dérivés présentent en général une réactivité accrue à la lumière, une expression accrue par la cellule hôte ou une stabilité différente.  According to a preferred embodiment, the photoreceptor domain is a derivative of a LOV domain, preferably a derivative of the asLOV2 domain. Compared with parent LOV domains, these derivatives generally exhibit increased light reactivity, increased expression by the host cell, or different stability.
De nombreux dérivés de domaine LOV, et en particulier du domaine asLOV2, ont été décrits dans la littérature. Ces dérivés incluent, sans y être limités, le domaine LOV- SsrA dans lequel le peptide SsrA bactérien a été incorporé dans l’hélice C-terminale d’asLOV2 (Lungu et al., 2012, Chem. Biol. 19, 507-517), le domaine iLID (Improved Light Induced Dimer) (Guntas et al., 2015, Proc. Natl. Acad. Sci. 112, 112-117), les mutants G528A et N358E tels que décrits dans l'article Strickland et al. Nature Methods (2010), 7 (8) 623-626, et les mutants décrits dans l'article de Kawano et al. PLoS One 2013 8(12): e82693 tels que V416T ou V416L. Numerous LOV domain derivatives, and in particular the asLOV2 domain, have been described in the literature. Such derivatives include, but are not limited to, the LOV-SsrA domain in which the bacterial SsrA peptide has been incorporated into the C-terminal helix of asLOV2 (Lungu et al., 2012, Chem Biol., 19, 507-517). ), the iLID domain (Improved Light Induced Dimer) (Guntas et al., 2015, Proc Natl Acad Sci 112, 112-117), mutants G528A and N358E as described in Strickland et al. Nature Methods (2010), 7 (8) 623-626, and the mutants described in the article by Kawano et al. PLoS One 2013 8 (12): e82693 such as V416T or V416L.
Selon un mode de réalisation particulier, le domaine photorécepteur de la protéine de fusion est un domaine iLID comprenant, ou consistant en, la séquence suivante MRGSHHHHHHGSLATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILG RN CRFLQGPETDR AT VRKIRD AIDN QTE VT V QLIN YTKS GKKFWN VFHLQPMR DYKGD V QYFIGV QLDGTERLHGAAEREA VCLIKKTAFQIX (SEQ ID NO : 13), dans laquelle X représente un ou plusieurs acides aminés.  In a particular embodiment, the photoreceptor domain of the fusion protein is an iLID domain comprising, or consisting of, the following sequence: : 13), wherein X represents one or more amino acids.
X peut être toute séquence d’ acides aminés adoptant une conformation en hélice alpha. De préférence, X représente un à 10 acides aminés, de manière plus préférée un à 9, 8, 7, 6, 5 ou 4 acides aminés, et de manière plus particulièrement préférée de un à trois acides aminés.  X can be any amino acid sequence adopting an alpha helical conformation. Preferably, X represents one to 10 amino acids, more preferably one to 9, 8, 7, 6, 5 or 4 amino acids, and more preferably one to three amino acids.
Selon certains modes particuliers de réalisation, X est choisi dans le groupe constitué  According to certain particular embodiments, X is chosen from the group consisting of
- d’un acide aminé choisi parmi A, D, K et L,  an amino acid chosen from A, D, K and L,
- d’une séquence de deux acides aminés choisie parmi IL, VV et AI, et  a sequence of two amino acids chosen from IL, VV and AI, and
- de la séquence QPG.  - the QPG sequence.
Selon certains modes préférés de réalisation, X est choisi dans le groupe constitué de IL et AI.  According to some preferred embodiments, X is selected from the group consisting of IL and AI.
Le domaine photorécepteur de la protéine de fusion peut être fusionné en N- terminal ou C-terminal du domaine recombinase. The photoreceptor domain of the fusion protein may be fused to the N-terminal or C-terminal domain of the recombinase domain.
De préférence, le domaine photorécepteur de la protéine de fusion est fusionné en N-terminal du domaine recombinase.  Preferably, the photoreceptor domain of the fusion protein is fused to the N-terminal of the recombinase domain.
Les deux domaines peuvent être immédiatement adjacents ou séparés par une ou plusieurs séquences de liaison. De préférence, les domaines sont séparés d’au maximum 10 acides aminés, de préférence d’au maximum 6, 5, 4, 3, 2 ou 1 acides aminés.  The two domains can be immediately adjacent or separated by one or more link sequences. Preferably, the domains are separated by up to 10 amino acids, preferably at most 6, 5, 4, 3, 2 or 1 amino acids.
Selon des modes de réalisation préférés, la ou les séquences de liaison entre les deux domaines ne comprennent pas de séquence de clivage reconnue par une protéase, en particulier de séquence reconnue par une protéase TEV. De manière plus particulièrement préférée, les deux domaines sont directement adjacents, c’est-à-dire sans séquence de liaison entre eux. According to preferred embodiments, the binding sequence (s) between the two domains do not comprise a cleavage sequence recognized by a protease, in particular of a sequence recognized by a TEV protease. More particularly preferably, the two domains are directly adjacent, that is to say without a link sequence between them.
Selon un mode de réalisation particulier, la protéine de fusion selon l’invention comprend, ou consiste en, une séquence choisie parmi les séquences SEQ ID NO : 5 à 12. According to a particular embodiment, the fusion protein according to the invention comprises, or consists of, a sequence chosen from the sequences SEQ ID NO: 5 to 12.
La protéine de fusion selon l’invention présente une activité recombinase photoactivable. Cela signifie que l’activation du domaine photorécepteur induit l’activation ou une augmentation de l’activité du domaine recombinase. The fusion protein according to the invention has a photoactivatable recombinase activity. This means that activation of the photoreceptor domain induces activation or enhancement of recombinase domain activity.
L’ activation du domaine photorécepteur est réalisée par exposition à une lumière dont la longueur d’onde peut varier selon la nature du photorécepteur. Comme mentionné ci-dessus, le domaine photorécepteur est de préférence sensible à la lumière bleue, soit une lumière d’une longueur d’onde comprise entre 400 nm et 500 nm, de préférence une lumière d’une longueur d’onde comprise entre 440 nm et 480 nm.  Activation of the photoreceptor domain is achieved by exposure to a light whose wavelength may vary depending on the nature of the photoreceptor. As mentioned above, the photoreceptor domain is preferably sensitive to blue light, ie a light having a wavelength of between 400 nm and 500 nm, preferably a light having a wavelength of between 440 nm and 480 nm.
La durée d’exposition à la lumière et l’intensité lumineuse peuvent être aisément déterminées par l’homme du métier.  The duration of exposure to light and the light intensity can be easily determined by those skilled in the art.
La protéine de fusion peut être exposée à une intensité lumineuse comprise entre 0,05 mW/cm2 et 50 mW/cm2, de préférence entre 1,5 mW/cm2 et 40 mW/cm2, et de manière plus particulièrement préférée entre 15 mW/cm2 et 40 mW/cm2. The fusion protein can be exposed to a light intensity of between 0.05 mW / cm 2 and 50 mW / cm 2 , preferably between 1.5 mW / cm 2 and 40 mW / cm 2 , and more particularly preferably between 15 mW / cm 2 and 40 mW / cm 2 .
Selon un mode de réalisation, la protéine de fusion est exposée à une intensité lumineuse comprise entre 2 mW/cm2 et 40 mW/cm2, de préférence entre 2 mW/cm2 et 10 mW/cm2. According to one embodiment, the fusion protein is exposed to a luminous intensity of between 2 mW / cm 2 and 40 mW / cm 2 , preferably between 2 mW / cm 2 and 10 mW / cm 2 .
De préférence, la durée d’exposition à la lumière est comprise entre 2 min et trois heures, de préférence entre 10 min et trois heures, de manière plus particulièrement préférée entre 30 min et deux heures. De manière tout particulièrement préférée, la durée d’exposition à la lumière est comprise entre 30 min et 90 min.  Preferably, the duration of exposure to light is between 2 minutes and three hours, preferably between 10 minutes and three hours, more preferably between 30 minutes and two hours. Most preferably, the exposure time is between 30 minutes and 90 minutes.
Selon un mode de réalisation particulier, l’activité recombinase de la protéine de fusion est induite par une exposition de 10 min à trois heures, de préférence de 30 min à deux heures, à une lumière bleue d’une intensité entre 2 mW/cm2 et 40 mW/cm2, de préférence entre 2 mW/cm2 et 10 mW/cm2. According to a particular embodiment, the recombinase activity of the fusion protein is induced by an exposure of 10 minutes to three hours, preferably from 30 minutes to two hours, to a blue light with an intensity of between 2 mW / cm. 2 and 40 mW / cm 2 , preferably between 2 mW / cm 2 and 10 mW / cm 2 .
Selon un autre mode de réalisation particulier, l’activité recombinase de la protéine de fusion est induite par une exposition de 2 min à deux heures, de préférence de 30 min à 90 min, à une lumière bleue d’une intensité entre 1,5 mW/cm2 et 40 mW/cm2, de préférence entre 15 mW/cm2 et 40 mW/cm2. According to another particular embodiment, the recombinase activity of the fusion protein is induced by an exposure of 2 minutes to two hours, preferably from 30 minutes to 90 minutes, to a blue light of an intensity between 1.5 mW / cm 2 and 40 mW / cm 2 , preferably between 15 mW / cm 2 and 40 mW / cm 2 .
Tel qu’utilisé ici, le terme « photoactivable » signifie de préférence que l’exposition de la protéine de fusion selon l’invention à la lumière permet d’obtenir une augmentation au minimum 15% de l’activité recombinase, de préférence une augmentation d’au minimum 25 % de l’activité recombinase, et de manière plus particulièrement préférée une augmentation d’au minimum 30%, 40% ou 50% de l’activité recombinase, par rapport au niveau sans exposition lumineuse. De manière plus particulièrement préférée, l’exposition de la protéine de fusion selon l’invention à une lumière bleue d’une intensité d’environ 2 mW/cm2 durant 90 min permet d’obtenir une augmentation d’au minimum 50% de l’activité recombinase, par rapport au niveau sans exposition lumineuse. Alternativement, l’exposition de la protéine de fusion selon l’invention à une lumière bleue d’une intensité entre 30 mW/cm2 et 40 mW/cm2 durant 30 min permet d’obtenir une augmentation d’au minimum 50% de l’activité recombinase, par rapport au niveau sans exposition lumineuse. As used herein, the term "photoactivatable" preferably means that exposing the fusion protein according to the invention to light achieves a minimum 15% increase in recombinase activity, preferably an increase in at least 25% of the recombinase activity, and more preferably at least 30%, 40% or 50% increase in recombinase activity, relative to the level without light exposure. More preferably, the exposure of the fusion protein according to the invention to a blue light of an intensity of about 2 mW / cm 2 for 90 min allows to obtain an increase of at least 50% of recombinase activity, relative to the level without light exposure. Alternatively, the exposure of the fusion protein according to the invention to a blue light of an intensity of between 30 mW / cm 2 and 40 mW / cm 2 for 30 min makes it possible to obtain an increase of at least 50% of recombinase activity, relative to the level without light exposure.
La présente invention concerne également un support solide sur lequel est immobilisée une protéine de fusion selon l’invention. Elle concerne également un procédé de préparation d’un tel support solide comprenant la fourniture d’une protéine de fusion selon l’invention et d’un support solide adapté, et l’immobilisation de ladite protéine sur ledit support. The present invention also relates to a solid support on which is immobilized a fusion protein according to the invention. It also relates to a process for preparing such a solid support comprising providing a fusion protein according to the invention and a suitable solid support, and immobilizing said protein on said support.
Les moyens d'immobilisation sont bien connus de l'homme de l'art (voir par exemple « Enzyme Technology » de Martin Chaplin et Christopher Bucke, Cambridge University Press, 1990). La protéine de fusion selon l’invention peut être immobilisée sur le support solide par tout moyen adapté tel qu’une liaison covalente ou non covalente. Une grande variété de matériaux peut être utilisée comme support d’immobilisation. Ces matériaux sont en général des matrices polymériques ou inorganiques inertes. Le support peut être par exemple membranaire, particulaire (e.g. billes, nanobilles, microbilles) ou fibreux. Des exemples de support comprennent, sans y être limité, des matrices de polyuréthane, du sépharose activé, de l’alginate, des résines Amberlite, Sephadex ou Duolite, des résines acryliques, des résines polystyrène ou des résines macroréticulées.  The immobilization means are well known to those skilled in the art (see, for example, "Enzyme Technology" by Martin Chaplin and Christopher Bucke, Cambridge University Press, 1990). The fusion protein according to the invention may be immobilized on the solid support by any suitable means such as a covalent or non-covalent bond. A wide variety of materials can be used as an immobilizer. These materials are generally inert polymeric or inorganic matrices. The support may for example be membrane, particulate (e.g., beads, nanobeads, microbeads) or fibrous. Examples of carriers include, but are not limited to, polyurethane matrices, activated sepharose, alginate, Amberlite, Sephadex or Duolite resins, acrylic resins, polystyrene resins or macroreticulated resins.
La présente invention concerne également un acide nucléique codant pour une protéine de fusion selon l’invention. L'acide nucléique peut être de l'ADN (ADNc ou ADNg), de l'ARN ou un mélange des deux. Il peut être sous forme monocaténaire ou sous forme duplex ou un mélange des deux. Il peut comprendre des nucléotides modifiés, comprenant par exemple une liaison modifiée, une base purine ou pyrimidine modifiée, ou un sucre modifié. Il peut être préparé par toute méthode connue de l'homme du métier, telle que la synthèse chimique, la recombinaison et la mutagenèse. L'acide nucléique selon l'invention peut être déduit de la séquence de la protéine de fusion selon l'invention et l'utilisation des codons peut être adaptée en fonction de la cellule hôte dans laquelle l'acide nucléique doit être transcrit et/ou traduit. Ces étapes peuvent être réalisées selon des méthodes bien connues de l'homme du métier et dont certaines sont décrites dans le manuel de référence Sambrook et al. (Sambrook et al., 2001, Molecular cloning: a laboratory manual, Third Edition Cold Spring Harbor). The present invention also relates to a nucleic acid encoding a fusion protein according to the invention. The nucleic acid can be DNA (cDNA or gDNA), RNA or a mixture of both. It may be in single-stranded or duplex form or a mixture of both. It may comprise modified nucleotides, comprising, for example, a modified linkage, a modified purine or pyrimidine base, or a modified sugar. It can be prepared by any method known to those skilled in the art, such as chemical synthesis, recombination and mutagenesis. The nucleic acid according to the invention can be deduced from the sequence of the fusion protein according to the invention and the use of the codons can be adapted according to the host cell in which the nucleic acid must be transcribed and / or translated. These steps can be performed according to methods well known to those skilled in the art and some of which are described in the reference manual Sambrook et al. (Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Third Edition).
La présente invention concerne en outre une cassette d’expression comprenant un acide nucléique selon l’invention, The present invention further relates to an expression cassette comprising a nucleic acid according to the invention,
Le terme « cassette d'expression » désigne ici une construction d'acide nucléique comprenant une région codante comprenant un acide nucléique selon l’invention et une ou plusieurs séquences régulatrices, la région codante et la ou les séquences régulatrices étant liées de manière opérationnelle.  The term "expression cassette" herein refers to a nucleic acid construct comprising a coding region comprising a nucleic acid according to the invention and one or more regulatory sequences, the coding region and the regulatory sequence (s) being operably linked.
L'expression « lié de manière opérationnelle » indique que les éléments sont combinés de manière à ce que l'expression de la région codante soit sous le contrôle de la ou des séquences régulatrices.  The term "operably linked" indicates that the elements are combined so that expression of the coding region is under the control of the regulatory sequence (s).
L'expression « séquence régulatrice » désigne une séquence d'acide nucléique nécessaire à l’expression ou contrôlant l'expression de la région codante. Les séquences régulatrices peuvent être endogènes ou hétérologues à la cellule hôte. De telles séquences sont bien connues de l’homme du métier qui peut aisément sélectionner les séquences régulatrices adaptées à chaque application et notamment à la cellule hôte dans laquelle l’expression est souhaitée. Sans y être limité, ces séquences peuvent comprendre notamment un promoteur, une séquence de polyadénylation, un terminateur de transcription, une région 3’UTR, une région 5’UTR et un peptide signal.  The term "regulatory sequence" refers to a nucleic acid sequence necessary to express or control the expression of the coding region. Regulatory sequences may be endogenous or heterologous to the host cell. Such sequences are well known to a person skilled in the art who can easily select the regulatory sequences adapted to each application and in particular to the host cell in which the expression is desired. Without being limited thereto, these sequences may comprise in particular a promoter, a polyadenylation sequence, a transcription terminator, a 3'UTR region, a 5'UTR region and a signal peptide.
De préférence, la cassette d’expression selon l’invention comprend, ou consiste en, un promoteur permettant d’initier la transcription, un acide nucléique selon l’invention, et un terminateur de transcription. Typiquement, la séquence du promoteur est placée en amont de la région codante et à une distance compatible avec le contrôle de l'expression de ladite région. Preferably, the expression cassette according to the invention comprises, or consists of, a promoter making it possible to initiate transcription, a nucleic acid according to the invention, and a transcription terminator. Typically, the promoter sequence is placed upstream of the coding region and at a distance compatible with the control of the expression of said region.
Le promoteur contient des séquences de contrôle transcriptionnel qui initient l'expression de l’acide nucléique codant pour une protéine de fusion de l'invention. Il peut être un promoteur reconnu par une cellule hôte ou un système d'expression in vitro. Le promoteur peut être tout polynucléotide présentant une activité transcriptionnelle dans les conditions d’utilisation envisagées, i.e. in vitro ou in vivo, et peut notamment être un promoteur obtenu à partir de gènes codant pour des polypeptides endogènes ou hétérologues à la cellule hôte, ou un promoteur mutant, tronqué ou hybride. Le promoteur peut être un promoteur fort, faible, constitutif ou inductible. Sur la base de ses connaissances, l’homme du métier peut aisément choisir le promoteur adapté.  The promoter contains transcriptional control sequences that initiate expression of the nucleic acid encoding a fusion protein of the invention. It may be a promoter recognized by a host cell or an in vitro expression system. The promoter may be any polynucleotide exhibiting transcriptional activity under the envisaged conditions of use, ie in vitro or in vivo, and may in particular be a promoter obtained from genes coding for endogenous or heterologous polypeptides at the host cell, or a mutant, truncated or hybrid promoter. The promoter may be a strong, weak, constitutive or inducible promoter. On the basis of his knowledge, a person skilled in the art can easily choose the adapted promoter.
Le terminateur de transcription est reconnu par une cellule hôte pour terminer la transcription. Le terminateur est fonctionnellement lié à l'extrémité 3' de l'acide nucléique selon l’invention. Tout terminateur qui est fonctionnel dans la cellule hôte peut être utilisé dans la présente invention.  The transcription terminator is recognized by a host cell to complete the transcription. The terminator is functionally linked to the 3 'end of the nucleic acid according to the invention. Any terminator that is functional in the host cell can be used in the present invention.
La présente invention concerne également un vecteur d’expression comprenant un acide nucléique ou une cassette d’expression selon l’invention. Ce vecteur d’expression peut être utilisé pour transformer une cellule hôte et permettre l’expression de l’acide nucléique selon l’invention dans ladite cellule. The present invention also relates to an expression vector comprising a nucleic acid or an expression cassette according to the invention. This expression vector can be used to transform a host cell and allow the expression of the nucleic acid according to the invention in said cell.
Le vecteur peut être un ADN ou un ARN, circulaire ou non, simple- ou double- brin. Il est avantageusement choisi parmi un plasmide, un phage, un phagemide, un virus, un cosmide et un chromosome artificiel.  The vector may be a DNA or an RNA, circular or not, single- or double-stranded. It is advantageously chosen from a plasmid, a phage, a phagemid, a virus, a cosmid and an artificial chromosome.
De manière générale, le vecteur est choisi de manière à être compatible avec la cellule hôte dans laquelle il doit être introduit. Le vecteur peut être un vecteur se répliquant de manière autonome, c'est-à-dire un vecteur existant en tant qu'entité extra chromosomique dont la réplication est indépendante de la réplication chromosomique, ou un vecteur qui, lorsqu'il est introduit dans la cellule hôte, est intégré dans le génome et répliqué avec le chromosome dans lequel il a été intégré.  In general, the vector is chosen to be compatible with the host cell into which it is to be introduced. The vector may be an autonomously replicating vector, i.e., an existing vector as an extra chromosomal entity whose replication is independent of chromosomal replication, or a vector which, when introduced into the host cell is integrated into the genome and replicated with the chromosome in which it has been integrated.
Avantageusement, le vecteur d’expression comprend des éléments régulateurs permettant l’expression de l’acide nucléique selon l’invention. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d’initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l’expression est souhaitée, sont bien connues de l’homme du métier. Advantageously, the expression vector comprises regulatory elements allowing the expression of the nucleic acid according to the invention. These elements may comprise, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. Methods for selecting these elements according to the host cell in which the expression is desired, are well known to those skilled in the art.
Le vecteur peut comporter en outre des éléments permettant sa sélection dans la cellule hôte comme, par exemple, un gène de résistance à un antibiotique ou un gène de sélection assurant la complémentation du gène respectif délété dans le génome de la cellule hôte. De tels éléments sont bien connus de l'homme du métier et largement décrits dans la littérature.  The vector may further comprise elements allowing its selection in the host cell, such as, for example, an antibiotic resistance gene or a selection gene ensuring the complementation of the respective gene deleted in the genome of the host cell. Such elements are well known to those skilled in the art and widely described in the literature.
Selon certains modes de réalisation, le vecteur comprend un ou plusieurs éléments permettant l'intégration du vecteur dans le génome de la cellule hôte. Cette intégration peut reposer sur une recombinaison homologue ou non homologue. Dans le cas d’une intégration ciblée, le vecteur peut contenir des séquences homologues d’une région cible du génome et qui permettent de cibler l’intégration par recombinaison homologue à un emplacement précis dans le génome de la cellule hôte.  In some embodiments, the vector comprises one or more elements for integrating the vector into the genome of the host cell. This integration may be based on homologous or non-homologous recombination. In the case of targeted integration, the vector may contain sequences homologous to a target region of the genome and which make it possible to target integration by homologous recombination at a specific location in the genome of the host cell.
Lorsque la réplication autonome du vecteur est souhaitée, le vecteur peut comprendre une origine de réplication fonctionnelle dans la cellule hôte.  When autonomous replication of the vector is desired, the vector may comprise a replication origin functional in the host cell.
Les méthodes pour sélectionner ces différents éléments en fonction du vecteur et de la cellule hôte dans laquelle l'expression est souhaitée sont bien connues de l'homme du métier. Les vecteurs selon l’invention peuvent être construits par les techniques classiques de biologie moléculaire.  The methods for selecting these different elements depending on the vector and the host cell in which the expression is desired are well known to those skilled in the art. The vectors according to the invention can be constructed by standard molecular biology techniques.
La présente invention concerne l’utilisation d’un acide nucléique, d’une cassette d’expression ou d’un vecteur d’expression selon l’invention pour transformer ou transfecter une cellule. La cellule hôte peut être transformée/transfectée de manière transitoire ou stable et l’acide nucléique, la cassette ou le vecteur peut être contenu dans la cellule sous forme d’épisome ou sous forme chromosomique. The present invention relates to the use of a nucleic acid, an expression cassette or an expression vector according to the invention to transform or transfect a cell. The host cell may be transiently / stably transfected / transfected and the nucleic acid, cassette or vector may be contained in the cell as an episome or chromosomal form.
La présente invention concerne également une cellule hôte comprenant un acide nucléique, une cassette ou un vecteur d’expression selon l’invention.  The present invention also relates to a host cell comprising a nucleic acid, a cassette or an expression vector according to the invention.
La cellule hôte peut être une cellule procaryote ou une cellule eucaryote.  The host cell may be a prokaryotic cell or a eukaryotic cell.
Selon un mode de réalisation, la cellule hôte est une cellule procaryote, de préférence une bactérie.  According to one embodiment, the host cell is a prokaryotic cell, preferably a bacterium.
Selon un autre mode de réalisation, la cellule hôte est une cellule eucaryote, de préférence une levure, une cellule de champignon, une cellule d’algue, une cellule de plante ou une cellule animale, et de manière plus particulièrement préférée une cellule animale ou une levure. According to another embodiment, the host cell is a eukaryotic cell, preferably a yeast, a mushroom cell, an algal cell, a cell of plant or animal cell, and more preferably an animal cell or yeast.
Selon un mode de réalisation particulier, la cellule hôte est une cellule animale, de préférence une cellule d’insecte ou de mammifère, et de manière plus particulièrement préférée une cellule de souris, une cellule de hamster (par exemple une cellule CHO) ou une cellule humaine.  According to a particular embodiment, the host cell is an animal cell, preferably an insect or mammalian cell, and more preferably a mouse cell, a hamster cell (for example a CHO cell) or a human cell.
Dans un mode de réalisation particulier, la cellule est non-humaine et/ou n’est pas une cellule souche embryonnaire.  In a particular embodiment, the cell is non-human and / or is not an embryonic stem cell.
Selon un autre mode de réalisation particulier, la cellule hôte est une cellule de mammifère non humain.  According to another particular embodiment, the host cell is a non-human mammalian cell.
Selon un autre mode de réalisation particulier, la cellule hôte est une cellule animale, de préférence humaine, et n’est pas une cellule souche embryonnaire humaine.  According to another particular embodiment, the host cell is an animal cell, preferably human, and is not a human embryonic stem cell.
Selon un autre mode de réalisation particulier, la cellule hôte est un microorganisme, de préférence une bactérie ou une levure.  According to another particular embodiment, the host cell is a microorganism, preferably a bacterium or a yeast.
Le terme « cellule hôte » englobe également toute progéniture d'une cellule hôte parente qui n'est pas identique à la cellule hôte parente en raison des mutations qui se produisent pendant la réplication.  The term "host cell" also includes any offspring of a parent host cell that is not identical to the parent host cell due to mutations that occur during replication.
L'acide nucléique, cassette d'expression ou vecteur d'expression selon l'invention peut être introduit dans la cellule hôte par toute méthode connue de l'homme du métier, telle que l'infection, l’électroporation, la conjugaison, la transduction, la transformation de cellules compétentes, la transformation de protoplaste, la fusion de protoplastes, la biolistique ou encore des méthodes de transformation faisant intervenir le PEG, des agents lipidiques, l'acétate de lithium ou des liposomes.  The nucleic acid, expression cassette or expression vector according to the invention may be introduced into the host cell by any method known to those skilled in the art, such as infection, electroporation, conjugation, transduction, competent cell transformation, protoplast transformation, protoplast fusion, biolistics or transformation methods involving PEG, lipid agents, lithium acetate or liposomes.
Selon les modes de réalisation, une ou plusieurs copies d'un acide nucléique, d'une cassette ou d'un vecteur selon la présente invention peut être insérée dans une cellule hôte.  According to the embodiments, one or more copies of a nucleic acid, a cassette or a vector according to the present invention may be inserted into a host cell.
La cellule hôte peut être une cellule isolée (transformation/transfection ex vivo) ou une cellule présente dans un organisme (transformation/transfection in vivo).  The host cell may be an isolated cell (transformation / transfection ex vivo) or a cell present in an organism (transformation / transfection in vivo).
De préférence, la cellule hôte est une cellule isolée. Tel qu’utilisé ici, le terme « cellule isolée » se réfère à une cellule séparée et/ou récupérée à partir de son environnement naturel. En particulier, la cellule peut être isolée/récupérée à partir d’un organisme pluricellulaire afin d’être manipulée ex vivo. Selon un autre aspect, la présente invention concerne un procédé de production d’une protéine de fusion selon l'invention comprenant l'expression d'un acide nucléique codant pour ladite protéine de fusion et la récupération de celle-ci. Preferably, the host cell is an isolated cell. As used herein, the term "isolated cell" refers to a separate cell and / or recovered from its natural environment. In particular, the cell can be isolated / recovered from a multicellular organism to be manipulated ex vivo. In another aspect, the present invention relates to a method of producing a fusion protein according to the invention comprising expressing a nucleic acid encoding said fusion protein and recovering it.
La présente invention concerne en particulier un procédé de production in vitro d’une protéine de fusion selon l'invention comprenant (a) la mise en contact d'un acide nucléique, d'une cassette ou d'un vecteur selon l'invention avec un système d'expression in vitro, et (b) la récupération de la protéine de fusion. Les systèmes d'expression in vitro sont bien connus de l'homme du métier et de nombreux systèmes sont disponibles dans le commerce.  The present invention relates in particular to a process for the in vitro production of a fusion protein according to the invention comprising (a) bringing a nucleic acid, a cassette or a vector according to the invention into contact with an in vitro expression system, and (b) the recovery of the fusion protein. In vitro expression systems are well known to those skilled in the art and many systems are commercially available.
La présente invention concerne de préférence un procédé de production d’une protéine de fusion selon invention comprenant  The present invention preferably relates to a method for producing a fusion protein according to the invention comprising
(a) la culture d’une cellule hôte selon l'invention dans un milieu de culture approprié et dans des conditions appropriées pour produire ladite protéine de fusion; et (a) culturing a host cell according to the invention in a suitable culture medium and under conditions suitable for producing said fusion protein; and
(b) la récupération de la protéine de fusion à partir de la culture cellulaire. (b) recovering the fusion protein from the cell culture.
Les cellules hôtes sont cultivées dans un milieu nutritif approprié pour la production de la protéine de fusion en utilisant des procédés bien connus de l’homme du métier.  The host cells are cultured in a nutrient medium suitable for the production of the fusion protein using methods well known to those skilled in the art.
Par exemple, la cellule hôte peut être cultivée en flacon ou en fermenteur dans un milieu approprié et dans des conditions permettant à la protéine de fusion d’être exprimée et/ou isolée. La culture a lieu dans un milieu nutritif approprié comprenant notamment des sources de carbone, d'azote et des sels inorganiques, en utilisant des procédures bien connues de l’homme du métier. De tels milieux sont disponibles auprès de fournisseurs commerciaux ou peuvent être préparés selon des compositions publiées (par exemple, dans les catalogues de l'American Type Culture Collection).  For example, the host cell may be cultured in a vial or fermentor in a suitable medium and under conditions allowing the fusion protein to be expressed and / or isolated. The culture is carried out in a suitable nutrient medium comprising in particular carbon, nitrogen and inorganic salt sources, using procedures well known to those skilled in the art. Such media are available from commercial suppliers or can be prepared according to published compositions (for example, in the catalogs of the American Type Culture Collection).
Si la protéine de fusion est sécrétée dans le milieu nutritif, celle-ci peut être récupérée directement à partir du surnageant de culture. Si elle n'est pas sécrétée, elle peut être récupérée à partir des lysats cellulaires ou après perméabilisation.  If the fusion protein is secreted into the nutrient medium, it can be recovered directly from the culture supernatant. If it is not secreted, it can be recovered from cell lysates or after permeabilization.
La protéine de fusion peut être détectée et récupérée en utilisant tout procédé connu de l’homme du métier tel que des méthodes de chromatographie et/ou des méthodes électrophorétiques. Selon un autre aspect, la présente invention concerne également un procédé, de préférence in vitro ou ex vivo, pour stimuler l’activité recombinase dans une cellule comprenant The fusion protein can be detected and recovered using any method known to those skilled in the art such as chromatography methods and / or electrophoretic methods. In another aspect, the present invention also relates to a method, preferably in vitro or ex vivo, for stimulating recombinase activity in a cell comprising
- la fourniture d’une cellule exprimant une protéine de fusion selon l’invention ou l’insertion d’un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention dans une cellule, et  providing a cell expressing a fusion protein according to the invention or inserting a nucleic acid, an expression cassette or an expression vector according to the invention into a cell, and
- l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc G activité recombinase.  exposing said cell to a light capable of activating the photoreceptor domain of said fusion protein and thus recombinase activity.
La cellule peut être une cellule hôte telle que définie ci-dessus.  The cell may be a host cell as defined above.
L’insertion de l’acide nucléique, de la cassette ou du vecteur selon l’invention dans la cellule peut se faire par toute technique connue de l’homme du métier.  The insertion of the nucleic acid, the cassette or the vector according to the invention into the cell can be done by any technique known to those skilled in the art.
La cellule peut éventuellement avoir été préalablement génétiquement modifiée afin d’insérer un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de la protéine de fusion, et éventuellement un ou plusieurs acides nucléiques dont l’expression, le nombre et/ou la localisation dans le génome se trouveront modifiés par l’action de la recombinase au niveau desdits sites de reconnaissance.  The cell may possibly have been previously genetically modified to insert one or more recognition sites recognized by the recombinase domain of the fusion protein, and optionally one or more nucleic acids whose expression, number and / or location in the genome will be modified by the action of the recombinase at said recognition sites.
En particulier, la cellule peut être un microorganisme, par exemple une bactérie ou une levure, dans lequel un ou plusieurs gènes d’intérêt ont été introduits (par exemple des gènes codant pour des enzymes donnant lieu à la production d'un composé d’intérêt) en combinaison avec des sites de reconnaissance reconnus par le domaine recombinase de la protéine de fusion. L’exposition de cette cellule à une lumière capable d’activer le domaine photorécepteur de la protéine de fusion génère un réarrangement chromosomique qui permet, selon la configuration des sites de reconnaissance de la recombinase, par exemple d’activer ou d’inhiber l’expression du ou des gènes d’intérêt, et/ou de déléter, insérer ou transloquer un ou plusieurs gènes d'intérêt de la cellule hôte.  In particular, the cell may be a microorganism, for example a bacterium or a yeast, in which one or more genes of interest have been introduced (for example genes coding for enzymes giving rise to the production of a compound of interest) in combination with recognition sites recognized by the recombinase domain of the fusion protein. The exposure of this cell to a light capable of activating the photoreceptor domain of the fusion protein generates a chromosomal rearrangement which, according to the configuration of the recognition sites of the recombinase, makes it possible, for example, to activate or inhibit the expression of the gene (s) of interest, and / or deleting, inserting or translocating one or more genes of interest of the host cell.
Ce type de modulation est bien connue de l’homme du métier. En revanche, l’avantage majeur du procédé selon l’invention est d’utiliser la lumière comme agent d’induction de l’activité recombinase et non un inducteur chimique.  This type of modulation is well known to those skilled in the art. In contrast, the major advantage of the method according to the invention is to use light as an induction agent for recombinase activity and not a chemical inducer.
La présente invention concerne également un procédé, de préférence in vitro ou ex vivo, pour modifier un ou plusieurs acides nucléiques, comprenant - la mise en contact d’une protéine de fusion selon l’invention, avec un ou des acides nucléiques d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, et The present invention also relates to a method, preferably in vitro or ex vivo, for modifying one or more nucleic acids, comprising contacting a fusion protein according to the invention with one or more nucleic acids of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and
- l’exposition de la protéine de fusion et du ou des acides nucléiques à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.  exposing the fusion protein and the nucleic acid (s) to a light capable of activating the photoreceptor domain of said fusion protein and therefore the recombinase activity.
Les modifications apportées aux acides nucléiques peuvent être des translocations, inversions, insertions et/ou délétions. Celles-ci peuvent notamment conduire à induire ou bloquer l’expression d’un gène, ou à introduire une mutation dans une séquence codante (séquence sauvage vers séquence mutée ou vice-versa). Ce type de modifications au moyen de recombinases est bien connu de l’homme du métier.  The modifications made to the nucleic acids can be translocations, inversions, insertions and / or deletions. These may in particular lead to inducing or blocking the expression of a gene, or to introducing a mutation in a coding sequence (wild-type sequence to mutated sequence or vice versa). This type of recombinase modification is well known to those skilled in the art.
La mise en contact de la protéine de fusion avec le ou les acides nucléiques d’intérêt peut avoir lieu dans une cellule, in vivo ou ex vivo, ou in vitro.  The contacting of the fusion protein with the nucleic acid (s) of interest can take place in a cell, in vivo or ex vivo, or in vitro.
Dans le cas d’une mise en contact dans une cellule, la protéine de fusion est de préférence exprimée par ladite cellule qui comprend également le ou les acides nucléiques à modifier.  In the case of contacting in a cell, the fusion protein is preferably expressed by said cell which also comprises the nucleic acid (s) to be modified.
Dans le cadre d’une utilisation in vivo, la protéine de fusion selon l’invention peut être mise en contact avec le ou les acides nucléiques à modifier en administrant soit un vecteur ou une cassette d’expression codant pour ladite protéine, soit directement ladite protéine dans l’organisme, le tissu ou la cellule cible. L’activation de l’activité recombinase peut être réalisée par photothérapie, photochimiothérapie ou via des sources lumineuses offrant une précision spatiale telles que des fibres optiques. Ce type d’application trouve un intérêt tout particulier en thérapie génique lorsqu’il est nécessaire de modifier l'activité ou la viabilité d'une cellule ou d'un groupe de cellules impliquées dans une pathologie ou dans son évolution (voir par exemple Greco et al. Gene Therapy volume 13, pages 206-215 (2006)).  In the context of an in vivo use, the fusion protein according to the invention can be brought into contact with the nucleic acid (s) to be modified by administering either a vector or an expression cassette coding for said protein, or directly protein in the body, tissue or target cell. The activation of the recombinase activity can be carried out by phototherapy, photochemotherapy or via light sources offering spatial precision such as optical fibers. This type of application is of particular interest in gene therapy when it is necessary to modify the activity or viability of a cell or a group of cells involved in a pathology or in its evolution (see for example Greco and Gene Therapy Volume 13, pages 206-215 (2006)).
Dans le cas d’une mise en contact in vitro, la protéine de fusion est de préférence mise en contact avec un mélange réactionnel comprenant le ou les acides nucléiques d’intérêt sous la forme d’une protéine purifiée. La protéine de fusion peut être utilisée en solution ou sous une forme immobilisée. De préférence, le mélange réactionnel comprend également un système de transcription et traduction in vitro.  In the case of in vitro contacting, the fusion protein is preferably contacted with a reaction mixture comprising the nucleic acid (s) of interest in the form of a purified protein. The fusion protein can be used in solution or in immobilized form. Preferably, the reaction mixture also comprises an in vitro transcription and translation system.
Selon un mode de réalisation, ce procédé est utilisé pour générer de la diversité génétique au sein d’une cellule ou d'une population de cellules, de préférence une population de bactéries ou de levures, ou dans un acide nucléique ou mélange d'acides nucléiques. De manière optionnelle, le génome de la cellule ou l’acide nucléique peut être préalablement synthétisé ou modifié afin comprendre une pluralité de sites de reconnaissance insérée de manière ciblée ou aléatoire et générant ainsi, sous l’action de la recombinase, une diversité génétique contrôlée ou aléatoire. According to one embodiment, this method is used to generate genetic diversity within a cell or a population of cells, preferably a population of bacteria or yeasts, or in a nucleic acid or mixture of nucleic acids. Optionally, the genome of the cell or the nucleic acid may be previously synthesized or modified to comprise a plurality of recognition sites inserted in a targeted or random manner and thus generating, under the action of the recombinase, a controlled genetic diversity or random.
Les procédés selon l’invention peuvent trouver une application dans un très grand nombre de domaines, notamment The methods according to the invention can find application in a very large number of fields, in particular
- pour moduler l’expression d’une molécule d’intérêt, par exemple dans le cadre d’un procédé de bioproduction. L’expression de la molécule d’intérêt peut notamment être induite, stoppée, augmentée ou diminuée. Le composé d’intérêt peut être notamment tout produit de fermentation, un composé changeant la physiologie ou la viabilité de la cellule hôte ou de cellules en contact direct ou indirect avec celle-ci, un composé contrôlant une propriété moléculaire ou cellulaire de ladite cellule hôte ou de cellules en contact direct ou indirect avec celle-ci. Le composé d’intérêt peut également être une protéine ou un acide nucléique présentant une mutation par rapport à la version produite par la cellule hôte avant G action de la recombinase ;  to modulate the expression of a molecule of interest, for example in the context of a biomanufacturing process. The expression of the molecule of interest can in particular be induced, stopped, increased or decreased. The compound of interest may be in particular any fermentation product, a compound that changes the physiology or viability of the host cell or cells in direct or indirect contact therewith, a compound controlling a molecular or cellular property of said host cell or cells in direct or indirect contact with it. The compound of interest may also be a protein or nucleic acid having a mutation with respect to the version produced by the host cell before the action of the recombinase;
- pour induire de la diversité génétique dans une cellule hôte ou une population de cellules hôtes, par exemple pour des applications d’évolution dirigée ou de criblage. Les cellules ainsi obtenues peuvent ensuite être criblées afin d’identifier ou de sélectionner des cellules présentant de nouvelles caractéristiques d’intérêt, telles que par exemple, la synthèse d’un nouveau composé, une résistance accrue à des conditions particulières de culture ou une productivité accrue ; ou  to induce genetic diversity in a host cell or a population of host cells, for example for directed evolution or screening applications. The cells thus obtained can then be screened to identify or select cells with new characteristics of interest, such as, for example, synthesis of a new compound, increased resistance to particular culture conditions or productivity. increased; or
- pour modifier une activité biologique dans le cadre d’une thérapie génique, par exemple comme décrit ci-dessus.  to modify a biological activity in the context of a gene therapy, for example as described above.
Selon un autre aspect, la présente invention concerne également un kit comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur d’expression selon l’invention et/ou une cellule hôte selon l’invention, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion. According to another aspect, the present invention also relates to a kit comprising a fusion protein, a nucleic acid, a cassette or an expression vector according to the invention and / or a host cell according to the invention, and optionally a light source. capable of activating the photoreceptor domain of the fusion protein.
Elle concerne également G utilisation de ce kit pour mettre en œuvre un procédé selon l’invention, notamment pour induire une activité recombinase dans une cellule et/ou pour modifier in vivo, ex vivo ou in vitro un ou plusieurs acides nucléiques. Toutes les références citées dans cette description sont incorporées par référence dans la présente demande. D'autres caractéristiques et avantages de l'invention apparaîtront mieux à la lecture des exemples suivants donnés à titre illustratif et non limitatif. It also relates to the use of this kit for implementing a method according to the invention, in particular for inducing a recombinase activity in a cell and / or for modifying in vivo, ex vivo or in vitro one or more nucleic acids. All references cited in this specification are incorporated by reference in this application. Other features and advantages of the invention will appear better on reading the following examples given for illustrative and non-limiting.
EXEMPLES EXAMPLES
Matériel et méthodes  Material and methods
Système rapporteur permettant de quantifier l’activité CRE recombinase in vivo. Reporter system for quantifying CRE recombinase activity in vivo.
Le système rapporteur est illustré sur la Figure 1. Ce système est intégré au locus HO du génome de cellules de levure Saccharomyces cerevisiae. Il est constitué des éléments de séquence consécutifs suivants: The reporter system is illustrated in Figure 1. This system is integrated with the HO locus of the yeast cell genome Saccharomyces cerevisiae. It consists of the following consecutive sequence elements:
- PromTEF: promoteur conférant une expression constitutive (provient du gène TEF1 de Saccharomyces cerevisiae ).  PromTEF: promoter conferring constitutive expression (comes from the TEF1 gene of Saccharomyces cerevisiae).
- LoxP: site de reconnaissance de la CRE recombinase.  - LoxP: recognition site of CRE recombinase.
-K1LEU2: séquence codante du gène K1LEU2 de la levure Kluyveromyces lactis, codant pour une Beta-isopropylmalate dehydrogenase.  -K1LEU2: coding sequence of the K1LEU2 gene of the yeast Kluyveromyces lactis, encoding a beta-isopropylmalate dehydrogenase.
-TermADHl : sequence terminatrice de transcription provenant du gène ADH1 (Alcohol DeHydrogenase 1) de Saccharomyces cerevisiae. Cette séquence comporte un ou plusieurs codons STOP qui assurent également une terminaison de la traduction.  -TermADH1: transcription terminator sequence from the ADH1 gene (Alcohol DeHydrogenase 1) of Saccharomyces cerevisiae. This sequence includes one or more STOP codons which also provide termination of the translation.
-LoxP: site de reconnaissance de la CRE recombinase.  -LoxP: recognition site of CRE recombinase.
- GFP: séquence codante de la Green Fluorescent Protein  - GFP: coding sequence of the Green Fluorescent Protein
- TermCYCl : séquence terminatrice de transcription provenant du gène CYC1 de Saccharomyces cerevisiae.  - TermCYCl: transcription terminator sequence from the CYC1 gene of Saccharomyces cerevisiae.
En l'absence d'activité CRE recombinase, les cellules portant cette construction ne sont pas fluorescentes. En présence d'activité CRE recombinase, la recombinaison entre les deux sites loxP génère l'excision de la portion KlLEU2-TermADHl, et place ainsi la portion GFP sous l'activité transcriptionnelle conférée par la portion PromTEF. Les cellules ayant subi cette excision expriment ainsi la protéine GFP et sont fluorescentes. Conditions expérimentales du test de l'activité CRE recombinase. In the absence of CRE recombinase activity, cells carrying this construct are not fluorescent. In the presence of CRE recombinase activity, the recombination between the two loxP sites generates the excision of the KlLEU2-TermADH1 portion, and thus places the GFP portion under the transcriptional activity conferred by the PromTEF portion. Cells that have undergone this excision thus express the GFP protein and are fluorescent. Experimental conditions of CRE recombinase activity test.
Des cellules de levures correspondant à la souche GY1761 de génotype MATalpha his3A200 leu2Al trplA63 ura3A0 hoA: :loxKlLEU2loxGFP et portant le système rapporteur décrit ci-dessus sont transformées avec un plasmide portant une cassette d'expression d'une protéine candidate susceptible d'avoir une activité CRE recombinase. La souche de levure ainsi transformée est cultivée durant une nuit sur milieu sélectif dans des conditions où la protéine candidate est exprimée. Ce milieu est appelé milieu de préculture ci-après. Le lendemain, IOOmI de cette culture sont transférés dans une plaque 96-puits de plastique transparent à fond plat et, le cas échéant, illuminé à température ambiante dans les conditions souhaitées de temps, longueur d'onde et énergie lumineuse. Une partie des cellules de cet échantillon sont ensuite cultivées durant 4 heures dans un milieu correspondant à des conditions où la protéine candidate n'est pas exprimée. Ce milieu est appelé milieu de récupération ci-après. Un échantillon de ces cellules est ensuite transféré dans un milieu appelé milieu d'analyse ci-après et analysé à la vitesse de 400 évènements par seconde sur un cytomètre en flux LACSCalibur (BDBiosciences) dans lequel la GLP a été excitée avec un laser à 488 nm et la fluorescence émise à travers un filtre 530/30 a été quantifiée pour produire des données telles que celles représentées sur la Ligure 2A. En fonction de la fluorescence des cellules, celles-ci sont classées en deux groupes: OLE (fluorescence faible) et ON (fluorescence élevée) qui correspondent aux cellules qui n'ont pas (OLE) ou qui ont (ON) activé le système rapporteur. La proportion de cellules ON est utilisée comme indicateur de l'activité CRE recombinase, comme indiqué sur la Figure 2B. Yeast cells corresponding to strain GY1761 of genotype MATalpha his3A200 leu2A1 trplA63 ura3A0 hoA :: loxKlLEU2loxGFP and carrying the reporter system described above are transformed with a plasmid carrying an expression cassette of a candidate protein likely to have an CRE recombinase activity. The yeast strain thus transformed is cultured overnight on a selective medium under conditions where the candidate protein is expressed. This medium is called preculture medium below. The next day, 100 ml of this culture are transferred to a flat-bottomed transparent plastic 96-well plate and, where appropriate, illuminated at room temperature under the desired conditions of time, wavelength and light energy. Part of the cells of this sample are then cultured for 4 hours in a medium corresponding to conditions where the candidate protein is not expressed. This medium is called the recovery medium below. A sample of these cells is then transferred to a medium called analysis medium below and analyzed at a rate of 400 events per second on a LACSCalibur flow cytometer (BDBiosciences) in which the GLP was excited with a 488 laser. nm and the fluorescence emitted through a 530/30 filter was quantified to produce data such as those shown in Figure 2A. Depending on the fluorescence of the cells, they are classified into two groups: OLE (low fluorescence) and ON (high fluorescence), which correspond to cells that do not have (OLE) or that have (ON) activated the reporter system. . The proportion of ON cells is used as an indicator of CRE recombinase activity, as shown in Figure 2B.
Milieux et tampons utilisés Media and buffers used
Le tampon TBS est une dilution au dixième dans l'eau du tampon TBS10X, lequel correspond à une solution aqueuse (Tris 30 g/L, NaCl 80 g/L, KC1 2 g/L) ajustée à pH 7,4 avec de l'acide chlorydrique fumant. The TBS buffer is a tenth dilution in water of the TBS10X buffer, which corresponds to an aqueous solution (Tris 30 g / L, NaCl 80 g / L, KCI 2 g / L) adjusted to pH 7.4 with water. fuming hydrochloric acid.
Les milieux de culture de cellules de levure sont préparés à partir d'un mélange poudreux d'acides aminés et de nucléotides appelé MixW dont la composition est la suivante: Adénine (Ad) 1 g, Uracile (U) 2 g, Alanine (A) 2 g, Arginine (R) 2 g, Aspartate (D) 2 g, Asparagine (N) 2 g, Cystéine (C) 2 g, Glutamate (E) 2 g, Glutamine (Q) 2 g, Glycine (G) 2 g, Histidine (H) 2 g, Isoleucine (I) 2 g, Leucine (L) 4 g, Lysine (K) 2 g, Méthionine (M) 2 g, Phénylalanine (F) 2 g, Proline (P) 2 g, Sérine (S) 2 g, Thréonine (T) 2 g, Tyrosine (Y) 2 g, Valine (V) 2 g. D'autres mélanges, appelés MixW X où X désigne un des composés du mélange, sont préparés de la même manière mais en omettant le composé X. Ainsi, par exemple, le mélange MixW M ne contient pas de méthionine. De manière similaire, d'autres mélanges, appelés MixW X Y sont préparés en omettant deux composés désignés par X et Y. The yeast cell culture media are prepared from a powdery mixture of amino acids and nucleotides called MixW whose composition is as follows: Adenine (Ad) 1 g, Uracil (U) 2 g, Alanine (A) 2 g, Arginine (R) 2 g, Aspartate (D) 2 g, Asparagine (N) 2 g, Cysteine (C) 2 g, Glutamate (E) 2 g, Glutamine (Q) 2 g, Glycine (G) 2 g, Histidine (H) 2 g, Isoleucine (I) 2 g, Leucine (L) 4 g, Lysine (K) 2 g, Methionine (M) 2 g, Phenylalanine (F) 2 g, Proline (P) 2 g, Serine (S) 2 g, Threonine (T) 2 g, Tyrosine (Y) 2 g, Valine (V) 2 g. Other mixtures, called MixW X where X denotes one of the compounds of the mixture, are prepared in the same manner but omitting the compound X. Thus, for example, the mixture MixW M does not contain methionine. Similarly, other mixtures called MixW XY are prepared by omitting two compounds designated X and Y.
Protocole PI: IP Protocol:
La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants: The procedure described in the section 'Experimental conditions of the CRE recombinase activity test' above is applied, with the following media:
- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de galactose, 20g de raffinose, et 2g de MixW décrit ci-dessus dont dilués dans 1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar.  - Preculture medium: 6.7 g Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20 g of galactose, 20 g of raffinose, and 2 g of MixW described above diluted in 1L of distilled water, 1 mL of 1M NaOH is added and the solution is autoclaved at 0.5 bar.
- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW décrit ci-dessus dont dilués dans 1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar. Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW described above diluted in 1 L of distilled water, 1 ml of 1 M NaOH is added and the solution is autoclaved at 0.5 bar.
- Milieu d'analyse: Tampon TBS auquel est rajouté lmM d'azide de sodium. - Analytical medium: TBS buffer to which is added 1 mM sodium azide.
Protocole P2: P2 protocol:
La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants: The procedure described in the section 'Experimental conditions of the CRE recombinase activity test' above is applied, with the following media:
- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW M décrit ci-dessus dont dilués dans 1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar. - Preculture medium: 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BDBiosciences), 20 g of glucose, and 2 g of MixW M described above diluted in 1L of distilled water, 1 ml of 1M NaOH is added and the solution is autoclaved at 0.5 bar.
- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW H décrit ci-dessus dont dilués dans 1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar.Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW H described above, diluted in 1 L of distilled water, 1 ml of 1 M NaOH. added and the solution is autoclaved at 0.5 bar.
- Milieu d'analyse: Tampon TBS. Protocole P3: - Analytical medium: TBS buffer. Protocol P3:
La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants: The procedure described in the section 'Experimental conditions of the CRE recombinase activity test' above is applied, with the following media:
- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW M U décrit ci-dessus dont dilués dans - Preculture medium: 6.7 g Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20 g glucose, and 2 g MixW M U described above diluted in
1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar.1L of distilled water, 1mL of 1M NaOH is added and the solution is autoclaved at 0.5 bar.
- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW H U décrit ci-dessus dont dilués dans 1L d'eau distillée, lmL de NaOH 1M est rajouté et la solution est autoclavée à 0.5 bar. - Milieu d'analyse: Tampon TBS. Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino Acids (Difco, BD Biosciences), 20 g of glucose, and 2 g of MixW HU described above, diluted in 1 ml of distilled water, 1 ml of 1 M NaOH. added and the solution is autoclaved at 0.5 bar. - Analytical medium: TBS buffer.
Résultats Results
Effets de mutations de l'extrémité en C -terminale de la CRE recombinase Effects of mutations of the C-terminal end of CRE recombinase
Le mutant Cre_Stop34l a été obtenu par mutagénèse dirigée d'un plasmide où le codon D341 a été remplacé par un codon Stop. Le mutant Cre_A340A34l a été obtenu par mutagénèse dirigée d'un plasmide où les codons E340 et D341 ont été remplacés par A340 et A341. Dans les plasmides ainsi obtenus, l'expression de la protéine recombinase sauvage ou mutante est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae. Les conditions du test sont celles du protocole Pl sans illumination. The Cre_Stop341 mutant was obtained by site-directed mutagenesis of a plasmid where codon D341 was replaced by a stop codon. The Cre_A340A341 mutant was obtained by site-directed mutagenesis of a plasmid where codons E340 and D341 were replaced by A340 and A341. In the plasmids thus obtained, the expression of the wild-type or mutant recombinase protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae. The test conditions are those of the protocol Pl without illumination.
Les résultats montrant l'activité CRE recombinase de ces mutants sont présentés sur la Figure 3. Le mutant mutant Cre_Stop34l présente une activité complète. Ceci démontre que la recombinase CRE délétée de 3 acides-aminés C-terminaux est active. D'autre part, les résultats montrent que le mutant Cre_A340A34l présente une activité légèrement réduite par rapport à la CRE recombinase sauvage. Effets de mutations de l'extrémité en N-terminale de la CRE recombinase  The results showing the CRE recombinase activity of these mutants are shown in FIG. 3. The Cre_Stop341 mutant mutant exhibits complete activity. This demonstrates that CRE recombinase deleted from 3 C-terminal amino acids is active. On the other hand, the results show that the Cre_A340A341 mutant has a slightly reduced activity compared to the wild-type CRE recombinase. Effects of mutations of the N-terminus of CRE recombinase
Les mutants Cre_A2-2l et Cre_A2-28 ont été obtenus par The mutants Cre_A2-21 and Cre_A2-28 were obtained by
i) PCR où la matrice ADN a été le plasmide pGY 115 et où les amorces ont été 1L80 dont la séquence est 5'-tggtatctttatagtcctgtcgg-3' (SEQ ID NO : 15) et, pour Cre_A2- 21 1L71 dont la séquence est 5'-gaacatgtccatcaggttcttgcgaacctccatttaacactcagataa-3' (SEQ ID NO : 16), et pour Cre_A2-28 1L72 dont la séquence est 5'- agaaaacgcctggcgatccctgaacatgtccatttaacactcagataa-3' (SEQ ID NO : 17). i) PCR where the DNA template was the plasmid pGY 115 and where the primers were 1L80 whose sequence is 5'-tggtatctttatagtcctgtcgg-3 '(SEQ ID NO: 15) and, for Cre_A2-1L71 whose sequence is 5 '-gaacatgtccatcaggttcttgcgaacctccatttaacactcagataa-3' (SEQ ID NO: 16), and for Cre_A2-28 1L72 whose sequence is 5'-agaaaacgcctggcgatccctgaacatgtccatttaacactcagataa-3 '(SEQ ID NO: 17).
ii) digestion du plasmide pGYl l5 par l’enzyme Agel et purification sur gel d'agarose 1% du fragment de 6.3Kb  ii) digestion of the plasmid pGY155 with the Agel enzyme and purification on agarose gel 1% of the 6.3 Kb fragment
iii) co-transformation des produits des étapes i) et ii) dans une souche de levure trplA et sélection sur milieu sans tryptophane.  iii) co-transformation of the products of steps i) and ii) into a trplA yeast strain and selection on medium without tryptophan.
La dénomination Dc-y indique ici la délétion des acides aminés situés de la position x incluse à la position y incluse.  The denomination Dc-y here indicates the deletion of the amino acids located from the included position x to the included position y.
Dans les plasmides ainsi obtenus, l'expression de la protéine recombinase sauvage ou mutante est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae. Les conditions du test sont celles du protocole Pl sans illumination. Les résultats montrant l'activité de ces mutants sont présentés sur la figure 4. L'activité CRE du mutant Cre_A2-2l est complète tandis que celle du mutant Cre_A2-28 est réduite de moins de 10%.  In the plasmids thus obtained, the expression of the wild-type or mutant recombinase protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae. The test conditions are those of the protocol Pl without illumination. The results showing the activity of these mutants are shown in FIG. 4. The CRE activity of the Cre_A2-21 mutant is complete while that of the Cre_A2-28 mutant is reduced by less than 10%.
Construction de fusions LOV2-CRE LOV2-CRE merger construction
Le photorécepteur iLID dérivé de asLOV2 et décrit dans l'article de Guntas et al. 2015 P.N.A.S. 112(1):112-117 a été fusionné en N-terminal de plusieurs variants de la protéine CRE recombinase. La méthode utilisée est schématisée sur la Ligure 5. Elle a été de transférer, par recombinaison homologue spontanée dans des cellules de levure, un fragment d'ADN amplifié par PCR et contenant la séquence du variant CRE ainsi que, éventuellement, certaines modifications de séquence souhaitées en N-terminal dudit variant, dans un plasmide contenant un système d'expression et la séquence codante de iLID. The iLID photoreceptor derived from asLOV2 and described in the article by Guntas et al. 2015 P.N.A.S. 112 (1): 112-117 was fused to the N-terminal of several variants of the CRE recombinase protein. The method used is shown schematically in FIG. 5. It was transferred, by spontaneous homologous recombination into yeast cells, a DNA fragment amplified by PCR and containing the CRE variant sequence as well as, optionally, certain sequence modifications. N-terminal of said variant, in a plasmid containing an expression system and the coding sequence of iLID.
En particulier, la construction iLID-Crel9 (fusion du domaine iLID au résidu en position 19 de SEQ ID NO : 1) a été obtenue par i) PCR où la matrice ADN a été le plasmide pGYl l5 et où les amorces ont été 1G42 dont la séquence est 5'- AGAAAAGGAGAGGGCC AAGA-3 ' (SEQ ID NO :l8) et 1M43 dont la séquence est 5'- CTTATTAAGAAAACCGCATTTCAAATCgccacgagtgatgaggttcgcaag-3' (SEQ ID NO : 19), ii) digestion du plasmide pGY408 par les enzymes Mfel et BsiWI et purification sur gel d'agarose 1 % du fragment de 4,4Kb, iii) co-transformation des produits des étapes i) et ii) dans la souche de levure GY 1761 et sélection sur milieu sans tryptophane. De manière similaire, la construction iLID-Cre27 (fusion du domaine iLID au résidu en position 27 de SEQ ID NO : 1) a été obtenue en appliquant les étapes i) à iii) ci-dessus avec la modification suivante de l'étape i): utilisation de l'amorce 1M51 dont la séquence est 5'-CTTATTAAGAAAACCGCATTT CAAATCgccctgatggacatgttcagggat- 3' (SEQ ID NO :20) à la place de l'amorce 1M43. In particular, the iLID-Crel9 construct (fusion of the iLID domain to the residue at position 19 of SEQ ID NO: 1) was obtained by i) PCR where the DNA template was the plasmid pGY155 and where the primers were 1G42 with the sequence is 5'-AGAAAAGGAGAGGGCC AAGA-3 '(SEQ ID NO: 18) and 1M43 whose sequence is 5'-CTTATTAAGAAAACCGCATTTCAAATCgccacgagtgatgaggttcgcaag-3' (SEQ ID NO: 19), ii) digesting the plasmid pGY408 with the enzymes Mfel and BsiWI and agarose gel purification 1% of the fragment of 4.4Kb, iii) co-transformation of the products of steps i) and ii) in yeast strain GY 1761 and selection on medium without tryptophan. Similarly, the construct iLID-Cre27 (fusion of the iLID domain to the residue at position 27 of SEQ ID NO: 1) was obtained by applying steps i) to iii) above with the following modification of step i ): use of the 1M51 primer whose sequence is 5'-CTTATTAAGAAAACCGCATTT CAAATCgccctgatggacatgttcagggat-3 '(SEQ ID NO: 20) in place of the 1M43 primer.
De manière similaire, la construction iLID-Cre32 (fusion du domaine iLID au résidu en position 32 de SEQ ID NO : 1) contenue dans le plasmide pGY4l5 a été obtenue en appliquant les étapes i) à iii) ci-dessus avec la modification suivante de l'étape i): utilisation de l'amorce 1M53 dont la séquence est 5'- CTTATTAAGAAAACCGCA TTTCAAATCgccagggatcgccaggcgttttctg-3' (SEQ ID NO :2l) à la place de l'amorce 1M43.  Similarly, the construct iLID-Cre32 (fusion of the iLID domain to the residue at position 32 of SEQ ID NO: 1) contained in the plasmid pGY415 was obtained by applying steps i) to iii) above with the following modification. of step i): use of the 1M53 primer whose sequence is 5'-CTTATTAAGAAAACCGCA TTTCAAATCgccagggatcgccaggcgttttctg-3 '(SEQ ID NO: 21) in place of the 1M43 primer.
De manière similaire, la construction iLID-CreAA20 (fusion du domaine iLID au résidu en position 20 de SEQ ID NO : 1 avec la double mutation A340A341) contenue dans le plasmide pGY4l6 a été obtenue en appliquant les étapes i) à v) ci-dessus avec les modifications suivantes de l'étape i): utilisation de l'amorce 1M44 dont la séquence est 5'- CTTATTAAG AAAACCGCATTTCAAATCgccagtgatgaggttcgcaagaac-3' (SEQ ID NO :22) à la place de l'amorce 1M43 et utilisation de la matrice pGY372 au lieu de la matrice pGYl l5.  Similarly, construct iLID-CreAA20 (fusion of the iLID domain to the residue at position 20 of SEQ ID NO: 1 with the double mutation A340A341) contained in plasmid pGY416 was obtained by applying steps i) to v) above. above with the following modifications of step i): use of the 1M44 primer whose sequence is 5'-CTTATTAAG AAAACCGCATTTCAAATCgccagtgatgaggttcgcaagaac-3 '(SEQ ID NO: 22) in place of the 1M43 primer and use of the template pGY372 instead of the pGY15 matrix.
Dans les constructions ainsi obtenues, l'expression de la protéine de fusion est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae.  In the constructs thus obtained, the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
Démonstration de la photoactivation de ces protéines de fusion. Demonstration of the photoactivation of these fusion proteins.
L'activité des protéines de fusions a été évaluée en appliquant ou non une illumination des cellules selon le protocole Pl. Les résultats obtenus sont présentés en figure 6. La fusion iLID-Crel9 présente une activité de 25% sans illumination et de 32% après illumination, la fusion iLID-Cre27 présente une activité de 50% sans illumination et de 60% après illumination, la fusion iLID-Cre32 présente une activité de 15% sans illumination et de 45% après illumination, et la fusion iLID-CreAA20 présente une activité nulle sans illumination et de 18% après illumination. Obtention et activités des constructions iLID(OJ)-xn-Cre32 The activity of the fusion proteins was evaluated by applying or not an illumination of the cells according to the P1 protocol. The results obtained are presented in FIG. 6. The iLID-Crel9 fusion exhibits an activity of 25% without illumination and 32% after illumination, the iLID-Cre27 fusion exhibits 50% activity without illumination and 60% after illumination, the iLID-Cre32 fusion exhibits 15% activity without illumination and 45% after illumination, and the iLID-CreAA20 fusion exhibits zero activity without illumination and 18% after illumination. Obtaining and building activities iLID (OJ) -x n -Cre32
Une série de mutants notés iLID(QI)-xi-Cre32 a été générée afin d'introduire un acide aminé aléatoire à la jonction entre iLID et Cre32. Cette série a été obtenue en amplifiant par PCR la séquence comportant une portion de la CRE recombinase en utilisant l'amorce antisens 1F14 de séquence 5'-gtgatgacggtgaaaacctc-3' (SEQ ID NO :23) et l'amorce sens 1N24 de séquence 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC- VNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO :24) où V correspond aléatoirement à A, C ou G, et N correspond aléatoirement à A, T, C ou G. L'amplicon obtenu a été inséré par recombinaison homologue dans le vecteur de 4,4kb issu de la digestion NcoI-BsiWI du plasmide pGY4l7. A series of mutants denoted iLID (QI) -xi-Cre32 was generated to introduce a random amino acid at the junction between iLID and Cre32. This series was obtained by PCR amplification of the sequence comprising a portion of CRE recombinase using the 1F14 antisense primer of the 5'-gtgatgacggtgaaaacctc-3 'sequence (SEQ ID NO: 23) and the sequence 1N24 sense primer. "-CTT ATT AAG AAA ACC GCA TT CAA ATC-VNN-agg gat cgc cag gcgttt tct g-3 '(SEQ ID NO: 24) where V is at random A, C or G, and N is at random A, T, C or G. The amplicon obtained was inserted by homologous recombination into the 4.4 kb vector resulting from the NcoI-BsiWI digestion of the plasmid pGY417.
Une autre série de mutants notés iLID(QI)-X2-Cre32 a été générée de manière similaire en utilisant l'amorce 1N25 de séquence 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO :25) au lieu de l'amorce 1N24. Another series of mutants denoted iLID (QI) -X 2 -Cre32 was similarly generated using the 1N25 sequence primer 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 25) instead of primer 1N24.
Une autre série de mutants notés iLID(QI)-X3-Cre32 a été générée de manière similaire en utilisant l'amorce 1N26 de séquence 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN VNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO :26) au lieu de l'amorce 1N24. Dans les constructions ainsi obtenues, l'expression de la protéine de fusion est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae. Another series of mutants denoted iLID (QI) -X 3 -Cre32 was generated in a similar manner using the 1N26 primer of 5'-CTT sequence ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 26) instead of primer 1N24. In the constructs thus obtained, the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene of Saccharomyces cerevisiae.
L'activité des protéines de fusions a été évaluée en appliquant ou non une illumination selon le protocole Pl. La Figure 7 présente les activités sans ou avec illumination pour plusieurs constructions iLID(QI)-xn-Cre32 ainsi générées. Ces constructions présentent un gain d'activité après illumination. The activity of the fusion proteins was evaluated by applying or not an illumination according to the protocol Pl. FIG. 7 presents the activities without or with illumination for several constructions iLID (QI) -x n -Cre32 thus generated. These constructions show a gain in activity after illumination.
Activité lors de différentes conditions d'illumination Activity under different conditions of illumination
Des conditions d'illumination de temps et d'intensités différentes ont été appliquées à des cellules de levure contenant la construction iLID_Cre32 ou la construction iLID_CreAA20, placée dans deux types de cassette d'expression. La première cassette comprend le promoteur du gène GAL1. Les résultats obtenus avec cette cassette et selon le protocole Pl, en appliquant ou non une illumination des cellules selon des intensités et des durées variables, sont présentés sur la figure 8. La seconde cassette comprend le promoteur du gène MET17. Les résultats obtenus avec cette cassette et selon le protocole P2, en appliquant ou non une illumination des cellules selon des intensités et des durées variables, sont présentés sur les figures 8 et 9. Ces résultats montrent que l’activité recombinase des constructions est activable dans des conditions de temps et d’intensité très variées. Illumination conditions of different times and intensities were applied to yeast cells containing the construct iLID_Cre32 or the construct iLID_CreAA20, placed in two types of expression cassette. The first cassette comprises the promoter of the GAL1 gene. The results obtained with this cassette and according to the protocol P1, by applying or not an illumination of the cells with varying intensities and durations, are presented in FIG. comprises the promoter of the MET17 gene. The results obtained with this cassette and according to the P2 protocol, by applying or not an illumination of the cells according to varying intensities and durations, are presented in FIGS. 8 and 9. These results show that the recombinase activity of the constructs is activatable in very different conditions of time and intensity.
Ajout d'un peptide d'adressage au noyau. Addition of an addressing peptide to the nucleus.
Une construction NLS_iLID_CreAA20 a été étudiée. Cette construction correspond à la fusion à l'extrémité N-terminale de iLID_CreAA20 d'un peptide dont la séquence VPKKKRKV (SEQ ID NO : 27) (Nuclear Localization Signal, NLS) est connue pour adresser des protéines au noyau des cellules, comme indiqué dans l'article de Cheng et al. Endocrinology 157: 127-140, 2016, suivie de la séquence GGSGG (SEQ ID NO : 28). Cette construction a été obtenue en réalisant une amplification PCR avec les amorces 1080 (5'-atgtgagttacctcactcat-3' (SEQ ID NO : 29)) et 1084 (5'- GCTAAAGAACCGTGATGGTGGTGATGATGTGAACCTCTCATACCTCCGGAac caccgacttttctcttct-3' (SEQ ID NO : 30)) sur le plasmide pGY49l et en co-transformant le produit de ladite amplification avec le fragment SacI-EcoRI du plasmide pGY466 dans une souche de levure. Dans les constructions ainsi obtenues, l'expression de la protéine de fusion est placée sous le contrôle du promoteur du gène MET 17 de Saccharomyces cerevisiae. L'activité de cette construction a été évaluée en appliquant le protocole P2. L'activité de cette construction est présentée dans les résultats de la figure 10. An NLS_iLID_CreAA20 construct was studied. This construction corresponds to the fusion at the N-terminus of iLID_CreAA20 of a peptide whose sequence VPKKKRKV (SEQ ID NO: 27) (Nuclear Localization Signal, NLS) is known to address proteins to the nucleus of the cells, as indicated in the article by Cheng et al. Endocrinology 157: 127-140, 2016, followed by the sequence GGSGG (SEQ ID NO: 28). This construct was obtained by performing PCR amplification with 1080 primers (5'-atgtgagttacctcactcat-3 '(SEQ ID NO: 29)) and 1084 (5'-GCTAAAGAACCGTGATGGTGGTGATGATGTGAACCTCTCATACCTCCGGAac caccgacttttctcttct-3' (SEQ ID NO: 30)) on the plasmid pGY491 and by co-transforming the product of said amplification with the SacI-EcoRI fragment of the plasmid pGY466 in a yeast strain. In the constructs thus obtained, the expression of the fusion protein is placed under the control of the promoter of the Saccharomyces cerevisiae MET 17 gene. The activity of this construction was evaluated by applying the P2 protocol. The activity of this construction is presented in the results of Figure 10.
Test comparatif avec le système nMag/pMag-CRE Comparative test with the nMag / pMag-CRE system
Un système de recombinase activable basé sur la dimérisation photo-inductible de peptides appelés nMag et pMag, a été décrit dans l'article de Kawano et al. Nat. Chem. Biol. 2016 12(12): 1059-1064. Ce système comporte deux protéines de fusion distinctes qui doivent être exprimées dans la même cellule. Afin de comparer les performances de ce système à celles de la présente invention, deux constructions plasmidiques ont été réalisées: pMetl7-Crel8to59-nMag-NLS-URA (SEQ ID NO : 31) et pMetl7-ATG-NLS- pMag-Cre60to343-TRP (SEQ ID NO : 32). Dans ces constructions, l'expression de chacune des protéines de fusion est placée sous le contrôle du promoteur du gène MET 17 de Saccharomyces cerevisiae. La combinaison de ces deux plasmides est appelée nMag/pMag-CRE ci-après. An activatable recombinase system based on the photoinducible dimerization of peptides called nMag and pMag has been described in the article by Kawano et al. Nat. Chem. Biol. 2016 12 (12): 1059-1064. This system has two distinct fusion proteins that must be expressed in the same cell. In order to compare the performances of this system with those of the present invention, two plasmid constructs were made: pMet17-Crel8to59-nMag-NLS-URA (SEQ ID NO: 31) and pMet17-ATG-NLS-pMag-Cre60to343-TRP (SEQ ID NO: 32). In these constructs, the expression of each of the fusion proteins is placed under the control of the promoter of the MET gene. of Saccharomyces cerevisiae. The combination of these two plasmids is called nMag / pMag-CRE hereinafter.
L'activité de ce système a été testée en comparaison de la présente invention selon le protocole P3 et les résultats obtenus sont présentés sur la figure 11. Ces résultats confirment que le système nMag/pMag-CRE est photoactivable (activité de 10% sans illumination et de 35% après illumination). Ils montrent également que ce système est moins performant que le système de la présente invention, en particulier que les fusions iLID_Cre32 et iLID_CreAA20: celles-ci présentent un différentiel d'activité lié à l'illumination qui est supérieur.  The activity of this system was tested in comparison with the present invention according to the P3 protocol and the results obtained are shown in FIG. 11. These results confirm that the nMag / pMag-CRE system is photoactivatable (10% activity without illumination). and 35% after illumination). They also show that this system is less efficient than the system of the present invention, in particular that the mergers iLID_Cre32 and iLID_CreAA20: these have an activity differential related to the illumination which is higher.

Claims

REVENDICATIONS
1. Protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur et dans laquelle l'activité recombinase est photoactivable. A fusion protein comprising a recombinase domain fused to a photoreceptor domain and wherein the recombinase activity is photoactivatable.
2. Protéine de fusion selon la revendication 1, dans laquelle le domaine recombinase est fusionné en N-terminal au domaine photorécepteur. The fusion protein of claim 1, wherein the recombinase domain is fused to the photoreceptor domain at the N-terminus.
3. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur comprend, ou consiste en, un domaine LOV, de préférence LOV2, de phototropine, ou un variant ou dérivé de celui-ci. A fusion protein according to any one of the preceding claims, wherein the photoreceptor domain comprises, or consists of, a LOV domain, preferably LOV2, of phototropin, or a variant or derivative thereof.
4. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur est un dérivé d’un domaine LOV2, de préférence un domaine iLID (improved light inducible dimer), et de manière plus particulièrement préférée un domaine iLID dérivé du domaine LOV2 de la phototropine 1 d' Aven a sativa. A fusion protein according to any one of the preceding claims, wherein the photoreceptor domain is a derivative of a LOV2 domain, preferably an iLID domain (improved light inductive dimer), and more preferably a derived iLID domain. of the LOV2 domain of phototropin 1 from Aven a sativa.
5. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur de la protéine de fusion est un domaine iLID comprenant, ou consistant en, la séquence SEQ ID NO : 13 dans laquelle X représente un à trois acides aminés, de préférence X représente A, D, K, L, IL, VV, AI ou QPG. A fusion protein according to any one of the preceding claims, wherein the photoreceptor domain of the fusion protein is an iLID domain comprising, or consisting of, the sequence SEQ ID NO: 13 wherein X is one to three amino acids preferably X is A, D, K, L, IL, VV, AI or QPG.
6. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur de la protéine de fusion est un domaine iLID comprenant, ou consistant en, la séquence SEQ ID NO : 13 dans laquelle X représente IL ou AI. A fusion protein according to any one of the preceding claims, wherein the photoreceptor domain of the fusion protein is an iLID domain comprising, or consisting of, the sequence SEQ ID NO: 13 wherein X is IL or AI.
7. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est sélectionné dans le groupe constitué de la recombinase CRE (SEQ ID NO : 1), et des variants fonctionnels de celle-ci, de préférence des variants fonctionnels présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 1. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is selected from the group consisting of CRE recombinase (SEQ ID NO: 1), and functional variants thereof, preferably variants functional groups having at least 80% sequence identity with SEQ ID NO: 1.
8. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE comprenant, ou consistant en, la séquence SEQ ID NO : 2, ou une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is a functional variant of the CRE recombinase comprising, or consisting of, the sequence SEQ ID NO: 2, or a sequence having at least 80% d sequence identity with SEQ ID NO: 2.
9. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle au maximum 31 acides aminés ont été délétés en N-terminal et/ou au maximum 3 acides aminés ont été délétés en C -terminal. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which at most 31 amino acids were deleted at the N-terminus and / or at most 3 amino acids were deleted at the C-terminal.
10. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés, de préférence 18, 26 ou 31 acides aminés, ont été délétés en N-terminal. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19 26 or 31 amino acids, preferably 18, 26 or 31 amino acids, have been deleted at the N-terminus.
11. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 19 acides aminés ont été délétés en N-terminal. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which 19 amino acids have been deleted in N-terminal.
12. Protéine de fusion selon l’une quelconque des revendications 1 à 10, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 31 acides aminés ont été délétés en N-terminal. A fusion protein according to any one of claims 1 to 10, wherein the recombinase domain is a functional variant of the CRE recombinase, said variant comprising, or consisting of, a CRE recombinase of SEQ ID NO: 1 in which amino acids were deleted in N-terminal.
13. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE qui présente une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1, de préférence une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is a functional variant of the CRE recombinase which has a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the level of the residue corresponding to residue D341 of SEQ ID NO: 1, preferably a substitution at the level of the residue corresponding to E340 residue of SEQ ID NO: 1 and a residue-level substitution corresponding to residue D341 of SEQ ID NO: 1.
14. Protéine de fusion selon la revendication 13, dans laquelle le ou les résidus de substitution sont choisis indépendamment dans le groupe constitué de A, G, V, L, I, P, M, W, C, N, Q, S, T et Y, de préférence le ou les résidus sont substitués par un résidu alanine. The fusion protein of claim 13, wherein the one or more substitute residues are independently selected from the group consisting of A, G, V, L, I, P, M, W, C, N, Q, S, T and Y, preferably the residue or residues are substituted by an alanine residue.
15. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase consiste en la SEQ ID NO : 3 ou la SEQ ID NO :A fusion protein according to any one of the preceding claims, wherein the recombinase domain is SEQ ID NO: 3 or SEQ ID NO:
4. 4.
16. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle les deux domaines sont immédiatement adjacents. 16. A fusion protein according to any one of the preceding claims, wherein the two domains are immediately adjacent.
17. Protéine de fusion selon l’une quelconque des revendications 1 à 15, dans laquelle les deux domaines sont séparés d’au maximum 6, 5, 4, 3, 2 ou 1 acides aminés. 17. The fusion protein according to any one of claims 1 to 15, wherein the two domains are separated by at most 6, 5, 4, 3, 2 or 1 amino acids.
18. Protéine de fusion selon la revendication 1, comprenant ou consistant en, une séquence choisie parmi les séquences SEQ ID NO : 5 à 12. 18. A fusion protein according to claim 1 comprising or consisting of a sequence selected from SEQ ID NO: 5 to 12.
19. Acide nucléique codant pour une protéine de fusion selon l’une quelconque des revendications précédentes. 20. Cassette d’expression comprenant un acide nucléique selon la revendicationNucleic acid encoding a fusion protein according to any one of the preceding claims. An expression cassette comprising a nucleic acid according to claim
19. 19.
21. Vecteur d’expression comprenant un acide nucléique selon la revendication 19 ou une cassette d’expression selon la revendication 20. An expression vector comprising a nucleic acid according to claim 19 or an expression cassette according to claim 20.
22. Cellule hôte comprenant un acide nucléique selon la revendication 19, une cassette d’expression selon la revendication 20 ou un vecteur d’expression selon la revendication 21. 22. A host cell comprising a nucleic acid according to claim 19, an expression cassette according to claim 20 or an expression vector according to claim 21.
23. Procédé pour induire une activité recombinase dans une cellule comprenant23. A method for inducing recombinase activity in a cell comprising
- la fourniture d’une cellule exprimant une protéine de fusion selon l’une quelconque des revendications 1 à 18 ou l’insertion d’un acide nucléique selon la revendication 19, une cassette d’expression selon la revendication 20 ou un vecteur d’expression selon la revendication 21 dans une cellule et supplying a cell expressing a fusion protein according to any one of claims 1 to 18 or inserting a nucleic acid according to claim 19, an expression cassette according to claim 20 or a vector of expression according to claim 21 in a cell and
- l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase. 24. Procédé pour modifier un acide nucléique, comprenant  exposing said cell to a light capable of activating the photoreceptor domain of said fusion protein and thus the recombinase activity. 24. Process for modifying a nucleic acid, comprising
- la mise en contact d’une protéine de fusion selon l’une quelconque des revendications 1 à 18, avec ledit acide nucléique d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, et  contacting a fusion protein according to any one of claims 1 to 18 with said nucleic acid of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and
- l’exposition de la protéine de fusion et dudit acide nucléique à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.  exposing the fusion protein and said nucleic acid to a light capable of activating the photoreceptor domain of said fusion protein and thus the recombinase activity.
25. Procédé selon la revendication 24, qui est utilisé 25. The method of claim 24, which is used
- pour moduler l’expression d’une molécule d’intérêt dans la cellule hôte, to modulate the expression of a molecule of interest in the host cell,
- pour induire de la diversité génétique dans la cellule hôte, ou to induce genetic diversity in the host cell, or
- pour modifier une activité biologique dans le cadre d’une thérapie génique.  to modify a biological activity in the context of a gene therapy.
26. Kit comprenant une protéine de fusion selon l’une quelconque des revendications 1 à 18, un acide nucléique selon la revendication 19, une cassette d’expression selon la revendication 20, un vecteur d’expression selon la revendication 21 et/ou une cellule hôte selon la revendication 22, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion. 27. Utilisation d’un kit selon la revendication 26, pour induire une activité recombinase dans une cellule selon le procédé de la revendication 23 et/ou pour modifier un ou plusieurs acides nucléiques selon le procédé de la revendication 24 ou 25. A kit comprising a fusion protein according to any one of claims 1 to 18, a nucleic acid according to claim 19, an expression cassette according to claim 20, an expression vector according to claim 21 and / or a The host cell of claim 22, and optionally a light source capable of activating the photoreceptor domain of the fusion protein. Use of a kit according to claim 26 for inducing recombinase activity in a cell according to the method of claim 23 and / or for modifying one or more nucleic acids according to the method of claim 24 or 25.
PCT/EP2019/058829 2018-04-06 2019-04-08 Chimeric protein having photoactivatable recombinase activity WO2019193205A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1853046 2018-04-06
FR1853046A FR3079832A1 (en) 2018-04-06 2018-04-06 CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY

Publications (1)

Publication Number Publication Date
WO2019193205A1 true WO2019193205A1 (en) 2019-10-10

Family

ID=63080037

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2019/058829 WO2019193205A1 (en) 2018-04-06 2019-04-08 Chimeric protein having photoactivatable recombinase activity

Country Status (2)

Country Link
FR (1) FR3079832A1 (en)
WO (1) WO2019193205A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6734295B1 (en) 1999-09-17 2004-05-11 President Of Osaka University Modified CRE recombinase gene for mammals
WO2014158593A1 (en) 2013-03-13 2014-10-02 President And Fellows Of Harvard College Mutants of cre recombinase
WO2017015545A1 (en) * 2015-07-22 2017-01-26 President And Fellows Of Harvard College Evolution of site-specific recombinases
WO2017144620A1 (en) * 2016-02-24 2017-08-31 Max Planck Florida Institute for Neuroscience Light-gated signaling modulation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6734295B1 (en) 1999-09-17 2004-05-11 President Of Osaka University Modified CRE recombinase gene for mammals
WO2014158593A1 (en) 2013-03-13 2014-10-02 President And Fellows Of Harvard College Mutants of cre recombinase
WO2017015545A1 (en) * 2015-07-22 2017-01-26 President And Fellows Of Harvard College Evolution of site-specific recombinases
WO2017144620A1 (en) * 2016-02-24 2017-08-31 Max Planck Florida Institute for Neuroscience Light-gated signaling modulation

Non-Patent Citations (46)

* Cited by examiner, † Cited by third party
Title
"Genbank", Database accession no. AAC05083
"GenBank", Database accession no. AAK08514.1
"UNIPROT", Database accession no. 049003
ALTSCHUL ET AL., FEBS J., vol. 272, 2005, pages 5101 - 5109
ALTSCHUL ET AL., NUCLEIC ACIDS RES., vol. 25, 1997, pages 3389 - 3402
ANASTASSIADIS ET AL., DISEASE MODELS & MECHANISMS, vol. 2, 2009, pages 508 - 515
BABINET; COHEN-TANNOUDJI, MED SCI, vol. 16, no. 1, 2000, pages 31 - 42
BUCHHOLZ ET AL., NAT BIOTECHNOL., vol. 16, 1998, pages 657 - 662
CHENG ET AL., ENDOCRINOLOGY, vol. 157, 2016, pages 127 - 140
FRANK BUCHHOLZ; A. FRANCIS STEWART, NATURE BIOTECHNOLOGY, vol. 19, 2001, pages 1047 - 1052
FUUN KAWANO ET AL: "A photoactivatable Cre-loxP recombination system for optogenetic genome engineering", NATURE CHEMICAL BIOLOGY, vol. 12, no. 12, 1 December 2016 (2016-12-01), Basingstoke, pages 1059 - 1064, XP055506281, ISSN: 1552-4450, DOI: 10.1038/nchembio.2205 *
GRECO ET AL., GENE THERAPY, vol. 13, 2006, pages 206 - 215
GUNTAS ET AL., P.N.A.S., vol. 112, no. 1, 2015, pages 112 - 117
GUNTAS ET AL., PROC. NATL. ACAD. SCI., vol. 112, 2015, pages 112 - 117
GURKAN GUNTAS ET AL: "Engineering an improved light-induced dimer (iLID) for controlling the localization and activity of signaling proteins", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 112, no. 1, 6 January 2015 (2015-01-06), US, pages 112 - 117, XP055506159, ISSN: 0027-8424, DOI: 10.1073/pnas.1417910112 *
HALAVATY; MOFFAT, BIOCHEMISTRY, vol. 46, 2007, pages 14001 - 14009
HARPER, SCIENCE, vol. 301, 2003, pages 1541 - 1544
INDRA ET AL., NUCLEIC ACIDS RES., vol. 27, 1999, pages 4324 - 4327
KAWANO ET AL., NAT CHEM BIOL., vol. 12, no. 12, December 2016 (2016-12-01), pages 1059 - 1064
KAWANO ET AL., NAT. CHEM. BIOL., vol. 12, no. 12, 2016, pages 1059 - 1064
KAWANO ET AL., PLOS ONE, vol. 8, no. 12, 2013, pages e82693
KOBAYASHI ET AL., GENES. N. Y. N, vol. 51, 2000, pages 59 - 67
LIU RONGRONG ET AL: "Effect of deletion mutation on the recombination activity of Cre recombinase", ACTA BIOCHIMICA POLONICA, vol. 52, 1 January 2005 (2005-01-01), PL, pages 541 - 544, XP055506217, ISSN: 0001-527X *
LU ET AL., BIOCONJUG. CHEM., vol. 23, 2012, pages 1945 - 1951
LUNGU ET AL., CHEM. BIOL., vol. 19, 2012, pages 507 - 517
MARTIN CHAPLIN; CHRISTOPHER BUCKE: "Enzyme Technology", 1990, CAMBRIDGE UNIVERSITY PRESS
METZGER ET AL., PROC. NATL. ACAD. SCI., vol. 92, 1995, pages 6991 - 6995
METZGER; CHAMBON, METHODS, vol. 24, 2001, pages 71 - 80
NEEDLEMAN; WUNSCH, J. MOL. BIOL, vol. 48, 1970, pages 443
PROC NATL ACAD SCI USA, vol. 99, no. 7, 2 April 2002 (2002-04-02), pages 4185 - 90
RAYMOND; SORIANO, PLOS ONE, vol. 2, 2007, pages el62
SAMBROOK ET AL.: "Molecular cloning: a laboratory manual", 2001, COLD SPRING HARBOR
SANTORO; SCHULTZ, PROC NATL ACAD SCI USA, vol. 99, no. 7, 2 April 2002 (2002-04-02), pages 4185 - 90
SAUER, MOL. CELL. BIOL., vol. 7, 1987, pages 2087 - 2096
SINHA ET AL., CHEMBIOCHEM, vol. 11, 2010, pages 653 - 663
SINHA ET AL., ZEBRAFISH, vol. 7, 2010, pages 199 - 204
SMITH; WATERMAN, ADV. APPL. MATH., vol. 2, 1981, pages 482
STRICKLAND ET AL., NATURE METHODS, vol. 7, no. 8, 2010, pages 623 - 626
SUZANNE E. SCHINDLER ET AL: "Photo-activatable Cre recombinase regulates gene expression in vivo", SCIENTIFIC REPORTS, vol. 5, no. 1, 9 September 2015 (2015-09-09), XP055506223, DOI: 10.1038/srep13627 *
TASLIMI ET AL., NAT CHEM BIOL., vol. 12, no. 6, June 2016 (2016-06-01), pages 425 - 430
TAYLOR, I. B. ZHULIN, MICROBIOL. MOL. BIOL. REV., vol. 63, 1999, pages 479
WANG ET AL., NAT. METHODS, vol. 9, 2012, pages 266 - 269
WU, Q.; GARDNER, K.H., BIOCHEMISTRY, vol. 48, 2009, pages 2620 - 2629
ZAYNER ET AL., J. MOL. BIOL., vol. 419, 2012, pages 61 - 74
ZHANG ET AL., NATURE METHODS, vol. 14, no. 4, 2017, pages 391 - 394
ZOLTOWSKI, B.D.; VACCARO, B.; CRANE, B.R., NAT. CHEM. BIOL., vol. 5, 2009, pages 827 - 834

Also Published As

Publication number Publication date
FR3079832A1 (en) 2019-10-11

Similar Documents

Publication Publication Date Title
US9938327B2 (en) Expression constructs and methods of genetically engineering methylotrophic yeast
RU2730038C2 (en) Luciferin biosynthesis enzymes and use thereof
US8759028B2 (en) Expression cassette, recombinant host cell and process for producing a target protein
EP3798302A1 (en) Method for inducing targeted meiotic recombinations
JP2002512015A (en) Rapidly degradable GFP fusion proteins and methods of use
WO2002072846A9 (en) Synthetic genes and bacterial plasmids devoid of cpg
WO2012071549A2 (en) Inducible expression system transcription modulators comprising a distributed protein transduction domain and methods for using the same
FR2500847A1 (en) SELECTIVE GENETIC MARKERS FOR EUKARYOTIC CELLS, PROCESS FOR IMPLEMENTING SUCH MARKERS AND APPLICATION OF THE CELLS CONTAINING SUCH A MARKER TO THE MANUFACTURE OF DETERMINED PROTEINS AFTER THEIR TRANSFORMATION BY A CORRESPONDING DNA
CN101939422A (en) Spray-dried microorganisms and methods of making and using them
KR102018248B1 (en) Mutant Gaussia luciferase with enhanced bioluminescence intensity
WO2019193205A1 (en) Chimeric protein having photoactivatable recombinase activity
EP2689018B1 (en) Constructs and method for regulating gene expression or for detecting and controlling a dna locus in eukaryotes
JP2006508678A (en) Fluorescent proteins from aqueous species
CA2455542A1 (en) Mutated photoproteins and their uses
JP5224100B2 (en) Mutant luciferase
JP6535483B2 (en) Juvenile hormone sensor
EP2424572A1 (en) Targeting nucleic acids in the mitochondria
JP7241423B2 (en) Photoproteins, their substrates, and their uses
WO1999053080A1 (en) Novel constructs for controlled expression of recombinant proteins in prokaryotic cells
JP2008237024A (en) Transformant having galactose induction system and use thereof
US12331337B2 (en) Fe-S fusion protein acting as electron transfer chain, carbon monoxide formate redox enzyme mediated through FES fusion protein, strain BCF12 derived from Thermococcus wherein enzyme is transformed, and use thereof
JP2010124782A (en) Method for producing protein using nematode
WO2024034619A1 (en) Luminescent protein
Kumarasamy et al. Tagging fluorescent reporter to epinecidin-1 antimicrobial peptide
JP6573400B2 (en) A novel diatom transformation vector and a novel promoter sequence contained therein

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19714699

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19714699

Country of ref document: EP

Kind code of ref document: A1