[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2635244T3 - CRISPR-Cas systems, methods and component compositions for sequence manipulation - Google Patents

CRISPR-Cas systems, methods and component compositions for sequence manipulation Download PDF

Info

Publication number
ES2635244T3
ES2635244T3 ES13812430.0T ES13812430T ES2635244T3 ES 2635244 T3 ES2635244 T3 ES 2635244T3 ES 13812430 T ES13812430 T ES 13812430T ES 2635244 T3 ES2635244 T3 ES 2635244T3
Authority
ES
Spain
Prior art keywords
crispr
sequence
protein
csn1
family
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13812430.0T
Other languages
Spanish (es)
Inventor
Feng Zhang
David Olivier BIKARD
Le Cong
David Benjamin Turitz COX
Patrick Hsu
Wenyan Jiang
Shauiliang LIN
Luciano MARRAFFINI
Randall Jeffrey PLATT
Fei RAN
Neville Espi SANJANA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Rockefeller University
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Rockefeller University
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Rockefeller University, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Priority claimed from PCT/US2013/074611 external-priority patent/WO2014093595A1/en
Application granted granted Critical
Publication of ES2635244T3 publication Critical patent/ES2635244T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Una composición que no se encuentra en la naturaleza o lograda, que comprende un sistema vector que comprende uno o más vectores que comprenden: I. un primer elemento regulador ligado de manera operable a una secuencia de polinucleótidos de ARN quimérico (ARNqui) del sistema CRISPR-Cas, en el que la secuencia de polinucleótidos comprende: (a) una secuencia guía capaz de hibridarse a una secuencia diana en una célula eucariota, (b) una secuencia de emparejamiento tracr y (c) una secuencia tracr y II. un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende al menos una o más secuencias de localización nuclear (las NLS) en la proximidad de un extremo de la enzima CRISPR, en la que (a), (b) y (c) se disponen en una orientación 5' a 3', en la que los componentes I y II se sitúan en vectores iguales o diferentes del sistema, en la que cuando se transcribe, la secuencia de emparejamiento tracr hibrida a la secuencia tracr y la secuencia guía dirige la unión específica de la secuencia de un complejo de CRISPR a la secuencia diana, en la que el complejo de CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y en la que la secuencia de polinucleótidos de ARN quimérico comprende dos o más horquillas.A composition that is not found in nature or achieved, comprising a vector system comprising one or more vectors comprising: I. a first regulatory element operably linked to a chimeric RNA polynucleotide sequence (siRNA) of the CRISPR system -Cas, in which the polynucleotide sequence comprises: (a) a guide sequence capable of hybridizing to a target sequence in a eukaryotic cell, (b) a tracr pairing sequence and (c) a tracr and II sequence. a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising at least one or more nuclear localization sequences (the NLS) in the vicinity of one end of the CRISPR enzyme, in which (a ), (b) and (c) are arranged in a 5 'to 3' orientation, in which components I and II are placed in the same or different vectors of the system, in which, when transcribed, the tracr pairing sequence hybridizes to the tracr sequence and the guide sequence directs the specific binding of the sequence of a CRISPR complex to the target sequence, in which the CRISPR complex comprises the CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and in which the chimeric RNA polynucleotide sequence comprises two or more hairpins.

Description

Sistemas, métodos y composiciones de componentes de CRISPR-Cas para manipulación de secuencias. CRISPR-Cas systems, methods and component compositions for sequence manipulation.

Campo de la invención Field of the Invention

La presente invención se refiere en general a sistemas, métodos y composiciones usados para el control de la expresión de genes que implica fijar como objetivo una secuencia, tal como perturbación del genoma o edición de genes, que pueden usar sistemas vectores relacionados con Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas (CRISPR, por sus siglas en inglés) y componentes de los mismos. The present invention relates in general to systems, methods and compositions used for the control of gene expression that involves targeting a sequence, such as genome disturbance or gene editing, which vector systems related to Short Palindromic Repeats can use Grouped and Regularly Interested (CRISPR) and their components.

Informe relativo a la investigación patrocinada por el gobierno federal. Esta invención se realizó con apoyo estatal bajo el Premio Pionero de los INS DP1MH100706, otorgado por los Institutos Nacionales de Salud. El gobierno tiene ciertos derechos sobre la invención. Report related to research sponsored by the federal government. This invention was carried out with state support under the INS Pioneer Award DP1MH100706, granted by the National Institutes of Health. The government has certain rights over the invention.

Antecedentes de la invención Background of the invention

Los recientes avances en las técnicas de secuenciación del genoma y métodos de análisis han acelerado significativamente la capacidad para catalogar y cartografiar factores genéticos asociados a un diverso intervalo de funciones biológicas y enfermedades. Se requieren tecnologías precisas para fijar como objetivo genoma para permitir la ingeniería inversa sistemática de variaciones genéticas causales permitiendo la perturbación selectiva de elementos genéticos individuales, así como avanzar las aplicaciones de la biología sintética, biotecnológicas y médicas. Aunque están disponibles técnicas de edición de genoma tales como dedos de cinc diseñadores, efectores del tipo activador de la transcripción (los TALE, por sus siglas en inglés) o meganucleasas de migración para producir perturbaciones del genoma fijado como objetivo, sigue existiendo la necesidad de nuevas tecnologías de ingeniería del genoma que tengan un precio asequible, fáciles de montar, escalables y susceptibles de fijar como objetivo múltiples posiciones dentro del genoma eucariota. Recent advances in genome sequencing techniques and analysis methods have significantly accelerated the ability to catalog and map genetic factors associated with a diverse range of biological functions and diseases. Precise technologies are required to set the target genome to allow systematic reverse engineering of causal genetic variations allowing selective disturbance of individual genetic elements, as well as advancing the applications of synthetic, biotechnological and medical biology. Although genome editing techniques such as designer zinc fingers, transcription activator type effectors (the TALE) or migration meganucleases to produce disturbances of the target genome are available, there is still a need for new genome engineering technologies that are affordable, easy to assemble, scalable and capable of setting multiple positions within the eukaryotic genome.

Sumario de la invención Summary of the invention

Existe una necesidad apremiante de sistemas y técnicas alternativos y robustos para fijar como objetivo secuencias con una amplia serie de aplicaciones. Esta invención estudia esta necesidad y proporciona ventajas relacionadas. El CRISPR/Cas o el sistema CRISPR-Cas (ambos términos se usan de manera intercambiable por toda esta solicitud) no requiere la generación de proteínas personalizadas para secuencias específicas fijadas como objetivo sino más bien se puede programar una enzima Cas única mediante una molécula de ARN corta para reconocer un objetivo de ADN específico, en otras palabras, la enzima Cas se puede reclutar para un objetivo de ADN específico usando dicha molécula de ARN corta. Añadir el sistema CRISPR-Cas al repertorio de técnicas de secuenciación del genoma y métodos de análisis puede simplificar de manera significativa la metodología y acelerar la capacidad para catalogar y cartografiar factores genéticos asociados a un diverso intervalo de funciones biológicas y enfermedades. Para utilizar el sistema CRISPR-Cas de manera eficaz para editar genoma sin efectos perjudiciales, es crítico comprender aspectos de ingeniería y optimización de estas herramientas de ingeniería del genoma, que son aspectos de la presente descripción. There is a pressing need for alternative and robust systems and techniques to target sequences with a wide range of applications. This invention studies this need and provides related advantages. The CRISPR / Cas or the CRISPR-Cas system (both terms are used interchangeably throughout this application) does not require the generation of customized proteins for specific target sequences but rather a single Cas enzyme can be programmed using a molecule of Short RNA to recognize a specific DNA target, in other words, the Cas enzyme can be recruited for a specific DNA target using said short RNA molecule. Adding the CRISPR-Cas system to the repertoire of genome sequencing techniques and analysis methods can significantly simplify the methodology and accelerate the ability to catalog and map genetic factors associated with a diverse range of biological functions and diseases. To use the CRISPR-Cas system effectively to edit genome without damaging effects, it is critical to understand engineering aspects and optimization of these genome engineering tools, which are aspects of this description.

Según la presente invención, se proporciona una composición que no se encuentra en la naturaleza o lograda que comprende un sistema vector según las reivindicaciones 1 o 2. También se proporciona un sistema de enzima CRISPR multiplexada según la reivindicación 4. La invención proporciona además un método para seleccionar una o más célula(s) procariota(s), estando el método de acuerdo con la reivindicación 22. Más aspectos de la invención se describen en las reivindicaciones dependientes. La invención también proporciona métodos usando las composiciones de la invención. According to the present invention, there is provided a composition that is not found in nature or achieved comprising a vector system according to claims 1 or 2. A multiplexed CRISPR enzyme system according to claim 4 is also provided. The invention further provides a method to select one or more prokaryotic cell (s), the method according to claim 22. More aspects of the invention are described in the dependent claims. The invention also provides methods using the compositions of the invention.

En un aspecto, la descripción proporciona un sistema vector que comprende uno o más vectores. En algunas realizaciones, el sistema comprende: (a) un primer elemento regulador ligado de manera operable a una secuencia de emparejado tracr y uno o más sitios de inserción para insertar una o más secuencias guía aguas arriba de la secuencia de emparejado tracr, en la que cuando se expresa, la secuencia guía se dirige a unión específica de secuencias de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia fijada como objetivo y (2) la secuencia de emparejado tracr que se hibrida a la secuencia tracr y (b) un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzimas que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear; en el que los componentes (a) y (b) están situados en los mismos vectores o diferentes del sistema. En algunas realizaciones, el componente (a) comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía ligadas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos o más secuencias guía dirige unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula eucariota. En algunas realizaciones, el sistema comprende la secuencia tracr bajo el control de un In one aspect, the description provides a vector system comprising one or more vectors. In some embodiments, the system comprises: (a) a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting one or more guiding sequences upstream of the tracr pairing sequence, in the that when expressed, the guide sequence is directed to specific binding of sequences from a CRISPR complex to a target-fixed sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that is hybridizes to the target set sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a sequence nuclear location; wherein the components (a) and (b) are located in the same or different vectors of the system. In some embodiments, component (a) further comprises the tracr sequence downstream of the pairing sequence tracr under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs specific binding of the sequence of a complex CRISPR to a different target sequence in a eukaryotic cell. In some embodiments, the system comprises the sequence tracr under the control of a

tercer elemento regulador, tal como un activador de polimerasa III. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejado tracr cuando se alinean de manera óptima. Determinar el alineamiento óptimo está dentro del alcance de un experto en la materia. Por ejemplo, hay algoritmos y programas de alineamiento disponibles públicamente y comercialmente tales como, pero no limitado a, ClustalW, Smith-Waterman en Matlab, Bowtie, Geneious, Biopython y SeqMan. En algunas realizaciones, el complejo CRISPR comprende una third regulatory element, such as a polymerase III activator. In some embodiments, the tracr sequence has at least 50%, 60%, 70%, 80%, 90%, 95% or 99% sequence complementarity along the length of the tracr pairing sequence when aligned with optimal way. Determining the optimal alignment is within the scope of an expert in the field. For example, there are algorithms and alignment programs available publicly and commercially such as, but not limited to, ClustalW, Smith-Waterman in Matlab, Bowtie, Geneious, Biopython and SeqMan. In some embodiments, the CRISPR complex comprises a

o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicho complejo CRISPR en una cantidad detectable en el núcleo de una célula eucariota. Sin desear estar ligados por la teoría, se cree que una secuencia de localización nuclear no es necesariamente para actividad del complejo CRISPR en eucariotas, sino que incluyendo tales secuencias se mejora la actividad del sistema, especialmente en cuanto a moléculas de ácido nucleico fijadas como objetivo en el núcleo. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo II. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada derivada de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos cadenas en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa III. En algunas realizaciones, el segundo elemento regulador es un activador de la polimerasa II. En algunas realizaciones, la secuencia guía tiene al menos 15, 16, 17, 18, 19, 20, 25 nucleótidos o entre 10-30 o entre 15-25 o entre 15-20 nucleótidos de longitud. En general y por toda esta memoria descriptiva, el término "vector" se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido. Los vectores incluyen, pero no se limitan a, moléculas de ácido nucleico que son monocatenarias, bicatenarias o parcialmente bicatenarias; moléculas de ácido nucleico que comprenden uno o más extremos libres, ningún extremo libre (por ejemplo, circular); moléculas de ácido nucleico que comprenden ADN, ARN o ambos y otras variedades de polinucleótidos conocidos en la técnica. Un tipo de vector es un "plásmido", que se refiere a un bucle de ADN de doble cadena circular en que se pueden insertar segmentos de ADN adicionales, tal como por técnicas de clonación molecular clásicas. Otro tipo de vector es un vector vírico, en el que están presentes secuencias de ADN o ARN derivadas víricamente en el vector para empaquetamiento en un virus (por ejemplo, retrovirus, retrovirus de replicación defectuosa, adenovirus, adenovirus de replicación defectuosa y virus adenoasociados). Los vectores víricos también incluyen polinucleótidos soportados por un virus para transinfección a una célula huésped. Algunos vectores son capaces de replicación autónoma en una célula huésped en que se introducen (por ejemplo, vectores bacterianos con un origen bacteriano de replicación y vectores de mamífero episomales). Otros vectores (por ejemplo, vectores de mamíferos no episomales) se integran en el genoma de una célula huésped en la introducción en la célula huésped y se replican de ese modo junto con el genoma huésped. Por otra parte, algunos vectores son capaces de dirigir la expresión de los genes a los que están unidos de manera operativa. Dichos vectores se refieren en la presente memoria como "vectores de expresión". Los vectores de expresión comunes de utilidad en técnicas de ADN recombinante están con frecuencia en la forma de plásmidos. or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR complex in a detectable amount in the nucleus of a eukaryotic cell. Without wishing to be bound by theory, it is believed that a nuclear localization sequence is not necessarily for activity of the CRISPR complex in eukaryotes, but that including such sequences improves system activity, especially in terms of target nucleic acid molecules. in the core In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes or S. thermophilus and may include mutated Cas9 derived from these organisms. The enzyme can be a homolog or ortholog of Cas9. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs the cleavage of one or two chains at the position of the target sequence. In some embodiments, the CRISPR enzyme lacks DNA chain cleavage activity. In some embodiments, the first regulatory element is a polymerase III activator. In some embodiments, the second regulatory element is a polymerase II activator. In some embodiments, the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides or between 10-30 or between 15-25 or between 15-20 nucleotides in length. In general and throughout this specification, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single stranded, double stranded or partially double stranded; nucleic acid molecules comprising one or more free ends, no free end (for example, circular); nucleic acid molecules comprising DNA, RNA or both and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular double-stranded DNA loop in which additional segments of DNA can be inserted, such as by classical molecular cloning techniques. Another type of vector is a viral vector, in which virally derived DNA or RNA sequences are present in the vector for packaging in a virus (e.g., retroviruses, defective replication retroviruses, adenoviruses, defective replication adenoviruses and adeno-associated viruses) . Viral vectors also include polynucleotides supported by a virus for transfection into a host cell. Some vectors are capable of autonomous replication in a host cell into which they are introduced (for example, bacterial vectors with a bacterial origin of replication and episomal mammalian vectors). Other vectors (for example, non-episomal mammalian vectors) are integrated into the genome of a host cell upon introduction into the host cell and thereby replicated together with the host genome. On the other hand, some vectors are capable of directing the expression of the genes to which they are operatively linked. Such vectors are referred to herein as "expression vectors." Common expression vectors useful in recombinant DNA techniques are often in the form of plasmids.

Los vectores de expresión recombinantes pueden comprender un ácido nucleico de la descripción en una forma adecuada para expresión del ácido nucleico en una célula huésped, que significa que los vectores de expresión recombinantes incluyen uno o más elementos reguladores, que se pueden seleccionar sobre la base de las células huésped que se tienen que usar para expresión, que está unido de manera operativa a la secuencia de ácidos nucleicos que se tiene que expresar. En un vector de expresión recombinante, "unido de manera operable" significa que la secuencia de nucleótidos de interés está unida al elemento o a los elementos reguladores de una manera que permite la expresión de la secuencia de nucleótidos (por ejemplo, en un sistema de transcripción/traducción in vitro o en una célula huésped cuando el vector se introduce en la célula huésped). The recombinant expression vectors may comprise a nucleic acid of the description in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors include one or more regulatory elements, which may be selected on the basis of the host cells that have to be used for expression, which is operatively linked to the nucleic acid sequence to be expressed. In a recombinant expression vector, "operably linked" means that the nucleotide sequence of interest is linked to the element or regulatory elements in a manner that allows the expression of the nucleotide sequence (eg, in a transcription system / translation in vitro or in a host cell when the vector is introduced into the host cell).

El término "elemento regulador" incluye activadores, potenciadores, sitios de entrada de ribosomas internos (IRES, por sus siglas en inglés) y otros elementos de control de la expresión (por ejemplo, señales de terminación de la transcripción, tales como señales de poliadenilación y secuencias poli-U). Tales elementos reguladores se describen, por ejemplo, en Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Los elementos reguladores incluyen aquéllos que dirigen la expresión constitutiva de una secuencia de nucleótidos en muchos tipos de célula huésped y aquéllos que dirigen la expresión de la secuencia de nucleótidos sólo en ciertas células huésped (por ejemplo, secuencias reguladoras específicas del tejido). Un activador específico del tejido puede dirigir la expresión principalmente en un tejido deseado de interés, tal como músculo, neurona, hueso, piel, sangre, órganos específicos (por ejemplo, hígado, páncreas) o tipos de células particulares (por ej., linfocitos). Los elementos reguladores también pueden dirigir la expresión de una manera dependiente temporal, tal como de una manera dependiente del ciclo celular o dependiente de la fase de desarrollo, que puede ser o no también específica del tejido o del tipo de célula. En algunas realizaciones, un vector comprende uno o más activadores de pol III (por ej., 1, 2, 3, 4, 5 o más activadores de pol III), uno o más activadores de pol II (por ej., 1, 2, 3, 4, 5 o más activadores de pol II), uno o más activadores de pol I (por ej., 1, 2, 3, 4, 5 o más activadores de pol I) o combinaciones de los mismos. Ejemplos de activadores de pol III incluyen, pero no se limitan a, activadores U6 y H1. Ejemplos de activadores de pol II incluyen, pero no se limitan a, el activador LTR del virus The term "regulatory element" includes activators, enhancers, internal ribosome entry sites (IRES) and other expression control elements (eg, transcription termination signals, such as polyadenylation signals). and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that direct the constitutive expression of a nucleotide sequence in many types of host cell and those that direct the expression of the nucleotide sequence only in certain host cells (eg, tissue-specific regulatory sequences). A specific tissue activator can direct expression primarily in a desired tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas) or particular cell types (e.g., lymphocytes ). Regulatory elements may also direct the expression in a time-dependent manner, such as in a cell cycle-dependent or developmentally dependent manner, which may or may not also be tissue specific or cell type. In some embodiments, a vector comprises one or more pol III activators (e.g., 1, 2, 3, 4, 5 or more pol III activators), one or more pol II activators (e.g., 1, 2, 3, 4, 5 or more pol II activators), one or more pol I activators (eg, 1, 2, 3, 4, 5 or more pol I activators) or combinations thereof. Examples of pol III activators include, but are not limited to, activators U6 and H1. Examples of pol II activators include, but are not limited to, the virus LTR activator.

del sarcoma de Rous (RSV, por sus siglas en inglés) retrovírico (opcionalmente con el potenciador de RSV), el activador de citomegalovirus (CMV) (opcionalmente con el estimulador de CMV) [véase, por ej., Boshart et al, Cell, of retroviral Rous sarcoma (RSV) (optionally with RSV enhancer), cytomegalovirus activator (CMV) (optionally with CMV stimulator) [see, eg, Boshart et al, Cell ,

41: 521-530 (1985)], el activador de SV40, el activador de dihidrofolato reductasa, el activador de β-actina, el activador de fosfoglicerol cinasa (PGK, por sus siglas en inglés) y el activador de EF1α. También están incluidos en el término "elemento regulador" los elementos estimuladores, tales como WPRE; estimuladores de CMV; el segmento R-U5' en LTR de HTLV-1 (Mol. Cell. Biol., Vol. 8 (1), pág. 466-472, 1988); estimulador de SV40 y la secuencia del intrón entre los exones 2 y 3 de β-globina de conejo (Proc. Natl. Acad. Sci. USA., Vol. 78 (3), pág. 1.527-31, 1981). Se apreciará por los expertos en la materia que el diseño del vector de expresión puede depender de factores tales como la elección de la célula huésped que se tiene que transformar, el nivel de expresión deseado, etc. Se puede introducir un vector en células huésped para producir de ese modo transcritos, proteínas o péptidos, incluyendo proteínas o péptidos de fusión, codificados por ácidos nucleicos como se describe en la presente memoria (por ejemplo, transcritos de repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR), proteínas, enzimas, formas mutantes de los mismos, proteínas de fusión de los mismos, etc.). 41: 521-530 (1985)], the SV40 activator, the dihydrofolate reductase activator, the β-actin activator, the phosphoglycerol kinase activator (PGK) and the EF1α activator. Also included in the term "regulatory element" are stimulatory elements, such as WPRE; CMV stimulators; the R-U5 'segment in LTR of HTLV-1 (Mol. Cell. Biol., Vol. 8 (1), p. 466-472, 1988); SV40 stimulator and intron sequence between exons 2 and 3 of rabbit β-globin (Proc. Natl. Acad. Sci. USA., Vol. 78 (3), p. 1,527-31, 1981). It will be appreciated by those skilled in the art that the design of the expression vector may depend on factors such as the choice of host cell to be transformed, the level of expression desired, etc. A vector can be introduced into host cells to thereby produce transcripts, proteins or peptides, including fusion proteins or peptides, encoded by nucleic acids as described herein (e.g., transcripts of clustered and regularly interspaced short palindromic repeats. (CRISPR), proteins, enzymes, mutant forms thereof, fusion proteins thereof, etc.).

Vectores ventajosos incluyen lentivirus y virus adenoasociados y también se pueden seleccionar tipos de tales vectores para fijar como objetivo tipos particulares de células. Advantageous vectors include lentiviruses and adeno-associated viruses and types of such vectors can also be selected to target particular types of cells.

En un aspecto, la descripción proporciona un vector que comprende un elemento regulador unido de manera operable a una secuencia codificadora de enzimas que codifica una enzima CRISPR que comprende una o más secuencias de localización nucleares. En algunas realizaciones, dicho elemento regulador conduce la transcripción de la enzima CRISPR en una célula eucariota de manera que dicha enzima CRISPR se acumula en una cantidad detectable en el núcleo de la célula eucariota. En algunas realizaciones, el elemento regulador es un activador de la polimerasa II. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo II. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos cadenas en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN. In one aspect, the description provides a vector comprising a regulatory element operably linked to an enzyme coding sequence encoding a CRISPR enzyme comprising one or more nuclear localization sequences. In some embodiments, said regulatory element conducts transcription of the CRISPR enzyme in a eukaryotic cell such that said CRISPR enzyme accumulates in a detectable amount in the nucleus of the eukaryotic cell. In some embodiments, the regulatory element is a polymerase II activator. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 of S. pneumoniae, S. pyogenes or S. thermophilus and may include mutated Cas9 from these organisms. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs the cleavage of one or two chains at the position of the target sequence. In some embodiments, the CRISPR enzyme lacks DNA chain cleavage activity.

En un aspecto, la descripción proporciona una enzima CRISPR que comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo II. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR carece de capacidad para escindir una o más cadenas de una secuencia objetivo a la que se une. In one aspect, the description provides a CRISPR enzyme comprising one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 of S. pneumoniae, S. pyogenes or S. thermophilus and may include mutated Cas9 from these organisms. The enzyme can be a homolog or ortholog of Cas9. In some embodiments, the CRISPR enzyme lacks the ability to cleave one or more chains of an objective sequence to which it binds.

En un aspecto, la descripción proporciona una célula eucariota huésped que comprende: (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una o más secuencias guía aguas arriba de la secuencia de emparejamiento tracr, en la que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica a dicha enzima CRISPR que comprende una secuencia de localización nuclear. En algunas realizaciones, la célula huésped comprende los componentes (a) y (b). En algunas realizaciones, el componente (a), el componente (b) o los componentes (a) y (b) están integrados de manera estable en un genoma de la célula eucariota huésped. En algunas realizaciones, el componente (a) comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía unidas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula eucariota. En algunas realizaciones, la célula huésped eucariota comprende además un tercer elemento regulador, tal como un activador de la polimerasa III, unido de manera operable a dicha secuencia tracr. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinean de manera óptima. En algunas realizaciones, la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo II. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o In one aspect, the description provides a host eukaryotic cell comprising: (a) a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites to insert one or more guide sequences upstream of the sequence of tracr pairing, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to an objective sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said enzyme CRISPR comprising a nuclear localization sequence. In some embodiments, the host cell comprises components (a) and (b). In some embodiments, component (a), component (b) or components (a) and (b) are stably integrated into a genome of the host eukaryotic cell. In some embodiments, component (a) further comprises the tracr sequence downstream of the pairing sequence tracr under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, in which when expressed, each of the two or more guide sequences directs the specific binding of the sequence of a CRISPR complex to a different target sequence in a eukaryotic cell. In some embodiments, the eukaryotic host cell further comprises a third regulatory element, such as a polymerase III activator, operably linked to said tracr sequence. In some embodiments, the tracr sequence has at least 50%, 60%, 70%, 80%, 90%, 95% or 99% sequence complementarity along the length of the tracr pairing sequence when aligned with optimal way. In some embodiments, the CRISPR enzyme comprises one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 of S. pneumoniae, S. pyogenes or

S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos cadenas en la posición de la S. thermophilus and may include mutated Cas9 from these organisms. The enzyme can be a homolog or ortholog of Cas9. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs the cleavage of one or two chains at the position of the

secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa III. En algunas realizaciones, el segundo elemento regulador es un activador de la polimerasa II. En algunas realizaciones, la secuencia guía es al menos 15, 16, 17, 18, 19, 20, 25 nucleótidos o entre 10-30 o entre 15-25 o entre 15-20 nucleótidos de longitud. En un aspecto, la descripción proporciona un organismo eucariota no humano; preferiblemente un organismo eucariota multicelular, que comprende una célula eucariota huésped según cualquiera de las realizaciones descritas. En otros aspectos, la descripción proporciona un organismo eucariota; preferiblemente un organismo eucariota multicelular, que comprende una célula eucariota huésped según cualquiera de las realizaciones descritas. El organismo en algunas realizaciones de estos aspectos puede ser un animal; por ejemplo, un mamífero. También, el organismo puede ser un artrópodo tal como un insecto. El organismo puede ser también una planta. Además, el organismo puede ser un hongo. objective sequence In some embodiments, the CRISPR enzyme lacks DNA chain cleavage activity. In some embodiments, the first regulatory element is a polymerase III activator. In some embodiments, the second regulatory element is a polymerase II activator. In some embodiments, the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides or between 10-30 or between 15-25 or between 15-20 nucleotides in length. In one aspect, the description provides a non-human eukaryotic organism; preferably a multicellular eukaryotic organism, comprising a host eukaryotic cell according to any of the described embodiments. In other aspects, the description provides a eukaryotic organism; preferably a multicellular eukaryotic organism, comprising a host eukaryotic cell according to any of the described embodiments. The organism in some embodiments of these aspects may be an animal; For example, a mammal. Also, the organism can be an arthropod such as an insect. The organism can also be a plant. In addition, the organism can be a fungus.

En un aspecto, la descripción proporciona un estuche que comprende uno o más de los componentes descritos en la presente memoria. En algunas realizaciones, el estuche comprende un sistema vector e instrucciones para usar el estuche. En algunas realizaciones, el sistema vector comprende: (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una o más secuencias guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresan, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear. En algunas realizaciones, el estuche comprende los componentes (a) y (b) situados en los mismos vectores del sistema o diferentes. En algunas realizaciones, el componente (a) comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía unidas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula eucariota. En algunas realizaciones, el sistema comprende además un tercer elemento regulador, tal como un activador de la polimerasa III, unido de manera operable a dicha secuencia tracr. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. En algunas realizaciones, la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo II. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos cadenas en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa III. En algunas realizaciones, el segundo elemento regulador es un activador de la polimerasa II. En algunas realizaciones, la secuencia guía es al menos 15, 16, 17, 18, 19, 20, 25 nucleótidos o entre 10-30 o entre 15-25 o entre 15-20 nucleótidos de longitud. In one aspect, the description provides a case comprising one or more of the components described herein. In some embodiments, the case comprises a vector system and instructions for using the case. In some embodiments, the vector system comprises: (a) a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting one or more guiding sequences upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target-fixed sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that the target sequence is hybridized and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence In some embodiments, the case comprises components (a) and (b) located in the same or different system vectors. In some embodiments, component (a) further comprises the tracr sequence downstream of the pairing sequence tracr under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, in which when expressed, each of the two or more guide sequences directs the specific binding of the sequence of a CRISPR complex to a different target sequence in a eukaryotic cell. In some embodiments, the system further comprises a third regulatory element, such as a polymerase III activator, operably linked to said tracr sequence. In some embodiments, the tracr sequence has at least 50%, 60%, 70%, 80%, 90%, 95% or 99% sequence complementarity along the length of the tracr pairing sequence when aligned with optimal way. In some embodiments, the CRISPR enzyme comprises one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 of S. pneumoniae, S. pyogenes or S. thermophilus and may include mutated Cas9 from these organisms. The enzyme can be a homolog or ortholog of Cas9. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs the cleavage of one or two chains at the position of the target sequence. In some embodiments, the CRISPR enzyme lacks DNA chain cleavage activity. In some embodiments, the first regulatory element is a polymerase III activator. In some embodiments, the second regulatory element is a polymerase II activator. In some embodiments, the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides or between 10-30 or between 15-25 or between 15-20 nucleotides in length.

En un aspecto, la descripción proporciona un método para modificar un polinucleótido objetivo en una célula eucariota. En algunas realizaciones, el método comprende permitir que se una un complejo CRISPR al polinucleótido objetivo para efectuar la escisión de dicho polinucleótido objetivo modificando de ese modo el polinucleótido objetivo, en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia objetivo dentro de dicho polinucleótido objetivo, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se hibrida a una secuencia tracr. En algunas realizaciones, dicha escisión comprende escindir una o dos cadenas en la posición de la secuencia objetivo mediante dicha enzima CRISPR. En algunas realizaciones, dicha escisión da como resultado la transcripción disminuida de un gen objetivo. En algunas realizaciones, el método comprende además reparar dicho polinucleótido objetivo escindido por recombinación homóloga con un polinucleótido exógeno de plantilla, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido objetivo. En algunas realizaciones, dicha mutación da como resultado uno o más cambios de aminoácido en una proteína expresada a partir de un gen que comprende la secuencia objetivo. En algunas realizaciones, el método comprende además suministrar uno o más vectores a dicha célula eucariota, en el que uno o más vectores conducen la expresión de uno o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr. En algunas realizaciones, dichos vectores se suministran a la célula eucariota en un individuo. En algunas realizaciones, dicha modificación tiene lugar en dicha célula eucariota en un cultivo celular. En algunas realizaciones, el método comprende además aislar dicha célula eucariota de un individuo antes de dicha modificación. En algunas realizaciones, el método comprende además devolver dicha célula y/o células eucariotas procedentes de ahí a dicho individuo. In one aspect, the description provides a method for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises allowing a CRISPR complex to be attached to the target polynucleotide to effect cleavage of said target polynucleotide thereby modifying the target polynucleotide, in which the CRISPR complex comprises a complexed CRISPR enzyme with a guide sequence hybridized to an objective sequence within said target polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence. In some embodiments, said cleavage comprises cleaving one or two chains at the position of the target sequence by said CRISPR enzyme. In some embodiments, said cleavage results in decreased transcription of a target gene. In some embodiments, the method further comprises repairing said target polynucleotide cleaved by homologous recombination with an exogenous template polynucleotide, wherein said repair results in a mutation comprising insertion, deletion or replacement of one or more nucleotides of said target polynucleotide. . In some embodiments, said mutation results in one or more amino acid changes in a protein expressed from a gene comprising the target sequence. In some embodiments, the method further comprises supplying one or more vectors to said eukaryotic cell, in which one or more vectors lead to the expression of one or more of: the CRISPR enzyme, the guiding sequence linked to the tracr pairing sequence and the tracr sequence In some embodiments, said vectors are delivered to the eukaryotic cell in an individual. In some embodiments, said modification takes place in said eukaryotic cell in a cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from an individual before said modification. In some embodiments, the method further comprises returning said cell and / or eukaryotic cells from there to said individual.

En un aspecto, la descripción proporciona un método para modificar la expresión de un polinucleótido en una célula eucariota. En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinucleótido de manera que dicha unión dé como resultado la expresión aumentada o disminuida de dicho polinucleótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia objetivo dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se hibrida a una secuencia tracr. En algunas realizaciones, el método comprende además suministrar uno o más vectores a dichas células eucariotas, en el que uno o más vectores conducen la expresión de una o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr. In one aspect, the description provides a method for modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises allowing a CRISPR complex to bind to the polynucleotide so that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence within said polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence. In some embodiments, the method further comprises providing one or more vectors to said eukaryotic cells, in which one or more vectors lead to the expression of one or more of: the CRISPR enzyme, the guiding sequence linked to the tracr pairing sequence and the tracr sequence

En un aspecto, la descripción proporciona un método para generar una célula eucariota modelo que comprende un gen mutado de la enfermedad. En algunas realizaciones, un gen de la enfermedad es cualquier gen asociado a un aumento del riesgo de tener o desarrollar una enfermedad. En algunas realizaciones, el método comprende (a) introducir uno o más vectores en una célula eucariota, en la que uno o más vectores conducen la expresión de uno o más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr y una secuencia tracr y (b) permitir que un complejo CRISPR se una a un polinucleótido objetivo para efectuar la escisión del polinucleótido objetivo dentro de dicho gen de la enfermedad, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo dentro del polinucleótido objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr, generándose de ese modo una célula eucariota modelo que comprende un gen mutado de la enfermedad. En algunas realizaciones, dicha escisión comprende escindir una o dos cadenas en la posición de la secuencia objetivo mediante dicha enzima CRISPR. En algunas realizaciones, dicha escisión da como resultado la transcripción disminuida de un gen objetivo. En algunas realizaciones, el método comprende además reparar dicho polinucleótido objetivo escindido por recombinación homóloga con un polinucleótido exógeno de plantilla, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido objetivo. En algunas realizaciones, dicha mutación da como resultado uno o más cambios de aminoácido en una expresión de proteína de un gen que comprende la secuencia objetivo. In one aspect, the description provides a method for generating a model eukaryotic cell that comprises a mutated disease gene. In some embodiments, a disease gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors into a eukaryotic cell, in which one or more vectors lead to the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a tracr pairing sequence and a tracr sequence and (b) allowing a CRISPR complex to bind to an objective polynucleotide to effect cleavage of the target polynucleotide within said disease gene, wherein the CRISPR complex comprises the enzyme CRISPR complexed with (1) the guide sequence that hybridizes to the target sequence within the target polynucleotide and (2) the tracr pairing sequence that hybridizes to the tracr sequence, thereby generating a model eukaryotic cell comprising a mutated disease gene. In some embodiments, said cleavage comprises cleaving one or two chains at the position of the target sequence by said CRISPR enzyme. In some embodiments, said cleavage results in decreased transcription of a target gene. In some embodiments, the method further comprises repairing said target polynucleotide cleaved by homologous recombination with an exogenous template polynucleotide, wherein said repair results in a mutation comprising insertion, deletion or replacement of one or more nucleotides of said target polynucleotide. . In some embodiments, said mutation results in one or more amino acid changes in a protein expression of a gene that comprises the target sequence.

En un aspecto, la descripción proporciona un método para desarrollar un agente biológicamente activo que module un caso de señalización celular asociado a un gen de la enfermedad. En algunas realizaciones, un gen de la enfermedad es cualquier gen asociado a un aumento del riesgo de tener o desarrollar una enfermedad. En algunas realizaciones, el método comprende (a) poner en contacto un compuesto de ensayo con una célula modelo de una cualquiera de las realizaciones descritas y (b) detectar un cambio en una lectura que sea indicativo de una reducción In one aspect, the description provides a method for developing a biologically active agent that modulates a case of cellular signaling associated with a disease gene. In some embodiments, a disease gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) contacting a test compound with a model cell of any one of the described embodiments and (b) detecting a change in a reading that is indicative of a reduction

o un aumento del caso de señalización celular asociado a dicha mutación en dicho gen de la enfermedad, desarrollando de ese modo dicho agente biológicamente activo que module dicho caso de señalización celular asociado a dicho gen de la enfermedad. or an increase in the case of cellular signaling associated with said mutation in said disease gene, thereby developing said biologically active agent that modulates said case of cellular signaling associated with said disease gene.

En un aspecto, la descripción proporciona un polinucleótido recombinante que comprende una secuencia guía aguas arriba de una secuencia de emparejamiento tracr, en el que la secuencia guía cuando se expresa dirige la unión específica de la secuencia de un complejo CRISPR a una correspondiente secuencia objetivo presente en una célula eucariota. En algunas realizaciones, la secuencia objetivo es una secuencia vírica presente en una célula eucariota. En algunas realizaciones, la secuencia objetivo es un proto-oncogén o un oncogén. In one aspect, the description provides a recombinant polynucleotide comprising a guide sequence upstream of a tracr pairing sequence, in which the guide sequence when expressed directs the specific binding of the sequence of a CRISPR complex to a corresponding target sequence present. in a eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. In some embodiments, the target sequence is a proto-oncogene or an oncogene.

En un aspecto, la descripción proporciona un método para seleccionar una o más células procariotas por introducción de una o más mutaciones en un gen en una o más células procariotas, comprendiendo el método: introducir uno o más vectores en la célula o las células procariotas, en las que uno o más vectores conducen la expresión de uno o más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr, una secuencia tracr y una plantilla de edición; en la que la plantilla de edición comprende una o más mutaciones que anulan la escisión de la enzima CRISPR; permitir la recomendación homóloga de la plantilla de edición con el polinucleótido objetivo en la célula o las células que se tienen que seleccionar; permitir que un complejo CRISPR se una a un polinucleótido objetivo para efectuar la escisión del polinucleótido objetivo dentro de dicho gen, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo dentro del polinucleótido objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr, en la que la unión del complejo CRISPR al polinucleótido objetivo induce la muerte celular, permitiendo de ese modo que se seleccione una o más células procariotas en que se ha introducido una o más mutaciones. En una realización preferida, la enzima CRISPR es Cas9. En otro aspecto de la descripción, la célula que se tiene que seleccionar puede ser una célula eucariota. Los aspectos de la descripción permiten la selección de células específicas sin que se requiera un marcador de selección o un procedimiento de dos etapas que pueda incluir un sistema de contraselección. In one aspect, the description provides a method for selecting one or more prokaryotic cells by introducing one or more mutations in a gene into one or more prokaryotic cells, the method comprising: introducing one or more vectors into the cell or prokaryotic cells, in which one or more vectors drive the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a tracr pairing sequence, a tracr sequence and an editing template; wherein the editing template comprises one or more mutations that nullify the cleavage of the CRISPR enzyme; allow homologous recommendation of the editing template with the target polynucleotide in the cell or cells to be selected; allowing a CRISPR complex to bind to an objective polynucleotide to effect cleavage of the target polynucleotide within said gene, wherein the CRISPR complex comprises the CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence within the gene. target polynucleotide and (2) the tracr pairing sequence that hybridizes to the tracr sequence, in which the binding of the CRISPR complex to the target polynucleotide induces cell death, thereby allowing one or more prokaryotic cells to be selected in which You have introduced one or more mutations. In a preferred embodiment, the CRISPR enzyme is Cas9. In another aspect of the description, the cell to be selected may be a eukaryotic cell. Aspects of the description allow the selection of specific cells without requiring a selection marker or a two-stage procedure that may include a counter-selection system.

De acuerdo con esto, es un objeto de la invención no abarcar dentro de la invención ningún producto previamente conocido, procedimiento de fabricación del producto o método de uso del producto de manera que los solicitantes se reservan el derecho y describen de ese modo una exclusión de cualquier producto, procedimiento o método, previamente conocido. Se observa además que la invención no se destina a abarcar dentro del alcance de la Accordingly, it is an object of the invention not to cover within the invention any previously known product, product manufacturing process or method of use of the product so that applicants reserve the right and thereby describe an exclusion of any product, procedure or method, previously known. It is further noted that the invention is not intended to encompass within the scope of the

invención ningún producto, procedimiento o fabricación del producto o método de uso del producto, que no satisfaga la descripción descrita y los requerimientos de capacitación de la USPTO (35 U. S. C. §112, primer párrafo) o la EPO (Artículo 83 de la EPC), de manera que los solicitantes se reservan el derecho y describen de ese modo una exclusión de cualquier producto, procedimiento de fabricación del producto o método de uso del producto, descrito previamente. invention of any product, procedure or manufacturing of the product or method of use of the product, which does not meet the description described and the training requirements of the USPTO (35 USC §112, first paragraph) or the EPO (Article 83 of the EPC), so that applicants reserve the right and thus describe an exclusion of any product, product manufacturing procedure or method of use of the product, described previously.

Se observa que en esta descripción y en particular en las reivindicaciones y/o los párrafos, los términos tales como “comprende”, “comprendido”, “que comprende” y similares pueden tener el significado atribuido al mismo en la ley de patentes de EE.UU.; por ejemplo, pueden significar “incluye”, “incluido”, “que incluye” y similares y esos términos tales como “que consiste esencialmente en” y “ consiste esencialmente en” presentan el significado atribuido a los mismos en la ley de patentes de EE.UU., por ejemplo, permiten que los elementos no se citen de manera explícita, pero excluyen los elementos que se encuentran en la técnica anterior o que afectan a una característica básica o novedosa de la invención. Estas y otras realizaciones se describen o son evidentes a partir de, y están abarcadas por, la siguiente descripción detallada. It is noted that in this description and in particular in the claims and / or paragraphs, the terms such as "comprises", "included", "comprising" and the like may have the meaning attributed thereto in the US patent law .UU .; for example, they can mean "includes", "included", "including" and the like and those terms such as "consisting essentially of" and "consisting essentially of" present the meaning attributed to them in US patent law For example, they allow elements not to be explicitly cited, but exclude those elements found in the prior art or that affect a basic or novel feature of the invention. These and other embodiments are described or are apparent from, and are encompassed by, the following detailed description.

Breve descripción de los dibujos Brief description of the drawings

Las nuevas características de la invención se exponen con particularidad en las reivindicaciones adjuntas. Se obtendrá un mejor entendimiento de las características y ventajas de la presente invención por referencia a la siguiente descripción detallada que explica realizaciones ilustrativas, en que se utilizan los principios de la invención, y los dibujos adjuntos de los que: The new features of the invention are set forth with particularity in the appended claims. A better understanding of the features and advantages of the present invention will be obtained by reference to the following detailed description explaining illustrative embodiments, in which the principles of the invention are used, and the accompanying drawings of which:

La Figura 1 muestra un modelo esquemático del sistema CRISPR. La nucleasa Cas9 de Streptococcus pyogenes (amarillo) se fija como objetivo para ADN genómico por un ARN guía sintético (ARNsg) que consiste en una secuencia guía de 20-nt (azul) y un andamio (rojo). Los pares de bases de la secuencia guía con el ADN objetivo (azul), directamente aguas arriba de una unidad adyacente protoespaciadora 5'-NGG (PAM; magenta) requisito y Cas9 media una doble rotura de cadena (DRC) ~3 pb aguas arriba de la PAM (triángulo rojo). Figure 1 shows a schematic model of the CRISPR system. The Cas9 nuclease of Streptococcus pyogenes (yellow) is set as a target for genomic DNA by a synthetic guide RNA (sRNA) consisting of a 20-nt guide sequence (blue) and a scaffold (red). The base pairs of the guide sequence with the target DNA (blue), directly upstream of an adjacent 5'-NGG proto-spacer unit (PAM; magenta) requirement and Cas9 mediates a double chain break (DRC) ~ 3 bp upstream of the PAM (red triangle).

La Figura 2A-F muestra un sistema CRISPR ejemplar, un posible mecanismo de acción, una adaptación de ejemplo para la expresión en células eucariotas y los resultados de los ensayos que evalúan la localización nuclear y la actividad de CRISPR. Figure 2A-F shows an exemplary CRISPR system, a possible mechanism of action, an example adaptation for expression in eukaryotic cells and the results of tests evaluating nuclear localization and CRISPR activity.

La Figura 3 muestra una casete de expresión ejemplar para expresión de elementos del sistema CRISPR en células eucariotas, estructuras previstas de secuencias guía de ejemplo y actividad del sistema CRISPR cuando se mide en células eucariotas y procariotas. Figure 3 shows an exemplary expression cassette for expression of elements of the CRISPR system in eukaryotic cells, envisaged structures of example guide sequences and activity of the CRISPR system when measured in eukaryotic and prokaryotic cells.

La Figura 4A-D muestra los resultados de una evaluación de especificidad de SpCas9 para un objetivo de ejemplo. Figure 4A-D shows the results of a SpCas9 specificity assessment for an example objective.

La Figura 5A-G muestra un sistema vector ejemplar y los resultados para su uso en dirigir recombinación homóloga en células eucariotas. Figure 5A-G shows an exemplary vector system and the results for use in directing homologous recombination in eukaryotic cells.

La Figura 6 proporciona una tabla de secuencias protoespaciadoras y resume los resultados de eficacia de modificación para objetivos protoespaciadores diseñados basándose en sistemas CRISPR de S. pyogenes y S. thermophilus ejemplares con las correspondientes PAM contra sitios en genomas humanos y de ratón. Se transinfectaron células con Cas9 y pre-ARNcr/ARNtracr o ARN quimérico y se analizaron 72 horas después de transinfección. Se calculan los porcentajes de inserciones o supresiones basándose en los resultados de la prueba Surveyor de estirpes celulares indicadas (N=3 para todos los objetivos protoespaciadores, los errores son E. E. M., Figure 6 provides a table of proto-spacer sequences and summarizes the modification efficacy results for proto-spacer targets designed based on exemplary S. pyogenes and S. thermophilus CRISPR systems with corresponding PAMs against sites in human and mouse genomes. Cells were transinfected with Cas9 and pre-cRNA / RNAcrcr or chimeric RNA and analyzed 72 hours after transfection. The percentages of insertions or deletions are calculated based on the results of the Surveyor test of indicated cell lines (N = 3 for all proto-spacer objectives, the errors are E. E. M.,

N. D. indica no detectable usando la prueba Surveyor y N. D. indicates not detectable using the Surveyor test and

N. E. indica no ensayado en este estudio). N. E. indicates not tested in this study).

La Figura 7A-C muestra una comparación de diferentes transcritos de ARNtracr para fijar como objetivo genes mediados por Cas9. Figure 7A-C shows a comparison of different RNAcrcr transcripts to target genes mediated by Cas9.

La Figura 8 muestra un esquema de una prueba de nucleasa surveyor para detección de microinserciones y microsupresiones inducidas por doble rotura de cadena. Figure 8 shows a scheme of a surveyor nuclease test for detection of microinserrations and microsuppressions induced by double chain breakage.

La Figura 9A-B muestra vectores de expresión bicistrónicos ejemplares para expresión de elementos del sistema CRISPR en células eucariotas. Figure 9A-B shows exemplary bicistronic expression vectors for expression of elements of the CRISPR system in eukaryotic cells.

La Figura 10 muestra un ensayo de interferencia de transformación de plásmidos bacterianos, casetes de expresión y plásmidos usados en el mismo y eficacias de transformación de células usadas en el mismo. Figure 10 shows an interference assay for transformation of bacterial plasmids, expression cassettes and plasmids used therein and cell transformation efficiencies used therein.

La Figura 11A-C muestra histogramas de distancias entre PAM del sitio 1 SF370 de S. pyogenes (NGG) (Figura 10A) y PAM del sitio 2 de LMD9 de S. thermophilus (NNAGAAW) (Figura 10B) en el genoma humano y las distancias para cada PAM por cromosoma (Chr) (Figura 10C). Figure 11A-C shows histograms of distances between PAM of site SF370 of S. pyogenes (NGG) (Figure 10A) and PAM of site 2 of LMD9 of S. thermophilus (NNAGAAW) (Figure 10B) in the human genome and distances for each MAP per chromosome (Chr) (Figure 10C).

La Figura 12A-C muestra un sistema CRISPR ejemplar, una adaptación de ejemplo para expresión en células eucariotas y los resultados de ensayos que evalúan la actividad CRISPR. Figure 12A-C shows an exemplary CRISPR system, an example adaptation for expression in eukaryotic cells and the results of tests evaluating CRISPR activity.

La Figura 13A-C muestra manipulaciones ejemplares de un sistema CRISPR para fijar como objetivo sitios genómicos en células de mamífero. Figure 13A-C shows exemplary manipulations of a CRISPR system to target genomic sites in mammalian cells.

La Figura 14A-B muestra los resultados de un análisis por el método Northern de tratamiento de ARNcr en células de mamífero. Figure 14A-B shows the results of an analysis by the Northern method of treatment of cRNA in mammalian cells.

La Figura 15 muestra una selección ejemplar de protoespaciadores en los sitios PVALB humano y Th de ratón. Figure 15 shows an exemplary selection of proto-spacers in the human and Th mouse PVALB sites.

La Figura 16 muestra protoespaciador de ejemplo y los correspondientes objetivos de secuencia PAM del sistema CRISPR de S. thermophilus en el sitio EMX1 humano. Figure 16 shows an example proto-spacer and the corresponding PAM sequence targets of the S. thermophilus CRISPR system at the human EMX1 site.

La Figura 17 muestra una tabla de secuencias para cebadores y sondas usados para pruebas Surveyor, RFLP, secuenciación genómica y método de Northern. Figure 17 shows a sequence table for primers and probes used for Surveyor, RFLP, genomic sequencing and Northern method tests.

La Figura 18A-C muestra manipulación ejemplar de un sistema CRISPR con ARN quiméricos y los resultados de pruebas SURVEYOR para actividad del sistema en células eucariotas. Figure 18A-C shows exemplary manipulation of a CRISPR system with chimeric RNA and the results of SURVEYOR tests for system activity in eukaryotic cells.

La Figura 19A-B muestra una representación gráfica de los resultados de pruebas SURVEYOR para actividad del sistema CRISPR en células eucariotas. Figure 19A-B shows a graphical representation of SURVEYOR test results for CRISPR system activity in eukaryotic cells.

La Figura 20 muestra una visualización ejemplar de algunos sitios objetivo de Cas9 de S. pyogenes en el genoma humano usando el buscador de genomas UCSC. Figure 20 shows an exemplary visualization of some S. pyogenes Cas9 target sites in the human genome using the UCSC genome finder.

La Figura 21 muestra estructuras secundarias previstas para ARN quiméricos ejemplares que comprenden una secuencia guía, secuencia de emparejamiento tracr y secuencia tracr. Figure 21 shows secondary structures envisioned for exemplary chimeric RNAs comprising a guide sequence, tracr pairing sequence and tracr sequence.

La Figura 22 muestra vectores de expresión bicistrónicos ejemplares para expresión de elementos del sistema CRISPR en células eucariotas. Figure 22 shows exemplary bicistronic expression vectors for expression of elements of the CRISPR system in eukaryotic cells.

La Figura 23 muestra que la actividad de la nucleasa Cas9 frente a objetivos endógenos puede explotarse para edición de genomas. (a) Concepto de edición de genomas usando el sistema CRISPR. La construcción que fija como objetivo CRISPR dirigió la escisión de un sitio cromosómico y se cotransformó con una plantilla de edición que se recombinó con el objetivo para evitar la escisión. Los transformados resistentes a la kanamicina que sobrevivieron al ataque de CRISPR contenían modificaciones introducidas por la plantilla de edición. ARN de CRISPR trans-activante, tracr; gen de resistencia a la kanamicina, aphA-3. (b) Transformación de ADN crR6M en células R68.232,5 sin plantilla de edición, srtA natural R6 o las plantillas de edición de R6370,1. La recombinación de srtA R6 o R6370,1 evitó la escisión por Cas9. Se calculó la eficacia de transformación como unidades formadoras de colonias (ufc) por µg de ADN de crR6M; se muestran los valores medios con desviaciones estándar de al menos tres experimentos independientes. Se realizó análisis PCR sobre 8 clones en cada transformación. “No.” indica el sitio srtA no editado de la cepa R68232,5; “Ed.” muestra la plantilla de edición. Los objetivos R68232,5 y R6370,1 se distinguen por restricción con EaeI. Figure 23 shows that the activity of the Cas9 nuclease against endogenous targets can be exploited for genome editing. (a) Concept of genome editing using the CRISPR system. The construction that sets CRISPR as objective directed the excision of a chromosomal site and was co-transformed with an editing template that was recombined with the objective to avoid excision. Kanamycin-resistant transformations that survived the CRISPR attack contained modifications introduced by the editing template. Trans-activating CRISPR RNA, tracr; Kanamycin resistance gene, aphA-3. (b) Transformation of crR6M DNA into R68.232.5 cells without editing template, natural R6 srtA or R6370.1 editing templates. Recombination of srtA R6 or R6370.1 prevented excision by Cas9. The transformation efficiency was calculated as colony forming units (cfu) per µg of crR6M DNA; Mean values with standard deviations of at least three independent experiments are shown. PCR analysis was performed on 8 clones in each transformation. "No." indicates the unedited srtA site of strain R68232.5; "Ed." Shows the editing template. Objectives R68232.5 and R6370.1 are distinguished by restriction with EaeI.

La Figura 24 muestra análisis de PAM y secuencias de siembra que eliminan la escisión de Cas9. (a) Se transformaron los productos PCR con secuencias PAM aleatoriadas o secuencias de siembra aleatoriadas en células crR6. Estas células expresaron Cas9 cargado con un ARNcr que fijó como objetivo una región cromosómica de células R68232,5 (resaltado en rosa) que está ausente a partir del genoma R6. Más de 2x105 transformados resistentes al cloranfenicol, soportando PAM o secuencias de siembra inactivas, se combinaron para multiplicación y secuenciación intensa de la región fijada como objetivo. (b) Proporción relativa de número de lecturas después de la transformación de las construcciones PAM aleatorias en células crR6 (comparado con el número de lecturas en transformados R6). Se muestra la abundancia relativa para cada secuencia PAM de 3 nucleótidos. Se muestran secuencias seriamente infrarrepresentadas (NGG) en rojo; una parcialmente infrarrepresentada en naranja (NAG) Figure 24 shows PAM analysis and seeding sequences that eliminate excision of Cas9. (a) PCR products were transformed with randomized PAM sequences or randomized sowing sequences in crR6 cells. These cells expressed Cas9 loaded with an cRNA that targeted a chromosomal region of R68232.5 cells (highlighted in pink) that is absent from the R6 genome. More than 2x105 chloramphenicol resistant transformants, supporting PAM or inactive seeding sequences, were combined for intense multiplication and sequencing of the target region. (b) Relative proportion of number of readings after transformation of random PAM constructs into crR6 cells (compared to the number of readings in R6 transforms). The relative abundance for each PAM sequence of 3 nucleotides is shown. Seriously underrepresented (NGG) sequences are shown in red; one partially underrepresented in orange (NAG)

(c) Proporción relativa de número de lecturas después de transformación de las construcciones de secuencias de siembra aleatorias en células crR6 (comparado con el número de lecturas en transformados de R6). Se muestra la abundancia relativa de cada nucleótido para cada posición de los primeros 20 nucleótidos de la secuencia protoespaciadora. La abundancia alta indica ausencia de escisión por Cas9, es decir, una mutación que inactiva CRISPR. La línea gris muestra el nivel de la secuencia TN. La línea de puntos representa el nivel por encima del cual una mutación interrumpe significativamente la escisión (Véase la sección “Analysis of deep sequencing data” en el Ejemplo 5)). (c) Relative proportion of number of readings after transformation of random sowing sequence constructs in crR6 cells (compared to the number of readings in R6 transforms). The relative abundance of each nucleotide for each position of the first 20 nucleotides of the proto-spacer sequence is shown. High abundance indicates absence of excision by Cas9, that is, a mutation that inactivates CRISPR. The gray line shows the level of the TN sequence. The dotted line represents the level above which a mutation significantly interrupts the excision (See the section "Analysis of deep sequencing data" in Example 5)).

La Figura 25 muestra la introducción de mutaciones únicas y múltiples usando el sistema CRISPR en S. pneumoniae, (a) Secuencias de nucleótidos y aminoácidos de bgaA tipo natural y editado (nucleótidos verdes; restos de aminoácidos subrayados). Se muestra el protoespaciador, PAM y sitios de restricción. (b) Eficacia de transformación de células transformadas con construcciones fijadoras de objetivo en presencia de una plantilla o Figure 25 shows the introduction of single and multiple mutations using the CRISPR system in S. pneumoniae, (a) Nucleotide and amino acid sequences of wild-type and edited bgaA (green nucleotides; underlined amino acid residues). Proto-spacer, PAM and restriction sites are shown. (b) Transformation efficiency of transformed cells with target fixing constructs in the presence of a template or

control de edición. (c) Análisis PCR para 8 transformados de cada experimento de edición seguido por digestión con BtgZI (R→A) y TseI (NE→AA). La supresión de bgaA se reveló como un producto PCR más pequeño. (d) Prueba de Miller para medir la actividad de la β-galactosidasa de cepas TN y editadas. (e) Para una doble supresión de una sola etapa, la construcción fijadora de objetivo contenía dos espaciadores (en este caso emparejando srtA y bgaA) y se cotransformó con dos plantillas de edición diferentes (f) Análisis PCR para 8 transformados para detectar supresiones en los sitios srtA y bgaA. Los transformados 6/8 contenían supresiones de los dos genes. edit control (c) PCR analysis for 8 transformations of each editing experiment followed by digestion with BtgZI (R → A) and TseI (NE → AA). BgaA suppression was revealed as a smaller PCR product. (d) Miller test to measure the β-galactosidase activity of TN and edited strains. (e) For a double suppression of a single stage, the target fixing construction contained two spacers (in this case matching srtA and bgaA) and was co-transformed with two different editing templates (f) PCR analysis for 8 transformed to detect deletions in the srtA and bgaA sites. Transforms 6/8 contained deletions of the two genes.

La Figura 26 proporciona mecanismos que subrayan la edición usando el sistema CRISPR. (a) Se introdujo un codón de terminación en el gen de resistencia a eritromicina ermAM para generar cepa JEN53. Se puede restaurar la secuencia natural fijando como objetivo el codón de terminación con la construcción CRISPR::ermAM(terminación) y usando la secuencia natural ermAM como una plantilla de edición. (b) Secuencias ermAM mutantes y de tipo natural. (c) Fracción de ufc (ermR) resistente a eritromicina calculada a partir de las ufc totales o resistentes a kanamicina (kanR). (d) Fracción de células totales que adquieren tanto la construcción CRISPR como la plantilla de edición. La cotransformación de la construcción que fija como objetivo CRISPR produjo más transformados (ensayo t, p=0,011). En todos los casos los valores muestran la media ± d. e. para tres experimentos independientes. Figure 26 provides mechanisms that underline editing using the CRISPR system. (a) A termination codon was introduced into the ermAM erythromycin resistance gene to generate strain JEN53. The natural sequence can be restored by targeting the termination codon with the CRISPR :: ermAM (termination) construct and using the ermAM natural sequence as an editing template. (b) Mutant and wild-type ermAM sequences. (c) Fraction of erythromycin-resistant cfu (ermR) calculated from total or kanamycin-resistant cfu (kanR). (d) Fraction of total cells that acquire both the CRISPR construction and the editing template. The cotransformation of the construction that sets CRISPR as its objective produced more transformations (t-test, p = 0.011). In all cases the values show the mean ± d. and. for three independent experiments.

La Figura 27 ilustra edición de genomas con el sistema CRISPR en E. coli. (a) Un plásmido resistente a kanamicina que soporta la matriz CRISPR (pCRISPR) que fija como objetivo el gen para editar puede transformarse en la cepa de recombinación de HME63 que contiene un plásmido resistente a cloranfenicol que alberga cas9 y tracr (pCas9), junto con un oligonucleótido que especifica la mutación. (b) Se introdujo una mutación de K42T que confería resistencia a la estreptomicina en el gen rpsL (c) Fracción de ufc resistentes a estreptomicina (strepR) calculada a partir de ufc totales o resistentes a kanamicina (kanR). (d) Fracción de células totales que adquieren tanto el plásmido pCRISPR como el oligonucleótido de edición. La cotransformación del plásmido que fija como objetivo pCRISPR produjo más transformados (ensayo t, p=0,004). En todos los casos los valores mostraron la media ± d. e. para tres experimentos independientes. Figure 27 illustrates genome editing with the CRISPR system in E. coli. (a) A kanamycin-resistant plasmid that supports the CRISPR matrix (pCRISPR) that targets the gene for editing can be transformed into the recombination strain of HME63 containing a chloramphenicol-resistant plasmid that houses cas9 and tracr (pCas9), together with an oligonucleotide that specifies the mutation. (b) A K42T mutation was introduced that conferred streptomycin resistance in the rpsL gene (c) Streptomycin-resistant cfu fraction (strepR) calculated from total or kanamycin-resistant cfu (kanR). (d) Fraction of total cells that acquire both the plasmid pCRISPR and the editing oligonucleotide. The cotransformation of the plasmid that targets pCRISPR produced more transformations (t-test, p = 0.004). In all cases the values showed the mean ± d. and. for three independent experiments.

La Figura 28 ilustra que la transformación de ADN genómico de crR6 conduce a la edición del sitio fijado como objetivo (a) El elemento IS1167 deR6 de S. pneumoniae fue reemplazado por el sitio CRISPR01 de SF370 de S. pyogenes para generar cepa crR6. Este sitio codifica la nucleasa Cas9, una matriz CRISPR con seis espaciadores, el ARNtracr que se requiere para biogénesis de ARNcr y Cas1, Cas2 y Csn2, proteínas no necesarias para fijación como objetivo. La cepa crR6M contiene un sistema CRISPR funcional mínimo sin cas1, cas2 y csn2. El gen aphA-3 codifica resistencia a kanamicina. Se fusionaron protoespaciadores de los bacteriófagos de estreptococos φ8232,5 y φ370,1 a un gen de resistencia a cloranfenicol (cat) y se integraron en el gen srtA de cepa R6 para generar las cepas R68232,5 y R6370,1. (b) Panel izquierdo: Transformación de ADN genómico crR6 y crR6M en R68232,5 y R6370,1. Como un control de competencia celular también se transformó un gen resistente a estreptomicina. Panel derecho: Análisis PCR de 8 transformados R68232,5 con ADN genómico crR6. Se usaron cebadores que multiplican el sitio srtA por PCR. 7/8 colonias genotipadas reemplazaron el sitio srtA R68232,5 por el sitio TN del ADN genómico de crR6. Figure 28 illustrates that the transformation of genomic DNA of crR6 leads to the edition of the target site (a). The IS1167 element of S. pneumoniae R6 was replaced by the site CRISPR01 of SF370 of S. pyogenes to generate strain crR6. This site encodes the Cas9 nuclease, a CRISPR matrix with six spacers, the RNAcrcr that is required for cDNA and Cas1, Cas2 and Csn2 biogenesis, proteins not necessary for target fixation. The crR6M strain contains a minimum functional CRISPR system without cas1, cas2 and csn2. The aphA-3 gene encodes kanamycin resistance. Proto-spacers of the φ8232.5 and φ370.1 streptococcus bacteriophages were fused to a chloramphenicol (cat) resistance gene and integrated into the srtA gene of strain R6 to generate strains R68232.5 and R6370.1. (b) Left panel: Transformation of crR6 and crR6M genomic DNA into R68232.5 and R6370.1. As a control of cellular competence, a streptomycin resistant gene was also transformed. Right panel: PCR analysis of 8 R68232.5 transformed with crR6 genomic DNA. Primers that multiply the srtA site by PCR were used. 7/8 genotyped colonies replaced the srtA site R68232.5 with the TN site of the genomic DNA of crR6.

La Figura 29 proporciona cromatogramas de secuencias de ADN de células editadas obtenidas en este estudio. En todos los casos, se indica el protoespaciador natural y mutante y secuencias PAM (o su complemento inverso). Cuando es relevante, se proporciona la secuencia de aminoácidos codificada por el protoespaciador. Para cada experimento de edición, se secuenciaron todas las cepas para las que el análisis PCR y de restricción corroboró la introducción de la modificación deseada. Se muestra un cromatograma representativo. (a) Cromatograma para la introducción de una mutación PAM en el objetivo R68232,5 (Figura 23d). (b) Cromatogramas para la introducción de las mutaciones R>A y NE>AA en β-galactosidasa (bgaA) (Figura 25c). (c) Cromatograma para la introducción de una supresión de 6.664 pb en ORF (marco de lectura abierta, por sus siglas en inglés) de bgaA (Figuras 25c y 25f). La línea de puntos indica los límites de la supresión. (d) Cromatograma para la introducción de una supresión de 729 pb en ORF de srtA (Figura 25f). La línea de puntos indica los límites de la supresión. (e) Cromatogramas para la generación de un codón de terminación prematuro en ermAM (Figura 33). (f) Edición de rpsL en E. coli (Figura 27). Figure 29 provides chromatograms of edited cell DNA sequences obtained in this study. In all cases, the natural and mutant proto-spacer and PAM sequences (or their reverse complement) are indicated. When relevant, the amino acid sequence encoded by the proto-spacer is provided. For each editing experiment, all strains for which the PCR and restriction analysis corroborated the introduction of the desired modification were sequenced. A representative chromatogram is shown. (a) Chromatogram for the introduction of a PAM mutation in objective R68232.5 (Figure 23d). (b) Chromatograms for the introduction of R> A and NE> AA mutations in β-galactosidase (bgaA) (Figure 25c). (c) Chromatogram for the introduction of a 6,664 bp suppression in bgaA ORF (open reading frame) (Figures 25c and 25f). The dotted line indicates the limits of the deletion. (d) Chromatogram for the introduction of a 729 bp suppression in srtA ORF (Figure 25f). The dotted line indicates the limits of the deletion. (e) Chromatograms for the generation of a codon of premature termination in ermAM (Figure 33). (f) Edition of rpsL in E. coli (Figure 27).

La Figura 30 ilustra inmunidad de CRISPR contra objetivos de S. pneumoniae aleatorios conteniendo diferentes PAM. (a) Posición de los 10 objetivos aleatorios en el genoma R6 de S. pneumoniae. Los objetivos elegidos presentan diferentes PAM y están en ambas cadenas. (b) Se clonaron los espaciadores correspondientes a los objetivos en una matriz de CRISPR mínima en plásmido pLZ12 y se transformaron en cepa crR6Rc, que suministra la maquinaria de tratamiento y fijación como objetivo en trans. (c) Eficacia de transformación de los diferentes plásmidos en cepa R6 y crR6Rc. No se recuperaron colonias para la transformación de pDB99-108 (T1-T10) en crR6Rc. La línea de puntos representa el límite de detección de la prueba. Figure 30 illustrates CRISPR immunity against random S. pneumoniae targets containing different PAMs. (a) Position of the 10 randomized targets in the R6 genome of S. pneumoniae. The chosen objectives have different MAPs and are in both chains. (b) The spacers corresponding to the targets were cloned into a minimum CRISPR matrix in plasmid pLZ12 and transformed into strain crR6Rc, which supplies the treatment and fixation machinery as a target in trans. (c) Transformation efficiency of the different plasmids in strain R6 and crR6Rc. No colonies were recovered for the transformation of pDB99-108 (T1-T10) into crR6Rc. The dotted line represents the limit of detection of the test.

La Figura 31 proporciona un esquema general para editar genoma fijado como objetivo. Para facilitar la edición de genoma fijado como objetivo, se logró además que crR6M contuviera ARNtracr, Cas9 y sólo una repetición de la matriz CRISPR seguido por marcador de resistencia a kanamicina (aphA-3), generando cepa crR6Rk. Se usa ADN de esta cepa como una plantilla para PCR con cebadores diseñados para introducir un nuevo espaciador (recuadro Figure 31 provides a general scheme for editing target genome. To facilitate the editing of the target genome, it was also achieved that crR6M contained ARNtracr, Cas9 and only one repetition of the CRISPR matrix followed by a kanamycin resistance marker (aphA-3), generating strain crR6Rk. DNA from this strain is used as a template for PCR with primers designed to introduce a new spacer (box

verde designado con N). Las PCR izquierda y derecha se reúnen usando el método de Gibson para crear la construcción fijadora de objetivo. Después se transforman las construcciones tanto fijadora de objetivo como de edición en cepa crR6Rc, que es una cepa equivalente a crR6Rk, pero presenta el marcador de resistencia a kanamicina reemplazado por un marcador de resistencia a cloranfenicol (cat). Aproximadamente el 90% de los transformados resistentes a kanamicina contienen la mutación deseada. green designated with N). The left and right PCR are assembled using the Gibson method to create the target fixer construction. The target-fixing and editing constructs are then transformed into the crR6Rc strain, which is a strain equivalent to crR6Rk, but has the kanamycin resistance marker replaced by a chloramphenicol resistance marker (cat). Approximately 90% of kanamycin resistant transformants contain the desired mutation.

La Figura 32 ilustra la distribución de distancias entre las PAM. NGG y CCN que se consideran que son PAM válidas. Se muestran los datos para el genoma R6 de S. pneumoniae, así como para una secuencia aleatoria de la misma longitud y con el mismo contenido en GC (39,7%). La línea de puntos representa la distancia promedio (12) entre las PAM en el genoma R6. Figure 32 illustrates the distribution of distances between PAMs. NGG and CCN that are considered to be valid PAM. Data for the R6 genome of S. pneumoniae are shown, as well as for a random sequence of the same length and with the same GC content (39.7%). The dotted line represents the average distance (12) between the PAMs in the R6 genome.

La Figura 33 ilustra edición mediada por CRISPR del sitio ermAM usando ADN genómico como construcción fijadora de objetivo. Para usar ADN genómico como construcción fijadora de objetivo es necesario evitar autoinmunidad de CRISPR y, por lo tanto, se debe usar un espaciador contra una secuencia no presente en el cromosoma (en este caso el gen de resistencia a eritromicina ermAM). (a) Secuencias de nucleótidos y aminoácidos del gen ermAM natural y mutado (letras rojas). Se muestra el protoespaciador y las secuencias PAM. (b) Un esquema para la edición mediada por CRISPR del sitio ermAM usando ADN genómico. Una construcción que soporta un espaciador que fija como objetivo ermAM (recuadro azul) se prepara por PCR y ensamblaje de Gibson y se transforma en cepa crR6Rc, que genera cepa JEN37. Después se usó el ADN genómico de JEN37 como una construcción fijadora de objetivo y se cotransformó con la plantilla de edición en JEN38, una cepa en la que el gen srtA fue reemplazado por una copia natural de ermAM. Los transformados resistentes a kanamicina contienen el genotipo editado (JEN43). (c)Número de células resistentes a kanamicina obtenidas después de co-transformación de plantillas de fijación como objetivo y de edición o control. En presencia de la plantilla de control se obtuvieron 5,4×103 ufc/ml y 4,3×105 ufc/ml cuando se usó la plantilla de edición. Esta diferencia indica una eficacia de edición de aproximadamente 99% [(4,3×105-5,4×103)/4,3×105]. (d) Para comprobar la presencia de células editadas se sembraron en estrías siete clones resistentes a kanamicina y JEN38 en placas de agar con eritromicina (erm+) o sin eritromicina (erm-). Sólo el control positivo mostró resistencia a eritromicina. El genotipo mutado de ermAM de uno de estos transformados también fue verificado por secuenciación de ADN (Figura 29e). Figure 33 illustrates CRISPR mediated edition of the ermAM site using genomic DNA as a target fixation construct. To use genomic DNA as a target-fixing construct, it is necessary to avoid autoimmunity of CRISPR and, therefore, a spacer must be used against a sequence not present in the chromosome (in this case the ermromycin resistance gene ermAM). (a) Nucleotide and amino acid sequences of the natural and mutated ermAM gene (red letters). The proto-spacer and PAM sequences are shown. (b) A scheme for the CRISPR mediated edition of the ermAM site using genomic DNA. A construction that supports a spacer that sets the target ermAM (blue box) is prepared by Gibson PCR and assembly and transformed into strain crR6Rc, which generates strain JEN37. The JEN37 genomic DNA was then used as a target-fixing construct and co-transformed with the editing template in JEN38, a strain in which the srtA gene was replaced by a natural copy of ermAM. Kanamycin resistant transformants contain the edited genotype (JEN43). (c) Number of kanamycin resistant cells obtained after co-transformation of fixation templates as a target and for editing or control. In the presence of the control template 5.4 × 103 cfu / ml and 4.3 × 105 cfu / ml were obtained when the editing template was used. This difference indicates an editing efficiency of approximately 99% [(4.3 × 105-5.4 × 103) / 4.3 × 105]. (d) To verify the presence of edited cells, seven clones resistant to kanamycin and JEN38 were plated on agar plates with erythromycin (erm +) or without erythromycin (erm-). Only the positive control showed resistance to erythromycin. The mutated ermAM genotype of one of these transformed was also verified by DNA sequencing (Figure 29e).

La Figura 34 ilustra la introducción secuencial de mutaciones por edición de genomas mediada por CRISPR. (a) Un esquema para introducción secuencial de mutaciones por edición de genomas mediada por CRISPR. Primero, se logra R6 para generar crR6Rk. crR6Rk se co-transforma con una construcción que fija como objetivo srtA fusionado a cat para selección de cloranfenicol de células editadas, junto con una construcción de edición para una supresión dentro del marco de ΔsrtA. Se genera cepa ΔsrtA crR6 por selección sobre cloranfenicol. Con posterioridad, se cotransforma la cepa ΔsrtA con una construcción que fija como objetivo bgaA fusionada a aphA-3 para selección de kanamicina de células editadas y una construcción de edición que contiene una supresión dentro del marco de ΔbgaA. Finalmente, el sitio de CRISPR logrado puede ser eliminado del cromosoma cotransformando primero ADN de R6 que contiene el sitio IS1167 natural y un plásmido que soporta un protoespaciador bgaA (pDB97) y selección en espectinomicina. (b) Análisis PCR para 8 transformados resistentes a cloranfenicol (Cam) para detectar la supresión en el sitio srtA. (c) Actividad de la β-galactosidasa cuando se mide por la prueba de Miller. En S. pneumoniae, se ancha esta enzima a la pared celular mediante sortasa A. La supresión del gen srtA da como resultado la liberación de β-galactosidasa en el sobrenadante. Los mutantes de ΔbgaA no muestran actividad. (d)Análisis PCR para 8 transformados resistentes a espectinomicina (Espec) para detectar el reemplazo del sitio CRISPR mediante IS1167 natural. Figure 34 illustrates the sequential introduction of mutations by genome editing mediated by CRISPR. (a) A scheme for sequential introduction of mutations by genome editing mediated by CRISPR. First, R6 is achieved to generate crR6Rk. crR6Rk is co-transformed with a construction that targets srtA fused to cat for chloramphenicol selection of edited cells, together with an edit construction for suppression within the ΔsrtA framework. Strain ΔsrtA crR6 is generated by selection on chloramphenicol. Subsequently, the ΔsrtA strain is co-transformed with a construct that targets bgaA fused to aphA-3 for kanamycin selection of edited cells and an edit construct that contains a suppression within the framework of ΔbgaA. Finally, the CRISPR site achieved can be removed from the chromosome by first transforming R6 DNA that contains the natural IS1167 site and a plasmid that supports a bgaA proto-spacer (pDB97) and spectinomycin selection. (b) PCR analysis for 8 chloramphenicol-resistant transformations (Cam) to detect suppression at the srtA site. (c) Activity of β-galactosidase when measured by the Miller test. In S. pneumoniae, this enzyme is widened to the cell wall by sortase A. Suppression of the srtA gene results in the release of β-galactosidase in the supernatant. ΔbgaA mutants show no activity. (d) PCR analysis for 8 spectinomycin resistant transformants (Spec) to detect the replacement of the CRISPR site by natural IS1167.

La Figura 35 ilustra la frecuencia de mutación de fondo de CRISPR en S. pneumoniae. (a) Transformación de las construcciones que fijan como objetivo CRISPR::∅ o CRISPR::erm(terminación) en JEN53, con o sin la plantilla de edición de ermAM. La diferencia en UFC de kanR entre CRISPR::∅ y CRISPR::erm(terminación) indica que la escisión de Cas9 destruye células no editadas. Los mutantes que escapan a la interferencia de CRISPR en ausencia de plantilla de edición se observan a una frecuencia de 3×10-3 (b) El análisis PCR del sitio CRISPR de escapistas muestra que 7/8 presentan una supresión de espaciador. (c) El escapista #2 soporta una mutación puntual en cas9. Figure 35 illustrates the background mutation frequency of CRISPR in S. pneumoniae. (a) Transformation of the constructions that set CRISPR :: ∅ or CRISPR :: erm (completion) as a goal in JEN53, with or without the ermAM editing template. The difference in kanR CFU between CRISPR :: ∅ and CRISPR :: erm (termination) indicates that excision of Cas9 destroys unedited cells. Mutants that escape CRISPR interference in the absence of an editing template are observed at a frequency of 3 × 10-3 (b) The PCR analysis of the escaper CRISPR site shows that 7/8 have a spacer suppression. (c) The escapist # 2 supports a punctual mutation in cas9.

La Figura 36 ilustra que los elementos esenciales del sitio 1 de CRISPR de S. pyogenes se reconstituyen en E. coli usando pCas9. El plásmido contenía ARNtracr, Cas9, así como una secuencia líder que conduce la matriz ARNcr. Los plásmidos pCRISPR contenían el líder y la matriz sólo. Los espaciadores pueden insertarse en la matriz de ARNcr entre los sitios BsaI usando oligonucleótidos hibridados. El diseño de oligonucleótidos se muestra en el fondo. pCas9 soportaba resistencia a cloranfenicol (CmR) y se basa en la cadena principal del plásmido pACYC184 de copia baja. pCRISPR se basa en el plásmido pZE21 de alto número de copias. Se requirieron dos plásmidos debido a que un plásmido pCRISPR que contenía un espaciador que fijada como objetivo el cromosoma de E. coli puede no ser construido usando este organismo como un huésped de clonación si también está presente Cas9 (destruirá el huésped). Figure 36 illustrates that the essential elements of the S. pyogenes CRISPR site 1 are reconstituted in E. coli using pCas9. The plasmid contained RNAcrcr, Cas9, as well as a leader sequence that drives the RNAcr matrix. The pCRISPR plasmids contained the leader and matrix only. The spacers can be inserted into the rRNA matrix between BsaI sites using hybridized oligonucleotides. The oligonucleotide design is shown in the background. pCas9 supported chloramphenicol resistance (CmR) and is based on the main chain of the low copy plasmid pACYC184. pCRISPR is based on the high copy number plasmid pZE21. Two plasmids were required because a pCRISPR plasmid containing a spacer that targeted the E. coli chromosome may not be constructed using this organism as a cloning host if Cas9 is also present (will destroy the host).

La Figura 37 ilustra edición dirigida por CRISPR en MG1655 de E.coli. Un oligonucleótido (W542) que soporta una mutación puntual que tanto confiere resistencia a estreptomicina como suprime la inmunidad de CRISPR, junto con Figure 37 illustrates edition directed by CRISPR in MG1655 by E.coli. An oligonucleotide (W542) that supports a point mutation that both confers streptomycin resistance and suppresses CRISPR immunity, along with

un plásmido que fija como objetivo rpsL (pCRISPR::rpsL) o un plásmido de control (pCRISPR::∅) se cotransformaron en MG1655 de la cepa E.coli natural que contenía pCas9. Los transformados se seleccionaron en medios que contenían estreptomicina o kanamicina. La línea de puntos indica el límite de detección de la prueba de transformación. a plasmid targeting rpsL (pCRISPR :: rpsL) or a control plasmid (pCRISPR :: ∅) were co-transformed into MG1655 of the natural E.coli strain containing pCas9. The transformants were selected in media containing streptomycin or kanamycin. The dotted line indicates the detection limit of the transformation test.

La Figura 38 ilustra la frecuencia de mutación de fondo de CRISPR en HME63 de E. coli. (a) Transformación de los plásmidos pCRISPR::∅ o pCRISPR::rpsL en células competentes HME63. Los mutantes que escapan a la interferencia de CRISPR fueron observados a una frecuencia de 2,6×10-4 . (b) La multiplicación de la matriz CRISPR de escapistas demostró que 8/8 había suprimido el espaciador. Figure 38 illustrates the background mutation frequency of CRISPR in HME63 of E. coli. (a) Transformation of plasmids pCRISPR :: ∅ or pCRISPR :: rpsL into competent HME63 cells. Mutants that escape CRISPR interference were observed at a frequency of 2.6 × 10-4. (b) The multiplication of the CRISPR matrix of escapists showed that 8/8 had suppressed the spacer.

La Figura 39A-D muestra una representación circular del análisis filogenético que revela cinco familias de Cas9s, incluyendo tres grupos de Cas9s grandes (1.400 aminoácidos) y dos de Cas9s pequeños (∼1.100 aminoácidos). Figure 39A-D shows a circular representation of the phylogenetic analysis that reveals five families of Cas9s, including three large Cas9s groups (.41,400 amino acids) and two small Cas9s (∼1,100 amino acids).

La Figura 40A-F muestra la representación lineal del análisis filogenético que revela cinco familias de Cas9s, incluyendo tres grupos de Cas9s grandes (1.400 aminoácidos) y dos de Cas9s pequeños (∼1.100 aminoácidos). Figure 40A-F shows the linear representation of the phylogenetic analysis that reveals five Cas9 families, including three large Cas9 groups (91,400 amino acids) and two small Cas9s (∼1,100 amino acids).

La Figura 41A-M muestra las secuencias en el caso de que los puntos de mutación estén situados dentro del gen SpCas9. Figure 41A-M shows the sequences in case the mutation points are located within the SpCas9 gene.

La Figura 42 muestra una construcción esquemática en la que se fusiona el dominio de activación de la transcripción (VP64) a Cas9 con dos mutaciones en los dominios catalíticos (D10 y H840). Figure 42 shows a schematic construction in which the transcription activation domain (VP64) is fused to Cas9 with two mutations in the catalytic domains (D10 and H840).

La Figura 43A-D muestra edición de genomas por recombinación homóloga. (a) Esquema de nickasa SpCas9, con mutación D10A en el dominio catalítico RuvC I. (b) Esquema que representa recombinación homóloga (RH) en el sitio EMX1 humano usando oligonucleótido monocatenario sentido o antisentido como plantillas de reparación. La flecha roja arriba indica sitio de escisión de ARNsg; los cebadores PCR para genotipados (Tablas J y K) se indican como flechas en el panel derecho. (c) Secuencia de región modificada por RH. d, prueba SURVEYOR para las inserciones o supresiones medidadas por SpCas9 natural (tn) y nickasa (D10A) en el sitio objetivo 1 de EMX1 (n=3). Las flechas indican las posiciones de tamaños de fragmento esperados. Figure 43A-D shows genome editing by homologous recombination. (a) SpCas9 nickase scheme, with D10A mutation in the RuvC I catalytic domain. (b) Scheme representing homologous recombination (RH) in the human EMX1 site using sense or antisense single stranded oligonucleotide as repair templates. The red arrow above indicates site of RNAs cleavage; PCR primers for genotyping (Tables J and K) are indicated as arrows in the right panel. (c) Region sequence modified by RH. d, SURVEYOR test for insertions or deletions measured by natural SpCas9 (tn) and nickasa (D10A) at target site 1 of EMX1 (n = 3). The arrows indicate the expected fragment size positions.

La Figura 44A-B muestra únicos diseños de vector para SpCas9. Figure 44A-B shows unique vector designs for SpCas9.

La Figura 45 muestra cuantificación de escisión de construcciones de NLS-Csn1 NLS-Csn1, Csn1, Csn1-NLS, NLSCsn1-NLS, NLS-Csn1-GFP-NLS y UnTFN. Figure 45 shows quantification of NLS-Csn1 NLS-Csn1, Csn1, Csn1-NLS, NLSCsn1-NLS, NLS-Csn1-GFP-NLS and UnTFN constructs.

La Figura 46 muestra la frecuencia del índice de NLS-Cas9, Cas9, Cas9-NLS y NLS-Cas9-NLS. Figure 46 shows the index frequency of NLS-Cas9, Cas9, Cas9-NLS and NLS-Cas9-NLS.

La Figura 47 muestra un gel que demuestra que SpCas9 con mutaciones de nickasa (individualmente) no inducen roturas de doble cadena. Figure 47 shows a gel demonstrating that SpCas9 with nickase mutations (individually) do not induce double chain tears.

La Figura 48 muestra un diseño del oligo ADN usado como plantilla de recombinación homóloga (RH) en este experimento y una comparación de la eficacia de la RH inducida por diferentes combinaciones de proteína Cas9 y plantilla de RH. Figure 48 shows a design of the oligo DNA used as a homologous recombination template (RH) in this experiment and a comparison of the efficacy of RH induced by different combinations of Cas9 protein and RH template.

La Figura 49A muestra el mapa de vectores que fijan como objetivo Cas9, Rosa26 condicional. Figure 49A shows the map of vectors that target Cas9, Conditional Rose26.

La Figura 49B muestra el mapa de vectores que fijan como objetivo Cas9, Rosa26 constitutivo. Figure 49B shows the map of vectors that target Cas9, Rosa26 constitutive.

La Figura 50A-H muestra las secuencias de cada elemento presentes en los mapas de vectores de las Figuras 49A-Figure 50A-H shows the sequences of each element present in the vector maps of Figures 49A-

B. B.

La Figura 51 muestra un esquema de los elementos importantes en las construcciones Cas9 constitutiva y condicional. Figure 51 shows an outline of the important elements in the constitutive and conditional Cas9 constructions.

La Figura 52 muestra la validación funcional de la expresión de las construcciones Cas9 constitutiva y condicional. Figure 52 shows the functional validation of the expression of the constitutive and conditional Cas9 constructs.

La Figura 53 muestra la validación de la actividad de la nucleasa Cas9 por Surveyor. Figure 53 shows the validation of Cas9 nuclease activity by Surveyor.

La Figura 54 muestra la cuantificación de actividad de la nucleasa Cas9. Figure 54 shows the quantification of Cas9 nuclease activity.

La Figura 55 muestra diseño de construcción y estrategia de recombinación homóloga (RH). Figure 55 shows construction design and homologous recombination strategy (RH).

La Figura 56 muestra los resultados de genotipados de PCR genómico para las construcciones constitutiva (derecha) y condicional (izquierda) en dos tiempos de exposición de gel diferentes (fila de arriba durante 3 min y fila del fondo durante 1 min). Figure 56 shows the genomic PCR genotyping results for the constitutive (right) and conditional (left) constructs at two different gel exposure times (top row for 3 min and bottom row for 1 min).

La Figura 57 muestra activación de Cas9 en mESCs. Figure 57 shows activation of Cas9 in mESCs.

La Figura 58 muestra un esquema de la estrategia usada para mediar la inactivación génica vía NHEJ (recombinación no homóloga, por sus siglas en inglés) usando una versión de nickasa de Cas9 junto con dos ARN guías. Figure 58 shows a schematic of the strategy used to mediate gene inactivation via NHEJ (non-homologous recombination) using a Nick9 version of Cas9 along with two guide RNAs.

La Figura 59 muestra cómo la reparación de la rotura de doble cadena de ADN (DSB, por sus siglas en inglés) activa la edición de genes. En la ruta de unión de extremos no homólogos propensa a errores (NHEJ), los extremos de una DSB se tratan mediante maquinarias de reparación de ADN endógeno y se vuelven a unir entre sí, lo que puede dar como resultado mutaciones de inserción/supresión (indel) aleatorias en el sitio de unión. Las mutaciones indel que tienen lugar en la región codificadora de un gen pueden dar como resultado cambio de marco y un codón de terminación prematuro, conduciendo a inactivación génica. Alternativamente, se puede suministrar una plantilla de reparación en la forma de un plásmido u oligodesoxinucleótidos monocatenarios (ODNss) para potenciar la ruta de reparación dirigida por homología (HDR, por sus siglas en inglés), que permite alta fidelidad y edición precisa. Figure 59 shows how DNA double strand (DSB) repair activates gene editing. In the error-prone non-homologous end junction path (NHEJ), the ends of a DSB are treated by endogenous DNA repair machinery and rejoined with each other, which can result in insertion / deletion mutations ( indel) random at the binding site. Indel mutations that occur in the coding region of a gene can result in a frame change and a premature termination codon, leading to gene inactivation. Alternatively, a repair template can be supplied in the form of a single stranded plasmid or oligodeoxynucleotide (ODNss) to enhance the homology-directed repair path (HDR), which allows high fidelity and precise editing.

La Figura 60 muestra la cronología y resumen de los experimentos. Las etapas para diseño de reactivo, construcción, validación y expansión de estirpes celulares. Los ARNsg de costumbre (barras azul claro) para cada objetivo, así como cebadores de genotipado, se diseñan in silico vía nuestra herramienta de diseño on-line (disponible en el sitio web genome-engineering.org/tools). Los vectores de expresión ARNsg se clonaron después en un plásmido que contenía Cas9 (PX330) y se verificó por secuenciación de ADN. Los plásmidos completos (los pCRISPR) y las plantillas de reparación opcionales para facilitar la reparación dirigida por homología, se transinfectan después a células y se prueba su capacidad para mediar la escisión fijada como objetivo. Finalmente, las células transinfectadas pueden expandirse de manera clonal para obtener estirpes celulares isogénicas con mutaciones definidas. Figure 60 shows the chronology and summary of the experiments. The stages for reagent design, construction, validation and expansion of cell lines. The usual ARNsg (light blue bars) for each objective, as well as genotyping primers, are designed in silico via our online design tool (available on the genome-engineering.org/tools website). The rRNA expression vectors were then cloned into a plasmid containing Cas9 (PX330) and verified by DNA sequencing. Complete plasmids (pCRISPR) and optional repair templates to facilitate homology-directed repair are then transinfected into cells and their ability to mediate target cleavage is tested. Finally, the transinfected cells can be clonally expanded to obtain isogenic cell lines with defined mutations.

La Figura 61A-C muestra selección de objetivo y preparación de reactivo. (a) Para Cas9 de S. pyogene, los objetivos de 20 pb (resaltado en azul) deben ir seguidos por 5'-NGG, que puede tener lugar en cualquier cadena en ADN genómico. Se recomienda usar la herramienta on-line descrita en este protocolo para ayudar a la selección de objetivo (www.genome-engineering.org/tools). (b) Esquema para cotransinfección de plásmido de expresión de Cas9 (PX165) y casete de expresión de ARNsg conducida por U6 multiplicada por PCR. Usar una plantilla de PCR que contenga activador de U6 y un cebador directo fijado (U6 Dir), puede agregarse ADN codificador de ARNsg sobre el cebador inverso de U6 (U6 Inv) y sintetizarse como un oligo ADN extendido (Oligo ultrámeros de IDT). Obsérvese que la secuencia guía (de N azul) en U6 Inv es el complemento inverso de la secuencia objetivo flanqueadora de 5'-NGG. (c) Esquema para clonación sin marca de las oligo secuencias guía en un plásmido que contiene andamio Cas9 y ARNsg (PX330). Los oligos guía (de N azul) contienen salientes para ligadura en el par de sitios de BbsI en PS330, igualándose las orientaciones de las cadenas superior y del fondo a aquéllas del objetivo genómico (es decir, oligo superior es la secuencia de 20 pb que precede 5'-NGG en ADN genómico). La digestión de PX330 con BbsI permite el reemplazo de los sitios de restricción de tipo IIs (trazado azul) con inserción directa de oligos hibridados. Cabe señalar que se puso una G extra antes de la primera base de la secuencia guía. Los solicitantes han encontrado que una G extra delante de la secuencia guía no afecta negativamente a la eficacia de la fijación como objetivo. En los casos en los que la secuencia guía de 20 nucleótidos de elección no empieza con guanina, la guanina extra asegurará que el ARNsg se transcriba de manera eficaz por el activador de U6, que prefiere una guanina en la primera base de la transcripción. Figure 61A-C shows target selection and reagent preparation. (a) For Cas9 of S. pyogene, the 20 bp targets (highlighted in blue) must be followed by 5'-NGG, which can take place in any genomic DNA strand. It is recommended to use the online tool described in this protocol to help target selection (www.genome-engineering.org/tools). (b) Scheme for cotransfection of Cas9 expression plasmid (PX165) and RNAs expression cassette driven by U6 multiplied by PCR. Using a PCR template containing a U6 activator and a fixed direct primer (U6 Dir), DNA encoding RNAsg can be added onto the reverse primer of U6 (U6 Inv) and synthesized as an extended DNA oligo (Oligo IDT ulcers). Note that the guide sequence (of blue N) in U6 Inv is the inverse complement of the 5'-NGG flanking target sequence. (c) Scheme for unlabeled cloning of the oligo guide sequences in a plasmid containing Cas9 scaffold and siRNA (PX330). The guide oligos (of blue N) contain ligation projections in the pair of BbsI sites on PS330, the orientations of the upper and bottom chains being equal to those of the genomic target (i.e., superior oligo is the 20 bp sequence precedes 5'-NGG in genomic DNA). The digestion of PX330 with BbsI allows the replacement of type IIs restriction sites (blue tracing) with direct insertion of hybridized oligos. It should be noted that an extra G was placed before the first base of the guide sequence. Applicants have found that an extra G in front of the guide sequence does not adversely affect the effectiveness of the target fixation. In cases where the guiding sequence of 20 nucleotides of choice does not start with guanine, the extra guanine will ensure that the siRNA is efficiently transcribed by the U6 activator, which prefers a guanine at the first base of the transcript.

La Figura 62A-D muestra los resultados anticipados para NHEJ múltiplex. (a) Esquema de la prueba SURVEYOR usada para determinar el porcentaje de inserciones o supresiones. Primero, se multiplica por PCR ADN genómico de la población heterogénea de células fijadas como objetivo de Cas9. Se vuelven a hibridar después lentamente los amplicones para generar los heterodúplex. Se escinden los heterodúplex hibridados de nuevo mediante nucleasa SURVEYOR, mientras se dejan intactos los homodúplex. Se calcula la eficacia de escisión mediada por Cas9 (% indel) basándose en la fracción de ADN escindido, cuando se determina por intensidad integrada de bandas de gel. Figure 62A-D shows the anticipated results for multiplex NHEJ. (a) SURVEYOR test scheme used to determine the percentage of insertions or deletions. First, genomic DNA from the heterogeneous population of fixed cells targeted by Cas9 is multiplied by PCR. The amplicons are then slowly hybridized again to generate heteroduplexes. Hybridized heteroduxes are cleaved again by SURVEYOR nuclease, while homoduplexes are left intact. The efficiency of Cas9-mediated cleavage (% indel) is calculated based on the fraction of DNA cleaved, when determined by integrated intensity of gel bands.

(b) (b)
Se diseñan dos ARNsg (barras naranja y azul) para fijar como objetivo los sitios (GRIN2B y DYRK1A humanos. El gel SURVEYOR muestra la modificación en ambos sitios en células transinfectadas. Las flechas coloreadas indicaron los tamaños de fragmento esperados para cada sitio. (c) Se diseña un par de ARNsg (barras azul claro y verde) para escindir un exón (azul oscuro) en el sitio EMX1 humano. Las secuencias objetivo y los PAM (rojo) se muestran en los respectivos colores y los sitios de escisión se indican por triángulo rojo. La unión prevista se muestra a continuación. Los clones individuales aislados de poblaciones de células transinfectadas con ARNsg 3, 4 Two RNAs (orange and blue bars) are designed to target the sites (human GRIN2B and DYRK1A. SURVEYOR gel shows the modification at both sites in transfected cells. Colored arrows indicated the expected fragment sizes for each site. (C ) A pair of RNAs (light blue and green bars) is designed to cleave an exon (dark blue) at the human EMX1 site.The target sequences and the PAMs (red) are shown in the respective colors and the cleavage sites are indicated by red triangle The expected binding is shown below: Individual clones isolated from populations of cells transfected with RNAs 3, 4

o ambos se ensayan mediante PCR (OUT Dir, OUT Inv), que refleja una supresión de ∼270 pb. Se muestran los clones representativos sin modificación (12/23), modificaciones monoalélicas (10/23) y bi-alélicas (1/23). Se usan cebadores IN Dir e IN Inv para identificar sistemáticamente sucesos de inversión (Fig. 6d). (d) Cuantificación de estirpes clonales con supresiones de exones EMX1. Se usan dos pares de ARNsg (ARNsg de flanqueado izquierdo 3.1, 3.2; ARNsg de flanqueado derecho 4.1, 4.2) para mediar las supresiones de tamaños variables alrededor de un exón EMX1. Se aíslan de manera clonal células transinfectadas y se expanden por análisis de genotipado para supresiones y sucesos de inversión. De los 105 clones se detectan sistemáticamente, 51 (49%) y 11 (10%) soportando supresiones heterozigóticas y homozigóticas, respectivamente. Se proporcionan tamaños de supresión aproximados puesto que las uniones pueden ser variables. or both are tested by PCR (OUT Dir, OUT Inv), which reflects a suppression of ∼270 bp. Representative clones without modification (12/23), mono-allelic (10/23) and bi-allelic (1/23) modifications are shown. IN Dir and IN Inv primers are used to systematically identify reversal events (Fig. 6d). (d) Quantification of clonal lines with EMX1 exon suppressions. Two pairs of sRNAs (left flanked sRNA 3.1, 3.2; right flanked sRNA 4.1, 4.2) are used to mediate deletions of varying sizes around an EMX1 exon. Transinfected cells are cloned and expanded by genotyping analysis for suppression and reversal events. Of the 105 clones, 51 (49%) and 11 (10%) are systematically detected, supporting heterozygous and homozygous deletions, respectively. Approximate suppression sizes are provided since the joints can be variable.

La Figura 63A-C muestra la aplicación de ssODN (del inglés, oligodesoxirribonucleótido de cadena sencilla) y vector de fijación como objetivo para mediar la RH con mutante tanto natural como nickasa de Cas9 en células HEK293FT y HUES9 con eficacias que oscilan de 1,0-27%. Figure 63A-C shows the application of ssODN (English, single chain oligodeoxyribonucleotide) and fixation vector as a target to mediate HR with both natural mutant and Cas9 nickase in HEK293FT and HUES9 cells with efficiencies ranging from 1.0 -27%

La Figura 64 muestra un esquema de un método basado en PCR para fijar como objetivo CRISPR de manera rápida y eficaz en células de mamífero. Un plásmido que contiene el activador U6 de polimerasa III de ARN humano se multiplica por PCR usando un cebador directo específico de U6 y un cebador inverso que soporta el complemento inverso de parte del cebador U6, el andamio ARNsg(+85) con secuencia guía y nucleótidos 7 T para terminación transcripcional. Se purifica el producto PCR resultante y se suministra conjuntamente con un plásmido que soporta Cas9 conducido por el activador CBh. Figure 64 shows a scheme of a PCR-based method for quickly and efficiently targeting CRISPR in mammalian cells. A plasmid containing the human RNA polymerase III activator U6 is multiplied by PCR using a direct specific U6 primer and a reverse primer that supports the reverse complement of part of the U6 primer, the RNAsg scaffold (+85) with guide sequence and 7 T nucleotides for transcriptional termination. The resulting PCR product is purified and supplied together with a plasmid that supports Cas9 driven by the CBh activator.

La Figura 65 muestra estuche de detección de mutación SURVEYOR de resultados transgenómicos para cada ARNg y respectivos controles. Un resultado SURVEYOR positivo es una banda grande que corresponde al PCR genómico y dos bandas más pequeñas que son el producto de la nucleasa SURVEYOR que haga una rotura de doble cadena en el sitio de una mutación. Se validó cada ARNg en la estirpe celular de ratón, Neuro-N2a, por cotransinfección transitoria liposomal con hSpCas9. 72 horas postransinfección se purificó ADN genómico usando ADN QuickExtract de Epicentre. Se realizó PCR para multiplicar el sitio de interés. Figure 65 shows SURVEYOR mutation detection kit of transgenomic results for each mRNA and respective controls. A positive SURVEYOR result is a large band that corresponds to genomic PCR and two smaller bands that are the product of the SURVEYOR nuclease that causes a double-strand break at the site of a mutation. Each rRNA was validated in the mouse cell line, Neuro-N2a, by transient liposomal co-transfection with hSpCas9. 72 hours post-infection genomic DNA was purified using Epicenter QuickExtract DNA. PCR was performed to multiply the site of interest.

La Figura 66 muestra los resultados Surveyor para 38 crías vivas (rutas 1-38) 1 cría muerta (ruta 39) y 1 cría natural para comparación (ruta 40). Se inyectó ARNg Chd8.2 a las crías 1-19 y ARNg Chd8.3 a las crías 20-38. De las 38 crías vivas, 13 fueron positivas para una mutación. Una cría muerta también tuvo una mutación. No se detectó mutación en la muestra natural. La secuenciación PCR genómica fue consistente con los hallazgos de la prueba SURVEYOR. Figure 66 shows the Surveyor results for 38 live offspring (routes 1-38) 1 dead offspring (route 39) and 1 natural offspring for comparison (route 40). Chd8.2 siRNA was injected to offspring 1-19 and Chdg.3.3 siRNAs were fed to offspring 20-38. Of the 38 live offspring, 13 were positive for a mutation. A dead baby also had a mutation. No mutation was detected in the natural sample. Genomic PCR sequencing was consistent with the findings of the SURVEYOR test.

La Figura 67 muestra un diseño de diferentes construcciones de NLS Cas9. Todos los Cas9 fueron la versión de codón optimizado humano de Sp Cas9. Las secuencias NLS se ligaron al gen cas9 en cualquier N-terminal o Cterminal. Todas las variantes de Cas9 con diferentes diseños NLS se clonaron en un vector de esqueleto que conteniendo eso es conducido por un activador de EF1a. En el mismo vector hay un sitio EMX1 humano que fija como objetivo ARN quimérico conducido por activador U6, formando un sistema de dos componentes. Figure 67 shows a design of different constructions of NLS Cas9. All Cas9 were the human optimized codon version of Sp Cas9. The NLS sequences were linked to the cas9 gene in any N-terminal or Cterminal. All variants of Cas9 with different NLS designs were cloned into a skeleton vector containing that is driven by an EF1a activator. In the same vector there is a human EMX1 site that targets chimeric RNA driven by activator U6, forming a two component system.

La Figura 68 muestra la eficacia de la escisión genómica inducida por variantes de Cas9 que soportan diferentes diseños NLS. El porcentaje indica la porción de ADN genómico de EMX1 humano que se escindió por cada construcción. Todos los experimentos son de 3 replicados biológicos. n = 3, el error indica E.E.M. Figure 68 shows the efficacy of genomic excision induced by Cas9 variants that support different NLS designs. The percentage indicates the portion of human EMX1 genomic DNA that was cleaved by each construct. All experiments are of 3 biological replicates. n = 3, the error indicates E.E.M.

La Figura 69A muestra un diseño del CRISPR-TF (factor de transcripción) con actividad de activación transcripcional. Se expresa el ARN quimérico por el activador U6, mientras una versión de doble mutante, de codón optimizado humano de la proteína Cas9 (hSpCas9m), ligada de manera operable a NLS triple y un dominio funcional VP64 se expresa por un activador de EF1a. Las dobles mutaciones, D10A y H840A, hacen a la proteína cas9 incapaz de introducir escisión pero mantiene su capacidad para fijar como objetivo ADN cuando se guía por el ARN quimérico. Figure 69A shows a design of the CRISPR-TF (transcription factor) with transcriptional activation activity. The chimeric RNA is expressed by the U6 activator, while a double mutant, human optimized codon version of the Cas9 protein (hSpCas9m), operably linked to triple NLS and a VP64 functional domain is expressed by an EF1a activator. The double mutations, D10A and H840A, make the cas9 protein unable to introduce cleavage but maintains its ability to target DNA when guided by the chimeric RNA.

La Figura 69B muestra la activación de la transcripción del gen SOX2 humano con sistema CRISPR-TF (ARN quimérico y la proteína de fusión Cas9-NLS-VP64). Se transinfectaron células 293FT con plásmidos que soportaban dos componentes: (1) diferentes ARN quiméricos conducidos por U6 que fijan como objetivo secuencias de 20 pb en Figure 69B shows the activation of transcription of the human SOX2 gene with CRISPR-TF system (chimeric RNA and the Cas9-NLS-VP64 fusion protein). 293FT cells were transinfected with plasmids that supported two components: (1) different U6-driven chimeric RNAs that target 20 bp sequences in

o alrededor del sitio genómico SOX2 humano y (2) proteína de fusión hSpCas9m (doble mutante)-NLS-VP64 conducida por EF1a. 96 horas postransinfección, se recogieron las células 293FT y se midió el nivel de activación por la inducción de expresión de ARNm usando una prueba qRT-PCR (del inglés, reacción en cadena de la polimerasa con transcriptasa inversa). Se normalizan todos los niveles de expresión contra el grupo de control (barra gris), que representa los resultados de células transinfectadas con el plásmido de esqueleto de CRISPR-TF sin ARN quimérico. Las sondas de qRT-PCR usadas para detectar el ARNm de SOX2 es la prueba de expresión de genes humanos Taqman (Life Technologies). Todos los experimentos representan datos de 3 replicados biológicos, n=3, las barras de error muestran E.E.M. or around the human SOX2 genomic site and (2) hSpCas9m (double mutant) -NLS-VP64 fusion protein driven by EF1a. 96 hours post-infection, 293FT cells were collected and the level of activation was measured by induction of mRNA expression using a qRT-PCR test (in English, polymerase chain reaction with reverse transcriptase). All levels of expression are normalized against the control group (gray bar), which represents the results of cells transinfected with the CRISPR-TF skeleton plasmid without chimeric RNA. The qRT-PCR probes used to detect the SOX2 mRNA is the Taqman human gene expression test (Life Technologies). All experiments represent data from 3 biological replicates, n = 3, the error bars show E.E.M.

La Figura 70 representa la optimización de la arquitectura NLS para SpCas9. Figure 70 represents the optimization of the NLS architecture for SpCas9.

La Figura 71 muestra una representación gráfica de QQ para las secuencias NGGNN. Figure 71 shows a graphical representation of QQ for the NGGNN sequences.

La Figura 72 muestra un histograma de la densidad de datos con distribución normal fijada (línea negra) y 0,99 de cuantil (línea de puntos). Figure 72 shows a histogram of data density with fixed normal distribution (black line) and 0.99 quantile (dotted line).

La Figura 73A-C muestra represión guiada por ARN de expresión de bgaA por ARNdg::cas9**. a. La proteína Cas9 se une al ARNtracr y al precursor de ARN de CRISPR que se trata por RNAseIII para formar el ARNcr. El ARNcr dirige la unión de Cas9 al activador de bgaA y reprime la transcripción. b. Se representan los objetivos usados para dirigir Cas9** al activador de bgaA. El codón putativo -35, -10 así como el codón de partida bgaA están en negrita. c. Figure 73A-C shows repression guided by bgaA expression RNA by dRNA :: cas9 **. to. The Cas9 protein binds to the RNAcrcr and the CRISPR RNA precursor which is treated by RNAseIII to form the cRNA. The ARNcr directs the binding of Cas9 to the bgaA activator and represses the transcription. b. The objectives used to direct Cas9 ** to the bgaA activator are represented. The putative codon -35, -10 as well as the starting codon bgaA are in bold. C.

La actividad de la betagalactosidasa cuando se mide por la prueba de Miller en ausencia de fijación como objetivo y para los cuatro objetivos diferentes. The activity of betagalactosidase when measured by the Miller test in the absence of fixation as an objective and for the four different objectives.

La Figura 74A-E muestra caracterización de represión mediada por Cas9**. a. El gen gfpmut2 y su activador, incluyendo las señales -35 y -10 se representan junto con la posición de los diferentes sitios objetivo usados en el estudio. b. Fluorescencia relativa en la fijación como objetivo de la cadena codificadora. c. Fluorescencia relativa en la fijación como objetivo de la cadena no codificadora. d. Método de Northern con sondas B477 y B478 sobre ARN extraído de T5, T10, B10 o una cepa de control sin un objetivo. e. Efecto de un número creciente de mutaciones en el extremo 5' del ARNcr de B1, T5 y B10. Figure 74A-E shows characterization of repression mediated by Cas9 **. to. The gfpmut2 gene and its activator, including the -35 and -10 signals are represented along with the position of the different target sites used in the study. b. Relative fluorescence in the fixation as objective of the coding chain. C. Relative fluorescence in the fixation as an objective of the non-coding chain. d. Northern method with probes B477 and B478 on RNA extracted from T5, T10, B10 or a control strain without a target. and. Effect of an increasing number of mutations at the 5 'end of the bRNA of B1, T5 and B10.

Las figuras en la presente memoria son sólo para fines ilustrativos y no están necesariamente dibujadas a escala. The figures herein are for illustrative purposes only and are not necessarily drawn to scale.

Descripción detallada de la invención Detailed description of the invention

Los términos "polinucleótido", "nucleótido", "secuencia de nucleótidos", "ácido nucleico" y "oligonucleótido" se usan de forma intercambiable. Se refieren a una forma polimérica de nucleótidos de cualquier longitud, desoxirribonucleótidos o ribonucleótidos o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional y pueden realizar cualquier función, conocida o desconocida. Los siguientes no son ejemplos limitantes de los polinucleótidos: regiones codificadoras o no codificadoras de un gen o fragmento de gen, sitios (sitio) definidos a partir de análisis de unión, exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ARN de interferencia corta (ARNic), ARN de horquilla corta (ARNhc), micro-ARN (ARNmi), ribozimas y ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácidos nucleicos y cebadores. Un polinucleótido puede comprender uno o más nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. Si hay, se pueden impartir modificaciones a la estructura del nucleótido antes o después del ensamblado del polímero. La secuencia de nucleótidos puede ser interrumpida por componentes no nucleótidos. Un polinucleótido puede ser modificado además después de polimerización, tal como por conjugación con un componente etiquetado. The terms "polynucleotide", "nucleotide", "nucleotide sequence", "nucleic acid" and "oligonucleotide" are used interchangeably. They refer to a polymeric form of nucleotides of any length, deoxyribonucleotides or ribonucleotides or analogs thereof. The polynucleotides can have any three-dimensional structure and can perform any function, known or unknown. The following are not limiting examples of polynucleotides: coding or non-coding regions of a gene or gene fragment, sites (site) defined from binding analysis, exons, introns, messenger RNA (mRNA), transfer RNA, RNA ribosomal, short interference RNA (siRNA), short hairpin RNA (hRNA), micro-RNA (mRNA), ribozymes and cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, DNA isolated from any sequence, RNA isolated from any sequence , nucleic acid probes and primers. A polynucleotide may comprise one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If there are, modifications can be made to the nucleotide structure before or after polymer assembly. The nucleotide sequence can be interrupted by non-nucleotide components. A polynucleotide can be further modified after polymerization, such as by conjugation with a labeled component.

En aspectos de la invención, los términos "ARN quimérico", "ARN guía quimérico", "ARN guía", "ARN guía único" y "ARN guía sintético" se usan de forma intercambiable y se refieren a la secuencia de polinucleótidos que comprende la secuencia guía, la secuencia tracr y la secuencia de emparejamiento tracr. El término "secuencia guía" se refiere a la secuencia de aproximadamente 20 pb dentro del ARN guía que especifica el sitio objetivo y se puede usar de manera intercambiable con los términos "guía" o "espaciador". El término "secuencia de emparejamiento tracr" también se puede usar de forma intercambiable con el término "repetición o repeticiones directas". In aspects of the invention, the terms "chimeric RNA", "chimeric guide RNA", "guide RNA", "single guide RNA" and "synthetic guide RNA" are used interchangeably and refer to the polynucleotide sequence comprising the guide sequence, the tracr sequence and the tracr pairing sequence. The term "guide sequence" refers to the sequence of approximately 20 bp within the guide RNA that specifies the target site and can be used interchangeably with the terms "guide" or "spacer." The term "tracr pairing sequence" can also be used interchangeably with the term "repetition or direct repetitions".

Como se usa en la presente memoria el término "natural" es un término de la técnica entendido por los expertos y significa la forma típica de un organismo, cepa, gen o característica como se encuentra en la naturaleza como se distingue de formas mutantes o variantes. As used herein the term "natural" is a term of the art understood by experts and means the typical form of an organism, strain, gene or characteristic as found in nature as distinguished from mutant or variant forms. .

Como se usa en la presente memoria, el término "variante" se debería considerar que significa la exhibición de cualidades que presentan un patrón que se desvía de lo que ocurre en la naturaleza. As used herein, the term "variant" should be considered to mean the display of qualities that exhibit a pattern that deviates from what occurs in nature.

Los términos "que no se encuentra en la naturaleza" o "logrado" se usan de forma intercambiable e indican la implicación de la mano del hombre. Los términos, cuando se refieren a moléculas de ácido nucleico o polipéptidos significan que la molécula de ácido nucleico o el polipéptido está al menos sustancialmente exento de al menos otro componente con el que se asocian de manera natural en la naturaleza y como se encuentran en la naturaleza. The terms "not found in nature" or "achieved" are used interchangeably and indicate the involvement of the hand of man. The terms, when referring to nucleic acid molecules or polypeptides mean that the nucleic acid molecule or polypeptide is at least substantially free of at least one other component with which they are naturally associated in nature and as found in the nature.

"Complementariedad" se refiere a la capacidad de un ácido nucleico para formar el enlace o enlaces de hidrógeno con otra secuencia de ácidos nucleicos por emparejamiento de bases de Watson-Crick tradicional u otros tipos no tradicionales. Un porcentaje de complementariedad indica el porcentaje de restos en una molécula de ácido nucleico que puede formar enlaces de hidrógeno (por ej., emparejamiento de bases de Watson-Crick) con una segunda secuencia de ácidos nucleicos (por ej., 5, 6, 7, 8, 9, 10 de un total de 10 siendo complementariedad del 50%, 60%, 70%, 80%, 90% y 100%). "Perfectamente complementario" significa que todos los restos contiguos de una secuencia de ácidos nucleicos formarán enlace de hidrógeno con el mismo número de restos contiguos en una segunda secuencia de ácidos nucleicos. "Sustancialmente complementario" como se usa en la presente memoria se refiere a un grado de complementariedad que es al menos 60%, 65%, 70%, 75%, 80%, 85%, 90%%, 95%, 97%, 98%, 99% o 100% por una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 o más nucleótidos o se refiere a dos ácidos nucleicos que se hibridan en condiciones rigurosas. "Complementarity" refers to the ability of a nucleic acid to form the hydrogen bond or bonds with another nucleic acid sequence by traditional Watson-Crick base pairing or other non-traditional types. A percentage of complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds (e.g., Watson-Crick base pairing) with a second nucleic acid sequence (e.g., 5, 6, 7, 8, 9, 10 of a total of 10 being a complementarity of 50%, 60%, 70%, 80%, 90% and 100%). "Perfectly complementary" means that all contiguous residues of a nucleic acid sequence will form hydrogen bond with the same number of contiguous residues in a second nucleic acid sequence. "Substantially complementary" as used herein refers to a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90 %%, 95%, 97%, 98%, 99% or 100% for a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 or more nucleotides or refers to two nucleic acids that hybridize under stringent conditions.

Como se usa en la presente memoria, "condiciones rigurosas" para hibridación se refiere a las condiciones en las cuales un ácido nucleico que tiene complementariedad a una secuencia objetivo se hibrida predominantemente con la secuencia objetivo y sustancialmente no se hibrida a las secuencias no objetivo. Las condiciones rigurosas son en general dependientes de la secuencia y varían dependiendo de una serie de factores. En general, cuanto más larga la secuencia, mayor la temperatura a la que se hibrida de manera específica la secuencia a su secuencia objetivo. As used herein, "stringent conditions" for hybridization refers to the conditions in which a nucleic acid that has complementarity to an objective sequence predominantly hybridizes with the objective sequence and substantially does not hybridize to the non-objective sequences. Rigorous conditions are generally sequence dependent and vary depending on a number of factors. In general, the longer the sequence, the higher the temperature at which the sequence specifically hybridizes to its target sequence.

Se describen con detalle ejemplos no limitantes de condiciones rigurosas en Tijssen (1993), Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Segundo Capítulo "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y. Non-limiting examples of severe conditions are described in detail in Tijssen (1993), Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, NY

"Hibridación" se refiere a una reacción en la que uno o más polinucleótidos reaccionan para formar un complejo que se estabiliza vía enlace de hidrógeno entre las bases de los restos de nucleótido. El enlace de hidrógeno puede tener lugar por apareamiento de bases de Watson Crick, unión de Hoogstein o de cualquier otra manera específica de la secuencia. El complejo puede comprender dos cadenas que forman una estructura dúplex, tres o más cadenas que forman un complejo multicatenario, una sola cadena que se autohibrida o cualquier combinación de éstas. Una reacción de hibridación puede constituir una etapa en un procedimiento más extenso, tal como la iniciación de PCR "Hybridization" refers to a reaction in which one or more polynucleotides react to form a complex that stabilizes via hydrogen bonding between the bases of the nucleotide moieties. Hydrogen bonding can take place by base pairing of Watson Crick, Hoogstein binding or in any other sequence-specific way. The complex may comprise two chains that form a duplex structure, three or more chains that form a multi-chain complex, a single chain that is self-inhibited or any combination thereof. A hybridization reaction may constitute a stage in a more extensive procedure, such as PCR initiation.

o la escisión de un polinucleótido mediante una enzima. Una secuencia capaz de hibridación con una secuencia determinada se refiere como el “complemento” de la secuencia determinada. or excision of a polynucleotide by an enzyme. A sequence capable of hybridization with a given sequence is referred to as the "complement" of the determined sequence.

Como se usa en la presente memoria, "expresión" se refiere al procedimiento por el que un polinucleótido se transcribe de una plantilla de ADN (tal como en ARNm u otro transcrito de ARN) y/o el procedimiento por el que se traduce con posterioridad un ARNm transcrito en péptidos, polipéptidos o proteínas. Los transcritos y polipéptidos codificados se pueden referir de manera colectiva como “producto génico”. Si el polinucleótido procede de ADN genómico, la expresión puede incluir proceso de corte y empalme del ARNm en una célula eucariota. As used herein, "expression" refers to the procedure by which a polynucleotide is transcribed from a DNA template (such as in mRNA or other RNA transcript) and / or the method by which it is subsequently translated an mRNA transcribed into peptides, polypeptides or proteins. Transcripts and encoded polypeptides can be collectively referred to as a "gene product." If the polynucleotide is derived from genomic DNA, the expression may include the mRNA splicing process in a eukaryotic cell.

Los términos "polipéptido", "péptido" y "proteína" se usan de forma intercambiable en la presente memoria para referirse a polímeros de aminoácidos de cualquier longitud. El polímero puede ser lineal o ramificado y puede comprender aminoácidos modificados y puede ser interrumpido por no aminoácidos. Los términos también incluyen un polímero de aminoácidos que ha sido modificado; por ejemplo, formación de enlace disulfuro, glucosilación, lipidación, acetilación, fosforilación o cualquier otra manipulación, tal como conjugación con un componente etiquetado. Como se usa en la presente memoria el término “aminoácido” incluye aminoácidos naturales y/o no naturales o sintéticos, incluyendo glicina y los dos isómeros ópticos D o L y análogos de aminoácido y peptidomiméticos. The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to amino acid polymers of any length. The polymer can be linear or branched and can comprise modified amino acids and can be interrupted by non-amino acids. The terms also include an amino acid polymer that has been modified; for example, disulfide bond formation, glycosylation, lipidation, acetylation, phosphorylation or any other manipulation, such as conjugation with a labeled component. As used herein the term "amino acid" includes natural and / or unnatural or synthetic amino acids, including glycine and the two optical isomers D or L and amino acid analogs and peptidomimetics.

Los términos " individuo," "individual" y "paciente" se usan de forma intercambiable en la presente memoria para referirse a un vertebrado, preferiblemente un mamífero, más preferiblemente un ser humano. Los mamíferos incluyen, pero no están limitados a, murinas, simios, seres humanos, animales de granja, animales deportivos y mascotas. Los tejidos, las células y su progenie de una entidad biológica obtenida in vivo o cultivada in vitro también se incluyen. The terms "individual," "individual" and "patient" are used interchangeably herein to refer to a vertebrate, preferably a mammal, more preferably a human being. Mammals include, but are not limited to, murine, apes, humans, farm animals, sports animals and pets. Tissues, cells and their progeny of a biological entity obtained in vivo or cultured in vitro are also included.

Los términos "agente terapéutico", "agente terapéutico capaz" o "agente de tratamiento" se usan de forma intercambiable y se refieren a una molécula o compuesto que confiere algún efecto beneficioso en la administración a un individuo. El efecto beneficioso incluye permitir determinaciones de diagnóstico; alivio de una enfermedad, síntoma, trastorno o afección patológica; reducir o prevenir el comienzo de una enfermedad, síntoma, trastorno o afección y en general contrarrestar una enfermedad, síntoma, trastorno o afección patológica. The terms "therapeutic agent", "capable therapeutic agent" or "treatment agent" are used interchangeably and refer to a molecule or compound that confers some beneficial effect on administration to an individual. The beneficial effect includes allowing diagnostic determinations; relief of a disease, symptom, disorder or pathological condition; reduce or prevent the onset of a disease, symptom, disorder or condition and in general counteract a disease, symptom, disorder or pathological condition.

Como se usa en la presente memoria, "tratamiento" o " tratar," o "paliar" o "aliviar" se usan de forma intercambiable. Estos términos se refieren a una propuesta para obtener resultados beneficiosos o deseados incluyendo, pero no limitándose a, un beneficio terapéutico y/o un beneficio profiláctico. Por beneficio terapéutico se quiere decir cualquier mejora terapéuticamente relevante en, o efecto sobre, una o más enfermedades, afecciones o síntomas bajo tratamiento. Para beneficio profiláctico, las composiciones se pueden administrar a un individuo con riesgo de desarrollar una enfermedad, afección o síntoma, particular, o a un individuo que indica uno o más de los síntomas fisiológicos de una enfermedad, incluso aunque la enfermedad, afección o síntoma pueda no haberse manifestado aún. As used herein, "treatment" or "treat," or "alleviate" or "relieve" are used interchangeably. These terms refer to a proposal to obtain beneficial or desired results including, but not limited to, a therapeutic benefit and / or a prophylactic benefit. By therapeutic benefit is meant any therapeutically relevant improvement in, or effect on, one or more diseases, conditions or symptoms under treatment. For prophylactic benefit, the compositions may be administered to an individual at risk of developing a particular disease, condition or symptom, or to an individual indicating one or more of the physiological symptoms of a disease, even if the disease, condition or symptom may Not having manifested yet.

El término "cantidad eficaz" o "cantidad terapéuticamente eficaz" se refiere a la cantidad de un agente que es suficiente para efectuar resultados beneficiosos o deseados. La cantidad terapéuticamente eficaz puede variar dependiendo de uno o más de: el individuo y la enfermedad que se está tratando, el peso y la edad del individuo, la gravedad de la enfermedad, la manera de administración y similares, que puede ser determinado fácilmente por un experto en la materia. El término también se aplica a una dosis que proporcionará una imagen para detección por uno cualquiera de los métodos de formación de imagen descritos en la presente memoria. La dosis específica puede variar dependiendo de uno o más de: el agente particular elegido, el régimen de dosificación que se tenga que seguir, si se administra en asociación con otros compuestos, la sincronización de la administración, el tejido que se tiene que someter a formación de imagen y el sistema de suministro físico en el que se soporte. The term "effective amount" or "therapeutically effective amount" refers to the amount of an agent that is sufficient to effect beneficial or desired results. The therapeutically effective amount may vary depending on one or more of: the individual and the disease being treated, the weight and age of the individual, the severity of the disease, the manner of administration and the like, which can easily be determined by An expert in the field. The term also applies to a dose that will provide an image for detection by any one of the imaging methods described herein. The specific dose may vary depending on one or more of: the particular agent chosen, the dosage regimen to be followed, if administered in association with other compounds, the timing of administration, the tissue to be subjected to image formation and the physical supply system on which it is supported.

La práctica de la presente invención emplea, a menos que se indique de otro modo, técnicas convencionales de inmunología, bioquímica, química, biología molecular, microbiología, biología celular, ADN genómico y recombinante, que están dentro de la destreza de la técnica. Véase Sambrook, Fritsch y Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2ª edición (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. The practice of the present invention employs, unless otherwise indicated, conventional techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomic and recombinant DNA, which are within the skill of the art. See Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F.

M. Ausubel, et al. eds., (1987)); las series METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M. J. MacPherson, B. D. Hames y G. R. Taylor eds. (1995)), eds. Harlow and Lane, M. Ausubel, et al. eds., (1987)); METHODS IN ENZYMOLOGY series (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)), eds. Harlow and Lane,

(1988) ANTIBODIES, A LABORATORY MANUAL y ANIMAL CELL CULTURE (ed. R. I. Freshney, (1987)). (1988) ANTIBODIES, A LABORATORY MANUAL and ANIMAL CELL CULTURE (ed. R. I. Freshney, (1987)).

Varios aspectos de la invención se refieren a sistemas vector que comprenden uno o más vectores o vectores como tales. Se pueden diseñar vectores para expresión de transcritos CRISPR (por ejemplo, transcritos de ácidos nucleicos, proteínas o enzimas) en células procariotas o eucariotas. Por ejemplo, se pueden expresar transcritos de CRISPR en células bacterianas tales como Escherichia coli, células de insecto (usando vectores de expresión de baculovirus), células de levaduras o células de mamíferos. Las células huésped adecuadas se discuten además en Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego; Calif. (1990). Alternativamente, el vector de expresión recombinante se puede transcribir y traducir in vitro, por ejemplo, usando secuencias reguladoras de activador T7 y polimerasa T7. Several aspects of the invention relate to vector systems comprising one or more vectors or vectors as such. Vectors can be designed for expression of CRISPR transcripts (eg, nucleic acid, protein or enzyme transcripts) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells such as Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego; Calif. (1990). Alternatively, the recombinant expression vector can be transcribed and translated in vitro, for example, using T7 activator and T7 polymerase regulatory sequences.

Se pueden introducir vectores y propagar en una procariota. En algunas realizaciones, se usa una procariota para multiplicar copias de un vector que se tiene que introducir en una célula eucariota o como un vector intermedio en la producción de un vector que se tiene que introducir en una célula eucariota (por ej., multiplicando un plásmido como parte de un sistema de empaquetamiento de vector vírico). En algunas realizaciones, se usa una procariota para multiplicar copias de un vector y expresar uno o más ácidos nucleicos, tal como para proporcionar una fuente de una Vectors can be introduced and propagated in a prokaryotic. In some embodiments, a prokaryotic is used to multiply copies of a vector that has to be introduced into a eukaryotic cell or as an intermediate vector in the production of a vector that has to be introduced into a eukaryotic cell (e.g., by multiplying a plasmid as part of a viral vector packaging system). In some embodiments, a prokaryotic is used to multiply copies of a vector and express one or more nucleic acids, such as to provide a source of a

o más proteínas para suministro a una célula huésped u organismo huésped. La expresión de proteínas en procariotas se lleva a cabo lo más frecuentemente en Escherichia coli con vectores que contienen activadores constitutivos o inducibles que dirigen la expresión de proteínas de fusión o de no fusión. Los vectores de fusión añaden una serie de aminoácidos a una proteína codificada allí, tal como al término amino de la proteína recombinante. Dichos vectores de fusión pueden servir para uno o más fines, tales como: (i) para aumentar la expresión de proteína recombinante; (ii) para aumentar la solubilidad de la proteína recombinante y (iii) para ayudar en la purificación de la proteína recombinante actuando como un ligando en purificación de afinidad. Con frecuencia, en vectores de expresión de fusión, se introduce un sitio de escisión proteolítico en la unión del resto de fusión y la proteína recombinante para permitir la separación de la proteína recombinante del resto de fusión posterior a la purificación de la proteína de fusión. Tales enzimas, y sus secuencias de reconocimiento afines, incluyen Factor Xa, trombina y enterocinasa. Vectores de expresión de fusión de ejemplo incluyen pGEX (Pharmacia Biotech Inc; Smith y Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Beverly, Mass.) y pRIT5 (Pharmacia, Piscataway, or more proteins for delivery to a host cell or host organism. Protein expression in prokaryotes is most frequently carried out in Escherichia coli with vectors containing constitutive or inducible activators that direct the expression of fusion or non-fusion proteins. Fusion vectors add a series of amino acids to a protein encoded there, such as the amino acid term of the recombinant protein. Said fusion vectors can serve one or more purposes, such as: (i) to increase the expression of recombinant protein; (ii) to increase the solubility of the recombinant protein and (iii) to aid in the purification of the recombinant protein by acting as a ligand in affinity purification. Frequently, in fusion expression vectors, a proteolytic cleavage site is introduced at the junction of the fusion moiety and the recombinant protein to allow separation of the recombinant protein from the fusion moiety after purification of the fusion protein. Such enzymes, and their related recognition sequences, include Factor Xa, thrombin and enterokinase. Example fusion expression vectors include pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Beverly, Mass.) And pRIT5 (Pharmacia, Piscataway,

N. N.
J.) que condensan glutationa S-transferasa (GST), proteína de unión de maltosa E o proteína A, respectivamente, a la proteína recombinante objetivo. J.) that condense glutathione S-transferase (GST), maltose E binding protein or protein A, respectively, to the target recombinant protein.

Ejemplos de vectores de expresión de E. coli no de fusión, inducibles, adecuados, incluyen pTrc (Amrann et al., (1988) Gene 69: 301-315) y pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). Examples of suitable inducible, fusion E. coli expression vectors include pTrc (Amrann et al., (1988) Gene 69: 301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).

En algunas realizaciones, un vector es un vector de expresión de levadura. Ejemplos de vectores para expresión en levadura Saccharomyces cerivisae incluyen pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan y Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.) y picZ (InVitrogen Corp, San Diego, Calif.). In some embodiments, a vector is a yeast expression vector. Examples of vectors for expression in yeast Saccharomyces cerivisae include pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.) and picZ (InVitrogen Corp, San Diego, Calif.).

En algunas realizaciones, un vector conduce la expresión de proteínas en células de insecto usando vectores de expresión de baculovirus. Los vectores baculovirus disponibles para expresión de proteínas en células de insecto cultivadas (por ej., células SF9) incluyen la serie pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2.156-2.165) y la serie pVL (Lucklow y Summers, 1989. Virology 170: 31-39). In some embodiments, a vector conducts protein expression in insect cells using baculovirus expression vectors. Baculovirus vectors available for protein expression in cultured insect cells (e.g., SF9 cells) include the pAc series (Smith, et al., 1983. Mol. Cell. Biol. 3: 2,156-2,165) and the pVL series (Lucklow and Summers, 1989. Virology 170: 31-39).

En algunas realizaciones, un vector es capaz de conducir la expresión de una o más secuencias en células de mamífero usando un vector de expresión de mamífero. Ejemplos de vectores de expresión de mamífero incluyen pCDM8 (Seed, 1987. Nature 329: 840) y pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). Cuando se usa en células de mamífero, las funciones de control del vector de expresión se proporcionan típicamente por uno o más elementos reguladores. Por ejemplo, los activadores usados comúnmente proceden de polioma, adenovirus 2, citomegalovirus, virus 40 de simio y otros descritos en la presente memoria y conocidos en la técnica. Para otros sistemas de expresión adecuados para células tanto procariotas como eucariotas véanse, por ejemplo, los Capítulos 16 y 17 de Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2ª ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989. In some embodiments, a vector is capable of conducting the expression of one or more sequences in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, 1987. Nature 329: 840) and pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). When used in mammalian cells, control functions of the expression vector are typically provided by one or more regulatory elements. For example, commonly used activators come from polyoma, adenovirus 2, cytomegalovirus, simian virus 40 and others described herein and known in the art. For other expression systems suitable for both prokaryotic and eukaryotic cells see, for example, Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A MANUAL LABORATORY. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989.

En algunas realizaciones, el vector de expresión de mamíferos recombinante es capaz de dirigir la expresión del ácido nucleico preferentemente en un tipo de célula particular (por ejemplo, se usan elementos reguladores específicos del tejido para expresar el ácido nucleico). Los elementos reguladores específicos del tejido son conocidos en la técnica. Ejemplos no limitantes de activadores específicos del tejido adecuados incluyen el activador de albúmina (específico del hígado; Pinkert, et al., 1987. Genes Dev. 1: 268-277), activadores específicos linfoides (Calame y Eaton, 1988. Adv. Immunol. 43: 235-275), en particular activadores de receptores de células T (Winoto y Baltimore, 1989. EMBO J. 8: 729-733) e inmunoglobulinas (Baneiji, et al., 1983. Cell 33: 729-740; Queen y Baltimore, 1983. Cell 33: 741-748), activadores específicos de las neuronas (por ej., el activador de neurofilamentos; Byrne y Ruddle, 1989. Proc. Natl. Acad Sci. USA 86: 5.473-5.477), activadores específicos del páncreas (Edlund, et al., 1985. Science 230: 912-916) y activadores específicos de las glándulas mamarias (por ej., activador de suero de In some embodiments, the recombinant mammalian expression vector is capable of directing the expression of the nucleic acid preferably in a particular cell type (for example, tissue-specific regulatory elements are used to express the nucleic acid). Fabric specific regulatory elements are known in the art. Non-limiting examples of suitable tissue-specific activators include the albumin activator (liver-specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), lymphoid-specific activators (Calame and Eaton, 1988. Adv. Immunol 43: 235-275), in particular T cell receptor activators (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) and immunoglobulins (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), specific neuron activators (e.g., neurofilament activator; Byrne and Ruddle, 1989. Proc. Natl. Acad Sci. USA 86: 5,473-5,477), specific activators of the pancreas (Edlund, et al., 1985. Science 230: 912-916) and specific activators of the mammary glands (eg, serum activator of

leche; Patente de EE.UU. Nº 4. 873. 316 y Publicación de la Solicitud de Patente Europea Nº 264.166). También se incluyen activadores regulados por el desarrollo, por ej., los activadores de hox de murina (Kessel y Gruss, 1990. Science 249: 374-379) y el activador de α-fetoproteína (Campes y Tilghman, 1989. Genes Dev. 3: 537-546). milk; U.S. Patent No. 4,873,316 and Publication of European Patent Application No. 264,166). Development-regulated activators are also included, eg, murine hox activators (Kessel and Gruss, 1990. Science 249: 374-379) and the α-fetoprotein activator (Campes and Tilghman, 1989. Genes Dev. 3: 537-546).

En algunas realizaciones, un elemento regulador se une de manera operable a uno o más elementos de un sistema CRISPR a fin de conducir la expresión de uno o más elementos del sistema CRISPR. En general, las CRISPR (Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas, por sus siglas en inglés), también conocidas como las SPIDR (Repeticiones Directas Intercaladas Separadas, por sus siglas en inglés), constituyen una familia de sitios de ADN que son normalmente específicos para una especie bacteriana particular. El sitio de CRISPR comprende una clase distinta de repeticiones de secuencias cortas intercaladas (las SSR, por sus siglas en inglés) que se reconocieron en E. coli (Ishino et al., J. Bacteriol., 169: 5.429-5.433 [1987] y Nakata et al., J. Bacteriol., 171: 3.553-3.556 [1989]) y genes asociados. Las SSR intercaladas similares han sido identificadas en Haloferax mediterranei, Streptococcus pyogenes, Anabaena y Mycobacterium tuberculosis (Véase, Groenen et al., Mol. Microbiol., 10: 1.057-1.065 [1993]; Hoe et al., Emerg. Infect. Dis., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1.307: 26-30 [1996] y Mojica et al., Mol. Microbiol., 17: 85-93 [1995]). El sitio de CRISPR difiere típicamente de las otras SSR por la estructura de las repeticiones, que se han denominado repeticiones espaciadas regularmente cortas (las SRSR, por sus siglas en inglés) (Janssen et al. OMICS J. Integ. Biol., 6: 23-33 [2002] y Mojica et al., Mol. Microbiol., 36: 244-246 [2000]). En general, las repeticiones son elementos cortos que tienen lugar en agrupaciones que están regularmente espaciadas por secuencias de intervención únicas con una longitud sustancialmente constante (Mojica et al., [2000], supra). Aunque las secuencias de repeticiones se conservan mucho entre cepas, el número de repeticiones intercaladas y las secuencias de las regiones espaciadoras difieren típicamente de cepa a cepa (van Embden et al., J. Bacteriol., 182: 2.393-2.401 [2000]). Se ha identificado el sitio de CRISPR en más de 40 procariotas (Véase por ej., Jansen et al., Mol. Microbiol., 43: 1.565-1.575 [2002] y Mojica et al., [2005]) incluyendo, pero no limitado a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus. Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella. Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pastaurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema y Thermotoga. In some embodiments, a regulatory element is operably linked to one or more elements of a CRISPR system in order to drive the expression of one or more elements of the CRISPR system. In general, CRISPR (Short Palindromic Repeats Grouped and Regularly Interspaced, for its acronym in English), also known as the SPIDR (Separate Direct Interleaved Repeats, for its acronym in English), constitute a family of DNA sites that are normally specific for a particular bacterial species. The CRISPR site comprises a distinct class of intercalated short sequence repeats (the SSRs) that were recognized in E. coli (Ishino et al., J. Bacteriol., 169: 5.429-5.433 [1987] and Nakata et al., J. Bacteriol., 171: 3,553-3,556 [1989]) and associated genes. Similar interleaved SSRs have been identified in Haloferax mediterranei, Streptococcus pyogenes, Anabaena and Mycobacterium tuberculosis (See, Groenen et al., Mol. Microbiol., 10: 1.057-1.065 [1993]; Hoe et al., Emerg. Infect. Dis ., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1,307: 26-30 [1996] and Mojica et al., Mol. Microbiol., 17: 85-93 [1995]). The CRISPR site typically differs from the other SSRs by the structure of the repetitions, which have been called regularly short spaced repetitions (the SRSRs) (Janssen et al. OMICS J. Integ. Biol., 6: 23-33 [2002] and Mojica et al., Mol. Microbiol., 36: 244-246 [2000]). In general, repetitions are short elements that occur in clusters that are regularly spaced by unique intervention sequences with a substantially constant length (Mojica et al., [2000], supra). Although repetition sequences are highly conserved among strains, the number of interleaved repetitions and the sequences of the spacer regions typically differ from strain to strain (van Embden et al., J. Bacteriol., 182: 2,393-2,401 [2000]) . The CRISPR site has been identified in more than 40 prokaryotes (See, e.g., Jansen et al., Mol. Microbiol., 43: 1,565-1,575 [2002] and Mojica et al., [2005]) including, but not limited to Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus. Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylobacterium, Staphylobacterium, Staphylobacterium, Staphylobacterium Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella. Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pastaurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema and Thermotoga.

En general, "sistema CRISPR" se refiere colectivamente a transcritos y otros elementos implicados en la expresión de o dirigidos a la actividad de genes asociados a CRISPR ("Cas"), incluyendo secuencias que codifican un gen Cas, una secuencia tracr (CRISPR trans-activante) (por ej., ARNtracr o un ARNtracr parcial activo), una secuencia de emparejamiento tracr (incluyendo una "repetición directa" y una repetición directa parcial tratada por ARNtracr en el contexto de un sistema CRISPR endógeno), una secuencia guía (también referida como un "espaciador" en el contexto de un sistema CRISPR endógeno) u otras secuencias y transcritos de un sitio CRISPR. En algunas realizaciones, uno o más elementos de un sistema CRISPR proceden de un sistema CRISPR tipo I, tipo II o tipo III. En algunas realizaciones, uno o más elementos de un sistema CRISPR proceden de un organismo particular que comprende un sistema CRISPR endógeno, tal como Streptococcus pyogenes. En general, un sistema CRISPR se caracteriza por elementos que activan la formación de un complejo CRISPR en el sitio de una secuencia objetivo (también referido como un protoespaciador en el contexto de un sistema CRISPR endógeno). En el contexto de formación de un complejo CRISPR, "secuencia objetivo" se refiere a una secuencia para la que se diseña una secuencia guía que presente complementariedad, donde la hibridación entre una secuencia objetivo y una secuencia guía active la formación de un complejo CRISPR. No se requiere necesariamente complementariedad completa, siempre que haya suficiente complementariedad para producir hibridación y activar la formación de un complejo CRISPR. Una secuencia objetivo puede comprender cualquier polinucleótido, tal como polinucleótidos de ADN o ARN. En algunas realizaciones, se sitúa una secuencia objetivo en el núcleo o citoplasma de una célula. En algunas realizaciones, la secuencia objetivo puede estar dentro de un organelo de una célula eucariota, por ejemplo, mitocondria o cloroplasto. Una secuencia o plantilla que se puede usar para recombinación en el sitio fijado como objetivo que comprende las secuencias objetivo se refiere como una “plantilla de edición” o “polinucleótido de edición” o “secuencia de edición”. En aspectos de la invención, un polinucleótido de plantilla exógeno se puede referir como una plantilla de edición. En un aspecto de la invención la recombinación es recombinación homóloga. In general, "CRISPR system" collectively refers to transcripts and other elements involved in the expression of or directed to the activity of genes associated with CRISPR ("Cas"), including sequences encoding a Cas gene, a tracr sequence (CRISPR trans -activating) (eg, ARNtracr or an active partial ARNtracr), a tracr pairing sequence (including a "direct repeat" and a partial direct repeat treated by RNAtracr in the context of an endogenous CRISPR system), a guiding sequence ( also referred to as a "spacer" in the context of an endogenous CRISPR system) or other sequences and transcripts of a CRISPR site. In some embodiments, one or more elements of a CRISPR system come from a CRISPR type I, type II or type III system. In some embodiments, one or more elements of a CRISPR system come from a particular organism comprising an endogenous CRISPR system, such as Streptococcus pyogenes. In general, a CRISPR system is characterized by elements that activate the formation of a CRISPR complex at the site of an objective sequence (also referred to as a proto-spacer in the context of an endogenous CRISPR system). In the context of the formation of a CRISPR complex, "objective sequence" refers to a sequence for which a guide sequence is designed that exhibits complementarity, where hybridization between an objective sequence and a guide sequence activates the formation of a CRISPR complex. Complete complementarity is not necessarily required, provided there is sufficient complementarity to produce hybridization and activate the formation of a CRISPR complex. An objective sequence may comprise any polynucleotide, such as DNA or RNA polynucleotides. In some embodiments, an objective sequence is located in the nucleus or cytoplasm of a cell. In some embodiments, the target sequence may be within an organelle of a eukaryotic cell, for example, mitochondria or chloroplast. A sequence or template that can be used for recombination at the target site comprising the target sequences is referred to as an "editing template" or "editing polynucleotide" or "editing sequence." In aspects of the invention, an exogenous template polynucleotide can be referred to as an editing template. In one aspect of the invention recombination is homologous recombination.

Típicamente, en el contexto de un sistema CRISPR endógeno, la formación de un complejo CRISPR (que comprende una secuencia guía hibridada a una secuencia objetivo y complejada con una o más proteínas Cas) da como resultado la escisión de una o más cadenas en o cerca de (por ej., dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 Typically, in the context of an endogenous CRISPR system, the formation of a CRISPR complex (comprising a guide sequence hybridized to an objective sequence and complexed with one or more Cas proteins) results in the cleavage of one or more chains at or near of (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50

o más pares de bases de) la secuencia objetivo. Sin desear estar limitados por la teoría, la secuencia tracr, que puede comprender o constar de toda o una porción de una secuencia tracr natural (por ej., aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia tracr natural), también puede formar parte de un complejo CRISPR, tal como por hibridación a lo largo de al menos una porción de la secuencia tracr a toda o una porción de una secuencia de emparejamiento tracr que esté ligada de manera operable a la secuencia guía. En algunas realizaciones, la secuencia tracr presenta suficiente complementariedad a una secuencia de emparejamiento tracr para hibridar y participar en la formación de un complejo CRISPR. Como con la or more base pairs of) the target sequence. Without wishing to be limited by theory, the tracr sequence, which may comprise or consist of all or a portion of a natural tracr sequence (e.g., about or more than about 20, 26, 32, 45, 48, 54, 63 , 67, 85 or more nucleotides of a natural tracr sequence), may also be part of a CRISPR complex, such as by hybridization along at least a portion of the tracr sequence to all or a portion of a tracr pairing sequence that is operably linked to the guide sequence. In some embodiments, the tracr sequence has sufficient complementarity to a tracr pairing sequence to hybridize and participate in the formation of a CRISPR complex. As with the

secuencia objetivo, se cree que no es necesaria la complementariedad completa, siempre que haya suficiente para que sea funcional. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% objective sequence, it is believed that complete complementarity is not necessary, provided there is enough to be functional. In some embodiments, the tracr sequence has at least 50%, 60%, 70%, 80%, 90%, 95%

o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. En algunas realizaciones, uno o más vectores que conducen la expresión de uno o más elementos de un sistema CRISPR se introducen en una célula huésped de manera que la expresión de los elementos del sistema CRISPR dirija la formación de un complejo CRISPR en uno o más sitios objetivo. Por ejemplo, una enzima Cas, una secuencia guía ligada a una secuencia de emparejamiento tracr y una secuencia tracr podían estar unidas cada una de manera operable a elementos reguladores separados en vectores separados. Alternativamente, dos o más de los elementos expresados de los mismos o diferentes elementos reguladores, se pueden combinar en un vector único, proporcionando uno o más vectores adicionales cualquier componente del sistema CRISPR no incluido en el primer vector. Los elementos del sistema CRISPR que se combinan en un único vector se pueden disponer en cualquier orientación adecuada, tal como un elemento situado en 5' con respecto a ("aguas arriba" de) o 3' con respecto a ("aguas abajo" de) un segundo elemento. La secuencia codificadora de un elemento puede estar situada en la misma cadena u opuesta de la secuencia codificadora de un segundo elemento y orientada en la misma dirección u opuesta. En algunas realizaciones, un activador único conduce la expresión de una transcripción que codifica una enzima CRISPR y una o más de la secuencia guía, la secuencia de emparejamiento tracr (opcionalmente ligada de manera operable a la secuencia guía) y una secuencia tracr embebida dentro de una o más secuencias intrón (por ej., cada una en un intrón diferente, dos o más en al menos un intrón o todas en un solo intrón). En algunas realizaciones, la enzima CRISPR, secuencia guía, secuencia de emparejamiento tracr y secuencia tracr se ligan de manera operable a, y se expresan a partir de, el mismo activador. or 99% sequence complementarity along the length of the tracr pairing sequence when aligned optimally. In some embodiments, one or more vectors that drive the expression of one or more elements of a CRISPR system are introduced into a host cell so that the expression of the elements of the CRISPR system directs the formation of a CRISPR complex at one or more sites. objective. For example, a Cas enzyme, a guide sequence linked to a tracr pairing sequence and a tracr sequence could each be operably linked to separate regulatory elements in separate vectors. Alternatively, two or more of the expressed elements of the same or different regulatory elements may be combined in a single vector, providing one or more additional vectors any component of the CRISPR system not included in the first vector. The elements of the CRISPR system that are combined in a single vector can be arranged in any suitable orientation, such as an element located 5 'with respect to ("upstream" of) or 3' with respect to ("downstream" of ) a second element. The coding sequence of an element may be located in the same or opposite chain of the coding sequence of a second element and oriented in the same or opposite direction. In some embodiments, a single activator conducts the expression of a transcript encoding a CRISPR enzyme and one or more of the guide sequence, the tracr pairing sequence (optionally operably linked to the guide sequence) and a tracr sequence embedded within one or more intron sequences (eg, each in a different intron, two or more in at least one intron or all in a single intron). In some embodiments, the CRISPR enzyme, guide sequence, tracr pairing sequence and tracr sequence are operably linked to, and expressed from, the same activator.

En algunas realizaciones, un vector comprende uno o más sitios de inserción, tal como una secuencia de reconocimiento de endonucleasa de restricción (también referido como un “sitio de clonación”). En algunas realizaciones, uno o más sitios de inserción (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios de inserción) están situados aguas arriba y/o aguas abajo de uno o más elementos de secuencia de uno o más vectores. En algunas realizaciones, un vector comprende un sitio de inserción aguas arriba de una secuencia de emparejamiento tracr y opcionalmente aguas abajo de un elemento regulador ligado de manera operable a la secuencia de emparejamiento tracr, de manera que después de la inserción de una secuencia guía en el sitio de inserción y en la expresión de la secuencia guía dirija la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo en una célula eucariota. En algunas realizaciones, un vector comprende dos o más sitios de inserción, estando situado cada sitio de inserción entre dos secuencias de emparejamiento tracr de manera que se permita la inserción de una secuencia guía en cada sitio. En dicha disposición, dos o más secuencias guía pueden comprender dos o más copias de una secuencia guía única, dos o más secuencias guía diferentes o combinaciones de éstas. Cuando se usan múltiples secuencias guía diferentes, se puede usar una construcción de expresión única para fijar como objetivo la actividad de CRISPR a múltiples secuencias objetivo correspondientes, diferentes, dentro de una célula. Por ejemplo, un solo vector puede comprender aproximadamente In some embodiments, a vector comprises one or more insertion sites, such as a restriction endonuclease recognition sequence (also referred to as a "cloning site"). In some embodiments, one or more insertion sites (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more insertion sites) are located upstream and / or downstream of one or more sequence elements of one or more vectors. In some embodiments, a vector comprises an insertion site upstream of a tracr pairing sequence and optionally downstream of a regulatory element operably linked to the tracr pairing sequence, such that after insertion of a guide sequence in the insertion site and in the expression of the guide sequence direct the specific binding of the sequence of a CRISPR complex to an objective sequence in a eukaryotic cell. In some embodiments, a vector comprises two or more insertion sites, each insertion site being located between two tracr pairing sequences so as to allow insertion of a guide sequence at each site. In said arrangement, two or more guide sequences may comprise two or more copies of a single guide sequence, two or more different guide sequences or combinations thereof. When multiple different guide sequences are used, a single expression construct can be used to target CRISPR activity to multiple corresponding, different target sequences within a cell. For example, a single vector may comprise approximately

o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 o más secuencias guía. En algunas realizaciones, se pueden proporcionar aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más de tales vectores que contienen secuencia guía y se suministran opcionalmente a una célula. or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 or more guide sequences. In some embodiments, about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more of such vectors containing a guide sequence and optionally supplied to a cell can be provided.

En algunas realizaciones, un vector comprende un elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica una enzima CRISPR, tal como una proteína Cas. Ejemplos no limitantes de proteínas Cas incluyen Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (también conocidas como Csn1 y Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homólogos de las mismas o versiones modificadas de las mismas. Estas enzimas son conocidas; por ejemplo, la secuencia de aminoácidos de proteína Cas9 de S. pyogenes se puede encontrar en la base de datos SwissProt con el número de acceso Q99ZW2. En algunas realizaciones, la enzima CRISPR no modificada presenta actividad de escisión de ADN, tal como Cas9. En algunas realizaciones la enzima CRISPR es Cas9 y puede ser Cas9 de S. pyogenes o S. pneumoniae. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o más cadenas en la posición de una secuencia objetivo, tal como dentro de la secuencia objetivo y/o dentro del complemento de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o más cadenas dentro de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 o más pares de bases del primer o el último nucleótido de una secuencia objetivo. En algunas realizaciones, un vector codifica una enzima CRISPR que muta con respecto a una enzima natural correspondiente de manera que la enzima CRISPR mutadas carece de la capacidad para escindir una o ambas cadenas de un polinucleótido objetivo que contiene una secuencia objetivo. Por ejemplo, una sustitución de aspartato a alanina (D10A) en el dominio catalítico RuvC I de Cas9 de S. pyogenes convierte Cas9 de una nucleasa que escinde dos cadenas en una nickasa (escinde una única cadena). Otros ejemplos de mutaciones que hacen Cas9 una nickasa incluyen, sin limitación, H840A, N854A y N863A. En algunas realizaciones, se puede usar una nickasa de Cas9 junto con secuencia o secuencias guía, por ejemplo, dos secuencias guía, que fijan como objetivo cadenas transcrita y complementaria, respectivamente, del objetivo de ADN. Esta combinación permite que ambas cadenas sean nickeadas y usadas para inducir NHEJ. Los solicitantes han demostrado (datos no mostrados) la eficacia de dos objetivos de nickasa (es decir, los ARNsg fijados como objetivo en la misma posición pero para diferentes cadenas de ADN) en la inducción de NHEJ In some embodiments, a vector comprises a regulatory element operably linked to an enzyme coding sequence encoding a CRISPR enzyme, such as a Cas protein. Non-limiting examples of Cas proteins include Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2 , Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx3, Csx3, Csx3, Csx3, Csx3, Csx3, Csx3 , Csf3, Csf4, their counterparts or modified versions thereof. These enzymes are known; for example, the amino acid sequence of S. pyogenes Cas9 protein can be found in the SwissProt database with the accession number Q99ZW2. In some embodiments, the unmodified CRISPR enzyme exhibits DNA cleavage activity, such as Cas9. In some embodiments, the CRISPR enzyme is Cas9 and may be Cas9 of S. pyogenes or S. pneumoniae. In some embodiments, the CRISPR enzyme directs the cleavage of one or more chains at the position of an objective sequence, such as within the objective sequence and / or within the complement of the objective sequence. In some embodiments, the CRISPR enzyme directs the cleavage of one or more chains within about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 or more base pairs of the first or last nucleotide of an objective sequence. In some embodiments, a vector encodes a CRISPR enzyme that mutates with respect to a corresponding natural enzyme so that the mutated CRISPR enzyme lacks the ability to cleave one or both chains of a target polynucleotide that contains an objective sequence. For example, a substitution of aspartate to alanine (D10A) in the catalytic domain RuvC I of Cas9 of S. pyogenes converts Cas9 from a nuclease that cleaves two chains into a nickase (cleaves a single chain). Other examples of mutations that make Cas9 a nickasa include, without limitation, H840A, N854A and N863A. In some embodiments, a Cas9 nickasa may be used in conjunction with sequence or guide sequences, for example, two guide sequences, which target transcribed and complementary strands, respectively, of the DNA target. This combination allows both chains to be nickened and used to induce NHEJ. Applicants have demonstrated (data not shown) the effectiveness of two nickasa targets (ie, the RNAs set as targets in the same position but for different DNA strands) in the induction of NHEJ

mutagénico. Una única nickasa (Cas9-D10A con un único ARNsg) es incapaz de inducir NHEJ y crear inserciones o supresiones (las indel) pero los Solicitantes han demostrado que la nickasa doble (Cas9-D10A y dos ARNsg fijados como objetivo a diferentes cadenas en la misma posición) lo puede hacer en células madre embrionarias humanas (las hESC, por sus siglas en inglés). La eficacia es aproximadamente 50% de nucleasa (es decir, Cas9 regular sin mutación D10) en las hESC. mutagenic A single nickasa (Cas9-D10A with a single ARNsg) is unable to induce NHEJ and create insertions or deletions (the indel) but Applicants have demonstrated that the double nickasa (Cas9-D10A and two ARNsg target different chains in the same position) you can do it in human embryonic stem cells (the hESC). The efficacy is approximately 50% nuclease (ie, regular Cas9 without D10 mutation) in hESC.

Como un ejemplo más, dos o más dominios catalíticos de Cas9 (RuvC I, RuvC II y RuvC III) pueden mutar para producir un Cas9 mutado que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, una mutación de D10A se combina con una o más de las mutaciones H840A, N854A o N863A para producir una enzima Cas9 que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, se considera que una enzima CRISPR carece sustancialmente de toda actividad de escisión de ADN cuando la actividad de escisión de ADN de la enzima mutada es menor que aproximadamente 25%, 10%, 5%, 1%, 0,1%, 0,01% o menor con respecto a su forma no mutada. Pueden ser útiles otras mutaciones; en el caso de que la Cas9 u otra enzima CRISPR sea de una especie distinta de S. pyogenes, se pueden realizar mutaciones en los correspondientes aminoácidos para conseguir efectos similares. As a further example, two or more catalytic domains of Cas9 (RuvC I, RuvC II and RuvC III) may mutate to produce a mutated Cas9 that substantially lacks all DNA cleavage activity. In some embodiments, a D10A mutation is combined with one or more of the H840A, N854A or N863A mutations to produce a Cas9 enzyme that substantially lacks all DNA cleavage activity. In some embodiments, a CRISPR enzyme is considered to be substantially devoid of all DNA cleavage activity when the DNA cleavage activity of the mutated enzyme is less than about 25%, 10%, 5%, 1%, 0.1% , 0.01% or less with respect to its non-mutated form. Other mutations may be useful; in the event that Cas9 or another CRISPR enzyme is from a species other than S. pyogenes, mutations can be made in the corresponding amino acids to achieve similar effects.

En algunas realizaciones, una secuencia codificadora de enzimas que codifica una enzima CRISPR es codón optimizada para expresión en células particulares, tales como células eucariotas. Las células eucariotas pueden ser aquéllas de, o procedentes de, un organismo particular, tal como un mamífero, incluyendo, pero no limitado a, ser humano, ratón, rata, conejo, perro o primate no ser humano. En general, optimización de codón se refiere a un procedimiento para modificar una secuencia de ácidos nucleicos para mejorar la expresión en las células huésped de interés reemplazando al menos un codón (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más codones) de la secuencia natural con codones que se usan más frecuentemente o lo más frecuentemente en los genes de esa célula huésped al tiempo que se mantiene la secuencia de aminoácidos natural. Diversas especies presentan sesgo particular para ciertos codones de un aminoácido particular. El sesgo de codones (diferencias en el uso de codones entre organismos) con frecuencia se correlaciona con la eficacia de traducción de ARN mensajero (ARNm), que se cree a su vez que depende de, entre otras cosas, las propiedades de los codones que se están traduciendo y la disponibilidad de moléculas de ARN de transferencia (ARNt) particulares. La predominancia de los ARNt seleccionados en una célula es en general un reflejo de los codones usados lo más frecuentemente en síntesis de péptidos. De acuerdo con esto, se pueden adaptar los genes para expresión óptima de los genes en un organismo determinado basándose en optimización de codones. Las tablas de utilización de codones están fácilmente disponibles, por ejemplo, en la “Base de Datos de Uso de Codones” y estas tablas se pueden adaptar de una serie de maneras. Véase Nakamura Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2000). También están disponibles algoritmos de ordenador para codones optimizando una secuencia particular para expresión en una célula huésped particular, también están disponibles tales como Gene Forge (Aptagen; Jacobus, PA). En algunas realizaciones, uno In some embodiments, an enzyme coding sequence encoding a CRISPR enzyme is codon optimized for expression in particular cells, such as eukaryotic cells. Eukaryotic cells may be those of, or from, a particular organism, such as a mammal, including, but not limited to, human, mouse, rat, rabbit, dog or primate not to be human. In general, codon optimization refers to a method for modifying a nucleic acid sequence to improve expression in host cells of interest by replacing at least one codon (e.g., about or more than about 1, 2, 3, 4 , 5, 10, 15, 20, 25, 50 or more codons) of the natural sequence with codons that are used most frequently or most frequently in the genes of that host cell while maintaining the natural amino acid sequence. Various species have particular bias for certain codons of a particular amino acid. Codon bias (differences in the use of codons between organisms) is often correlated with the translation efficiency of messenger RNA (mRNA), which in turn is believed to depend on, among other things, the properties of codons that are being translated and the availability of particular transfer RNA molecules (tRNAs). The predominance of selected tRNAs in a cell is in general a reflection of the codons most frequently used in peptide synthesis. Accordingly, genes can be adapted for optimal expression of genes in a given organism based on codon optimization. Codon usage tables are readily available, for example, in the "Codon Use Database" and these tables can be adapted in a number of ways. See Nakamura Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2000). Computer algorithms for codons are also available optimizing a particular sequence for expression in a particular host cell, also available as Gene Forge (Aptagen; Jacobus, PA). In some embodiments, one

o más codones (por ej., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más o todos los codones) en una secuencia codificando una enzima CRISPR corresponden al codón usado lo más frecuentemente para un aminoácido particular. or more codons (e.g., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more or all codons) in a sequence encoding a CRISPR enzyme correspond to the codon most frequently used for a particular amino acid

En algunas realizaciones, un vector codifica una enzima CRISPR que comprende una o más secuencias de localización nuclear (las NLS, por sus siglas en inglés), tales como aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS. En algunas realizaciones, la enzima CRISPR comprende aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del amino terminal, aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del carboxi terminal o una combinación de éstos (por ejemplo, una o más NLS en el amino terminal y una o más NLS en el carboxi terminal). Cuando está presente más de una NLS, cada una se puede seleccionar independientemente de las otras, de manera que puede estar presente una sola NLS en más de una copia y/o junto con otra u otras NLS más presentes en una o más copias. En una realización preferida de la descripción, la enzima CRISPR comprende a lo sumo 6 NLS. En algunas realizaciones, se considera una NLS cerca del N-o C-terminal cuando el aminoácido más cercano de la NLS está dentro de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 o más aminoácidos a lo largo de la cadena polipeptídica del N o C-terminal. Típicamente, una NLS consta de una o más secuencias cortas de lisinas o argininas cargadas positivamente expuestas en la superficie de la proteína, pero se conocen otros tipos de NLS. Ejemplos no limitantes de las NLS incluyen una secuencia de NLS procedente de: la NLS del antígeno T grande del virus SV40, que tiene la secuencia de aminoácidos PKKKRKV; la NLS de nucleoplasmina (por ej., la NLS bipartita de nucleoplasmina con la secuencia KRPAATKKAGQAKKKK); la NLS de c-myc que tiene la secuencia de aminoácidos PAAKRVKLD o RQRRNELKRSP; la NLS M9 del hRNPA1 que tiene la secuencia NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; la secuencia RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV del dominio IBB de importina-alfa; las secuencias VSRKRPRP y PPKKARED de la proteína T de mioma; la secuencia POPKKKPL de p53 humano; la secuencia SALIKKKKKMAP de c-abl IV de ratón; las secuencias DRLRR y PKQKKRK del virus de la influenza NS1; la secuencia RKLKKKIKKL del antígeno delta del virus de la Hepatitis; la secuencia REKKKFLKRR de la proteína Mx1 del ratón; la secuencia KRKGDEVDGVDEVAKKKSKK de la poli(ADP-ribosa) polimerasa humana y la secuencia RKCLQAGMNLEARKTKK del glucocorticoide de receptores de hormonas esteroideas (humano). In some embodiments, a vector encodes a CRISPR enzyme that comprises one or more nuclear localization sequences (the NLS), such as about or more than about 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10 or more NLS. In some embodiments, the CRISPR enzyme comprises about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the amino terminal, about or more than about 1.2. , 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the carboxy terminal or a combination of these (for example, one or more NLS in the amino terminal and one or more NLS in the carboxy terminal). When more than one NLS is present, each can be selected independently of the others, so that a single NLS can be present in more than one copy and / or together with another or other NLS more present in one or more copies. In a preferred embodiment of the description, the CRISPR enzyme comprises at most 6 NLS. In some embodiments, an NLS near the Non-C-terminal is considered when the closest amino acid in the NLS is within about 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 or more amino acids along the N or C-terminal polypeptide chain. Typically, an NLS consists of one or more short sequences of positively charged lysines or arginines exposed on the surface of the protein, but other types of NLS are known. Non-limiting examples of the NLS include a sequence of NLS from: the NLS of the large T antigen of the SV40 virus, which has the amino acid sequence PKKKRKV; the nucleoplasmin NLS (eg, the bipartite nucleoplasmin NLS with the sequence KRPAATKKAGQAKKKK); c-myc NLS having the amino acid sequence PAAKRVKLD or RQRRNELKRSP; the NLS M9 of hRNPA1 having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; the RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV sequence of the import-alpha IBB domain; the VSRKRPRP and PPKKARED sequences of the myoma T protein; the POPKKKPL sequence of human p53; the SALIKKKKKMAP sequence of mouse c-abl IV; the DRLRR and PKQKKRK sequences of the NS1 influenza virus; the RKLKKKIKKL sequence of the Hepatitis virus delta antigen; the REKKKFLKRR sequence of the mouse Mx1 protein; the KRKGDEVDGVDEVAKKKSKK sequence of the human poly (ADP-ribose) polymerase and the RKCLQAGMNLEARKTKK sequence of the glucocorticoid steroid hormone receptor (human).

En general, una o más NLS son de suficiente fortaleza para conducir la acumulación de la enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En general, la fortaleza de actividad de localización nuclear puede proceder del número de las NLS en la enzima CRISPR, la o las NLS particulares usadas o una combinación de estos factores. La detección de acumulación en el núcleo se puede realizar por cualquier técnica adecuada. Por ejemplo, se puede condensar un marcador detectable a la enzima CRISPR, de manera que se pueda visualizar la localización dentro de una célula, tal como junto con un medio para detectar la localización del núcleo (por ejemplo, una mancha específica para el núcleo tal como DAPI). Ejemplos de marcadores detectables incluyen proteínas fluorescentes (tales como proteínas fluorescentes Verdes o GFP; RFP; CFP) y etiquetas de epítopos (etiqueta HA, etiqueta bandera, etiqueta SNAP). También se pueden aislar los núcleos celulares de las células, los contenidos de los cuales se pueden analizar después por cualquier procedimiento adecuado para detectar proteína, tal como immunohistoquímica, ensayo de Western o ensayo de actividad enzimática. La acumulación en el núcleo también se puede determinar de una manera indirecta, tal como por un ensayo para el efecto de la formación de complejo CRISPR (por ejemplo, ensayo para escisión de ADN o mutación en la secuencia objetivo o ensayo para actividad de expresión de genes modificada afectada por la formación de complejo CRISPR y/o actividad de la enzima CRISPR), cuando se compara con un control no expuesto a la enzima o complejo CRISPR o expuesto a una enzima CRISPR que carece de una o más NLS. In general, one or more NLSs are of sufficient strength to drive the accumulation of the CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In general, the strength of nuclear localization activity may come from the number of NLS in the CRISPR enzyme, the particular NLS or used or a combination of these factors. The detection of accumulation in the nucleus can be performed by any suitable technique. For example, a detectable marker can be condensed to the CRISPR enzyme, so that the location within a cell can be visualized, such as together with a means to detect the location of the nucleus (for example, a specific spot for the nucleus such as DAPI). Examples of detectable markers include fluorescent proteins (such as Green or GFP fluorescent proteins; RFP; CFP) and epitope tags (HA tag, flag tag, SNAP tag). Cell nuclei can also be isolated from cells, the contents of which can then be analyzed by any suitable method to detect protein, such as immunohistochemistry, Western assay or enzyme activity assay. The accumulation in the nucleus can also be determined indirectly, such as by an assay for the effect of CRISPR complex formation (eg, assay for DNA cleavage or mutation in the target sequence or assay for expression activity of modified genes affected by the formation of CRISPR complex and / or activity of the CRISPR enzyme), when compared to a control not exposed to the enzyme or CRISPR complex or exposed to a CRISPR enzyme that lacks one or more NLS.

En general, una secuencia guía es cualquier secuencia de polinucleótidos que tiene suficiente complementariedad con una secuencia de polinucleótidos objetivo para hibridación con la secuencia objetivo y dirigir la unión específica de la secuencia de un complejo CRISPR a la secuencia objetivo. En algunas realizaciones, el grado de complementariedad entre una secuencia guía y su correspondiente secuencia objetivo, cuando se alinean de manera óptima usando un algoritmo de alineación adecuado, es aproximadamente o más de aproximadamente 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% o más. La alineación óptima se puede determinar con el uso de cualquier algoritmo adecuado para alinear secuencias, ejemplo no limitante de lo cual incluye el algoritmo Smith-Waterman, el algoritmo Needleman-Wunsch, los algoritmos basados en la transformación de Burrows-Wheeler (por ej., el Alineador de Burrows Wheeler), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies, ELAND (Illumina, San Diego, CA), SOAP (disponible en soap.genomics.org.cn) y Maq (disponible en maq.sourceforge.net). En algunas realizaciones, una secuencia guía es aproximadamente o más de aproximadamente 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 o más nucleótidos de longitud. En algunas realizaciones, una secuencia guía es menor que aproximadamente 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 o menos nucleótidos de longitud. La capacidad de una secuencia guía para dirigir la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo se puede evaluar por cualquier prueba adecuada. Por ejemplo, los componentes de un sistema CRISPR suficientes para formar un complejo CRISPR, incluyendo la secuencia guía que se tiene que ensayar, se pueden proporcionar a una célula huésped que tenga la correspondiente secuencia objetivo, tal como por transinfección con vectores que codifiquen los componentes de la secuencia CRISPR, seguido por una evaluación de la escisión preferente dentro de la secuencia objetivo, tal como mediante ensayo Surveyor como se describe en la presente memoria. De manera similar, la escisión de una secuencia de polinucleótidos objetivo se puede evaluar en un tubo de ensayo proporcionando la secuencia objetivo, los componentes de un complejo CRISPR, incluyendo la secuencia guía que se tiene que ensayar y una secuencia guía de control diferente de la secuencia guía de ensayo y comparando la unión o velocidad de escisión en la secuencia objetivo entre las reacciones de la secuencia guía de ensayo y de control. Son posibles otros ensayos, y tendrán lugar para los expertos en la materia. In general, a guide sequence is any polynucleotide sequence that has sufficient complementarity with a target polynucleotide sequence for hybridization with the target sequence and directs the specific binding of the sequence of a CRISPR complex to the target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence, when optimally aligned using a suitable alignment algorithm, is approximately or more than about 50%, 60%, 75%, 80%, 85 %, 90%, 95%, 97.5%, 99% or more. The optimal alignment can be determined with the use of any suitable algorithm for aligning sequences, a non-limiting example of which includes the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, the algorithms based on the Burrows-Wheeler transformation (eg. , Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies, ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn) and Maq (available at maq.sourceforge .net) In some embodiments, a guide sequence is about or more than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 , 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides in length In some embodiments, a guide sequence is less than about 75, 50, 45, 40, 35, 30, 25 , 20, 15, 12 or less nucleotides in length.The ability of a guide sequence to direct the specific binding of the sequence of a CRISPR complex to a sequence The objective can be assessed by any suitable test. For example, components of a CRISPR system sufficient to form a CRISPR complex, including the guide sequence to be tested, can be provided to a host cell having the corresponding target sequence, such as by transfection with vectors encoding the components. of the CRISPR sequence, followed by an evaluation of the preferential cleavage within the target sequence, such as by Surveyor assay as described herein. Similarly, the cleavage of a target polynucleotide sequence can be evaluated in a test tube by providing the target sequence, the components of a CRISPR complex, including the guide sequence to be tested and a control guide sequence different from the test guide sequence and comparing the binding or cleavage rate in the target sequence between the reactions of the test and control guide sequence. Other trials are possible, and will take place for those skilled in the art.

Se puede seleccionar una secuencia guía para fijar como objetivo cualquier secuencia objetivo. En algunas realizaciones, la secuencia objetivo es una secuencia dentro de un genoma de una célula. Las secuencias objetivo ejemplares incluyen aquéllas que son únicas en el genoma objetivo. Por ejemplo, para la Cas9 de S. pyogenes, una secuencia objetivo única en un genoma puede incluir un sitio objetivo de Cas9 de la forma MMMMMMMMNNNNNNNNNNNNXGG donde NNNNNNNNNNNNXGG (N es A, G, T o C y X puede ser cualquiera) presenta un solo caso en el genoma. Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de S. pyogenes de la forma MMMMMMMMMNNNNNNNNNNNXGG donde NNNNNNNNNNNXGG (N es A, G, T o C y X puede ser cualquiera) presenta un solo caso en el genoma. Para la Cas9 de CRISPR1 de S. thermophilus, una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de la forma MMMMMMMMNNNNNNNNNNNNXXAGAAW donde NNNNNNNNNNNNXXAGAAW (N es A, G, T o C; X puede ser cualquiera y W es A o T) presenta un solo caso en el genoma. Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de CRISPR1 de S. thermophilus de la forma MMMMMMMMMNNNNNNNNNNNXXAGAAW donde NNNNNNNNNNNXXAGAAW (N es A, G, T o C; X puede ser cualquiera y W es A o T) presenta un solo caso en el genoma. Para la Cas9 de S. pyogenes, una sola secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de la forma MMMMMMMMNNNNNNNNNNNNXGGXG donde NNNNNNNNNNNNXGGXG (N es A, G, T o C y X puede ser cualquiera) presenta un solo caso en el genoma. Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de S. pyogenes de la forma MMMMMMMMNMNNNNNNNNNNXGGXG donde NNNNNNNNNNNXGGXG (N es A, G, T o C y X puede ser cualquiera) presenta un único caso en el genoma. En cada una de estas secuencias "M" puede ser A, G, T o C y requiere que no se considere en la identificación de una secuencia como única. A guide sequence can be selected to target any target sequence. In some embodiments, the target sequence is a sequence within a genome of a cell. Exemplary target sequences include those that are unique in the target genome. For example, for S. pyogenes Cas9, a unique target sequence in a genome can include a Cas9 target site of the MMMMMMMMNNNNNNNNNNNNXGG form where NNNNNNNNNNNNXGG (N is A, G, T or C and X can be any) has only one case in the genome. A single target sequence in a genome can include a S. pyogenes Cas9 target site of the MMMMMMMMMNNNNNNNNNNNXGG form where NNNNNNNNNNNXGG (N is A, G, T or C and X can be any) presents a single case in the genome. For Cas9 of CRISPR1 of S. thermophilus, a single target sequence in a genome may include a target site of Cas9 of the form MMMMMMMMNNNNNNNNNNNNXXAGAAW where NNNNNNNNNNNNXXAGAAW (N is A, G, T or C; X can be any and W is A or W T) presents a single case in the genome. A single objective sequence in a genome can include a S. thermophilus CR9PR1 Cas9 target site of the form MMMMMMMMMNNNNNNNNNNNXXAGAAW where NNNNNNNNNNNXXAGAAW (N is A, G, T or C; X can be any and W is A or T) Only case in the genome. For S. pyogenes Cas9, a single target sequence in a genome can include a Cas9 target site in the form MMMMMMMMNNNNNNNNNNNNXGGXG where NNNNNNNNNNNNXGGXG (N is A, G, T or C and X can be any) presents a single case in the genome A single target sequence in a genome can include a S. pyogenes Cas9 target site of the form MMMMMMMMNMNNNNNNNNNNXGGXG where NNNNNNNNNNNXGGXG (N is A, G, T or C and X may be any) presents a single case in the genome. In each of these sequences "M" can be A, G, T or C and requires that it not be considered in the identification of a sequence as unique.

En algunas realizaciones, se selecciona una secuencia guía para reducir el grado de estructura secundaria dentro de la secuencia guía. La estructura secundaria se puede determinar por cualquier algoritmo de plegamiento de polinucleótidos adecuado. Algunos programas se basan en calcular la energía libre mínima de Gibbs. Un ejemplo de uno de tales algoritmos es mFold, como se describe por Zuker y Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Otro algoritmo de plegamiento de ejemplo es el RNAfold webserver online, desarrollado en el Instituto para Química Teórica de la Universidad de Viena, usando el algoritmo de predicción de estructura centroide (véase por ej., A. R. Gruber et al., 2008, Cell 106 (1): 23-24 y PA Carr y GM Church, 2009, Nature Biotechnology 27 (12): 1.151-62). In some embodiments, a guide sequence is selected to reduce the degree of secondary structure within the guide sequence. The secondary structure can be determined by any suitable polynucleotide folding algorithm. Some programs are based on calculating the minimum free energy of Gibbs. An example of one such algorithm is mFold, as described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example folding algorithm is the RNAfold webserver online, developed at the Institute for Theoretical Chemistry of the University of Vienna, using the prediction algorithm of centroid structure (see e.g., AR Gruber et al., 2008, Cell 106 ( 1): 23-24 and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1,151-62).

En general, una secuencia de emparejamiento tracr incluye cualquier secuencia que presente suficiente complementariedad con una secuencia tracr para activar uno o más de: (1) escisión de una secuencia guía flanqueada por secuencias de emparejamiento tracr en una célula que contiene la correspondiente secuencia tracr y In general, a tracr pairing sequence includes any sequence that has sufficient complementarity with a tracr sequence to activate one or more of: (1) cleavage of a guide sequence flanked by tracr pairing sequences in a cell containing the corresponding tracr sequence and

(2) formación de un complejo CRISPR en una secuencia objetivo, en la que el complejo CRISPR comprende la secuencia de emparejamiento tracr hibridada a la secuencia tracr. En general, el grado de complementariedad es con referencia al alineamiento óptimo de la secuencia de emparejamiento tracr y la secuencia tracr, junto con la longitud del acortador de las dos secuencias. El alineamiento óptimo se puede determinar por cualquier algoritmo de alineamiento adecuado y puede justificar además estructuras secundarias, tal como autocomplementareidad dentro de cualquiera, la secuencia tracr o la secuencia de emparejamiento tracr. En algunas realizaciones, el grado de complementariedad entre la secuencia tracr y la secuencia de emparejamiento tracr junto con la longitud del acortador de las dos cuando se alinean de manera óptima es aproximadamente o más de aproximadamente 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% o mayor. Las ilustraciones de ejemplo de alineación óptima entre una secuencia tracr y una secuencia de emparejamiento tracr se proporcionan en las Figuras 12B y 13B. En algunas realizaciones, la secuencia tracr es aproximadamente o más de aproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 o más nucleótidos de longitud. En algunas realizaciones, la secuencia tracr y secuencia de emparejamiento tracr están contenidas dentro de un transcripto único, de manera que la hibridación entre las dos produce un transcripto con una estructura secundaria, tal como una horquilla. Las secuencias formadoras de bucle preferidas para uso en estructuras de horquilla tienen cuatro nucleótidos de longitud y lo más preferiblemente tienen la secuencia GAAA. Sin embargo, se pueden usar secuencias de bucle más largas o más cortas, como se pueden usar secuencias alternativas. Las secuencias incluyen preferiblemente un triplete nucleótido (por ejemplo, AAA) y un nucleótido adicional (por ejemplo, C o G). Ejemplos de secuencias formadoras de bucle incluyen CAAA y AAAG. En una realización de la invención, el transcripto o secuencia de polinucleótidos transcrita presenta al menos dos o más horquillas. En realizaciones preferidas, el transcripto presenta dos, tres, cuatro o cinco horquillas. En una realización más de la invención, el transcripto presenta a lo sumo cinco horquillas. En algunas realizaciones, el transcripto único incluye además una secuencia de terminación de la transcripción; preferiblemente esta es una secuencia poliT, por ejemplo, seis nucleótidos T. Una ilustración de ejemplo de dicha estructura de horquilla se proporciona en la porción inferior de la Figura 13B, donde la porción de la secuencia 5' del "N" final y aguas arriba del bucle corresponde a la secuencia de emparejamiento tracr y la porción de la secuencia 3' del bucle corresponde a la secuencia tracr. Ejemplos no limitantes adicionales de polinucleótidos únicos que comprenden una secuencia guía, una secuencia de emparejamiento tracr y una secuencia tracr son como sigue (enumerados 5' a 3'), donde "N" representa una base de una secuencia guía, el primer bloque de letras de la caja inferior representan la secuencia de emparejamiento tracr y el segundo bloque de letras de la caja inferior representa la secuencia tracr y la secuencia poli-T final representa el terminador de la transcripción: (1) (2) formation of a CRISPR complex in an objective sequence, in which the CRISPR complex comprises the tracr pairing sequence hybridized to the tracr sequence. In general, the degree of complementarity is with reference to the optimal alignment of the tracr pairing sequence and the tracr sequence, together with the shortening length of the two sequences. The optimal alignment can be determined by any suitable alignment algorithm and can also justify secondary structures, such as autocomplementarity within either the tracr sequence or the tracr pairing sequence. In some embodiments, the degree of complementarity between the tracr sequence and the tracr pairing sequence together with the length of the shortening of the two when aligned optimally is approximately or more than about 25%, 30%, 40%, 50% , 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or greater. Example illustrations of optimal alignment between a tracr sequence and a tracr pairing sequence are provided in Figures 12B and 13B. In some embodiments, the tracr sequence is about or more than about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40 , 50 or more nucleotides in length. In some embodiments, the tracr sequence and tracr pairing sequence are contained within a single transcript, so that hybridization between the two produces a transcript with a secondary structure, such as a hairpin. Preferred loop-forming sequences for use in hairpin structures are four nucleotides in length and most preferably have the GAAA sequence. However, longer or shorter loop sequences can be used, as alternative sequences can be used. The sequences preferably include a nucleotide triplet (for example, AAA) and an additional nucleotide (for example, C or G). Examples of loop-forming sequences include CAAA and AAAG. In one embodiment of the invention, the transcript or transcript polynucleotide sequence has at least two or more hairpins. In preferred embodiments, the transcript has two, three, four or five hairpins. In a further embodiment of the invention, the transcript has at most five forks. In some embodiments, the single transcript also includes a transcription termination sequence; preferably this is a polyT sequence, for example, six T nucleotides. An example illustration of said hairpin structure is provided in the lower portion of Figure 13B, where the portion of the 5 'sequence of the final and upstream "N" of the loop corresponds to the tracr pairing sequence and the portion of the 3 'sequence of the loop corresponds to the tracr sequence. Additional non-limiting examples of single polynucleotides comprising a guide sequence, a tracr pairing sequence and a tracr sequence are as follows (listed 5 'to 3'), where "N" represents a base of a guide sequence, the first block of Lower box letters represent the tracr pairing sequence and the second block of letters in the lower box represents the tracr sequence and the final poly-T sequence represents the transcription terminator: (1)

En algunas realizaciones, las secuencias (1) a (3) se usan junto con Cas9 de CRISPR1 de S. thermophilus. En algunas realizaciones, las secuencias (4) a (6) se usan junto con Cas9 de S. pyogenes. En algunas realizaciones, la secuencia tracr es un transcrito separado de un transcrito que comprende la secuencia de emparejamiento tracr (tal como se ilustra en la porción superior de la Figura 13B). In some embodiments, sequences (1) to (3) are used in conjunction with Cas9 of CRISPR1 from S. thermophilus. In some embodiments, sequences (4) to (6) are used together with Cas9 of S. pyogenes. In some embodiments, the tracr sequence is a separate transcript of a transcript comprising the tracr pairing sequence (as illustrated in the upper portion of Figure 13B).

En algunas realizaciones, también se proporciona una plantilla de recombinación. Una plantilla de recombinación puede ser un componente de otro vector como se describe en la presente memoria, contenido en un vector separado o proporcionado como un polinucleótido separado. En algunas realizaciones, se diseña una plantilla de recombinación para servir como una plantilla en recombinación homóloga, tal como dentro de o cerca de una secuencia objetivo nickeada o escindida por una enzima CRISPR como parte de un complejo CRISPR. Un polinucleótido de plantilla puede ser de cualquier longitud adecuada, tal como aproximadamente o más aproximadamente 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1.000 o más nucleótidos de longitud. En algunas realizaciones, el polinucleótido de plantilla es complementario a una porción de un polinucleótido que comprende la secuencia objetivo. Cuando se alinea de manera óptima, un polinucleótido de plantilla puede solaparse con uno o más nucleótidos de una secuencia objetivo (por ej., aproximadamente o más de aproximadamente 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 o más nucleótidos). En algunas realizaciones, cuando una secuencia de plantilla y un polinucleótido que comprende una secuencia de plantilla se alinean de manera óptima, el nucleótido más cercano del polinucleótido de plantilla está dentro de aproximadamente 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1.000, 5.000, 10.000 o más nucleótidos de la secuencia objetivo. In some embodiments, a recombination template is also provided. A recombination template can be a component of another vector as described herein, contained in a separate vector or provided as a separate polynucleotide. In some embodiments, a recombination template is designed to serve as a homologous recombination template, such as within or near a target sequence nickeated or cleaved by a CRISPR enzyme as part of a CRISPR complex. A template polynucleotide can be of any suitable length, such as about or more or about 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1,000 or more nucleotides in length. In some embodiments, the template polynucleotide is complementary to a portion of a polynucleotide comprising the target sequence. When optimally aligned, a template polynucleotide can overlap with one or more nucleotides of a target sequence (e.g., about or more than about 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 or more nucleotides). In some embodiments, when a template sequence and a polynucleotide comprising a template sequence are optimally aligned, the closest nucleotide of the template polynucleotide is within about 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1,000, 5,000, 10,000 or more nucleotides of the target sequence.

En algunas realizaciones, la enzima CRISPR es parte de una proteína de fusión que comprende uno o más dominios de proteína heteróloga (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más dominios además de la enzima CRISPR). Una proteína de fusión de enzima CRISPR puede comprender cualquier secuencia de proteínas adicional y opcionalmente una secuencia ligadora entre dos dominios cualesquiera. Ejemplos de dominios de proteínas que se pueden condensar a una enzima CRISPR incluyen, sin limitación, etiquetas de epítopos, secuencias de genes informadores y dominios de proteínas con una o más de las siguientes actividades: actividad de metilasa, actividad de desmetilasa, actividad de activación de la transcripción, actividad de represión de la transcripción, actividad del factor de liberación de la transcripción, actividad de modificación de histona, actividad de escisión de ARN y actividad de unión de ácidos nucleicos. Ejemplos no limitantes de etiquetas de epítopos incluyen etiquetas de histidina (His), etiquetas V5, etiquetas FLAG, etiquetas de hemaglutinina de la influenza (HA), etiquetas Myc, etiquetas VSV-G y etiquetas de tioredoxina (Trx). Los ejemplos de genes informadores incluyen, pero no se limitan a, glutationa-S-transferasa (GST), peroxidasa de rábano (HRP, por sus siglas en inglés), cloramfenicol acetiltransferasa (CAT, por sus siglas en inglés) beta-galactosidasa, betaglucuronidasa, luciferasa, proteína fluorescente verde (PFV), HcRed, DsRed, proteína fluorescente cian (PFC) proteína fluorescente amarilla (PFAm) y proteínas autofluorescentes incluyendo proteína fluorescente azul (PFA). Una enzima CRISPR se puede condensar a una secuencia de genes que codifique una proteína o un fragmento de una proteína que una moléculas de ADN o una otras moléculas celulares, incluyendo pero no limitándose a (por sus siglas en inglés), proteína de unión de maltosa (MBP), etiqueta S, fusiones de dominios de unión de ADN Lex A (DBD), fusiones de dominios de unión de ADN GAL4 y fusiones de proteínas BP16 de virus del herpes simple (HSV). Los dominios adicionales que pueden formar parte de una proteína de fusión que comprende una enzima CRISPR se describen en la patente de EE.UU. 20110059502. En algunas realizaciones, se usa una enzima CRISPR etiquetada para identificar la posición de una secuencia objetivo. In some embodiments, the CRISPR enzyme is part of a fusion protein comprising one or more heterologous protein domains (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9 , 10 or more domains in addition to the enzyme CRISPR). A CRISPR enzyme fusion protein may comprise any additional protein sequence and optionally a linker sequence between any two domains. Examples of protein domains that can be condensed to a CRISPR enzyme include, without limitation, epitope tags, reporter gene sequences and protein domains with one or more of the following activities: methylase activity, demethylase activity, activation activity of transcription, transcription repression activity, transcription release factor activity, histone modification activity, RNA cleavage activity and nucleic acid binding activity. Non-limiting examples of epitope tags include histidine tags (His), V5 tags, FLAG tags, influenza hemagglutinin tags (HA), Myc tags, VSV-G tags and thioredoxin tags (Trx). Examples of reporter genes include, but are not limited to, glutathione-S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT) beta-galactosidase, betaglucuronidase, luciferase, green fluorescent protein (PFV), HcRed, DsRed, cyan fluorescent protein (PFC) yellow fluorescent protein (PFAm) and autofluorescent proteins including blue fluorescent protein (PFA). A CRISPR enzyme can be condensed to a gene sequence that encodes a protein or a fragment of a protein that a DNA molecule or other cell molecules, including but not limited to (maltose binding protein) (MBP), S-tag, Lex A DNA binding domain fusions (DBD), GAL4 DNA binding domain fusions and BP16 protein fusions of herpes simplex virus (HSV). Additional domains that may be part of a fusion protein comprising a CRISPR enzyme are described in US Pat. 20110059502. In some embodiments, a labeled CRISPR enzyme is used to identify the position of an objective sequence.

En algunos aspectos, la descripción proporciona métodos que comprenden suministrar uno o más polinucleótidos, tales como o uno o más vectores como se describe en la presente memoria, uno o más transcritos de los mismos y/o una o proteínas transcritas de allí, a una célula huésped. En algunos aspectos, la invención proporciona además células producidas por tales métodos y organismos (tales como animales, plantas u hongos) que comprenden o son producidos de tales células. En algunas realizaciones, se suministra una enzima CRISPR junto con (y opcionalmente complejada con) una secuencia guía a una célula. Se pueden usar métodos de transferencia de genes con base vírica y no vírica convencionales para introducir ácidos nucleicos en células de mamífero o tejidos objetivo. Se In some aspects, the description provides methods comprising delivering one or more polynucleotides, such as or one or more vectors as described herein, one or more transcripts thereof and / or one or proteins transcribed therein, to a host cell In some aspects, the invention further provides cells produced by such methods and organisms (such as animals, plants or fungi) that comprise or are produced from such cells. In some embodiments, a CRISPR enzyme is supplied together with (and optionally complexed with) a guide sequence to a cell. Conventional viral and non-viral based gene transfer methods can be used to introduce nucleic acids into mammalian cells or target tissues. Be

pueden usar dichos métodos para administrar componentes que codifican ácidos nucleicos de un sistema CRISPR a células en cultivo o en un organismo huésped. Los sistemas de suministro de vectores no víricos incluyen plásmidos de ADN, ARN (por ej., un transcrito de un vector descrito en la presente memoria), ácido nucleico desnudo y ácido nucleico complejado con un vehículo de suministro, tal como un liposoma. Los sistemas de suministro de vectores víricos incluyen virus de ADN y ARN, que tienen genomas episomales o integrados después de suministro a la célula. Para una Invisión de procedimientos de tratamiento de genes, véase Anderson, Science 256: 808-813 (1992); Nabel & Felgner, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6 (10): 1.149-1.154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51 (1): 3144 (1995); Haddada et al., en Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995) y Yu et al., Gene Therapy 1: 13-26 (1994). they can use such methods to deliver components encoding nucleic acids of a CRISPR system to cells in culture or in a host organism. Non-viral vector delivery systems include plasmids of DNA, RNA (eg, a transcript of a vector described herein), naked nucleic acid and nucleic acid complexed with a delivery vehicle, such as a liposome. Viral vector delivery systems include DNA and RNA viruses, which have episomal or integrated genomes after delivery to the cell. For an Invision of gene treatment procedures, see Anderson, Science 256: 808-813 (1992); Nabel & Felgner, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6 (10): 1,149-1,154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51 (1): 3144 (1995); Haddada et al., In Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995) and Yu et al., Gene Therapy 1: 13-26 (1994).

Los métodos de suministro no vírico de ácidos nucleicos incluyen lipofección, nucleofección, microinyección, biolística, virosomas, liposomas, inmunoliposomas, conjugados de policatión o lípido:ácido nucleico, ADN desnudo, viriones artificiales y absorción de ADN aumentada por agente. La lipofeción se describe en por ej., las Patentes de EE.UU. Nº 5.049.386, 4.946.787 y 4.897.355) y se venden comercialmente los reactivos de lipofección (por ej., Transfectam™ y Lipofectin™). Los lípidos catiónicos y neutros que son adecuados para lipofección de reconocimiento de receptores eficaz de polinucleótidos incluyen aquéllos de Felgner, Patente Internacional WO 91/17424; Patente Internacional WO 91/16024. El suministro puede ser a células (por ej., administración in vitro o ex vivo) o tejidos objetivo (por ej., administración in vivo). Non-viral nucleic acid delivery methods include lipofection, nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid conjugates: nucleic acid, naked DNA, artificial virions and agent-enhanced DNA absorption. Lipofetion is described in e.g., US Pat. No. 5,049,386, 4,946,787 and 4,897,355) and lipofection reagents are commercially sold (eg, Transfectam ™ and Lipofectin ™). Cationic and neutral lipids that are suitable for lipofection of effective polynucleotide receptor recognition include those of Felgner, International Patent WO 91/17424; International Patent WO 91/16024. The delivery may be to cells (e.g., in vitro or ex vivo administration) or target tissues (e.g., in vivo administration).

La preparación de complejos de lípido:ácido nucleico, incluyendo liposomas fijados como objetivo tales como complejos de inmunolípidos, es conocida para un experto en la materia (véase, por ej., Crystal, Science 270: 404410 (1995); Blaese et al., Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al., Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4.817-4.820 (1992); Patentes de EE.UU. Nº 4.186.183; 4.217.344; 4.235.871; 4.261.975; 4.485.054; 4.501.728; 4.774.085; 4.837.028 y 4.946.787). The preparation of lipid: nucleic acid complexes, including target fixed liposomes such as immunolipid complexes, is known to one skilled in the art (see, eg, Crystal, Science 270: 404410 (1995); Blaese et al. , Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al., Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4,817-4,820 (1992); US Pat. Nos. 4,186,183; 4,217,344; 4,235,871; 4,261,975; 4,485,054; 4,501,728; 4,774,085; 4,837,028 and 4,946,787).

El uso de sistemas de base vírica de ARN o ADN para el suministro de ácidos nucleicos toma ventaja de los procedimientos altamente desarrollados para fijar como objetivo un virus para células específicas en el cuerpo y traficar la carga útil vírica al núcleo. Se pueden administrar vectores víricos directamente a pacientes (in vivo) o se pueden usar para tratar células in vitro y las células modificadas se pueden administrar opcionalmente a los pacientes (ex vivo). Los sistemas con base vírica convencionales podían incluir vectores retrovirales, de lentivirus, adenovirales, adenoasociados y del virus del herpes simple para transferencia de genes. La integración en el genoma huésped es posible con los métodos de transferencia de genes de retrovirus, lentivirus y virus adenoasociados, dando como resultado con frecuencia expresión a largo plazo del transgén insertado. Adicionalmente, se han observado altas eficacias de transducción en muchos tipos celulares diferentes y tejidos fijados como objetivo. The use of viral or RNA-based systems for the delivery of nucleic acids takes advantage of highly developed procedures to target a virus for specific cells in the body and to traffic the viral payload to the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to treat cells in vitro and the modified cells can optionally be administered to patients (ex vivo). Conventional viral-based systems could include retroviral, lentivirus, adenoviral, adeno-associated and herpes simplex virus vectors for gene transfer. Integration into the host genome is possible with the methods of gene transfer of retroviruses, lentiviruses and adeno-associated viruses, often resulting in long-term expression of the inserted transgene. Additionally, high transduction efficiencies have been observed in many different cell types and target tissues.

El tropismo de un retrovirus se puede modificar por incorporación de proteínas de sobre extrañas, expandiendo la población objetivo potencial de células objetivo. Los vectores lentivirales son vectores retrovirales que son capaces de transducir o infectar células no de división y típicamente producen títulos víricos altos. La selección de un sistema de transferencia de genes retrovirales dependería por lo tanto del tejido objetivo. Los vectores retrovirales están constituidos por repeticiones terminales largas que actúan en cis con capacidad de empaquetamiento para hasta 610 kb de secuencia extraña. Las LTR mínimas que actúan en cis son suficientes para la replicación y empaquetamiento de los vectores, que se usan después para integrar el gen terapéutico en la célula objetivo para proporcionar expresión de transgenes permanente. Los vectores retrovirales ampliamente usados incluyen los basados en virus de la leucemia murina (MuLV), virus de la leucemia del mono gibón (GaLV), virus de la inmunodeficiencia simia (VIS), virus de la inmunodeficiencia humana (VIH) y combinaciones de los mismos (véase, por ej., Buchscher et al., J. Virol. 66: 2.731-2.739 (1992); Johann et al., J. Virol. 66: 1.635-1.640 (1992); Sommnerfelt et al., Virol. 176: 58-59 (1990); Wilson et al., J. Virol. 63: 2.374-2.378 (1989); Miller et al., J. Virol. 65: 2.220-2.224 (1991); Patente de EE.UU. PCT/US94/05700). En aplicaciones donde se prefiere la expresión transitoria, se pueden usar sistemas a base de adenovirus. Los vectores a base de adenovirus son capaces de una eficacia de transducción muy alta en muchos tipos de células y no requieren división celular. Con tales vectores, se han obtenido altos títulos y niveles de expresión. Este vector se puede producir en grandes cantidades en un sistema relativamente simple. También se pueden usar vectores de virus adenoasociados (“AAV”, por sus siglas en inglés) para transducir células con ácidos nucleicos objetivo, por ejemplo, en la producción in vitro de ácidos nucleicos y péptidos y para procedimientos de tratamiento con genes in vivo y ex vivo (véase, por ej., West et al., Virology 160: 38-47 (1987); la Patente de EE.UU. Nº 4.797.368; la patente internacional WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1.351 (1994). Se describe la construcción de vectores AAV recombinantes en una serie de publicaciones, incluyendo la Patente de EE.UU. Nº 5.173.414; Tratschin et al., Mol. Cell. Biol. 5: 3.251-3.260 (1985); Tratschin, et al., Mol. Cell Biol. 4: 2.072-2.081 (1984); Hermonat & Muzyczka, PNAS 81: 6.466-6.470 (1984) y Samulski et al., J. Virol. 63: 03822-3828 (1989). The tropism of a retrovirus can be modified by incorporating foreign envelope proteins, expanding the potential target population of target cells. Lentiviral vectors are retroviral vectors that are capable of transducing or infecting non-dividing cells and typically produce high viral titers. The selection of a retroviral gene transfer system would therefore depend on the target tissue. Retroviral vectors consist of long terminal repeats that act in cis with packing capacity for up to 610 kb of strange sequence. The minimum LTRs that act in cis are sufficient for replication and packaging of the vectors, which are then used to integrate the therapeutic gene into the target cell to provide permanent transgene expression. Widely used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon monkey leukemia virus (GaLV), simian immunodeficiency virus (VIS), human immunodeficiency virus (HIV) and combinations of themselves (see, e.g., Buchscher et al., J. Virol. 66: 2,731-2,739 (1992); Johann et al., J. Virol. 66: 1,635-1,640 (1992); Sommnerfelt et al., Virol 176: 58-59 (1990); Wilson et al., J. Virol. 63: 2,374-2,378 (1989); Miller et al., J. Virol. 65: 2,220-2,224 (1991); US Pat. PCT / US94 / 05700). In applications where transient expression is preferred, adenovirus-based systems can be used. Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. With such vectors, high titers and levels of expression have been obtained. This vector can be produced in large quantities in a relatively simple system. Adeno-associated virus ("AAV") vectors can also be used to transduce cells with target nucleic acids, for example, in the in vitro production of nucleic acids and peptides and for in vivo and gene treatment methods. ex vivo (see, e.g., West et al., Virology 160: 38-47 (1987); U.S. Patent No. 4,797,368; International Patent WO 93/24641; Kotin, Human Gene Therapy 5 : 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1,351 (1994) The construction of recombinant AAV vectors is described in a number of publications, including US Patent No. 5,173,414; Tratschin et al., Mol. Cell. Biol. 5: 3,251-3,260 (1985); Tratschin, et al., Mol. Cell Biol. 4: 2,072-2,081 (1984); Hermonat & Muzyczka, PNAS 81: 6,466-6,470 (1984) and Samulski et al., J. Virol. 63: 03822-3828 (1989).

Típicamente se usan células de empaquetamiento para formar partículas de virus que sean capaces de infectar una célula huésped. Tales células incluyen células 293, que empaquetan adenovirus, y células ψ2 o células PA317, que empaquetan retrovirus. Los vectores víricos usados en terapia génica se usan generalmente produciendo una estirpe celular que empaqueta un vector de ácidos nucleicos en una partícula vírica. Los vectores contienen típicamente las mínimas secuencias víricas requeridas para empaquetamiento y posterior integración en un huésped, siendo reemplazadas otras secuencias víricas por una casete de expresión para el polinucleótido o los polinucleótidos que se tienen que expresar. Las funciones víricas que faltan se suministran típicamente en trans por la estirpe celular de empaquetamiento. Por ejemplo, los vectores AAV usados en terapia génica típicamente poseen sólo secuencias ITR del genoma AAV que se requieren para empaquetamiento e integración en el genoma huésped. El ADN vírico se empaqueta en una estirpe celular, que contiene un plásmido auxiliar que codifica los otros genes AAV, es decir rep y cap, pero carecen de secuencias ITR. La estirpe celular también puede infectarse con adenovirus como auxiliar. El virus auxiliar activa la replicación del vector AAV y la expresión de genes AAV del plásmido auxiliar. El plásmido auxiliar no se empaqueta en cantidades significativas debido a ausencia de secuencias ITR. La contaminación con adenovirus se puede reducir por, por ejemplo, tratamiento térmico al cual es más sensible el adenovirus que AAV. Los métodos adicionales para el suministro de ácidos nucleicos a células son conocidos para los expertos en la materia. Véase, por ejemplo, la Patente de EE.UU. 20030087817. Typically packaging cells are used to form virus particles that are capable of infecting a host cell. Such cells include 293 cells, which package adenovirus, and ψ2 cells or PA317 cells, which package retroviruses. The viral vectors used in gene therapy are generally used to produce a cell line that packages a nucleic acid vector into a viral particle. Vectors typically contain the minimum viral sequences required for packaging and subsequent integration into a host, other viral sequences being replaced by an expression cassette for the polynucleotide or polynucleotides to be expressed. Missing viral functions are typically supplied in trans through the packaging cell line. For example, AAV vectors used in gene therapy typically possess only ITR sequences of the AAV genome that are required for packaging and integration into the host genome. The viral DNA is packaged in a cell line, which contains an auxiliary plasmid that encodes the other AAV genes, ie rep and cap, but they lack ITR sequences. Cell line can also be infected with adenovirus as an auxiliary. The auxiliary virus activates AAV vector replication and AAV gene expression of the auxiliary plasmid. The auxiliary plasmid is not packaged in significant amounts due to the absence of ITR sequences. Contamination with adenovirus can be reduced by, for example, heat treatment to which adenovirus is more sensitive than AAV. Additional methods for the delivery of nucleic acids to cells are known to those skilled in the art. See, for example, US Pat. 20030087817.

En algunas realizaciones, una célula huésped se transinfecta de manera transitoria o de manera no transitoria con uno o más vectores descritos en la presente memoria. En algunas realizaciones, una célula se transinfecta como tiene lugar de manera natural en un individuo. En algunas realizaciones, una célula que se transinfecta es tomada de un individuo. En algunas realizaciones, la célula procede de células tomadas de un individuo, tales como una estirpe celular. Se conoce una amplia variedad de estirpes celulares de cultivos de tejido en la técnica. Ejemplos de estirpes celulares incluyen, pero no se limitan a, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, epitelial de riñón de mono BS-C-1, fibroblasto de embrión de ratón BALB/ 3T3, 3T3 Swiss, 3T3-L1, fibroblastos fetales humanos 132-d5; fibroblastos de ratón 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, células BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, células JY, células K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145 estirpes celulares OPCN / OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, células Saos-2, Sf9, SkBr3, T2, T-47D, T84, estirpe celular THP1, U373, U87, U937, VCaP, células Vero, WM39, WT-49, X63 YAC-1, YAR y variedades transgénicas de los mismos. Las estirpes celulares están disponibles de una variedad de fuentes conocidas por los expertos en la materia (véase, por ej., la Colección de Cultivos de Tipo Americano (ATCC, por sus siglas en inglés) (Manassus, Va.)). En algunas realizaciones, una célula transinfectada con uno o más vectores descritos en la presente memoria se usa para establecer una nueva estirpe celular que comprende una o más secuencias procedentes de vector. En algunas realizaciones, una célula transinfectada de manera transitoria con los componentes de un sistema CRISPR como se describe en la presente memoria (tal como por transinfección transitoria de uno más vectores o transinfección con ARN) y modificada por la actividad de un complejo CRISPR, se usa para establecer una nueva estirpe celular que comprende células que contienen la modificación pero carecen de otra secuencia exógena. En algunas realizaciones, las células transinfectadas de manera transitoria o de manera no transitoria con uno o más vectores descritos en la presente memoria o estirpes celulares procedentes de dichas células se usan en la valoración de uno o más compuestos de ensayo. In some embodiments, a host cell is transinfected transiently or non-transiently with one or more vectors described herein. In some embodiments, a cell is transinfected as it occurs naturally in an individual. In some embodiments, a cell that is transinfected is taken from an individual. In some embodiments, the cell is derived from cells taken from an individual, such as a cell line. A wide variety of cell lines of tissue cultures are known in the art. Examples of cell lines include, but are not limited to, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC- 3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI- 231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS , COS-1, COS-6, COS-M6A, monkey kidney epithelial BS-C-1, mouse embryo fibroblast BALB / 3T3, 3T3 Swiss, 3T3-L1, human fetal fibroblasts 132-d5; Mouse fibroblasts 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 cells, BEAS-2B, bEnd. 3, BHK-21, BR 293, BxPC3, C3H-10T1 / 2, C6 / 36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr - / -, COR-L23, COR-L23 / CPR, COR-L23 / 5010, COR-L23 / R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6 / AR1, EMT6 / AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, cells K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR / 0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69 / CPR, NCI-H69 / LX10, NCI-H69 / LX20, NCI-H69 / LX4, NIH-3T3, NALM -1, NW-145 OPCN / OPCT cell lines, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA / RMAS, Saos-2 cells, Sf9, SkBr3, T2, T-47D, T84, cell line THP1, U373, U87, U937, VCaP, Vero cells, WM39, WT-49, X63 YAC-1, YAR and transgenic varieties s of them. Cell lines are available from a variety of sources known to those skilled in the art (see, e.g., the American Type Culture Collection (ATCC) (Manassus, Va.)). In some embodiments, a cell transinfected with one or more vectors described herein is used to establish a new cell line comprising one or more vector sequences. In some embodiments, a transiently transfected cell with the components of a CRISPR system as described herein (such as by transient transfection of one more vectors or RNA transfection) and modified by the activity of a CRISPR complex, is used to establish a new cell line comprising cells that contain the modification but lack another exogenous sequence. In some embodiments, cells transinfected transiently or non-transiently with one or more vectors described herein or cell lines from said cells are used in the titration of one or more test compounds.

En algunas realizaciones, se usa uno o más vectores descritos en la presente memoria para producir un animal transgénico no humano o planta transgénica. En algunas realizaciones, el animal transgénico es un mamífero, tal como un ratón, rata o conejo. En algunas realizaciones, el organismo o individuo es una planta. En algunas realizaciones, el organismo o individuo o planta es un alga. Los métodos para producir plantas y animales transgénicos son conocidos en la técnica y generalmente empiezan con un método de transinfección de células, tal como se describe en la presente memoria. In some embodiments, one or more vectors described herein are used to produce a non-human transgenic animal or transgenic plant. In some embodiments, the transgenic animal is a mammal, such as a mouse, rat or rabbit. In some embodiments, the organism or individual is a plant. In some embodiments, the organism or individual or plant is an algae. Methods for producing transgenic plants and animals are known in the art and generally begin with a method of cell transfection, as described herein.

En un aspecto, la descripción proporciona métodos para modificar un polinucleótido objetivo en una célula eucariota. En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinucleótido objetivo para efectuar la escisión de dicho polinucleótido objetivo modificando de ese modo el polinucleótido objetivo, en la que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia fijada como objetivo dentro de dicho polinucleótido objetivo, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez hibrida a una secuencia tracr. In one aspect, the description provides methods for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises allowing a CRISPR complex to bind to the target polynucleotide to effect cleavage of said target polynucleotide thereby modifying the target polynucleotide, in which the CRISPR complex comprises a complexed CRISPR enzyme with a guide sequence hybridized to a target set sequence within said target polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence.

En un aspecto, la descripción proporciona un método para modificar la expresión de un polinucleótido en una célula In one aspect, the description provides a method for modifying the expression of a polynucleotide in a cell.

eucariota. En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinucleótido de manera que dicha unión dé como resultado expresión aumentada o disminuida de dicho polinucleótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia fijada como objetivo dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez hibrida a una secuencia tracr. eukaryotic In some embodiments, the method comprises allowing a CRISPR complex to bind to the polynucleotide so that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target target sequence within said polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence .

Con los recientes avances en la genómica de cultivos, la capacidad para usar sistemas CRISPR-Cas para realizar edición y manipulación de genes eficaz y de coste eficaz permitirá la rápida selección y la comparación de manipulaciones genéticas únicas y multiplexadas para transformar dichos genomas para producción mejorada y cebos mejorados. Con respecto a esto se hace referencia a las Patentes y publicaciones de EE.UU.: Patente de EE.UU. Nº 6.603.061 -Agrobacterium-Mediated Plant Transformation Method; la Patente de EE.UU. Nº 7.868.149 -Plant Genome Sequences and Uses Thereof y la Patente de EE.UU. 2009/0100536 -Transgenic Plants with Enhanced Agronomic Traits. En la práctica de la descripción, los contenidos y la invención de Morrell et al., “Crop genomics: advances and applications Nat Rev Genet., 29 de diciembre de 2011; 13 (2): 85-96 también son de interés. En una realización ventajosa de la invención, el sistema CRISPR/Cas9 se usa para lograr microalgas (Ejemplo 15). De acuerdo con esto, la referencia en la presente memoria a células de animales puede aplicarse también, mutatis mutandis, a células de plantas a menos que sea evidente de otro modo. With recent advances in crop genomics, the ability to use CRISPR-Cas systems to perform efficient and cost-effective gene editing and manipulation will allow rapid selection and comparison of unique and multiplexed genetic manipulations to transform such genomes for improved production. and improved baits. In this regard, reference is made to US Patents and Publications: US Pat. No. 6,603,061 -Agrobacterium-Mediated Plant Transformation Method; U.S. Patent No. 7,868,149 -Plant Genome Sequences and Uses Thereof and US Pat. 2009/0100536 -Transgenic Plants with Enhanced Agronomic Traits. In the practice of the description, contents and invention of Morrell et al., "Crop genomics: advances and applications Nat Rev Genet., December 29, 2011; 13 (2): 85-96 are also of interest. In an advantageous embodiment of the invention, the CRISPR / Cas9 system is used to achieve microalgae (Example 15). Accordingly, the reference herein to animal cells can also be applied, mutatis mutandis, to plant cells unless it is evident otherwise.

En un aspecto, la descripción proporciona métodos para modificar un polinucleótido objetivo en una célula eucariota, que puede ser in vivo, ex vivo o in vitro. En algunas realizaciones, el método comprende muestrear una célula o población de células de un animal humano o no humano o planta (incluyendo microalgas) y modificar la célula o células. Puede tener lugar cultivo en cualquier fase ex vivo. La célula o las células pueden ser introducidas de nuevo incluso en el animal no humano o planta (incluyendo microalgas). In one aspect, the description provides methods for modifying a target polynucleotide in a eukaryotic cell, which can be in vivo, ex vivo or in vitro. In some embodiments, the method comprises sampling a cell or population of cells from a human or non-human animal or plant (including microalgae) and modifying the cell or cells. Cultivation can take place in any ex vivo phase. The cell or cells can be reintroduced even into the non-human animal or plant (including microalgae).

En las plantas, los patógenos son con frecuencia específicos del huésped. Por ejemplo, Fusarium oxysporum f. sp. lycopersici produce marchitamiento del tomate pero ataca sólo al tomate y F. oxysporum f. dianthii Puccinia graminis In plants, pathogens are often host specific. For example, Fusarium oxysporum f. sp. lycopersici produces tomato wilting but attacks only tomato and F. oxysporum f. Puccinia graminis dianthii

f. sp. tritici ataca sólo al trigo. Las plantas tienen defensas existentes e inducidas para resistir a la mayoría de los patógenos. Las mutaciones y los casos de recombinación a través de generaciones de plantas conducen a variabilidad genética que da lugar a susceptibilidad, especialmente ya que los patógenos se reproducen con más frecuencia que las plantas. En las plantas puede haber resistencia al no huésped, por ej., el huésped y el patógeno son incompatibles. También puede haber Resistencia Horizontal, por ej., resistencia parcial frente a todas las razas de un patógeno, controlado típicamente por muchos genes y Resistencia Vertical, por ej., resistencia completa a algunas razas de un patógeno pero no a otras razas, controlado típicamente por unos genes. En un nivel de Gen por Gen, las plantas y los patógenos evolucionan juntos y los cambios genéticos en uno equilibran los cambios en otro. De acuerdo con eso, usando Variabilidad Natural, los criadores combinan genes lo más útiles para Rendimiento, Calidad, Uniformidad, Dureza, Resistencia. Las fuentes de genes de resistencia incluyen Variedades naturales o extrañas, Variedades Heirloom, Mutaciones relativas a plantas silvestres e inducidas, por ej., tratando material vegetal con agentes mutagénicos. Usando la presente invención, se les proporciona a los criadores de plantas una nueva herramienta para inducir mutaciones. De acuerdo con esto, un experto en la materia puede analizar el genoma de fuentes de genes de resistencia y en Variedades con características o rasgos deseados se emplea la presente invención para inducir la elevación de genes de resistencia con más precisión que los agentes mutagénicos previos y por lo tanto se aceleran y mejoran los programas de cultivo de plantas. F. sp. Tritici attacks only wheat. Plants have existing and induced defenses to resist most pathogens. Mutations and recombination cases across generations of plants lead to genetic variability that results in susceptibility, especially since pathogens reproduce more frequently than plants. In plants there may be resistance to the non-host, eg, the host and the pathogen are incompatible. There may also be Horizontal Resistance, e.g., partial resistance against all races of a pathogen, typically controlled by many genes and Vertical Resistance, e.g., complete resistance to some races of a pathogen but not other races, typically controlled For some genes. At one level of Gen by Gen, plants and pathogens evolve together and genetic changes in one balance the changes in another. Accordingly, using Natural Variability, breeders combine genes most useful for Performance, Quality, Uniformity, Hardness, Resistance. Sources of resistance genes include natural or foreign varieties, Heirloom varieties, mutations related to wild and induced plants, eg, treating plant material with mutagenic agents. Using the present invention, plant breeders are provided with a new tool for inducing mutations. Accordingly, a person skilled in the art can analyze the genome of sources of resistance genes and in Varieties with desired characteristics or traits the present invention is used to induce the elevation of resistance genes more accurately than previous mutagenic agents and therefore, plant cultivation programs are accelerated and improved.

En un aspecto, la invención proporciona estuches que contienen uno o más cualesquiera de los elementos descritos en los métodos y composiciones anteriores. En algunas realizaciones, el estuche comprende un sistema vector e instrucciones para usar el estuche. En algunas realizaciones, el sistema vector comprende (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear. Los elementos se pueden proporcionar de manera individual o en combinaciones y se pueden proporcionar en cualquier envase adecuado, tal como un vial, un frasco o un tubo. En algunas realizaciones, el estuche incluye instrucciones en uno o más idiomas, por ejemplo, en más de un idioma. In one aspect, the invention provides cases containing one or more of any of the elements described in the above methods and compositions. In some embodiments, the case comprises a vector system and instructions for using the case. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting a guide sequence upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target-fixed sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a localization sequence nuclear. The elements can be provided individually or in combinations and can be provided in any suitable container, such as a vial, a bottle or a tube. In some embodiments, the kit includes instructions in one or more languages, for example, in more than one language.

En algunas realizaciones, un estuche comprende uno o más reactivos para uso en un procedimiento utilizando uno o más de los elementos descritos en la presente memoria. Los reactivos se pueden proporcionar en cualquier envase adecuado. Por ejemplo, un estuche puede proporcionar uno o más tampones de reacción o de almacenamiento. Los reactivos se pueden proporcionar en una forma que sea utilizable en un ensayo particular o en una forma que requiera la adición de otro u otros componentes más antes de uso (por ejemplo, en forma concentrada o liofilizada). Un tampón puede ser cualquier tampón, incluyendo, pero no limitándose a un tampón de carbonato de sodio, un tampón de bicarbonato de sodio, un tampón de borato, un tampón de Tris, un tampón de MOPS, un tampón de In some embodiments, a kit comprises one or more reagents for use in a method using one or more of the elements described herein. Reagents can be provided in any suitable container. For example, a case may provide one or more reaction or storage buffers. The reagents can be provided in a form that is usable in a particular assay or in a form that requires the addition of another or other components before use (for example, in concentrated or lyophilized form). A buffer can be any buffer, including, but not limited to a sodium carbonate buffer, a sodium bicarbonate buffer, a borate buffer, a Tris buffer, a MOPS buffer, a buffer of

HEPES y combinaciones de los mismos. En algunas realizaciones, el tampón es alcalino. En algunas realizaciones, el tampón presenta un pH de aproximadamente 7 a aproximadamente 10. En algunas realizaciones, el estuche comprende uno o más oligonucleótidos correspondientes a una secuencia guía para inserción en un vector de manera que se una de manera operable a la secuencia guía y un elemento regulador. En algunas realizaciones, el estuche comprende un polinucleótido de plantilla de recombinación homólogo. HEPES and combinations thereof. In some embodiments, the buffer is alkaline. In some embodiments, the buffer has a pH of about 7 to about 10. In some embodiments, the kit comprises one or more oligonucleotides corresponding to a guide sequence for insertion into a vector so that it is operably linked to the guide sequence and a regulatory element In some embodiments, the kit comprises a homologous recombination template polynucleotide.

En un aspecto, la descripción proporciona métodos para usar uno o más elementos de un sistema CRISPR. El complejo CRISPR de la descripción proporciona un medio eficaz para modificar un polinucleótido objetivo. El complejo CRISPR de la descripción presenta una amplia variedad de utilidad incluyendo modificación (por ej., supresión, inserción, traslocación, inactivación, activación) de un polinucleótido objetivo en una multiplicidad de tipos de células. Como tal el complejo CRISPR de la descripción presenta un amplio espectro de aplicaciones en, por ej., tratamiento génico, investigación de fármacos, diagnóstico de enfermedades y prognosis. Un complejo CRISPR ejemplar comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia objetivo dentro del polinucleótido objetivo. La secuencia guía está ligada a una secuencia de emparejamiento tracr, que a su vez hibrida a una secuencia tracr. In one aspect, the description provides methods for using one or more elements of a CRISPR system. The CRISPR complex of the description provides an effective means to modify a target polynucleotide. The CRISPR complex of the description has a wide variety of utility including modification (eg, deletion, insertion, translocation, inactivation, activation) of a target polynucleotide in a multiplicity of cell types. As such, the CRISPR complex of the description has a broad spectrum of applications in, for example, gene treatment, drug research, disease diagnosis and prognosis. An exemplary CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to an objective sequence within the target polynucleotide. The guide sequence is linked to a tracr pairing sequence, which in turn hybridizes to a tracr sequence.

El polinucleótido objetivo de un complejo CRISPR puede ser cualquier polinucleótido endógeno o exógeno a la célula eucariota. Por ejemplo, el polinucleótido objetivo puede ser un polinucleótido que resida en el núcleo de la célula eucariota. El polinucleótido objetivo puede ser una secuencia que codifique un producto génico (por ej., una proteína) o una secuencia no codificadora (por ej., un polinucleótido regulador o un ADN basura). Sin desear estar limitados por la teoría, se cree que la secuencia objetivo debería estar asociada a un PAM (unidad adyacente protoespaciadora); esto es, una secuencia corta reconocida por el complejo CRISPR. Los requerimientos de secuencia y longitud precisos para el PAM difieren dependiendo de la enzima CRISPR usada, pero los PAM son típicamente secuencias de 2-5 pares de bases adyacentes al protoespaciador (esto es, la secuencia objetivo). Se proporcionan ejemplos de secuencias PAM en la sección de ejemplos a continuación y el experto podrá identificar secuencias PAM adicionales para uso con una enzima CRISPR determinada. The target polynucleotide of a CRISPR complex can be any endogenous or exogenous polynucleotide to the eukaryotic cell. For example, the target polynucleotide may be a polynucleotide that resides in the nucleus of the eukaryotic cell. The target polynucleotide can be a sequence that encodes a gene product (e.g., a protein) or a non-coding sequence (e.g., a regulatory polynucleotide or junk DNA). Without wishing to be bound by theory, it is believed that the target sequence should be associated with a PAM (adjacent proto-spacer unit); that is, a short sequence recognized by the CRISPR complex. The precise sequence and length requirements for the PAM differ depending on the CRISPR enzyme used, but the PAMs are typically 2-5 base pair sequences adjacent to the proto-spacer (that is, the target sequence). Examples of PAM sequences are provided in the examples section below and the expert will be able to identify additional PAM sequences for use with a given CRISPR enzyme.

El polinucleótido objetivo de un complejo CRISPR puede incluir una serie de genes y polinucleótidos asociados a enfermedades así como genes y polinucleótidos asociados a rutas bioquímicas de señalización como se enumera en las solicitudes de patente provisional de EE.UU., 61/736.527 y 61/748.427 con amplia referencia BI-2011/008/WSGR Certificado Nº 44063-701.101 y BI-2011/008/WSGR Certificado Nº 44063-701.102, respectivamente, ambos titulados SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION presentados el 12 de diciembre de 2012 y el 2 de enero de 2013, respectivamente. The target polynucleotide of a CRISPR complex may include a number of genes and polynucleotides associated with diseases as well as genes and polynucleotides associated with biochemical signaling pathways as listed in U.S. provisional patent applications, 61 / 736,527 and 61 / 748,427 with extensive reference BI-2011/008 / WSGR Certificate No. 44063-701.101 and BI-2011/008 / WSGR Certificate No. 44063-701.102, respectively, both titled SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION presented on December 12, 2012 and the January 2, 2013, respectively.

Ejemplos de polinucleótidos objetivo incluyen una secuencia asociada a una ruta bioquímica de señalización, por ej., un gen o polinucleótido asociado a una ruta bioquímica de señalización. Ejemplos de polinucleótidos objetivo incluyen un gen o polinucleótido asociado a una enfermedad. Un gen o polinucleótido "asociado a una enfermedad" se refiere a cualquier gen o polinucleótido que esté proporcionando productos de transcripción o traducción en un nivel anormal o en una forma anormal en las células procedentes de tejidos afectados por una enfermedad comparado con tejidos o células de un control no de enfermedad. Puede ser un gen que llegue a expresarse a un nivel anormalmente alto; puede ser un gen que llegue a expresarse a un nivel anormalmente bajo, donde la expresión modificada se correlaciona con la aparición y/o progresión de la enfermedad. Un gen asociado a la enfermedad también se refiere a un gen que posee mutación o mutaciones o variación genética que es directamente responsable o está ligada a desequilibrio con un gen, o genes, que es responsable de la etiología de una enfermedad. Los productos transcritos o traducidos pueden ser conocidos o desconocidos y puede ser a un nivel normal o anormal. Examples of target polynucleotides include a sequence associated with a biochemical signaling pathway, eg, a gene or polynucleotide associated with a biochemical signaling pathway. Examples of target polynucleotides include a gene or polynucleotide associated with a disease. A gene or polynucleotide "associated with a disease" refers to any gene or polynucleotide that is providing transcription or translation products at an abnormal level or in an abnormal form in cells from tissues affected by a disease compared to tissues or cells of a control not of disease. It may be a gene that expresses itself at an abnormally high level; It may be a gene that expresses itself at an abnormally low level, where the modified expression correlates with the onset and / or progression of the disease. A gene associated with the disease also refers to a gene that has mutation or mutations or genetic variation that is directly responsible or linked to imbalance with a gene, or genes, that is responsible for the etiology of a disease. Transcribed or translated products may be known or unknown and may be at a normal or abnormal level.

Ejemplos de genes y polinucleótidos asociados a una enfermedad están disponibles en Instituto McKusick-Nathans de Medicina Genética, Universidad de Johns Hopkins (Baltimore, Md.) y Centro Nacional para Información de Biotecnología, Biblioteca Nacional de Medicina (Bethesda, Md.), disponible en la Red Informática Mundial. Examples of genes and polynucleotides associated with a disease are available at the McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.) And National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.), Available in the World Computer Network.

Ejemplos de genes y polinucleótidos asociados a una enfermedad se enumeran en las Tablas A y B. La información específica de la enfermedad está disponible en el Instituto McKusick-Nathans de Medicina Genética, Universidad de Johns Hopkins (Baltimore, Md.) y Centro Nacional para Información de Biotecnología, Biblioteca Nacional de Medicina (Bethesda, Md.), disponible en la Red Informática Mundial. Ejemplos de genes y polinucleótido asociados a una ruta bioquímica de señalización se enumeran en la Tabla C. Examples of genes and polynucleotides associated with a disease are listed in Tables A and B. Specific disease information is available at the McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.) And National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.), Available on the World Computer Network. Examples of genes and polynucleotide associated with a biochemical signaling pathway are listed in Table C.

Las mutaciones en estos genes y rutas pueden dar como resultado la producción de proteínas inapropiadas o proteínas en cantidades inapropiadas que afecten a la función. Tales genes, proteínas y rutas pueden ser el polinucleótido objetivo de un complejo CRISPR. Mutations in these genes and pathways can result in the production of inappropriate proteins or proteins in inappropriate amounts that affect function. Such genes, proteins and pathways can be the target polynucleotide of a CRISPR complex.

Tabla A Table A

ENFERMEDAD/TRASTORNOS DISEASE / DISORDERS
GEN (ES) GEN (ES)

Neoplasia Neoplasia
PTEN; ATM; ATR; EGFR; ERBB2; ERBB3; ERBB4; PTEN; ATM; ATR; EGFR; ERBB2; ERBB3; ERBB4;

Notch1; Notch2; Notch3; Notch4; AKT; AKT2; AKT3; HIF; Notch1; Notch2; Notch3; Notch4; AKT; AKT2; AKT3; HIF;

HIF1a; HIF3a; Met; HRG; Bcl2; PPAR alfa; PPAR HIF1a; HIF3a; Met; HRG; Bcl2; PPAR alpha; PPAR

gamma; WT1 (Tumor Wilms); Familia Receptor FGF gamma; WT1 (Tumor Wilms); FGF Receiver Family

miembros (5 miembros: 1, 2, 3, 4, 5); CDKN2a; APC; RB members (5 members: 1, 2, 3, 4, 5); CDKN2a; APC; RB

(retinoblastoma); MEN1; VHL; BRCA1; BRCA2; AR (retinoblastoma); MEN1; VHL; BRCA1; BRCA2; AR

(Receptor Andrógenos); TSG101; IGF; Receptor IGF; Igf1 (4 (Androgen receptor); TSG101; IGF; IGF receiver; Igf1 (4

variantes); Igf2 (3 variantes); Receptor Igf 1; Receptor Igf 2; variants); Igf2 (3 variants); Igf 1 receptor; Igf 2 receptor;

Bax; Bcl2; familia caspasas (9 miembros: Bax; Bcl2; Caspasas family (9 members:

1, 2, 3, 4, 6, 7, 8, 9, 12); Kras; Apc 1, 2, 3, 4, 6, 7, 8, 9, 12); Kras; Apc

Degeneración Degeneration
Abcr; Cc12; Cc2; cp (ceruloplasmina); Timp3; catepsina D; Abcr; Nc12; Cc2; cp (ceruloplasmin); Timp3; cathepsin D;

Macular relacionada con la edad Age-related macular
Vldlr; Ccr2 Vldlr; Ccr2

Esquizofrenia Schizophrenia
Neuregulina1 (Nrg1); Erb4 (receptor para Neuregulina); Neuregulin1 (Nrg1); Erb4 (Neuregulin receptor);

Complexina1 (Cplx1); Tph1 Triptófano hidroxilasa; Tph2 Complexin1 (Cplx1); Tph1 Tryptophan hydroxylase; Tph2

Triptófano hidroxilasa 2; Neurexina 1; GSK3; GSK3a; Tryptophan hydroxylase 2; Neurexin 1; GSK3; GSK3a;

GSK3b GSK3b

Trastornos Disorders
5-HTT (Slc6a4); COMT; DRD (Drd1a); SLC6A3; DAOA; 5-HTT (Slc6a4); COMT; DRD (Drd1a); SLC6A3; DAOA;

DTNBP1; Dao (Dao1) DTNBP1; Dao (Dao1)

Repetición del trinucleótido Trinucleotide Repeat
HTT (Huntington's Dx); SBMA/SMAX1/AR (Kennedy's HTT (Huntington's Dx); SBMA / SMAX1 / AR (Kennedy's

Trastornos Disorders
Dx); FXN/X25 (Friedrich's Ataxia); ATX3 (Machado Dx); FXN / X25 (Friedrich's Ataxia); ATX3 (Machado

Joseph's Dx); ATXN1 y ATXN2 (ataxias Joseph's Dx); ATXN1 and ATXN2 (ataxias

espinocerebelares); DMPK (distrofia miotónica); Atrophin-1 y Atn1 spinocerebelar); DMPK (myotonic dystrophy); Atrophin-1 and Atn1

(DRPLA Dx); CBP (Creb-BP -inestabilidad global); VLDLR (DRPLA Dx); CBP (Creb-BP - global instability); VLDLR

(Alzheimer's); Atxn7; Atxn10 (Alzheimer's); Atxn7; Atxn10

Síndrome frágil X Fragile syndrome X
FMR2; FXR1; FXR2; mGLUR5 FMR2; FXR1; FXR2; mGLUR5

Tabla B Table B

Enfermedades y trastornos de la sangre y la coagulación Blood and clotting diseases and disorders
Anemia (CDAN1, CDA1, RPS19, DBA, PKLR, PK1, NT5C3, UMPH1, PSN1, RHAG, RH50A, NRAMP2, SPTB, ALAS2, ANH1, ASB, ABCB7, ABC7, ASAT); síndrome de linfocito desnudo (TAPBP, TPSN, TAP2, ABCB3, PSF2, RING11, MHC2TA, C2TA, RFX5, RFXAP, RFX5), Trastornos de sangrado (TBXA2R, P2RX1, P2X1); Factor H y factor H tipo -1 (HF1, CFH, HUS); Factor V y factor VIII (MCFD2); deficiencia de Factor VII (F7); deficiencia de Factor X (F10); deficiencia de Factor XI (F11); deficiencia de Factor XII (F12, HAF); deficiencia de Factor XIIIA (F13A1, F13A); deficiencia de Factor XIIIB (F13B); anemia Fanconi (FANCA, FACA, FA1, FA, FAA, FAAP95, FAAP90, FLJ34064, FANCB, FANCC, FACC, BRCA2, FANCD1, FANCD2, FANCD, FACD, FAD, FANCE, FACE, FANCF, XRCC9, FANCG, BRIP1, BACH1, FANCJ, PHF9, FANCL, FANCM, KIAA1596); trastornos Linfohistiocitosis Hemofagocítica (PRF1, HPLH2, UNC13D, MUNC13-4, HPLH3, HLH3, FHL3); Hemofilia A (F8, F8C, HEMA); Hemofilia B (F9, HEMB), trastornos hemorrágicos (PI, ATT, F5); deficiencias y trastornos de leucocia (ITGB2, CD18, LCAMB, LAD, EIF2B1, EIF2BA, EIF2B2, EIF2B3, EIF2B5, LVWM, CACH, CLE, EIF2B4); anemia Anemia (CDAN1, CDA1, RPS19, DBA, PKLR, PK1, NT5C3, UMPH1, PSN1, RHAG, RH50A, NRAMP2, SPTB, ALAS2, ANH1, ASB, ABCB7, ABC7, ASAT); naked lymphocyte syndrome (TAPBP, TPSN, TAP2, ABCB3, PSF2, RING11, MHC2TA, C2TA, RFX5, RFXAP, RFX5), Bleeding disorders (TBXA2R, P2RX1, P2X1); Factor H and factor H type -1 (HF1, CFH, HUS); Factor V and factor VIII (MCFD2); Factor VII deficiency (F7); Factor X deficiency (F10); Factor XI deficiency (F11); Factor XII deficiency (F12, HAF); Factor XIIIA deficiency (F13A1, F13A); Factor XIIIB deficiency (F13B); Fanconi anemia (FANCA, FACA, FA1, FA, FAA, FAAP95, FAAP90, FLJ34064, FANCB, FANCC, FACC, BRCA2, FANCD1, FANCD2, FANCD, FACD, FAD, FANCE, FACE, FANCF, XRCC9, FANCG, BRIP1, BACH1 , FANCJ, PHF9, FANCL, FANCM, KIAA1596); Hemophagocytic lymphohistiocytosis disorders (PRF1, HPLH2, UNC13D, MUNC13-4, HPLH3, HLH3, FHL3); Hemophilia A (F8, F8C, HEMA); Hemophilia B (F9, HEMB), bleeding disorders (PI, ATT, F5); Leukocy deficiencies and disorders (ITGB2, CD18, LCAMB, LAD, EIF2B1, EIF2BA, EIF2B2, EIF2B3, EIF2B5, LVWM, CACH, CLE, EIF2B4); anemia

depranocítica (HBB); Talasemia (HBA2, HBB, HBD, LCRB, HBA1). depranocitic (HBB); Thalassemia (HBA2, HBB, HBD, LCRB, HBA1).

Desrregulación celular y Cell deregulation and
Linfoma no de Hodgkin de células B (BCL7A, BCL7); Leucemia (TAL1, TCL5, SCL, Non-Hodgkin B-cell lymphoma (BCL7A, BCL7); Leukemia (TAL1, TCL5, SCL,

enfermedades y trastornos diseases and disorders
TAL2, FLT3, NBS1, NBS, ZNFN1A1, IK1, LYF1, HOXD4, HOX4B, BCR, CML, PHL, TAL2, FLT3, NBS1, NBS, ZNFN1A1, IK1, LYF1, HOXD4, HOX4B, BCR, CML, PHL,

oncológicos oncological
ALL, ARNT, KRAS2, RASK2, GMPS, AF10, ARHGEF12, LARG, KIAA0382, CALM, ALL, ARNT, KRAS2, RASK2, GMPS, AF10, ARHGEF12, LARG, KIAA0382, CALM,

CLTH, CEBPA, CEBP, CHIC2, BTL, FLT3, KIT, PBT, LPP, NPM1, NUP214, D9S46E, CLTH, CEBPA, CEBP, CHIC2, BTL, FLT3, KIT, PBT, LPP, NPM1, NUP214, D9S46E,

CAN, CAIN, RUNX1, CBFA2, AML1, WHSC1L1, NSD3, FLT3, AF1Q, NPM1, NUMA1, CAN, CAIN, RUNX1, CBFA2, AML1, WHSC1L1, NSD3, FLT3, AF1Q, NPM1, NUMA1,

ZNF 145, PLZF, PML, MYL, STAT5B, AF 10, CALM, CLTH, ARL11, ARLTS1, P2RX7, ZNF 145, PLZF, PML, MYL, STAT5B, AF 10, CALM, CLTH, ARL11, ARLTS1, P2RX7,

P2X7, BCR, CML, PHL, ALL, GRAF, NF1, VRNF, WSS, NFNS, PTPN11, PTP2C, P2X7, BCR, CML, PHL, ALL, GRAF, NF1, VRNF, WSS, NFNS, PTPN11, PTP2C,

SHP2, NS1, BCL2, CCND1, PRAD1, BCL1, TCRA, GATA1, GF1, ERYF1, NFE1, SHP2, NS1, BCL2, CCND1, PRAD1, BCL1, TCRA, GATA1, GF1, ERYF1, NFE1,

ABL1, NQO1, DIA4, NMOR1, NUP214, D9S46E, CAN, CAIN). ABL1, NQO1, DIA4, NMOR1, NUP214, D9S46E, CAN, CAIN).

Inflamación y enfermedades Inflammation and diseases
SIDA (KIR3DL1, NKAT3, NKB1, AMB11, KIR3DS1, IFNG, CXCL12, SDF1); síndrome AIDS (KIR3DL1, NKAT3, NKB1, AMB11, KIR3DS1, IFNG, CXCL12, SDF1); syndrome

y trastornos and disorders
linfoproliferativo autoinmunitario (TNFRSF6, APT1, FAS, CD95, ALPS1A); autoimmune lymphoproliferative (TNFRSF6, APT1, FAS, CD95, ALPS1A);

inmunorelacionados immunorelated
immunodeficiencia combinada, (IL2RG, SCIDX1, SCIDX, IMD4); VIH-1 (CCL5, SCYA5, D17S136E, TCP228), susceptibilidad o infección por VIH (IL10, CSIF, CMKBR2, CCR2, CMKBR5, CCCKR5 (CCR5)); Inmunodeficiencias (CD3E, CD3G, AICDA, AID, HIGM2, TNFRSF5, CD40, UNG, DGU, HIGM4, TNFSF5, CD40LG, HIGM1, IGM, FOXP3, IPEX, AIID, XPID, PIDX, TNFRSF14B, TACI); Inflamación (IL10, IL-1 (IL-1a, IL-1b), IL-13, IL-17 (IL-17a (CTLA8), IL-17b, IL-17c, IL-17d, IL-17f), II23, Cx3cr1, ptpn22, TNFa, NOD2/CARD15 para IBD, IL-6, IL-12 (IL-12a, IL-12b), CTLA4, Cx3cl1); inmunodeficiencias combinadas severas (SCIDs)(JAK3, JAKL, DCLRE1C, ARTEMIS, SCIDA, RAG1, RAG2, ADA, PTPRC, CD45, LCA, IL7R, CD3D, T3D, IL2RG, SCIDX1, SCIDX, IMD4). combined immunodeficiency, (IL2RG, SCIDX1, SCIDX, IMD4); HIV-1 (CCL5, SCYA5, D17S136E, TCP228), susceptibility or HIV infection (IL10, CSIF, CMKBR2, CCR2, CMKBR5, CCCKR5 (CCR5)); Immunodeficiencies (CD3E, CD3G, AICDA, AID, HIGM2, TNFRSF5, CD40, UNG, DGU, HIGM4, TNFSF5, CD40LG, HIGM1, IGM, FOXP3, IPEX, AIID, XPID, PIDX, TNFRSF14B, TACI); Inflammation (IL10, IL-1 (IL-1a, IL-1b), IL-13, IL-17 (IL-17a (CTLA8), IL-17b, IL-17c, IL-17d, IL-17f), II23 , Cx3cr1, ptpn22, TNFa, NOD2 / CARD15 for IBD, IL-6, IL-12 (IL-12a, IL-12b), CTLA4, Cx3cl1); Severe combined immunodeficiencies (SCIDs) (JAK3, JAKL, DCLRE1C, ARTEMIS, SCIDA, RAG1, RAG2, ADA, PTPRC, CD45, LCA, IL7R, CD3D, T3D, IL2RG, SCIDX1, SCIDX, IMD4).

Enfermedades y trastornos Diseases and disorders
Neuropatía amiloide (TTR, PALB); Amiloidosis (APOA1, APP, AAA, CVAP, AD1, Amyloid neuropathy (TTR, PALB); Amyloidosis (APOA1, APP, AAA, CVAP, AD1,

metabólicos, hepáticos, metabolic, hepatic,
GSN, FGA, LYZ, TTR, PALB); Cirrosis (KRT18, KRT8, C1RH1A, NAIC, TEX292, GSN, FGA, LYZ, TTR, PALB); Cirrhosis (KRT18, KRT8, C1RH1A, NAIC, TEX292,

renales y proteínicos renal and protein
K1AA1988); fibrosis quística (CFTR, ABCC7, CF, MRP7); enfermedades de almacenamiento de glucógeno (SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); adenoma hepático, 142330 (TCF1, HNF1A, MODY3), fallo hepático, comienzo temprano y trastorno neurológico (SCOD1, SCO1), deficiencia de lipasa hepática (LIPC), Hepatoblastoma, cáncer y carcinomas (CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5; enfermedad del riñón quístico medular (UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); Fenilcetonuria (PAH, PKU1, QDPR, DHPR, PTS); enfermedad renal y hepática poliquística (FCYT, PKHD1, ARPKD, PKD 1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63). K1AA1988); cystic fibrosis (CFTR, ABCC7, CF, MRP7); glycogen storage diseases (SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); hepatic adenoma, 142330 (TCF1, HNF1A, MODY3), hepatic failure, early onset and neurological disorder (SCOD1, SCO1), hepatic lipase deficiency (LIPC), Hepatoblastoma, cancer and carcinomas (CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5; medullary cystic kidney disease (UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); Phenylketonuria (PAH, PKU1, QDPR, DHPR, PTS); Polycystic kidney and liver disease (FCYT, PKHD1, ARPKD, PKD 1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63).

Enfermedades y trastornos Diseases and disorders
Distrofia muscular de Becker (DMD, BMD, MYF6), Distrofia muscular de Duchenne Becker muscular dystrophy (DMD, BMD, MYF6), Duchenne muscular dystrophy

musculares / del esqueleto muscle / skeleton
(DMD, BMD); Distrofia muscular de Emery-Dreifuss (LMNA, LMN1, EMD2, FPLD, CMD1A, HGPS, LGMD1B, LMNA, LMN1, EMD2, FPLD, CMD1A); Distrofia muscular Facioscapulohumeral (FSHMD1A, FSHD1A); Distrofia muscular (FKRP, MDC1C, LGMD2I, LAMA2, LAMM, LARGE, KIAA0609, MDC1D, FCMD, TTID, MYOT, CAPN3, CANP3, DYSF, LGMD2B, SGCG, LGMD2C, DMDA1, SCG3, SGCA, ADL, DAG2, LGMD2D, DMDA2, SGCB, LGMD2E, SGCD, SGD, LGMD2F, CMD1L, TCAP, LGMD2G, CMD1N, TRIM32, HT2A, LGMD2H, FKRP, MDC1C, LGMD21, TTN, CMD1G, TMD, LGMD2J, POMT1, CAV3, LGMD1C, SEPN1, SELN, RSMD1, PLEC1, PLTN, EBS1); Osteopetrosis (LRP5, BMND1, LRP7, LR3, OPPG, VBCH2, CLCN7, CLC7, OPTA2, OSTM1, GL, TCIRG1, TIRC7, OC116, OPTB1); Atrofia muscular (VAPB, VAPC, ALS8, SMN1, SMA1, SMA2, SMA3, SMA4, BSCL2, SPG17, GARS, SMAD1, CMT2D, HEXB, IGHMBP2, SMUBP2, CATF1, SMARD1). (DMD, BMD); Emery-Dreifuss muscular dystrophy (LMNA, LMN1, EMD2, FPLD, CMD1A, HGPS, LGMD1B, LMNA, LMN1, EMD2, FPLD, CMD1A); Facioscapulohumeral muscular dystrophy (FSHMD1A, FSHD1A); Muscular dystrophy (FKRP, MDC1C, LGMD2I, LAMA2, LAMM, LARGE, KIAA0609, MDC1D, FCMD, TTID, MYOT, CAPN3, CANP3, DYSF, LGMD2B, SGCG, LGMD2C, DMDA1, SCG3, SGCA, ADM2, DMM, ADM2, DMM, ADM2 , SGCB, LGMD2E, SGCD, SGD, LGMD2F, CMD1L, TCAP, LGMD2G, CMD1N, TRIM32, HT2A, LGMD2H, FKRP, MDC1C, LGMD21, TTN, CMD1G, TMD, LGMD2J, POMT1, CAV3, LGVD, CAVC, RSV1, CAV3 , PLEC1, PLTN, EBS1); Osteopetrosis (LRP5, BMND1, LRP7, LR3, OPPG, VBCH2, CLCN7, CLC7, OPTA2, OSTM1, GL, TCIRG1, TIRC7, OC116, OPTB1); Muscular atrophy (VAPB, VAPC, ALS8, SMN1, SMA1, SMA2, SMA3, SMA4, BSCL2, SPG17, GARS, SMAD1, CMT2D, HEXB, IGHMBP2, SMUBP2, CATF1, SMARD1).

Enfermedades y trastornos neurológicos y neuronales Neurological and neuronal diseases and disorders
ALS (SOD1, ALS2, STEX, FUS, TARDBP, VEGF (VEGF-a, VEGF-b, VEGF-c); enfermedad de Alzheimer (APP, AAA, CVAP, AD1, APOE, AD2, PSEN2, AD4, STM2, APBB2, FE65L1, NOS3, PLAU, URK, ACE, DCP1, ACE1, MPO, PACIP1, PAXIP1L, PTIP, A2M, BLMH, BMH, PSEN1, AD3); Autismo (Mecp2, BZRAP1, MDGA2, Sema5A, Neurexina 1, GLO1, MECP2, RTT, PPMX, MRX16, MRX79, NLGN3, NLGN4, KIAA1260, AUTSX2); Síndrome frágil X (FMR2, FXR1, FXR2, mGLUR5); ALS (SOD1, ALS2, STEX, FUS, TARDBP, VEGF (VEGF-a, VEGF-b, VEGF-c); Alzheimer's disease (APP, AAA, CVAP, AD1, APOE, AD2, PSEN2, AD4, STM2, APBB2 , FE65L1, NOS3, PLAU, URK, ACE, DCP1, ACE1, MPO, PACIP1, PAXIP1L, PTIP, A2M, BLMH, BMH, PSEN1, AD3); Autism (Mecp2, BZRAP1, MDGA2, Sema5A, Neurexin 1, GLO1, GLO1, GLO1, GLO1, GLO1, PLOP1 , RTT, PPMX, MRX16, MRX79, NLGN3, NLGN4, KIAA1260, AUTSX2); Fragile syndrome X (FMR2, FXR1, FXR2, mGLUR5);

enfermedad de Huntington y trastornos tipo enfermedad (HD, IT15, PRNP, PRIP, JPH3, JP3, HDL2, TBP, SCA17); enfermedad de Parkinson (NR4A2, NURR1, NOT, TINUR, SNCAIP, TBP, SCA17, SNCA, NACP, PARK1, PARK4, DJ1, PARK7, LRRK2, PARK8, PINK1, PARK6, UCHL1, PARK5, SNCA, NACP, PARK1, PARK4, PRKN, PARK2, PDJ, DBH, NDUFV2); síndrome de Rett (MECP2, RTT, PPMX, MRX16, MRX79, CDKL5, STK9, MECP2, RTT, PPMX, MRX16, MRX79, x-Synuclein, DJ-1); Esquizofrenia (Neuregulin1 (Nrg1), Erb4 (receptor for Neuregulin), Complexin1 (Cplx1), Tph1 Triptófano hidroxilasa, Tph2, Triptófano hidroxilasa 2, Neurexina 1, GSK3, GSK3a, GSK3b, 5-HTT (Slc6a4), COMT, DRD (Drd1a), SLC6A3, DAOA, DTNBP1, Dao (Dao1)); Trastornos Relacionados con la secretasa (APH-1 (alfa y beta), Presenilina (Psen1), nicastrina, (Ncstn), PEN-2, Nos1, Parp1, Nat1, Nat2); Trastornos Repetición del trinucleótido (HTT (Huntington's Dx), SBMA/SMAX1/AR (Kennedy's Dx), FXN/X25 (Ataxia de Friedrich), ATX3 (Machado-Joseph's Dx), ATXN1 y ATXN2 (ataxias espinocerebelares), DMPK (distrofia miotónica), Atrofina-1 y Atn1 (DRPLA Dx), CBP (Creb-BP -inestabilidad global), VLDLR (Alzheimer's), Atxn7, Atxn10). Huntington's disease and disease-like disorders (HD, IT15, PRNP, PRIP, JPH3, JP3, HDL2, TBP, SCA17); Parkinson's disease (NR4A2, NURR1, NOT, TINUR, SNCAIP, TBP, SCA17, SNCA, NACP, PARK1, PARK4, DJ1, PARK7, LRRK2, PARK8, PINK1, PARK6, UCHL1, PARK5, SNCA, NACP, PARK1, PARK4, PRKN, PARK2, PDJ, DBH, NDUFV2); Rett syndrome (MECP2, RTT, PPMX, MRX16, MRX79, CDKL5, STK9, MECP2, RTT, PPMX, MRX16, MRX79, x-Synuclein, DJ-1); Schizophrenia (Neuregulin1 (Nrg1), Erb4 (receptor for Neuregulin), Complexin1 (Cplx1), Tph1 Tryptophan Hydroxylase, Tph2, Tryptophan Hydroxylase 2, Neurexin 1, GSK3, GSK3a, GSK3b, 5-HTT (Slc6a) ), SLC6A3, DAOA, DTNBP1, Dao (Dao1)); Secretase-related Disorders (APH-1 (alpha and beta), Presenilin (Psen1), nicastrine, (Ncstn), PEN-2, Nos1, Parp1, Nat1, Nat2); Disorders Trinucleotide repetition (HTT (Huntington's Dx), SBMA / SMAX1 / AR (Kennedy's Dx), FXN / X25 (Friedrich's Ataxia), ATX3 (Machado-Joseph's Dx), ATXN1 and ATXN2 (Spinocerebellar Ataxias), DMPK (Myotonic Dystrophy) ), Atrophin-1 and Atn1 (DRPLA Dx), CBP (Creb-BP-global instability), VLDLR (Alzheimer's), Atxn7, Atxn10).

Enfermedades y trastornos oculares Eye diseases and disorders
Degeneración macular relacionada con la edad (Abcr, Ccl2, Cc2, cp (ceruloplasmina), Timp3, catepsinaD, Vldlr, Ccr2); Catarata (CRYAA, CRYA1, CRYBB2, CRYB2, PITX3, BFSP2, CP49, CP47, CRYAA, CRYA1, PAX6, AN2, MGDA, CRYBA1, CRYB1, CRYGC, CRYG3, CCL, LIM2, MP19, CRYGD, CRYG4, BFSP2, CP49, CP47, HSF4, CTM, HSF4, CTM, MIP, AQP0, CRYAB, CRYA2, CTPP2, CRYBB1, CRYGD, CRYG4, CRYBB2, CRYB2, CRYGC, CRYG3, CCL, CRYAA, CRYA1, GJA8, CX50, CAE1, GJA3, CX46, CZP3, CAE3, CCM1, CAM, KRIT1); distrofia y turbidez de la córnea (APOA1, TGFBI, CSD2, CDGG1, CSD, BIGH3, CDG2, TACSTD2, TROP2, M1S1, VSX1, RINX, PPCD, PPD, KTCN, COL8A2, FECD, PPCD2, PIP5K3, CFD); Cornea plana congénita (KERA, CNA2); Glaucoma (MYOC, TIGR, GLC1A, JOAG, GPOA, OPTN, GLC1E, FIP2, HYPL, NRP, CYP1B1, GLC3A, OPA1, NTG, NPG, CYP1B1, GLC3A); amaurosis congénita de Leber (CRB1, RP12, CRX, CORD2, CRD, RPGRIP1, LCA6, CORD9, RPE65, RP20, AIPL1, LCA4, GUCY2D, GUC2D, LCA1, CORD6, RDH12, LCA3); Distrofia macular (ELOVL4, ADMD, STGD2, STGD3, RDS, RP7, PRPH2, PRPH, AVMD, AOFMD, VMD2). Age-related macular degeneration (Abcr, Ccl2, Cc2, cp (ceruloplasmin), Timp3, cathepsinD, Vldlr, Ccr2); Cataract (CRYAA, CRYA1, CRYBB2, CRYB2, PITX3, BFSP2, CP49, CP47, CRYAA, CRYA1, PAX6, AN2, MGDA, CRYBA1, CRYB1, CRYGC, CRYG3, CCL, LIM2, MP19, CRYG49, CRYGD, CRYGD, CRYGD, CRYGD CP47, HSF4, CTM, HSF4, CTM, MIP, AQP0, CRYAB, CRYA2, CTPP2, CRYBB1, CRYGD, CRYG4, CRYBB2, CRYB2, CRYGC, CRYG3, CCL, CRYAA, CRYA1, GJAE, CX503, CAX8, CX503 CZP3, CAE3, CCM1, CAM, KRIT1); Corneal dystrophy and turbidity (APOA1, TGFBI, CSD2, CDGG1, CSD, BIGH3, CDG2, TACSTD2, TROP2, M1S1, VSX1, RINX, PPCD, PPD, KTCN, COL8A2, FECD, PPCD2, PIP5K3, CFD); Congenital flat cornea (KERA, CNA2); Glaucoma (MYOC, TIGR, GLC1A, JOAG, GPOA, OPTN, GLC1E, FIP2, HYPL, NRP, CYP1B1, GLC3A, OPA1, NTG, NPG, CYP1B1, GLC3A); Leber congenital amaurosis (CRB1, RP12, CRX, CORD2, CRD, RPGRIP1, LCA6, CORD9, RPE65, RP20, AIPL1, LCA4, GUCY2D, GUC2D, LCA1, CORD6, RDH12, LCA3); Macular dystrophy (ELOVL4, ADMD, STGD2, STGD3, RDS, RP7, PRPH2, PRPH, AVMD, AOFMD, VMD2).

Tabla C Table C

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Señalización PI3K/AKT PI3K / AKT signaling
PRKCE; ITGAM; ITGA5; IRAK1; PRKAA2; EIF2AK2; PRKCE; ITGAM; ITGA5; IRAK1; PRKAA2; EIF2AK2;

PTEN; EIF4E; PRKCZ; GRK6; MAPK1; TSC1; PLK1; PTEN; EIF4E; PRKCZ; GRK6; MAPK1; TSC1; PLK1;

AKT2; IKBKB; PIK3CA; CDK8; CDKN1B; NFKB2; BCL2; AKT2; IKBKB; PIK3CA; CDK8; CDKN1B; NFKB2; BCL2;

PIK3CB; PPP2R1A; MAPK8; BCL2L1; MAPK3; TSC2; PIK3CB; PPP2R1A; MAPK8; BCL2L1; MAPK3; TSC2;

ITGA1; KRAS; EIF4EBP1; RELA; PRKCD; NOS3; ITGA1; KRAS; EIF4EBP1; RELAY; PRKCD; NOS3;

PRKAA1; MAPK9; CDK2; PPP2CA; PIM1; ITGB7; PRKAA1; MAPK9; CDK2; PPP2CA; PIM1; ITGB7;

YWHAZ; ILK; TP53; RAF1; IKBKG; RELB; DYRK1A; YWHAZ; ILK; TP53; RAF1; IKBKG; RELB; DYRK1A;

CDKN1A; ITGB1; MAP2K2; JAK1; AKT1; JAK2; PIK3R1; CDKN1A; ITGB1; MAP2K2; JAK1; AKT1; JAK2; PIK3R1;

CHUK; PDPK1; PPP2R5C; CTNNB1; MAP2K1; NFKB1; CHUK; PDPK1; PPP2R5C; CTNNB1; MAP2K1; NFKB1;

PAK3; ITGB3; CCND1; GSK3A; FRAP1; SFN; ITGA2; PAK3; ITGB3; CCND1; GSK3A; FRAP1; SFN; ITGA2;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

TTK; CSNK1A1; BRAF; GSK3B; AKT3; FOXO1; SGK; TTK; CSNK1A1; BRAF; GSK3B; AKT3; FOXO1; SGK;

HSP90AA1; RPS6KB1 HSP90AA1; RPS6KB1

Señalización ERK/MAPK ERK / MAPK signaling
PRKCE; ITGAM; ITGA5; HSPB1; IRAK1; PRKAA2; PRKCE; ITGAM; ITGA5; HSPB1; IRAK1; PRKAA2;

EIF2AK2; RAC1; RAP1A; TLN1; EIF4E; ELK1; GRK6; EIF2AK2; RAC1; RAP1A; TLN1; EIF4E; ELK1; GRK6;

MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; CREB1; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; CREB1;

PRKCI; PTK2; FOS; RPS6KA4; PIK3CB; PPP2R1A; PRKCI; PTK2; FOS; RPS6KA4; PIK3CB; PPP2R1A;

PIK3C3; MAPK8; MAPK3; ITGA1; ETS1; KRAS; MYCN; PIK3C3; MAPK8; MAPK3; ITGA1; ETS1; KRAS; MYCN;

EIF4EBP1; PPARG; PRKCD; PRKAA1; MAPK9; SRC; EIF4EBP1; PPARG; PRKCD; PRKAA1; MAPK9; SRC;

CDK2; PPP2CA; PIM1; PIK3C2A; ITGB7; YWHAZ; CDK2; PPP2CA; PIM1; PIK3C2A; ITGB7; YWHAZ;

PPP1CC; KSR1; PXN; RAF1; FYN; DYRK1A; ITGB1; PPP1CC; KSR1; PXN; RAF1; FYN; DYRK1A; ITGB1;

MAP2K2; PAK4; PIK3R1; STAT3; PPP2R5C; MAP2K1; MAP2K2; PAK4; PIK3R1; STAT3; PPP2R5C; MAP2K1;

PAK3; ITGB3; ESR1; ITGA2; MYC; TTK; CSNK1A1; PAK3; ITGB3; ESR1; ITGA2; MYC; TTK; CSNK1A1;

CRKL; BRAF; ATF4; PRKCA; SRF; STAT1; SGK CRKL; BRAF; ATF4; PRKCA; SRF; STAT1; SGK

Señalización Signaling
RAC1; TAF4B; EP300; SMAD2; TRAF6; PCAF; ELK1; RAC1; TAF4B; EP300; SMAD2; TRAF6; PCAF; ELK1;

Receptor Glucocorticoide Glucocorticoid Receptor
MAPK1; SMAD3; AKT2; IKBKB; NCOR2; UBE2I; MAPK1; SMAD3; AKT2; IKBKB; NCOR2; UBE2I;

PIK3CA; CREB1; FOS; HSPA5; NFKB2; BCL2; PIK3CA; CREB1; FOS; HSPA5; NFKB2; BCL2;

MAP3K14; STAT5B; PIK3CB; PIK3C3; MAPKB; BCL2L1; MAP3K14; STAT5B; PIK3CB; PIK3C3; MAPKB; BCL2L1;

MAPK3; TSC22D3; MAPK10; NRIP1; KRAS; MAPK13; MAPK3; TSC22D3; MAPK10; NRIP1; KRAS; MAPK13;

RELA; STAT5A; MAPK9; NOS2A; PBX1; NR3C1; RELAY; STAT5A; MAPK9; NOS2A; PBX1; NR3C1;

PIK3C2A; CDKN1C; TRAF2; SERPINE1; NCOA3; PIK3C2A; CDKN1C; TRAF2; SERPINE1; NCOA3;

MAPK14; TNF; RAF1; IKBKG; MAP3K7; CREBBP; MAPK14; TNF; RAF1; IKBKG; MAP3K7; CREBBP;

CDKN1A; MAP2K2; JAK1; IL8; NCOA2; AKT1; JAK2; CDKN1A; MAP2K2; JAK1; IL8; NCOA2; AKT1; JAK2;

PIK3R1; CHUK; STAT3; MAP2K1; NFKB1; TGFBR1; PIK3R1; CHUK; STAT3; MAP2K1; NFKB1; TGFBR1;

ESR1; SMAD4; CEBPB; JUN; AR; AKT3; CCL2; MMP1; STAT1; IL6; HSP90AA1 ESR1; SMAD4; CEBPB; JUN; AR; AKT3; CCL2; MMP1; STAT1; IL6; HSP90AA1

Señalización Guía Axonal Axonal Guide Signaling
PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; ADAM12; PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; ADAM12;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

IGF1; RAC1; RAP1A; EIF4E; PRKCZ; NRP1; NTRK2; IGF1; RAC1; RAP1A; EIF4E; PRKCZ; NRP1; NTRK2;

ARHGEF7; SMO; ROCK2; MAPK1; PGF; RAC2; ARHGEF7; SAINT; ROCK2; MAPK1; PGF; RAC2;

PTPN11; GNAS; AKT2; PIK3CA; ERBB2; PRKCI; PTK2; PTPN11; GNAS; AKT2; PIK3CA; ERBB2; PRKCI; PTK2;

CFL1; GNAQ; PIK3CB; CXCL12; PIK3C3; WNT11; CFL1; GNAQ; PIK3CB; CXCL12; PIK3C3; WNT11;

PRKD1; GNB2L1; ABL1; MAPK3; ITGA1; KRAS; RHOA; PRKD1; GNB2L1; ABL1; MAPK3; ITGA1; KRAS; RHOA;

PRKCD; PIK3C2A; ITGB7; GLI2; PXN; VASP; RAF1; PRKCD; PIK3C2A; ITGB7; GLI2; PXN; VASP; RAF1;

FYN; ITGB1; MAP2K2; PAK4; ADAM17; AKT1; PIK3R1; FYN; ITGB1; MAP2K2; PAK4; ADAM17; AKT1; PIK3R1;

GLI1; WNT5A; ADAM10; MAP2K1; PAK3; ITGB3; GLI1; WNT5A; ADAM10; MAP2K1; PAK3; ITGB3;

CDC42; VEGFA; ITGA2; EPHA8; CRKL; RND1; GSK3B; CDC42; VEGFA; ITGA2; EPHA8; CRKL; RND1; GSK3B;

AKT3; PRKCA AKT3; PRKCA

Señalización Receptor Efrina Efrina Receptor Signaling
PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; IRAK1; PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; IRAK1;

PRKAA2; EIF2AK2; RAC I; RAP1A; GRK6; ROCK2; PRKAA2; EIF2AK2; RAC I; RAP1A; GRK6; ROCK2;

MAPK1; PGF; RAC2; PTPN11; GNAS; PLK1; AKT2; MAPK1; PGF; RAC2; PTPN11; GNAS; PLK1; AKT2;

DOK1; CDK8; CREB1; PTK2; CFL1; GNAQ; MAP3K14; DOK1; CDK8; CREB1; PTK2; CFL1; GNAQ; MAP3K14;

CXCL12; MAPK8; GNB2L1; ABL1; MAPK3; ITGA1; CXCL12; MAPK8; GNB2L1; ABL1; MAPK3; ITGA1;

KRAS; RHOA; PRKCD; PRKAA1; MAPK9; SRC; CDK2; KRAS; RHOA; PRKCD; PRKAA1; MAPK9; SRC; CDK2;

PIM1; ITGB7; PXN; RAF1; FYN; DYRK1A; ITGB1; PIM1; ITGB7; PXN; RAF1; FYN; DYRK1A; ITGB1;

MAP2K2; PAK4; AKT1; JAK2; STAT3; ADAM10; MAP2K2; PAK4; AKT1; JAK2; STAT3; ADAM10;

MAP2K1; PAK3; ITGB3; CDC42; VEGFA; ITGA2; MAP2K1; PAK3; ITGB3; CDC42; VEGFA; ITGA2;

EPHA8; TTK; CSNK1A1; CRKL; BRAF; PTPN13; ATF4; EPHA8; TTK; CSNK1A1; CRKL; BRAF; PTPN13; ATF4;

AKT3; SGK AKT3; SGK

Señalización Signaling
ACTN4; PRKCE; ITGAM; ROCK1; ITGA5; IRAK1; ACTN4; PRKCE; ITGAM; ROCK1; ITGA5; IRAK1;

cictoesqueleto de actina actin cytoskeleton
PRKAA2; EIF2AK2; RAC1; INS; ARHGEF7; GRK6; PRKAA2; EIF2AK2; RAC1; INS; ARHGEF7; GRK6;

ROCK2; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; ROCK2; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8;

PTK2; CFL1; PIK3CB; MYH9; DIAPH1; PIK3C3; MAPK8; PTK2; CFL1; PIK3CB; MYH9; DIAPH1; PIK3C3; MAPK8;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

F2R; MAPK3; SLC9A1; ITGA1; KRAS; RHOA; PRKCD; F2R; MAPK3; SLC9A1; ITGA1; KRAS; RHOA; PRKCD;

PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; ITGB7; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; ITGB7;

PPP1CC; PXN; VIL2; RAF1; GSN; DYRK1A; ITGB1; PPP1CC; PXN; VIL2; RAF1; GSN; DYRK1A; ITGB1;

MAP2K2; PAK4; PIP5K1A; PIK3R1; MAP2K1; PAK3; MAP2K2; PAK4; PIP5K1A; PIK3R1; MAP2K1; PAK3;

ITGB3; CDC42; APC; ITGA2; TTK; CSNK1A1; CRKL; ITGB3; CDC42; APC; ITGA2; TTK; CSNK1A1; CRKL;

BRAF; VAV3; SGK BRAF; VAV3; SGK

Señalización Signaling
PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4; TGM2; PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4; TGM2;

enfermedad de Huntington huntington's disease
MAPK1; CAPNS1; AKT2; EGFR; NCOR2; SP1; CAPN2; MAPK1; CAPNS1; AKT2; EGFR; NCOR2; SP1; CAPN2;

PIK3CA; HDAC5; CREB1; PRKCI; HSPA5; REST; PIK3CA; HDAC5; CREB1; PRKCI; HSPA5; REST;

GNAQ; PIK3CB; PIK3C3; MAPKB; IGF1R; PRKD1; GNAQ; PIK3CB; PIK3C3; MAPKB; IGF1R; PRKD1;

GNB2L1; BCL2L1; CAPN1; MAPK3; CASP8; HDAC2; GNB2L1; BCL2L1; CAPN1; MAPK3; CASP8; HDAC2;

HDAC7A; PRKCD; HDAC11; MAPK9; HDAC9; PIK3C2A; HDAC7A; PRKCD; HDAC11; MAPK9; HDAC9; PIK3C2A;

HDAC3; TP53; CASP9; CREBBP; AKT1; PIK3R1; HDAC3; TP53; CASP9; CREBBP; AKT1; PIK3R1;

PDPK1; CASP1; APAF1; FRAP1; CASP2; JUN; BAX; PDPK1; CASP1; APAF1; FRAP1; CASP2; JUN; BAX;

ATF4; AKT3; PRKCA; CLTC; SGK; HDAC6; CASP3 ATF4; AKT3; PRKCA; CLTC; SGK; HDAC6; CASP3

Señalización de muerte celular programada Programmed cell death signaling
PRKCE; ROCK1; BID; IRAK1; PRKAA2; EIF2AK2; BAK1; PRKCE; ROCK1; IDB; IRAK1; PRKAA2; EIF2AK2; BAK1;

BIRC4; GRK6; MAPK1; CAPNS1; PLK1; AKT2; IKBKB; BIRC4; GRK6; MAPK1; CAPNS1; PLK1; AKT2; IKBKB;

CAPN2; CDK8; FAS; NFKB2; BCL2; MAP3K14; MAPK8; CAPN2; CDK8; FAS; NFKB2; BCL2; MAP3K14; MAPK8;

BCL2L1; CAPN1; MAPK3; CASP8; KRAS; RELA; BCL2L1; CAPN1; MAPK3; CASP8; KRAS; RELAY;

PRKCD; PRKAA1; MAPK9; CDK2; PIM1; TP53; TNF; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; TP53; TNF;

RAF1; IKBKG; RELB; CASP9; DYRK1A; MAP2K2; RAF1; IKBKG; RELB; CASP9; DYRK1A; MAP2K2;

CHUK; APAF1; MAP2K1; NFKB1; PAK3; LMNA; CASP2; CHUK; APAF1; MAP2K1; NFKB1; PAK3; LMNA; CASP2;

BIRC2; TTK; CSNK1A1; BRAF; BAX; PRKCA; SGK; BIRC2; TTK; CSNK1A1; BRAF; BAX; PRKCA; SGK;

CASP3; BIRC3; PARP1 CASP3; BIRC3; PARP1

Señalización de Receptor de células B B cell receptor signaling
RAC1; PTEN; LYN; ELK1; MAPK1; RAC2; PTPN11; RAC1; PTEN; LYN; ELK1; MAPK1; RAC2; PTPN11;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

AKT2; IKBKB; PIK3CA; CREB1; SYK; NFKB2; CAMK2A; AKT2; IKBKB; PIK3CA; CREB1; SYK; NFKB2; CAMK2A;

MAP3K14; PIK3CB; PIK3C3; MAPK8; BCL2L1; ABL1; MAP3K14; PIK3CB; PIK3C3; MAPK8; BCL2L1; ABL1;

MAPK3; ETS1; KRAS; MAPK13; RELA; PTPN6; MAPK9; MAPK3; ETS1; KRAS; MAPK13; RELAY; PTPN6; MAPK9;

EGRI; PIK3C2A; BTK; MAPK14; RAF1; IKBKG; RELB; EGRI; PIK3C2A; BTK; MAPK14; RAF1; IKBKG; RELB;

MAP3K7; MAP2K2; AKT1; PIK3R1; CHUK; MAP2K1; MAP3K7; MAP2K2; AKT1; PIK3R1; CHUK; MAP2K1;

NFKB1; CDC42; GSK3A; FRAP1; BCL6; BCL10; JUN; NFKB1; CDC42; GSK3A; FRAP1; BCL6; BCL10; JUN;

GSK3B; ATF4; AKT3; VAV3; RPS6KB1 GSK3B; ATF4; AKT3; VAV3; RPS6KB1

Señalización de diapédesis Diademic signaling
ACTN4; CD44; PRKCE; ITGAM; ROCK1; CXCR4; CYBA; ACTN4; CD44; PRKCE; ITGAM; ROCK1; CXCR4; CYBA;

RAC1; RAP1A; PRKCZ; ROCK2; RAC2; PTPN11; RAC1; RAP1A; PRKCZ; ROCK2; RAC2; PTPN11;

MMP14; PIK3CA; PRKCI; PTK2; PIK3CB; CXCL12; MMP14; PIK3CA; PRKCI; PTK2; PIK3CB; CXCL12;

PIK3C3; MAPK8; PRKD1; ABL1; MAPK10; CYBB; PIK3C3; MAPK8; PRKD1; ABL1; MAPK10; CYBB;

MAPK13; RHOA; PRKCD; MAPK9; SRC; PIK3C2A; BTK; MAPK13; RHOA; PRKCD; MAPK9; SRC; PIK3C2A; BTK;

MAPK14; NOX1; PXN; VIL2; VASP; TTGB1; MAP2K2; MAPK14; NOX1; PXN; VIL2; VASP; TTGB1; MAP2K2;

CTNND1; PIK3R1; CTNNB1; CLDN1; CDC42; F11R; ITK; CTNND1; PIK3R1; CTNNB1; CLDN1; CDC42; F11R; ITK;

CRKL; VAV3; CTTN; PRKCA; MMP1; MMP9 CRKL; VAV3; CTTN; PRKCA; MMP1; MMP9

Señalización de Integrina Integrin signaling
ACTN4; ITGAM; ROCK1; ITGA5; RAC1; PTEN; RAP1A; ACTN4; ITGAM; ROCK1; ITGA5; RAC1; PTEN; RAP1A;

TLN1; ARHGEF7; MAPK1; RAC2; CAPNS1; AKT2; TLN1; ARHGEF7; MAPK1; RAC2; CAPNS1; AKT2;

CAPN2; PIK3CA; PTK2; PIK3CB; PIK3C3; MAPK8; CAPN2; PIK3CA; PTK2; PIK3CB; PIK3C3; MAPK8;

CAV1; CAPN1; ABL1; MAPK3; ITGA1; KRAS; RHOA; CAV1; CAPN1; ABL1; MAPK3; ITGA1; KRAS; RHOA;

SRC; PIK3C2A; ITGB7; PPP1CC; ILK; PXN; VASP; SRC; PIK3C2A; ITGB7; PPP1CC; ILK; PXN; VASP;

RAF1; FYN; ITGB1; MAP2K2; PAK4; AKT1; PIK3R1; RAF1; FYN; ITGB1; MAP2K2; PAK4; AKT1; PIK3R1;

TNK2; MAP2K1; PAK3; ITGB3; CDC42; RND3; ITGA2; TNK2; MAP2K1; PAK3; ITGB3; CDC42; RND3; ITGA2;

CRKL; BRAF; GSK3B; AKT3 CRKL; BRAF; GSK3B; AKT3

Señalización Signaling
IRAK1; SOD2; MYD88; TRAF6; ELK1; MAPK1; PTPN11; IRAK1; SOD2; MYD88; TRAF6; ELK1; MAPK1; PTPN11;

de Respuesta de fase aguda Acute phase response
AKT2; IKBKB; PIK3CA; FOS; NFKB2; MAP3K14; AKT2; IKBKB; PIK3CA; FOS; NFKB2; MAP3K14;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

PIK3CB; MAPK8; RIPK1; MAPK3; IL6ST; KRAS; PIK3CB; MAPK8; RIPK1; MAPK3; IL6ST; KRAS;

MAPK13; IL6R; RELA; SOCS1; MAPK9; FTL; NR3C1; MAPK13; IL6R; RELAY; SOCS1; MAPK9; FTL; NR3C1;

TRAF2; SERPINE1; MAPK14; TNF; RAF1; PDK1; TRAF2; SERPINE1; MAPK14; TNF; RAF1; PDK1;

IKBKG; RELB; MAP3K7; MAP2K2; AKT1; JAK2; PIK3R1; IKBKG; RELB; MAP3K7; MAP2K2; AKT1; JAK2; PIK3R1;

CHUK; STAT3; MAP2K1; NFKB1; FRAP1; CEBPB; JUN; CHUK; STAT3; MAP2K1; NFKB1; FRAP1; CEBPB; JUN;

AKT3; IL1R1; IL6 AKT3; IL1R1; IL6

Señalización de PTEN PTEN signaling
ITGAM; ITGA5; RAC1; PTEN; PRKCZ; BCL2L 11; ITGAM; ITGA5; RAC1; PTEN; PRKCZ; BCL2L 11;

MAPK1; RAC2; AKT2; EGFR; IKBKB; CBL; PIK3CA; MAPK1; RAC2; AKT2; EGFR; IKBKB; CBL; PIK3CA;

CDKN1B; PTK2; NFKB2; BCL2; PIK3CB; BCL2L1; CDKN1B; PTK2; NFKB2; BCL2; PIK3CB; BCL2L1;

MAPK3; ITGA1; KRAS; ITGB7; ILK; PDGFRB; INSR; MAPK3; ITGA1; KRAS; ITGB7; ILK; PDGFRB; INSR;

RAF1; IKBKG; CASP9; CDKN1A; ITGB1; MAP2K2; RAF1; IKBKG; CASP9; CDKN1A; ITGB1; MAP2K2;

AKT1; PIK3R1; CHUK; PDGFRA; PDPK1; MAP2K1; AKT1; PIK3R1; CHUK; PDGFRA; PDPK1; MAP2K1;

NFKB1; ITGB3; CDC42; CCND1; GSK3A; ITGA2; NFKB1; ITGB3; CDC42; CCND1; GSK3A; ITGA2;

GSK3B; AKT3; FOXO1; CASP3; RPS6KB1 GSK3B; AKT3; FOXO1; CASP3; RPS6KB1

Señalización de p53 P53 signaling
PTEN; EP300; BBC3; PCAF; FASN; BRCA1; GADD45A; PTEN; EP300; BBC3; PCAF; FASN; BRCA1; GADD45A;

BIRC5; AKT2; PIK3CA; CHEK1; TP53INP1; BCL2; BIRC5; AKT2; PIK3CA; CHEK1; TP53INP1; BCL2;

PIK3CB; PIK3C3; MAPK8; THBS1; ATR; BCL2L1; E2F1; PIK3CB; PIK3C3; MAPK8; THBS1; ATR; BCL2L1; E2F1;

PMAIP1; CHEK2; TNFRSF10B; TP73; RB1; HDAC9; PMAIP1; CHEK2; TNFRSF10B; TP73; RB1; HDAC9;

CDK2; PIK3C2A; MAPK14; TP53; LRDD; CDKN1A; CDK2; PIK3C2A; MAPK14; TP53; LRDD; CDKN1A;

HIPK2; AKT1; PIK3R1; RRM2B; APAF1; CTNNB1; HIPK2; AKT1; PIK3R1; RRM2B; APAF1; CTNNB1;

SIRT1; CCND1; PRKDC; ATM; SFN; CDKN2A; JUN; SIRT1; CCND1; PRKDC; ATM; SFN; CDKN2A; JUN;

SNAI2; GSK3B; BAX; AKT3 SNAI2; GSK3B; BAX; AKT3

Señalización Signaling
HSPB1; EP300; FASN; TGM2; RXRA; MAPK1; NQO1; HSPB1; EP300; FASN; TGM2; RXRA; MAPK1; NQO1;

de Receptor Arilhidrocarbonado of Arylhydrocarbon Receiver
NCOR2; SP1; ARNT; CDKN1B; FOS; CHEK1; NCOR2; SP1; TRNA; CDKN1B; FOS; CHEK1;

SMARCA4; NFKB2; MAPK8; ALDH1A1; ATR; E2F1; SMARCA4; NFKB2; MAPK8; ALDH1A1; ATR; E2F1;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

MAPK3; NRIP1; CHEK2; RELA; TP73; GSTP1; RB1; MAPK3; NRIP1; CHEK2; RELAY; TP73; GSTP1; RB1;

SRC; CDK2; AHR; NFE2L2; NCOA3; TP53; TNF; SRC; CDK2; AHR; NFE2L2; NCOA3; TP53; TNF;

CDKN I A; NCOA2; APAF1; NFKB1; CCND1; ATM; ESR1; CDKN I A; NCOA2; APAF1; NFKB1; CCND1; ATM; ESR1;

CDKN2A; MYC; JUN; ESR2; BAX; IL6; CYP1B1; CDKN2A; MYC; JUN; ESR2; BAX; IL6; CYP1B1;

HSP90AA1 HSP90AA1

Señalización de Signaling of
PRKCE; EP300; PRKCZ; RXRA; MAPK1; NQO1; PRKCE; EP300; PRKCZ; RXRA; MAPK1; NQO1;

Metabolismo Xenobiótico Xenobiotic metabolism
NCOR2; PIK3CA; ARNT; PRKCI; NFKB2; CAMK2A; NCOR2; PIK3CA; TRNA; PRKCI; NFKB2; CAMK2A;

PIK3CB; PPP2R1A; PIK3C3; MAPK8; PRKD1; PIK3CB; PPP2R1A; PIK3C3; MAPK8; PRKD1;

ALDH1A1; MAPK3; NRIP1; KRAS; MAPK13; PRKCD; ALDH1A1; MAPK3; NRIP1; KRAS; MAPK13; PRKCD;

GSTP1; MAPK9; NOS2A; ABCB1; AHR; PPP2CA; FTL; GSTP1; MAPK9; NOS2A; ABCB1; AHR; PPP2CA; FTL;

NFE2L2; PIK3C2A; PPARGC1A; MAPK14; TNF; RAF1; NFE2L2; PIK3C2A; PPARGC1A; MAPK14; TNF; RAF1;

CREBBP; MAP2K2; PIK3R1; PPP2R5C; MAP2K1; CREBBP; MAP2K2; PIK3R1; PPP2R5C; MAP2K1;

NFKB1; KEAP1; PRKCA; EIF2AK3; IL6; CYP1B1; NFKB1; KEAP1; PRKCA; EIF2AK3; IL6; CYP1B1;

HSP90AA1 HSP90AA1

Señalización de SAPK/JNK SAPK / JNK signaling
PRKCE; IRAK1; PRKAA2; EIF2AK2; RAC1; ELK1; PRKCE; IRAK1; PRKAA2; EIF2AK2; RAC1; ELK1;

GRK6; MAPK1; GADD45A; RAC2; PLK1; AKT2; PIK3CA; GRK6; MAPK1; GADD45A; RAC2; PLK1; AKT2; PIK3CA;

FADD; CDK8; PIK3CB; PIK3C3; MAPK8; R1PK1; FADD; CDK8; PIK3CB; PIK3C3; MAPK8; R1PK1;

GNB2L1; IRS1; MAPK3; MAPK10; DAXX; KRAS; GNB2L1; IRS1; MAPK3; MAPK10; DAXX; KRAS;

PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A;

TRAF2; TP53; LCK; MAP3K7; DYRK1A; MAP2K2; TRAF2; TP53; LCK; MAP3K7; DYRK1A; MAP2K2;

PIK3R1; MAP2K1; PAK3; CDC42; JUN; TTK; CSNK1A1; PIK3R1; MAP2K1; PAK3; CDC42; JUN; TTK; CSNK1A1;

CRKL; BRAF; SGK CRKL; BRAF; SGK

Señalización de PPAr/RXR PPAr / RXR signaling
PRKAA2; EP300; INS; SMAD2; TRAF6; PPARA; FASN; PRKAA2; EP300; INS; SMAD2; TRAF6; PPARA; FASN;

RXRA; MAPK1; SMAD3; GNAS; IKBKB; NCOR2; RXRA; MAPK1; SMAD3; GNAS; IKBKB; NCOR2;

ABCA1; GNAQ; NFKB2; MAP3K14; STAT5B; MAPK8; ABCA1; GNAQ; NFKB2; MAP3K14; STAT5B; MAPK8;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

IRS1; MAPK3; KRAS; RELA; PRKAA1; PPARGC1A; IRS1; MAPK3; KRAS; RELAY; PRKAA1; PPARGC1A;

NCOA3; MAPK14; INSR; RAF1; IKBKG; RELB; MAP3K7; NCOA3; MAPK14; INSR; RAF1; IKBKG; RELB; MAP3K7;

CREBBP; MAP2K2; JAK2; CHUK; MAP2K1; NFKB 1; CREBBP; MAP2K2; JAK2; CHUK; MAP2K1; NFKB 1;

TGFBR1; SMAD4; JUN; IL1R1; PRKCA; IL6; HSP90AA1; ADIPOQ TGFBR1; SMAD4; JUN; IL1R1; PRKCA; IL6; HSP90AA1; ADIPOQ

Señalización de NF-KB NF-KB signaling
IRAK1; EIF2AK2; EP300; INS; MYD88; PRKCZ; TRAF6; IRAK1; EIF2AK2; EP300; INS; MYD88; PRKCZ; TRAF6;

TBK1; AKT2; EGFR; IKBKB; PIK3CA; BTRC; NFKB2; TBK1; AKT2; EGFR; IKBKB; PIK3CA; BTRC; NFKB2;

MAP3K14; PIK3CB; PIK3C3; MAPK8; RIPK1; HDAC2; MAP3K14; PIK3CB; PIK3C3; MAPK8; RIPK1; HDAC2;

KRAS; RELA; PIK3C2A; TRAF2; TLR4; PDGFRB; TNF; KRAS; RELAY; PIK3C2A; TRAF2; TLR4; PDGFRB; TNF;

INSR; LCK; IKBKG; RELB; MAP3K7; CREBBP; AKT1; INSR; LCK; IKBKG; RELB; MAP3K7; CREBBP; AKT1;

PIK3R1; CHUK; PDGFRA; NFKB1; TLR2; BCL10; PIK3R1; CHUK; PDGFRA; NFKB1; TLR2; BCL10;

GSK3B; AKT3; TNFAIP3; IL1R1 GSK3B; AKT3; TNFAIP3; IL1R1

Señalización de Neuregulina Neuregulin signaling
ERBB4; PRKCE; ITGAM; ITGA5; PTEN; PRKCZ; ELK1; ERBB4; PRKCE; ITGAM; ITGA5; PTEN; PRKCZ; ELK1;

MAPK1; PTPN11; AKT2; EGFR; ERBB2; PRKCI; MAPK1; PTPN11; AKT2; EGFR; ERBB2; PRKCI;

CDKN1B; STAT5B; PRKD1; MAPK3; ITGA1; KRAS; CDKN1B; STAT5B; PRKD1; MAPK3; ITGA1; KRAS;

PRKCD; STAT5A; SRC; ITGB7; RAF1; ITGB1; MAP2K2; PRKCD; STAT5A; SRC; ITGB7; RAF1; ITGB1; MAP2K2;

ADAM17; AKT1; PIK3R1; PDPK1; MAP2K1; ITGB3; ADAM17; AKT1; PIK3R1; PDPK1; MAP2K1; ITGB3;

EREG; FRAP1; PSEN1; ITGA2; MYC; NRG1; CRKL; EREG; FRAP1; PSEN1; ITGA2; MYC; NRG1; CRKL;

AKT3; PRKCA; HSP90AA1; RPS6KB1 AKT3; PRKCA; HSP90AA1; RPS6KB1

Señalización de Signaling of
CD44; EP300; LRP6; DVL3; CSNK1E; GJA1; SMO; CD44; EP300; LRP6; DVL3; CSNK1E; GJA1; SAINT;

catenina Wnt y Beta Wnt and Beta catenin
AKT2; PIN1; CDH1; BTRC; GNAQ; MARK2; PPP2R1A; AKT2; PIN1; CDH1; BTRC; GNAQ; MARK2; PPP2R1A;

WNT11; SRC; DKK1; PPP2CA; SOX6; SFRP2; ILK; WNT11; SRC; DKK1; PPP2CA; SOX6; SFRP2; ILK;

LEF1; SOX9; TP53; MAP3K7; CREBBP; TCF7L2; AKT1; LEF1; SOX9; TP53; MAP3K7; CREBBP; TCF7L2; AKT1;

PPP2R5C; WNT5A; LRP5; CTNNB1; TGFBR1; CCND1; PPP2R5C; WNT5A; LRP5; CTNNB1; TGFBR1; CCND1;

GSK3A; DVL1; APC; CDKN2A; MYC; CSNK1A1; GSK3B; GSK3A; DVL1; APC; CDKN2A; MYC; CSNK1A1; GSK3B;

AKT3; SOX2 AKT3; SOX2

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Señalización de Receptor de Insulina Insulin Receptor Signaling
PTEN; INS; EIF4E; PTPN1; PRKCZ; MAPK1; TSC1; PTEN; INS; EIF4E; PTPN1; PRKCZ; MAPK1; TSC1;

PTPN11; AKT2; CBL; PIK3CA; PRKCI; PIK3CB; PIK3C3; PTPN11; AKT2; CBL; PIK3CA; PRKCI; PIK3CB; PIK3C3;

MAPK8; IRS1; MAPK3; TSC2; KRAS; EIF4EBP1; MAPK8; IRS1; MAPK3; TSC2; KRAS; EIF4EBP1;

SLC2A4; PIK3C2A; PPP1CC; INSR; RAF1; FYN; SLC2A4; PIK3C2A; PPP1CC; INSR; RAF1; FYN;

MAP2K2; JAK1; AKT1; JAK2; PIK3R1; PDPK1; MAP2K1; MAP2K2; JAK1; AKT1; JAK2; PIK3R1; PDPK1; MAP2K1;

GSK3A; FRAP1; CRKL; GSK3B; AKT3; FOXO1; SGK; GSK3A; FRAP1; CRKL; GSK3B; AKT3; FOXO1; SGK;

RPS6KB1 RPS6KB1

Señalización de IL-6 IL-6 signaling
HSPB1; TRAF6; MAPKAPK2; ELK1; MAPK1; PTPN11; HSPB1; TRAF6; MAPKAPK2; ELK1; MAPK1; PTPN11;

IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK3; IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK3;

MAPK10; IL6ST; KRAS; MAPK13; IL6R; RELA; SOCS1; MAPK10; IL6ST; KRAS; MAPK13; IL6R; RELAY; SOCS1;

MAPK9; ABCB1; TRAF2; MAPK14; TNF; RAF1; IKBKG; MAPK9; ABCB1; TRAF2; MAPK14; TNF; RAF1; IKBKG;

RELB; MAP3K7; MAP2K2; IL8; JAK2; CHUK; STAT3; RELB; MAP3K7; MAP2K2; IL8; JAK2; CHUK; STAT3;

MAP2K1; NFKB1; CEBPB; JUN; IL1R1; SRF; IL6 MAP2K1; NFKB1; CEBPB; JUN; IL1R1; SRF; IL6

Colestasis Hepática Hepatic Cholestasis
PRKCE; IRAK1; INS; MYD88; PRKCZ; TRAF6; PPARA; PRKCE; IRAK1; INS; MYD88; PRKCZ; TRAF6; PPARA;

RXRA; IKBKB; PRKCI; NFKB2; MAP3K14; MAPK8; RXRA; IKBKB; PRKCI; NFKB2; MAP3K14; MAPK8;

PRKD1; MAPK10; RELA; PRKCD; MAPK9; ABCB1; PRKD1; MAPK10; RELAY; PRKCD; MAPK9; ABCB1;

TRAF2; TLR4; TNF; INSR; IKBKG; RELB; MAP3K7; IL8; TRAF2; TLR4; TNF; INSR; IKBKG; RELB; MAP3K7; IL8;

CHUK; NR1H2; TJP2; NFKB1; ESR1; SREBF1; FGFR4; CHUK; NR1H2; TJP2; NFKB1; ESR1; SREBF1; FGFR4;

JUN; IL1R1; PRKCA; IL6 JUN; IL1R1; PRKCA; IL6

Señalización de IGF-1 IGF-1 signaling
IGF 1; PRKCZ; ELK1; MAPK1; PTPN11; NEDD4; AKT2; IGF 1; PRKCZ; ELK1; MAPK1; PTPN11; NEDD4; AKT2;

PIK3CA; PRKCI; PTK2; FOS; PIK3CB; PIK3C3; MAPK8; PIK3CA; PRKCI; PTK2; FOS; PIK3CB; PIK3C3; MAPK8;

IGF1R; IRS1; MAPK3; IGFBP7; KRAS; PIK3C2A; IGF1R; IRS1; MAPK3; IGFBP7; KRAS; PIK3C2A;

YWHAZ; PXN; RAF1; CASP9; MAP2K2; AKT1; PIK3R1; YWHAZ; PXN; RAF1; CASP9; MAP2K2; AKT1; PIK3R1;

PDPK1; MAP2K1; IGFBP2; SFN; JUN; CYR61; AKT3; PDPK1; MAP2K1; IGFBP2; SFN; JUN; CYR61; AKT3;

FOXO1; SRF; CTGF; RPS6KB1 FOXO1; SRF; CTGF; RPS6KB1

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Respuesta de Estrés Stress Response
PRKCE; EP300; SOD2; PRKCZ; MAPK1; SQSTM1; PRKCE; EP300; SOD2; PRKCZ; MAPK1; SQSTM1;

Oxidativo mediado por NRF2 Oxidative mediated by NRF2
NQO1; PIK3CA; PRKCI; FOS; PIK3CB; PIK3C3; MAPK8; NQO1; PIK3CA; PRKCI; FOS; PIK3CB; PIK3C3; MAPK8;

PRKD1; MAPK3; KRAS; PRKCD; GSTP1; MAPK9; FTL; PRKD1; MAPK3; KRAS; PRKCD; GSTP1; MAPK9; FTL;

NFE2L2; PIK3C2A; MAPK14; RAF1; MAP3K7; CREBBP; NFE2L2; PIK3C2A; MAPK14; RAF1; MAP3K7; CREBBP;

MAP2K2; AKT1; PIK3R1; MAP2K1; PPIB; JUN; KEAP1; MAP2K2; AKT1; PIK3R1; MAP2K1; PPIB; JUN; KEAP1;

GSK3B; ATF4; PRKCA; EIF2AK3; HSP90AA1 GSK3B; ATF4; PRKCA; EIF2AK3; HSP90AA1

Fibrosis Hepática / Hepatic Fibrosis /
EDN1; 1GF1; KDR; FLT1; SMAD2; FGFR1; MET; PGF; EDN1; 1GF1; KDR; FLT1; SMAD2; FGFR1; MET; PGF;

Activación de células estelares hepáticas Stellar liver cell activation
SMAD3; EGFR; FAS; CSF1; NFKB2; BCL2; MYH9; SMAD3; EGFR; FAS; CSF1; NFKB2; BCL2; MYH9;

IGF1R; IL6R; RELA; TLR4; PDGFRB; TNF; RELB; IL8; IGF1R; IL6R; RELAY; TLR4; PDGFRB; TNF; RELB; IL8;

PDGFRA; NFKB1; TGFBR1; SMAD4; VEGFA; BAX; PDGFRA; NFKB1; TGFBR1; SMAD4; VEGFA; BAX;

IL1R1; CCL2; HGF; MMP1; STAT1; IL6; CTGF; MMP9 IL1R1; CCL2; HGF; MMP1; STAT1; IL6; CTGF; MMP9

Señalización de PPAR PPAR signaling
EP300; INS; TRAF6; PPARA; RXRA; MAPK1; IKBKB; EP300; INS; TRAF6; PPARA; RXRA; MAPK1; IKBKB;

NCOR2; FOS; NFKB2; MAP3K14; STAT5B; MAPK3; NCOR2; FOS; NFKB2; MAP3K14; STAT5B; MAPK3;

NRIP1; KRAS; PPARG; RELA; STAT5A; TRAF2; NRIP1; KRAS; PPARG; RELAY; STAT5A; TRAF2;

PPARGC1A; PDGFRB; TNF; INSR; RAF1; IKBKG; PPARGC1A; PDGFRB; TNF; INSR; RAF1; IKBKG;

RELB; MAP3K7; CREBBP; MAP2K2; CHUK; PDGFRA; RELB; MAP3K7; CREBBP; MAP2K2; CHUK; PDGFRA;

MAP2K1; NFKB1; JUN; IL1R1; HSP90AA1 MAP2K1; NFKB1; JUN; IL1R1; HSP90AA1

Señalización de Fc Epsilon RI Fc Epsilon RI signaling
PRKCE; RAC1; PRKCZ; LYN; MAPK1; RAC2; PTPN11; PRKCE; RAC1; PRKCZ; LYN; MAPK1; RAC2; PTPN11;

AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; MAPK8; AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; MAPK8;

PRKD1; MAPK3; MAPK10; KRAS; MAPK13; PRKCD; PRKD1; MAPK3; MAPK10; KRAS; MAPK13; PRKCD;

MAPK9; PIK3C2A; BTK; MAPK14; TNF; RAF1; FYN; MAPK9; PIK3C2A; BTK; MAPK14; TNF; RAF1; FYN;

MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; AKT3; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; AKT3;

VAV3; PRKCA VAV3; PRKCA

Señalización de Receptor Receiver Signaling
PRKCE; RAP1A; RGS16; MAPK1; GNAS; AKT2; IKBKB; PRKCE; RAP1A; RGS16; MAPK1; GNAS; AKT2; IKBKB;

Acoplado a proteína G G protein coupled
PIK3CA; CREB1; GNAQ; NFKB2; CAMK2A; PIK3CB; PIK3CA; CREB1; GNAQ; NFKB2; CAMK2A; PIK3CB;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

PIK3C3; MAPK3; KRAS; RELA; SRC; PIK3C2A; RAF1; PIK3C3; MAPK3; KRAS; RELAY; SRC; PIK3C2A; RAF1;

IKBKG; RELB; FYN; MAP2K2; AKT1; PIK3R1; CHUK; IKBKG; RELB; FYN; MAP2K2; AKT1; PIK3R1; CHUK;

PDPK1; STAT3; MAP2K1; NFKB1; BRAF; ATF4; AKT3; PDPK1; STAT3; MAP2K1; NFKB1; BRAF; ATF4; AKT3;

PRKCA PRKCA

Metabolismo de Metabolism of
PRKCE; IRAK1; PRKAA2; EIF2AK2; PTEN; GRK6; PRKCE; IRAK1; PRKAA2; EIF2AK2; PTEN; GRK6;

Inositol fosfato Inositol phosphate
MAPK1; PLK1; AKT2; PIK3CA; CDK8; PIK3CB; PIK3C3; MAPK1; PLK1; AKT2; PIK3CA; CDK8; PIK3CB; PIK3C3;

MAPK8; MAPK3; PRKCD; PRKAA1; MAPK9; CDK2; MAPK8; MAPK3; PRKCD; PRKAA1; MAPK9; CDK2;

PIM1; PIK3C2A; DYRK1A; MAP2K2; PIP5K1A; PIK3R1; PIM1; PIK3C2A; DYRK1A; MAP2K2; PIP5K1A; PIK3R1;

MAP2K1; PAK3; ATM; TTK; CSNK1A1; BRAF; SGK MAP2K1; PAK3; ATM; TTK; CSNK1A1; BRAF; SGK

Señalización de PDGF PDGF signaling
EIF2AK2; ELK1; ABL2; MAPK1; PIK3CA; FOS; PIK3CB; EIF2AK2; ELK1; ABL2; MAPK1; PIK3CA; FOS; PIK3CB;

PIK3C3; MAPK8; CAV1; ABL1; MAPK3; KRAS; SRC; PIK3C3; MAPK8; CAV1; ABL1; MAPK3; KRAS; SRC;

PIK3C2A; PDGFRB; RAF1; MAP2K2; JAK1; JAK2; PIK3C2A; PDGFRB; RAF1; MAP2K2; JAK1; JAK2;

PIK3R1; PDGFRA; STAT3; SPHK1; MAP2K1; MYC; PIK3R1; PDGFRA; STAT3; SPHK1; MAP2K1; MYC;

JUN; CRKL; PRKCA; SRF; STAT1; SPHK2 JUN; CRKL; PRKCA; SRF; STAT1; SPHK2

Señalización de VEGF VEGF signaling
ACTN4; ROCK1; KDR; FLT1; ROCK2; MAPK1; PGF; ACTN4; ROCK1; KDR; FLT1; ROCK2; MAPK1; PGF;

AKT2; PIK3CA; ARNT; PTK2; BCL2; PIK3CB; PIK3C3; AKT2; PIK3CA; TRNA; PTK2; BCL2; PIK3CB; PIK3C3;

BCL2L1; MAPK3; KRAS; HIF1A; NOS3; PIK3C2A; PXN; BCL2L1; MAPK3; KRAS; HIF1A; NOS3; PIK3C2A; PXN;

RAF1; MAP2K2; ELAVL1; AKT1; PIK3R1; MAP2K1; SFN; RAF1; MAP2K2; ELAVL1; AKT1; PIK3R1; MAP2K1; SFN;

VEGFA; AKT3; FOXO1; PRKCA VEGFA; AKT3; FOXO1; PRKCA

Señalización de células Cell signaling
PRKCE; RAC1; PRKCZ; MAPK1; RAC2; PTPN11; PRKCE; RAC1; PRKCZ; MAPK1; RAC2; PTPN11;

aniquilantes naturales natural annihilants
KIR2DL3; AKT2; PIK3CA; SYK; PRKCI; PIK3CB; KIR2DL3; AKT2; PIK3CA; SYK; PRKCI; PIK3CB;

PIK3C3; PRKD1; MAPK3; KRAS; PRKCD; PTPN6; PIK3C3; PRKD1; MAPK3; KRAS; PRKCD; PTPN6;

PIK3C2A; LCK; RAF1; FYN; MAP2K2; PAK4; AKT1; PIK3C2A; LCK; RAF1; FYN; MAP2K2; PAK4; AKT1;

PIK3R1; MAP2K1; PAK3; AKT3; VAV3; PRKCA PIK3R1; MAP2K1; PAK3; AKT3; VAV3; PRKCA

Ciclo celular: G1/S Cell cycle: G1 / S
HDAC4; SMAD3; SUV39H1; HDAC5; CDKN1B; BTRC; HDAC4; SMAD3; SUV39H1; HDAC5; CDKN1B; BTRC;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Regulación de control Control regulation
ATR; ABL1; E2F1; HDAC2; HDAC7A; RB1; HDAC11; ATR; ABL1; E2F1; HDAC2; HDAC7A; RB1; HDAC11;

HDAC9; CDK2; E2F2; HDAC3; TP53; CDKN1A; CCND1; HDAC9; CDK2; E2F2; HDAC3; TP53; CDKN1A; CCND1;

E2F4; ATM; RBL2; SMAD4; CDKN2A; MYC; NRG1; E2F4; ATM; RBL2; SMAD4; CDKN2A; MYC; NRG1;

GSK3B; RBL1; HDAC6 GSK3B; RBL1; HDAC6

Señalización de Receptor de células T T cell receptor signaling
RAC1; ELK1; MAPK1; IKBKB; CBL; PIK3CA; FOS; RAC1; ELK1; MAPK1; IKBKB; CBL; PIK3CA; FOS;

NFKB2; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; NFKB2; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS;

RELA; PIK3C2A; BTK; LCK; RAF1; IKBKG; RELB; FYN; RELAY; PIK3C2A; BTK; LCK; RAF1; IKBKG; RELB; FYN;

MAP2K2; PIK3R1; CHUK; MAP2K1; NFKB1; ITK; BCL10; MAP2K2; PIK3R1; CHUK; MAP2K1; NFKB1; ITK; BCL10;

JUN; VAV3 JUN; VAV3

Señalización de Receptor de la muerte Death Receiver Signage
CRADD; HSPB1; BID; BIRC4; TBK1; IKBKB; FADD; CRADD; HSPB1; IDB; BIRC4; TBK1; IKBKB; FADD;

FAS; NFKB2; BCL2; MAP3K14; MAPK8; RIPK1; CASP8; FAS; NFKB2; BCL2; MAP3K14; MAPK8; RIPK1; CASP8;

DAXX; TNFRSF10B; RELA; TRAF2; TNF; IKBKG; RELB; DAXX; TNFRSF10B; RELAY; TRAF2; TNF; IKBKG; RELB;

CASP9; CHUK; APAF1; NFKB1; CASP2; BIRC2; CASP3; CASP9; CHUK; APAF1; NFKB1; CASP2; BIRC2; CASP3;

BIRC3 BIRC3

Señalización de FGF FGF signaling
RAC1; FGFR1; MET; MAPKAPK2; MAPK1; PTPN11; RAC1; FGFR1; MET; MAPKAPK2; MAPK1; PTPN11;

AKT2; PIK3CA; CREB1; PIK3CB; PIK3C3; MAPK8; AKT2; PIK3CA; CREB1; PIK3CB; PIK3C3; MAPK8;

MAPK3; MAPK13; PTPN6; PIK3C2A; MAPK14; RAF1; MAPK3; MAPK13; PTPN6; PIK3C2A; MAPK14; RAF1;

AKT1; PIK3R1; STAT3; MAP2K1; FGFR4; CRKL; ATF4; AKT1; PIK3R1; STAT3; MAP2K1; FGFR4; CRKL; ATF4;

AKT3; PRKCA; HGF AKT3; PRKCA; HGF

Señalización de GM-CSF GM-CSF signaling
LYN; ELK1; MAPK1; PTPN11; AKT2; PIK3CA; CAMK2A; LYN; ELK1; MAPK1; PTPN11; AKT2; PIK3CA; CAMK2A;

STAT5B; PIK3CB; PIK3C3; GNB2L1; BCL2L1; MAPK3; STAT5B; PIK3CB; PIK3C3; GNB2L1; BCL2L1; MAPK3;

ETS1; KRAS; RUNX1; PIM1; PIK3C2A; RAF1; MAP2K2; ETS1; KRAS; RUNX1; PIM1; PIK3C2A; RAF1; MAP2K2;

AKT1; JAK2; PIK3R1; STAT3; MAP2K1; CCND1; AKT3; AKT1; JAK2; PIK3R1; STAT3; MAP2K1; CCND1; AKT3;

STAT1 STAT1

Señalización de esclerosis Sclerosis signaling
BID; IGF1; RAC1; BIRC4; PGF; CAPNS1; CAPN2; IDB; IGF1; RAC1; BIRC4; PGF; CAPNS1; CAPN2;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

lateral amiotrófica amyotrophic lateral
PIK3CA; BCL2; PIK3CB; PIK3C3; BCL2L1; CAPN1; PIK3CA; BCL2; PIK3CB; PIK3C3; BCL2L1; CAPN1;

PIK3C2A; TP53; CASP9; PIK3R1; RAB5A; CASP1; PIK3C2A; TP53; CASP9; PIK3R1; RAB5A; CASP1;

APAF1; VEGFA; BIRC2; BAX; AKT3; CASP3; BIRC3 APAF1; VEGFA; BIRC2; BAX; AKT3; CASP3; BIRC3

Señalización de JAK/Stat JAK / Stat signaling
PTPN1; MAPK1; PTPN11; AKT2; PIK3CA; STAT5B; PTPN1; MAPK1; PTPN11; AKT2; PIK3CA; STAT5B;

PIK3CB; PIK3C3; MAPK3; KRAS; SOCS1; STAT5A; PIK3CB; PIK3C3; MAPK3; KRAS; SOCS1; STAT5A;

PTPN6; PIK3C2A; RAF1; CDKN1A; MAP2K2; JAK1; PTPN6; PIK3C2A; RAF1; CDKN1A; MAP2K2; JAK1;

AKT1; JAK2; PIK3R1; STAT3; MAP2K1; FRAP1; AKT3; AKT1; JAK2; PIK3R1; STAT3; MAP2K1; FRAP1; AKT3;

STAT1 STAT1

Metabolismo de Metabolism of
PRKCE; IRAK1; PRKAA2; EIF2AK2; GRK6; MAPK1; PRKCE; IRAK1; PRKAA2; EIF2AK2; GRK6; MAPK1;

Nicotinato y Nicotinate and

Nicotinamida Nicotinamide
PLK1; AKT2; CDK8; MAPK8; MAPK3; PRKCD; PRKAA1; PLK1; AKT2; CDK8; MAPK8; MAPK3; PRKCD; PRKAA1;

PBEF1; MAPK9; CDK2; PIM1; DYRK1A; MAP2K2; PBEF1; MAPK9; CDK2; PIM1; DYRK1A; MAP2K2;

MAP2K1; PAK3; NT5E; TTK; CSNK1A1; BRAF; SGK MAP2K1; PAK3; NT5E; TTK; CSNK1A1; BRAF; SGK

Señalización de quimiocinas Chemokine signaling
CXCR4; ROCK2; MAPK1; PTK2; FOS; CFL1; GNAQ; CXCR4; ROCK2; MAPK1; PTK2; FOS; CFL1; GNAQ;

CAMK2A; CXCL12; MAPK8; MAPK3; KRAS; MAPK13; CAMK2A; CXCL12; MAPK8; MAPK3; KRAS; MAPK13;

RHOA; CCR3; SRC; PPP1CC; MAPK14; NOX1; RAF1; RHOA; CCR3; SRC; PPP1CC; MAPK14; NOX1; RAF1;

MAP2K2; MAP2K1; JUN; CCL2; PRKCA MAP2K2; MAP2K1; JUN; CCL2; PRKCA

Señalización de IL-2 IL-2 signaling
ELK1; MAPK1; PTPN11; AKT2; PIK3CA; SYK; FOS; ELK1; MAPK1; PTPN11; AKT2; PIK3CA; SYK; FOS;

STAT5B; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; STAT5B; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS;

SOCS1; STAT5A; PIK3C2A; LCK; RAF1; MAP2K2; SOCS1; STAT5A; PIK3C2A; LCK; RAF1; MAP2K2;

JAK1; AKT1; PIK3R1; MAP2K1; JUN; AKT3 JAK1; AKT1; PIK3R1; MAP2K1; JUN; AKT3

Depresión sináptica Synaptic depression
PRKCE; IGF1; PRKCZ; PRDX6; LYN; MAPK1; GNAS; PRKCE; IGF1; PRKCZ; PRDX6; LYN; MAPK1; GNAS;

a largo lazo long tie
PRKCI; GNAQ; PPP2R1A; IGF1R; PRKD1; MAPK3; PRKCI; GNAQ; PPP2R1A; IGF1R; PRKD1; MAPK3;

KRAS; GRN; PRKCD; NOS3; NOS2A; PPP2CA; KRAS; GRN; PRKCD; NOS3; NOS2A; PPP2CA;

YWHAZ; RAF1; MAP2K2; PPP2R5C; MAP2K1; PRKCA YWHAZ; RAF1; MAP2K2; PPP2R5C; MAP2K1; PRKCA

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Señalización de Signaling of
TAF4B; EP300; CARM1; PCAF; MAPK1; NCOR2; TAF4B; EP300; CARM1; PCAF; MAPK1; NCOR2;

Receptor de Estrógenos Estrogen Receptor
SMARCA4; MAPK3; NRIP1; KRAS; SRC; NR3C1; SMARCA4; MAPK3; NRIP1; KRAS; SRC; NR3C1;

HDAC3; PPARGC1A; RBM9; NCOA3; RAF1; CREBBP; HDAC3; PPARGC1A; RBM9; NCOA3; RAF1; CREBBP;

MAP2K2; NCOA2; MAP2K1; PRKDC; ESR1; ESR2 MAP2K2; NCOA2; MAP2K1; PRKDC; ESR1; ESR2

Ruta de Route of
TRAF6; SMURF1; BIRC4; BRCA1; UCHL1; NEDD4; TRAF6; SMURF1; BIRC4; BRCA1; UCHL1; NEDD4;

Ubiquitinación de proteínas Protein ubiquitination
CBL; UBE2I; BTRC; HSPA5; USP7; USP10; FBXW7; CBL; UBE2I; BTRC; HSPA5; USP7; USP10; FBXW7;

USP9X; STUB1; USP22; B2M; BIRC2; PARK2; USP8; USP9X; STUB1; USP22; B2M; BIRC2; PARK2; USP8;

USP1; VHL; HSP90AA1; BIRC3 USP1; VHL; HSP90AA1; BIRC3

Señalización de IL-10 IL-10 signaling
TRAF6; CCR1; ELK1; IKBKB; SP1; FOS; NFKB2; TRAF6; CCR1; ELK1; IKBKB; SP1; FOS; NFKB2;

MAP3K14; MAPK8; MAPK13; RELA; MAPK14; TNF; MAP3K14; MAPK8; MAPK13; RELAY; MAPK14; TNF;

IKBKG; RELB; MAP3K7; JAK1; CHUK; STAT3; NFKB1; IKBKG; RELB; MAP3K7; JAK1; CHUK; STAT3; NFKB1;

JUN; IL1R1; IL6 JUN; IL1R1; IL6

Activación de VDR/RXR VDR / RXR activation
PRKCE; EP300; PRKCZ; RXRA; GADD45A; HES1; PRKCE; EP300; PRKCZ; RXRA; GADD45A; HES1;

NCOR2; SP1; PRKCI; CDKN1B; PRKD1; PRKCD; NCOR2; SP1; PRKCI; CDKN1B; PRKD1; PRKCD;

RUNX2; KLF4; YY1; NCOA3; CDKN1A; NCOA2; SPP1; RUNX2; KLF4; YY1; NCOA3; CDKN1A; NCOA2; SPP1;

LRP5; CEBPB; FOXO1; PRKCA LRP5; CEBPB; FOXO1; PRKCA

Señalización de TGF-beta TGF-beta signaling
EP300; SMAD2; SMURF1; MAPK1; SMAD3; SMAD1; EP300; SMAD2; SMURF1; MAPK1; SMAD3; SMAD1;

FOS; MAPK8; MAPK3; KRAS; MAPK9; RUNX2; FOS; MAPK8; MAPK3; KRAS; MAPK9; RUNX2;

SERPINE1; RAF1; MAP3K7; CREBBP; MAP2K2; SERPINE1; RAF1; MAP3K7; CREBBP; MAP2K2;

MAP2K1; TGFBR1; SMAD4; JUN; SMAD5 MAP2K1; TGFBR1; SMAD4; JUN; SMAD5

Señalización de Receptor tipo Toll Toll type receiver signaling
IRAK1; EIF2AK2; MYD88; TRAF6; PPARA; ELK1; IRAK1; EIF2AK2; MYD88; TRAF6; PPARA; ELK1;

IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK13; IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK13;

RELA; TLR4; MAPK14; IKBKG; RELB; MAP3K7; CHUK; RELAY; TLR4; MAPK14; IKBKG; RELB; MAP3K7; CHUK;

NFKB1; TLR2; JUN NFKB1; TLR2; JUN

Señalización de p38 MAPK MAP38 p38 signaling
HSPB1; IRAK1; TRAF6; MAPKAPK2; ELK1; FADD; FAS; HSPB1; IRAK1; TRAF6; MAPKAPK2; ELK1; FADD; FAS;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

CREB1; DDIT3; RPS6KA4; DAXX; MAPK13; TRAF2; CREB1; DDIT3; RPS6KA4; DAXX; MAPK13; TRAF2;

MAPK14; TNF; MAP3K7; TGFBR1; MYC; ATF4; IL1R1; MAPK14; TNF; MAP3K7; TGFBR1; MYC; ATF4; IL1R1;

SRF; STAT1 SRF; STAT1

Señalización de Neurotrofina/TRK Neurotrophin / TRK signaling
NTRK2; MAPK1; PTPN11; PIK3CA; CREB1; FOS; NTRK2; MAPK1; PTPN11; PIK3CA; CREB1; FOS;

PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; PIK3C2A; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; PIK3C2A;

RAF1; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; RAF1; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1;

CDC42; JUN; ATF4 CDC42; JUN; ATF4

Activación de FXR/RXR FXR / RXR activation
INS; PPARA; FASN; RXRA; AKT2; SDC1; MAPK8; INS; PPARA; FASN; RXRA; AKT2; SDC1; MAPK8;

APOB; MAPK10; PPARG; MTTP; MAPK9; PPARGC1A; APOB; MAPK10; PPARG; MTTP; MAPK9; PPARGC1A;

TNF; CREBBP; AKT1; SREBF1; FGFR4; AKT3; FOXO1 TNF; CREBBP; AKT1; SREBF1; FGFR4; AKT3; FOXO1

Potentiación sináptica Synaptic potentiation
PRKCE; RAP1A; EP300; PRKCZ; MAPK1; CREB1; PRKCE; RAP1A; EP300; PRKCZ; MAPK1; CREB1;

a largo plazo long-term
PRKCI; GNAQ; CAMK2A; PRKD1; MAPK3; KRAS; PRKCI; GNAQ; CAMK2A; PRKD1; MAPK3; KRAS;

PRKCD; PPP1CC; RAF1; CREBBP; MAP2K2; MAP2K1; PRKCD; PPP1CC; RAF1; CREBBP; MAP2K2; MAP2K1;

ATF4; PRKCA ATF4; PRKCA

Señalización de calcio Calcium signaling
RAP1A; EP300; HDAC4; MAPK1; HDAC5; CREB1; RAP1A; EP300; HDAC4; MAPK1; HDAC5; CREB1;

CAMK2A; MYH9; MAPK3; HDAC2; HDAC7A; HDAC11; CAMK2A; MYH9; MAPK3; HDAC2; HDAC7A; HDAC11;

HDAC9; HDAC3; CREBBP; CALR; CAMKK2; ATF4; HDAC9; HDAC3; CREBBP; CALR; CAMKK2; ATF4;

HDAC6 HDAC6

Señalización de EGF EGF signaling
ELK1; MAPK1; EGFR; PIK3CA; FOS; PIK3CB; PIK3C3; ELK1; MAPK1; EGFR; PIK3CA; FOS; PIK3CB; PIK3C3;

MAPK8; MAPK3; PIK3C2A; RAF1; JAK1; PIK3R1; MAPK8; MAPK3; PIK3C2A; RAF1; JAK1; PIK3R1;

STAT3; MAP2K1; JUN; PRKCA; SRF; STAT1 STAT3; MAP2K1; JUN; PRKCA; SRF; STAT1

Señalización de Hipoxia en el Hypoxia signaling in the
EDN1; PTEN; EP300; NQO1; UBE2I; CREB1; ARNT; EDN1; PTEN; EP300; NQO1; UBE2I; CREB1; TRNA;

Sistema Cardiovascular Cardiovascular system
HIF1A; SLC2A4; NOS3; TP53; LDHA; AKT1; ATM; HIF1A; SLC2A4; NOS3; TP53; LDHA; AKT1; ATM;

VEGFA; JUN; ATF4; VHL; HSP90AA1 VEGFA; JUN; ATF4; VHL; HSP90AA1

Inhibición mediada por LPS/IL-1 Inhibition mediated by LPS / IL-1
IRAK1; MYD88; TRAF6; PPARA; RXRA; ABCA1; IRAK1; MYD88; TRAF6; PPARA; RXRA; ABCA1;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

de función RXR RXR function
MAPK8; ALDH1A1; GSTP1; MAPK9; ABCB1; TRAF2; MAPK8; ALDH1A1; GSTP1; MAPK9; ABCB1; TRAF2;

TLR4; TNF; MAP3K7; NR1H2; SREBF1; JUN; IL1R1 TLR4; TNF; MAP3K7; NR1H2; SREBF1; JUN; IL1R1

Activación de LXR/RXR LXR / RXR Activation
FASN; RXRA; NCOR2; ABCA1; NFKB2; IRF3; RELA; FASN; RXRA; NCOR2; ABCA1; NFKB2; IRF3; RELAY;

NOS2A; TLR4; TNF; RELB; LDLR; NR1H2; NFKB1; NOS2A; TLR4; TNF; RELB; LDLR; NR1H2; NFKB1;

SREBF1; IL1R1; CCL2; IL6; MMP9 SREBF1; IL1R1; CCL2; IL6; MMP9

Proceso amiloide Amyloid process
PRKCE; CSNK1E; MAPK1; CAPNS 1; AKT2; CAPN2; PRKCE; CSNK1E; MAPK1; CAPNS 1; AKT2; CAPN2;

CAPN1; MAPK3; MAPK13; MAPT; MAPK14; AKT1; CAPN1; MAPK3; MAPK13; MAPT; MAPK14; AKT1;

PSEN1; CSNK1A1; GSK3B; AKT3; APP PSEN1; CSNK1A1; GSK3B; AKT3; APP

Señalización de IL-4 IL-4 signaling
AKT2; PIK3CA; PIK3CB; PIK3C3; IRS1; KRAS; SOCS1; AKT2; PIK3CA; PIK3CB; PIK3C3; IRS1; KRAS; SOCS1;

PTPN6; NR3C1; PIK3C2A; JAK1; AKT1; JAK2; PIK3R1; PTPN6; NR3C1; PIK3C2A; JAK1; AKT1; JAK2; PIK3R1;

FRAP1; AKT3; RPS6KB1 FRAP1; AKT3; RPS6KB1

Regulación Regulation
EP300; PCAF; BRCA1; GADD45A; PLK1; BTRC; EP300; PCAF; BRCA1; GADD45A; PLK1; BTRC;

Control de daño Damage control
CHEK1; ATR; CHEK2; YWHAZ; TP53; CDKN1A; CHEK1; ATR; CHEK2; YWHAZ; TP53; CDKN1A;

Ciclo celular: ADN G2/M Cell cycle: G2 / M DNA
PRKDC; ATM; SFN; CDKN2A PRKDC; ATM; SFN; CDKN2A

Señalización de óxido nítrico en el Nitric oxide signaling in the
KDR; FLT1; PGF; AKT2; PIK3CA; PIK3CB; PIK3C3; KDR; FLT1; PGF; AKT2; PIK3CA; PIK3CB; PIK3C3;

Sistema Cardiovascular Cardiovascular system
CAV1; PRKCD; NOS3; PIK3C2A; AKT1; PIK3R1; CAV1; PRKCD; NOS3; PIK3C2A; AKT1; PIK3R1;

VEGFA; AKT3; HSP90AA1 VEGFA; AKT3; HSP90AA1

Metabolismo de Purina Purina metabolism
NME2; SMARCA4; MYH9; RRM2; ADAR; EIF2AK4; NME2; SMARCA4; MYH9; RRM2; TO GIVE; EIF2AK4;

PKM2; ENTPD1; RAD51; RRM2B; TJP2; RAD51C; PKM2; ENTPD1; RAD51; RRM2B; TJP2; RAD51C;

NT5E; POLD1; NME1 NT5E; POLD1; NME1

Señalización mediada por cAMP CAMP-mediated signaling
RAP1A; MAPK1; GNAS; CREB1; CAMK2A; MAPK3; RAP1A; MAPK1; GNAS; CREB1; CAMK2A; MAPK3;

SRC; RAF1; MAP2K2; STAT3; MAP2K1; BRAF; ATF4 SRC; RAF1; MAP2K2; STAT3; MAP2K1; BRAF; ATF4

Disfunción mitocondrial Mitochondrial dysfunction
SOD2; MAPK8; CASP8; MAPK10; MAPK9; CASP9; SOD2; MAPK8; CASP8; MAPK10; MAPK9; CASP9;

PARK7; PSEN1; PARK2; APP; CASP3 PARK7; PSEN1; PARK2; APP; CASP3

Señalización de Notch Notch signage
HES1; JAG1; NUMB; NOTCH4; ADAM 17; NOTCH2; HES1; JAG1; NUMB; NOTCH4; ADAM 17; NOTCH2;

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

PSEN1; NOTCH3; NOTCH1; DLL4 PSEN1; NOTCH3; NOTCH1; DLL4

Ruta del estrés del Stress Route
HSPA5; MAPK8; XBP1; TRAF2; ATF6; CASP9; ATF4; HSPA5; MAPK8; XBP1; TRAF2; ATF6; CASP9; ATF4;

Retículo endoplasmático Endoplasmic reticulum
EIF2AK3; CASP3 EIF2AK3; CASP3

Metabolismo de pirimidina Pyrimidine metabolism
NME2; AICDA; RRM2; EIF2AK4; ENTPD1; RRM2B; NME2; AICDA; RRM2; EIF2AK4; ENTPD1; RRM2B;

NT5E; POLD1; NME1 NT5E; POLD1; NME1

Señalización de Parkinson Parkinson's signage
UCHL1; MAPK8; MAPK13; MAPK14; CASP9; PARK7; UCHL1; MAPK8; MAPK13; MAPK14; CASP9; PARK7;

PARK2; CASP3 PARK2; CASP3

Señalización Signaling
GNAS; GNAQ; PPP2R1A; GNB2L1; PPP2CA; PPP1CC; GNAS; GNAQ; PPP2R1A; GNB2L1; PPP2CA; PPP1CC;

Cardíaca y beta adrenérgica Cardiac and beta adrenergic
PPP2R5C PPP2R5C

Glucolisis/Gluconeogénesis Glycolysis / Gluconeogenesis
HK2; GCK; GPI; ALDH1A1; PKM2; LDHA; HK1 HK2; GCK; GPI; ALDH1A1; PKM2; LDHA; HK1

Señalización de interferón Interferon signaling
IRF1; SOCS1; JAK1; JAK2; IFITM1; STAT1; IFIT3 IRF1; SOCS1; JAK1; JAK2; IFITM1; STAT1; IFIT3

Señalización Sonic Hedgehog Sonic Hedgehog signage
ARRB2; SMO; GLI2; DYRK1A; GLI1; GSK3B; DYRK1B ARRB2; SAINT; GLI2; DYRK1A; GLI1; GSK3B; DYRK1B

Metabolismo Metabolism
PLD1; GRN; GPAM; YWHAZ; SPHK1; SPHK2 PLD1; GRN; GPAM; YWHAZ; SPHK1; SPHK2

Glicerofosfolípidos Glycerophospholipids

Degradación de fosfolípidos Phospholipid Degradation
PRDX6; PLD1; GRN; YWHAZ; SPHK1; SPHK2 PRDX6; PLD1; GRN; YWHAZ; SPHK1; SPHK2

Metabolismo de triptófano Tryptophan metabolism
SIAH2; PRMT5; NEDD4; ALDH1A1; CYP1B1; SIAH1 SIAH2; PRMT5; NEDD4; ALDH1A1; CYP1B1; SIAH1

Degradación de lisina Lysine degradation
SUV39H1; EHMT2; NSD1; SETD7; PPP2R5C SUV39H1; EHMT2; NSD1; SETD7; PPP2R5C

Ruta Route
ERCC5; ERCC4; XPA; XPC; ERCC1 ERCC5; ERCC4; XPA; XPC; ERCC1

Reparación escisión de nucleótidos Repair nucleotide excision

Metabolismo de Metabolism of
UCHL1; HK2; GCK; GPI; HK1 UCHL1; HK2; GCK; GPI; HK1

Almidón y sacarosa Starch and sucrose

Metabolismo de aminoazúcares Amino sugar metabolism
NQO1; HK2; GCK; HK1 NQO1; HK2; GCK; HK1

Metabolismo de Metabolism of
PRDX6; GRN; YWHAZ; CYP1B1 PRDX6; GRN; YWHAZ; CYP1B1

Ácido araquidónico Arachidonic acid

Señalización de ritmo circadiano Circadian rhythm signaling
CSNK1E; CREB1; ATF4; NR1D1 CSNK1E; CREB1; ATF4; NR1D1

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Sistema de coagulación Coagulation system
BDKRB1; F2R; SERPINE1; F3 BDKRB1; F2R; SERPINE1; F3

Receptor de Dopamina Dopamine Receiver
PPP2R1A; PPP2CA; PPP1CC; PPP2R5C PPP2R1A; PPP2CA; PPP1CC; PPP2R5C

Señalización Signaling

Metabolismo de glutationa Glutathione metabolism
IDH2; GSTP1; ANPEP; IDH1 IDH2; GSTP1; ANPEP; IDH1

Metabolismo de glicerolípidos Glycerolipid metabolism
ALDH1A1; GPAM; SPHK1; SPHK2 ALDH1A1; GPAM; SPHK1; SPHK2

Metabolismo de ácido linoleico Linoleic acid metabolism
PRDX6; GRN; YWHAZ; CYP1B1 PRDX6; GRN; YWHAZ; CYP1B1

Metabolismo de Metionina Methionine metabolism
DNMT1; DNMT3B; AHCY; DNMT3A DNMT1; DNMT3B; AHCY; DNMT3A

Metabolismo de piruvato Pyruvate Metabolism
GLO1; ALDH1A1; PKM2; LDHA GLO1; ALDH1A1; PKM2; LDHA

Metabolismo de Metabolism of
ALDH1A1; NOS3; NOS2A ALDH1A1; NOS3; NOS2A

Arginina y Prolina Arginine and Proline

Señalización Eicosanoide Eicosanoid signaling
PRDX6; GRN; YWHAZ PRDX6; GRN; YWHAZ

Metabolismo de Metabolism of
HK2; GCK; HK I HK2; GCK; HK I

Fructosa y Manosa Fructose and Mannose

Metabolismo de Galactosa Galactose metabolism
HK2; GCK; HK1 HK2; GCK; HK1

Biosíntesis de estilbeno, Stilbene biosynthesis,
PRDX6; PRDX1; TYR PRDX6; PRDX1; TYR

cumarina y lignina coumarin and lignin

Ruta de Route of
CALR; B2M CALR; B2M

Presentación de antígenos Antigen presentation

Biosíntesis de esteroides Steroid biosynthesis
NQO1; DHCR7 NQO1; DHCR7

Metabolismo de Butanoato Butanoate metabolism
ALDH1A1; NLGN1 ALDH1A1; NLGN1

Ciclo del Citrato Citrate Cycle
IDH2; IDH1 IDH2; IDH1

Metabolismo de ácidos grasos Fatty acid metabolism
ALDH1A1; CYP1B1 ALDH1A1; CYP1B1

Metabolismo de Metabolism of
PRDX6; CHKA PRDX6; CHKA

Glicerofosfolípidos Glycerophospholipids

Metabolismo de Histidina Histidine metabolism
PRMT5; ALDH1A1 PRMT5; ALDH1A1

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Metabolismo de Inositol Inositol metabolism
ERO1L; APEX1 ERO1L; APEX1

Metabolismo de xenobióticos Xenobiotic metabolism
GSTP1; CYP1B1 GSTP1; CYP1B1

por citocromo p450 by cytochrome p450

Metabolismo de metano Methane metabolism
PRDX6; PRDX1 PRDX6; PRDX1

Metabolismo de fenilalanina Phenylalanine metabolism
PRDX6; PRDX1 PRDX6; PRDX1

Metabolismo de Propanoato Propanoate metabolism
ALDH1A1; LDHA ALDH1A1; LDHA

Metabolismo de Metabolism of
PRMT5; AHCY PRMT5; AHCY

Selenoaminoácido Selenoamino acid

Metabolismo de esfingolípidos Sphingolipid Metabolism
SPHK1; SPHK2 SPHK1; SPHK2

Aminofosfonato Aminophosphonate
PRMT5 PRMT5

Metabolismo Metabolism

Andrógenos y estrógenos Androgens and estrogens
PRMT5 PRMT5

Metabolismo de Metabolism of

Ascorbato y Aldarato Ascorbate and Aldarato
ALDH1A1 ALDH1A1

Metabolismo de Metabolism of

Biosínteis de ácidos biliares Bile acid biosynthesis
ALDH1A1 ALDH1A1

Metabolismo de cisteína Cysteine metabolism
LDHA LDHA

Biosínteis de ácidos grasos Biosynthesis of fatty acids
FASN FASN

Receptor de Glutamato Glutamate Receptor
GNB2L1 GNB2L1

Señalización de Signaling of

Respuesta de estrés Stress response
PRDX1 PRDX1

Oxidativa mediada por NRF2 Oxidative mediated by NRF2

Ruta de Route of
GPI GPI

Pentosa fosfato Pentose phosphate

Interconversiones de Interconversions of
UCHL1 UCHL1

FUNCIÓN CELULAR CELLULAR FUNCTION
GENES GENES

Pentosa y Glucuronato Pentose and Glucuronate

Metabolismo de Retinol Retinol metabolism
ALDH1A1 ALDH1A1

Metabolismo de Riboflavina Riboflavin metabolism
TYR TYR

Metabolismo de tirosina Tyrosine Metabolism
PRMT5, TYR PRMT5, TYR

Biosíntesis de Ubiquinona Ubiquinone Biosynthesis
PRMT5 PRMT5

Degradación de Valina, Leucina e Degradation of Valine, Leucine and
ALDH1A1 ALDH1A1

Isoleucina Isoleucine

Metabolismo de Glicina, Serina y Metabolism of Wisteria, Serine and
CHKA CHKA

Treonina Threonine

Degradación de lisina Lysine degradation
ALDH1A1 ALDH1A1

Dolor/sabor Pain / taste
TRPM5; TRPA1 TRPM5; TRPA1

Dolor Pain
TRPM7; TRPC5; TRPC6; TRPC1; Cnr1; cnr2; Grk2; TRPM7; TRPC5; TRPC6; TRPC1; Cnr1; cnr2; Grk2;

Trpa1; Pomc; Cgrp; Crf; Pka; Era; Nr2b; TRPM5; Prkaca; Trpa1; Pomc; Cgrp; Crf; Pka; Was; Nr2b; TRPM5; Prkaca;

Prkacb; Prkar1a; Prkar2a Prkacb; Prkar1a; Prkar2a

Función mitocondrial Mitochondrial function
AIF; CytC; SMAC (Diablo); Aifm-1; Aifm-2 IDA; CytC; SMAC (Devil); Aifm-1; Aifm-2

Neurología de desarrollo Developmental neurology
BMP-4; Chordin (Chrd); Noggin (Nog); WNT (Wnt2; BMP-4; Chordin (Chrd); Noggin (Nog); WNT (Wnt2;

Wnt2b; Wnt3a; Wnt4; Wnt5a; Wnt6; Wnt7b; Wnt8b; Wnt2b; Wnt3a; Wnt4; Wnt5a; Wnt6; Wnt7b; Wnt8b;

Wnt9a; Wnt9b; Wnt10a; Wnt10b; Wnt16); beta-catenina; Wnt9a; Wnt9b; Wnt10a; Wnt10b; Wnt16); beta-catenin;

Dkk-1; proteínas relacionadas con Frizzled; Otx-2; Gbx2; FGF-8; Dkk-1; Frizzled related proteins; Otx-2; Gbx2; FGF-8;

Reelin; Dab1; unc-86 (Pou4f1 o Brn3a); Numb; Reln Reelin; Dab1; unc-86 (Pou4f1 or Brn3a); Numb; Reln

Las realizaciones de la descripción también se refieren a métodos y composiciones relacionadas con eliminación de genes, la multiplicación de genes y reparación de mutaciones particulares asociadas a la inestabilidad de repeticiones de ADN y trastornos neurológicos (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Segunda Edición, Academic Press, 13 de octubre de 2011-Medical). Se han encontrado Embodiments of the description also refer to methods and compositions related to gene elimination, gene multiplication and repair of particular mutations associated with instability of DNA repeats and neurological disorders (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, October 13, 2011-Medical). Have been found

5 aspectos específicos de secuencias de repetición en tándem responsables de más de veinte enfermedades humanas (Nuevos conocimientos en la inestabilidad de la repetición: función de híbridos de ARN·ADN. McIvor EI, Polak U, Napierala M. RNA Biol. Sep-Oct 2010; 7 (5): 551-8). El sistema CRISPR-Cas puede ser aprovechado para corregir estos defectos de inestabilidad genómica. 5 specific aspects of tandem repeat sequences responsible for more than twenty human diseases (New knowledge in the instability of repetition: RNA · DNA hybrid function. McIvor EI, Polak U, Napierala M. RNA Biol. Sep-Oct 2010 ; 7 (5): 551-8). The CRISPR-Cas system can be used to correct these genomic instability defects.

Un aspecto más de la descripción se refiere a la utilización del sistema CRISPR-Cas para corregir defectos en los One more aspect of the description refers to the use of the CRISPR-Cas system to correct defects in the

10 genes EMP2A y EMP2B que se ha identificado que están asociados a la enfermedad Lafora. La enfermedad de Lafora es un trastorno autosómico recesivo que se caracteriza por epilepsia mioclónica progresiva que puede empezar como ataques epilépticos en la adolescencia. Algunos casos de la enfermedad pueden estar causados por 10 EMP2A and EMP2B genes that have been identified that are associated with Lafora disease. Lafora disease is an autosomal recessive disorder characterized by progressive myoclonic epilepsy that can begin as epileptic seizures in adolescence. Some cases of the disease may be caused by

mutaciones en genes que se tienen que identificar, sin embargo. La enfermedad produce ataques, espasmos musculares, dificultad para caminar, demencia y eventualmente la muerte. En la actualidad no hay tratamiento que se haya demostrado eficaz contra el progreso de la enfermedad. Otras anormalidades genéticas asociadas a la epilepsia también pueden ser fijadas como objetivo mediante el sistema CRISPR-Cas y la genética subyacente se describe además en Genetics of Epilepsy and Genetic Epilepsies, editado por Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: 20; 2009). gene mutations that have to be identified, however. The disease produces seizures, muscle spasms, difficulty walking, dementia and eventually death. At present there is no treatment that has been proven effective against the progress of the disease. Other genetic abnormalities associated with epilepsy can also be set as targets through the CRISPR-Cas system and the underlying genetics are also described in Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: 20 ; 2009).

En otro aspecto más de la descripción, el sistema CRISPR-Cas puede ser usado para corregir defectos oculares que surgen de mutaciones genéticas diversas descritas además en Genetic Diseases of the Eye, Segunda Edición, editado por Elias I. Traboulsi, Oxford University Press, 2012. In another aspect of the description, the CRISPR-Cas system can be used to correct eye defects that arise from various genetic mutations further described in Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012 .

Diversos aspectos adicionales de la descripción se refieren a corregir defectos asociados a un amplio intervalo de enfermedades genéticas que se describen además en la página web del Instituto Nacional para la Salud bajo la subsección tópica Trastornos Genéticos (sitio web en health.nih.gov/topic/GeneticDisorders). Las enfermedades cerebrales genéticas pueden incluir, pero no se limitan a, Adrenoleucodistrofia, Angenesia del Cuerpo Calloso, Síndrome de Aicardi, Enfermedad de Alper, Enfermedad de Alzheimer, Síndrome de Barth, Enfermedad de Batten, CADASIL, Degeneración Cerebelar, Enfermedad de Fabry, Enfermedad de Gerstmann-Straussler-Scheinker, Enfermedad de Huntington y otros Trastornos de Triple Repetición, Enfermedad de Leigh, Síndrome de Lesch-Nyhan, Enfermedad de Menkes, Miopatías Mitocondriales y Colpocefalia de NINDS (por sus siglas en inglés). Estas enfermedades se describen además en el sitio web del Instituto Nacional de la Salud bajo la subsección Trastornos Cerebrales Genéticos. Various additional aspects of the description relate to correcting defects associated with a wide range of genetic diseases that are also described on the website of the National Institute for Health under the topical subsection Genetic Disorders (website at health.nih.gov/topic / GeneticDisorders). Genetic brain diseases may include, but are not limited to, Adrenoleukodystrophy, Coronary Body Angenesis, Aicardi Syndrome, Alper's Disease, Alzheimer's Disease, Barth Syndrome, Batten's Disease, CADASIL, Cerebellar Degeneration, Fabry's Disease, Disease of Gerstmann-Straussler-Scheinker, Huntington's Disease and other Triple Repetition Disorders, Leigh's Disease, Lesch-Nyhan's Syndrome, Menkes' Disease, Mitochondrial Myopathies and NINDS Colpocephaly (for its acronym in English). These diseases are also described on the website of the National Institute of Health under the subsection of Genetic Brain Disorders.

En algunas realizaciones, la afección puede ser neoplasia. En algunas realizaciones, donde la afección es neoplasia, los genes que se tienen que fijar como objetivo son cualquiera de los enumerados en la Tabla A (en este caso PTEN, etc). En algunas realizaciones, la afección puede ser Degeneración Macular Relacionada con la Edad. En algunas realizaciones, la afección puede ser un Trastorno Esquizofrénico. En algunas realizaciones, la afección puede ser un trastorno de Repetición del Trinucleótido. En algunas realizaciones, la afección puede ser Síndrome Frágil X. En algunas realizaciones, la afección puede ser un Trastorno Relacionado con la Secretasa. En algunas realizaciones, la afección puede ser un trastorno relacionado con el Prión. En algunas realizaciones, la afección puede ser ELA. En algunas realizaciones, la afección puede ser una drogadicción. En algunas realizaciones, la afección pueden ser Autismo. En algunas realizaciones, la afección puede ser Enfermedad de Alzheimer. En algunas realizaciones, la afección puede ser inflamación. En algunas realizaciones, la afección puede ser Enfermedad de Parkinson. In some embodiments, the condition may be neoplasia. In some embodiments, where the condition is neoplasia, the genes that have to be targeted are any of those listed in Table A (in this case PTEN, etc.). In some embodiments, the condition may be Age-related Macular Degeneration. In some embodiments, the condition may be a Schizophrenic Disorder. In some embodiments, the condition may be a Trinucleotide Repetition disorder. In some embodiments, the condition may be Fragile X Syndrome. In some embodiments, the condition may be a Secretase-Related Disorder. In some embodiments, the condition may be a disorder related to the Prion. In some embodiments, the condition may be ALS. In some embodiments, the condition may be a drug addiction. In some embodiments, the condition may be Autism. In some embodiments, the condition may be Alzheimer's disease. In some embodiments, the condition may be inflammation. In some embodiments, the condition may be Parkinson's disease.

Ejemplos de proteínas asociadas a la enfermedad de Parkinson incluyen, pero no se limitan a, α-sinucleína, DJ-1, LRRK2, PINK1, Parkin, UCHL1, Synphilin-1 y NURR1. Examples of proteins associated with Parkinson's disease include, but are not limited to, α-synuclein, DJ-1, LRRK2, PINK1, Parkin, UCHL1, Synphilin-1 and NURR1.

Ejemplos de proteínas relacionadas con la adicción pueden incluir ABAT, por ejemplo. Examples of addiction-related proteins may include ABAT, for example.

Ejemplos de proteínas relacionadas con la inflamación pueden incluir la proteína quimioatrayente de monocitos -1 (MCP1) codificada por el gen Ccr2, el receptor de quimiocina C-C tipo 5 (CCR5) codificada por el gen Ccr5, el receptor IIB de IgG (FCGR2b, también denominado CD32) codificado por el gen Fcgr2b o la proteína de R1g Fc épsilon (FCER1g) codificada por el gen Fcer1g, por ejemplo. Examples of inflammation-related proteins may include the monocyte chemoattractant protein -1 (MCP1) encoded by the Ccr2 gene, the type 5 chemokine receptor CC (CCR5) encoded by the Ccr5 gene, the IgG IIB receptor (FCGR2b, also called CD32) encoded by the Fcgr2b gene or the R1g Fc epsilon protein (FCER1g) encoded by the Fcer1g gene, for example.

Ejemplos de enfermedades cardiovasculares asociadas a proteínas pueden incluir IL1B (interleucina 1, beta), XDH (xantina deshidrogenasa), TP53 (proteína tumoral p53), PTGIS (prostaglandina 12 (prostaciclina) sintasa), MB (mioglobina), IL4 (interleucina 4), ANGPT1 (angiopoyetina 1), ABCG8 (casete de unión a ATP, sub-familia G (WHITE), miembro 8) o CTSK (catepsina K), por ejemplo. Examples of protein-associated cardiovascular diseases may include IL1B (interleukin 1, beta), XDH (xanthine dehydrogenase), TP53 (tumor protein p53), PTGIS (prostaglandin 12 (prostacyclin) synthase), MB (myoglobin), IL4 (interleukin 4) , ANGPT1 (angiopoietin 1), ABCG8 (ATP-binding cassette, sub-family G (WHITE), member 8) or CTSK (cathepsin K), for example.

Ejemplos de proteínas asociadas a la enfermedad de Alzheimer pueden incluir la proteína receptora de lipoproteína de densidad muy baja (VLDLR, por sus siglas en inglés) codificada por el gen VLDLR, la enzima activadora de modificador de tipo ubiquitina 1 (UBA1) codificada por el gen UBA1 o la proteína de subunidad catalítica de enzima E1 activadora de NEDD8 (UBE1C) codificada por el gen UBA3, por ejemplo. Examples of proteins associated with Alzheimer's disease may include the very low density lipoprotein receptor protein (VLDLR) encoded by the VLDLR gene, the ubiquitin-type modifier activating enzyme 1 (UBA1) encoded by the UBA1 gene or NEDD8 activating enzyme E1 catalytic subunit protein (UBE1C) encoded by the UBA3 gene, for example.

Ejemplos de proteínas asociadas a Trastorno por Espectro Autista pueden incluir la proteína 1 asociada a receptor de benzodiazapina (periférica) (BZRAP1) codificada por el gen BZRAP1, la proteína del miembro 2 de la familia AF4/FMR2 (AFF2) codificada por el gen AFF2 (también denominado MFR2), la proteína de homólogo 1 autosómico de retraso mental frágil X (FXR1) codificada por el gen FXR1 o la proteína de homólogo 2 autosómico del retraso mental frágil X (FXR2) codificada por el gen FXR2, por ejemplo. Examples of proteins associated with Autism Spectrum Disorder may include benzodiazapine receptor (peripheral) associated protein (BZRAP1) encoded by the BZRAP1 gene, member 2 protein of the AF4 / FMR2 (AFF2) family encoded by the AFF2 gene (also called MFR2), the autosomal fragile mental retardation X (FXR1) homologous protein encoded by the FXR1 gene or the autosomal fragile mental retardation X (FXR2) homologous protein encoded by the FXR2 gene, for example.

Los ejemplos de proteínas asociadas a Degeneración Macular pueden incluir la casete de unión de ATP, proteína del miembro 4 (ABCA4) de la sub-familia A (ABC 1) codificada por el gen ABCR, la proteína apolipoproteína E (APOE) codificada por el gen APOE o la proteína de Ligando 2 (CCL2) de quimiocina (unidad C-C) codificada por el gen CCL2, por ejemplo. Examples of proteins associated with Macular Degeneration may include the ATP binding cassette, member protein 4 (ABCA4) of sub-family A (ABC 1) encoded by the ABCR gene, apolipoprotein E protein (APOE) encoded by the APOE gene or chemokine Ligand 2 (CCL2) protein (CC unit) encoded by the CCL2 gene, for example.

Ejemplos de proteínas asociadas a Esquizofrenia pueden incluir NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B y combinaciones de las mismas. Examples of Schizophrenia-associated proteins may include NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B and combinations thereof.

Ejemplos de proteínas implicadas en la supresión de tumores pueden incluir ATM (ataxia telangiectasia mutada), ATR (ataxia telangiectasia y relacionada con Rad3), EGFR (receptor de factor de crecimiento epidérmico), ERBB2 (homólogo 2 de oncogén vírico de leucemia eritroblástica v-erb-b2), ERBB3 (homólogo 3 de oncogén vírico de leucemia eritroblástica v-erb-b2), ERBB4 (homólogo 4 de oncogén vírico de leucemia eritroblástica v-erb-b2), Notch 1, Notch2, Notch 3 o Notch 4, por ejemplo. Examples of proteins involved in tumor suppression may include ATM (mutated ataxia telangiectasia), ATR (telangiectasia ataxia and Rad3-related ataxia), EGFR (epidermal growth factor receptor), ERBB2 (viral oncogene homolog 2 of erythroblastic leukemia v- erb-b2), ERBB3 (homologous 3 of viral oncogene of erythroblastic leukemia v-erb-b2), ERBB4 (homologous 4 of viral oncogene of erythroblastic leukemia v-erb-b2), Notch 1, Notch2, Notch 3 or Notch 4, for example.

Ejemplos de proteínas asociadas a trastorno de la secretas pueden incluir PSENEN (homólogo de estimulador 2 de presenilina (C. elegans)), CTSB (catepsina B), PSEN1 (presenilina 1), APP (proteína precursora de amiloide beta (A4)), APH1B (homólogo B defectuoso anterior de la faringe (C. elegans)), PSEN2 (presenilina 2 (enfermedad de Alzheimer 4)) o BACE1 (enzima 1 de escisión de APP de sitio beta), por ejemplo. Examples of proteins associated with secretory disorder may include PSENEN (presenilin stimulator 2 homologue (C. elegans)), CTSB (cathepsin B), PSEN1 (presenilin 1), APP (beta amyloid precursor protein (A4)), APH1B (previous defective homologue B of the pharynx (C. elegans)), PSEN2 (presenilin 2 (Alzheimer's disease 4)) or BACE1 (enzyme 1 of beta-site APP cleavage), for example.

Los ejemplos de proteínas asociadas a Esclerosis Lateral Amiotrófica pueden incluir SOD1 (superóxido dismutasa 1), ALS2 (esclerosis lateral amiotrófica 2), FUS (fusionado en sarcoma), TARDBP (proteína de unión de ADN TAR), VAGFA (factor A de crecimiento endotelial vascular), VAGFB (factor B de crecimiento endotelial vascular) y VAGFC (factor C de crecimiento endotelial vascular) y cualquier combinación de los mismos. Examples of proteins associated with Amyotrophic Lateral Sclerosis may include SOD1 (superoxide dismutase 1), ALS2 (amyotrophic lateral sclerosis 2), FUS (fused in sarcoma), TARDBP (TAR DNA binding protein), VAGFA (endothelial growth factor A vascular), VAGFB (vascular endothelial growth factor B) and VAGFC (vascular endothelial growth factor C) and any combination thereof.

Ejemplos de proteínas asociadas a enfermedades por priones pueden incluir SOD1 (superóxido dismutasa 1), ALS2 (esclerosis lateral amiotrófica 2), FUS (fusionado en sarcoma), TARDBP (proteína de unión de ADN TAR), VAGFA (factor A de crecimiento endotelial vascular), VAGFB (factor B de crecimiento endotelial vascular) y VAGFC (factor C de crecimiento endotelial vascular) y cualquier combinación de los mismos. Examples of proteins associated with prion diseases may include SOD1 (superoxide dismutase 1), ALS2 (amyotrophic lateral sclerosis 2), FUS (fused in sarcoma), TARDBP (TAR DNA binding protein), VAGFA (vascular endothelial growth factor A ), VAGFB (vascular endothelial growth factor B) and VAGFC (vascular endothelial growth factor C) and any combination thereof.

Los ejemplos de proteínas relacionadas con enfermedades neurodegenerativas en trastornos por priones pueden incluir A2M (Alfa-2-Macroglobulina), AATF (Factor de transcripción de antagonización de muerte celular programada), ACPP (fosfatasa ácida prostática), ACTA2 (Actina alfa 2 de músculo liso aorta), ADAM22 (dominio de la metalopeptidasa ADAM), ADORA3 (Receptor de adenosina A3) o ADRA1D (Receptor adrenérgico Alfa-1D para adrenoreceptor Alfa-1D), por ejemplo. Examples of proteins related to neurodegenerative diseases in prion disorders may include A2M (Alpha-2-Macroglobulin), AATF (Transcription factor of programmed cell death antagonization), ACPP (prostatic acid phosphatase), ACTA2 (Muscle actin alpha 2 smooth aorta), ADAM22 (domain of metallopeptidase ADAM), ADORA3 (Adenosine A3 receptor) or ADRA1D (Alpha-1D adrenergic receptor for Alpha-1D adrenoceptor), for example.

Los ejemplos de proteínas asociadas a Inmunodeficiencia pueden incluir A2M [alfa-2-macroglobulina]; AANAT [arilalquilamina N-acetiltransferasa]; ABCA1 [casete de unión a ATP, sub-familia A (ABC1), miembro 1]; ABCA2 [casete de unión a ATP, sub-familia A (ABC1), miembro 2] o ABCA3 [casete de unión a ATP, sub-familia A (ABC1), miembro 3]; por ejemplo. Examples of proteins associated with immunodeficiency may include A2M [alpha-2-macroglobulin]; AANAT [arylalkylamine N-acetyltransferase]; ABCA1 [ATP binding cassette, sub-family A (ABC1), member 1]; ABCA2 [ATP binding cassette, sub-family A (ABC1), member 2] or ABCA3 [ATP binding cassette, sub-family A (ABC1), member 3]; for example.

Ejemplos de proteínas asociadas a Trastornos de Repetición del Trinucleótido incluyen AR (receptor de andrógeno), FMR1 (retraso mental 1 frágil X), HTT (huntingtina) o DMPK (distrofia miotónica-proteína cinasa), FXN (frataxina), ATXN2 (ataxina 2), por ejemplo. Examples of proteins associated with Trinucleotide Repetition Disorders include AR (androgen receptor), FMR1 (mental fragility 1 fragile X), HTT (huntingtin) or DMPK (myotonic dystrophy-protein kinase), FXN (frataxin), ATXN2 (ataxin 2 ), for example.

Ejemplos de proteínas asociadas a Trastornos de Neurotransmisión incluyen SST (somatostatina), NOS1 (óxido nítrico sintasa 1 (neuronal)), ADRA2A (receptor alfa-2A-adrenérgico), ADRA2C (receptor alfa-2C-adrenérgico), TACR1 (receptor de taquicinina 1) o HTR2c (receptor 2C de 5-hidroxitriptamina (serotonina)), por ejemplo. Examples of proteins associated with Neurotransmission Disorders include SST (somatostatin), NOS1 (nitric oxide synthase 1 (neuronal)), ADRA2A (alpha-2A-adrenergic receptor), ADRA2C (alpha-2C-adrenergic receptor), TACR1 (tachykinin receptor 1) or HTR2c (5C hydroxytryptamine (serotonin) 2C receptor), for example.

Ejemplos de secuencias asociadas al neurodesarrollo incluyen A2BP1 [proteína 1 de unión de ataxina 2], AADAT [aminoadipato aminotransferasa], AANAT [arilalquilamina N-acetiltransferasa], ABAT [4-aminobutirato aminotransferasa], ABCA1 [casete de unión a ATP, sub-familia A (ABC1), miembro 1] o ABCA13 [casete de unión a ATP, sub-familia A (ABC1), miembro 13], por ejemplo. Examples of neurodevelopmental-associated sequences include A2BP1 [ataxin 2 binding protein 1], AADAT [aminoadipate aminotransferase], AANAT [arylalkylamine N-acetyltransferase], ABAT [4-aminobutyrate aminotransferase], ABCA1 [ATP binding cassette, sub- family A (ABC1), member 1] or ABCA13 [ATP binding cassette, sub-family A (ABC1), member 13], for example.

Más ejemplos de trastornos preferidos tratables con el presente sistema se pueden seleccionar de: Síndrome de Aicardi-Goutières; Enfermedad de Alexander; Síndrome de Allan-Herndon-Dudley; Trastornos Relacionados con POLG; Alfa-Manosidosis (Tipo II y III); Síndrome de Alström; Angelman; Síndrome; Ataxia-Telangiectasia; Lipofuscinosis Ceroide Neuronal; Beta-Talasemia; Atrofia Óptica Bilateral y Atrofia Óptica (Infantil) Tipo 1; Retinoblastoma (bilateral); Enfermedad de Canavan; Síndrome 1 Cerebroculofacioesquelético [COFS1]; Xantomatosis Cerebrotendinosa; Síndrome de Cornelia de Lange; Trastornos Relacionados con MAPT; Enfermedades Genéticas por Priones; Síndrome de Dravet; Enfermedad de Alzheimer Familiar de Comienzo Temprano; Ataxia de Friedreich [FRDA]; Síndrome de Fryns; Fucosidosis; Distrofia Muscular Congénita de Fukuyama; Galactosialidosis; Enfermedad de Gaucher; Acidemias Orgánicas; Linfohistiocitosis Hemofagocítica; Síndrome de Progeria de Hutchinson-Gilford; Mucolipidosis II; Enfermedad de Almacenamiento de Ácido Siálico Libre Infantil; Neurodegeneración Asociada a PLA2G6; Síndrome de Jervell y Lange-Nielsen; Epidermolisis Bullosa sobre las Articulaciones; Enfermedad de Huntington; Enfermedad de Krabbe (Infantil); Síndrome de Leigh Asociado al ADN Mitocondrial y NARP; Síndrome de Lesch-Nyhan; Lisencefalia Asociada a LIS1; Síndrome de Lowe; Enfermedad Urinaria de Jarabe de Maple; Síndrome de Duplicación de MECP2; Trastornos de Transporte de Cobre Relacionado con ATP7A; Distrofia Muscular Relacionada con LAMA2; Deficiencia de Arilsulfatasa A; Mucopolisacaridosis Tipos I, II o III; Trastornos de la Biogénesis del Peroxisoma, Espectro del Síndrome de Zellweger; Neurodegeneración con Trastornos de Acumulación de Hierro en el Cerebro; Deficiencia de More examples of preferred disorders treatable with the present system can be selected from: Aicardi-Goutières syndrome; Alexander's disease; Allan-Herndon-Dudley syndrome; POLG related disorders; Alpha-Mannosidosis (Type II and III); Alström syndrome; Angelman; Syndrome; Ataxia-Telangiectasia; Neuronal Ceroid Lipofuscinosis; Beta-Thalassemia; Bilateral Optic Atrophy and Optical Atrophy (Child) Type 1; Retinoblastoma (bilateral); Canavan disease; Cerebroculofacioskeletal Syndrome 1 [COFS1]; Cerebrotendinous Xanthomatosis; Cornelia de Lange syndrome; MAPT Related Disorders; Genetic Prion Diseases; Dravet syndrome; Early-onset Family Alzheimer's Disease; Friedreich's ataxia [FRDA]; Fryns syndrome; Fucosidosis; Fukuyama Congenital Muscular Dystrophy; Galactosialidosis; Gaucher's disease; Organic Acidemias; Hemophagocytic lymphohistiocytosis; Hutchinson-Gilford Progeria syndrome; Mucolipidosis II; Child Free Sialic Acid Storage Disease; Neurodegeneration Associated with PLA2G6; Jervell and Lange-Nielsen syndrome; Epidermolysis Bullosa on the Joints; Huntington's disease; Krabbe disease (childhood); Leigh Syndrome Associated with Mitochondrial DNA and NARP; Lesch-Nyhan syndrome; Lysencephaly Associated with LIS1; Lowe syndrome; Urinary Maple Syrup Disease; MECP2 Duplication Syndrome; Copper Transport Disorders Related to ATP7A; Muscular Dystrophy Related to LAMA2; Arilsulfatase A deficiency; Mucopolysaccharidoses Types I, II or III; Disorders of the Biogenesis of Peroxisome, Spectrum of Zellweger Syndrome; Neurodegeneration with Iron Accumulation Disorders in the Brain; Deficiency of

Esfingomielinasa Ácida; Enfermedad de Niemann-Pick Tipo C; Encefalopatía por Glicina; Trastornos Relacionados con ARX; Trastornos del Ciclo de la Urea; Osteogénesis Imperfecta Relacionada con COL1A1/2; Síndromes de Supresión de ADN Mitocondrial; Trastornos Relacionados con PLP1; Síndrome de Perry; Síndrome de Phelan-McDermid; Enfermedad de Almacenamiento de Glucógeno Tipo II (Enfermedad de Pompe) (Infantil); Trastornos Relacionados con MAPT; Trastornos Relacionados con MECP2; Condrodisplasia Punctata Rizomélica Tipo 1; Síndrome de Roberts; Enfermedad de Sandhoff; Enfermedad de Schindler -Tipo 1; Deficiencia de Adenosina Deaminasa; Síndrome de Smith-Lemli-Opitz; Atrofia Muscular Espinal; Ataxia Espinocerebelar de Comienzo Infantil; Deficiencia de Hexosaminidasa A; Displasia Tanatofórica de Tipo 1; Trastornos Relacionados con el Colágeno Tipo VI; Síndrome de Usher Tipo I; Distrofia Muscular Congénita; Síndrome de Wolf-Hirschhorn; Deficiencia de LipasaÁcida Lisosomal y Xerodermia Pigmentosa. Acid Sphingomyelinase; Niemann-Pick Type C disease; Glycine encephalopathy; ARX Related Disorders; Urea Cycle Disorders; Osteogenesis Imperfecta Related to COL1A1 / 2; Mitochondrial DNA Suppression Syndromes; Disorders Related to PLP1; Perry syndrome; Phelan-McDermid syndrome; Type II Glycogen Storage Disease (Pompe Disease) (Childhood); MAPT Related Disorders; Disorders Related to MECP2; Type 1 Rhizomelic Chondrodysplasia Punctata; Roberts syndrome; Sandhoff's disease; Schindler's disease -Type 1; Adenosine Deaminase Deficiency; Smith-Lemli-Opitz syndrome; Spinal Muscular Atrophy; Spinocerebellar Ataxia of Childhood Beginning; Hexosaminidase A deficiency; Type 1 Tanatophoreic Dysplasia; Disorders Related to Type VI Collagen; Usher Syndrome Type I; Congenital Muscular Dystrophy; Wolf-Hirschhorn syndrome; Lipase Acid Lysosomal and Xeroderma Pigmentosa.

Como será evidente, se prevé que el presente sistema se pueda usar para fijar como objetivo cualquier secuencia de polinucleótidos de interés. Algunos ejemplos de afecciones o enfermedades que se podían tratar positivamente usando el presente sistema se incluyen en las Tablas anteriores y también se proporcionan allí ejemplos de genes asociados en la actualidad a esas enfermedades. Sin embargo, los genes ejemplificados no son exhaustivos. As will be apparent, it is envisioned that the present system can be used to target any polynucleotide sequence of interest. Some examples of conditions or diseases that could be treated positively using the present system are included in the above Tables and examples of genes currently associated with those diseases are also provided there. However, the exemplified genes are not exhaustive.

Ejemplos Examples

Los siguientes ejemplos se proporcionan para el fin de ilustración de diversas realizaciones de la invención y no están destinados a limitar la presente invención de ningún modo. Los presentes ejemplos, junto con los métodos descritos en la presente memoria son representativos en el momento presente de realizaciones preferidas, son ejemplares, y no se destinan como limitaciones del alcance de la invención. Serán evidentes para los expertos en la materia cambios en la misma y otros usos que estén abarcados por la invención como se define por el alcance de las reivindicaciones. The following examples are provided for the purpose of illustration of various embodiments of the invention and are not intended to limit the present invention in any way. The present examples, together with the methods described herein are representative at present of preferred embodiments, are exemplary, and are not intended as limitations on the scope of the invention. Changes in it and other uses that are encompassed by the invention as defined by the scope of the claims will be apparent to those skilled in the art.

Ejemplo 1: Actividad del complejo CRISPR en el núcleo de una célula eucariota. Example 1: Activity of the CRISPR complex in the nucleus of a eukaryotic cell.

Un sistema CRISPR de ejemplo de tipo II es el sitio CRISPR de tipo II de Streptococcus pyogenes SF370, que contiene una agrupación de cuatro genes Cas9, Cas1, Cas2 y Csn1, así como dos elementos de ARN no codificante, ARNtracr y una serie característica de secuencias repetitivas (repeticiones directas) interespaciadas por tramos cortos de secuencias no repetitivas (espaciadores, aproximadamente 30 pb cada uno). En este sistema, se genera rotura de doble cadena (RDC) de ADN fijado como objetivo en cuatro etapas secuenciales (Figura 2A). Primero, dos ARN no codificantes, la matriz pre-ARNcr y ARNtracr, se transcriben del sitio CRISPR. Segundo, ARNtracr se hibrida a las repeticiones directas de pre-ARNcr, que se tratan después en ARNcr maduros que contienen secuencias espaciadoras individuales. Tercero, el complejo ARNcr:ARNtracr maduro dirige Cas9 al ADN objetivo que consiste en el protoespaciador y la correspondiente PAM vía la formación de heterodúplex entre la región espaciadora del ARNcr y el ADN protoespaciador. Finalmente, Cas9 media la escisión de ADN objetivo aguas arriba de PAM para crear una RDC dentro del protoespaciador (Figura 2A). Este ejemplo describe un procedimiento de ejemplo para adaptar este sistema de nucleasa programable de ARN para dirigir la actividad del complejo CRISPR en el núcleo de las células eucariotas. An example type II CRISPR system is the Type II CRISPR site of Streptococcus pyogenes SF370, which contains a cluster of four Cas9, Cas1, Cas2 and Csn1 genes, as well as two non-coding RNA elements, RNAcrcr and a characteristic series of repetitive sequences (direct repetitions) interspaced by short stretches of non-repetitive sequences (spacers, approximately 30 bp each). In this system, double strand rupture (RDC) of target DNA is generated in four sequential stages (Figure 2A). First, two non-coding RNAs, the pre-siRNA matrix and RNAcrcr, are transcribed from the CRISPR site. Second, ARNtracr hybridizes to direct pre-cRNA repeats, which are then treated in mature cRNAs that contain individual spacer sequences. Third, the ARNcr: mature ARNtracr complex directs Cas9 to the target DNA consisting of the proto-spacer and the corresponding PAM via heteroduplex formation between the RNAcr spacer region and the proto-spacer DNA. Finally, Cas9 mediates the cleavage of target DNA upstream of PAM to create a RDC within the proto-spacer (Figure 2A). This example describes an example procedure to adapt this programmable RNA nuclease system to direct the activity of the CRISPR complex in the nucleus of eukaryotic cells.

Cultivo celular y transinfección. Cell culture and transfection.

Se mantuvo la estirpe celular HEK 293FT (Life Technologies) de riñón embriónico humano (HEK, por sus siglas en inglés) en Medio Eagle modificado de Dulbecco (DMEM, por sus siglas en inglés) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación en CO2 al 5%. Se mantuvo la estirpe celular neuro2A (N2A) de ratón (ATCC) con DMEM enriquecido con suero fetal bovino al 5% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con CO2 al 5%. The HEK 293FT (Life Technologies) human embryonic kidney (HEK) cell line was maintained in Dulbecco's Modified Eagle Medium (DMEM) enriched with 10% fetal bovine serum (HyClone) , 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 µg / ml streptomycin at 37 ° C with 5% CO2 incubation. The mouse neuro2A (N2A) cell line (ATCC) was maintained with DMEM enriched with 5% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 µg / ml streptomycin a 37 ° C with 5% CO2.

Se sembraron células 293FT de HEK o N2A en placas de 24 pozos (Corning) un día previamente a transinfección a una densidad de 200.000 células por pozo. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 24 pozos, se usó un total de 800 ng de plásmido. 293FT HEK or N2A cells were seeded in 24-well plates (Corning) one day prior to transfection at a density of 200,000 cells per well. Cells were transinfected using Lipofectamine 2000 (Life Technologies) following the protocol recommended by the manufacturer. For each well of a 24-well plate, a total of 800 ng of plasmid was used.

Ensayo surveyor y análisis de secuenciación para modificación de genomas. Surveyor test and sequencing analysis for genome modification.

Se transinfectaron células 293FT de HEK o N2A con ADN de plásmido como se describió anteriormente. Después de transinfección, se incubaron las células a 37°C durante 72 horas antes de extracción de ADN genómico. Se extrajo ADN genómico usando el estuche de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células en disolución QuickExtract y se incubaron a 65°C durante 15 minutos y 98°C durante 10 minutos. El ADN genómico extraído se trató inmediamente o se almacenó a 20ºC. 293FT HEK or N2A cells were transinfected with plasmid DNA as described above. After transfection, the cells were incubated at 37 ° C for 72 hours before genomic DNA extraction. Genomic DNA was extracted using the QuickExtract (Epicenter) DNA extraction kit following the manufacturer's protocol. In summary, the cells were resuspended in QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes. The extracted genomic DNA was treated immediately or stored at 20 ° C.

La región genómica que rodea un sitio objetivo de CRISPR para cada gen se multiplicó por PCR y se purificaron los The genomic region surrounding a CRISPR target site for each gene was multiplied by PCR and the cells were purified.

productos usando una columna de QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezcló un total de 400 ng los productos PCR purificados con 2 µl de tampón PCR Taq Polimerasa (Enzymatics) X 10 y agua ultrapura a un volumen final de 20 µl y se sometió a un procedimiento de rehibridación para permitir la formación de heterodúplex: 95°C durante 10 min, 95°C a 85°C descendiendo a -2°C/s, 85°C a 25°C a – 0,25°C/s y 25°C mantenidos durante 1 minuto. Después de rehibridación, se trataron los productos con nucleasa Surveyor y estimulador S Surveyor (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaron sobre geles de poliacrilamida Novex TBE al 4-20% (Life Technologies). Se tiñeron los geles con tinción de ADN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Gel Doc (Bio-rad). La cuantificación estuvo basada en intensidades de banda relativas, como una medición de la fracción de ADN escindido. La Figura 8 proporciona una ilustración esquemática de esta prueba Surveyor. products using a QiaQuick Spin column (Qiagen) following the manufacturer's protocol. A total of 400 ng of the purified PCR products was mixed with 2 µl of Taq Polymerase (Enzymatics) X 10 PCR buffer and ultrapure water to a final volume of 20 µl and underwent a rehybridization procedure to allow heteroduplex formation: 95 ° C for 10 min, 95 ° C to 85 ° C falling to -2 ° C / s, 85 ° C to 25 ° C at - 0.25 ° C / s and 25 ° C maintained for 1 minute. After rehybridization, the products were treated with Surveyor nuclease and S Surveyor stimulator (Transgenomics) following the manufacturer's recommended protocol and analyzed on Novex TBE 4-20% polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA staining (Life Technologies) for 30 minutes and images were formed with a Gel Doc (Bio-rad) gel imaging system. The quantification was based on relative band intensities, as a measurement of the fraction of cleaved DNA. Figure 8 provides a schematic illustration of this Surveyor test.

Prueba de polimorfismo de longitud de fragmento de restricción para detección de recombinación homóloga. Restriction fragment length polymorphism test for homologous recombination detection.

Se transinfectaron células 293FT de HEK y N2A con ADN de plásmido y se incubaron a 37ºC durante 72 horas antes de extracción de ADN genómico como se describió anteriormente. La región genómica objetivo se multiplicó por PCR usando cebadores fuera de las ramas de homología de la plantilla de recombinación homóloga (RH). Los productos PCR se separaron en un gel de agarosa al 1% y se extrajo con Estuche MinElute GelExtraction (Qiagen). Se digirieron los productos purificados con HindIII (Fermentas) y se analizaron en un gel de poliacrilamida Novex TBE al 6% (Life Technologies). HEK and N2A 293FT cells were transinfected with plasmid DNA and incubated at 37 ° C for 72 hours before genomic DNA extraction as described above. The target genomic region was multiplied by PCR using primers outside the homology branches of the homologous recombination template (RH). The PCR products were separated on a 1% agarose gel and extracted with MinElute GelExtraction Case (Qiagen). Products purified with HindIII (Fermentas) were digested and analyzed on a 6% Novex TBE polyacrylamide gel (Life Technologies).

Predicción y análisis de la estructura secundaria de ARN. Prediction and analysis of the secondary structure of RNA.

Se realizó la predicción de la estructura secundaria de ARN usando el webserver RNAfold online desarrollado en el Instituto para Química Teórica de la Universidad de Viena, usando el algoritmo de predicción de estructura centroide (véase por ej., A. R. Gruber et al., 2008, Cell 106 (1): 23-24 y PA Carr y GM Church, 2009, Nature Biotechnology 27 (12): 1.151-62). The secondary RNA structure prediction was performed using the online RNAfold webserver developed at the Institute for Theoretical Chemistry of the University of Vienna, using the centroid structure prediction algorithm (see, for example, AR Gruber et al., 2008, Cell 106 (1): 23-24 and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1,151-62).

Prueba de interferencia de transformación de plásmidos bacterianos. Interference test for transformation of bacterial plasmids.

Se reconstituyeron elementos del sitio 1 de CRISPR de S. pyogenes suficientes para actividad de CRISPR en E. coli usando plásmido de pCRISPR (ilustrado de manera esquemática en la Figura 10A). pCRISPR contenía ARNtracr, SpCas9, y una secuencia líder que conducía a la matriz de ARNcr. Se insertaron espaciadores (también referidos como “secuencias guía”) en la matriz de ARNcr entre los sitios BsaI usando oligonucleótidos hibridados, como se ilustra. Se construyeron plásmidos provocadores usados en la prueba de interferencia insertando la secuencia protoespaciadora (también referida como una “secuencia diana”) junto con una secuencia unidad de CRISPR adyacente (PAM) en pUC19 (véase la Figura 10B). El plásmido provocador contenía resistencia a la ampicilina. La figura 10C proporciona una representación esquemática de la prueba de interferencia. Las cepas E. coli químicamente competentes que ya soportaban pCRISPR y el espaciador apropiado se transformaron con el plásmido provocador que contenía la correspondiente secuencia protoespaciador-PAM. Se usó pUC19 para valorar la eficacia de la transformación de cada cepa competente soportando pCRISPR. La catividad CRISPR dio como resultado escisión del plásmido pPSP soportando el protoespaciador, que excluye la resistencia a la ampicilina conferida de otro modo por pUC19 que carece del protoespaciador. La figura 10D ilustra competencia de cada cepa de E. coli que soporta pCRISPR usada en las pruebas ilustradas en la Figura 4C. Elements of the S. pyogenes CRISPR site 1 were reconstituted sufficient for CRISPR activity in E. coli using pCRISPR plasmid (schematically illustrated in Figure 10A). pCRISPR contained ARNtracr, SpCas9, and a leader sequence that led to the matrix of ARNcr. Spacers (also referred to as "guide sequences") were inserted into the rRNA matrix between the BsaI sites using hybridized oligonucleotides, as illustrated. Provocative plasmids used in the interference test were constructed by inserting the proto-spacer sequence (also referred to as a "target sequence") together with an adjacent CRISPR unit sequence (PAM) in pUC19 (see Figure 10B). The provocative plasmid contained resistance to ampicillin. Figure 10C provides a schematic representation of the interference test. Chemically competent E. coli strains that already supported pCRISPR and the appropriate spacer were transformed with the provocative plasmid containing the corresponding proto-spacer-PAM sequence. PUC19 was used to assess the efficiency of the transformation of each competent strain supporting pCRISPR. CRISPR cativity resulted in cleavage of the pPSP plasmid supporting the proto-spacer, which excludes ampicillin resistance otherwise conferred by pUC19 lacking the proto-spacer. Figure 10D illustrates competence of each E. coli strain that supports pCRISPR used in the tests illustrated in Figure 4C.

Purificación de ARN. RNA purification.

Se mantuvieron células de HEK 293FT y se transinfectaron como se indicó anteriormente. Se recogieron las células por tripsinización seguido por lavado en disolución salina tamponada de fosfato (PBS). Se extrajo ARN de células totales con reactivo TRI (Sigma) siguiendo el protocolo del fabricante. Se cuantificó el ARN total extraido usando Naonodrop (Thermo Scientific) y se normalizó a la misma concentración. HEK 293FT cells were maintained and transinfected as indicated above. Cells were collected by trypsinization followed by washing in phosphate buffered saline (PBS). Total cell RNA was extracted with TRI reagent (Sigma) following the manufacturer's protocol. Total RNA extracted using Naonodrop (Thermo Scientific) was quantified and normalized to the same concentration.

Análisis por el método Northern de expresión de ARNcr y ARNtracr en células de mamífero. Analysis by the Northern method of expression of cRNA and RNAcr in mammalian cells.

Se mezclaron ARN con volúmenes iguales de tampón de carga X2 (Ambion), se calentó a 95ºC durante 5 min., se enfrió en hielo durante 1 min., y después se cargó en geles de poliacrilamida desnaturalizada al 8% (SequaGel, National Diagnostics) después de hacer operar previamente el gel durante al menos 30 minutos. Se sometieron las muestras a electroforesis durante 1,5 horas a un límite de 40 W. Después, se transfirió el ARN a membrana Hybond N+ (GE Healthcare) a 300 mA en un aparato de transferencia semiseco (Bio-rad) a temperatura ambiente durante 1,5 horas. Se reticuló el ARN a la membrana usando un botón de autoreticulación en Reticulador UV Stratagene el Stratalinker (Stratagene). Se hibridó previamente la membrana en Tampón de Hibridación ULTRAhyb-Oligo (Ambion) durante 30 min., con rotación a 42ºC y se añadieron después sondas y se hibridaron durante la noche. Se pidieron las sondas de IDT y se etiquetaron con ATP [gamma-32P] (Perkin Elmer) con T4 polinucleótido cinasa (New England Biolabs). Se lavó la membrana una vez con SSC (citrato de sodio – salino, por sus siglas en inglés) x2 precalentado (42ºC), SDS (dodecilsulfato de sodio, por sus siglas en inglés) al 0,5% durante 1 min., seguido por dos lavados de 30 minutos a 42ºC. Se expuso la membrana a pantalla de fósforo durante una hora o durante la noche a RNA was mixed with equal volumes of loading buffer X2 (Ambion), heated at 95 ° C for 5 min., Cooled on ice for 1 min., And then loaded onto 8% denatured polyacrylamide gels (SequaGel, National Diagnostics ) after previously operating the gel for at least 30 minutes. The samples were electrophoresed for 1.5 hours at a limit of 40 W. Then, the RNA was transferred to Hybond N + membrane (GE Healthcare) at 300 mA in a semi-dry transfer apparatus (Bio-rad) at room temperature for 1.5 hours The RNA was crosslinked to the membrane using a self-cross-linking button in Stratagene UV Straticinker (Stratagene). The membrane was previously hybridized in ULTRAhyb-Oligo Hybridization Buffer (Ambion) for 30 min., With rotation at 42 ° C and then probes were added and hybridized overnight. The RTD probes were ordered and labeled with ATP [gamma-32P] (Perkin Elmer) with T4 polynucleotide kinase (New England Biolabs). The membrane was washed once with SSC (sodium citrate - saline) x2 preheated (42), SDS (sodium dodecyl sulfate) 0.5% for 1 min., Followed for two 30 minute washes at 42 ° C. The phosphor screen membrane was exposed for one hour or overnight to

temperatura ambiente y después se escaneó con un fosforimager (Typhoon). room temperature and then scanned with a phosphorimager (Typhoon).

Construcción y evaluación de sistema CRISPR bacteriano. Construction and evaluation of bacterial CRISPR system.

Los elementos del sitio CRISPR, incluyendo ARNtracr, Cas9, y líder se multiplicaron por PCR de ADN genómico SF370 de Streptococcus pyogenes con ramas de homología de flanqueamiento por Gibson Assembly. Se introdujeron dos sitios BsaI tipo IIS en medio de dos repeticiones directas para facilitar la fácil inserción de espaciadores (Figura 9). Se clonaron los productos PCR en pACYC184 EcoRV-digerido aguas abajo del activador tet usando Mezcla Maestra de Gibson Assembly (NEB). Se omitieron otros elementos del sistema CRISPR endógeno, con la excepción de las últimas 50 pb de Csn2. Se clonaron espaciadores codificadores de oligos (Tecnología de ADN Integrada) con salientes complementarios en el vector BsaI-digerido pDC000 (NEB) y se ligaron después con T7 ligasa (Enzymatics) para generar plásmidos pCRISPR. Se crearon espaciadores que contenían plásmidos provocadores con secuencias de PAM (también referido en la presente memoria como “secuencias de unidades CRISPR”) ligando oligos hibridados soportando salientes compatibles (Tecnología de ADN Integrada) en pUC19 BamHI-digeridos. Se realizó clonación para todas las construcciones en cepa JM109 de E. coli (Zymo Research). The CRISPR site elements, including ARNtracr, Cas9, and leader were multiplied by Streptococcus pyogenes SF370 genomic DNA PCR with flanking homology branches by Gibson Assembly. Two IIS type BsaI sites were introduced in the middle of two direct repetitions to facilitate easy insertion of spacers (Figure 9). The PCR products were cloned into pACYC184 EcoRV-digested downstream of the tet activator using Gibson Assembly Master Mix (NEB). Other elements of the endogenous CRISPR system were omitted, with the exception of the last 50 bp of Csn2. Oligo coding spacers (Integrated DNA Technology) were cloned with complementary projections in the BsaI-digested vector pDC000 (NEB) and then ligated with T7 ligase (Enzymatics) to generate pCRISPR plasmids. Spacers containing provocative plasmids with PAM sequences (also referred to herein as "CRISPR unit sequences") were ligated by hybridizing oligos supporting compatible projections (Integrated DNA Technology) in pUC19 BamHI-digested. Cloning was performed for all constructs in E. coli strain JM109 (Zymo Research).

Las células que soportaban pCRISPR se hicieron competentes usando el Estuche de Transformación de E. coli Z-Competente y Ajuste de Tampón (Zymo Research, T3001) según las instrucciones del fabricante. En la prueba de transformación, se descongelaron sobre hielo alícuotas de 50 ul de células competentes que soportaban pCRISPR y se transformaron con 1 ng de plásmido espaciador o pUC19 sobre hielo durante 30 minutos, seguido por 45 segundos de choque térmico a 42ºC y 2 minutos sobre hielo. Con posterioridad, se añadieron 250 ul de SOC (Invitrogen) seguido por incubación con agitación a 37ºC durante 1 h y se pusieron en placas 100 ul de excrecencia pos-SOC en placas de selección dobles (12,5 ug/ml de cloranfenicol, 100 ug/ml de ampicilina). Para obtener ufc/ng de ADN, los números de colonias totales se multiplicaron por 3. The cells supporting pCRISPR were made competent using the E. coli Z-Competent and Buffer Adjustment Transformation Kit (Zymo Research, T3001) according to the manufacturer's instructions. In the transformation test, 50 ul aliquots of competent cells supporting pCRISPR were thawed on ice and transformed with 1 ng of spacer plasmid or pUC19 on ice for 30 minutes, followed by 45 seconds of thermal shock at 42 ° C and 2 minutes on ice. Subsequently, 250 ul of SOC (Invitrogen) was added followed by incubation with shaking at 37 ° C for 1 h and 100 ul plates of post-SOC excretion were placed in double selection plates (12.5 ug / ml chloramphenicol, 100 ug / ml ampicillin). To obtain cfu / ng of DNA, the numbers of total colonies were multiplied by 3.

Para mejorar la expresión de los componentes CRISPR en células de mamífero, se codón-optimizaron dos genes del sitio 1 de SF370 de Streptococcus pyogenes (S. pyogenes), Cas9 (SpCas9) y RNasa III (SpRNasa III). Para facilitar la localización nuclear, se incluyó una señal de localización nuclear (NLS, por sus siglas eninglés) en el término (N) amino o (C) carboxilo de tanto SpCas9 como SpRNasa III (Figura 2B). Para facilitar la visualización de la expresión de proteínas, también se incluyó un marcador de proteína fluorescente en el N-o C-terminal de ambas proteínas (Figura 2B). También se generó una versión de SpCas9 con una NLS unido a tanto N-como C-terminal (2xNLS-SpCas9). Se transinfectaron construcciones que contenían SpCas9 NLS-fusionada y SpRNasa III en células de riñón embriónico humano (HEK) 293FT y se encontró que el posicionamiento relativo de la NLS para SpCas9 y SpRNasa III afectaba a su eficacia de localización nuclear. Mientras la NLS C-terminal fue suficiente para fijar como objetivo SpRNasa III para los núcleos, la unión de una sola copia de estas NLS particulares en cualquiera de los NTo improve the expression of the CRISPR components in mammalian cells, two genes from the SF370 site 1 of Streptococcus pyogenes (S. pyogenes), Cas9 (SpCas9) and RNase III (SpRNase III) were codon-optimized. To facilitate nuclear localization, a nuclear localization signal (NLS) was included in the (N) amino or (C) carboxyl terminus of both SpCas9 and SpRNase III (Figure 2B). To facilitate visualization of protein expression, a fluorescent protein marker was also included in the N-or C-terminal of both proteins (Figure 2B). A version of SpCas9 was also generated with an NLS attached to both N-and C-terminal (2xNLS-SpCas9). Constructs containing NLS-fused SpCas9 and SpRNase III were transinfected into human embryonic kidney (HEK) 293FT cells and the relative positioning of the NLS for SpCas9 and SpRNase III was found to affect its nuclear localization efficiency. While the C-terminal NLS was sufficient to set SpRNase III as a target for the nuclei, the union of a single copy of these particular NLSs in any of the N

o C-terminales de SpCas9 no pudo conseguir la localización nuclear adecuada en este sistema. En este ejemplo, la NLS C-terminal fue la de nucleoplasmina (KRPAATKKAGQAKKKK) y la NLS C-terminal fue la del antígeno T grande SV40 (PKKKRKV). De las versiones de SpCas9 ensayadas, sólo 2xNLS -SpCas9 presentó localización nuclear (Figura 2B). o C-terminals of SpCas9 could not get the proper nuclear location in this system. In this example, the C-terminal NLS was the nucleoplasmin (KRPAATKKAGQAKKKK) and the C-terminal NLS was that of the SV40 large T antigen (PKKKRKV). Of the SpCas9 versions tested, only 2xNLS -SpCas9 presented nuclear localization (Figure 2B).

La ARNtracr del sitio CRISPR de S. pyogenes SF370 presenta dos sitios de comienzo transcripcional, dando lugar a dos transcritos de 89 nucleótidos (nt) y 171 nt que se tratan con posterioridad en ARNtracr maduros de 75 nt idénticos. Se seleccionó el ARNtracr de 89 nt más corto para expresión en células de mamífero (construcciones de expresión ilustradas en la Figura 7A, con funcionalidad cuando se determina por los resultados de la prueba de Surveryor mostrados en la Figura 7B). Los sitios de comienzo de la transcripción se señalan como +1 y el terminador de la transcripción y la secuencia probada por el ensayo de northern se indican también. La expresión de ARNtracr tratado también se confirmó por ensayo de Northern. La Figura 7C muestra los resultados de un análisis por el método de Northern de ARN total extraído de células 293FT transinfectadas con construcciones de expresión U6 que soportaban ARNtracr largo o corto, así como SpCas9 y DR-EMX1(1)-DR. Los paneles izquierdo y derecho son de células 293FT transinfectadas sin o con SpRNasa III, respectivamente. U6 indica control de carga representado gráficamente con una sonda que fija como objetivo ARNsn U6 humano. La transinfección de la construcción de expresión de ARNtracr corto conduce a niveles abundantes de la forma tratada de ARNtracr (~75 pb). Se detectan cantidades muy bajas de ARNtracr largo en el análisis de Northern. The ARNtracr of the S. pyogenes SF370 CRISPR site has two transcriptional start sites, resulting in two transcripts of 89 nucleotides (nt) and 171 nt that are subsequently treated in mature RNAcrcr of identical 75 nt. The shortest 89 nt RNAcrcr was selected for expression in mammalian cells (expression constructs illustrated in Figure 7A, with functionality when determined by the Surveryor test results shown in Figure 7B). The transcription start sites are indicated as +1 and the transcription terminator and the sequence tested by the northern assay are also indicated. Expression of treated tRNA was also confirmed by Northern assay. Figure 7C shows the results of an analysis by the Northern method of total RNA extracted from 293FT cells transinfected with U6 expression constructs that supported long or short RNAcrcr, as well as SpCas9 and DR-EMX1 (1) -DR. The left and right panels are of 293FT cells transinfected without or with SpRNase III, respectively. U6 indicates load control graphically represented with a probe that targets human U6 RNAs. Transfection of the short RNARcr expression construct leads to abundant levels of the treated form of RNAcrcr (~ 75 bp). Very low amounts of long RNAcrcr are detected in Northern analysis.

Para activar la iniciación precisa transcripcional, se seleccionó el activador de U6 basado en ARN polimerasa III para conducir la expresión de ARNtracr (Figura 2C). De manera similar, se desarrolló una construcción a base de activador U6 para expresar una matriz pre-ARNcr que consiste en un único espaciador flanqueado por dos repeticiones directas (las RD, también incluida por el término "secuencias de emparejamiento tracr"; Figura 2C). Se diseñó el espaciador inicial para fijar como objetivo un sitio objetivo de 33 pares de bases (pb) (protoespaciador de 30 pb más una secuencia de unidad (PAM) CRISPR de 3 pb que satisface la unidad de reconocimiento NGG de Cas9) en el sitio EMX1 humano (Figura 2C), un gen clave en el desarrollo de la corteza cerebral. To activate precise transcriptional initiation, the U6 activator based on RNA polymerase III was selected to drive the expression of RNAcrcr (Figure 2C). Similarly, a U6 activator-based construct was developed to express a pre-siRNA matrix consisting of a single spacer flanked by two direct repeats (the RDs, also included by the term "tracr pairing sequences"; Figure 2C) . The initial spacer was designed to target a target site of 33 base pairs (bp) (30 bp proto-spacer plus a 3 bp CRISPR unit (PAM) sequence that satisfies the Cas9 NGG recognition unit) at the site Human EMX1 (Figure 2C), a key gene in the development of the cerebral cortex.

Para ensayar si la expresión heteróloga del sistema CRISPR (SpCas9, SpRNasa III, ARNtracr y pre-ARNcr) en células de mamífero puede conseguir la escisión fijada como objetivo de cromosomas de mamífero, se To test whether the heterologous expression of the CRISPR system (SpCas9, SpRNase III, RNAcrcr and pre-siRNA) in mammalian cells can achieve the cleavage set as the target of mammalian chromosomes,

transinfectaron células HEK 293FT con combinaciones de componentes CRISPR. Puesto que las RDC en núcleos de mamífero se reparan parcialmente por la ruta de unión de extremos no homólogos (NHEJ, por sus siglas en inglés), que conduce a la formación de inserciones o supresiones, se usó el ensayo Surveyor para detectar potencial actividad de escisión en el sitio EMX1 objetivo (Figura 8) (véase por ej., Guschin et al., 2010, Methods Mol Biol 649: 247). La transinfección conjunta de los cuatro componentes CRISPR pudo inducir una escisión hasta del 5,0% en el protoespaciador (véase la Figura 2D). La transinfección conjunta de todos los componentes CRISPR menos SpRNasa III también indujo hasta 4,7% de inserción o supresión en el protoespaciador, que sugiere que puede haber RNasas de mamífero endógenas que son capaces de ayudar a la maduración de ARNcr, tal como por ejemplo las enzimas Dicer y Drosha relacionadas. Retirar cualquiera de los tres componentes restantes anuló la actividad de escisión del genoma del sistema CRISPR (Figura 2D). La secuenciación Sanger de amplicones que contienen el sitio fijado como objetivo verificó la actividad de escisión: en 43 clones secuenciados, se encontraron 5 alelos mutados (11,6%). Experimentos similares usando una variedad de secuencias guía produjeron porcentajes de inserción o supresión tan altos como 29% (véanse las Figuras 4-7, 12 y 13). Estos resultados definen un sistema de tres componentes para modificación de genomas mediada por CRISPR eficaz en células de mamífero. Para optimizar la eficacia de escisión, los solicitantes también ensayaron si diferentes isoformas de ARNtracr afectaban a la eficacia de la escisión y encontraron que, en este sistema de ejemplo, sólo la forma transcrita corta (89 pb) era capaz de mediar la escisión del sitio genómico EMX1 humano (Figura 7B). they transinfected HEK 293FT cells with combinations of CRISPR components. Since RDCs in mammalian nuclei are partially repaired by the non-homologous end junction path (NHEJ), which leads to the formation of insertions or deletions, the Surveyor test was used to detect potential activity of cleavage at the target EMX1 site (Figure 8) (see eg, Guschin et al., 2010, Methods Mol Biol 649: 247). The joint transfection of the four CRISPR components could induce a cleavage of up to 5.0% in the proto-spacer (see Figure 2D). Joint transinfection of all CRISPR components except SpRNase III also induced up to 4.7% insertion or deletion in the proto-spacer, which suggests that there may be endogenous mammalian RNases that are capable of aiding the maturation of cRNA, such as for example the related Dicer and Drosha enzymes. Removing any of the three remaining components nullified the genome cleavage activity of the CRISPR system (Figure 2D). Sanger sequencing of amplicons containing the target site verified the cleavage activity: in 43 sequenced clones, 5 mutated alleles (11.6%) were found. Similar experiments using a variety of guide sequences produced insertion or deletion rates as high as 29% (see Figures 4-7, 12 and 13). These results define a three component system for efficient CRISPR mediated genome modification in mammalian cells. To optimize the efficiency of cleavage, applicants also tested whether different isoforms of RNAcrcr affected the effectiveness of cleavage and found that, in this example system, only the short transcribed form (89 bp) was able to mediate site cleavage. Genomic human EMX1 (Figure 7B).

La Figura 14 proporciona un análisis de Northern adicional de tratamiento de ARNcr en células de mamífero. La Figura 14A ilustra un esquema que muestra el vector de expresión para un único espaciador flanqueado por dos repeticiones directas (RD-EMX1(1)-RD). El espaciador de 30 pb que fija como objetivo el protoespaciador 1 del sitio EMX1 humano (véase la Figura 6) y las secuencias de repetición directa se muestran en la secuencia debajo de la Figura 14A. La línea indica la región cuya secuencia de complemento inverso se usó para generar sondas de Northern para detección de ARNcr de EMX1(1). La Figura 14B muestra un análisis Northern de ARN total extraído de células 293FT transinfectadas con construcciones de expresión U6 que soportan RD-EMX1(1)-RD. Los paneles izquierdo y derecho son de células 293FT transinfectadas sin o con SpRNasa III respectivamente. Se trató RDEMX1(1)-RD en ARNcr maduros sólo en presencia de SpCas9 y ARNtracr corto y no fue dependiente de la presencia de SpRNasa III. El ARNcr maduro detectado de ARN total de 293FT transinfectado es ~33 pb y es más corto que el ARNcr maduro de 39-42 pb de S. pyogenes. Estos resultados demuestran que un sistema CRISPR se puede trasplantar en células eucariotas y reprogramar para facilitar la escisión de polinucleótidos objetivo de mamíferos endógenos. Figure 14 provides an additional Northern analysis of rRNA treatment in mammalian cells. Figure 14A illustrates a scheme showing the expression vector for a single spacer flanked by two direct repeats (RD-EMX1 (1) -RD). The 30 bp spacer that targets proto-spacer 1 of the human EMX1 site (see Figure 6) and the direct repeat sequences are shown in the sequence below Figure 14A. The line indicates the region whose reverse complement sequence was used to generate Northern probes for detection of EMX1 cRNA (1). Figure 14B shows a Northern analysis of total RNA extracted from 293FT cells transinfected with U6 expression constructs that support RD-EMX1 (1) -RD. The left and right panels are of 293FT cells transinfected without or with SpRNase III respectively. RDEMX1 (1) -RD was treated in mature cRNAs only in the presence of SpCas9 and short RNARcr and was not dependent on the presence of SpRNase III. The mature RNARcr of total 293FT RNA transinfected is ~ 33 bp and is shorter than the mature pRNA of 39-42 bp of S. pyogenes. These results demonstrate that a CRISPR system can be transplanted into eukaryotic cells and reprogrammed to facilitate excision of target polynucleotides from endogenous mammals.

La Figura 2 ilustra el sistema CRISPR bacteriano descrito en este ejemplo. La Figura 2A ilustra un esquema que muestra el sitio 1 de CRISPR de SF370 de Streptococcus pyogenes y un mecanismo propuesto de escisión de ADN mediada por CRISPR por este sistema. El ARNcr maduro tratado de la matriz de repetición directa – espaciador dirige Cas9 a objetivos genómicos que consisten en protoespaciadores favorables y una unidad adyacente al protoespaciador (PAM). En el emparejamiento de base objetivo-espaciador, Cas9 media una rotura de doble cadena en el ADN objetivo. La Figura 2B ilustra el logro de Cas9 de S. pyogenes (SpCas9) y RNasa III (SpRNasa III) con señales de localización nuclear (las NLS) para permitir la importación al núcleo del mamífero. La Figura 2C ilustra la expresión de mamífero de SpCas9 y SpRNasa III conducida por el activador EF1a constitutivo y ARNtracr y la matriz pre-ARNcr (RD-Espaciador-RD) conducida por el activador U6 de ARN Pol3 para activar iniciación y terminación de transcripción precisa. Se usa un protoespaciador del sitio EMX1 humano con una secuencia PAM satisfactoria como el espaciador en la serie pre-ARNcr. La Figura 2D ilustra ensayo de la nucleasa surveyor para inserciones y supresiones minoritarias mediadas por SpCas9. SpCas9 se expresó con y sin SpRNasa III, ARNtracr y una matriz pre-ARNcr que soporta el espaciador objetivo EMX1. La Figura 2E ilustra una representación esquemática de emparejamiento de bases entre el sitio objetivo y ARNcr que fija como objetivo EMX1, así como un cromatograma de ejemplo que muestra una microsupresión adyacente al sitio de escisión de SpCas9. La Figura 2F ilustra alelos mutados identificados de análisis de secuenciación de 43 amplicones clonales que muestran una variedad de microinserciones y supresiones. Las líneas discontinuas indican bases suprimidas y bases no alineadas o desajustadas indican inserciones o mutaciones. Barra de escala = 10 µm. Figure 2 illustrates the bacterial CRISPR system described in this example. Figure 2A illustrates a scheme showing the CRISPR site 1 of SF370 of Streptococcus pyogenes and a proposed mechanism of DNA cleavage mediated by CRISPR by this system. The treated mature rRNA of the direct repeat-spacer matrix directs Cas9 to genomic targets consisting of favorable proto-spacers and a unit adjacent to the proto-spacer (PAM). In the target-spacer base pairing, Cas9 mediates a double strand break in the target DNA. Figure 2B illustrates the achievement of S. pyogenes Cas9 (SpCas9) and RNase III (SpRNase III) with nuclear localization signals (the NLS) to allow importation into the mammalian nucleus. Figure 2C illustrates the mammalian expression of SpCas9 and SpRNase III driven by the constitutive EF1a activator and RNAcr and the pre-RNAcr matrix (RD-Spacer-RD) driven by the U6 activator of Pol3 RNA to activate precise transcription initiation and termination. . A human EMX1 site proto-spacer with a satisfactory PAM sequence is used as the spacer in the pre-siRNA series. Figure 2D illustrates the surveyor nuclease assay for minor insertions and deletions mediated by SpCas9. SpCas9 was expressed with and without SpRNase III, RNAcrcr and a pre-RNAcr matrix that supports the EMX1 target spacer. Figure 2E illustrates a schematic representation of base pairing between the target site and cRNA setting as an EMX1 target, as well as an example chromatogram showing microsuppression adjacent to the SpCas9 cleavage site. Figure 2F illustrates identified mutated alleles of sequencing analysis of 43 clonal amplicons showing a variety of microinsertions and deletions. Dashed lines indicate deleted bases and non-aligned or mismatched bases indicate insertions or mutations. Scale bar = 10 µm.

Para simplificar además el sistema de tres componentes, se adaptó un diseño híbrido de ARNcr-ARNtracr quimérico, donde un ARNcr maduro (que comprende una secuencia guía) se fusiona a un ARNtracr parcial vía un tallo-bucle para imitar el dúplex ARNcr:ARNtracr natural (Figura 3A). Para aumentar la eficacia de suministro conjunto, se creó un vector de expresión bicistrónico para conducir la coexpresión de un ARN quimérico y SpCas9 en células transinfectadas (Figuras 3A y 8). Paralelamente, se usaron los vectores bicistrónicos para expresar un pre-ARNcr (RD-secuencia guía-RD) con SpCas9, para inducir el progreso en ARNcr con un ARNtracr expresado por separado (compare la Figura 13B superior y del fondo). La Figura 9 proporciona ilustraciones esquemáticas de vectores de expresión bicistrónicos para matriz pre-ARNcr (Figura 9A) o ARNcr quimérico (representado por la línea corta aguas abajo del sitio de inserción de la secuencia guía y aguas arriba del activador EF1α en la Figura 9B) con hSpCas9, que muestra la posición de varios elementos y el punto de inserción de la secuencia guía. La secuencia expandida alrededor de la posición del sitio de inserción de la secuencia guía en la Figura 9B también muestra una secuencia RD parcial (GTTTAGAGCTA) y una secuencia de ARNtracr parcial (TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT). Las secuencias guía se pueden insertar entre sitios BbsI usando oligonucleótidos hibridados. El diseño de las To further simplify the three-component system, a hybrid design of chimeric ARNcr-ARNtracr was adapted, where a mature cRNA (comprising a guide sequence) is fused to a partial rRNA via a stem-loop to mimic the cRNA duplex: natural RNAcrcr (Figure 3A). To increase the efficiency of joint delivery, a bicistronic expression vector was created to drive the coexpression of a chimeric RNA and SpCas9 in transfected cells (Figures 3A and 8). At the same time, bicistronic vectors were used to express a pre-cRNA (RD-guide sequence-RD) with SpCas9, to induce progress in cRNA with a separately expressed RNAcr (compare Figure 13B above and in the background). Figure 9 provides schematic illustrations of bicistronic expression vectors for pre-siRNA matrix (Figure 9A) or chimeric cRNA (represented by the short line downstream of the insertion site of the guide sequence and upstream of the EF1α activator in Figure 9B) with hSpCas9, which shows the position of several elements and the insertion point of the guide sequence. The expanded sequence around the position of the insertion site of the guide sequence in Figure 9B also shows a partial RD sequence (GTTTAGAGCTA) and a partial ARNtracr sequence (TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT). Guidance sequences can be inserted between BbsI sites using hybridized oligonucleotides. The design of the

secuencias para los oligonucleótidos se muestra bajo las ilustraciones esquemáticas en la Figura 9, con los adaptadores de ligadura apropiados indicados. WPRE representa el elemento regulador postranscripcional del virus de la hepatitis Woodchuck. Se ensayó la eficacia de la escisión mediada por ARN quimérico fijando como objetivo el mismo sitio EMX1 descrito anteriormente. Usando tanto la prueba Surveyor como la secuenciación de Sanger de amplicones, los solicitantes confirmaron que el diseño de ARN quimérico facilita la escisión del sitio EMX1 humano con aproximadamente una relación de modificación de 4,7% (Figura 4). Sequences for oligonucleotides are shown under the schematic illustrations in Figure 9, with the appropriate ligation adapters indicated. WPRE represents the post-transcriptional regulatory element of the Woodchuck hepatitis virus. The efficacy of chimeric RNA mediated cleavage was tested by targeting the same EMX1 site described above. Using both the Surveyor test and the Sanger sequencing of amplicons, the applicants confirmed that the design of chimeric RNA facilitates the cleavage of the human EMX1 site with approximately a modification ratio of 4.7% (Figure 4).

Se ensayó el carácter generalizable de la escisión medidad por CRISPR en células eucariotas fijando como objetivo los sitios genómicos adicionales en células tanto humanas como de ratón diseñando múltiples sitios que fijen como objetivo ARN quimérico en el EMX1 y PVALB humanos, así como los sitios Th de ratón. La Figura 15 ilustra la selección de algunos protoespaciadores fijados como objetivo adicionales en PVALB humano (Figura 15A) y sitios Th de ratón (Figura 15B). Se proporcionan esquemas de los sitios génicos y la posición de tres protoespaciadores en el último exón de cada uno. Las secuencias subrayadas incluyen 30 pb de secuencia protoespaciadora y 3 pb en el extremo 3’ correspondiente a las secuencias de PAM. Los protoespaciadores en las cadenas codificante y no codificante se indican por encima y por debajo de las secuencias de ADN, respectivamente. Se consiguió una tasa de modificación de 6,3% y 0,75% para los sitios PVALB humano y Th de ratón, respectivamente, que demuestra la amplia aplicabilidad del sistema CRISPR en la modificación de diferentes sitios a través de múltiples organismos (Figuras 3B y 6). Aunque la escisión sólo se detectó con uno de tres espaciadores para cada sitio usando las construcciones quiméricas, todas las secuencias objetivo se escindieron con eficacia de producción de inserción o supresión que alcanzó el 27% cuando se usó la disposición de pre-ARNcr expresada conjuntamente (Figura 6). The generalizable nature of CRISPR-mediated excision in eukaryotic cells was tested by targeting additional genomic sites in both human and mouse cells by designing multiple sites that target chimeric RNA in human EMX1 and PVALB, as well as Th sites of mouse. Figure 15 illustrates the selection of some proto-spacers set as additional targets in human PVALB (Figure 15A) and mouse Th sites (Figure 15B). Schemes of the gene sites and the position of three proto-spacers in the last exon of each are provided. The underlined sequences include 30 bp of proto-spacer sequence and 3 bp at the 3 ′ end corresponding to the PAM sequences. The proto-spacers in the coding and non-coding chains are indicated above and below the DNA sequences, respectively. A modification rate of 6.3% and 0.75% was achieved for human and Th mouse PVALB sites, respectively, demonstrating the broad applicability of the CRISPR system in the modification of different sites across multiple organisms (Figures 3B and 6). Although cleavage was only detected with one of three spacers for each site using the chimeric constructs, all target sequences were cleaved with insertion or suppression production efficiency that reached 27% when the jointly expressed pre-RNAcr provision was used ( Figure 6).

La Figura 13 proporciona una ilustración más de que SpCas9 puede ser reprogramado para fijar como objetivo múltiples sitios genómicos en células de mamífero. La Figura 13A proporciona un esquema del sitio EMX1 humano que muestra la posición de cinco protoespaciadores, indicado por las secuencias subrayadas. La Figura 13B proporciona un esquema del complejo pre-ARNcr/ARNtrcr que muestra la hibridación entre la región de repetición directa del pre-ARNcr y ARNtracr (parte superior) y un esquema de un diseño de ARN quimérico que comprende una secuencia guía de 20 pb y secuencias de emparejamiento tracr y tracr que consisten en secuencias de repetición directa parcial y ARNtracr hibridadas en una estructura de horquilla (fondo). Los resultados de un ensayo Surveyor comparando la eficacia de escisión mediada por Cas9 en cinco protoespaciadores en el sitio EMX1 humano se ilustra en la Figura 13C. Cada protoespaciador se fija como objetivo usando complejo preARNcr/ARNtracr tratado (ARNcr) o ARN quimérico (ARNqui). Figure 13 provides a further illustration that SpCas9 can be reprogrammed to target multiple genomic sites in mammalian cells. Figure 13A provides a schematic of the human EMX1 site showing the position of five proto-spacers, indicated by the underlined sequences. Figure 13B provides a scheme of the pre-siRNA / tRNA complex that shows hybridization between the direct repeat region of the pre-siRNA and RNAcr (upper part) and a scheme of a chimeric RNA design comprising a 20 bp guide sequence and tracr and tracr pairing sequences consisting of partial direct repeat sequences and RNAcrcr hybridized on a hairpin structure (background). The results of a Surveyor trial comparing the efficacy of Cas9-mediated cleavage in five proto-spacers in the human EMX1 site is illustrated in Figure 13C. Each proto-spacer is set as a target using treated preRNAcr / RNAcrcr complex (cRNA) or chimeric RNA (siRNA).

Puesto que la estructura secundaria de ARN puede ser crucial para interacciones intermoleculares, se usó un algoritmo de predicción de estructuras basado en energía libre mínima y conjunto de estructura pesada de Boltzmann para comparar la estructura secundaria putativa de todas las secuencias guía usadas en nuestro experimento de fijación como objetivo de genoma (Figura 3B) (véase por ej., Gruber et al., 2008, Nucleic Acids Research, 36: W70). El análisis reveló que en la mayoría de los casos, las secuencias guía eficaces en el contexto de ARNcr quimérico estaban sustancialmente exentas de unidades de estructura secundaria, mientras las secuencias guía ineficaces era más probable que formaran estructuras secundarias internas que podían evitar el emparejamiento de bases con el ADN de protoespaciador objetivo. Así es posible que la variabilidad en la estructura secundaria del espaciador pueda impactar en la eficacia de la interferencia mediada por CRISPR cuando se usa un ARNcr quimérico. Since the secondary RNA structure can be crucial for intermolecular interactions, a Boltzmann minimum structure and heavy structure set based prediction algorithm was used to compare the putative secondary structure of all guiding sequences used in our experiment. genome target fixation (Figure 3B) (see e.g., Gruber et al., 2008, Nucleic Acids Research, 36: W70). The analysis revealed that in most cases, effective guide sequences in the context of chimeric cRNA were substantially free of secondary structure units, while inefficient guide sequences were more likely to form internal secondary structures that could prevent base pairing. with the target proto-spacer DNA. Thus it is possible that the variability in the secondary structure of the spacer may impact the efficacy of CRISPR-mediated interference when a chimeric cRNA is used.

La Figura 3 ilustra vectores de expresión de ejemplo. La Figura 3A proporciona un esquema de un vector bicistrónico para conducir la expresión de una quimera ARNcr-ARNtracr sintética (ARN quimérico) así como SpCas9. El ARN guía quimérico contiene una secuencia guía de 20 pb correspondiendo al protoespaciador en el sitio objetivo genómico. La Figura 3B proporciona un esquema que muestra secuencias guía que fijan como objetivo los sitios EMX1, PVALB humano y Th de ratón, así como sus estructuras secundarias previstas. La eficacia de la modificación en cada sitio objetivo se indica debajo del dibujo de la estructura secundaria del ARN (EMX1, n = 216 lecturas de secuenciación de amplicones; PVALB, n = 224 lecturas; Th, n = 265 lecturas). El algoritmo de plegamiento produjo una salida con cada base coloreada de acuerdo con su probabilidad de asumir la estructura secundaria prevista, como se indica por una escala en arco iris que se reproduce en la Figura 3B en escala de grises. Más diseños de vectores para SpCas9 se presentan en la Figura 44, que ilustra vectores únicos de expresión que incorporan un activador U6 ligado a un sitio de inserción para un oligo guía y un activador Cbh ligado a secuencia de codificación de SpCas9. El vector mostrado en la Figura 44b incluye una secuencia codificadora de ARNtracr ligada a un activador H1. Figure 3 illustrates example expression vectors. Figure 3A provides a schematic of a bicistronic vector to drive the expression of a synthetic cRNA-RNAcrcr chimera (chimeric RNA) as well as SpCas9. The chimeric guide RNA contains a 20 bp guide sequence corresponding to the proto-spacer at the genomic target site. Figure 3B provides a scheme showing guide sequences that target the EMX1, human PVALB and mouse Th sites, as well as their intended secondary structures. The effectiveness of the modification at each target site is indicated below the secondary RNA structure drawing (EMX1, n = 216 amplicon sequencing readings; PVALB, n = 224 readings; Th, n = 265 readings). The folding algorithm produced an output with each colored base according to its probability of assuming the expected secondary structure, as indicated by a rainbow scale that is reproduced in Figure 3B in grayscale. More vector designs for SpCas9 are presented in Figure 44, which illustrates unique expression vectors incorporating a U6 activator linked to an insertion site for a guide oligo and a Cbh activator linked to SpCas9 coding sequence. The vector shown in Figure 44b includes an RNAcr coding sequence linked to an H1 activator.

Para ensayar si los espaciadores que contienen estructuras secundarias son capaces de funcionar en células procariotas en las cuales los CRISPR operan de manera natural, se ensayó interferencia de transformación de plásmidos que soportan protoespaciadores en una cepa E. coli que expresa de manera heteróloga el sitio 1 CRISPR SF370 de S. pyogenes (Figura 10). Se clonó el sitio CRISPR en un vector de expresión E. coli de copia baja y se reemplazó la matriz de ARNcr con un espaciador único flanqueado por un par de las RD (pCRISPR). Se transformaron cepas E. coli que albergaban diferentes plásmidos pCRISPR con plásmidos problema conteniendo el correspondiente protoespaciador y secuencias PAM (Figura 10C). En el ensayo de bacterias, todos los espaciadores To test whether spacers that contain secondary structures are capable of functioning in prokaryotic cells in which CRISPRs operate naturally, interference transformation of plasmids that support proto-spacers in an E. coli strain that heterologously expresses site 1 was tested. CRISPR SF370 by S. pyogenes (Figure 10). The CRISPR site was cloned into a low copy E. coli expression vector and the rRNA matrix was replaced with a single spacer flanked by a pair of RD (pCRISPR). E. coli strains were transformed that harbored different pCRISPR plasmids with problem plasmids containing the corresponding proto-spacer and PAM sequences (Figure 10C). In the bacteria test, all spacers

facilitaron interferencia de CRISPR eficaz (Figura 4C). Estos resultados sugieren que puede haber factores adicionales que afecten a la eficacia de la actividad de CRISPR en células de mamífero. facilitated interference from effective CRISPR (Figure 4C). These results suggest that there may be additional factors that affect the efficacy of CRISPR activity in mammalian cells.

Para investigar la especificidad de la escisión mediada por CRISPR, se analizó el efecto de mutaciones de único nucleótido en la secuencia guía sobre la escisión del protoespaciador en el genoma de mamífero usando una serie de ARNcr quiméricos que fijan como objetivo EMX1 con mutaciones de puntos únicos (Figura 4A). La Figura 4B ilustra los resultados de un ensayo de nucleasa Surveyor comparando la eficacia de la escisión de Cas9 cuando se empareja con diferentes ARN quiméricos mutantes. El desajuste de bases únicas hasta 12 pb 5' de la PAM sustancialmente anuló la escisión genómica por SpCas9, mientras los espaciadores con mutaciones en posiciones aguas arriba más lejos retuvieron la actividad frente al objetivo del protoespaciador original (Figura 4B). Además de la PAM, SpCas9 presenta especificidad de base única dentro de las últimas 12 pb del espaciador. Además, CRISPR es capaz de mediar la escisión genómica tan eficazmente como un par de nucleasas TALE (TALEN) fijando como objetivo el mismo protoespaciador EMX1. La Figura 4C proporciona un esquema que muestra el diseño de las TALEN que fijan como objetivo EMX1 y la Figura 4D muestra un gel Surveyor comparando la eficacia de TALEN y Cas9 (n=3). To investigate the specificity of CRISPR-mediated cleavage, the effect of single nucleotide mutations in the guide sequence on proto-spacer cleavage in the mammalian genome was analyzed using a series of chimeric cRNAs that target EMX1 with single-point mutations. (Figure 4A). Figure 4B illustrates the results of a Surveyor nuclease assay comparing the efficacy of Cas9 cleavage when paired with different mutant chimeric RNAs. The mismatch of single bases up to 12 bp 5 'of the PAM substantially nullified the genomic cleavage by SpCas9, while spacers with mutations in upstream positions further retained activity against the target of the original proto-spacer (Figure 4B). In addition to the PAM, SpCas9 has unique base specificity within the last 12 bp of the spacer. In addition, CRISPR is able to mediate genomic excision as effectively as a pair of TALE (TALEN) nucleases by targeting the same EMX1 proto-spacer. Figure 4C provides a scheme that shows the design of the TALENs that target EMX1 and Figure 4D shows a Surveyor gel comparing the efficacy of TALEN and Cas9 (n = 3).

Teniendo establecida una serie de componentes para conseguir edición de genes mediada por CRISPR en células de mamífero a través del mecanismo NHEJ con predisposición a errores, se ensayó la capacidad de CRISPR para estimular la recombinación homóloga (RH), una ruta de reparación de genes de alta fidelidad para preparar ediciones precisas en el genoma. SpCas9 natural es capaz de mediar las RDC específicas del sitio, que se pueden reparar a través de tanto NHEJ como RH. Además, se logró una sustitución de aspartato a alanina (D10A) en el dominio catalítico RuvC I de SpCas9 para convertir la nucleasa en una nickasa (SpCas9n; ilustrado en la Figura 5A) (véase por ej., Sapranauskas et al., 2011, Nucleic Acids Research, 39: 9.275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109: E2579), de manera que el ADN genómico nickeado experimenta la reparación dirigida por homología de alta fidelidad (HDR, por sus siglas en inglés). La prueba Surveyor confirmó que SpCas9n no generaba inserciones o supresiones en el objetivo del protoespaciador EMX1. Como se ilustra en la Figura 5B, la expresión conjunta de ARNcr quimérico que fija como objetivo EMX1 con SpCas9 produjo inserciones o supresiones en el sitio fijado como objetivo, mientras la expresión conjunta con SpCas9n no lo hizo (n=3). Por otra parte, la secuenciación de 327 amplicones no detectó ninguna inserción o supresión inducida por SpCas9n. Se seleccionó el mismo sitio para ensayar RH mediada por CRISPR por transinfección conjunta de células HEK 293FT con el ARN quimérico que fija como objetivo EMX1, hSpCas9 o hSpCas9n, así como una plantilla de RH para introducir un par de sitios de restricción (HindIII y NheI) cerca del protoespaciador. La Figura 5C proporciona una ilustración en esquema de la estrategia de la RH, con posiciones relativas de puntos de recombinación y secuencias de hibridación de cebadores (flechas). SpCas9 y SpCas9n por supuesto catalizaron la integración de la plantilla de RH en el sitio EMX1. La multiplicación por PCR de la región fijada como objetivo seguida por digestión de restricción con HindIII reveló productos de escisión correspondiendo a tamaños de fragmentos esperados (flechas en análisis de gel de polimorfismo de longitud del fragmento de restricción mostrado en la Figura 5D), mediando SpCas9 y SpCas9n niveles similares de eficacias de la RH. Los solicitantes verificaron además RH usando secuenciación de Sanger de amplicones genómicos (Figura 5E). Estos resultados demuestran la utilidad de CRISPR para facilitar la inserción de genes fijados como objetivo en el genoma del mamífero. Dada la especificidad objetivo de 14 pb (12 pb del espaciador y 2 pb de la PAM) de SpCas9 natural, la disponibilidad de una nickasa puede reducir significativamente la probabilidad de modificaciones fuera de lo proyectado, puesto que las roturas de cadena única no son sustratos para la ruta NHEJ con predisposición a errores. Having established a series of components to achieve CRISPR-mediated gene editing in mammalian cells through the error-predisposed NHEJ mechanism, CRISPR's ability to stimulate homologous recombination (RH), a gene repair pathway of High fidelity to prepare precise editions in the genome. Natural SpCas9 is capable of mediating site-specific RDCs, which can be repaired through both NHEJ and RH. In addition, a substitution of aspartate to alanine (D10A) in the RuvC I catalytic domain of SpCas9 was achieved to convert the nuclease into a nickasa (SpCas9n; illustrated in Figure 5A) (see e.g., Sapranauskas et al., 2011, Nucleic Acids Research, 39: 9.275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109: E2579), so that nickeado genomic DNA undergoes high fidelity homology-directed repair (HDR) its acronym in English). The Surveyor test confirmed that SpCas9n did not generate insertions or deletions in the objective of the EMX1 proto-spacer. As illustrated in Figure 5B, the joint expression of chimeric cRNA that targets EMX1 with SpCas9 resulted in insertions or deletions at the target site, while joint expression with SpCas9n did not (n = 3). On the other hand, sequencing of 327 amplicons did not detect any insertion or suppression induced by SpCas9n. The same site was selected to test CRIS-mediated HR by joint transfection of HEK 293FT cells with the chimeric RNA that targets EMX1, hSpCas9 or hSpCas9n, as well as an HR template to introduce a couple of restriction sites (HindIII and NheI ) near the proto-spacer. Figure 5C provides a schematic illustration of the HR strategy, with relative positions of recombination points and primer hybridization sequences (arrows). SpCas9 and SpCas9n of course catalyzed the integration of the HR template into the EMX1 site. PCR multiplication of the target region followed by restriction digestion with HindIII revealed cleavage products corresponding to expected fragment sizes (arrows in polymorphism gel analysis of restriction fragment length shown in Figure 5D), mediating SpCas9 and SpCas9n similar levels of HR efficiencies. Applicants also verified RH using Sanger sequencing of genomic amplicons (Figure 5E). These results demonstrate the usefulness of CRISPR to facilitate the insertion of target genes in the mammalian genome. Given the objective specificity of 14 bp (12 bp of the spacer and 2 bp of the PAM) of natural SpCas9, the availability of a nickasa can significantly reduce the likelihood of out-of-projected modifications, since single chain breaks are not substrates for the NHEJ route with predisposition to errors.

Las construcciones de expresión que imitan la arquitectura natural de sitios CRISPR con espaciadores formados (Figura 2A) se construyeron para ensayar la posibilidad de fijar como objetivo secuencias multiplexadas. Usando una única matriz de CRISPR codificando un par de espaciadores que fijan como objetivo EMX1 y PVALB, se detectó la escisión eficaz en ambos sitios (Figura 4F, que muestra tanto un diseño esquemático de la matriz ARNcr como un análisis Surveyor mostrando la mediación eficaz de la escisión). La supresión fijada como objetivo de regiones genómicas mayores a través de las RDC concurrentes usando espaciadores frente a dos objetivos dentro de EMX1 espaciado por 119 pb también se ensayó y se detectó una eficacia de la supresión del 1,6% (3 de un total de 182 amplicones; Figura 4G). Esto demuestra que el sistema CRISPR puede mediar la edición multiplexada dentro de un único genoma. Expression constructs that mimic the natural architecture of CRISPR sites with formed spacers (Figure 2A) were constructed to test the possibility of targeting multiplexed sequences. Using a single CRISPR matrix encoding a pair of spacers that target EMX1 and PVALB, effective cleavage was detected at both sites (Figure 4F, which shows both a schematic design of the ARNcr matrix and a Surveyor analysis showing the effective mediation of cleavage). The target suppression of major genomic regions across concurrent CDRs using spacers versus two targets within EMX1 spaced by 119 bp was also tested and a suppression efficiency of 1.6% was detected (3 of a total of 182 amplicons; Figure 4G). This demonstrates that the CRISPR system can mediate multiplexed editing within a single genome.

Ejemplo 2: Modificaciones y alternativas del sistema CRISPR. Example 2: Modifications and alternatives of the CRISPR system.

La capacidad para usar ARN para programar escisión de ADN específica de la secuencia define una nueva clase de herramientas de ingeniería del genoma para una variedad de aplicaciones de investigación e industriales. Diversos aspectos del sistema CRISPR se pueden mejorar además para aumentar la eficacia y la versatilidad de la fijación como objetivo de CRISPR. La actividad óptima de Cas9 puede depender de la disponibilidad de Mg2+ libre en niveles mayores que el presente en el núcleo de los mamíferos (véase por ej., Jinek et al., 2012, Science, 337: 816) y la preferencia para una unidad de NGG inmediatamente aguas abajo del protoespaciador restringe la capacidad para fijar como objetivo de promedio cada 12 pb en el genoma humano (Figura 11, evaluando las cadenas positiva y negativa de secuencias de cromosomas humanos). Algunas de estas restricciones se pueden superar explorando la The ability to use RNA to program sequence specific DNA cleavage defines a new class of genome engineering tools for a variety of research and industrial applications. Various aspects of the CRISPR system can also be improved to increase the efficiency and versatility of the fixation as a goal of CRISPR. The optimal activity of Cas9 may depend on the availability of free Mg2 + at levels greater than that present in the mammalian nucleus (see eg, Jinek et al., 2012, Science, 337: 816) and the preference for a unit NGG immediately downstream of the proto-spacer restricts the ability to set an average target every 12 bp in the human genome (Figure 11, evaluating the positive and negative chains of human chromosome sequences). Some of these restrictions can be overcome by exploring the

diversidad de los sitios CRISPR a través del metagenoma microbiano (véase por ej., Makarova et al., 2011, Nat Rev Microbiol, 9: 467). Otros sitios CRISPR pueden ser trasplantados en el medio celular de los mamíferos mediante un procedimiento similar al descrito en el Ejemplo 1. Por ejemplo, la Figura 12 ilustra la adaptación del sistema CRISPR de Tipo II de CRISPR 1 de LMD-9 de Streptococcus thermophilus para expresión heteróloga en células de mamífero para conseguir edición de genomas mediada por CRISPR. La Figura 12A proporciona una ilustración esquemática de CRISPR 1 de LMD-9 de S. thermophilus. La Figura 12B ilustra el diseño de un sistema de expresión para el sistema CRISPR de S. thermophilus. Se expresa hStCas9 codón-optimizado humano usando un activador de EF1α constitutivo. Las versiones maduras de ARNtracr y ARNcr se expresan usando el activador U6 para activar la iniciación de transcripción precisa. Se ilustran las secuencias del ARNcr y ARNtracr maduros. Se usa una sola base indicada por el caso inferior “un” en la secuencia de ARNcr para retirar la secuencia poliU, que sirve como un terminador transcripcional de ARN polIII. La Figura 12C proporciona un esquema que muestra secuencias guía que fijan como objetivo el sitio EMX1 humano, así como sus estructuras secundarias previstas. La eficacia de la modificación en cada sitio fijado como objetivo se indica debajo de las estructuras secundarias de ARN. El algoritmo que genera las estructuras colorea cada base de acuerdo con su probabilidad para asumir la estructura secundaria prevista, que se indica por una escala en arco iris reproducida en la Figura 12C en escala gris. La Figura 12D muestra los resultados de la escisión mediada por hStCas9 en el sitio fijado como objetivo usando la prueba Surveyor. Los espaciadores 1 y 2 guía de ARN indujeron 14% y 6,4%, respectivamente. El análisis estadístico de la actividad de escisión a través de réplicas biológicas en estos dos sitios del protoespaciador se proporciona también en la Figura 6. La Figura 16 proporciona un esquema de protoespaciador adicional y los correspondientes objetivos de secuencia PAM del sistema CRISPR de S. thermophilus en el sitio EMX1 humano. Se resaltan dos secuencias protoespaciadoras y se indican sus correspondientes secuencias PAM satisfaciendo la unidad NNAGAAW subrayando 3’ con respecto a la correspondiente secuencia resaltada. Los dos protoespaciadores fijan como objetivo la cadena no codificante. diversity of CRISPR sites through the microbial metagenome (see eg, Makarova et al., 2011, Nat Rev Microbiol, 9: 467). Other CRISPR sites can be transplanted into the mammalian cell medium by a procedure similar to that described in Example 1. For example, Figure 12 illustrates the adaptation of the CRISPR Type II system of CRISPR 1 of LMD-9 of Streptococcus thermophilus to heterologous expression in mammalian cells to achieve genome editing mediated by CRISPR. Figure 12A provides a schematic illustration of CRISPR 1 of LMD-9 from S. thermophilus. Figure 12B illustrates the design of an expression system for the CRISPR system of S. thermophilus. Human codon-optimized hStCas9 is expressed using a constitutive EF1α activator. Mature versions of ARNtracr and ARNcr are expressed using the U6 activator to activate precise transcription initiation. Mature rRNA and RNAcrcr sequences are illustrated. A single base indicated by the lower case "a" in the cRNA sequence is used to remove the polyU sequence, which serves as a transcriptional terminator of polIII RNA. Figure 12C provides a scheme showing guide sequences that target the human EMX1 site, as well as its intended secondary structures. The effectiveness of the modification at each target site is indicated below the secondary RNA structures. The algorithm that generates the structures colors each base according to its probability to assume the expected secondary structure, which is indicated by a rainbow scale reproduced in Figure 12C in gray scale. Figure 12D shows the results of hStCas9-mediated cleavage at the target site using the Surveyor test. RNA guide spacers 1 and 2 induced 14% and 6.4%, respectively. Statistical analysis of the cleavage activity through biological replicas at these two proto-spacer sites is also provided in Figure 6. Figure 16 provides an additional proto-spacer scheme and the corresponding PAM sequence objectives of the S. thermophilus CRISPR system. on the human EMX1 site. Two proto-spacer sequences are highlighted and their corresponding PAM sequences are indicated satisfying the NNAGAAW unit underlining 3 ’with respect to the corresponding highlighted sequence. The two proto-spacers set the non-coding chain as their objective.

Ejemplo 3: Algoritmo de selección de secuencias objetivo de muestra. Example 3: Algorithm for selection of sample target sequences.

Se diseña un programa informático para identificar secuencias objetivo de CRISPR candidato en ambas cadenas de una secuencia de ADN de entrada basada en longitud deseada de secuencias guía y una secuencia de unidad CRISPR (PAM) para una enzima CRISPR especificada. Por ejemplo, los sitios objetivo para Cas9 de S. pyogenes, con secuencias NGG de PAM, se pueden identificar por investigación para 5'-Nx-NGG-3' ambas en la secuencia de entrada y en el complemento inverso de la entrada. Asimismo, los sitios objetivo para Cas9 de CRISPR1 de S. thermophilus, con secuencia NNAGAAW de PAM, se pueden identificar por investigación para 5'-Nx-NNAGAAW-3' ambos en la secuencia de entrada y en el complemento inverso de la entrada. Asimismo, los sitios objetivo para Cas9 de CRISPR3 de S. thermophilus, con secuencia NGGNG de PAM, se pueden identificar por investigación para 5'-Nx-NGGNG-3' ambos en la secuencia de entrada y en el complemento inverso de la entrada. El valor "x" en Nx puede ser fijado por el programa o especificado por el usuario, tal como 20. A computer program is designed to identify candidate CRISPR target sequences in both strands of an input DNA sequence based on desired length of guide sequences and a CRISPR unit sequence (PAM) for a specified CRISPR enzyme. For example, the target sites for Cas9 of S. pyogenes, with PAM NGG sequences, can be identified by investigation for 5'-Nx-NGG-3 'both in the input sequence and in the inverse complement of the input. Likewise, the target sites for Cas9 of CRISPR1 of S. thermophilus, with PAM NNAGAAW sequence, can be identified by research for 5'-Nx-NNAGAAW-3 'both in the input sequence and in the reverse complement of the input. Likewise, the target sites for Cas9 of CRISPR3 of S. thermophilus, with PAM NGGNG sequence, can be identified by investigation for 5'-Nx-NGGNG-3 'both in the input sequence and in the inverse complement of the input. The value "x" in Nx can be set by the program or specified by the user, such as 20.

Puesto que múltiples apariciones en el genoma del sitio objetivo de ADN pueden conducir a edición de genoma no especifica, después de identificar todos los sitios potenciales, el programa filtra secuencias basadas en el número de veces que aparecen en el genoma de referencia relevante. Para esas enzimas CRISPR para las cuales se determina la especificidad de secuencia mediante una secuencia "simiente", tal como la 5’ de 11-12 pb de la secuencia PAM, incluyendo la propia secuencia PAM, la etapa de filtración puede estar basada en la secuencia simiente. Así, para evitar la edición en sitios genómicos adicionales, los resultados se filtran basándose en el número de apariciones de la secuencia simiente:PAM en el genoma relevante. Se puede permitir que el usuario elija la longitud de la secuencia simiente. También se puede permitir que el usuario especifique el número de apariciones de la secuencia simiente:PAM en un genoma para fines de pase del filtro. El defecto es investigar secuencias únicas. El nivel de filtración se modifica cambiando tanto la longitud de la secuencia simiente como el número de apariciones de la secuencia en el genoma. El programa puede proporcionar además o alternativamente la secuencia de una secuencia guía complementaria a la secuencia o secuencias objetivo indicadas proporcionando el complemento inverso de la secuencia o secuencias objetivo identificadas. Se pueden encontrar más detalles de métodos y algoritmos para optimizar la selección de secuencias en la solicitud de patente de EE. UU. Nº de Serie 61/836.080 (certificado del abogado 44790.11.2022). Since multiple occurrences in the genome of the target DNA site can lead to unspecified genome editing, after identifying all potential sites, the program filters sequences based on the number of times they appear in the relevant reference genome. For those CRISPR enzymes for which sequence specificity is determined by a "seed" sequence, such as the 5 'of 11-12 bp of the PAM sequence, including the PAM sequence itself, the filtration step may be based on the seed sequence. Thus, to avoid editing in additional genomic sites, the results are filtered based on the number of occurrences of the seed sequence: PAM in the relevant genome. The user can be allowed to choose the length of the seed sequence. The user can also be allowed to specify the number of occurrences of the seed sequence: PAM in a genome for filter pass purposes. The defect is to investigate unique sequences. The level of filtration is modified by changing both the length of the seed sequence and the number of occurrences of the sequence in the genome. The program may additionally or alternatively provide the sequence of a complementary guide sequence to the indicated sequence or target sequences by providing the inverse complement of the identified sequence or target sequences. More details of methods and algorithms to optimize sequence selection can be found in the US patent application. UU. Serial No. 61 / 836.080 (lawyer's certificate 44790.11.2022).

Ejemplo 4: Evaluación de híbridos ARNcr-ARNtracr quiméricos múltiples. Example 4: Evaluation of multiple chimeric ARNcr-ARNtracr hybrids.

Este ejemplo describe los resultados obtenidos para los ARN quiméricos (los ARNqui; que comprenden una secuencia guía, una secuencia de emparejamiento tracr y una secuencia tracr en un transcrito único) que tienen secuencias tracr que incorporan diferentes longitudes de secuencia ARNtracr natural. La Figura 18a ilustra un esquema de un vector bicistrónico de expresión para ARN quimérico y Cas9. Cas9 es conducido por el activador CBh y el ARN quimérico es conducido por un activador U6. El ARN guía quimérico consta de una secuencia guía de 20 pb (Ns) unida a la secuencia tracr (barriendo desde la primera "U" de la cadena menor al extremo del transcrito), que se trunca en diversas posiciones como se indica. Las secuencias guía y tracr se separan mediante la secuencia de emparejamiento tracr GUUUUAGAGCUA seguido por la secuencia bucle GAAA. Los resultados de los ensayos SURVEYOR para inserciones o supresiones mediadas por Cas9 en los sitios EMX1 y PVALB humanos se ilustran This example describes the results obtained for the chimeric RNAs (the siRNAs, which comprise a guide sequence, a tracr pairing sequence and a tracr sequence in a single transcript) that have tracr sequences that incorporate different lengths of natural RNAcrcr sequence. Figure 18a illustrates a schematic of a bicistronic expression vector for chimeric RNA and Cas9. Cas9 is driven by the CBh activator and the chimeric RNA is driven by a U6 activator. The chimeric guide RNA consists of a 20 bp guide sequence (Ns) attached to the tracr sequence (sweeping from the first "U" of the minor chain to the end of the transcript), which is truncated at various positions as indicated. The guide and tracr sequences are separated by the GUUUUAGAGCUA tracr pairing sequence followed by the GAAA loop sequence. The results of SURVEYOR tests for insertions or deletions mediated by Cas9 at human EMX1 and PVALB sites are illustrated.

en la Figura 18b y 18c, respectivamente. Las flechas indican los fragmentos SURVEYOR esperados. Los ARNqui se indican por su designación "+n" y ARNcr se refiere a un ARN híbrido donde las secuencias guía y tracr se expresan como transcritos separados. La cuantificación de estos resultados, realizados por triplicado, se ilustran por histograma en las Figuras 19a y 19b, que corresponden a las Figuras 18b y 18c, respectivamente ("N. D." indica no inserciones o supresiones detectadas). Los ID del protoespaciador y su correspondiente objetivo genómico, secuencia del protoespaciador, secuencia PAM y posición de la cadena se proporcionan en la Tabla D. Las secuencias guía se diseñaron para que fueran complementarias a la secuencia completa del protoespaciador en el caso de transcritos separados en el sistema híbrido o sólo a la porción subrayada en el caso de ARN quiméricos. in Figure 18b and 18c, respectively. The arrows indicate the expected SURVEYOR fragments. The siRNAs are indicated by their designation "+ n" and cRNA refers to a hybrid RNA where the guide and tracr sequences are expressed as separate transcripts. The quantification of these results, performed in triplicate, are illustrated by histogram in Figures 19a and 19b, which correspond to Figures 18b and 18c, respectively ("N.D." indicates no insertions or deletions detected). The proto-spacer IDs and their corresponding genomic target, proto-spacer sequence, PAM sequence and chain position are provided in Table D. The guiding sequences were designed to be complementary to the complete proto-spacer sequence in the case of separate transcripts in the hybrid system or only the underlined portion in the case of chimeric RNA.

Tabla D: Table D:

Cultivo celular y transinfección. Cell culture and transfection.

Se mantuvo la estirpe celular 293FT (Life Technologies) de riñón embriónico humano (HEK) en Medio Eagle modificado de Dulbecco (DMEM) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación en CO2 al 5%. Se sembraron células 293FT en placas de 24 pozos (Coming) 24 horas previamente a transinfección a una densidad de The human embryonic kidney (HEK) cell line 293FT (Life Technologies) was maintained in Dulbecco's Modified Eagle Medium (DMEM) enriched with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml of penicillin and 100 µg / ml of streptomycin at 37 ° C with incubation in 5% CO2. 293FT cells were seeded in 24-well plates (Coming) 24 hours prior to transfection at a density of

150.000 células por pozo. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 24 pozos, se usó un total de 500 ng de plásmido. 150,000 cells per well. Cells were transinfected using Lipofectamine 2000 (Life Technologies) following the protocol recommended by the manufacturer. For each well of a 24-well plate, a total of 500 ng of plasmid was used.

Prueba SURVEYOR para modificación de genomas. SURVEYOR test for genome modification.

Se transinfectaron células 293FT con ADN de plásmido como se describió anteriormente. Se incubaron las células a 37°C durante 72 horas post-transinfección previamente a extracción de ADN genómico. Se extrajo ADN genómico usando la disolución de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células del botón en disolución QuickExtract y se incubaron a 65°C durante 15 minutos y 98°C durante 10 minutos. La región genómica que flanquea el sitio objetivo de CRISPR para cada gen se multiplicó por PCR (cebadores enumerados en la Tabla E) y se purificaron los productos usando una columna de QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezclaron 400 ng totales de los productos PCR purificados con 2 µl 10X de tampón PCR Taq ADN Polimerasa (Enzymatics) y agua ultrapura a un volumen final de 20 µl y se sometieron a un procedimiento de rehibridación para permitir la formación de heterodúplex: 95°C durante 10 min, 95°C a 85°C descendiendo a -2°C/s, 85°C a 25°C a – 0,25°C/s y 25°C mantenidos durante 1 minuto. Después de rehibridación, se trataron los productos con nucleasa SURVEYOR y estimulador S SURVEYOR (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaron sobre geles de poliacrilamida Novex TBE al 4-20% (Life Technologies). Se tiñeron los geles con tinción de ADN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Gel Doc (Bio-rad). La cuantificación estuvo basada en intensidades de banda relativas. 293FT cells were transinfected with plasmid DNA as described above. Cells were incubated at 37 ° C for 72 hours post-transfection prior to genomic DNA extraction. Genomic DNA was extracted using the QuickExtract DNA extraction solution (Epicenter) following the manufacturer's protocol. In summary, the button cells were resuspended in QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes. The genomic region flanking the CRISPR target site for each gene was multiplied by PCR (primers listed in Table E) and the products were purified using a QiaQuick Spin column (Qiagen) following the manufacturer's protocol. Total 400 ng of the purified PCR products were mixed with 2 µl 10X of Taq DNA Polymerase PCR buffer (Enzymatics) and ultrapure water to a final volume of 20 µl and subjected to a rehybridization procedure to allow heteroduplex formation: 95 ° C for 10 min, 95 ° C to 85 ° C falling to -2 ° C / s, 85 ° C to 25 ° C at - 0.25 ° C / s and 25 ° C held for 1 minute. After rehybridization, the products were treated with SURVEYOR nuclease and S SURVEYOR stimulator (Transgenomics) following the protocol recommended by the manufacturer and analyzed on 4-20% Novex TBE polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA staining (Life Technologies) for 30 minutes and images were formed with a Gel Doc (Bio-rad) gel imaging system. The quantification was based on relative band intensities.

Tabla E: Table E:

nombre del cebador primer name
objetivo genómico secuencia del cebador (5' a 3') genomic target primer sequence (5 'to 3')

Sp-EMX1-F Sp-EMX1-F
EMX1 AAAACCACCCTTCTCTCTGGC EMX1 AAAACCACCCTTCTCTCTGGC

Sp-EMX1-R Sp-EMX1-R
EMX1 EMX1

Sp-PVALB-F Sp-PVALB-F
PVALB CTGGAAAGCCAATGCCTGAC PVALB CTGGAAAGCCAATGCCTGAC

Sp-PVALB-R Sp-PVALB-R
PVALB GGCAGCAAACTCCTTGTCCT PVALB GGCAGCAAACTCCTTGTCCT

Identificación computacional de sitios fijados como objetivo de CRISPR únicos. Computational identification of sites set as the objective of unique CRISPR.

Para identificar sitios fijados como objetivo, únicos, para la enzima SF370 Cas9 (SpCas9) de S. pyogenes en genoma de ser humano, ratón, rata, pez cebra, mosca de la fruta y C. elegans, se desarrolló un paquete informático para escanear ambas cadenas de una secuencia de ADN e identificar todos los posibles sitios objetivo de SpCas9. Para este ejemplo, cada sitio objetivo SpCas9 se definió operacionalmente como una secuencia de 20 pb seguido por una secuencia de unidad adyacente del protoespaciador (PAM) de NGG y se identificaron todas las secuencias que satisfacían esta definición de 5'-N20-NGG-3' en todos los cromosomas. Para evitar la edición de genoma no específica, después de identificar todos los sitios potenciales, se filtraron todos los sitios objetivo basándose en el número de veces que aparecían en el genoma de referencia relevante. Para sacar provecho de la especificidad de la secuencia de la actividad de Cas9 conferida por una secuencia "simiente", que puede ser, por ejemplo, secuencia 5' de aproximadamente 11-12 pb de la secuencia PAM, se seleccionaron secuencias 5'-NNNNNNNNNN-NGG-3' para que fueran únicas en el genoma relevante. Todas las secuencias genómicas se descargaron de UCSC Genome Browser (genoma humano hg19, genoma de ratón mm9, genoma de rata rn5, genoma de pez cebra danRer7, genoma dm4 de D. melanogaster y genoma ce10 de C. elegans). Los resultados de la investigación completa están disponibles para navegar usando la información de UCSC Genome Browser. Una visualización de ejemplo de algunos sitios objetivo en el genoma humano se proporciona en la Figura 21. To identify unique, targeted sites for the SF370 Cas9 (SpCas9) enzyme of S. pyogenes in the human, mouse, rat, zebrafish, fruit fly and C. elegans genomes, a computer package was developed to scan both chains of a DNA sequence and identify all possible SpCas9 target sites. For this example, each SpCas9 target site was operationally defined as a 20 bp sequence followed by an adjacent NGG proto-spacer (PAM) unit sequence and all sequences that met this 5'-N20-NGG-3 definition were identified 'on all chromosomes. To avoid non-specific genome editing, after identifying all potential sites, all target sites were filtered based on the number of times they appeared in the relevant reference genome. To take advantage of the sequence specificity of the Cas9 activity conferred by a "seed" sequence, which may be, for example, 5 'sequence of approximately 11-12 bp of the PAM sequence, 5'-NNNNNNNNNN sequences were selected -NGG-3 'to be unique in the relevant genome. All genomic sequences were downloaded from UCSC Genome Browser (human genome hg19, mouse genome mm9, rat genome rn5, zebrafish genome danRer7, genome dm4 of D. melanogaster and genome ce10 of C. elegans). The results of the full investigation are available to navigate using the UCSC Genome Browser information. An example visualization of some target sites in the human genome is provided in Figure 21.

Inicialmente, se fijaron como objetivo tres sitios dentro del sitio de EMX1 en células HEK 293FT humanas. Se evaluó la eficacia de la modificación del genoma de cada ARNqui usando la prueba de la nucleasa SURVEYOR, que detecta mutaciones que resultan de las roturas de la doble cadena de ADN (las RDC) y su posterior reparación por la ruta de reparación de daños de ADN de unión de extremos no homólogos (NHEJ). Las construcciones designadas ARNqui(+n) indican que hasta el nucleótido +n de ARNtracr natural se incluye en la construcción de ARN quimérico, con valores de 48, 54, 67 y 85 usados para n. Los ARN quiméricos que contienen fragmentos mayores de ARNtracr natural (ARNqui (+67) y ARNqui (+85)) mediaron la escisión de ADN en los tres sitios objetivo de EMX1, demostrando ARNqui (+85) en particular niveles significativamente mayores de escisión de ADN que los correspondientes híbridos ARNcr/ARNtracr que expresaron secuencias guía y tracr en transcritos separados (Figuras 18b y 19a). También se fijaron como objetivo dos sitios en el sitio PVALB que no proporcionaron escisión detectable usando el sistema híbrido (secuencia guía y secuencia tracr expresadas como transcritos separados) usando los ARNqui. ARNqui(+67) y ARNqui(+85) pudieron mediar escisión significativa en los dos protoespaciadores PVALB (Figuras 18c y 19b). Initially, three sites within the EMX1 site in human HEK 293FT cells were targeted. The effectiveness of genomic modification of each siRNA was evaluated using the SURVEYOR nuclease test, which detects mutations that result from breaks in the double strand of DNA (the RDCs) and its subsequent repair by the damage repair path of Non-homologous end junction DNA (NHEJ). The designated RNAi (+ n) constructs indicate that even the nucleotide + n of natural RNAcrcr is included in the construction of chimeric RNA, with values of 48, 54, 67 and 85 used for n. Chimeric RNAs containing major fragments of natural RNAcrcr (RNAi (+67) and RNAi (+85)) mediated DNA cleavage at the three target sites of EMX1, demonstrating siRNA (+85) in particular significantly higher levels of cleavage of DNA than the corresponding siRNA / RNAcrcr hybrids that expressed guide and tracr sequences in separate transcripts (Figures 18b and 19a). Two sites were also targeted at the PVALB site that did not provide detectable cleavage using the hybrid system (guide sequence and tracr sequence expressed as separate transcripts) using the siRNAs. ARNqui (+67) and ARNqui (+85) were able to mediate significant excision in the two PVALB proto-spacers (Figures 18c and 19b).

Para los cinco objetivos en los sitios EMX1 y PVALB, se observó un incremento consistente en la eficacia de modificación del genoma con longitud creciente de la secuencia tracr. Sin desear estar limitados por ninguna teoría, la estructura secundaria formada por el extremo 3' de la ARNtracr puede desempeñar una función en la activación de la tasa de formación de complejo CRISPR. Una ilustración de las estructuras secundarias previstas para cada uno de los ARN quiméricos usados en este ejemplo se proporciona en la Figura 21. Se predijo la estructura secundaria usando RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi) usando energía libre mínima y algoritmo de función de partición. El pseudocolor para cada base (reproducido en escala de grises) indica la probabilidad de emparejamiento. Debido a que los ARNqui con secuencias tracr más largas eran capaces de escindir objetivos que no eran escindidos por híbridos ARNcr/ARNtracr de CRISPR naturales, es posible que se pueda cargar ARN quimérico en Cas9 más eficazmente que su contrapartida híbrida natural. Para facilitar la aplicación de Cas9 para edición de genoma específica del sitio en células y organismos eucariotas, todos los sitios objetivo únicos previstos para la Cas9 de S. pyogenes se identificaron de manera computacional en los genomas del ser humano, ratón, rata, pez cebra, C. elegans y D. melanogaster. Se pueden diseñar ARN quiméricos para enzimas Cas9 de otros microbios para expandir el espacio fijado como objetivo de las nucleasas programables de ARN de CRISPR. For the five objectives at the EMX1 and PVALB sites, a consistent increase in the efficiency of genome modification with increasing length of the tracr sequence was observed. Without wishing to be bound by any theory, the secondary structure formed by the 3 'end of the ARNtracr can play a role in the activation of the CRISPR complex formation rate. An illustration of the secondary structures envisioned for each of the chimeric RNAs used in this example is provided in Figure 21. The secondary structure was predicted using RNAfold (http://rna.tbi.univie.ac.at/cgi-bin /RNAfold.cgi) using minimum free energy and partition function algorithm. The pseudo color for each base (reproduced in grayscale) indicates the probability of pairing. Because siRNAs with longer tracr sequences were able to cleave targets that were not cleaved by natural CRISPR cRNA / RNAcrcr hybrids, it is possible that chimeric RNA can be loaded into Cas9 more efficiently than its natural hybrid counterpart. To facilitate the application of Cas9 for site-specific genome editing in eukaryotic cells and organisms, all unique target sites intended for Cas9 of S. pyogenes were computationally identified in the genomes of human, mouse, rat, zebrafish , C. elegans and D. melanogaster. Chimeric RNAs can be designed for Cas9 enzymes of other microbes to expand the target space of the CRISPR RNA programmable nucleases.

La Figura 22 ilustra un vector de expresión bicistrónico ejemplar para expresión de ARN quimérico incluyendo hasta el nucleótido +85 de secuencia de ARNtracr natural y SpCas9 con secuencias de localización nuclear. SpCas9 se expresa a partir de un activador CBh y termina con la señal poliA bGH (bGH pA). La secuencia expandida ilustrada inmediatamente debajo del esquema corresponde a la región que rodea al sitio de inserción de la secuencia guía e Figure 22 illustrates an exemplary bicistronic expression vector for chimeric RNA expression including up to nucleotide +85 of natural RNAcrcr sequence and SpCas9 with nuclear localization sequences. SpCas9 is expressed from a CBh activator and ends with the polyA bGH signal (bGH pA). The expanded sequence illustrated immediately below the scheme corresponds to the region surrounding the insertion site of the guide sequence e

incluye, desde 5' a 3', la porción 3' del activador U6 (primera región sombreada), sitios de escisión BbsI (flechas), repetición directa parcial (secuencia de emparejamiento tracr GTTTTAGAGCTA, subrayada), secuencia bucle GAAA y secuencia tracr +85 (secuencia subrayada después de la secuencia bucle). Un inserto de la secuencia guía ejemplar se ilustra debajo del sitio de la inserción de la secuencia guía, con nucleótidos de la secuencia guía para un objetivo seleccionado representado por un "N". includes, from 5 'to 3', the 3 'portion of the activator U6 (first shaded region), BbsI cleavage sites (arrows), partial direct repeat (GTTTTAGAGCTA tracr pairing sequence, underlined), GAAA loop sequence and tracr + sequence 85 (underlined sequence after the loop sequence). An example guide sequence insert is illustrated below the insertion site of the guide sequence, with nucleotides of the guide sequence for a selected target represented by an "N".

Las secuencias descritas en los ejemplos anteriores son como sigue (las secuencias de polinucleótidos son 5’ a 3’): The sequences described in the previous examples are as follows (polynucleotide sequences are 5 ’to 3’):

ARNtracr corto U6 (Streptococcus pyogenes SF370): Short siRNA U6 (Streptococcus pyogenes SF370):

(negrita = secuencia ARNtracr; subrayado = secuencia terminadora) 10 ARNtracr largo U6 (SF370 Streptococcus pyogenes): (Bold = ARNtracr sequence; underlined = terminator sequence) 10 Long RNAcrcr U6 (SF370 Streptococcus pyogenes):

U6-DR-BbsI cadena principal-RD (SF370 Streptococcus pyogenes): U6-DR-BbsI main chain-RD (SF370 Streptococcus pyogenes):

15 U6-ARN quimérico-Cadena principal BbsI (SF370 Streptococcus pyogenes) NLS-SpCas9-EGFP: SpCas9-EGFP-NLS: NLS-SpCas9-EGFP-NLS: NLS-SpCas9-NLS: 15 U6-chimeric RNA-BbsI main chain (SF370 Streptococcus pyogenes) NLS-SpCas9-EGFP: SpCas9-EGFP-NLS: NLS-SpCas9-EGFP-NLS: NLS-SpCas9-NLS:

NLS-mCherry-SpRNasa3: NLS-mCherry-SpRNasa3:

SpRNasa3-mCherry-NLS: SpRNasa3-mCherry-NLS:

NLS-SpCas9n-NLS (la mutación de nickasa D10A es minúscula): hEMX1-Plantilla RH-HindII-NheI: NLS-StCsn1-NLS: U6-RD-espaciador-RD (SF370 S. pyogenes) NLS-SpCas9n-NLS (nickel D10A mutation is lowercase): hEMX1-Template RH-HindII-NheI: NLS-StCsn1-NLS: U6-RD-spacer-RD (SF370 S. pyogenes)

ARN quimérico que contiene +48 ARNtracr (SF370 S. pyogenes) Chimeric RNA containing +48 RNAtracr (SF370 S. pyogenes)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico que contiene +54 ARNtracr (SF370 S. pyogenes) Chimeric RNA containing +54 RNAtracr (SF370 S. pyogenes)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico que contiene +67 ARNtracr (SF370 S. pyogenes) Chimeric RNA containing +67 RNAtracr (SF370 S. pyogenes)

10 (N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) 10 (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico que contiene +85 ARNtracr (SF370 S. pyogenes) Chimeric RNA containing +85 RNAtracr (SF370 S. pyogenes)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; 15 negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; 15 bold = terminator)

CBh-NLS-SpCas9-NLS CBh-NLS-SpCas9-NLS

(subrayado = NLS-hSpCas9-NLS) ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) (underlined = NLS-hSpCas9-NLS) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) (N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

10 (N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) 10 (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; 15 negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; 15 bold = terminator)

ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

20 ARN quimérico de ejemplo para Cas9 CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) 20 Example chimeric RNA for Cas9 CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) Example chimeric RNA for Cas9 CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW) (N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) Example chimeric RNA for Cas9 CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

ARN quimérico de ejemplo para Cas9 CRISPR3 LMD-9 de S. thermophilus (con PAM de NGGNG) Example chimeric RNA for Cas9 CRISPR3 LMD-9 from S. thermophilus (with NGGNG PAM)

(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador) (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)

Versión codón-optimizada de Cas9 de sitio CRISPR3 LMD-9 de S. thermophilus (con una NLS en ambos extremos 5’ y 3’) Codon-optimized version of Cas9 of CRISPR3 LMD-9 site of S. thermophilus (with an NLS at both 5 ’and 3’ ends)

Ejemplo 5: Edición guiada de ARN de genomas bacterianos usando sistemas CRISPR-Cas. Example 5: Guided edition of RNA from bacterial genomes using CRISPR-Cas systems.

Los solicitantes usaron la endonucleasa Cas9 asociada a CRISPR para introducir mutaciones precisas en los genomas de Streptococcus pneumoniae y Escherichia coli. La propuesta se basa en escisión dirigida por Cas9 en el sitio fijado como objetivo para destruir células no mutadas y evitar la necesidad de marcadores seleccionables o sistemas contra la selección. La especificidad de Cas9 se volvió a programar cambiando la secuencia de ARN CRISPR (ARNcr) corto para hacer cambios de nucleótidos únicos y múltiples soportados sobre plantillas de edición. El uso simultáneo de dos ARNcr permitió la mutagénesis múltiplex. En S. pneumoniae, casi el 100% de las células que sobrevivió a la escisión de Cas9 contenía la mutación deseada y el 65% cuando se usó junto con recombinación en E. coli. Los solicitantes analizaron de manera exhaustiva los requerimientos de fijación como objetivo de Cas9 para definir el intervalo de secuencias fijables como objetivo y mostraron las estrategias para editar sitios que no requieren estos requerimientos, sugiriendo la versatilidad de esta técnica para lograr genomas bacterianos. Applicants used the Cas9 endonuclease associated with CRISPR to introduce precise mutations in the genomes of Streptococcus pneumoniae and Escherichia coli. The proposal is based on Cas9-directed cleavage at the site set as a target to destroy non-mutated cells and avoid the need for selectable markers or anti-selection systems. The specificity of Cas9 was reprogrammed by changing the short CRISPR RNA sequence (ARNcr) to make single and multiple nucleotide changes supported on editing templates. The simultaneous use of two cRNAs allowed multiplex mutagenesis. In S. pneumoniae, almost 100% of the cells that survived the Cas9 cleavage contained the desired mutation and 65% when used together with recombination in E. coli. The applicants thoroughly analyzed the fixation requirements as a Cas9 objective to define the range of fixed sequences as an objective and showed the strategies to edit sites that do not require these requirements, suggesting the versatility of this technique to achieve bacterial genomes.

El entendimiento de la función génica depende de la posibilidad de modificar las secuencias de ADN dentro de la célula de un modo controlado. La mutagénesis específica del sitio en eucariotas se consigue por el uso de nucleasas específicas de la secuencia que activan la recombinación homóloga de un ADN de plantilla que contiene la mutación de interés. Las nucleasas con dedos de cinc (las ZFN, por sus siglas en inglés), las nucleasas efectoras de tipo activador de la transcripción (las TALEN, por sus siglas en inglés) y meganucleasas de direccionamiento específico pueden programarse para escindir genomas en posiciones específicas, pero estas propuestas requieren lograr nuevas enzimas para cada secuencia diana. En organismos procariotas, los métodos de mutagénesis introducen un marcador de selección en el sitio editado o requieren un procedimiento de dos etapas que incluya un sistema contra la selección. Más recientemente, las proteínas de recombinación de fagos se han usado para recombinación, una técnica que activa la recombinación homóloga de ADN lineal u oligonucleótidos. Sin embargo, debido a que no hay selección de mutaciones, la eficacia de la recombinación puede ser relativamente baja (0,1-10% para mutaciones puntuales hasta 10-5-10-6 para mayores modificaciones), requiriendo en muchos casos la detección sistemática de un gran número de colonias. Por lo tanto, aún se requieren nuevas tecnologías que sean a un precio asequible, fáciles de usar y eficaces para ingeniería genética de organismos tanto eucariotas como procariotas. The understanding of gene function depends on the possibility of modifying the DNA sequences within the cell in a controlled way. Site-specific mutagenesis in eukaryotes is achieved by the use of sequence-specific nucleases that activate homologous recombination of a template DNA containing the mutation of interest. Zinc finger nucleases (ZFNs), transcription activator-type effector nucleases (TALEN) and specific targeting meganucleases can be programmed to cleave genomes at specific positions, but these proposals require achieving new enzymes for each target sequence. In prokaryotic organisms, mutagenesis methods introduce a selection marker at the edited site or require a two-stage procedure that includes a system against selection. More recently, phage recombination proteins have been used for recombination, a technique that activates homologous recombination of linear DNA or oligonucleotides. However, because there is no selection of mutations, the efficacy of recombination can be relatively low (0.1-10% for point mutations up to 10-5-10-6 for major modifications), requiring in many cases detection Systematic of a large number of colonies. Therefore, new technologies are still required that are affordable, easy to use and effective for genetic engineering of both eukaryotic and prokaryotic organisms.

El trabajo reciente sobre el sistema inmunitario adaptativo de CRISPR (repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas) de procariotas ha conducido a la identificación de nucleasas cuya especificidad de secuencias se programa por ARN pequeños. Los sitios de CRISPR están constituidos por una serie de repeticiones separadas por secuencias “espaciadoras” que igualan los genomas de los bacteriófagos y otros elementos genéticos móviles. La matriz repetición-espaciador se transcribe como un gran precursor y se trata dentro de secuencias de repetición para generar ARNcr pequeño que especifique las secuencias diana (también conocidas como protoespaciadores) escindidas por sistemas CRISPR. Es esencial para la escisión la presencia de una unidad de secuencia inmediatamente aguas abajo de la región fijada como objetivo, conocida como la unidad protoespaciadora-adyacente (PAM). Los genes asociados a CRISPR (cas) normalmente flanquean la matriz repetición-espaciador y codifican la maquinaria enzimática responsable de la biogénesis y fijación como objetivo de ARNcr. Cas9 es una endonucleasa de ADNdc que usa una guía de ARNcr para especificar el sitio de escisión. La carga de la guía de ARNcr sobre Cas9 tiene lugar durante el tratamiento del precursor de ARNcr y requiere un ARN complementario pequeño para el precursor, el ARNtracr y RNAsa III. A diferencia de edición de genomas con las ZFN o las TALEN, cambiar la especificidad fijada como objetivo de Cas9 no requiere lograr proteínas sino sólo el diseño de la guía de ARNcr corta. Recent work on the adaptive immune system of CRISPR (short palindromic repeats grouped and regularly interspaced) of prokaryotes has led to the identification of nucleases whose sequence specificity is programmed by small RNAs. CRISPR sites consist of a series of repetitions separated by "spacer" sequences that match the genomes of bacteriophages and other mobile genetic elements. The repeat-spacer matrix is transcribed as a large precursor and treated within repeat sequences to generate small cRNA that specifies the target sequences (also known as proto-spacers) cleaved by CRISPR systems. The presence of a sequence unit immediately downstream of the target region, known as the adjacent proto-spacer unit (PAM), is essential for cleavage. The genes associated with CRISPR (cas) normally flank the repeat-spacer matrix and encode the enzymatic machinery responsible for biogenesis and fixation as a target for cRNA. Cas9 is a cDNA endonuclease that uses an RNAcr guide to specify the cleavage site. The loading of the rRNA guide on Cas9 takes place during the treatment of the rRNA precursor and requires a small complementary RNA for the precursor, the RNAcrcr and RNAse III. Unlike genome editing with ZFN or TALEN, changing the specificity set as the objective of Cas9 does not require the achievement of proteins but only the design of the short cRNA guide.

Los solicitantes mostraron recientemente en S. pneumoniae que la introducción de un sistema CRISPR que fija como objetivo un sitio cromosómico conduce a la destrucción de las células transformadas. Se observó que los supervivientes ocasionales contenían mutaciones en la región fijada como objetivo, que sugiere que la actividad de la endonucleasa de ADNdc de Cas9 contra dianas endógenas podía ser usada para edición de genomas. Los solicitantes mostraron que las mutaciones sin marcador podían introducirse por la transformación de un fragmento de ADN de plantilla que se recombinarán en el genoma y eliminarán el reconocimiento de la diana de Cas9. Dirigir la especificidad de Cas9 con varios ARNcr diferentes permite la introducción de múltiples mutaciones al mismo tiempo. Los solicitantes también caracterizaron con detalle los requerimientos de la secuencia para fijar como objetivo Cas9 y mostrar que la propuesta puede combinarse con recombinación para edición de genomas en E. coli. Applicants recently showed in S. pneumoniae that the introduction of a CRISPR system that targets a chromosomal site leads to the destruction of transformed cells. It was noted that occasional survivors contained mutations in the target region, which suggests that the activity of the Cas9 cDNA endonuclease against endogenous targets could be used for genome editing. Applicants showed that mutations without a marker could be introduced by transforming a template DNA fragment that will recombine into the genome and eliminate recognition of the Cas9 target. Directing the specificity of Cas9 with several different cRNAs allows the introduction of multiple mutations at the same time. Applicants also characterized in detail the sequence requirements to set Cas9 as a target and show that the proposal can be combined with recombination for genome editing in E. coli.

Resultados: Edición de genomas por escisión de Cas9 de un objetivo cromosómico. Results: Genome editing by excision of Cas9 of a chromosomal objective.

La cepa crR6 de S. pneumoniae contiene un sistema CRISPR a base de Cas9 escinde una secuencia diana presente en el bacteriófago φ8232.5. Esta diana se integró en el sitio cromosómico srtA de una segunda cepa el R68232.5. Se integró una secuencia diana modificada que contenía una mutación en la región PAM en el sitio srtA de una tercera cepa R6370,1, haciendo esta cepa “inmune” a escisión de CRISPR (Figura 28a). Los solicitantes transformaron células R68232,5 y R6370,1 con ADN genómico de células crR6, esperando que la transformación exitosa de las células de R68232,5 conduciría a escisión del sitio fijado como objetivo y la muerte celular. A diferencia de esta previsión, los solicitantes aislaron transformados de R68232,5, aunque con aproximadamente 10 veces menos eficacia que los transformados de R6370,1 (Figura 28b). El análisis genético de ocho transformados de R68232,5 (Figura 28) reveló que la gran mayoría son el producto de un caso de doble recombinación que elimina la toxicidad de la fijación como objetivo de Cas9 reemplazando el objetivo φ8232,5 con el sitio srtA natural del genoma de crR6, que no contiene el protoespaciador requerido para reconocimiento de Cas9. Estos resultados eran evidencia de que la introducción concurrente de un sistema CRISPR que fija como objetivo un sitio genómico (la construcción fijadora de objetivo) junto con una plantilla para recombinación en el sitio fijado como objetivo (la plantilla de edición) condujo a edición de genoma fijada como objetivo (Figura 23a). The S. pneumoniae crR6 strain contains a CR9PR system based on Cas9 cleaves a target sequence present in the bacteriophage φ8232.5. This target was integrated into the srtA chromosomal site of a second strain R68232.5. A modified target sequence was integrated that contained a mutation in the PAM region at the srtA site of a third strain R6370.1, making this strain "immune" to CRISPR cleavage (Figure 28a). Applicants transformed R68232.5 and R6370.1 cells with genomic DNA from crR6 cells, hoping that the successful transformation of R68232.5 cells would lead to cleavage of the target site and cell death. In contrast to this forecast, applicants isolated R68232.5 transforms, although with approximately 10 times less efficiency than R6370.1 transforms (Figure 28b). The genetic analysis of eight R68232.5 transforms (Figure 28) revealed that the vast majority are the product of a double recombination case that eliminates the toxicity of the fixation as a Cas9 target by replacing the φ8232.5 target with the natural srtA site of the genome of crR6, which does not contain the proto-spacer required for recognition of Cas9. These results were evidence that the concurrent introduction of a CRISPR system that targets a genomic site (the target fixer construct) together with a template for recombination at the target site (the template edit) led to genome editing set as objective (Figure 23a).

Para crear un sistema simplificado para edición de genomas, los solicitantes modificaron el sitio CRISPR en la cepa crR6 suprimiendo los genes cas1, cas2 y csn2, que ha demostrado ser prescindible para fijar como objetivo CRISPR, proporcionando la cepa crR6M (Figura 28a). Esta cepa mantuvo las mismas propiedades de crR6 (Figura 28b). Para aumentar la eficacia de edición a base de Cas9 y demostrar que puede usarse un ADN de plantilla de elección para controlar la mutación introducida, los solicitantes cotransformaron células R68232,5 con productos PCR del gen srtA natural o el objetivo R6370,1 mutante, cualquiera de los cuales debería ser resistente a escisión por Cas9. Esto dio como resultado un aumento de 5 a 10 veces de la frecuencia de transformación comparado con ADN de crR6 genómico sólo (Figura 23b). La eficacia de la edición también aumentó sustancialmente, con 8/8 de los transformados ensayados conteniendo una copia de srtA natural y conteniendo 7/8 la mutación PAM presente en el objetivo R6370,1 (Figura 23b y Figura 29a). Tomados juntos, estos resultados mostraron el potencial de la edición de genomas asistida por Cas9. To create a simplified system for genome editing, applicants modified the CRISPR site in strain crR6 by suppressing the cas1, cas2 and csn2 genes, which has proven to be expendable to set as a CRISPR target, providing strain crR6M (Figure 28a). This strain maintained the same properties of crR6 (Figure 28b). To increase the effectiveness of Cas9-based editing and demonstrate that a template DNA of choice can be used to control the introduced mutation, applicants co-transformed R68232.5 cells with PCR products of the natural srtA gene or the mutant R6370.1 target, either of which should be resistant to cleavage by Cas9. This resulted in a 5 to 10 fold increase in the transformation frequency compared to genomic crR6 DNA only (Figure 23b). The effectiveness of the edition also increased substantially, with 8/8 of the tested transformants containing a copy of natural srtA and containing 7/8 the PAM mutation present in the R6370.1 target (Figure 23b and Figure 29a). Taken together, these results showed the potential of genome editing assisted by Cas9.

Análisis de los requerimientos del objetivo de Cas9: Para introducir cambios específicos en el genoma, se debe usar una plantilla de edición que soporte mutaciones que anulen la escisión mediada por Cas9, evitándose de ese modo la muerte celular. Esto es fácil de conseguir cuando se busque la supresión del objetivo o su reemplazo por otra secuencia (inserción de genes). Cuando el objetivo es producir fusiones de genes o generar mutaciones de nucleótidos solos, la supresión de la actividad de la nucleasa Cas9 sólo será posible introduciendo mutaciones en la plantilla de edición que modifiquen la PAM o las secuencias del protoespaciador. Para determinar las restricciones de la edición mediada por CRISPR, los solicitantes realizaron un análisis exhaustivo de mutaciones de PAM y protoespaciador que anularan la fijación como objetivo de CRISPR. Analysis of the requirements of the Cas9 objective: To introduce specific changes in the genome, an editing template should be used that supports mutations that nullify the excision mediated by Cas9, thereby avoiding cell death. This is easy to achieve when the goal is suppressed or replaced by another sequence (gene insertion). When the objective is to produce gene fusions or generate nucleotide mutations alone, suppression of Cas9 nuclease activity will only be possible by introducing mutations in the editing template that modify the PAM or the proto-spacer sequences. To determine the restrictions of the CRISPR-mediated edition, the applicants conducted a thorough analysis of PAM and proto-spacer mutations that nullified the fixation as the objective of CRISPR.

Los estudios previos propusieron que Cas9 de S. pyogenes requiere una PAM de NGG inmediatamente aguas abajo del protoespaciador. Sin embargo, debido a que se ha descrito hasta ahora sólo un número muy limitado de mutaciones de inactivación de PAM, los solicitantes llevaron a cabo un análisis sistemático para encontrar todas las secuencias de 5 nucleótidos siguiendo al protoespaciador que elimina la escisión de CRISPR. Los solicitantes usaron oligonucleótidos aleatorizados para generar todas las posibles 1.024 secuencias de PAM en un producto PCR heterogéneo que se transformó en células crR6 o R6. Se esperó que se reconocieran las construcciones que soportaban las PAM funcionales y fueran destruidas por Cas9 en células crR6 pero no R6 (Figura 24a). Se mezclaron más de 2×105 colonias para extraer ADN para usar como plantilla para la multiplicación conjunta de todos los objetivos. Se secuenciaron a fondo los productos PCR y se encontró que contenían todas las 1.024 secuencias, con un cubrimiento que oscilaba de 5 a 42.472 lecturas (véase la sección "Analysis of deep sequencing data"). La funcionalidad de cada PAM se estimó por la proporción relativa de sus lecturas en la muestra de crR6 sobre la muestra de R6. El análisis de las primeras tres bases de la PAM, promediando sobre las dos últimas bases, demostró claramente que el patrón de NGG estaba infrarepresentado en transformados de crR6 (Figura 24b). Además, las siguientes dos bases no presentaron un efecto detectabla sobre la PAM de NGG (véase la sección "Analysis of deep sequencing data"), que demuestra que la secuencia NGGNN era suficiente para conceder actividad de Cas9. Se observó fijación como objetivo parcial para secuencias de PAM de NAG (Figura 24b). También el patrón de NNGGN inactivó parcialmente la fijación como objetivo de CRISPR (Tabla G), que indica que la unidad de NGG aún puede ser reconocida por Cas9 con eficacia reducida cuando se desplaza por 1 pb. Estos datos arrojaron luz sobre el mecanismo molecular del reconocimiento de objetivo de Cas9 y revelaron que las secuencias NGG (o CCN en la cadena complementaria) son suficientes para fijar como objetivo Cas9 y que las mutaciones de NGG a NAG o NNGGN en la plantilla de edición deberían evitarse. Debido a la alta frecuencia de estas secuencias de trinucleótidos (una vez cada 8 pb), esto significa que casi cualquier posición del genoma puede editarse. Por lo tanto, los solicitantes ensayaron diez objetivos elegidos de manera aleatoria soportando varias PAM y todas fueron encontradas funcionales (Figura 30). Previous studies proposed that S. pyogenes Cas9 requires a PAM of NGG immediately downstream of the proto-spacer. However, because only a very limited number of PAM inactivation mutations have been described so far, the applicants carried out a systematic analysis to find all the 5 nucleotide sequences following the proto-spacer that eliminates CRISPR cleavage. Applicants used randomized oligonucleotides to generate all possible 1,024 PAM sequences in a heterogeneous PCR product that was transformed into crR6 or R6 cells. It was hoped that the constructions that supported functional PAMs would be recognized and destroyed by Cas9 in crR6 cells but not R6 (Figure 24a). More than 2 × 105 colonies were mixed to extract DNA to use as a template for the joint multiplication of all targets. The PCR products were sequenced thoroughly and found to contain all 1,024 sequences, with a coverage ranging from 5 to 42,472 readings (see the "Analysis of deep sequencing data" section). The functionality of each PAM was estimated by the relative proportion of its readings in the crR6 sample over the R6 sample. The analysis of the first three bases of the PAM, averaging over the last two bases, clearly demonstrated that the NGG pattern was underrepresented in crR6 transforms (Figure 24b). In addition, the following two bases did not show a detectable effect on NGG PAM (see the "Analysis of deep sequencing data" section), which demonstrates that the NGGNN sequence was sufficient to grant Cas9 activity. Partial target fixation was observed for NAG PAM sequences (Figure 24b). The NNGGN pattern also partially inactivated the fixation as a target of CRISPR (Table G), which indicates that the NGG unit can still be recognized by Cas9 with reduced efficiency when it travels by 1 bp. These data shed light on the molecular mechanism of the Cas9 target recognition and revealed that the NGG sequences (or CCN in the complementary chain) are sufficient to target Cas9 and that the mutations from NGG to NAG or NNGGN in the editing template They should be avoided. Due to the high frequency of these trinucleotide sequences (once every 8 bp), this means that almost any position of the genome can be edited. Therefore, applicants tested ten randomly chosen objectives supporting several PAMs and all were found functional (Figure 30).

Otra manera de alterar la escisión mediada por Cas9 es introducir mutaciones en la región protoespaciadora de la plantilla de edición. Se sabe que las mutaciones puntuales en la “secuencia simiente” (los 8 a 10 nucleótidos del protoespaciador inmediatamente adyacentes a la PAM) pueden anular la escisión por nucleasas CRISPR. Sin embargo, no se conoce la longitud de exacta de esta región y no está claro si las mutaciones para cualquier nucleótido en la simiente pueden anular el reconocimiento del objetivo de Cas9. Los solicitantes siguieron la misma propuesta de secuenciación profunda descrita anteriormente para aleatorizar la secuencia completa del protoespaciador implicada en los contactos de pares de bases con el ARNcr y determinar todas las secuencias que alteran la fijación como objetivo. Cada posición de los 20 nucleótidos de igualación (14) en el presente objetivo spc1 en células R68232,5 (Figura 23a) fue aleatorizada y transformada en células crR6 y R6 (Figura 24a). Consistente con la presencia de una secuencia simiente, sólo las mutaciones en los 12 nucleótidos inmediatamente aguas arriba de la PAM anularon la escisión por Cas9 (Figura 24c). Sin embargo, diferentes mutaciones mostraron efectos notablemente diferentes. Las posiciones distales (de la PAM) de la simiente (12 a 7) toleraron la mayoría de las mutaciones y sólo una sustitución de base particular anuló la fijación como objetivo. Por el contrario, las mutaciones en cualquier nucleótido en las posiciones próximas (6 a 1, excepto 3) eliminaron la actividad de Cas9, aunque en diferentes niveles para cada sustitución particular. En la posición 3, sólo dos sustituciones afectaron a la actividad de CRISPR y con diferente fortaleza. Los solicitantes concluyeron que, aunque las mutaciones de la secuencia simiente pueden evitar la fijación como objetivo de CRISPR, hay restricciones teniendo en cuenta los cambios de nucleótidos que pueden realizarse en cada posición de la simiente. Además, estas restricciones lo más probablemente pueden variar para diferentes secuencias espaciadoras. Por lo tanto, los solicitantes creen que las mutaciones en la secuencia PAM, si es posible, deberían ser la estrategia de edición preferida. Alternativamente, se pueden introducir múltiples mutaciones en la secuencia simiente para evitar la actividad de la nucleasa Cas9. Another way to alter Cas9-mediated excision is to introduce mutations in the proto-spacer region of the editing template. It is known that point mutations in the "seed sequence" (the 8 to 10 nucleotides of the proto-spacer immediately adjacent to the PAM) can nullify excision by CRISPR nucleases. However, the exact length of this region is unknown and it is not clear whether mutations for any nucleotide in the seed can void recognition of the Cas9 target. The applicants followed the same deep sequencing proposal described above to randomize the complete proto-spacer sequence involved in base pair contacts with the cRNA and determine all sequences that alter the target fixation. Each position of the 20 matching nucleotides (14) in the present spc1 target in R68232.5 cells (Figure 23a) was randomized and transformed into crR6 and R6 cells (Figure 24a). Consistent with the presence of a seed sequence, only mutations in the 12 nucleotides immediately upstream of the PAM nullified the cleavage by Cas9 (Figure 24c). However, different mutations showed remarkably different effects. The distal (PAM) positions of the seed (12 to 7) tolerated most mutations and only a particular base substitution annulled the target fixation. In contrast, mutations in any nucleotide at the next positions (6 to 1, except 3) eliminated Cas9 activity, although at different levels for each particular substitution. In position 3, only two substitutions affected the activity of CRISPR and with different strength. The applicants concluded that, although mutations of the seed sequence can prevent fixation as a target of CRISPR, there are restrictions taking into account the nucleotide changes that can be made at each seed position. In addition, these restrictions may most likely vary for different spacer sequences. Therefore, applicants believe that mutations in the PAM sequence, if possible, should be the preferred editing strategy. Alternatively, multiple mutations can be introduced into the seed sequence to avoid the activity of the Cas9 nuclease.

Edición de genomas mediada por Cas9 en S. pneumonia: Para desarrollar un método rápido y eficaz para editar genomas fijados como objetivo, los solicitantes lograron la cepa crR6Rk, una cepa en la que se pueden introducir fácilmente espaciadores por PCR (Figura 33). Los solicitantes decidieron editar el gen de β-galactosidasa (bgaA) de Cas9-mediated genome editing in S. pneumonia: To develop a fast and efficient method to edit target genomes, applicants achieved the crR6Rk strain, a strain into which PCR spacers can easily be introduced (Figure 33). The applicants decided to edit the β-galactosidase (bgaA) gene of

S. pneumoniae, cuya actividad puede medirse fácilmente. Los solicitantes introdujeron sustituciones de alanina de aminoácidos en el sitio activo de esta enzima: mutaciones R481A (R→A) y N563A, E564A (NE→AA). Para ilustrar diferentes estrategias de edición, los solicitantes diseñaron mutaciones de tanto la secuencia PAM como la simiente del protoespaciador. En los dos casos, se usó la misma construcción fijadora de objetivo con un ARNcr complementario a una región del gen de β-galactosidasa que es adyacente a una secuencia de PAM TGG (CCA en la cadena complementaria, Figura 26). La plantilla de edición de R→A creó un desajuste de tres nucleótidos en la secuencia simiente del protoespaciador (CGT a GCA, introduciendo también un sitio de restricción de BtgZI). En la plantilla de edición de NE→AA, los solicitantes introdujeron simultáneamente una mutación sinónima que creó una PAM inactiva (TGG a TTG) junto con mutaciones que son 218 nt aguas abajo de la región protoespaciadora (AAT GAA a GCT GCA, generando también un sitio de restricción de TseI). Esta última estrategia de edición demostró la posibilidad de usar una PAM remota para hacer mutaciones en sitios donde puede ser duro elegir un objetivo apropiado. Por ejemplo, aunque el genoma R6 de S. pneumoniae, que presenta un contenido del 39,7% de GC, contiene de promedio una unidad PAM cada 12 pb, algunas unidades PAM se separan por hasta 194 pb (Figura 33). Además, los solicitantes diseñaron una supresión dentro del marco de ΔbgaA de 6.664 pb. En los tres casos, la cotransformación de las plantillas de fijación como objetivo y de edición produjo 10 veces más células resistentes a kanamicina que la cotransformación con una plantilla de edición de control que contenía secuencias bgaA naturales (Figura 25b). Los solicitantes genotiparon 24 transformados (8 para cada experimento de edición) y encontraron que todos excepto uno incorporaron el cambio deseado (Figura 25c). La secuenciación de ADN también confirmó no sólo la presencia de las mutaciones introducidas sino también la ausencia de mutaciones secundarias en la región de objetivo (Figura 29b,c). Finalmente, los solicitantes midieron la actividad de la β-galactosidasa para confirmar que todas las células editadas mostraban el fenotipo esperado (Figura 25d). S. pneumoniae, whose activity can be easily measured. Applicants introduced amino acid alanine substitutions at the active site of this enzyme: R481A (R → A) and N563A, E564A (NE → AA) mutations. To illustrate different editing strategies, applicants designed mutations of both the PAM sequence and the proto-spacer seed. In both cases, the same target-fixer construction was used with a rRNA complementary to a region of the β-galactosidase gene that is adjacent to a PAM TGG sequence (CCA in the complementary chain, Figure 26). The edition template of R → A created a mismatch of three nucleotides in the seed spacer sequence (CGT to GCA, also introducing a BtgZI restriction site). In the NE → AA edition template, applicants simultaneously introduced a synonymous mutation that created an inactive PAM (TGG to TTG) along with mutations that are 218 nt downstream of the proto-spacer region (AAT GAA to GCT GCA, also generating a TseI restriction site). This latest editing strategy demonstrated the possibility of using a remote PAM to make mutations at sites where it may be hard to choose an appropriate target. For example, although the R6 genome of S. pneumoniae, which has a content of 39.7% GC, on average contains one PAM unit every 12 bp, some PAM units are separated by up to 194 bp (Figure 33). In addition, the applicants designed a suppression within the ΔbgaA framework of 6,664 bp. In all three cases, cotransformation of target and editing templates produced 10 times more kanamycin-resistant cells than cotransformation with a control editing template that contained natural bgaA sequences (Figure 25b). Applicants genotyped 24 transforms (8 for each editing experiment) and found that all but one incorporated the desired change (Figure 25c). DNA sequencing also confirmed not only the presence of introduced mutations but also the absence of secondary mutations in the target region (Figure 29b, c). Finally, applicants measured β-galactosidase activity to confirm that all edited cells showed the expected phenotype (Figure 25d).

La edición mediada por Cas9 también puede usarse para generar múltiples mutaciones para el estudio de rutas biológicas. Los solicitantes decidieron ilustrar esto para la ruta dependiente de sortasa que ancla las proteínas superficiales a la envoltura de las bacterias Gram-positivas. Los solicitantes introdujeron una supresión de sortasa por cotransformación de una construcción fijadora como objetivo resistente a cloranfenicol y una plantilla de edición de ΔsrtA (Figura 33a,b), seguido por una supresión de ΔbgaA usando una construcción fijadora de objetivo resistente a kanamicina que reemplaza la previa. En S. pneumoniae, la β-galactosidasa está ligada mediante enlaces covalentes a la pared celular mediante sortasa. Por lo tanto, la supresión de srtA da como resultado la liberación de la proteína superficial en el sobrenadante, mientras que la doble supresión no presenta actividad de la β-galactosidasa detectabla (Figura 34c). Dicha selección secuencial puede iterarse tantas veces como se requiera para generar múltiples mutaciones. The Cas9-mediated edition can also be used to generate multiple mutations for the study of biological pathways. The applicants decided to illustrate this for the sortasa-dependent route that anchors the surface proteins to the envelope of Gram-positive bacteria. Applicants introduced a suppression of sortasa by cotransformation of a fixative construct as a chloramphenicol resistant target and an ΔsrtA editing template (Figure 33a, b), followed by a suppression of ΔbgaA using a kanamycin resistant target fixation construct that replaces the previous. In S. pneumoniae, β-galactosidase is linked by covalent bonds to the cell wall by sortasa. Therefore, the suppression of srtA results in the release of the surface protein in the supernatant, while the double suppression does not show detectable β-galactosidase activity (Figure 34c). Said sequential selection can be iterated as many times as required to generate multiple mutations.

Estas dos mutaciones también se pueden introducir al mismo tiempo. Los solicitantes diseñaron una construcción fijadora de objetivo que contenía dos espaciadores, uno igualando srtA y el otro igualando bgaA y cotransformándola con las dos plantillas de edición al mismo tiempo (Figura 25e). Los análisis genéticos de transformados mostraron que la edición tenía lugar en 6/8 de casos (Figura 25f). En particular, los dos clones restantes contenían cada uno una supresión de ΔsrtA o una de ΔbgaA, que sugiere la posibilidad de realizar mutagénesis combinatoria usando Cas9. Finalmente, para eliminar las secuencias CRISPR, los solicitantes introdujeron un plásmido que contenía el objetivo bgaA y un gen de resistencia a espectinomicina junto con ADN genómico de la cepa R6 natural. Los transformados resistentes a espectinomicina que conservan el plásmido eliminaron las secuencias CRISPR (Figura 34a,d). These two mutations can also be introduced at the same time. Applicants designed a target fixing construction that contained two spacers, one matching srtA and the other matching bgaA and co-transforming it with the two editing templates at the same time (Figure 25e). Transformed genetic analyzes showed that editing took place in 6/8 cases (Figure 25f). In particular, the two remaining clones each contained a suppression of ΔsrtA or one of ΔbgaA, which suggests the possibility of performing combinatorial mutagenesis using Cas9. Finally, to eliminate the CRISPR sequences, applicants introduced a plasmid containing the bgaA target and a spectinomycin resistance gene along with genomic DNA from the natural R6 strain. The spectinomycin-resistant transformants that conserve the plasmid removed the CRISPR sequences (Figure 34a, d).

Mecanismo y eficacia de edición: Para comprender los mecanismos subyacentes a la edición de genomas con Cas9, los solicitantes diseñaron un experimento en el que la eficacia de edición se midió independientemente de escisión de Cas9. Los solicitantes integraron el gen de resistencia a eritromicina ermAM en el sitio srtA e introdujeron un codón de terminación prematuro usando edición mediada por Cas9 (Figura 33). La cepa resultante (JEN53) contiene un alelo ermAM(interrupción) y es sensible a eritromicina. Esta cepa puede usarse para valorar la eficacia con la que se repara el gen ermAM midiendo la fracción de células que restablecen la resistencia a los antibióticos con o sin el uso de escisión de Cas9. Se transformó JEN53 con una plantilla de edición que restablece el alelo natural, junto con construcción CRISPR resistente a kanamicina que fija como objetivo el alelo ermAM(interrupción) (CRISPR::ermAM(interrupción)) o una construcción de control sin un espaciador (CRISPR::Ø) (Figura 26a,b). En ausencia de selección de kanamicina, la fracción de colonias editadas estuvo en el orden de 10-2 (ufc resistentes a eritromicina/ufc totales) (Figura 26c), que representa la frecuencia de referencia de recombinación sin selección mediada por Cas9 frente a células no editadas. Sin embargo, si se aplicaba selección de kanamicina y se cotransformaba la construcción CRISPR de control, la fracción de colonias editadas aumentó a aproximadamente 10-1 (ufc resistentes a kanamicina y eritromicina/ufc resistentes a kanamicina) (Figura 26c). Este resultado muestra que la selección para la recombinación del sitio CRISPR se coseleccionó para recombinación en el sitio ermAM independientemente de escisión Cas9 del genoma, que sugiere que una subpoblación de células es más propensa a transformación y/o recombinación. La transformación de la construcción CRISPR::ermAM(interrupción) seguido por selección de kanamicina dio como resultado un aumento de la fracción de células editadas, resistentes a eritromicina a 99% (Figura 26c). Para determinar si este aumento se produce por la destrucción de células no editadas, los solicitantes compararon las unidades formadoras de colonias (cfu) resistentes a kanamicina obtenidas después de cotransformación de células JEN53 con las construcciones CRISPR: :ermAM(interrupción) o CRISPR::∅. Mechanism and effectiveness of editing: To understand the mechanisms underlying genome editing with Cas9, applicants designed an experiment in which the effectiveness of editing was measured independently of Cas9 excision. Applicants integrated the ermAM erythromycin resistance gene into the srtA site and introduced a premature termination codon using Cas9-mediated edition (Figure 33). The resulting strain (JEN53) contains an ermAM allele (interruption) and is sensitive to erythromycin. This strain can be used to assess the effectiveness with which the ermAM gene is repaired by measuring the fraction of cells that restore antibiotic resistance with or without the use of Cas9 cleavage. JEN53 was transformed with an editing template that restores the natural allele, together with Kanamycin-resistant CRISPR construction that targets the ermAM (interruption) allele (CRISPR :: ermAM (interruption)) or a control construction without a spacer (CRISPR :: Ø) (Figure 26a, b). In the absence of kanamycin selection, the fraction of edited colonies was in the order of 10-2 (total erythromycin resistant cfu / cfu) (Figure 26c), which represents the reference frequency of recombination without Cas9-mediated selection against cells not edited However, if kanamycin selection was applied and the control CRISPR construct was co-transformed, the fraction of edited colonies increased to approximately 10-1 (kanamycin-resistant cfu and kanamycin-resistant erythromycin / cfu) (Figure 26c). This result shows that the selection for CRISPR site recombination was harvested for recombination at the ermAM site regardless of Cas9 cleavage of the genome, which suggests that a subpopulation of cells is more prone to transformation and / or recombination. Transformation of the CRISPR :: ermAM construct (interruption) followed by kanamycin selection resulted in an increase in the fraction of edited, erythromycin resistant cells to 99% (Figure 26c). To determine whether this increase is caused by the destruction of unedited cells, the applicants compared the kanamycin-resistant colony forming units (cfu) obtained after cotransformation of JEN53 cells with the CRISPR constructions:: ermAM (interruption) or CRISPR :: ∅

Los solicitantes contaron 5,3 veces menos colonias resistentes a kanamicina después de transformación de la construcción ermAM(interrupción) (2,5×104/4,7×103, Figura 35a), un resultado que sugiere que por supuesto fijar como objetivo un sitio cromosómico por Cas9 conduce a la destrucción de células no editadas. Finalmente, debido a que la introducción de roturas de ADNdc en el cromosoma bacteriano se sabe que provoca mecanismos de reparación que aumentan la tasa de recombinación del ADN dañado, los solicitantes investigaron si la escisión por Cas9 induce la recombinación de la plantilla de edición. Los solicitantes contaron 2,2 veces más colonias después de cotransformación con la construcción CRISPR::erm(interrupción) que con la construcción CRISPR::Ø (Figura 26d), que indica que hubo una modesta inducción de recombinación. Tomados juntos, estos resultados mostraron que la coselección de células transformables, inducción de recombinación por escisión mediada por Cas9 y selección contra células no editadas, contribuyeron cada una a la alta eficacia de la edición de genomas en S. pneumoniae. Applicants counted 5.3 times less kanamycin-resistant colonies after transformation of the ermAM construction (interruption) (2.5 × 104 / 4.7 × 103, Figure 35a), a result that suggests that of course set a target Cas9 chromosomal site leads to the destruction of unedited cells. Finally, because the introduction of cDNA breaks in the bacterial chromosome is known to cause repair mechanisms that increase the recombination rate of damaged DNA, applicants investigated whether excision by Cas9 induces recombination of the editing template. Applicants counted 2.2 times more colonies after cotransformation with the CRISPR :: erm (interruption) construct than with the CRISPR :: Ø construct (Figure 26d), which indicates that there was a modest recombination induction. Taken together, these results showed that the harvesting of transformable cells, induction of recombination by Cas9-mediated cleavage and selection against unedited cells, each contributed to the high efficiency of genome editing in S. pneumoniae.

Como la escisión del genoma por Cas9 debería destruir las células no editadas, no se debería espera recuperar ninguna célula que recibiera la casete de Cas9 que contiene resistencia a kanamicina pero no la plantilla de edición. Sin embargo, en ausencia de la plantilla de edición, los solicitantes recuperaron muchas colonias resistentes a kanamicina después de transformación de la construcción CRISPR::ermAM(interrupción) (Figura 35a). Estas células que “escapan” a la muerte inducida por CRISPR produjeron un fondo que determinó un límite del método. Esta frecuencia del fondo puede calcularse como la relación de ufc de CRISPR::ermAM(interrupción)/CRISPR::Ø, 2,6×103 (7,1×101/2,7×104) en este experimento, que significa que si la frecuencia de recombinación de la plantilla de edición es menor que este valor, la selección de CRISPR puede no recuperar con eficacia los mutantes deseados por encima del fondo. Para entender el origen de estas células, los solicitantes genotiparon 8 colonias de fondo y encontraron que 7 contenían supresiones del espaciador de fijación como objetivo (Figura 35b) y una albergó una mutación presumiblemente inactivante en Cas9 (Figura 35c). Since genome cleavage by Cas9 should destroy unedited cells, one should not expect to recover any cells that received the Cas9 cassette that contains kanamycin resistance but not the editing template. However, in the absence of the editing template, applicants recovered many kanamycin-resistant colonies after transformation of the CRISPR :: ermAM (interruption) construct (Figure 35a). These cells that "escape" the death induced by CRISPR produced a background that determined a limit of the method. This background frequency can be calculated as the cfu ratio of CRISPR :: ermAM (interruption) / CRISPR :: Ø, 2.6 × 103 (7.1 × 101 / 2.7 × 104) in this experiment, which means that If the recombination frequency of the editing template is less than this value, the selection of CRISPR may not effectively recover the desired mutants above the background. To understand the origin of these cells, the applicants genotyped 8 background colonies and found that 7 contained suppression of the target spacer (Figure 35b) and one housed a presumably inactive mutation in Cas9 (Figure 35c).

Edición de genomas con Cas9 en E. coli: La activación de fijación como objetivo de Cas9 por la integración cromosómica de un sistema CRISPR-Cas sólo es posible en organismos que sean altamente recombinogénicos. Para desarrollar un método más general que sea aplicable a otros microbios, los solicitantes decidieron realizar edición de genomas en E. coli usando un sistema CRISPR-Cas a base de plásmido. Se construyeron dos plásmidos: un plásmido pCas9 soportando el ARNtracr, Cas9 y una casete de resistencia a cloranfenicol (Figura 36) y un plásmido resistente a kanamicina de pCRISPR soportando la matriz de espaciadores de CRISPR. Para medir la eficacia de la edición independientemente de la selección de CRISPR, los solicitantes buscaron introducir una transversión de A a C en el gen rpsL que confiriera resistencia a estreptomicina. Los solicitantes construyeron un plásmido de pCRISPR::rpsL que albergaba un espaciador que guiaría la escisión de Cas9 del alelo rpsL natural, pero no el mutante (Figura 27b). El plásmido pCas9 fue introducido primero en MG1655 de E. coli y se cotransformó la cepa resultante con el plásmido pCRISPR::rpsL y W542, un oligonucleótido de edición que contenía la mutación A a C. Sólo se recuperaron colonias resistentes a estreptomicina después de la transformación del plásmido pCRISPR::rpsL, que sugiere que la escisión de Cas9 induce la recombinación del oligonucleótido (Figura 37). Sin embargo, el número de colonias resistentes a estreptomicina fue dos órdenes de magnitud menor que el número de colonias resistentes a kanamicina, que son presumiblemente células que escapan a la escisión por Cas9. Por lo tanto, en estas condiciones, la escisión por Cas9 facilitó la introducción de la mutación, pero con una eficacia que no fue suficiente para seleccionar las células mutantes por encima del fondo de “escapistas”. Genome editing with Cas9 in E. coli: Activation of fixation as a target of Cas9 by the chromosomal integration of a CRISPR-Cas system is only possible in organisms that are highly recombinogenic. To develop a more general method that is applicable to other microbes, the applicants decided to perform genome editing in E. coli using a plasmid-based CRISPR-Cas system. Two plasmids were constructed: a plasmid pCas9 supporting the RNAtracr, Cas9 and a chloramphenicol resistance cassette (Figure 36) and a kanamycin resistant plasmid from pCRISPR supporting the CRISPR spacers matrix. To measure the effectiveness of the edition regardless of the selection of CRISPR, the applicants sought to introduce a transversion from A to C in the rpsL gene that conferred streptomycin resistance. Applicants constructed a plasmid from pCRISPR :: rpsL that housed a spacer that would guide the Cas9 cleavage of the natural rpsL allele, but not the mutant (Figure 27b). Plasmid pCas9 was first introduced into E. coli MG1655 and the resulting strain was cotransformed with plasmid pCRISPR :: rpsL and W542, an editing oligonucleotide containing mutation A to C. Only streptomycin-resistant colonies were recovered after Plasmid transformation pCRISPR :: rpsL, which suggests that excision of Cas9 induces oligonucleotide recombination (Figure 37). However, the number of streptomycin resistant colonies was two orders of magnitude less than the number of kanamycin resistant colonies, which are presumably cells that escape Cas9 cleavage. Therefore, under these conditions, excision by Cas9 facilitated the introduction of the mutation, but with an efficacy that was not sufficient to select the mutant cells above the background of "escapists."

Para mejorar la eficacia de edición de genomas en E. coli, los solicitantes aplicaron su sistema CRISPR con recombinación, usando muerte celular inducida por Cas9 para seleccionar las mutaciones deseadas. Se introdujo el plásmido pCas9 en la cepa recombinante HME63 (31), que contenía las funciones Gam, Exo y Beta del fago □-rojo. Se cotransformó la cepa resultante con el plásmido pCRISPR::rpsL (o un control de pCRISPR::Ø) y el oligonucleótido W542 (Figura 27a). La eficacia de recombinación fue 5,3×10-5, calculada como la fracción de células totales que llegaba a ser resistente a estreptomicina cuando se usaba el plásmido de control (Figura 27c). Por el contrario, la trasformación con el plásmido pCRISPR::rpsL aumentó el porcentaje de células mutantes a 65 ± 14 % (Figuras 27c y 29f). Los solicitantes observaron que el número de ufc se reducía por aproximadamente tres órdenes de magnitud después de la transformación del plásmido pCRISPR::rpsL que el plásmido de control (4,8×105/5,3×102, Figura 38a), que sugiere que la selección da como resultado muerte inducida por CRISPR de células no editadas. Para medir la tasa a la que se inactivó la escisión de Cas9, un parámetro importante del método de los solicitantes, los solicitantes transformaron células con pCRISPR::rpsL o el plásmido de control sin el oligonucleótido de edición W542 (Figura 38a). Este fondo de “escapistas” de CRISPR, medido como la relación de ufc de pCRISPR::rpsL/pCRISPR::Ø, fue 2,5×10-4 (1,2×102/4,8×105). Genotipar ocho de estos escapistas reveló que en todos los casos había una supresión del espaciador de fijación como objetivo (Figura 38b). Este fondo fue mayor que la eficacia de recombinación de la mutación rpsL, 5,3×10-5, que sugiere que para obtener el 65% de las células editadas, la escisión de Cas9 debe inducir recombinación de oligonucleótidos. Para confirmar esto, los solicitantes compararon el número de ufc resistentes a kanamicina y estreptomicina después de la transformación de pCRISPR::rpsL o pCRISPR::Ø (Figura 27d). Como en el caso para S. pneumoniae, los solicitantes observaron una modesta inducción de recombinación, aproximadamente 6,7 veces (2,0×10-4/3,0×10-5). Tomados juntos, estos resultados indicaron que el sistema CRISPR proporcionaba un método para seleccionar mutaciones introducidas por recombinación. To improve the efficiency of genome editing in E. coli, applicants applied their CRISPR system with recombination, using Cas9-induced cell death to select the desired mutations. Plasmid pCas9 was introduced into recombinant strain HME63 (31), which contained the Gam, Exo and Beta functions of phage □ -red. The resulting strain was co-transformed with the plasmid pCRISPR :: rpsL (or a pCRISPR :: Ø control) and the oligonucleotide W542 (Figure 27a). The recombination efficiency was 5.3 × 10-5, calculated as the fraction of total cells that became streptomycin resistant when the control plasmid was used (Figure 27c). In contrast, transformation with plasmid pCRISPR :: rpsL increased the percentage of mutant cells to 65 ± 14% (Figures 27c and 29f). Applicants noted that the cfu number was reduced by approximately three orders of magnitude after transformation of plasmid pCRISPR :: rpsL than the control plasmid (4.8 × 105 / 5.3 × 102, Figure 38a), which suggests that selection results in CRISPR induced death of unedited cells. To measure the rate at which Cas9 cleavage was inactivated, an important parameter of the applicants method, applicants transformed cells with pCRISPR :: rpsL or the control plasmid without the W542 edition oligonucleotide (Figure 38a). This CRISPR “escapist” fund, measured as the pCRISPR :: rpsL / pCRISPR :: Ø cfu ratio, was 2.5 × 10-4 (1.2 × 102 / 4.8 × 105). Genotyping eight of these escapists revealed that in all cases there was a suppression of the fixation spacer as a target (Figure 38b). This background was greater than the recombination efficiency of the rpsL mutation, 5.3 × 10-5, which suggests that to obtain 65% of the edited cells, excision of Cas9 must induce oligonucleotide recombination. To confirm this, applicants compared the number of kanamycin and streptomycin resistant cfu after the transformation of pCRISPR :: rpsL or pCRISPR :: Ø (Figure 27d). As in the case for S. pneumoniae, applicants observed a modest recombination induction, approximately 6.7 times (2.0 × 10-4 / 3.0 × 10-5). Taken together, these results indicated that the CRISPR system provided a method to select mutations introduced by recombination.

Los solicitantes mostraron que los sistemas CRISPR-Cas pueden usarse para edición fijada como objetivo de genomas en bacterias por la cointroducción de una construcción de fijación como objetivo que destruye células naturales y una plantilla de edición que tanto eliminaba la escisión de CRISPR como introducía las mutaciones deseadas. Se pueden generar diferentes tipos de mutaciones (inserciones, supresiones o sustituciones de un solo nucleótido sin marca). Se pueden introducir múltiples mutaciones al mismo tiempo. La especificidad y versatilidad de la edición usando el sistema CRISPR se basaba en las diversas propiedades únicas de la endonucleasa Cas9: (i) su especificidad de objetivo puede programarse con un ARN pequeño, sin la necesidad de lograr enzimas, (ii) la especificidad del objetivo fue muy alta, determinada por una interacción ARN-ADN de 20 pb con baja probabilidad de no reconocimiento de objetivo, (iii) casi ninguna secuencia puede fijarse como objetivo, siendo el único requerimiento la presencia de una secuencia NGG adyacente, (iv) casi ninguna mutación en la secuencia NGG, así como mutaciones en la secuencia simiente del protoespaciador, elimina la fijación como objetivo. Applicants showed that CRISPR-Cas systems can be used for fixed editing as a target for genomes in bacteria by co-introduction of a binding construct that targets natural cells and an editing template that both eliminated CRISPR excision and introduced mutations. desired. Different types of mutations can be generated (insertions, deletions or substitutions of a single nucleotide without a label). Multiple mutations can be introduced at the same time. The specificity and versatility of the edition using the CRISPR system was based on the various unique properties of the Cas9 endonuclease: (i) its target specificity can be programmed with a small RNA, without the need to achieve enzymes, (ii) the specificity of the target was very high, determined by a 20 bp RNA-DNA interaction with a low probability of no target recognition, (iii) almost no sequence can be set as the target, the only requirement being the presence of an adjacent NGG sequence, (iv) almost no mutation in the NGG sequence, as well as mutations in the seed spacer sequence, eliminates target fixation.

Los solicitantes mostraron que la ingeniería genómica usando el sistema CRISPR no sólo funcionaba en bacterias altamente recombinogénicas tales como S. pneumoniae, sino también en E. coli. Los resultados en E. coli sugirieron que el método podía ser aplicable a otros organismos para los cuales se pueden introducir plásmidos. En E. coli, la propuesta complementa la recombinación de oligonucleótidos mutagénicos. Para usar esta metodología en microbios en los que no es posible la recombinación, se puede usar la maquinaria de recombinación homóloga del huésped para proporcionar la plantilla de edición en un plásmido. Además, debido a que la evidencia acumulada indica que la escisión mediada por CRISPR del cromosoma conduce a muerte celular en muchas bacterias y arqueas, es posible prever el uso de sistemas CRISPR-Cas endógenos para fines de edición. The applicants showed that genomic engineering using the CRISPR system not only worked in highly recombinogenic bacteria such as S. pneumoniae, but also in E. coli. The results in E. coli suggested that the method could be applicable to other organisms for which plasmids can be introduced. In E. coli, the proposal complements the recombination of mutagenic oligonucleotides. To use this methodology in microbes in which recombination is not possible, homologous host recombination machinery can be used to provide the editing template in a plasmid. In addition, because the accumulated evidence indicates that CRISPR-mediated excision of the chromosome leads to cell death in many bacteria and archaea, it is possible to provide for the use of endogenous CRISPR-Cas systems for editing purposes.

Tanto en S. pneumoniae como en E. coli, los solicitantes observaron que aunque se facilitó la edición por una coselección de células transformables y una pequeña inducción de recombinación en el sitio fijado como objetivo por escisión de Cas9, el mecanismo que contribuyó más a la edición fue la selección contra células no editadas. Por lo tanto, la mayor limitación del método fue la presencia de un fondo de células que escaparan a la muerte celular inducida por CRISPR y ausencia de la mutación deseada. Los solicitantes mostraron que estos “escapistas” surgían principalmente por la supresión del espaciador de fijación como objetivo, presumiblemente después de la recombinación de las secuencias de repetición que flanqueaban el espaciador de fijación como objetivo. Más mejoras pueden centrarse en conseguir secuencias de flanqueamiento que puedan soportar aún la biogénesis de los ARNcr funcionales pero que sean suficientemente diferentes entre sí para eliminar la recombinación. Alternativamente, la trasformación directa de los ARNcr quiméricos puede explorarse. En el caso particular de E. coli, la construcción del sistema CRISPR-Cas no fue posible si este organismo se usaba también como un huésped de clonación. Los solicitantes resolvieron esta cuestión poniendo Cas9 y el ARNtracr en un plásmido diferente que la matriz de CRISPR. La ingeniería de un sistema inducible también puede evitar esta limitación. In both S. pneumoniae and E. coli, the applicants noted that although editing was facilitated by a harvest of transformable cells and a small induction of recombination at the target site by Cas9 cleavage, the mechanism that contributed most to the edition was the selection against unedited cells. Therefore, the greatest limitation of the method was the presence of a background of cells that escaped CRISPR-induced cell death and absence of the desired mutation. The applicants showed that these "escapists" arose primarily by the suppression of the target spacer, presumably after the recombination of the repeat sequences flanking the target spacer. Further improvements may focus on achieving flanking sequences that can still support the biogenesis of functional cRNAs but that are sufficiently different from each other to eliminate recombination. Alternatively, direct transformation of the chimeric cRNAs can be explored. In the particular case of E. coli, the construction of the CRISPR-Cas system was not possible if this organism was also used as a cloning host. The applicants resolved this issue by putting Cas9 and the ARNtracr in a different plasmid than the CRISPR matrix. The engineering of an inducible system can also avoid this limitation.

Aunque las nuevas tecnologías de síntesis de ADN proporcionan la capacidad para crear con coste eficaz cualquier secuencia con un alto rendimiento, permanece el reto de integrar ADN sintético en células vivas para crear genomas funcionales. Recientemente, se mostró la estrategia MAGE de coselección para mejorar la eficacia de mutación de recombinación por selección de una subpoblación de células que presenta una probabilidad aumentada para conseguir recombinación en o alrededor de un sitio determinado. En este método, la introducción de mutaciones seleccionables se usa para aumentar los cambios de generación de mutaciones cercanas no seleccionables. Al contrario que la selección indirecta proporcionada por esta estrategia, el uso del sistema CRISPR lo hace posible para seleccionar de manera directa la mutación deseada y recuperarla con una alta eficacia. Estas tecnologías se añaden al conjunto de los logros genéticos y junto con la síntesis de ADN, pueden avanzar sustancialmente tanto la capacidad para decodificar la función genética como para manipular organismos para fines biotecnológicos. Otros dos estudios también se relacionan con la ingeniería asistida por CRISPR de genomas de mamífero. Se espera que estas tecnologías de edición de genomas dirigida por ARNcr puedan ser ampliamente útiles en ciencias básicas y médicas. Although new DNA synthesis technologies provide the ability to effectively create any sequence with high performance, the challenge remains to integrate synthetic DNA into living cells to create functional genomes. Recently, the MAGE harvesting strategy was shown to improve the efficiency of recombination mutation by selection of a subpopulation of cells that has an increased probability to achieve recombination at or around a given site. In this method, the introduction of selectable mutations is used to increase the generation changes of nearby non-selectable mutations. Unlike the indirect selection provided by this strategy, the use of the CRISPR system makes it possible to directly select the desired mutation and recover it with high efficiency. These technologies are added to the set of genetic achievements and together with DNA synthesis, the ability to decode the genetic function and to manipulate organisms for biotechnological purposes can substantially advance. Two other studies also relate to CRISPR assisted engineering of mammalian genomes. It is expected that these genome editing technologies directed by ARNcr can be widely useful in basic and medical sciences.

Cepas y condiciones de cultivo. Se proporcionó cepa R6 de S. pneumoniae por el Dr. Alexander Tomasz. Se generó cepa crR6 en un estudio previo. Se cultivaron cultivos líquidos de S. pneumoniae en medio THYE (30 g/l de agar Todd-Hewitt, 5 g/l de extracto de levadura). Se cultivaron células en agar de soja tríptica (TSA, por sus siglas en inglés) enriquecido con sangre de oveja desfibrinada al 5%. Cuando fue apropiado, se añadieron antibióticos como sigue: kanamicina (400 µg/ml), cloranfenicol (5 µg/ml), eritromicina (1 µg/ml), estreptomicina (100 µg/ml) o espectinomicina (100 µg/ml). Se realizaron mediciones de actividad de β-galactosidasa usando la prueba de Miller como se describió previamente. Strains and culture conditions. S. pneumoniae strain R6 was provided by Dr. Alexander Tomasz. CrR6 strain was generated in a previous study. Liquid cultures of S. pneumoniae were grown in THYE medium (30 g / l of Todd-Hewitt agar, 5 g / l of yeast extract). Cells were grown in tryptic soy agar (TSA) enriched with 5% defibrinated sheep blood. When appropriate, antibiotics were added as follows: kanamycin (400 µg / ml), chloramphenicol (5 µg / ml), erythromycin (1 µg / ml), streptomycin (100 µg / ml) or spectinomycin (100 µg / ml). Measurements of β-galactosidase activity were made using the Miller test as previously described.

Se proporcionaron cepas MG1655 y HME63 de E. coli (procedentes de MG1655, Δ(argF-lac) U169 λ cI857 ΔcrobioA galK tyr 145 UAG mutS<>amp) (31) por Jeff Roberts y Donald Court, respectivamente. Se cultivaron cultivos líquidos de E. coli en medio LB (Difco). Cuando fue apropiado, se añadieron antibióticos como sigue: cloranfenicol (25 µg/ml), kanamicina (25 µg/ml) y estreptomicina (50 µg/ml). E. coli MG1655 and HME63 strains (from MG1655, Δ (argF-lac) U169 λ cI857 ΔcrobioA galK tyr 145 UAG mutS <> amp) (31) were provided by Jeff Roberts and Donald Court, respectively. Liquid cultures of E. coli were grown in LB medium (Difco). When appropriate, antibiotics were added as follows: chloramphenicol (25 µg / ml), kanamycin (25 µg / ml) and streptomycin (50 µg / ml).

Transformación de S. pneumoniae. Se prepararon células competentes como se describió previamente (23). Para todas las transformaciones de edición de genomas, se descongelaron suavemente las células sobre hielo y se volvieron a suspender en 10 volúmenes de medio M2 enriquecido con 100 ng/ml de péptido estimulador de competencia CSP1(40) y seguido por adición de construcciones de edición (se añadieron construcciones de edición a células a una concentración final entre 0,7 ng/µl y 2,5 µg/ul). Se incubaron las células 20 min a 37°C antes de la adición de 2 µl de construcciones de fijación como objetivo y después se incubaron 40 min a 37°C. Se pusieron en placas diluciones en serie de células en el medio apropiado para determinar el recuento de unidades formadoras de colonias (ufc). S. pneumoniae transformation. Competent cells were prepared as previously described (23). For all genome editing transformations, cells were gently thawed on ice and resuspended in 10 volumes of M2 medium enriched with 100 ng / ml CSP1 competition stimulator peptide (40) and followed by addition of editing constructs (Cell editing constructs were added at a final concentration between 0.7 ng / µl and 2.5 µg / ul). Cells were incubated 20 min at 37 ° C before the addition of 2 µl of target fixation constructs and then incubated 40 min at 37 ° C. Serial dilutions of cells were plated on the appropriate medium to determine the count of colony forming units (cfu).

Recombinación de lambda-rojo de E. coli. Se usó cepa HME63 para todos los experimentos de recombinación. Se prepararon células de recombinación y se manipularon de acuerdo con un protocolo publicado previamente (6). En pocas palabras, se cultivaron 2 ml de cultivo durante la noche (medio LB) inoculado de una única colonia obtenida de una placa a 30°C. Se diluyó el cultivo durante la noche 100 veces y se cultivó a 30 °C con agitación (21 rad/s (200 rpm)) hasta que la DO600 es de 0,4-0,5 (aproximadamente 3 h). Para inducción de Lambda-rojo, se transfirió el cultivo a un baño de agua a 42 °C para agitar a (21 rad/s (200 rpm)) durante 15 min. Inmediatamente después de inducción, se distribuyó el cultivo en una suspensión de hielo-agua y se enfrió sobre hielo durante 5-10 min. Después se lavaron las células y se tomaron alícuotas según el protocolo. Para electrotransformación, se mezclaron 50 µl de células con 1 mM de oligos sin sal (IDT) o 100-150 ng de ADN de plásmido (preparado por Estuche QIAprep Spin Miniprep, Qiagen). Se electroporaron las células usando una cubeta de 1 mm de Gene Pulser (Biorad) a 1,8 kV y se volvieron a suspender inmediatamente en 1 ml de medio LB a temperatura ambiente. Se recuperaron las células a 30 °C durante 1-2 h antes de que se pusieran en placas sobre agar LB con resistencia apropiada a los antibióticos y se incubaron a 32 °C durante la noche. Lambda-red recombination of E. coli. Strain HME63 was used for all recombination experiments. Recombination cells were prepared and manipulated according to a previously published protocol (6). Simply put, 2 ml of culture was grown overnight (LB medium) inoculated from a single colony obtained from a plate at 30 ° C. The culture was diluted overnight 100 times and grown at 30 ° C with stirring (21 rad / s (200 rpm)) until the OD600 is 0.4-0.5 (approximately 3 h). For induction of Lambda-red, the culture was transferred to a water bath at 42 ° C to stir at (21 rad / s (200 rpm)) for 15 min. Immediately after induction, the culture was distributed in an ice-water suspension and cooled on ice for 5-10 min. The cells were then washed and aliquots were taken according to the protocol. For electrotransformation, 50 µl of cells were mixed with 1 mM of unsalted oligos (RTD) or 100-150 ng of plasmid DNA (prepared by QIAprep Spin Miniprep Case, Qiagen). The cells were electroporated using a 1 mm cuvette of Gene Pulser (Biorad) at 1.8 kV and immediately resuspended in 1 ml of LB medium at room temperature. Cells were recovered at 30 ° C for 1-2 h before they were plated on LB agar with appropriate antibiotic resistance and incubated at 32 ° C overnight.

Preparación de ADN genómico de S. pneumoniae. Para fines de transformación, se extrajo ADN genómico de S. pneumoniae usando el estuche de purificación de ADN genómico Wizard, siguiendo las instrucciones proporcionadas por el fabricante (Promega). Para fines de genotipado, se granularon 700 ul de cultivos de S. pneumoniae durante la noche, se volvieron a suspender en 60 ul de disolución de lisozima (2 mg/ml) y se incubaron 30 min a 37°C. Se extrajo el ADN genómico usando estuche QIAprep Spin Miniprep (Qiagen). Preparation of genomic DNA of S. pneumoniae. For transformation purposes, genomic DNA from S. pneumoniae was extracted using the Wizard genomic DNA purification kit, following the instructions provided by the manufacturer (Promega). For genotyping purposes, 700 ul of S. pneumoniae cultures were granulated overnight, resuspended in 60 ul of lysozyme solution (2 mg / ml) and incubated 30 min at 37 ° C. Genomic DNA was extracted using QIAprep Spin Miniprep (Qiagen) case.

Construcción de cepas. Todos los cebadores usados en este estudio se proporcionan en la Tabla G. Para generar crR6M de S. pneumoniae, se preparó una cepa intermedia, LAM226. En esta cepa se volvió a poner el gen aphA-3 (proporcionando resistencia a kanamicina) adyacente a la matriz de CRISPR de cepa crR6 de S. pneumoniae por un gen cat (que proporciona resistencia a cloranfenicol). En pocas palabras, se multiplicó ADN genómico de crR6 usando cebadores L448/L444 y L447/L481, respectivamente. El gen cat se multiplicó de plásmido pC194 usando los cebadores L445/L446. Cada producto PCR se purificó en gel y los tres se fusionaron por PCR SOEing con los cebadores L448/L481. El producto PCR resultante se transformó en células crR6 de S. pneumoniae competentes y se seleccionaron transformados resistentes a cloranfenicol. Para generar ADN genómico de crR6M de S. pneumoniae, crR6 de S. pneumoniae se multiplicó por PCR usando los cebadores L409/L488 y L448/L481, respectivamente. Cada producto PCR se purificó en gel y se fusionaron por PCR SOEing con cebadores L409/L481. El producto PCR resultante se transformó en células LAM226 de S. pneumoniae competentes y se seleccionaron transformados resistentes a kanamicina. Strain construction. All primers used in this study are provided in Table G. To generate crR6M from S. pneumoniae, an intermediate strain, LAM226, was prepared. In this strain, the aphA-3 gene (providing kanamycin resistance) was placed adjacent to the CRISPR matrix of S. pneumoniae strain CRR6 by a cat gene (which provides chloramphenicol resistance). Simply put, crR6 genomic DNA was multiplied using primers L448 / L444 and L447 / L481, respectively. The cat gene was multiplied from plasmid pC194 using primers L445 / L446. Each PCR product was gel purified and all three were fused by SOEing PCR with primers L448 / L481. The resulting PCR product was transformed into competent S. pneumoniae crR6 cells and chloramphenicol resistant transformants were selected. To generate genomic DNA from S. pneumoniae crR6M, S. pneumoniae crR6 was multiplied by PCR using primers L409 / L488 and L448 / L481, respectively. Each PCR product was gel purified and fused by SOEing PCR with primers L409 / L481. The resulting PCR product was transformed into competent S. pneumoniae LAM226 cells and kanamycin resistant transformants were selected.

Para generar crR6Rc de S. pneumoniae, se multiplicó ADN genómico de crR6M de S. pneumoniae por PCR usando cebadores L430/W286 y se multiplicó ADN genómico LAM226 de S. pneumoniae por PCR usando cebadores W288/L481. Cada producto PCR se purificó en gel y se fusionaron por PCR SOEing con cebadores L430/L481. El producto PCR resultante se transformó en células crR6M de S. pneumoniae competentes y se seleccionaron transformados resistentes a cloranfenicol. To generate S. pneumoniae crR6Rc, S. pneumoniae crR6M genomic DNA was multiplied by PCR using L430 / W286 primers and S. pneumoniae LAM226 genomic DNA was multiplied by PCR using W288 / L481 primers. Each PCR product was gel purified and fused by SOEing PCR with primers L430 / L481. The resulting PCR product was transformed into competent S. pneumoniae crR6M cells and chloramphenicol resistant transformants were selected.

Para generar crR6Rk de S. pneumoniae, se multiplicó ADN genómico de crR6M de S. pneumoniae por PCR usando cebadores L430/W286 y W287/L481, respectivamente. Cada producto PCR se purificó en gel y se fusionaron por PCR SOEing con cebadores L430/L481. El producto PCR resultante se transformó en células crR6Rc de S. pneumoniae compententes y se seleccionaron transformados resistentes a kanamicina. To generate S. pneumoniae crR6Rk, S. pneumoniae crR6M genomic DNA was multiplied by PCR using primers L430 / W286 and W287 / L481, respectively. Each PCR product was gel purified and fused by SOEing PCR with primers L430 / L481. The resulting PCR product was transformed into competing S. pneumoniae crR6Rc cells and kanamycin resistant transformants were selected.

Para generar JEN37, se multiplicó ADN genómico de crR6Rk de S. pneumoniae por PCR usando cebadores L430/W356 y W357/L481, respectivamente. Cada producto PCR se purificó en gel y se fusionaron por PCR SOEing con cebadores L430/L481. El producto PCR resultante se transformó en células crR6Rc compententes de S. pneumoniae y transformados resistentes a kanamicina se seleccionaron. To generate JEN37, S. pneumoniae crR6Rk genomic DNA was multiplied by PCR using primers L430 / W356 and W357 / L481, respectively. Each PCR product was gel purified and fused by SOEing PCR with primers L430 / L481. The resulting PCR product was transformed into S. pneumoniae-compliant crR6Rc cells and kanamycin resistant transformants were selected.

Para generar JEN38, se multiplicó ADN genómico R6 usando cebadores L422/L461 y L459/L426, respectivamente. El gen ermAM (que especifica resistencia a eritromicina) se multiplicó de plásmido pFW1543 usando cebadores L457/L458. Cada producto PCR se purificó en gel y los tres se fusionaron por PCR SOEing con cebadores L422/L426. El producto PCR resultante se transformó en células crR6Rc de S. pneumoniae compententes y se seleccionaron transformados resistentes a eritromicina. To generate JEN38, R6 genomic DNA was multiplied using primers L422 / L461 and L459 / L426, respectively. The ermAM gene (which specifies resistance to erythromycin) was multiplied from plasmid pFW1543 using primers L457 / L458. Each PCR product was gel purified and all three were fused by SOEing PCR with primers L422 / L426. The resulting PCR product was transformed into competing S. pneumoniae crR6Rc cells and erythromycin resistant transformants were selected.

Se generaron JEN53 S. pneumoniae en dos etapas. Primero se construyó JEN43 como se ilustra en la Figura 33. Se generó JEN53 transformando ADN genómico de JEN25 en células JEN43 competentes y seleccionando en tanto cloranfenicol como eritromicina. JEN53 S. pneumoniae was generated in two stages. JEN43 was first constructed as illustrated in Figure 33. JEN53 was generated by transforming JEN25 genomic DNA into competent JEN43 cells and selecting both chloramphenicol and erythromycin.

Para generar JEN62S. pneumoniae, se multiplicó ADN genómico crR6Rk S. pneumoniae por PCR usando cebadores W256/W365 y W366/L403, respectivamente. Cada producto PCR fue purificado y ligado por ensamblado de Gibson. El producto de ensamblado se transformó en células crR6Rc compententes de S. pneumoniae y se seleccionaron transformados resistentes a kanamicina. To generate JEN62S. pneumoniae, crR6Rk S. pneumoniae genomic DNA was multiplied by PCR using primers W256 / W365 and W366 / L403, respectively. Each PCR product was purified and ligated by Gibson assembly. The assembly product was transformed into S. pneumoniae-compatible crR6Rc cells and kanamycin-resistant transformants were selected.

Construcción de plásmido. Se construyó pDB97 por fosforilación e hibridación de oligonucleótidos B296/B297, seguido por ligadura en pLZ12spec digerido por EcoRI/BamHI. Los solicitantes secuenciaron completamente pLZ12spec y depositaron su secuencia en genebank (acceso: KC112384). Plasmid construction. PDB97 was constructed by phosphorylation and hybridization of oligonucleotides B296 / B297, followed by ligation in pLZ12spec digested by EcoRI / BamHI. The applicants completely sequenced pLZ12spec and deposited their sequence in genebank (access: KC112384).

Se obtuvo pDB98 después de clonar la secuencia líder de CRISPR se clonó junto con una unidad repeticiónespaciador-repetición en pLZ12spec. Esto se consiguió por multiplicación de ADN de crR6Rc con cebadores B298/B320 y B299/B321, seguido por PCR SOEing de los dos productos y clonación en pLZ12spec con sitios de restricción BamHI/EcoRI. De esta manera se logró que la secuencia espaciadora en pDB98 contuviera dos sitios de restricción BsaI en direcciones opuestas que permitieran la clonación sin marca de nuevos espaciadores. PDB98 was obtained after cloning the leader sequence of CRISPR was cloned together with a repeat spacer-repeat unit in pLZ12spec. This was achieved by multiplying crR6Rc DNA with primers B298 / B320 and B299 / B321, followed by SOEing PCR of the two products and cloning into pLZ12spec with BamHI / EcoRI restriction sites. In this way, the spacer sequence in pDB98 was achieved to contain two BsaI restriction sites in opposite directions that allowed unlabeled cloning of new spacers.

Se construyeron pDB99 a pDB108 por hibridación de oligonucleótidos B300/B301 (pDB99), B302/B303 (pDB100), B304/B305 (pDB101), B306/B307 (pDB102), B308/B309 (pDB103), B310/B311 (pDB104), B312/B313 (pDB105), B314/B315 (pDB106), B315/B317 (pDB107), B318/B319 (pDB108), seguido por ligadura en corte de pDB98 por BsaI. PDB99 to pDB108 were constructed by hybridization of oligonucleotides B300 / B301 (pDB99), B302 / B303 (pDB100), B304 / B305 (pDB101), B306 / B307 (pDB102), B308 / B309 (pDB103), B310 / B3 (11) , B312 / B313 (pDB105), B314 / B315 (pDB106), B315 / B317 (pDB107), B318 / B319 (pDB108), followed by cut-off of pDB98 by BsaI.

Se construyó el plásmido pCas9 como sigue. Se multiplicaron elementos CRISPR esenciales de ADN genómico de SF370 Streptococcos pyogenes con brazos de homología de flanqueamiento para ensamblado de Gibson. El ARNtracr y Cas9 se multiplicaron con oligos HC008 y HC010. Las secuencias líder y CRISPR se multiplicaron HC011/HC014 y HC015/HC009, de manera que se introdujeron dos sitios BsaI tipo IIS entre dos repeticiones directas para facilitar la fácil inserción de espaciadores. Plasmid pCas9 was constructed as follows. Essential CRISPR genomic DNA elements of SF370 Streptococcos pyogenes were multiplied with flanking homology arms for Gibson assembly. The ARNtracr and Cas9 were multiplied with oligos HC008 and HC010. The leader and CRISPR sequences were multiplied HC011 / HC014 and HC015 / HC009, so that two IIS type BsaI sites were introduced between two direct repeats to facilitate easy insertion of spacers.

Se construyó pCRISPR por subclonación de la matriz CRISPR pCas9 en pZE21-MCS1 por multiplicación con oligos B298+B299 y restricción con EcoRI y BamHI. Se clonó el espaciador de fijación como objetivo de rpsL por hibridación de oligos B352+B353 y clonando en el corte de BsaI pCRISPR proporcionando pCRISPR::rpsL. PCRISPR was constructed by subcloning the CRISPR pCas9 matrix into pZE21-MCS1 by multiplication with oligo B298 + B299 and restriction with EcoRI and BamHI. The fixation spacer was cloned as the target of rpsL by hybridization of oligos B352 + B353 and cloning in the BsaI cut pCRISPR providing pCRISPR :: rpsL.

Generación de construcciones de fijación como objetivo y edición. Las construcciones de fijación como objetivo usadas para edición de genomas se prepararon por ensamblado de Gibson de los PCR izquierdo y PCR derecho (Tabla G). Las construcciones de edición se prepararon por PCR SOEing fusionando productos PCR A (PCR A), productos PCR B (PCR B) y productos PCR C (PCR C) cuando fue aplicable (Tabla G). Se generaron las construcciones de fijación como objetivo CRISPR::Ø y CRISPR::ermAM(interrupción) por multiplicación PCR de JEN62 y ADN genómico crR6 respectivamente, con oligos L409 y L481. Generation of fixing constructions as objective and edition. Target fixation constructs used for genome editing were prepared by Gibson assembly of the left PCR and right PCR (Table G). Editing constructs were prepared by SOEing PCR by fusing PCR A products (PCR A), PCR B products (PCR B) and PCR C products (PCR C) when applicable (Table G). The target constructs CRISPR :: Ø and CRISPR :: ermAM (interruption) were generated by PCR multiplication of JEN62 and genomic DNA crR6 respectively, with oligos L409 and L481.

Generación de objetivos con PAM o secuencias del protoespaciador aleatorizadas. Se aleatorizaron los 5 nucleótidos siguiendo el objetivo espaciador 1 por la multiplicación de ADN genómico de R68232,5 con cebadores W377/ L426. Este producto PCR se ensambló después con el gen cat y la región aguas arriba de srtA que se multiplicó a partir de la misma matriz con los cebadores L422/W376. Se usaron 80 ng del ADN ensamblado para transformar las cepas R6 y crR6. Se prepararon las muestras para los objetivos aleatorizados usando los siguientes cebadores: B280-B290/L426 para aleatorizar las bases 1-10 del objetivo y B269-B278/L426 para aleatorizar las bases 10-20. Se usaron los cebadores L422/B268 y L422/B279 para multiplicar el gen cat y la región aguas arriba de srtA para ensamblar con los 10 productos PCR primeros y últimos, respectivamente. Se mezclaron juntas las construcciones ensambladas y se transformaron 30 ng en R6 y crR6. Después de la transformación, se pusieron en Generation of objectives with PAM or randomized proto-spacer sequences. The 5 nucleotides were randomized following the spacer target 1 by the multiplication of genomic DNA of R68232.5 with primers W377 / L426. This PCR product was then assembled with the cat gene and the upstream region of srtA that multiplied from the same matrix with primers L422 / W376. 80 ng of the assembled DNA was used to transform the R6 and crR6 strains. Samples were prepared for randomized targets using the following primers: B280-B290 / L426 to randomize bases 1-10 of the target and B269-B278 / L426 to randomize bases 10-20. Primers L422 / B268 and L422 / B279 were used to multiply the cat gene and the upstream region of srtA to assemble with the first and last 10 PCR products, respectively. The assembled constructions were mixed together and 30 ng were transformed into R6 and crR6. After the transformation, they were put in

5 placas las células en selección de cloranfenicol. Para cada muestra se mezclaron entre sí más de 2×105 células en 1 ml de THYE y se extrajo ADN genómico con el estuche Promega Wizard. Se usaron los cebadores B250/B251 para multiplicar la región fijada como objetivo. Se marcaron los productos PCR y se barrieron sobre una vía de extremos apareados Illumina MiSeq usando 300 ciclos. 5 plates the cells in chloramphenicol selection. For each sample, more than 2 × 105 cells in 1 ml of THYE were mixed together and genomic DNA was extracted with the Promega Wizard kit. Primers B250 / B251 were used to multiply the target region. The PCR products were labeled and swept on a path of paired ends Illumina MiSeq using 300 cycles.

Análisis de los datos de secuenciación profunda. Analysis of deep sequencing data.

10 PAM aleatorizada: Para el experimento de PAM aleatorizada se obtuvieron 3.429.406 lecturas para crR6 y 3.253.998 para R6. Se espera que sólo la mitad de ellas corresponda al objetivo PAM mientras la otra mitad secuenciará el otro extremo del producto PCR. 1.623.008 de las lecturas de crR6 reads y 1.537.131 de las lecturas de R6 soportaron una secuencia diana exenta de error. La existencia de cada posible PAM entre estas lecturas se muestra en un archivo suplementario. Para estimar la funcionalidad de una PAM, se cómputo su proporción relativa en la muestra 10 Randomized PAM: For the randomized PAM experiment, 3,429,406 readings were obtained for crR6 and 3,253,998 for R6. It is expected that only half of them correspond to the PAM target while the other half will sequence the other end of the PCR product. 1,623,008 of the crR6 reads readings and 1,537,131 of the R6 readings supported an error-free target sequence. The existence of each possible PAM between these readings is shown in a supplementary file. To estimate the functionality of a MAP, its relative proportion in the sample was calculated

15 de crR6 sobre la muestra de R6 y se indica rijklm donde I,j,k,l,m son una de las 4 posibles bases. Se construyó el siguiente modelo estadístico: 15 of crR6 on the sample of R6 and rijklm is indicated where I, j, k, l, m are one of the 4 possible bases. The following statistical model was constructed:

donde ε es el error residual, b2 es el efecto de la 2a base de la PAM, b3 de la tercera, b4 de la cuarta, b2b3 es la interacción entre las bases segunda y tercera, b3b4 entre las bases tercera y cuarta. Se realizó un análisis de la 20 varianza: where ε is the residual error, b2 is the effect of the 2nd base of the PAM, b3 of the third, b4 of the fourth, b2b3 is the interaction between the second and third bases, b3b4 between the third and fourth bases. An analysis of the variance was carried out:

Tabla Anova Anova table

Df Suma Cuadrado Media Cuadrado Valor F Pr (>F) Df Sum Sum Half Square F value Pr (> F)

b3 b3
3 151,693 50,564 601,8450 < 2,2e-16 *** 3 151,693 50,564 601,8450 <2,2e-16 ***

b2 b2
3 90,521 30,174 359,1454 < 2,2e-16 *** 3 90,521 30,174 359,1454 <2,2e-16 ***

b4 b4
3 1,881 0,627 7,4623 6,070e-05 *** 3 1,881 0.627 7.4623 6,070e-05 ***

b3:b2 b3: b2
9 228,940 25,438 302,7738 < 2,2e-16 *** 9 228,940 25,438 302.7738 <2,2e-16 ***

b3:b4 b3: b4
9 3,010 0,334 3,9809 5,227e-05 *** 9 3,010 0.334 3,9809 5,227e-05 ***

Residuos Waste
996 83,680 0,084 996 83,680 0.084

Cuando se añade este modelo, no parece que b1 o b5 sean significativos y también se pueden desechar otras interacciones que las incluidas. La lección de modelo se realizó por comparación de sucesivas de modelos más o menos completos usando el método anova en R. Se usó el ensayo de significancia verdadera de Tukey para When this model is added, b1 or b5 does not appear to be significant and other interactions than those included can also be discarded. The model lesson was performed by comparing successive models of more or less complete models using the anova R method. Tukey's test of true significance was used to

25 determinar si eran significativas las diferencias de pares entre efectos. 25 determine whether the differences in pairs between effects were significant.

Los patrones NGGNN eran significativamente diferentes de los otros patrones y soportan el efecto más fuerte (véase la tabla a continuación). The NGGNN patterns were significantly different from the other patterns and support the strongest effect (see table below).

Para demostrar que las posiciones, 1, 4 ó 5 no afectan al patrón NGGNN, los solicitantes miraron estas secuencias solamente. Este efecto parece que está normalmente distribuido (véase la representación gráfica QQ en la Figura To demonstrate that positions 1, 4 or 5 do not affect the NGGNN pattern, applicants looked at these sequences only. This effect seems to be normally distributed (see graphic representation QQ in Figure

30 71) y comparaciones de modelo usando el método anova en R muestran que el modelo nulo es el mejor, es decir, no hay una función significativa de b1, b4 y b5. 30 71) and model comparisons using the anova method in R show that the null model is the best, that is, there is no significant function of b1, b4 and b5.

Comparación de modelo usando el método anova en R para las secuencias NGGNN. Model comparison using the anova method in R for NGGNN sequences.

Modelo 1: Model 1:
proporción.log ∼1 proportion.log ∼1

Modelo 2: Model 2:
proporción.log ∼b1 + b4 + b5 log.log ∼b1 + b4 + b5

Df Res. Df Res.
RSS Df Suma de Cuadrados F Pr (>F) RSS feed Df Sum of squares F Pr (> F)

1 63 1 63
14,579 14,579

2 2
54 11,295 9 3,2836 1,7443 0,1013 54 11,295 9 3.2836 1,7443 0.1013

Interferencia parcial de los patrones NAGNN y NNGGN Partial interference of the NAGNN and NNGGN patterns

Los patrones NAGNN eran significativamente diferentes de los otros patrones pero soportan un efecto mucho menor que NGGNN (véase el ensayo de significancia verdadera de Tukey a continuación). The NAGNN patterns were significantly different from the other patterns but withstand a much smaller effect than NGGNN (see Tukey's true significance test below).

Finalmente, los patrones NTGGN y NCGGN son similares y muestran interferencia de CRISPR más significativamente que los patrones NTGHN y NCGHN (donde H es A,T o C), como se muestra por un ensayo de student de pares ajustados de bonferroni. Finally, the NTGGN and NCGGN patterns are similar and show CRISPR interference more significantly than the NTGHN and NCGHN patterns (where H is A, T or C), as shown by a student essay of bonferroni adjusted pairs.

Comparaciones de pares del efecto de b4 sobre secuencias NYGNN usando ensayos t con DE agrupada. Peer comparisons of the effect of b4 on NYGNN sequences using t-tests with pooled ED.

Datos: b4 Data: b4

A TO
C G C G

C 1,00 C 1.00
- - - -

G 9,2e-05 G 9.2e-05
2,4e-06 - 2,4e-06 -

T T
0,31 1,00 1,2e-08 0.31 1.00 1,2e-08

Tomados juntos, estos resultados permiten concluir que los patrones NNGGN producen en general una interferencia completa en el caso de NGGGN, o una interferencia parcial en el caso de NAGGN, NTGGN o NCGGN. Taken together, these results allow us to conclude that NNGGN patterns generally produce complete interference in the case of NGGGN, or partial interference in the case of NAGGN, NTGGN or NCGGN.

10 Comparaciones múltiples de Tukey de medias: 95% de nivel de confianza a nivel familiar. 10 Tukey multiple comparisons of means: 95% confidence level at family level.

$b2:b3 $ b2: b3

dif infer super p adj dif infer super p adj

G:G-A:A G: G-A: A
-2,76475 -2,94075 -2,58875 <1E -07 -2,76475 -2,94075 -2,58875 <1E -07

G:G-C:A G: G-C: A
-2,79911 -2,97511 -2,62311 <1E -07 -2,79911 -2,97511 -2,62311 <1E -07

G:G-T:A G: G-T: A
-2,7809 -2,9569 -2,6049 <1E -07 -2,7809 -2.9569 -2,6049 <1E -07

G:G-A:C G: G-A: C
-2,81643 -2,99244 -2,64043 <1E -07 -2,81643 -2.99244 -2,64043 <1E -07

G:G-C:C G: G-C: C
-2,77903 -2,95504 -2,60303 <1E -07 -2.77903 -2.95504 -2,60303 <1E -07

G:G-G:C G: G-G: C
-2,64867 -2,82468 -2,47267 <1E -07 -2,64867 -2,82468 -2.47267 <1E -07

G:G-T:C G: G-T: C
-2,79718 -2,97319 -2,62118 <1E -07 -2,79718 -2,97319 -2.62118 <1E -07

G:G-A:G G: G-A: G
-2,67068 -2,84668 -2,49468 <1E -07 -2,67068 -2,84668 -2,49468 <1E -07

G:G-C:G G: G-C: G
-2,73525 -2,91125 -2,55925 <1E -07 -2,73525 -2.91125 -2,55925 <1E -07

G:G-T:G G: G-T: G
-2,7976 -2,62159 -2,9736 <1E -07 -2.7976 -2.62159 -2.9736 <1E -07

$b2:b3 $ b2: b3

dif infer super p adj dif infer super p adj

G:G-A:T G: G-A: T
-2,76727 -2,59127 -2,94328 <1E -07 -2,76727 -2.59127 -2.94328 <1E -07

G:G-C:T G: G-C: T
-2,84114 -2,66513 -3,01714 <1E -07 -2.84114 -2,66513 -3,01714 <1E -07

G:G-G:T G: G-G: T
-2,76409 -2,58809 -2,94009 <1E -07 -2.76409 -2.58809 -2.94009 <1E -07

G:G-T:T G: G-T: T
-2,76781 -2,59181 -2,94381 <1E -07 -2,76781 -2.59181 -2.94381 <1E -07

G:G-G:A G: G-G: A
-2,13964 -2,31565 -1,96364 <1E -07 -2,13964 -2,31565 -1.96364 <1E -07

G:A-A:A G: A-A: A
-0,62511 -0,80111 -0,4491 <1E -07 -0.62511 -0.80111 -0.4491 <1E -07

G:A-C:A G: A-C: A
-0,65947 -0,83547 -0,48346 <1E -07 -0.65947 -0.83547 -0.48346 <1E -07

G:A-T:A CAT
-0,64126 -0,46525 -0,81726 <1E -07 -0.64126 -0.46525 -0.81726 <1E -07

G:A-A:C G: A-A: C
-0,67679 -0,50078 -0,85279 <1E -07 -0.67679 -0,50078 -0.85279 <1E -07

G:A-C:C G: A-C: C
-0,63939 -0,46339 -0,81539 <1E -07 -0.63939 -0.46339 -0,81539 <1E -07

G:-A-G:C G: -A-G: C
-0,50903 -0,33303 -0,68503 <1E -07 -0.50903 -0.33303 -0.68503 <1E -07

G:A-T:C G: A-T: C
-0,65754 -0,48154 -0,83354 <1E -07 -0.65754 -0.48154 -0.83354 <1E -07

G:A-A:G G: A-A: G
-0,53104 -0,35503 -0,70704 <1E -07 -0.53104 -0.35503 -0.70704 <1E -07

G:A-C:G G: A-C: G
-0,59561 -0,4196 -0,77161 <1E -07 -0.59561 -0.4196 -0.77161 <1E -07

G:A-T:G G: A-T: G
-0,65795 -0,48195 -0,83396 <1E -07 -0.65795 -0.48195 -0.83396 <1E -07

G:A-A:T G: A-A: T
-0,62763 -0,45163 -0,80363 <1E -07 -0.62763 -0.45163 -0.80363 <1E -07

G:A-C:T G: A-C: T
-0,70149 -0,52549 -0,8775 <1E -07 -0.70149 -0.52549 -0.8775 <1E -07

G:A-G:T G: A-G: T
-0,62445 -0,44844 -0,80045 <1E -07 -0.62445 -0.44844 -0,80045 <1E -07

G:A-T:T G: A-T: T
-0,62817 -0,45216 -0,80417 <1E -07 -0.62817 -0.45216 -0.80417 <1E -07

$b3:b4 $ b3: b4

dif infer super p adj dif infer super p adj

G:G-G:A G: G-G: A
-0,33532 -0,51133 -0,15932 <1E-07 -0.33532 -0.51133 -0,15932 <1E-07

G:G-G:C G: G-G: C
-0,18118 -0,35719 -0,00518 0,036087 -0.18118 -0.35719 -0.00518 0.036087

$b2:b3 $ b2: b3

dif infer super p adj dif infer super p adj

G:G-G:T G: G-G: T
-0,31626 -0,14026 -0,49226 <1E-07 -0.31626 -0,14026 -0.49226 <1E-07

Objetivo aleatorizado Randomized target

Para el experimento de objetivo aleatorizado se obtuvieron 540.726 lecturas para crR6 y 753.570 para R6. Como antes, se esperó que sólo la mitad de las lecturas secuenciara el extremo de interés del producto PCR. Después de filtrar para las lecturas que soportan un objetivo que está exento de error o con una mutación puntual única, 5 permanecieron 217.656 y 353.141 lecturas para crR6 y R6, respectivamente. Se computó la proporción relativa de cada mutante en la muestra crR6 sobre la muestra R6 (Figura 24c). Todas las mutaciones fuera de la secuencia simiente (13-20 bases lejos de la PAM) muestran interferencia completa. Esas secuencias se usaron con una referencia para determinar si se podía decir que otras mutaciones en el interior de la secuencia simiente alteraban significativamente la interferencia. Se fijó una distribución normal para estas secuencias usando la función fitdistr del For the randomized objective experiment, 540,726 readings were obtained for crR6 and 753,570 for R6. As before, only half of the readings were expected to sequence the end of interest of the PCR product. After filtering for the readings that support an objective that is free of error or with a single point mutation, 5 remained 217,656 and 353,141 readings for crR6 and R6, respectively. The relative proportion of each mutant in the crR6 sample on the R6 sample was computed (Figure 24c). All mutations outside the seed sequence (13-20 bases away from PAM) show complete interference. These sequences were used with a reference to determine if other mutations within the seed sequence could be said to significantly alter the interference. A normal distribution for these sequences was set using the fitdistr function of the

10 paquete MASS R. El cuantil 0,99 de la distribución fijada se muestra como una línea de puntos en la Figura 24c. La Figura 72 muestra un histograma de la densidad de datos con distribución normal fijada (línea negra) y el cuantil 0,99 (línea de puntos). 10 MASS R package. The quantile 0.99 of the fixed distribution is shown as a dotted line in Figure 24c. Figure 72 shows a histogram of the density of data with fixed normal distribution (black line) and the quantile 0.99 (dotted line).

15 Tabla G. Cebadores usados en este estudio. 15 Table G. Primers used in this study.

Cebador Primer
Secuencia 5'-3' 5'-3 'sequence

B217 B217
TCCTAGCAGGATTTCTGATATTACTGTCACGTTTTAGAGCTATGCTGTTTTGA TCCTAGCAGGATTTCTGATATTACTGTCACGTTTTAGAGCTATGCTGTTTTGA

B218 B218
GTCACAGTAATATCAGAAATCCTGCTAGGAGTTTTGGGACCATTCAAAACAGC GTCACAGTAATATCAGAAATCCTGCTAGGAGTTTTGGGACCATTCAAAACAGC

B229 B229
GGGTTTCAAGTCTTTGTAGCAAGAG GGGTTTCAAGTCTTTGTAGCAAGAG

B230 B230
GCCAATGAACGGGAACCCTTGGTC GCCAATGAACGGGAACCCTTGGTC

B250 B250
NNNNGACGAGGCAATGGCTGAAATC NNNNGACGAGGCAATGGCTGAAATC

B251 B251
NNNNTTATTTGGCTCATATTTGCTG NNNNTTATTTGGCTCATATTTGCTG

B255 B255
CTTTACACCAATCGCTGCAACAGAC CTTTACACCAATCGCTGCAACAGAC

B256 B256
CAAAATTTCTAGTCTTCTTTGCCTTTCCCCATAAAACCCTCCTTA CAAAATTTCTAGTCTTCTTTGCCTTTCCCCATAAAACCCTCCTTA

B257 B257
AGGGTTTTATGGGGAAAGGCAAAGAAGACTAGAAATTTTGATACC AGGGTTTTATGGGGAAAGGCAAAGAAGACTAGAAATTTTGATACC

B258 B258
CTTACGGTGCATAAAGTCAATTTCC CTTACGGTGCATAAAGTCAATTTCC

Cebador Primer
Secuencia 5'-3' 5'-3 'sequence

B269 B269
TGGCTCGATTTCAGCCATTGC TGGCTCGATTTCAGCCATTGC

B270 B270
CTTTGACGAGGCAATGGCTGAAATCGAGCCAANAAAGCGCAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAANAAAGCGCAAG

B271 B271
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAANAAGCGCAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAANAAGCGCAAG

B272 B272
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAANAGCGCAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAANAGCGCAAG

B273 B273
CTTTGACGAGGCAAAGGCTGAAATCGAGCCAAAAANGCGCAAG CTTTGACGAGGCAAAGGCTGAAATCGAGCCAAAAANGCGCAAG

B274 B274
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAANCGCAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAANCGCAAG

B275 B275
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGNGCAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGNGCAAG

B276 B276
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAANCAAGAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAANCAAGAAG

B277 B277
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGCGNAAGAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGCGNAAGAAG

B278 B278
CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGCGCNAGAAG CTTTGACGAGGCAATGGCTGAAATCGAGCCAAAAAAGCGCNAGAAG

B279 B279
GCGCTTTTTTGGCTCGATTTCAG GCGCTTTTTTGGCTCGATTTCAG

B280 B280
CAATGGCTGAAATCGAGCCAAAAAAGCGCANGAAGAAATC CAATGGCTGAAATCGAGCCAAAAAAGCGCANGAAGAAATC

B281 B281
CAATGGCTGAAATCGAGCCAAAAAAGCGCAANAAGAAATC CAATGGCTGAAATCGAGCCAAAAAAGCGCAANAAGAAATC

B282 B282
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGNAGAAATC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGNAGAAATC

B283 B283
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGANGAAATC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGANGAAATC

B284 B284
CAATGGTGAAATCGAGCCAAAAAAGCGCAAGAANAAATC CAATGGTGAAATCGAGCCAAAAAAGCGCAAGAANAAATC

B285 B285
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGNAATCAACC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGNAATCAACC

B286 B286
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGANATCAACC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGANATCAACC

B287 B287
CAATGGCTGAAATCGAGCCAAAAAAAGCGCAAGAAGAANTCAACC CAATGGCTGAAATCGAGCCAAAAAAAGCGCAAGAAGAANTCAACC

B288 B288
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAANCAACC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAANCAACC

B289 B289
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAATNAACCAGC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAATNAACCAGC

B290 B290
CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAATCNACCAGC CAATGGCTGAAATCGAGCCAAAAAAGCGCAAGAAGAAATCNACCAGC

B296 B296
gatccTCCATCCGTACAACCCACAACCCTGg gatccTCCATCCGTACAACCCACAACCCTGg

B297 B297
aattcCAGGGTTGTGGGTTGTACGGATGGAg aattcCAGGGTTGTGGGTTGTACGGATGGAg

B298 B298
CATGGATCCTATTTCTTAATAACTAAAAATATGG CATGGATCCTATTTCTTAATAACTAAAAATATGG

B299 B299
CATGAATTCAACTCAACAAGTCTCAGTGTGCTG CATGAATTCAACTCAACAAGTCTCAGTGTGCTG

B300 B300
AAACATTTTTTCTCCATTTAGGAAAAAGGATGCTG AAACATTTTTTCTCCATTTAGGAAAAAGGATGCTG

B301 B301
AAAACAGCATCCTTTTTCCTAAATGGAGAAAAAT AAAACAGCATCCTTTTTCCTAAATGGAGAAAAAT

B302 B302
AAACCTTAAATCAGTCACAAATAGCAGCAAAATTG AAACCTTAAATCAGTCACAAATAGCAGCAAAATTG

B303 B303
AAAACAATTTTGCTGCTATTTC-TGACTGATTTAAG AAAACAATTTTGCTGCTATTTC-TGACTGATTTAAG

B304 B304
AAACTTTTCATCATACGACCAATCTGCTTTATTTG AAACTTTTCATCATACGACCAATCTGCTTTATTTG

B305 B305
AAAACAAATAAAGCAGATTGGTCGTATGATGAAAA AAAACAAATAAAGCAGATTGGTCGTATGATGAAAA

B306 B306
AAACTCGTCCAGAAGTTATCGTAAAAGAAATCGAG AAACTCGTCCAGAAGTTATCGTAAAAGAAATCGAG

B307 B307
AAAACTCGATTTCTTTTACGATAACTTCTGGACGA AAAACTCGATTTCTTTTACGATAACTTCTGGACGA

B308 B308
AAACAATCTCTCCAAGGTTTCCTTAAAAATCTCTG AAACAATCTCTCCAAGGTTTCCTTAAAAATCTCTG

B309 B309
AAAACAGAGATTTTTAAGGAAACCTTGGAGAGATT AAAACAGAGATTTTTAAGGAAACCTTGGAGAGATT

B310 B310
AAACGCCATCGTCAGGAAGAAGCTATGCTTGAGTG AAACGCCATCGTCAGGAAGAAGCTATGCTTGAGTG

B311 B311
AAAACACTCAAGCATAGCTTCTTCCTGACGATGGC AAAACACTCAAGCATAGCTTCTTCCTGACGATGGC

B312 B312
AAACATCTCTATACTTATTGAAATTTCTTTGTATG AAACATCTCTATACTTATTGAAATTTCTTTGTATG

Cebador Primer
Secuencia 5'-3' 5'-3 'sequence

B313 B313
AAAACATACAAAGAAATTTCAATAAGTATAGAGAT AAAACATACAAAGAAATTTCAATAAGTATAGAGAT

B314 B314
AAACTAGCTGTGATAGTCCGCAAAACCAGCCTTCG AAACTAGCTGTGATAGTCCGCAAAACCAGCCTTCG

B315 B315
AAAACGAAGGCTGGTTTTGCGGACTATCACAGCTA AAAACGAAGGCTGGTTTTGCGGACTATCACAGCTA

B316 B316
AAACATCGGAAGGTCGAGCAAGZAAZZATCZZZZG AAACATCGGAAGGTCGAGCAAGZAAZZATCZZZZG

B317 B317
AAAACAAAAGATAAZZACZZGCZCGACCZZCCGAZ AAAACAAAAGATAAZZACZZGCZCGACCZZCCGAZ

B318 B318
AAACAAGATGGTATCGCAAAGTAAGTGACAATAAG AAACAAGATGGTATCGCAAAGTAAGTGACAATAAG

B319 B319
AAAACTTATTGTCACTTACTTTGCGATACCATCTT AAAACTTATTGTCACTTACTTTGCGATACCATCTT

B320 B320
GAGACCTTTGAGCTTCCGAGACTGGTCTCAGTTTTGGGACCATTCAAAACAG GAGACCTTTGAGCTTCCGAGACTGGTCTCAGTTTTGGGACCATTCAAAACAG

B321 B321
TGAGACCAGTCTCGGAAGCTCAAAGGTCTCGTTTTAGAGCTATGCTGTTTTG TGAGACCAGTCTCGGAAGCTCAAAGGTCTCGTTTTAGAGCTATGCTGTTTTG

B352 B352
aaacTACTTTACGCAGCGCGGAGTTCGGTTTTTTg aaacTACTTTACGCAGCGCGGAGTTCGGTTTTTTg

B353 B353
aaaacAAAAAACCGAACTCCGCGCTGCGTAAGTA aaaacAAAAAACCGAACTCCGCGCTGCGTAAGTA

HC008_SP HC008_SP
ATGCCGGTACTGCCGGGCCTCTTGCGGGATTACGAAATCATCCTG ATGCCGGTACTGCCGGGCCTCTTGCGGGATTACGAAATCATCCTG

HC009_SP HC009_SP
GTAGACTGGCGATGCTGTCGGAATGGACGATCACACTACTCTTCTT GTAGACTGGCGATGCTGTCGGAATGGACGATCACACTACTCTTCTT

HC010_SP HC010_SP
TTAAGAAATAATCTTCATCTAAAATATACTTCAGTCACCTCCTAGCTGAC TTAAGAAATAATCTTCATCTAAAATATACTTCAGTCACCTCCTAGCTGAC

HC011_SP HC011_SP
ATTGATTTGAGTCAGCTAGGAGGTGACTGAAGTATATTTTAGATGAAG ATTGATTTGAGTCAGCTAGGAGGTGACTGAAGTATATTTTAGATGAAG

HC014_SP HC014_SP

HC015_SP HC015_SP

L403 L403
AGTCATCCCAGCAACAAATGG AGTCATCCCAGCAACAAATGG

L409 L409
CGTGGTAAATCGGATAACGTTCCAAGTGAAG CGTGGTAAATCGGATAACGTTCCAAGTGAAG

L422 L422
Tgctcttcttcacaaacaaggg Tgctcttcttcacaaacaaggg

L426 L426
AAGCCAAAGTTTGGCACCACC AAGCCAAAGTTTGGCACCACC

L430 L430
GTAGCTTATTCAGTCCTAGTGG GTAGCTTATTCAGTCCTAGTGG

L444 L444
CGTTTGTTGAACTAATGGGTGCAAATTACGAATCTTCTCCTGACG CGTTTGTTGAACTAATGGGTGCAAATTACGAATCTTCTCCTGACG

L445 L445
CGTCAGGAGAAGATTCGTAATTTGCACCCATTAGTTCAACAAACG CGTCAGGAGAAGATTCGTAATTTGCACCCATTAGTTCAACAAACG

L446 L446
GATATTATGGAGCCTATTTTTGTGGGTTTTTAGGCATAAAACTATATG GATATTATGGAGCCTATTTTTGTGGGTTTTTAGGCATAAAACTATATG

L447 L447
CATATAGTTTTATGCCTAAAAACCcACAAAAATAGGCTCCATAATATG CATATAGTTTTATGCCTAAAAACCcACAAAAATAGGCTCCATAATATG

L448 L448
ATTATTTCTTAATAACTAAAAATATGG ATTATTTCTTAATAACTAAAAATATGG

L457 L457
CGTgtacaattgccagcgcacggc CGTgtacaattgccagcgcacggc

L458 L458
GCACCGGTGATCACTAGTCCTAGG GCACCGGTGATCACTAGTCCTAGG

L459 L459
cctaggactagtgatcaccggtGCAAATATGAGCCAAATAAATATAT cctaggactagtgatcaccggtGCAAATATGAGCCAAATAAATATAT

L461 L461
GCCGTACGCTAGCAATTGTACACGTTTGTTGAACTAATGGGTGC GCCGTACGCTAGCAATTGTACACGTTTGTTGAACTAATGGGTGC

L481 L481
TTCAAATTTTCCCATTTGATTCTCC TTCAAATTTTCCCATTTGATTCTCC

L488 L488
CCATATTTTTAGTTATTAAGAAATAATACCAGCCATCAGTCACCTCC CCATATTTTTAGTTATTAAGAAATAATACCAGCCATCAGTCACCTCC

W256 W256
AGACGATTCAATAGACAATAAGG AGACGATTCAATAGACAATAAGG

W286 W286
GTTTTGGGACCATTCAAAACAGCATAGCTCTAAAACCTCGTAGAC GTTTTGGGACCATTCAAAACAGCATAGCTCTAAAACCTCGTAGAC

W287 W287
GCTATGCTGTTTTGAATGGTCCCAAAACcattattttaacacacgaggtg GCTATGCTGTTTTGAATGGTCCCAAAACcattattttaacacacgaggtg

W288 W288
GCTATGCTGTTTTGAATGGTCCCAAAACGCACCCATTAGTTCAACAAACG GCTATGCTGTTTTGAATGGTCCCAAAACGCACCCATTAGTTCAACAAACG

W326 W326
AATTCTTTTCTTCATCATCGGTC AATTCTTTTCTTCATCATCGGTC

Cebador Primer
Secuencia 5'-3' 5'-3 'sequence

W327 W327
AAGAAAGAATGAAGATTGTTCATG AAGAAAGAATGAAGATTGTTCATG

W341 W341
GGTACTAATCAAAATAGTGAGGAGG GGTACTAATCAAAATAGTGAGGAGG

W354 W354
GTTTTTCAAAATCTGCGGTTGCG GTTTTTCAAAATCTGCGGTTGCG

W355 W355
AAAAATTGAAAAAATGGTGGAAACAC AAAAATTGAAAAAATGGTGGAAACAC

W356 W356
ATTTCGTAAACGGTATCGGTTTCTTTTAAAGTTTTGGGACCATTCAAAACAGC ATTTCGTAAACGGTATCGGTTTCTTTTAAAGTTTTGGGACCATTCAAAACAGC

W357 W357
TTTAAAAGAAACCGATACCGTTTACGAAATGTTTTAGAGCTATGCTGTTTTGA TTTAAAAGAAACCGATACCGTTTACGAAATGTTTTAGAGCTATGCTGTTTTGA

W365 W365
AAACGGTATCGGTTTCTTTTAAATTCAATTGTTTTGGGACCATTCAAAACAGC AAACGGTATCGGTTTCTTTTAAATTCAATTGTTTTGGGACCATTCAAAACAGC

W366 W366
AATTGAATTTAAAAGAAACCGATACCGTTTGTTTTAGAGCTATGCTGTTTTGA AATTGAATTTAAAAGAAACCGATACCGTTTGTTTTAGAGCTATGCTGTTTTGA

W370 W370
GTTCCTTAAACCAAAACGGTATCGGTTTCTTTTAAATTC GTTCCTTAAACCAAAACGGTATCGGTTTCTTTTAAATTC

W371 W371
GAAACCGATACCGTTTTGGTTTAAGGAACAGGTAAAGGGCATTTAAC GAAACCGATACCGTTTTGGTTTAAGGAACAGGTAAAGGGCATTTAAC

W376 W376
CGATTTCAGCCATTGCCTCGTC CGATTTCAGCCATTGCCTCGTC

W377 W377
GCCTTTGACGAGGCAATGGCTGAAATCGNNNNNAAAAAGCGCAAGAAGAAATCAAC GCCTTTGACGAGGCAATGGCTGAAATCGNNNNNAAAAAGCGCAAGAAGAAATCAAC

W391 W391
TCCGTACAACCCACAACCCTGCTAGTGAGCGTTTTGGGACCATTCAAAACAGC TCCGTACAACCCACAACCCTGCTAGTGAGCGTTTTGGGACCATTCAAAACAGC

W392 W392
GCTCACTAGCAGGGTTGTGGGTTGTACGGAGTTTTAGAGCTATGCTGTTTTGA GCTCACTAGCAGGGTTGTGGGTTGTACGGAGTTTTAGAGCTATGCTGTTTTGA

W393 W393
TTGTTGCCACTCTTCCTTCTTTC TTGTTGCCACTCTTCCTTCTTTC

W397 W397
CAGGGTTGTGGGTTGTTGCGATGGAGTTAACTCCCATCTCC CAGGGTTGTGGGTTGTTGCGATGGAGTTAACTCCCATCTCC

W398 W398
GGGAGTTAACTCCATCGCAACAACCCACAACCCTGCTAGTG GGGAGTTAACTCCATCGCAACAACCCACAACCCTGCTAGTG

W403 W403
GTGGTATCTATCGTGATGTGAC GTGGTATCTATCGTGATGTGAC

W404 W404
TTACCGAAACGGAATTTATCTGC TTACCGAAACGGAATTTATCTGC

W405 W405
AAAGCTAGAGTTCCGCAATTGG AAAGCTAGAGTTCCGCAATTGG

W431 W431
GTGGGTTGTACGGATTGAGTTAACTCCCATCTCCTTC GTGGGTTGTACGGATTGAGTTAACTCCCATCTCCTTC

W432 W432
GATGGGAGTTAACTCAATCCGTACAACCCACAACCCTG GATGGGAGTTAACTCAATCCGTACAACCCACAACCCTG

W433 W433
GCTTCACCTATTGCAGCACCAATTGACCACATGAAGATAG GCTTCACCTATTGCAGCACCAATTGACCACATGAAGATAG

W434 W434
GTGGTCAATTGGTGCTGCAATAGGTGAAGCTAATGGTGATG GTGGTCAATTGGTGCTGCAATAGGTGAAGCTAATGGTGATG

W463 W463
CTAGATTTGTATTAATTTTGAGACATTATGCTTCACCTTC CTAGATTTGTATTAATTTTGAGACATTATGCTTCACCTTC

W464 W464
GCATAATGTCTCAAAATTAATACAAATCAGTGAAATCATG GCATAATGTCTCAAAATTAATACAAATCAGTGAAATCATG

W465 W465
GTTTTGGGACCATTCAAAACAGCATAGCTCTAAAACGTGACAGTAATATCAG GTTTTGGGACCATTCAAAACAGCATAGCTCTAAAACGTGACAGTAATATCAG

W466 W466
GTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAACGCTCACTAGCAGGGTTG GTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAACGCTCACTAGCAGGGTTG

W542 W542
ATACTTTACGCAGCGCGGAGTTCGGTTTTgTAGGAGTGGTAGTATATACACGAGTACAT ATACTTTACGCAGCGCGGAGTTCGGTTTTgTAGGAGTGGTAGTATATACACGAGTACAT


Tabla H. Diseño de construcciones de fijación como objetivo y edición usadas en este estudio .

Table H. Design of fixing constructions as objective and edition used in this study.

Construcciones de fijación como objetivo Construcciones de edición Fixation constructions as objective     Editing constructions

Nombre de cepas resultante s Cebadores usados para verificar genotipo editado Name of resulting strains s Primers used to verify edited genotype

Edición Edition
AND plantilla PCR izdo PCR ddcho Secuencia espaciadora PAM AND plantilla PCR A PCR B PCR C PCR SOEing AND template PCR left Right PCR Spacer sequence PAM AND template PCR A PCR B PCR C PCR SOEing

bgaAR > A bgaAR> A
crR6Rk W256/ W391 W392/L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 W403/W397 N398/W404 N/A W403/W404 JEN56 W403/W404 crR6Rk W256 / W391 W392 / L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 W403 / W397 N398 / W404 N / A W403 / W404 JEN56 W403 / W404

bgaA NE>AA bgaA NE> AA
crR6Rk W256/ W391 W392/L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 W403/W431 W432/W433 W434/W404 W403/W404 JEN60 _ W403/W404 crR6Rk W256 / W391 W392 / L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 W403 / W431 W432 / W433 W434 / W404 W403 / W404 JEN60 _ W403 / W404

ΔbgaA ΔbgaA
crR6Rk W256/ W391 W392/L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 B255/B256 B257/B258 N/A B255/B258 JEN52 W393/W405 crR6Rk W256 / W391 W392 / L403 GCTCACTAG CAGGGTTGT GGGTTGTAC GGA TGG R6 B255 / B256 B257 / B258 N / A B255 / B258 JEN52 W393 / W405

ΔsrtA ΔsrtA
crR6Rc W256/B 218 B2177/L403 TCCTAGCAG GATTTCTGAT ATTACTGTCA C TGG R6 B230/W463 W464/B229 N/A B230/B229 JEN51 W422/W426 crR6Rc W256 / B 218 B2177 / L403 TCCTAGCAG GATTTCTGAT ATTACTGTCA C TGG R6 B230 / W463 W464 / B229 N / A B230 / B229 JEN51 W422 / W426

ermB interru p. ermB interru p.
crR6Rk W256/ W356 W357/L403 TTTAAAAGAA ACCGATACC GTTTACGAAA T TGG JEN38 L422/W370 W371/L426 N/A L422/L426 _ JEN43 L457/L458 crR6Rk W256 / W356 W357 / L403 TTTAAAAGAA ACCGATACC GTTTACGAAA T TGG JEN38 L422 / W370 W371 / L426 N / A L422 / L426 _ JEN43 L457 / L458

ΔsrtA ΔbgaA ΔsrtA ΔbgaA
JEN51 (para PCR izdo) y JEN52 (para PCR ddcho) W256/ W465 W466/W403 igual que las usadas para ΔsrtA y ΔbgaA TGG igual que las usadas para ΔsrtA y ΔbgaA JEN64 igual que las usadas para ΔsrtA y ΔbgaA JEN51 (for left hand PCR) and JEN52 (for right hand PCR) W256 / W465 W466 / W403 same as those used for ΔsrtA and ΔbgaA TGG same as those used for ΔsrtA and ΔbgaA JEN64 same as those used for ΔsrtA and ΔbgaA

Ejemplo 6: Optimización del ARN guía para Cas9 de Streptococcus pyogenes (referido como SpCas9). Example 6: Optimization of the guide RNA for Cas9 of Streptococcus pyogenes (referred to as SpCas9).

Los solicitantes mutaron las secuencias ARNtracr y de repetición directa o mutaron el ARN guía quimérico para activar los ARN en las células. Applicants mutated the RNAtracr and direct repeat sequences or mutated the chimeric guide RNA to activate the RNAs in the cells.

La optimización se basa en la observación de que hay tramos de timinas (Ts) en el ARNtracr y ARN guía, que podían conducir a terminación de la transcripción temprana por el activador pol 3. Por lo tanto, los Solicitantes generaron las siguientes secuencias optimizadas. Se presentan en parejas ARNtracr optimizada y la repetición directa optimizada correspondiente. The optimization is based on the observation that there are stretches of thymine (Ts) in the RNAtracr and guide RNA, which could lead to early transcription termination by the pol 3 activator. Therefore, the Requesters generated the following optimized sequences. They are presented in optimized ARNtracr pairs and the corresponding optimized direct repeat.

ARNtracr optimizado 1 (mutación subrayada): Optimized ARNtracr 1 (underlined mutation):

Repetición directa optimizada 1 (mutación subrayada): Optimized direct repeat 1 (underlined mutation):

ARNtracr optimizado 2 (mutación subrayada): Optimized ARNtracr 2 (underlined mutation):

15 Repetición directa optimizada 2 (mutación subrayada): 15 Optimized direct repeat 2 (underlined mutation):

Los solicitantes también optimizaron el ARN guía quimérico para actividad óptima en células eucariotas. ARN guía original : Applicants also optimized the chimeric guide RNA for optimal activity in eukaryotic cells. Original guide RNA:

20 Secuencia de ARN guía quimérico optimizado 1: 20 Stream of optimized chimeric guide RNA 1:

Secuencia de ARN guía quimérico optimizado 2: Sequence of optimized chimeric guide RNA 2:

Secuencia de ARN guía quimérico optimizado 3: Stream of optimized chimeric guide RNA 3:

expresar una de las cuatro formas de ARN mostradas anteriormente. El objetivo del ARN guía es el mismo sitio objetivo en el lugar Emx1 humano: "GTCACCTCCAATGACTAGGG". express one of the four forms of RNA shown above. The objective of the guide RNA is the same target site in the human Emx1 site: "GTCACCTCCAATGACTAGGG".

Ejemplo 7: Optimización de Cas9 CRISPR1 LMD-9 de Streptococcus thermophilus (referido como StlCas9). Example 7: Optimization of Cas9 CRISPR1 LMD-9 of Streptococcus thermophilus (referred to as StlCas9).

Los solicitantes diseñaron los ARN quiméricos guía como se muestra en la Figura 4. Applicants designed the guide chimeric RNAs as shown in Figure 4.

Los ARN guía de StlCas9 pueden experimentar el mismo tipo de optimización que para los ARN guía de SpCas9, por rotura de los tramos de politiminas (Ts). The guide RNAs of StlCas9 may undergo the same type of optimization as for the guide RNAs of SpCas9, due to rupture of the polyimine (Ts) sections.

Ejemplo 8: Diversidad de Cas9 y mutaciones. Example 8: Diversity of Cas9 and mutations.

El sistema CRISPR-Cas es un mecanismo inmunitario adaptativo contra ADN exógeno invasor empleado por diversas especies a través de bacterias y arqueas. El sistema CRISPR-Cas9 de tipo II consiste en una serie de genes que codifica proteínas responsables de la “adquisición” de ADN extraño en el lugar CRISPR, así como una serie de genes que codifica la “ejecución” del mecanismo de escisión de ADN; estos incluyen la ADN nucleasa (Cas9), un ARN-cr de transactivación no codificante (ARNtracr) y una matriz de espaciadores procedentes de ADN extraño flanqueados por repeticiones directas (los ARNcr). En la maduración por Cas9, el dúplex de ARNtracr y ARNcr guía la nucleasa Cas9 para una secuencia de ADN fijada como objetivo especificada por las secuencias guía espaciadoras y media roturas de doble cadena en el ADN cerca de una unidad de secuencia corta en el ADN fijado como objetivo que se requiere para escisión y es específico para cada sistema CRISPR-Cas. Los sistemas CRISPR-Cas de tipo II se encuentran por todo el reino bacteriano y son muy diversos en secuencia y tamaño de la proteína Cas9, secuencia de repetición directa de ARNtracr y ARNcr, organización de genomas de estos elementos y el requerimiento de unidad para escisión fijada como objetivo. Una especie puede presentar múltiples sistemas CRISPR-Cas distintos. The CRISPR-Cas system is an adaptive immune mechanism against invasive exogenous DNA used by various species through bacteria and archaea. The CRISPR-Cas9 type II system consists of a series of genes that encode proteins responsible for the "acquisition" of foreign DNA at the CRISPR site, as well as a series of genes that encode the "execution" of the DNA cleavage mechanism; these include the DNA nuclease (Cas9), a non-coding transactivation RNA-cr (RNAcr) and an array of spacers from foreign DNA flanked by direct repeats (the rRNAs). In maturation by Cas9, the duplex of ARNtracr and cRNA guides the Cas9 nuclease for a target DNA sequence specified by the spacer guide sequences and half double strand breaks in the DNA near a short sequence unit in the fixed DNA. as an objective that is required for excision and is specific to each CRISPR-Cas system. Type II CRISPR-Cas systems are found throughout the bacterial kingdom and are very diverse in sequence and size of the Cas9 protein, direct repeat sequence of ARNtracr and RNAcr, genome organization of these elements and the requirement of unit for excision set as objective. A species can have multiple different CRISPR-Cas systems.

Los solicitantes evaluaron 207 Cas9s putativas de especies bacterianas identificadas basándose en homología de secuencias para conocer Cas9s y estructuras ortólogas para conocer subdominios, incluyendo el dominio de la endonucleasa HNH y los dominios de endonucleasa RuvC [información de the Eugene Koonin and Kira Makarova]. El análisis filogenético basado en la conservación de secuencias de proteínas de este conjunto reveló cinco familias de Cas9s, incluyendo tres grupos de Cas9s grandes (∼1.400 aminoácidos) y dos de Cas9s pequeños (∼1.100 aminoácidos) (Figuras 39 y 40A-F). Applicants evaluated 207 putative Cas9s of bacterial species identified based on sequence homology to know Cas9s and orthologous structures to know subdomains, including the HNH endonuclease domain and RuvC endonuclease domains [information from the Eugene Koonin and Kira Makarova]. Phylogenetic analysis based on the conservation of protein sequences of this set revealed five families of Cas9s, including three large Cas9s groups (.41,400 amino acids) and two small Cas9s (∼1,100 amino acids) (Figures 39 and 40A-F).

En este ejemplo, los solicitantes muestran que las siguientes mutaciones pueden convertir SpCas9 en una enzima de mellado: D10A, E762A, H840A, N854A, N863A, D986A. In this example, applicants show that the following mutations can convert SpCas9 into a nicking enzyme: D10A, E762A, H840A, N854A, N863A, D986A.

Los solicitantes proporcionan secuencias que muestran donde se sitúan los puntos de mutación dentro del gen SpCas9 (Figura 41). Los solicitantes muestran también que las nickasas aún pueden mediar la recombinación homóloga (Prueba indicada en la Figura 2). Además, los solicitantes muestran que SpCas9 con estas mutaciones (individualmente) no inducen doble rotura de cadena (Figura 47). Applicants provide sequences that show where the mutation points are located within the SpCas9 gene (Figure 41). Applicants also show that nickases can still mediate homologous recombination (Test indicated in Figure 2). In addition, applicants show that SpCas9 with these mutations (individually) does not induce double chain breakage (Figure 47).

Ejemplo 9: Suplemento para especificidad de fijación como objetivo de ADN de la nucleasa Cas9 guiada por ARN. Example 9: Supplement for binding specificity as a target of RNA-guided Cas9 nuclease DNA.

Cultivo celular y transinfección. Cell culture and transfection.

Se mantuvo la estirpe celular 293FT (Life Technologies) de riñón embriónico humano (HEK) en medio Eagle modificado de Dulbecco (DMEM) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación con CO2 al 5%. The human embryonic kidney (HEK) cell line 293FT (Life Technologies) was maintained in Dulbecco's modified Eagle's medium (DMEM) enriched with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml of penicillin and 100 µg / ml of streptomycin at 37 ° C with incubation with 5% CO2.

Se sembraron células 293FT en placas de 6 pozos, placas de 24 pozos o placas de 96 pozos (Corning) 24 horas previas a transinfección. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) a confluencia del 80-90% siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 6 pozos, se usó un total de 1 ug de plásmido Cas9+ARNsg. Para cada pozo de una placa de 24 pozos, se usó un total de 500 ng de plásmido Cas9+ARNsg a menos que se indicara de otro modo. Para cada pozo de una placa de 96 pozos, se usaron 65 ng de plásmido Cas9 a una relación molar de 1:1 para el producto PCR de U6-ARNsg. 293FT cells were seeded in 6-well plates, 24-well plates or 96-well plates (Corning) 24 hours prior to transfection. Cells were transinfected using Lipofectamine 2000 (Life Technologies) at 80-90% confluence following the protocol recommended by the manufacturer. For each well of a 6-well plate, a total of 1 ug of Cas9 + RNAs plasmid was used. For each well of a 24-well plate, a total of 500 ng of Cas9 + RNAs plasmid was used unless otherwise indicated. For each well of a 96-well plate, 65 ng of Cas9 plasmid was used at a 1: 1 molar ratio for the U6-RNAsg PCR product.

Se mantuvo estirpe de células madre embrionarias humanas HUES9 (núcleo del instituto de células madre de Harvard) en condiciones exentas de alimentador en GelTrex (Life Technologies) en medio mTesR (Stemcell Technologies) enriquecido con 100 ug/ml de Normocina (InvivoGen). Se transinfectaron células HUES9 con estuche Amaxa P3 Primary Cell 4-D Nucleofector (Lonza) siguiendo el protocolo del fabricante. Lineage of human embryonic stem cells HUES9 (core of the Harvard stem cell institute) was maintained under feeder-free conditions at GelTrex (Life Technologies) in mTesR medium (Stemcell Technologies) enriched with 100 ug / ml Normocin (InvivoGen). HUES9 cells were transinfected with Amaxa P3 Primary Cell 4-D Nucleofector (Lonza) case following the manufacturer's protocol.

Prueba de la nucleasa SURVEYOR para modificación de genomas. SURVEYOR nuclease test for genome modification.

Se transinfectaron células 293FT con ADN de plásmido como se describió anteriormente. Se incubaron las células a 37°C durante 72 horas postransinfección previamente a extracción de ADN genómico. Se extrajo ADN genómico usando la disolución de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células granuladas en disolución QuickExtract y se incubaron a 65°C durante 15 minutos y 98°C durante 10 minutos. 293FT cells were transinfected with plasmid DNA as described above. Cells were incubated at 37 ° C for 72 hours post-infection prior to genomic DNA extraction. Genomic DNA was extracted using the QuickExtract DNA extraction solution (Epicenter) following the manufacturer's protocol. In summary, the granulated cells were resuspended in QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes.

La región genómica flanqueando el sitio fijado como objetivo de CRISPR para cada gen se multiplicó por PCR (cebadores enumerados en las Tablas J y K) y se purificaron los productos usando Columna QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezclaron 400 ng totales de los productos PCR purificados con 2 µl de tampón PCR de ADN polimerasa 10X Taq (Enzymatics) y agua ultrapura a un volumen final de 20 µl y se sometió a un procedimiento de hibridación de nuevo para permitir la formación de heterodúplex: 95°C durante 10 min, 95°C a 85°C variando a -2°C/s, 85°C a 25°C a -0,25°C/s y se mantuvieron 25°C durante 1 minuto. Después de hibridar de nuevo, los productos se trataron con nucleasa SURVEYOR y activador S SURVEYOR (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaron en geles de poliacrilamida Novex TBE al 4-20% (Life Technologies). Se tiñeron los geles con tinte de ADN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Doc (Bio-rad). La cuantificación se basó en intensidades de banda relativas. The genomic region flanking the CRISPR target site for each gene was multiplied by PCR (primers listed in Tables J and K) and the products were purified using QiaQuick Spin Column (Qiagen) following the manufacturer's protocol. Total 400 ng of the purified PCR products were mixed with 2 µl of 10X Taq DNA polymerase PCR buffer (Enzymatics) and ultrapure water to a final volume of 20 µl and subjected to a hybridization procedure again to allow heteroduplex formation : 95 ° C for 10 min, 95 ° C to 85 ° C varying at -2 ° C / s, 85 ° C at 25 ° C at -0.25 ° C / s and 25 ° C were maintained for 1 minute. After hybridizing again, the products were treated with SURVEYOR nuclease and S SURVEYOR activator (Transgenomics) following the manufacturer's recommended protocol and analyzed in Novex TBE 4-20% polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA dye (Life Technologies) for 30 minutes and images were formed with a Doc gel imaging system (Bio-rad). The quantification was based on relative band intensities.

Análisis de Northern de expresión de ARNtracr en células humanas. Northern analysis of RNAcrcr expression in human cells.

Se realizaron análisis Northern como se describió previamente 1. En resumen, se calentaron los ARN a 95°C durante 5 min antes de la carga en geles de poliacrilamida desnaturalizadantes al 8% (SequaGel, National Diagnostics). Después, se transfirió el ARN a una membrana Hybond N+ prehibridada (GE Healthcare) y se reticuló con reticulador de UV Stratagene (Stratagene). Se etiquetaron las sondas con [gamma-32P] ATP (Perkin Elmer) con T4 polinucleótido cinasa (New England Biolabs). Después de lavado, se expuso la membrana a pantalla de fósforo durante una hora y se escaneó con fosforimager (Typhoon). Northern analyzes were performed as previously described 1. In summary, the RNAs were heated at 95 ° C for 5 min before loading in 8% denatured polyacrylamide gels (SequaGel, National Diagnostics). Then, the RNA was transferred to a pre-hybridized Hybond N + membrane (GE Healthcare) and crosslinked with Stratagene UV crosslinker (Stratagene). The probes were labeled with [gamma-32P] ATP (Perkin Elmer) with T4 polynucleotide kinase (New England Biolabs). After washing, the membrane was exposed to phosphor screen for one hour and scanned with phosphorimager (Typhoon).

Secuenciación de bisulfito para valorar estado de metilación de ADN. Bisulfite sequencing to assess DNA methylation status.

Se transinfectaron células 293FT HEK con Cas9 como se describió anteriormente. Se aisló ADN genómico con el estuche DNeasy Blood & Tissue (Qiagen) y bisulfito convertido con estuche EZ DNA Methylation-Lightning (Zymo Research). Se llevó a cabo PCR con bisulfito usando ADN polimerasa KAPA2G Robust HotStart (KAPA Biosystems) con cebadores diseñados usando el buscador de cebadores de bisulfito (Zymo Research, Tablas J y K). Los amplicones PCR resultantes se purificaron en gel, se digirieron con EcoRI y HindIII y se ligaron en una cadena principal de pUC19 previamente a transformación. Los clones individuales fueron sometidos a secuenciación de Sanger para valorar el estado de metilacion de ADN. 293FT HEK cells were transinfected with Cas9 as described above. Genomic DNA was isolated with the DNeasy Blood & Tissue (Qiagen) case and bisulfite converted with EZ DNA Methylation-Lightning (Zymo Research) case. Bisulfite PCR was performed using KAPA2G Robust HotStart DNA polymerase (KAPA Biosystems) with primers designed using the bisulfite primer finder (Zymo Research, Tables J and K). The resulting PCR amplicons were gel purified, digested with EcoRI and HindIII and ligated into a pUC19 backbone prior to transformation. The individual clones were subjected to Sanger sequencing to assess the state of DNA methylation.

Prueba de transcripción y escisión in vivo. In vivo transcription and excision test.

Se transinfectaron células 293FT HEK con Cas9 como se describió anteriormente. Se prepararon después lisados celulares completos con un tampón de lisis (HEPES 20 mM, KCl 100 mM, MgCl2 5 mM, DTT 1 mM, glicerol al 5%, Tritón X-100 al 0,1%) enriquecido con cóctel de inhibidores de proteasas (Roche). Se transcribió ARNsg conducido por T7 in vitro usando oligos modificados (Ejemplo 10) y estuche de transcripción in vitro de T7 HiScribe (NEB), siguiendo el protocolo recomendado por el fabricante. Para preparar sitios fijados como objetivo metilados, se metiló plásmido de pUC19 por M.SssI y después se linearizó por NheI. Se realizó la prueba de escisión in vitro como sigue: para una reacción de escisión de 20 ul, se incuban 10 ul de lisado celular con 2 ul de tampón de escisión (HEPES 100 mM, KCl 500 mM, MgCl2 25 mM, DTT 5 mM, glicerol al 25%), el ARN transcrito in vitro y 300 ng de ADN de plásmido de pUC19. 293FT HEK cells were transinfected with Cas9 as described above. Complete cell lysates were then prepared with a lysis buffer (20 mM HEPES, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% glycerol, 0.1% Triton X-100) enriched with protease inhibitor cocktail (Roche). T7-driven RNAs was transcribed in vitro using modified oligos (Example 10) and T7 HiScribe in vitro transcription kit (NEB), following the manufacturer's recommended protocol. To prepare methylated target sites, pUC19 plasmid was methylated by M.SssI and then linearized by NheI. The in vitro excision test was performed as follows: for a 20 ul excision reaction, 10 ul of cell lysate is incubated with 2 ul excision buffer (100 mM HEPES, 500 mM KCl, 25 mM MgCl2, 5 mM DTT , 25% glycerol), RNA transcribed in vitro and 300 ng of plasmid DNA from pUC19.

Secuenciación profunda para valorar la especificidad de la fijación como objetivo. Deep sequencing to assess the specificity of the fixation as an objective.

Se transinfectaron células 293FT HEK en placas de 96 pozos con ADN de plásmido Cas9 y casete PCR de ARN de una sola guía (ARNsg) 72 horas previas a extracción de ADN genómico (Fig. 72). La región genómica que flanquea el sitio fijado como objetivo de CRISPR para cada gen se multiplicó (Fig. 74, Fig. 80, (Ejemplo 10) por un método PCR de fusión para unir los adaptadores Illumina P5 así como códigos de barras específicos de una muestra única para los amplicones fijados como objetivo (esquema descrito en la Fig. 73). Se purificaron los productos PCR usando placas de filtro del 96 pozos EconoSpin (Epoch Life Sciences) siguiendo el protocolo recomendado por el fabricante. 293FT HEK cells were transinfected in 96-well plates with Cas9 plasmid DNA and single guide RNA (CasRG) PCR cassette 72 hours prior to genomic DNA extraction (Fig. 72). The genomic region flanking the CRISPR target site for each gene was multiplied (Fig. 74, Fig. 80, (Example 10) by a fusion PCR method to join Illumina P5 adapters as well as specific barcodes of a single sample for the amplicons set as the target (scheme described in Fig. 73) PCR products were purified using EconoSpin 96 well filter plates (Epoch Life Sciences) following the manufacturer's recommended protocol.

Se cuantificaron las muestras de ADN codificadas por barras y purificadas mediante el estuche de prueba de ADNdc Quant-iT PicoGreen o Fluorómetro Qubit 2.0 (Life Technologies) y se mezclaron en una relación equimolar. Se secuenciaron después en profundidad bibliotecas de secuenciación con el secuenciador personal MiSeq (Life Technologies). Bar-coded and purified DNA samples were quantified using the Quant-iT PicoGreen dsDNA test kit or Qubit 2.0 Fluorometer (Life Technologies) and mixed in an equimolar relationship. Sequencing libraries were then sequenced in depth with the MiSeq personal sequencer (Life Technologies).

Análisis de datos de secuenciación y detección de Indel. Analysis of sequencing data and detection of Indel.

Se filtraron lecturas de MiSeq requiriendo una calidad promedio Phred (puntuación Q) de al menos 23, así como igualaciones perfectas de secuencias para cebadores directos de códigos de barras y amplicones. Se analizaron las lecturas de los lugares en y fuera del objetivo realizando primero alineamientos de Smith-Waterman frente a secuencias de amplicones que incluían 50 nucleótidos aguas arriba y aguas abajo del sitio fijado como objetivo (un total de 120 pb). Se analizaron los indel en alineamientos, mientras tanto, de 5 nucleótidos aguas arriba a 5 nucleótidos aguas abajo del sitio fijado como objetivo (un total de 30 pb). Se desecharon las regiones fijadas como objetivo analizadas si parte de su alineamiento caía fuera de la propia lectura de MiSeq o si los pares de bases MiSeq readings were filtered requiring an average Phred quality (Q score) of at least 23, as well as perfect sequence matches for direct barcode and amplicon primers. The readings of the places on and off the target were analyzed by first making Smith-Waterman alignments against amplicon sequences that included 50 nucleotides upstream and downstream of the target site (a total of 120 bp). Indel were analyzed in alignments, meanwhile, from 5 nucleotides upstream to 5 nucleotides downstream from the target site (a total of 30 bp). The target regions analyzed were discarded if part of their alignment fell outside of MiSeq's own reading or if the base pairs

5 igualados comprendían menos del 85% de su longitud total. 5 matched comprised less than 85% of its total length.

Los controles negativos para cada muestra proporcionaron una medida para la inclusión o exclusión de los indel como casos de corte putativos. Para cada muestra, se contó un indel sólo si su puntuación de calidad excedía de µσ, donde µ era la puntuación de calidad media del control negativo que correspondía a esa muestra y σ era la desviación estándar del mismo. Esto proporcionó tasas de indel de región de objetivo total para tanto los controles Negative controls for each sample provided a measure for the inclusion or exclusion of indel as putative cut-off cases. For each sample, an indel was counted only if its quality score exceeded µσ, where µ was the average quality score of the negative control corresponding to that sample and σ was its standard deviation. This provided total target region indel rates for both controls.

10 negativos como sus correspondientes muestras. Usando la tasa de error por región de objetivo por lectura del control negativo, q, el recuento de indel observado de la muestra n y su recuento de lectura R, una estimación probablemente máxima para la fracción de lecturas con regiones de objetivo con los indel verdaderos, P, se derivó por aplicación de un modelo de error binomial, como sigue. 10 negatives as their corresponding samples. Using the error rate per target region per reading of the negative control, q, the observed indel count of the sample n and its reading count R, a probably maximum estimate for the fraction of readings with target regions with the true indel, P, was derived by application of a binomial error model, as follows.

Suponiendo que el número (desconocido) de lecturas en una muestra con regiones fijadas como objetivo contadas Assuming that the (unknown) number of readings in a sample with target regions counted

15 de manera incorrecta que tiene al menos 1 indel es E, se puede escribir (sin presumir acerca del número de los indel verdaderos) 15 incorrectly that has at least 1 indel is E, you can write (without presuming about the number of true indel)

puesto de R(1-p) es el número de lecturas que tiene regiones fijadas como objetivo sin indel verdadero. Mientras tanto, debido a que el número de lecturas que se observa que presenta indel es n, n=E+Rp, en otras palabras, el R position (1-p) is the number of readings that have regions set as targets without true indel. Meanwhile, because the number of readings that are observed to be indel is n, n = E + Rp, in other words, the

20 número de lecturas que tiene regiones fijadas como objetivo con error, pero no tienen indel verdadero más el número de lecturas cuyas regiones fijadas como objetivo tienen correctamente indel. Se puede volver a escribir entonces lo anterior: 20 number of readings that have regions set as target with error, but have no true indel plus the number of readings whose regions set as target have correctly indel. The above can be rewritten:

Tomando todos los valores de la frecuencia de regiones fijadas como objetivo con P inserciones o supresiones Taking all frequency values of target regions with P insertions or deletions

25 verdaderas que sean igualmente probables a priori, Prob(n|p) ∝ Prob(p|n). La estimación de probabilidad máxima (EPM) para la frecuencia de regiones fijadas como objetivo con inserciones o supresiones verdaderas se fijó por lo tanto como el valor de P que hizo máxima la Prob(n|p). Esto se evaluó de manera numérica. 25 true that are equally probable a priori, Prob (n | p) ∝ Prob (p | n). The maximum probability estimate (EPM) for the frequency of target regions with true insertions or deletions was therefore set as the value of P that maximized the Prob (n | p). This was evaluated numerically.

Para poner límites de error en las frecuencias de lectura de inserción o supresión verdadera en las propias bibliotecas de secuenciación, se calcularon los intervalos de puntuación de Wilson (2) para cada muestra, To set error limits on the actual insertion or deletion read frequencies in the sequencing libraries themselves, the Wilson score intervals (2) were calculated for each sample,

30 proporcionando la estimación de EPM para regiones fijadas como objetivo de inserción o supresión verdadera, Rp y el número de lecturas R. De manera explícita, el límite inferior l y el límite superior u se calcularon como: 30 providing the EPM estimate for regions set as the true insertion or suppression target, Rp and the number of readings R. Explicitly, the lower limit l and the upper limit u were calculated as:

donde z, la puntuación estándar para la confianza requerida de la distribución normal de la varianza 1, se fijó en where z, the standard score for the required confidence of the normal distribution of variance 1, was set at

35 1,96, que significa una confianza del 95%. Los límites superiores máximos y los límites inferiores mínimos para cada replicado biológico se enumeran en las Figs. 80-83. 35 1.96, which means 95% confidence. The maximum upper limits and the minimum lower limits for each biological replicate are listed in Figs. 80-83.

Análisis qRT-PCR de expresión relativa de Cas9 y ARNsg. QRT-PCR analysis of relative expression of Cas9 and RNAsg.

Se transinfectaron células 293FT puestas en placas de 24 pozos como se describió anteriormente. 72 horas postransinfección, se recogió ARN total con microestuche miRNeasy (Qiagen). Se realizó síntesis de cadena inversa 293FT cells placed in 24-well plates were transinfected as described above. 72 hours post-infection, total RNA was collected with miRNeasy micro-kit (Qiagen). Reverse chain synthesis was performed

40 para los ARNsg con estuche de ADNc qScript Flex (VWR) y cebadores de síntesis de primera cadena modificados (Tablas J y K). Se realizó análisis qPCR con mezclador maestro verde de Fast SYBR (Life Technologies) y cebadores modificados (Tablas J y K), usando GAPDH como un control endógeno. Se calculó la cuantificación relativa por el método ΔΔCT. 40 for siRNAs with qScript Flex cDNA kit (VWR) and modified first chain synthesis primers (Tables J and K). QPCR analysis was performed with Fast SYBR green master mixer (Life Technologies) and modified primers (Tables J and K), using GAPDH as an endogenous control. The relative quantification was calculated by the ΔΔCT method.

Tabla I | Secuencias del sitio fijado como objetivo. Sitios fijados como objetivo ensayados para sistema CRISPR de Table I | Sequences of the site set as objective. Target sites tested for CRISPR system

45 tipo II de S. pyogenes con la PAM requisito. Se transinfectaron células con Cas9 y ARNcr-ARNtracr o ARNsg quimérico para cada objetivo. 45 type II of S. pyogenes with the PAM requirement. Cells were transinfected with Cas9 and RNAcr-RNAcrcr or chimeric siRNA for each objective.

ID sitio fijado objetivo Target set site ID
como Objetivo genómico Secuencia del sitio fijado como objetivo (5' a 3') PAM Cadena how Genomic target Sequence of the target site (5 'to 3') PAM Chain

1 one
EMX1 GTCACCTCCAATGACTAGGG TGG + EMX1 GTCACCTCCAATGACTAGGG TGG +

2 2
EMX1 GACATCGATGTCCTCCCCAT TGG - EMX1 GACATCGATGTCCTCCCCAT TGG -

3 3
EMX1 GAGTCCGAGCAGAAGAAGAA GGG + EMX1 GAGTCCGAGCAGAAGAAGAA GGG +

6 6
EMX1 GCGCCACCGGTTGATGTGAT GGG - EMX1 GCGCCACCGGTTGATGTGAT GGG -

10 10
EMX1 GGGGCACAGATGAGAAACTC AGG - EMX1 GGGGCACAGATGAGAAACTC AGG -

11 eleven
EMX1 GTACAAACGGCAGAAGCTGG AGG + EMX1 GTACAAACGGCAGAAGCTGG AGG +

12 12
EMX1 GGCAGAAGCTGGAGGAGGAA GGG + EMX1 GGCAGAAGCTGGAGGAGGAA GGG +

13 13
EMX1 GGAGCCCTTCTTCTTCTGCT CGG - EMX1 GGAGCCCTTCTTCTTCTGCT CGG -

14 14
EMX1 GGGCAACCACAAACCCACGA GGG + EMX1 GGGCAACCACAAACCCACGA GGG +

15 fifteen
EMX1 GCTCCCATCACATCAACCGG TGG + EMX1 GCTCCCATCACATCAACCGG TGG +

16 16
EMX1 GTGGCGCATTGCCACGAAGC AGG + EMX1 GTGGCGCATTGCCACGAAGC AGG +

17 17
EMX1 GGCAGAGTGCTGCTTGCTGC TGG + EMX1 GGCAGAGTGCTGCTTGCTGC TGG +

18 18
EMX1 GCCCCTGCGTGGGCCCAAGC TGG + EMX1 GCCCCTGCGTGGGCCCAAGC TGG +

19 19
EMX1 GAGTGGCCAGAGTCCAGCTT GGG - EMX1 GAGTGGCCAGAGTCCAGCTT GGG -

20 twenty
EMX1 GGCCTCCCCAAAGCCTGGCC AGG - EMX1 GGCCTCCCCAAAGCCTGGCC AGG -

4 4
PVALB GGGGCCGAGATTGGGTGTTC AGG + PVALB GGGGCCGAGATTGGGTGTTC AGG +

5 5
PVALB GTGGCGAGAGGGGCCGAGAT TGG + PVALB GTGGCGAGAGGGGCCGAGAT TGG +

1 one
SERPINB5 GAGTGCCGCCGAGGCGGGGC GGG + SERPINB5 GAGTGCCGCCGAGGCGGGGC GGG +

2 2
SERPINB5 GGAGTGCCGCCGAGGCGGGG CGG + SERPINB5 GGAGTGCCGCCGAGGCGGGG CGG +

3 3
SERPINB5 GGAGAGGAGTGCCGCCGAGG CGG + SERPINB5 GGAGAGGAGTGCCGCCGAGG CGG +

Tabla J | Secuencias de cebadores Table J | Primer Sequences

Prueba SURVEYOR SURVEYOR test

nombre del cebador objetivo genómico secuencia cebadora (5' a 3') primer name genomic target primer sequence (5 'to 3')

Sp-EMX1-F1 EMX1 AAAACCACCCTTCTCTCTGGC Sp-EMX1-F1 EMX1 AAAACCACCCTTCTCTCTGGC

Sp-EMX1-R1 EMX1 GGAGATTGGAGACACGGAGAG Sp-EMX1-R1 EMX1 GGAGATTGGAGACACGGAGAG

Sp-EMX1-F2 EMX1 CCATCCCCTTCTGTGAATGT Sp-EMX1-F2 EMX1 CCATCCCCTTCTGTGAATGT

Sp-EMX1-R2 EMX1 GGAGATTGGAGACACGGAGA Sp-EMX1-R2 EMX1 GGAGATTGGAGACACGGAGA

Sp-PVALB-F PVALB CTGGAAAGCCAATGCCTGAC Sp-PVALB-F PVALB CTGGAAAGCCAATGCCTGAC

Sp-PVALB-R PVALB GGCAGCAAACTCCTTGTCCT Sp-PVALB-R PVALB GGCAGCAAACTCCTTGTCCT

qRT-PCR para expresión de Cas9 y ARNsg qRT-PCR for Cas9 and RNAsg expression

nombre del cebador secuencia cebadora (5' a 3') primer name     primer sequence (5 'to 3')

síntesis de cadena inversa de ARNsg AAGCACCGACTCGGTGCCAC reverse strand RNA synthesis     AAGCACCGACTCGGTGCCAC

F qPCR ARNsg EMX1.1 TCACCTCCAATGACTAGGGG F qPCR ARNsg EMX1.1     TCACCTCCAATGACTAGGGG

R qPCR ARNsg EMX1.1 CAAGTTGATAACGGACTAGCCT R qPCR ARNsg EMX1.1     CAAGTTGATAACGGACTAGCCT

F qPCR ARNsg EMX1.3 AGTCCGAGCAGAAGAAGAAGTTT F qPCR RNAsg EMX1.3     AGTCCGAGCAGAAGAAGAAGTTT

R qPCR ARNsg EMX1.3 TTTCAAGTTGATAACGGACTAGCCT R qPCR ARNsg EMX1.3     TTTCAAGTTGATAACGGACTAGCCT

F qPCR Cas9 AAACAGCAGATTCGCCTGGA F qPCR Cas9     AAACAGCAGATTCGCCTGGA

Prueba SURVEYOR SURVEYOR test

nombre del cebador objetivo genómico secuencia cebadora (5' a 3') primer name genomic target primer sequence (5 'to 3')

R qPCR Cas9 TCATCCGCTCGATGAAGCTC R qPCR Cas9     TCATCCGCTCGATGAAGCTC

F qPCR GAPDH TCCAAAATCAAGTGGGGCGA F qPCR GAPDH     TCCAAAATCAAGTGGGGCGA

R qPCR GAPDH TGATGACCCTTTTGGCTCCC R qPCR GAPDH     TGATGACCCTTTTGGCTCCC

PCR con bisulfito y secuenciación Bisulfite PCR and sequencing

nombre del cebador secuencia de cebador (5' a 3') primer name primer sequence (5 'to 3')

F PCR con bisulfito (lugar SERPINB5) F bisulfite PCR (SERPINB5 site)

R PCR con bisulfito (lugar SERPINB5) R PCR with bisulfite (SERPINB5 site)

secuenciación pUC19 pUC19 sequencing
CAGGAAACAGCTATGAC CAGGAAACAGCTATGAC

Tabla K | Secuencias para cebadores para ensayar la arquitectura de ARNsg. Los cebadores se hibridan a la cadena inversa del activador U6 a menos que se indique de otro modo. El sitio para cebar U6 está en cursiva, la secuencia guía se indica como un tramo de N, la secuencia repetida directa se destaca en negrita y subrayada la secuencia de ARNtracr. La estructura secundaria de cada arquitectura de ARNsg se muestra en la Fig. 43. K table | Sequences for primers to test the architecture of RNAsg. The primers hybridize to the reverse chain of activator U6 unless otherwise indicated. The site for priming U6 is in italics, the guide sequence is indicated as a stretch of N, the direct repeated sequence is highlighted in bold and the RNAcrcr sequence is underlined. The secondary structure of each rRNA architecture is shown in Fig. 43.

nombre del cebador primer name
secuencia cebadora (5' a 3') primer sequence (5 'to 3')

Directo U6 Direct U6
GCCTCTAGAGGTACCTGAGGGCCTATTTCCCATGATTCC GCCTCTAGAGGTACCTGAGGGCCTATTTCCCATGATTCC

I: ARNsg (DR +12, ARNtracr +85) I: ARNsg (DR +12, ARNtracr +85)

II: ARNsg (DR +12, ARNtracr +85) mut2 II: ARNsg (DR +12, ARNtracr +85) mut2

III: ARNsg (DR +22, ARNtracr +85) III: siRNA (DR +22, RNAcr +85)

IV: ARNsg (DR +22, ARNtracr +85) mut4 IV: siRNA (DR +22, RNAcr +85) mut4

Tabla L | Sitios fijados como objetivo con las PAM alternas para ensayar la especificidad de PAM de Cas9. Todos los sitios fijados como objetivo para ensayar la especificidad de PAM se encuentran dentro del lugar EMX1 humano. Table L | Target sites with alternate MAPs to test the specificity of Cas9 MAP. All target sites to test the specificity of PAM are within the human EMX1 site.

Secuencia del sitio fijado como objetivo (5' a 3') Sequence of the target site (5 'to 3')
PAM PAM

ACATCAACCGGTGGCGCAT ACATCAACCGGTGGCGCAT
NAT NAT

AAGGTGTGGTTCCAGAACC AAGGTGTGGTTCCAGAACC
NAC NAC

CCATCACATCAACCGGTGG CCATCACATCAACCGGTGG
NAG NAG

AAACGGCAGAAGCTGGAGG AAACGGCAGAAGCTGGAGG
NTA NTA

GGCAGAAGCTGGAGGAGGA GGCAGAAGCTGGAGGAGGA
NTT NTT

GGTGTGGTTCCAGAACCGG GGTGTGGTTCCAGAACCGG
NTC NTC

AACCGGAGGACAAAGTACA AACCGGAGGACAAAGTACA
NTG NTG

TTCCAGAACCGGAGGACAA TTCCAGAACCGGAGGACAA
NCA NCA

GTGTGGTTCCAGAACCGGA GTGTGGTTCCAGAACCGGA
NCT NCT

TCCAGAACCGGAGGACAAA TCCAGAACCGGAGGACAAA
NCC NCC

CAGAAGCTGGAGGAGGAAG CAGAAGCTGGAGGAGGAAG
NCG NCG

CATCAACCGGTGGCGCATT CATCAACCGGTGGCGCATT
NGA NGA

GCAGAAGCTGGAGGAGGAA GCAGAAGCTGGAGGAGGAA
NGT NGT

CCTCCCTCCCTGGCCCAGG CCTCCCTCCCTGGCCCAGG
NGC NGC

TCATCTGTGCCCCTCCCTC TCATCTGTGCCCCTCCCTC
NAA NAA

GGGAGGACATCGATGTCAC GGGAGGACATCGATGTCAC
NAT NAT

CAAACGGCAGAAGCTGGAG CAAACGGCAGAAGCTGGAG
NAC NAC

GGGTGGGCAACCACAAACC GGGTGGGCAACCACAAACC
NAG NAG

GGTGGGCAACCACAAACCC GGTGGGCAACCACAAACCC
NTA NTA

GGCTCCCATCACATCAACC GGCTCCCATCACATCAACC
NTT NTT

GAAGGGCCTGAGTCCGAGC GAAGGGCCTGAGTCCGAGC
NTC NTC

CAACCGGTGGCGCATTGCC CAACCGGTGGCGCATTGCC
NTG NTG

AGGAGGAAGGGCCTGAGTC AGGAGGAAGGGCCTGAGTC
NCA NCA

AGCTGGAGGAGGAAGGGCC AGCTGGAGGAGGAAGGGCC
NCT NCT

GCATTGCCACGAAGCAGGC GCATTGCCACGAAGCAGGC
NCC NCC

ATTGCCACGAAGCAGGCCA ATTGCCACGAAGCAGGCCA
NCG NCG

AGAACCGGAGGACAAAGTA AGAACCGGAGGACAAAGTA
NGA NGA

TCAACCGGTGGCGCATTGC TCAACCGGTGGCGCATTGC
NGT NGT

GAAGCTGGAGGAGGAAGGG GAAGCTGGAGGAGGAAGGG
NGC NGC


Ejemplo 10: Secuencias suplementarias Todas las secuencias están en la dirección 5' a 3'. Para la transcripción de U6, la hilera de T subrayadadas sirven como el terminador de la transcripción. > ARNtracr corto de U6 (SF370 Streptococcus pyogenes)

Example 10: Supplementary sequences All sequences are in the 5 'to 3' direction. For transcription of U6, the underlined row of T serve as the transcription terminator. > Short siRNA of U6 (SF370 Streptococcus pyogenes)

(Secuencia ARNtracr en negrita) >U6-RD-secuencia guía-RD (SF370 Streptococcus pyogenes) (ARNtracr sequence in bold) > U6-RD-RD-guide sequence (SF370 Streptococcus pyogenes)

(la secuencia de repetición directa se resalta en gris y la secuencia guía son N en negrita) > ARNsg que contiene +48 ARNtracr (SF370 Streptococcus pyogenes) (the direct repeat sequence is highlighted in gray and the guide sequence is N in bold)> RNAs containing +48 RNAcrcr (SF370 Streptococcus pyogenes)

(la secuencia guía son N en negrita y el fragmento ARNtracr está en negrita) > ARNsg que contiene +54 ARNtracr (SF370 Streptococcus pyogenes) (the guide sequence is N in bold and the ARNtracr fragment is in bold)> RNAs containing +54 RNAcrcr (SF370 Streptococcus pyogenes)

(la secuencia guía son N en negrita y el fragmento ARNtracr está en negrita) > ARNsg que contiene +67 ARNtracr (SF370 Streptococcus pyogenes) (the guide sequence is N in bold and the ARNtracr fragment is in bold)> RNAs containing +67 RNAcr (SF370 Streptococcus pyogenes)

(la secuencia guía son N en negrita y el fragmento ARNtracr está en negrita) 15 > ARNsg que contiene +85 ARNtracr (SF370 Streptococcus pyogenes) (the guide sequence is N in bold and the fragment ARNtracr is in bold) 15> RNAs containing +85 RNAcr (SF370 Streptococcus pyogenes)

(la secuencia guía son N en negrita y el fragmento ARNtracr está en negrita) > CBh-NLS-SpCas9-NLS (the guide sequence is N in bold and the ARNtracr fragment is in bold)> CBh-NLS-SpCas9-NLS

(NLS-hSpCas9-NLS se resalta en negrita) > Amplicón de secuenciación para guías de EMX1 1.1, 1.14, 1.17 (NLS-hSpCas9-NLS is highlighted in bold) > Amplicon sequencing for EMX1 guides 1.1, 1.14, 1.17

> Amplicón de secuenciación para guías de EMX1 1.2, 1.16 > Sequencing amplicon for EMX1 guides 1.2, 1.16

> Amplicón de secuenciación para guías de EMX1 1.3, 1.13, 1.15 > Sequence amplicon for EMX1 guides 1.3, 1.13, 1.15

> Amplicón de secuenciación para guías de EMX1 1.6 > Sequencing amplicon for EMX1 1.6 guides

> Amplicón de secuenciación para guías de EMX1 1.10 > Sequencing amplicon for EMX1 1.10 guides

> Amplicón de secuenciación para guías de EMX1 1.11, 1.12 > Amplicon sequencing for EMX1 guides 1.11, 1.12

15 > Amplicón de secuenciación para guías de EMX1 1.18, 1.19 > Amplicón de secuenciación para guías de EMX1 1.20 15> Sequencing amplicon for EMX1 guides 1.18, 1.19> Sequencing amplicon for EMX1 guides 1.20

> Cebador F de activador T7 para hibridación con cadena fijada como objetivo > T7 activator primer F for hybridization with target chain

>oligo que contiene sitio 1 fijado como objetivo de pUC19 para metilación (T7 inversa) > oligo containing site 1 set as the target of pUC19 for methylation (reverse T7)

>oligo que contiene sitio 2 fijado como objetivo de pUC19 para metilación (T7 inversa) > oligo containing site 2 set as the target of pUC19 for methylation (reverse T7)

10 Ejemplo 11: Recombinación homóloga inducida por Cas9 oligo-mediada. 10 Example 11: Homologous recombination induced by oligo-mediated Cas9.

El ensayo de recombinación homóloga de oligonucleótidos es una comparación de eficacia a través de diferentes variantes de Cas9 y diferentes plantillas de RH (oligonucleótido frente a plásmido). The homologous oligonucleotide recombination assay is a comparison of efficacy across different variants of Cas9 and different templates of RH (oligonucleotide against plasmid).

Se usaron células 293FT. SpCas9 = Cas9 natural y SpCas9n = Cas9 de nickasa (D10A). El objetivo de ARN quimérico es el mismo objetivo 1 protoespaciador EMX1 que en los Ejemplos 5, 9 y 10 y oligonucleótidos 293FT cells were used. SpCas9 = Natural Cas9 and SpCas9n = Nickasa Cas9 (D10A). The objective of chimeric RNA is the same objective 1 EMX1 proto-spacer as in Examples 5, 9 and 10 and oligonucleotides

15 sintetizados por IDT usando purificación PAGE. 15 synthesized by RTD using PAGE purification.

La Figura 44 representa un diseño de oligo-ADN usado como plantilla de recombinación homóloga (RH) en este experimento. Los oligonucleótidos largos contienen homología de 100 pb en el lugar EMX1 y un sitio de restricción HindIII. Se cotransinfectaron células 293FT con: primero, un plásmido que contenía un lugar EMX1 humano de fijación como objetivo de ARN quimérico y proteína cas9 natural y segundo, el oligo-ADN como plantilla de RH. Las Figure 44 depicts an oligo-DNA design used as a homologous recombination template (RH) in this experiment. Long oligonucleotides contain 100 bp homology at the EMX1 site and a HindIII restriction site. 293FT cells were co-transfected with: first, a plasmid containing a human EMX1 binding site as a target for chimeric RNA and natural cas9 protein, and second, the oligo-DNA as a template for RH. The

20 muestras son de células 293FT recogidas 96 horas postransinfección con Lipofectamina 2000. Todos los productos se multiplicaron con un cebador de RH EMX1, purificado en gel, seguido por digestión con HindIII para detectar la eficacia de integración de plantilla de RH en el genoma humano. 20 samples are from 293FT cells collected 96 hours post-infection with Lipofectamine 2000. All products were multiplied with an EMX1 RH primer, gel purified, followed by digestion with HindIII to detect the efficiency of RH template integration in the human genome.

Las Figuras 45 y 46 representan una comparación de eficacia de RH inducida por diferente combinación de proteína Cas9 y plantilla de RH. La construcción Cas9 usada fue Cas9 natural o la versión de nickasa de Cas9 (Cas9n). La 25 plantilla de RH usada fue: oligo-ADN complementario (oligonucleótido complementario en la figura anterior) u oligo-ADN transcrito (oligonucleótido transcrito en la figura anterior) o plantilla de RH de plásmido (plantilla de RH en la figura anterior). La definición del transcrito/complementario es que la cadena transcrita de manera activa con secuencia correspondiente al ARNm transcrito se define como la cadena transcrita de genoma. Se muestra la eficacia de RH como porcentaje de banda de digestión de HindIII como frente al producto multiplicado por PCR Figures 45 and 46 represent a comparison of RH efficacy induced by different combination of Cas9 protein and RH template. The Cas9 construction used was Cas9 natural or the nickasa version of Cas9 (Cas9n). The RH template used was: complementary oligo-DNA (complementary oligonucleotide in the previous figure) or transcribed oligo-DNA (oligonucleotide transcribed in the previous figure) or plasmid RH template (RH template in the previous figure). The definition of the transcript / complementary is that the actively transcribed chain with sequence corresponding to the transcribed mRNA is defined as the transcribed genome chain. The efficacy of RH is shown as a percentage of HindIII digestion band as compared to the product multiplied by PCR

30 genómico (números del fondo). 30 genomic (bottom numbers).

Ejemplo 12: Ratón autista Example 12: Autistic Mouse

Recientes iniciativas de secuenciación a gran escala han producido un gran número de genes asociados a enfermedad. El descubrimiento de los genes es sólo el comienzo del entendimiento de lo que hace el gen y cómo conduce a un fenotipo enfermo. Las tecnologías y propuestas actuales para estudiar genes candidatos son lentas y laboriosas. Las reglas de oro, fijación como objetivo de genes e inactivaciones genéticas, requieren una significativa inversión de tiempo y recursos, tanto monetariamente como en términos de personal investigador. Los solicitantes proponen utilizar la nucleasa hSpCas9 para fijar como objetivo muchos genes y haciéndolo con mayor eficacia y menor cambio comparado con cualquier otra tecnología. Debido a la alta eficacia de hSpCas9 los solicitantes pueden realizar inyección de ARN en zigotos de ratón y conseguir inmediatamente animales con genomas modificados sin la necesidad de hacer ninguna fijación como objetivo de genes de manera preliminar en mESC. Recent large-scale sequencing initiatives have produced a large number of genes associated with disease. The discovery of genes is only the beginning of the understanding of what the gene does and how it leads to a diseased phenotype. Current technologies and proposals to study candidate genes are slow and laborious. The rules of gold, targeting genes and genetic inactivations, require a significant investment of time and resources, both monetarily and in terms of research staff. The applicants propose using the hSpCas9 nuclease to target many genes and doing so more effectively and with less change compared to any other technology. Due to the high efficacy of hSpCas9, applicants can perform RNA injection in mouse zygotes and immediately get animals with modified genomes without the need to make any preliminary target fixation of genes in mESC.

La proteína 8 de unión a ADN helicasa con cromodominio (CHD8) es un gen pivotal implicado en el desarrollo y la morfogénesis de los vertebrados inicial. Los ratones que carecen de CHD8 mueren durante el desarrollo embrionario. Las mutaciones en el gen CHD8 se han asociado con un trastorno del espectro autista en seres humanos. Esta asociación se realizó en tres diferentes artículos publicados simultáneamente en Nature. Los mismos tres estudios identificaron una plétora de genes asociados al trastorno del espectro autista. El objeto de los solicitantes fue crear ratones inactivados para los cuatro genes que se encontraron en todos los artículos, Chd8, Katnal2, Kctd13 y Scn2a. Además, los solicitantes eligen otros dos genes asociados al trastorno del espectro autista, esquizofrenia y ADHD, GIT1, CACNA1C y CACNB2. Y finalmente, como control positivo, los solicitantes deciden fijar como objetivo MeCP2. Chromodomain DNA helicase-binding protein 8 (CHD8) is a pivotal gene involved in the development and morphogenesis of the initial vertebrates. Mice that lack CHD8 die during embryonic development. Mutations in the CHD8 gene have been associated with an autism spectrum disorder in humans. This association was made in three different articles published simultaneously in Nature. The same three studies identified a plethora of genes associated with autism spectrum disorder. The object of the applicants was to create inactivated mice for the four genes found in all articles, Chd8, Katnal2, Kctd13 and Scn2a. In addition, applicants choose two other genes associated with autism spectrum disorder, schizophrenia and ADHD, GIT1, CACNA1C and CACNB2. And finally, as a positive control, the applicants decide to set the MeCP2 objective.

Para cada gen, los solicitantes diseñaron tres ARNg que inactivarían probablemente el gen. Tendría lugar una inactivación después de que la nucleasa hSpCas9 realizara una doble rotura de cadena y la ruta de reparación de ADN propensa a error, unión de extremos no homólogos, corrija la rotura, creando una mutación. El resultado más probable es una mutación que desplace el marco de lectura que inactivaría el gen. La estrategia de fijación como objetivo implicó encontrar protoespaciadores en los exones del gen que tuvieran una secuencia PAM, NGG, y fuera única en el genoma. Se dio preferencia a los protoespaciadores en el primer exón, que sería lo más perjudicial para el gen. For each gene, applicants designed three rRNAs that would probably inactivate the gene. Inactivation would take place after the hSpCas9 nuclease performed a double chain break and the error-prone DNA repair path, non-homologous end junction, corrected the break, creating a mutation. The most likely result is a mutation that displaces the reading frame that would inactivate the gene. The target fixation strategy involved finding proto-spacers in the exons of the gene that had a PAM, NGG sequence, and was unique in the genome. Preference was given to the proto-spacers in the first exon, which would be the most harmful for the gene.

Se validó cada ARNg en la estirpe celular de ratón, Neuro-N2a, por cotransinfección transitoria de liposomas con hSpCas9. 72 horas postransinfección se purificó el ADN genómico usando ADN QuickExtract de Epicentre. Se realizó PCR para multiplicar el lugar de interés. Con posterioridad, se siguió el estuche de detección de mutación SURVEYOR de Transgenomics. Los resultados de SURVEYOR para cada ARNg y respectivos controles se muestran en la Figura A1. Un resultado de SURVEYOR positivo es una banda amplia correspondiendo al PCR genómico y dos bandas más pequeñas que son el producto de la nucleasa SURVEYOR realizando una doble rotura de cadena en el sitio de una mutación. La eficacia de corte promedio de cada ARNg se determinó también para cada ARNg. El ARNg que se eligió para inyección fue el ARNg de más alta eficacia que fue el más único dentro del genoma. Each rRNA was validated in the mouse cell line, Neuro-N2a, by transient co-infection of liposomes with hSpCas9. 72 hours post-infection genomic DNA was purified using Epicenter QuickExtract DNA. PCR was performed to multiply the place of interest. Subsequently, the Transgenomics SURVEYOR mutation detection kit was followed. SURVEYOR results for each siRNA and respective controls are shown in Figure A1. A positive SURVEYOR result is a broad band corresponding to genomic PCR and two smaller bands that are the product of the SURVEYOR nuclease performing a double chain break at the site of a mutation. The average cutoff efficiency of each mRNA was also determined for each mRNA. The mRNA that was chosen for injection was the highest efficacy mRNA that was the most unique within the genome.

Se inyectó ARN (ARN hSpCas9+ ARNg) en el pronúcleo de un zigoto y se trasplantó más tarde en una madre adoptiva. Se dejó que las madres completarán la gestación y se muestrearon las crías agarrando las colas 10 días posparto. Se extrajo ADN y se usó como una plantilla para PCR, que se trató después por SURVEYOR. Adicionalmente, los productos PCR se enviaron para secuenciación. Los animales que se detectaron como positivos en cualquiera de, el ensayo SURVEYOR o la secuenciación PCR habrían clonado sus productos PCR genómicos en un vector pUC19 y se secuenciaron para determinar mutaciones putativas para cada alelo. RNA (hSpCas9 + RNAg RNA) was injected into the zygote pronucleus and later transplanted into an adoptive mother. The mothers were allowed to complete the gestation and the offspring were sampled by grabbing the tails 10 days postpartum. DNA was extracted and used as a template for PCR, which was then treated by SURVEYOR. Additionally, PCR products were sent for sequencing. Animals that were detected as positive in any of the SURVEYOR assay or PCR sequencing would have cloned their genomic PCR products into a pUC19 vector and sequenced to determine putative mutations for each allele.

Hasta ahora, las crías de ratón del experimento de fijación como objetivo de Chd8 se han tratado completamente hasta el punto de secuenciación del alelo. Los resultados Surveyor para 38 crías vivas (vías 1-38) 1 cría muerta (vía 39) y 1 cría natural para comparación (vía 40) se muestran en la Figura A2. Se inyectó a las crías 1-19 ARNg Chd8.2 y a las crías 20-38 se inyectó ARNg Chd8.3. De las 38 crías vivas, 13 fueron positivas para una mutación. La cría muerta también tuvo una mutación. No hubo mutación detectada en la muestra natural. La secuenciación por PCR genómica fue consistente con los hallazgos de la prueba SURVEYOR. Until now, the mouse offspring of the fixation experiment as the target of Chd8 have been completely treated to the point of sequencing the allele. Surveyor results for 38 live offspring (lanes 1-38) 1 dead offspring (lane 39) and 1 natural offspring for comparison (lane 40) are shown in Figure A2. The offspring 1-19 Chd8.2 siRNA were injected and the 20-38 offspring Chd8.3 siRNA was injected. Of the 38 live offspring, 13 were positive for a mutation. The dead baby also had a mutation. There was no mutation detected in the natural sample. Genomic PCR sequencing was consistent with the findings of the SURVEYOR test.

Ejemplo 13: Modulación transcripcional mediada por CRISPR/Cas. Example 13: Transcriptional modulation mediated by CRISPR / Cas.

La Figura 67 representa un diseño del CRISPR-FT (Factor de Transcripción) con actividad de activación transcripcional. El ARN quimérico se expresa por el activador de U6, mientras una versión de doble mutante, codón optimizada humana de la proteína Cas9 (hSpCas9m), ligada de manera operable a un dominio funcional de NLS triple y uno de VP64 se expresa por un activador de EF1a. Las dobles mutaciones, D10A y H840A, hacen la proteína cas9 incapaz de introducir escisión, pero mantuvieron su capacidad para unirse a un ADN fijado como objetivo cuando se guía por el ARN quimérico. Figure 67 represents a design of the CRISPR-FT (Transcription Factor) with transcriptional activation activity. The chimeric RNA is expressed by the activator of U6, while a double mutant, human optimized codon version of the Cas9 protein (hSpCas9m), operably linked to a triple functional domain of NLS and one of VP64 is expressed by an activator of EF1a. The double mutations, D10A and H840A, make the cas9 protein unable to introduce cleavage, but they maintained their ability to bind to a target-fixed DNA when guided by the chimeric RNA.

La Figura 68 representa activación transcripcional del gen SOX2 humano con sistema CRISPR-FT (ARN quimérico y la proteína de fusión Cas9-NLS-VP64). Se transinfectaron células 293FT con plásmidos que soportaban dos componentes: (1) secuencias de 20 pb de fijación como objetivo de ARN quiméricos diferentes conducidos por U6 dentro o alrededor del lugar genómico SOX2 humano y (2) proteína de fusión hSpCas9m (doble mutante)-NLS-VP64 conducida por EF1a. 96 horas postransinfección, se recogieron células 293FT y se midió el nivel de activación por la inducción de expresión de ARNm usando una prueba qRT-PCR. Todos los niveles de expresión se normalizan frente al grupo de control (barra gris), que representa los resultados de células transinfectadas con el plásmido de cadena principal de CRISPR-FT sin ARN quimérico. Las ondas qRT-PCR usadas para detectar el ARNm de SOX2 es prueba de expresión de genes humanos de Taqman (Life Technologies). Todos los experimentos representan datos de 3 replicados biológicos, n=3, las barras de error muestran e. e. m. Figure 68 depicts transcriptional activation of the human SOX2 gene with CRISPR-FT system (chimeric RNA and Cas9-NLS-VP64 fusion protein). 293FT cells were transfected with plasmids supporting two components: (1) 20 bp binding sequences targeting different chimeric RNAs driven by U6 into or around the human SOX2 genomic site and (2) hSpCas9m fusion protein (double mutant) - NLS-VP64 driven by EF1a. 96 hours post-infection, 293FT cells were collected and the level of activation was measured by induction of mRNA expression using a qRT-PCR test. All expression levels are normalized against the control group (gray bar), which represents the results of cells transinfected with the CRISPR-FT main chain plasmid without chimeric RNA. The qRT-PCR waves used to detect the SOX2 mRNA is an expression test for human Taqman genes (Life Technologies). All experiments represent data from 3 biological replicates, n = 3, the error bars show e. and. m.

5 Ejemplo 14: NLS: NLS de Cas9 5 Example 14: NLS: Cas9 NLS

Se transinfectaron células 293FT con plásmido que contenía dos componentes: (1) activador de EF1a que conducía la expresión de Cas9 (Sp Cas9 codón optimizada, humana, natural) con diferentes diseños NLS (2) activador de U6 que conducía el mismo lugar EMX1 humano que fija como objetivo ARN quimérico. 293FT cells were transfected with plasmid containing two components: (1) EF1a activator that led to Cas9 expression (Sp Cas9 codon optimized, human, natural) with different NLS designs (2) U6 activator that conducted the same human EMX1 site which targets chimeric RNA.

Se recogieron células en el instante de tiempo de 72 h postransinfección y se extrajeron después con 50 µl de la Cells were collected at the time of 72 h post-infection and then extracted with 50 µl of the

10 disolución de extracción de ADN genómico QuickExtract siguiendo el protocolo del fabricante. Se multiplicó por PCR ADN genómico de EMX1 fijado como objetivo y se purificó en gel con gel de agarosa al 1%. Se volvió a hibridar el producto PCR genómico y se sometió a la prueba Surveyor siguiendo el protocolo del fabricante. La eficacia de escisión genómica de diferentes construcciones se midió usando SDS-PAGE en un gel TBE-PAGE al 4-12% (Life Technologies), se analizó y se cuantificó con el programa informático ImageLab (Bio-rad), todo siguiendo el 10 QuickExtract genomic DNA extraction solution following the manufacturer's protocol. Genomic target EMX1 DNA was multiplied by PCR and gel purified with 1% agarose gel. The genomic PCR product was re-hybridized and subjected to the Surveyor test following the manufacturer's protocol. The efficiency of genomic cleavage of different constructs was measured using SDS-PAGE on a 4-12% TBE-PAGE gel (Life Technologies), analyzed and quantified with the ImageLab (Bio-rad) software, all following the

15 protocolo del fabricante. 15 manufacturer protocol.

La Figura 69 representa un diseño de diferentes construcciones NLS Cas9. Todas las Cas9 eran la versión codón optimizada humana de la Sp Cas9. Se ligaron las secuencias NLS al gen cas9 en el N-terminal o C-terminal. Todas las variantes de Cas9 con diferentes diseños de NLS se clonaron en una cadena principal conteniendo así vector para ser conducido por el activador de EF1a. En el mismo vector hay un lugar EMX1 humano de fijación como Figure 69 represents a design of different NLS Cas9 constructions. All Cas9 were the human optimized codon version of the Cas9 Sp. The NLS sequences were linked to the cas9 gene in the N-terminal or C-terminal. All Cas9 variants with different NLS designs were cloned into a main chain thus containing vector to be driven by the EF1a activator. In the same vector there is a human EMX1 fixation site as

20 objetivo de ARN quimérico conducido por activador de U6, formando juntos un sistema de dos componentes. 20 target of chimeric RNA driven by U6 activator, together forming a two component system.

Tabla M. Resultados de ensayo de diseño NLS Cas9. Cuantificación de escisión genómica de diferentes construcciones cas9-nls por prueba surveyor. Table M. Design test results NLS Cas9. Quantification of genomic excision of different cas9-nls constructs by surveyor test.

Porcentaje de escisión de genoma cuando se mide por prueba Surveyor Percentage of genome excision when measured by Surveyor test
Replicado biológico 1 (%) Replicado biológico 2 (%) Replicado biológico 3 (%) Promedio (%) Error (E.E.M., error estándar de la media) Biological Replicate 1 (%) Biological Replicate 2 (%) Biological Replicate 3 (%) Average (%) Error (E.E.M., standard error of the mean)

Cas9 (No NLS) Cas9 (No NLS)
2,50 3,30 2,73 2,84 0,24 2.50 3.30 2.73 2.84 0.24

Cas9 con NLS N-term Cas9 with NLS N-term
7,61 6,29 5,46 6,45 0,63 7.61 6.29 5.46 6.45 0.63

Cas9 con NLS C-term Cas9 with NLS C-term
5,75 4,86 4,70 5,10 0,33 5.75 4.86 4.70 5.10 0.33

Cas9 con doble NLS (N-term y C-term) Cas9 with double NLS (N-term and C-term)
9,08 9,85 7,78 8,90 0,60 9.08 9.85 7.78 8.90 0.60

La Figura 70 representa la eficacia de escisión genómica inducida por variantes de Cas9 que soportan diferentes 25 diseños de NLS. El porcentaje indica la porción de ADN genómico de EMX1 humano que fue escindido por cada construcción. Todos los experimentos son de 3 replicados biológicos. n = 3, error indica E. E. M. Figure 70 depicts the efficacy of genomic cleavage induced by Cas9 variants that support different 25 NLS designs. The percentage indicates the portion of human EMX1 genomic DNA that was cleaved by each construct. All experiments are of 3 biological replicates. n = 3, error indicates E. E. M.

Ejemplo 15: Ingeniería del microalgas usando Cas9 Example 15: Microalgae engineering using Cas9

Métodos de suministrar Cas9 Cas9 delivery methods

Método 1: Los solicitantes suministran Cas9 y ARN guía usando un vector que expresa Cas9 bajo el control de un 30 activador constitutivo tal como Hsp70A-Rbc S2 o Beta2-tubulina. Method 1: Applicants supply Cas9 and guide RNA using a vector that expresses Cas9 under the control of a constitutive activator such as Hsp70A-Rbc S2 or Beta2-tubulin.

Método 2: Los solicitantes suministran Cas9 y Polimerasa T7 usando vectores que expresan Cas9 y Polimerasa T7 bajo el control de un activador constitutivo tal como Hsp70A-Rbc S2 o Beta2-tubulina. Se suministró ARN guía usando un vector que contenía activador de T7 que conduce el ARN guía. Method 2: Applicants supply Cas9 and T7 polymerase using vectors that express Cas9 and T7 polymerase under the control of a constitutive activator such as Hsp70A-Rbc S2 or Beta2-tubulin. Guide RNA was supplied using a vector containing T7 activator that conducts the guide RNA.

Método 3: Los solicitantes suministran ARNm de Cas9 y ARN guía transcrito in vitro a células de algas. El ARN 35 puede ser transcrito in vitro. El ARNm de Cas9 constará de la región codificadora para Cas9, así como 3'UTR de Cop1 para asegurar la estabilización del ARNm de Cas9. Method 3: Applicants supply Cas9 mRNA and guide RNA transcribed in vitro to algae cells. RNA 35 can be transcribed in vitro. The Cas9 mRNA will consist of the coding region for Cas9, as well as 3'UTR of Cop1 to ensure stabilization of the Cas9 mRNA.

Para recombinación homóloga, los solicitantes proporcionan una plantilla de reparación dirigida por homología adicional. 108 For homologous recombination, applicants provide a repair template directed by additional homology. 108

Secuencia para un casete que conduce la expresión de Cas9 bajo el control de activador de beta-2 tubulina, seguido por 3' UTR de Cop 1. Sequence for a cassette that conducts Cas9 expression under the control of beta-2 tubulin activator, followed by 3 'UTR of Cop 1.

Secuencia para un casete que conduce la expresión de polimerasa T7 bajo el control de activador de beta-2 tubulina, seguido por la 3’ UTR de Cop1: Sequence for a cassette that conducts T7 polymerase expression under the control of beta-2 tubulin activator, followed by the 3 ’UTR of Cop1:

Secuencia de ARN guía conducida por el activador T7 (activador T7, las N representan secuencia de fijación como objetivo): Sequence of guide RNA driven by activator T7 (activator T7, the Ns represent the target sequence):

5 Suministro génico: 5 Gene supply:

Se usarán cepas CC-124 y CC-125 de Chlamydomonas reinhardtii del centro de recursos de Chlamydomonas para electroporación. El protocol de electroporación sigue el protocolo recomendado estándar del estuche de ingeniería de Chlamydomonas GeneArt. Strains CC-124 and CC-125 of Chlamydomonas reinhardtii from the Chlamydomonas resource center will be used for electroporation. The electroporation protocol follows the standard recommended protocol of the Chlamydomonas GeneArt engineering kit.

También, los solicitantes generan una línea de Chlamydomonas reinhardtii que expresa Cas9 de manera Also, applicants generate a line of Chlamydomonas reinhardtii that expresses Cas9 so

10 constitutiva. Esto se puede realizar usando pChlamy1 (linearizado usando PvuI) y seleccionando colonias resistentes a higromicina. La secuencia para pChlamy1 que contiene Cas9 está a continuación. De esta manera para conseguir inactivación génica se requiere simplemente suministrar ARN para el ARN guía. Para recombinación homóloga, los solicitantes suministran ARN guía, así como una plantilla de recombinación homóloga linearizada. 10 constitutive. This can be done using pChlamy1 (linearized using PvuI) and selecting hygromycin resistant colonies. The sequence for pChlamy1 containing Cas9 is below. In this way to achieve gene inactivation, it is simply required to supply RNA for the guide RNA. For homologous recombination, applicants supply guide RNA, as well as a linearized homologous recombination template.

Para todas las células de Chlamydomonas reinhardtii, los solicitantes usaron PCR, prueba de la nucleasa SURVEYOR y secuenciación de ADN para verificar la modificación exitosa. For all Chlamydomonas reinhardtii cells, applicants used PCR, SURVEYOR nuclease test and DNA sequencing to verify the successful modification.

5 La capacidad para transcripción de control de manera artificial es esencial tanto para el estudio de la función génica como para la construcción de redes de genes sintéticos con propiedades deseadas. Los solicitantes describen en la presente el uso de la proteína Cas9 guiada por ARN como un represor transcripcional programable. 5 The ability to control transcription artificially is essential both for the study of gene function and for the construction of synthetic gene networks with desired properties. Applicants herein describe the use of RNA-guided Cas9 protein as a programmable transcriptional repressor.

Los solicitantes han demostrado previamente cómo puede usarse la proteína Cas9 de SF370 de Streptococcus pyogenes para dirigir la edición de genomas en Streptococcus pneumoniae. En este estudio, los solicitantes lograron 10 la cepa crR6Rk que contenía un sistema CRISPR mínimo, que consistía en cas9, el ARNtracr y una repetición. Se introdujeron las mutaciones D10A-H840 en cas9 en esta cepa, proporcionando cepa crR6Rk**. Se clonaron cuatro espaciadores fijando como objetivo diferentes posiciones del activador del gen de β-galactosidasa bgaA en la matriz CRISPR por el plásmido pDB98 descrito previamente. Los solicitantes observaron una reducción de X a Y veces en actividad de la β-galactosidasa dependiendo de la posición fijada como objetivo, que demuestra el potencial de Cas9 Applicants have previously demonstrated how Streptococcus pyogenes Cas9 SF970 protein can be used to direct genome editing in Streptococcus pneumoniae. In this study, the applicants achieved 10 the crR6Rk strain that contained a minimum CRISPR system, which consisted of cas9, the ARNtracr and a repeat. D10A-H840 mutations in cas9 were introduced into this strain, providing strain crR6Rk **. Four spacers were cloned by targeting different positions of the β-galactosidase bgaA gene activator in the CRISPR matrix by plasmid pDB98 previously described. Applicants observed a reduction from X to Y times in activity of β-galactosidase depending on the target position, which demonstrates the potential of Cas9

15 como un represor programable (Figura 73). 15 as a programmable repressor (Figure 73).

Para conseguir la represión de Cas9** en Escherichia coli se construyó un plásmido informador de proteína fluorescente verde (GFP, por sus siglas en inglés) (pDB127) para expresar el gen gfpmut2 de un activador constitutivo. Se diseñó el activador para que soportara varias PAM de NPP en las dos cadenas, para medir el efecto de la unión de Cas9** en varias posiciones. Los solicitantes introdujeron las mutaciones D10A-H840 en pCas9, un plásmido que se describe que soporta el ARNtracr, cas9 y una matriz de CRISPR mínima diseñada para la clonación fácil de nuevos espaciadores. Se diseñaron veintidós espaciadores diferentes para fijar como objetivo diferentes regiones del activador de gfpmut2 y marco de lectura abierto. Se observó una reducción de fluorescencia de aproximadamente 20 veces en las regiones de fijación como objetivo que solapan o están adyacentes a los elementos activadores -35 y -10 y a la secuencia Shine-Dalgarno. Los objetivos en ambas cadenas mostraron niveles de represión similares. Estos resultados sugieren que la unión de Cas9** a cualquier posición de la región activadora evita la iniciación de la transcripción, presumiblemente por inhibición estérica de la unión de RNAP. To achieve repression of Cas9 ** in Escherichia coli, a green fluorescent protein reporter plasmid (GFP) (pDB127) was constructed to express the gfpmut2 gene of a constitutive activator. The activator was designed to support several NPP PAMs in the two chains, to measure the effect of Cas9 ** binding in various positions. Applicants introduced the D10A-H840 mutations in pCas9, a plasmid described that supports RNAcrcr, cas9 and a minimal CRISPR matrix designed for easy cloning of new spacers. Twenty-two different spacers were designed to target different regions of the gfpmut2 activator and open reading frame. A fluorescence reduction of approximately 20 times was observed in the target fixation regions that overlap or are adjacent to the activator elements -35 and -10 and the Shine-Dalgarno sequence. The objectives in both chains showed similar levels of repression. These results suggest that the binding of Cas9 ** to any position of the activating region prevents the initiation of transcription, presumably by steric inhibition of RNAP binding.

Para determinar si Cas9** podía evitar la extensión de la transcripción, los solicitantes la dirigieron al marco de lectura de gpfmut2. Se observó una reducción en la fluorescencia cuando las cadenas codificante y no codificante eran fijadas como objetivo, que sugiere que la unión de Cas9 es en realidad suficientemente fuerte para representar un obstáculo para el funcionamiento de RNAP. Sin embargo, aunque se observó un 40% de reducción en la expresión cuando la cadena codificante era el objetivo, se observó una reducción de 20 veces para la cadena no codificante (Fig 21b, compare T9, T10 y T11 a B9, B10 y B11). Para determinar directamente los efectos de la unión de Cas9** en la transcripción, los solicitantes extrajeron ARN de cepas que soportaban T5, T10, B10 o una construcción de control que no fija como objetivo pDB127 y la sometieron a análisis Northern usando una sonda que se une antes (B477) o después de (B510) los sitios fijados como objetivo B10 y T10. Consistente con los métodos de fluorescencia de los solicitantes, no se detectó transcripción de gfpmut2 cuando se dirigió Cas9** a la región activadora (objetivo T5) y se observó una transcripción después de la fijación como objetivo de la región T10. Convenientemente, se observó un transcrito más pequeño con la sonda B477. Esta banda corresponde al tamaño esperado de un transcrito que se interrumpiría por Cas9** y es una indicación directa de una terminación transcripcional ocasionada por la unión de ARNdg::Cas9** a la cadena codificante. Sorprendentemente, los solicitantes no detectaron transcrito cuando la cadena no codificante fue fijada como objetivo (B10). Puesto que la unión de Cas9** a la región B10 es improbable que interfiera con la iniciación de la transcripción, este resultado sugiere que se degradó el ARNm. Se mostró que ARNdg::Cas9 se unía a ARNmc in vitro. Los solicitantes especulan que la unión puede provocar la degradación del ARNm por nucleasas huésped. Por supuesto, la inmovilización de los ribosomas puede inducir la escisión en el ARNm traducido en E. coli. To determine if Cas9 ** could avoid the extension of the transcript, the applicants directed it to the reading frame of gpfmut2. A reduction in fluorescence was observed when the coding and non-coding chains were set as a target, which suggests that the binding of Cas9 is actually strong enough to represent an obstacle to the functioning of RNAP. However, although a 40% reduction in expression was observed when the coding chain was the target, a 20-fold reduction was observed for the non-coding chain (Fig 21b, compare T9, T10 and T11 to B9, B10 and B11 ). To directly determine the effects of Cas9 ** binding on transcription, applicants extracted RNA from strains that supported T5, T10, B10 or a control construct that does not target pDB127 and subjected it to Northern analysis using a probe that joins before (B477) or after (B510) the sites set as target B10 and T10. Consistent with the fluorescence methods of the applicants, no transcription of gfpmut2 was detected when Cas9 ** was directed to the activating region (target T5) and a transcript was observed after fixation as the target of the T10 region. Conveniently, a smaller transcript was observed with the B477 probe. This band corresponds to the expected size of a transcript that would be interrupted by Cas9 ** and is a direct indication of a transcriptional termination caused by the binding of dRNA :: Cas9 ** to the coding chain. Surprisingly, the applicants did not detect transcript when the non-coding chain was set as target (B10). Since the binding of Cas9 ** to the B10 region is unlikely to interfere with the initiation of transcription, this result suggests that mRNA was degraded. It was shown that mRNA :: Cas9 bound mRNA in vitro. Applicants speculate that binding can cause degradation of mRNA by host nucleases. Of course, immobilization of ribosomes can induce excision in mRNA translated in E. coli.

Algunas solicitudes requieren una afinación precisa de la expresión génica en vez de su completa represión. Los solicitantes buscaron conseguir niveles de represión intermedios por la introducción de desajustes que debilitarían las interacciones ARNcr/objetivo. Los solicitantes crearon una serie de espaciadores basados en las construcciones B1, T5 y B10 con números crecientes de mutaciones en el extremo 5' del ARNcr. Hasta 8 mutaciones en B1 y T5 no afectaban al nivel de represión y se observó un progresivo aumento en la fluorescencia para mutaciones adicionales. Some applications require precise tuning of gene expression instead of complete repression. The applicants sought to achieve intermediate levels of repression by introducing mismatches that would weaken the ARNcr / target interactions. The applicants created a series of spacers based on the B1, T5 and B10 constructs with increasing numbers of mutations at the 5 'end of the siRNA. Up to 8 mutations in B1 and T5 did not affect the level of repression and a progressive increase in fluorescence was observed for additional mutations.

La represión observada con sólo una igualación de 8 nt entre el ARNcr y su objetivo plantea la cuestión de efectos inesperados del uso de Cas9** como un regulador transcripcional. Puesto que también se requiere una buena PAM (NGG) para unión de Cas9, el número de nucleótidos para igualar obtener algún nivel de respiración es 10. Una igualación de 10 nt tiene lugar aleatoriamente una vez cada ∼1 Mpb y tales sitios es así improbable que se encuentren incluso en genomas bacterianos pequeños. Sin embargo, para reprimir con eficacia la transcripción, se requiere que dicho sitio esté en una región activadora de gen, que hace mucho menos probable el efecto inesperado. Los solicitantes también demostraron que la expresión génica puede verse afectada si la cadena no codificante de un gen se fija como objetivo. Para que esto ocurra, un objetivo aleatorio tendría que estar en la orientación correcta, pero tales casos and the o, dicho sitio es un objetivo aleatorio tendría que estar en la orientación correcta pero que tales casos ocurran relativamente más probablemente. De hecho, durante el transcurso de este estudio, los solicitantes no pudieron construir uno de los espaciadores diseñados en pCas9**. Los solicitantes encontraron más tarde que este espaciador mostraba una igualación de 12 pb próxima a una buena PAM en el gen murC esencial. Dicho efecto inesperado podía evitarse fácilmente mediante un chorro sistemático de los espaciadores diseñados. The repression observed with only an equalization of 8 nt between the ARNcr and its objective raises the question of unexpected effects of the use of Cas9 ** as a transcriptional regulator. Since a good PAM (NGG) is also required for binding of Cas9, the number of nucleotides to equalize some level of respiration is 10. An equalization of 10 nt takes place randomly once every ∼1 Mpb and such sites are thus unlikely. that are found even in small bacterial genomes. However, to effectively suppress transcription, it is required that said site be in a gene activating region, which makes the unexpected effect much less likely. Applicants also demonstrated that gene expression can be affected if the non-coding chain of a gene is set as a target. For this to happen, a random objective would have to be in the correct orientation, but such cases and the or, said site is a random objective would have to be in the correct orientation but that such cases occur relatively more likely. In fact, during the course of this study, applicants were unable to build one of the spacers designed in pCas9 **. Applicants later found that this spacer showed a 12 bp match close to a good MAP in the essential murC gene. Such an unexpected effect could easily be avoided by a systematic jet of the designed spacers.

Los aspectos de la descripción se describen más en los siguientes párrafos numerados: Aspects of the description are described more in the following numbered paragraphs:

1. Un sistema vector que comprende uno o más vectores, en el que el sistema comprende: 1. A vector system comprising one or more vectors, in which the system comprises:

a. to.
un primer elemento regulador ligado de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana en una célula eucariota, en el que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting a guide sequence upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and

b.b.
un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear;  a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence;

en el que los componentes (a) y (b) se sitúan en los mismos vectores o diferentes del sistema. in which components (a) and (b) are placed in the same or different vectors of the system.

2.2.
El sistema vector del párrafo 1, en el que el componente (a) comprende además las secuencias tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador.  The vector system of paragraph 1, wherein component (a) further comprises the tracr sequences downstream of the tracr pairing sequence under the control of the first regulatory element.

3. 3.
El sistema vector del párrafo 1, en el que el componente (a) comprende además dos o más secuencias guía ligadas de manera operable al primer elemento regulador, en el que cuando se expresa, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana diferente en una célula eucariota. The vector system of paragraph 1, wherein component (a) further comprises two or more guide sequences operably linked to the first regulatory element, in which when expressed, each of the two or more guide sequences directs the binding sequence specific from a CRISPR complex to a different target sequence in a eukaryotic cell.

4. Four.
El sistema vector del párrafo 1, en el que el sistema comprende las secuencias tracr bajo el control de un tercer elemento regulador. The vector system of paragraph 1, in which the system comprises the sequences tracr under the control of a third regulatory element.

5. 5.
El sistema vector del párrafo 1, en el que la secuencia tracr presenta al menos 50% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. The vector system of paragraph 1, in which the tracr sequence has at least 50% sequence complementarity along the length of the tracr pairing sequence when aligned optimally.

6. 6.
El sistema vector del párrafo 1, en el que la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. The vector system of paragraph 1, wherein the CRISPR enzyme comprises one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

7.7.
El sistema vector del párrafo 1, en el que la enzima CRISPR es una enzima del sistema CRISPR de tipo II.  The vector system of paragraph 1, wherein the CRISPR enzyme is an enzyme of the type II CRISPR system.

8.8.
El sistema vector del párrafo 1, en el que la enzima CRISPR es una enzima Cas9.  The vector system of paragraph 1, in which the CRISPR enzyme is a Cas9 enzyme.

9. 9.
El sistema vector del párrafo 1, en el que la enzima CRISPR es codón optimizada para expresión en una célula eucariota. The vector system of paragraph 1, in which the enzyme CRISPR is codon optimized for expression in a eukaryotic cell.

10. 10.
El sistema vector del párrafo 1, en el que la enzima CRISPR dirige la escisión de una o más cadenas en la posición de la secuencia diana. The vector system of paragraph 1, in which the CRISPR enzyme directs the cleavage of one or more chains at the position of the target sequence.

11. eleven.
El sistema vector del párrafo 1, en el que la enzima CRISPR carece de actividad de escisión de la cadena de ADN. The vector system of paragraph 1, in which the CRISPR enzyme lacks DNA chain cleavage activity.

12.12.
El sistema vector del párrafo 1, en el que el primer elemento regulador es un activador de polimerasa III.  The vector system of paragraph 1, wherein the first regulatory element is a polymerase III activator.

13.13.
El sistema vector del párrafo 1, en el que el segundo elemento regulador es un activador de polimerasa II.  The vector system of paragraph 1, wherein the second regulatory element is a polymerase II activator.

14.14.
El sistema vector del párrafo 4, en el que el tercer elemento regulador es un activador de polimerasa III.  The vector system of paragraph 4, wherein the third regulatory element is a polymerase III activator.

15.fifteen.
El sistema vector del párrafo 1, en el que la secuencia guía tiene al menos 15 nucleótidos de longitud.  The vector system of paragraph 1, in which the guide sequence is at least 15 nucleotides in length.

16. 16.
El sistema vector del párrafo 1, en el que menos de 50% de los nucleótidos de la secuencia guía participa en apareamiento de bases autocomplementarias cuando se pliega de manera óptima. The vector system of paragraph 1, in which less than 50% of the nucleotides in the guide sequence participate in pairing of autocomplementary bases when folded optimally.

17. 17.
Un vector que comprende un elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica una enzima CRISPR que comprende una o más secuencias de localización nuclear, en el que dicho elemento regulador conduce la transcripción de la enzima CRISPR en una célula eucariota de manera que dicha enzima CRISPR se acumula en una cantidad detectable en el núcleo de la célula eucariota. A vector comprising a regulatory element operably linked to an enzyme coding sequence encoding a CRISPR enzyme comprising one or more nuclear localization sequences, wherein said regulatory element conducts transcription of the CRISPR enzyme in a eukaryotic cell of such that said CRISPR enzyme accumulates in a detectable amount in the nucleus of the eukaryotic cell.

18.18.
El vector del párrafo 17, en el que dicho elemento regulador es un activador de polimerasa II.  The vector of paragraph 17, wherein said regulatory element is a polymerase II activator.

19.19.
El vector del párrafo 17, en el que dicha enzima CRISPR es una enzima del sistema CRISPR de tipo II.  The vector of paragraph 17, wherein said CRISPR enzyme is an enzyme of the type II CRISPR system.

20.twenty.
El vector del párrafo 17, en el que dicha enzima CRISPR es una enzima Cas9.  The vector of paragraph 17, wherein said CRISPR enzyme is a Cas9 enzyme.

21. twenty-one.
El vector del párrafo 17, en el que dicha enzima CRISPR carece de la capacidad para escindir una o más cadenas de una secuencia diana a la que se une. The vector of paragraph 17, wherein said CRISPR enzyme lacks the ability to cleave one or more chains from a target sequence to which it binds.

22.22
Una enzima CRISPR que comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota.  A CRISPR enzyme comprising one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

23.2. 3.
La enzima CRISPR del párrafo 22, en la que dicha enzima CRISPR es una enzima del sistema CRISPR de tipo  The CRISPR enzyme of paragraph 22, wherein said CRISPR enzyme is an enzyme of the type CRISPR system

II. II.

24.24.
La enzima CRISPR del párrafo 22, en la que dicha enzima CRISPR es una enzima Cas9.  The CRISPR enzyme of paragraph 22, wherein said CRISPR enzyme is a Cas9 enzyme.

25.25.
La enzima CRISPR del párrafo 22, en la que dicha enzima CRISPR carece de la capacidad para escindir una o más cadenas de una secuencia diana a la que se une.  The CRISPR enzyme of paragraph 22, wherein said CRISPR enzyme lacks the ability to cleave one or more chains of a target sequence to which it binds.

26.26.
Una célula huésped eucariota que comprende:  A eukaryotic host cell comprising:

a. to.
un primer elemento regulador ligado de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana en una célula eucariota, en el que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting a guide sequence upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or

b.b.
un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear.  a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence.

27. 27.
La célula huésped eucariota del párrafo 26, en la que dicha célula huésped comprende los componentes (a) y (b). The eukaryotic host cell of paragraph 26, wherein said host cell comprises components (a) and (b).

28.28.
La célula huésped eucariota del párrafo 26, en la que el componente (a), el componente (b) o los componentes  The eukaryotic host cell of paragraph 26, in which component (a), component (b) or components

(a) y (b) se integran de manera estable en un genoma de la célula huésped eucariota. (a) and (b) are stably integrated into a genome of the eukaryotic host cell.

29. 29.
La célula huésped eucariota del párrafo 26, en la que el componente (a) comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. The eukaryotic host cell of paragraph 26, wherein component (a) further comprises the tracr sequence downstream of the tracr pairing sequence under the control of the first regulatory element.

30. 30
La célula huésped eucariota del párrafo 26, en la que el componente (a) comprende además dos o más secuencias guía ligadas de manera operable al primer elemento regulador, en el que cuando se expresa, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana diferente en una célula eucariota. The eukaryotic host cell of paragraph 26, wherein component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs the specific binding of the sequence of a CRISPR complex to a different target sequence in a eukaryotic cell.

31. 31.
La célula huésped eucariota del párrafo 26, que comprende además un tercer elemento regulador ligado de manera operable a dicha secuencia tracr. The eukaryotic host cell of paragraph 26, further comprising a third regulatory element operably linked to said tracr sequence.

32. 32
La célula huésped eucariotas del párrafo 26, en la que la secuencia tracr presenta al menos 50% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. The eukaryotic host cell of paragraph 26, wherein the tracr sequence has at least 50% sequence complementarity along the length of the tracr pairing sequence when aligned optimally.

33. 33.
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. The eukaryotic host cell of paragraph 26, wherein the CRISPR enzyme comprises one or more nuclear localization sequences of sufficient strength to drive the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

34.3. 4.
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR es una enzima del sistema CRISPR de tipo II.  The eukaryotic host cell of paragraph 26, wherein the CRISPR enzyme is an enzyme of the type II CRISPR system.

35.35
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR es una enzima Cas9.  The eukaryotic host cell of paragraph 26, wherein the CRISPR enzyme is a Cas9 enzyme.

36.36.
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR es codón optimizada para expresión en una célula eucariota.  The eukaryotic host cell of paragraph 26, wherein the CRISPR enzyme is codon optimized for expression in a eukaryotic cell.

37. 37.
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR dirige la escisión de una o más cadenas en la posición de la secuencia diana. The eukaryotic host cell of paragraph 26, in which the CRISPR enzyme directs the cleavage of one or more chains at the position of the target sequence.

38. 38.
La célula huésped eucariota del párrafo 26, en la que la enzima CRISPR carece de actividad de escisión de la cadena de ADN. The eukaryotic host cell of paragraph 26, in which the CRISPR enzyme lacks DNA chain cleavage activity.

39. 39.
La célula huésped eucariota del párrafo 26, en la que el primer elemento regulador es un activador de polimerasa III. The eukaryotic host cell of paragraph 26, wherein the first regulatory element is a polymerase III activator.

40. 40
La célula huésped eucariota del párrafo 26, en la que el segundo elemento regulador es un activador de polimerasa II. The eukaryotic host cell of paragraph 26, wherein the second regulatory element is a polymerase II activator.

41.41.
La célula huésped eucariota del párrafo 31, en la que el tercer elemento regulador es un activador de polimerasa  The eukaryotic host cell of paragraph 31, wherein the third regulatory element is a polymerase activator

III. III.

42. 42
La célula huésped eucariota del párrafo 26, en la que la secuencia guía tiene al menos 15 nucleótidos de longitud. The eukaryotic host cell of paragraph 26, in which the guide sequence is at least 15 nucleotides in length.

43. 43
La célula huésped eucariota del párrafo 26, en la que menos de 50% de los nucleótidos de la secuencia guía participa en apareamiento de bases autocomplementario cuando se dobla de manera óptima. The eukaryotic host cell of paragraph 26, in which less than 50% of the nucleotides in the guide sequence participate in autocomplementary base pairing when optimally bent.

44.44.
Un animal no humano que comprende una célula huésped eucariota de uno cualquiera de los párrafos 26-43.  A non-human animal comprising a eukaryotic host cell of any one of paragraphs 26-43.

45. Four. Five.
Un estuche que comprende un sistema vector e instrucciones para usar dicho estuche, comprendiendo el sistema vector: A case comprising a vector system and instructions for using said case, the vector system comprising:

a. to.
un primer elemento regulador ligado de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana en una célula eucariota, en el que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting a guide sequence upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or

b.b.
un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear.  a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence.

46.46.
El estuche del párrafo 45, en el que dicho estuche comprende los componentes (a) y (b) situados en los mismos vectores o diferentes del sistema.  The kit in paragraph 45, wherein said kit comprises components (a) and (b) located in the same or different vectors of the system.

47.47
El estuche del párrafo 45, en el que el componente (a) comprende además las secuencias tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador.  The kit in paragraph 45, wherein component (a) further comprises the tracr sequences downstream of the tracr pairing sequence under the control of the first regulatory element.

48. 48.
El estuche del párrafo 45, en el que el componente (a) comprende además dos o más secuencias guía ligadas de manera operable al primer elemento regulador, en el que cuando se expresa, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia diana diferente en una célula eucariota. The kit in paragraph 45, wherein component (a) further comprises two or more guide sequences operably linked to the first regulatory element, in which when expressed, each of the two or more guide sequences directs the specific binding from the sequence of a CRISPR complex to a different target sequence in a eukaryotic cell.

49. 49.
El estuche del párrafo 45, en el que el sistema comprende la secuencia tracr bajo el control de un tercer elemento regulador. The case of paragraph 45, in which the system comprises the sequence tracr under the control of a third regulatory element.

50. fifty.
El estuche del párrafo 45, en el que la secuencia tracr presenta al menos 50% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. The kit in paragraph 45, in which the tracr sequence has at least 50% sequence complementarity along the length of the tracr pairing sequence when aligned optimally.

51. 51.
El estuche del párrafo 45, en el que la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. The kit in paragraph 45, wherein the CRISPR enzyme comprises one or more nuclear localization sequences of sufficient strength to conduct the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

52.52
El estuche del párrafo 45, en el que la enzima CRISPR es una enzima del sistema CRISPR de tipo II.  The kit in paragraph 45, wherein the CRISPR enzyme is an enzyme of the type II CRISPR system.

53.53.
El estuche del párrafo 45, en el que la enzima CRISPR es una enzima Cas9.  The kit in paragraph 45, in which the CRISPR enzyme is a Cas9 enzyme.

54. 54
El estuche del párrafo 45, en el que la enzima CRISPR es codón optimizada para expresión en una célula eucariota. The kit in paragraph 45, in which the enzyme CRISPR is codon optimized for expression in a eukaryotic cell.

55.55.
El estuche del párrafo 45, en el que la enzima CRISPR dirige la escisión de una o dos cadenas en la posición de la secuencia diana.  The kit in paragraph 45, in which the enzyme CRISPR directs the cleavage of one or two chains at the position of the target sequence.

56.56.
El estuche del párrafo 45, en el que la enzima CRISPR carece de actividad de escisión de la cadena de ADN.  The kit in paragraph 45, in which the CRISPR enzyme lacks DNA chain cleavage activity.

57.57.
El estuche del párrafo 45, en el que el primer elemento regulador es un activador de polimerasa III.  The kit in paragraph 45, wherein the first regulatory element is a polymerase III activator.

58. 58.
El estuche del párrafo 45, en el que el segundo elemento regulador es un activador de polimerasa II. The case of paragraph 45, wherein the second regulatory element is a polymerase II activator.

59.59.
El estuche del párrafo 49, en el que el tercer elemento regulador es un activador de polimerasa III.  The case of paragraph 49, wherein the third regulatory element is a polymerase III activator.

60.60
El estuche del párrafo 45, en el que la secuencia guía tiene al menos 15 nucleótidos de longitud.  The kit in paragraph 45, in which the guide sequence is at least 15 nucleotides in length.

61. 61.
El estuche del párrafo 45, en el que menos de 50% de los nucleótidos de la secuencia guía participa en apareamiento de bases autocomplementario cuando se dobla de manera óptima. The kit in paragraph 45, in which less than 50% of the nucleotides in the guide sequence participate in autocomplementary base pairing when optimally bent.

62. 62
Un sistema informático para seleccionar una secuencia diana candidata dentro de una secuencia de ácidos nucleicos en una célula eucariota para fijar como objetivo por un complejo CRISPR, comprendiendo el sistema: A computer system for selecting a candidate target sequence within a nucleic acid sequence in a eukaryotic cell to target a CRISPR complex, the system comprising:

a.to.
una unidad de memoria configurada para recibir y/o almacenar dicha secuencia de ácidos nucleicos y  a memory unit configured to receive and / or store said nucleic acid sequence and

b. b.
uno o más procesadores solos o combinados programados para (i) localizar una secuencia unidad de CRISPR dentro de dicha secuencia de ácidos nucleicos y (ii) seleccionar una secuencia adyacente a dicha secuencia unidad de CRISPR localizada como la secuencia diana candidata a la que se une el complejo CRISPR. one or more single or combined processors programmed to (i) locate a CRISPR unit sequence within said nucleic acid sequence and (ii) select a sequence adjacent to said CRISPR unit sequence located as the candidate target sequence to which it binds the CRISPR complex.

63.63.
El sistema informático del párrafo 62, en el que dicha etapa de localización comprende identificar una secuencia  The computer system of paragraph 62, wherein said location step comprises identifying a sequence

unidad de CRISPR situada menos de aproximadamente 500 nucleótidos lejos de dicha secuencia diana. CRISPR unit located less than about 500 nucleotides away from said target sequence.

64. 64.
El sistema informático del párrafo 62, en el que dicha secuencia diana candidata tiene al menos 10 nucleótidos de longitud. The computer system of paragraph 62, wherein said candidate target sequence is at least 10 nucleotides in length.

65. 65
El sistema informático del párrafo 62, en el que el nucleótido en el extremo 3’ de la secuencia diana candidata está situado no más de aproximadamente 10 nucleótidos aguas arriba de la secuencia unidad de CRISPR. The computer system of paragraph 62, wherein the nucleotide at the 3 'end of the candidate target sequence is located no more than about 10 nucleotides upstream of the CRISPR unit sequence.

66. 66.
El sistema informático del párrafo 62, en el que la secuencia de ácidos nucleicos en la célula eucariota es endógena para el genoma eucariota. The computer system of paragraph 62, wherein the nucleic acid sequence in the eukaryotic cell is endogenous to the eukaryotic genome.

67.67.
El sistema informático de 62, en el que la secuencia de ácidos nucleicos en la célula eucariota es exógena para el genoma eucariota.  The 62 computer system, in which the nucleic acid sequence in the eukaryotic cell is exogenous to the eukaryotic genome.

68. 68.
Un medio legible por ordenador que comprende códigos que, en la ejecución por uno o más procesadores, implementa un método para seleccionar una secuencia diana candidata dentro de una secuencia de ácidos nucleicos en una célula eucariota para fijar como objetivo por un complejo CRISPR, comprendiendo dicho método: A computer-readable medium comprising codes that, in execution by one or more processors, implements a method to select a candidate target sequence within a nucleic acid sequence in a eukaryotic cell to target a CRISPR complex, said said comprising. method:

(a) localizar una secuencia unidad de CRISPR dentro de dicha secuencia de ácidos nucleicos y (b) seleccionar una secuencia adyacente a dicha secuencia unidad de CRISPR localizada como la secuencia diana candidata a la que se une el complejo CRISPR. (a) locating a CRISPR unit sequence within said nucleic acid sequence and (b) selecting a sequence adjacent to said CRISPR unit sequence located as the candidate target sequence to which the CRISPR complex binds.

69. 69.
El medio legible por ordenador del párrafo 68, en el que dicha localización comprende localizar una secuencia unidad de CRISPR que esté menos de aproximadamente 500 nucleótidos lejos de dicha secuencia diana. The computer-readable medium of paragraph 68, wherein said location comprises locating a CRISPR unit sequence that is less than about 500 nucleotides away from said target sequence.

70. 70.
El medio legible por ordenador del párrafo 68, en el que dicha secuencia diana candidata tiene al menos 10 nucleótidos de longitud. The computer-readable medium of paragraph 68, wherein said candidate target sequence is at least 10 nucleotides in length.

71. 71.
El medio legible por ordenador del párrafo 68, en el que el nucleótido en el extremo 3’ de la secuencia diana candidata está situado no más de aproximadamente 10 nucleótidos aguas arriba de la secuencia unidad de CRISPR. The computer-readable medium of paragraph 68, wherein the nucleotide at the 3 'end of the candidate target sequence is located no more than about 10 nucleotides upstream of the CRISPR unit sequence.

72.72.
El medio legible por ordenador del párrafo 68, en el que la secuencia de ácidos nucleicos en la célula eucariota es endógena para el genoma eucariota.  The computer-readable medium of paragraph 68, wherein the nucleic acid sequence in the eukaryotic cell is endogenous to the eukaryotic genome.

73.73
El medio legible por ordenador del párrafo 68, en el que la secuencia de ácidos nucleicos en la célula eucariota es exógena para el genoma eucariota.  The computer-readable medium of paragraph 68, wherein the nucleic acid sequence in the eukaryotic cell is exogenous to the eukaryotic genome.

74. 74.
Un método para modificar un polinucleótido fijado como objetivo en una célula eucariota, comprendiendo el método permitir que un complejo CRISPR se una al polinucleótido fijado como objetivo para efectuar escisión de dicho polinucleótido fijado como objetivo modificando de ese modo el polinucleótido fijado como objetivo, en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia diana dentro de dicho polinucleótido fijado como objetivo, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se hibrida a una secuencia tracr. A method for modifying a target fixed polynucleotide in a eukaryotic cell, the method comprising allowing a CRISPR complex to bind to the target fixed polynucleotide to effect cleavage of said target fixed polynucleotide thereby modifying the target fixed polynucleotide, in the that the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence within said target fixed polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence .

75. 75.
El método del párrafo 74, en el que dicha escisión comprende escindir una o más cadenas en la posición de la secuencia diana por dicha enzima CRISPR. The method of paragraph 74, wherein said cleavage comprises cleaving one or more chains at the position of the target sequence by said CRISPR enzyme.

76. 76
El método del párrafo 74, en el que dicha escisión da como resultado transcripción disminuida de un gen fijado como objetivo. The method of paragraph 74, wherein said cleavage results in decreased transcription of a target gene.

77.77.
El método del párrafo 74, que comprende además reparar dicho polinucleótido fijado como objetivo escindido por recombinación homóloga con un polinucleótido de plantilla exógena, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido fijado como objetivo.  The method of paragraph 74, further comprising repairing said target fixed polynucleotide cleaved by homologous recombination with an exogenous template polynucleotide, wherein said repair results in a mutation comprising insertion, deletion or replacement of one or more nucleotides of said target polynucleotide.

78. 78.
El método del párrafo 77, en el que dicha mutación da como resultado uno o más cambios de aminoácidos en una proteína expresada de un gen que comprende la secuencia diana. The method of paragraph 77, wherein said mutation results in one or more amino acid changes in an expressed protein of a gene comprising the target sequence.

79.79.
El método del párrafo 74, que comprende además suministrar uno o más vectores a dicha célula eucariota, en el que uno o más vectores conducen la expresión de uno o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr.  The method of paragraph 74, further comprising providing one or more vectors to said eukaryotic cell, in which one or more vectors lead to the expression of one or more of: the CRISPR enzyme, the guiding sequence linked to the tracr and pairing sequence the sequence tracr.

80.80.
El método del párrafo 79, en el que dichos vectores se suministran a la célula eucariota en un individuo.  The method of paragraph 79, wherein said vectors are delivered to the eukaryotic cell in an individual.

81.81.
El método del párrafo 74, en el que dicha modificación tiene lugar en dicha célula eucariota en un cultivo celular.  The method of paragraph 74, wherein said modification takes place in said eukaryotic cell in a cell culture.

82. 82.
El método del párrafo 74, que comprende además aislar dicha célula eucariota de un individuo previamente a The method of paragraph 74, further comprising isolating said eukaryotic cell from an individual prior to

dicha modificación. such modification.

83.83.
El método del párrafo 82, que comprende además devolver dicha célula eucariota y/o células derivadas de ahí a dicho individuo.  The method of paragraph 82, further comprising returning said eukaryotic cell and / or cells derived therefrom to said individual.

84. 84.
Un método para modificar la expresión de un polinucleótido en una célula eucariota, comprendiendo el método: permitir que un complejo CRISPR se una al polinucleótido de manera que dicha unión dé como resultado expresión aumentada o disminuida de dicho polinucleótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia diana dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se hibrida a una secuencia tracr. A method for modifying the expression of a polynucleotide in a eukaryotic cell, the method comprising: allowing a CRISPR complex to bind to the polynucleotide so that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence within said polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence.

85. 85.
El método del párrafo 74, que comprende además suministrar uno o más vectores a dichas células eucariotas, en el que uno o más vectores conducen la expresión de uno o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr. The method of paragraph 74, further comprising providing one or more vectors to said eukaryotic cells, in which one or more vectors lead to the expression of one or more of: the CRISPR enzyme, the guiding sequence linked to the tracr and pairing sequence the sequence tracr.

86. 86.
Un método para generar una célula eucariota modelo que comprende un gen de enfermedad mutado, comprendiendo el método: A method for generating a model eukaryotic cell comprising a mutated disease gene, the method comprising:

a. to.
introducir uno o más vectores en una célula eucariota, en el que uno o más vectores conducen la expresión de uno o más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr y una secuencia tracr y introducing one or more vectors into a eukaryotic cell, in which one or more vectors lead to the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a tracr pairing sequence and a tracr sequence and

b. b.
permitir que un complejo CRISPR se una a un polinucleótido fijado como objetivo para efectuar escisión del polinucleótido fijado como objetivo dentro de dicho gen de enfermedad, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana dentro del polinucleótido fijado como objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr, generando de ese modo una célula eucariota modelo que comprende un gen de enfermedad mutado. allowing a CRISPR complex to bind to a target fixed polynucleotide to effect cleavage of the target fixed polynucleotide within said disease gene, wherein the CRISPR complex comprises the complexed CRISPR enzyme with (1) the guide sequence that hybridizes to the target sequence within the target fixed polynucleotide and (2) the tracr pairing sequence that hybridizes to the tracr sequence, thereby generating a model eukaryotic cell comprising a mutated disease gene.

87. 87.
El método del párrafo 86, en el que dicha escisión comprende escindir una o más cadenas en la posición de la secuencia diana por dicha enzima CRISPR. The method of paragraph 86, wherein said cleavage comprises cleaving one or more chains at the position of the target sequence by said CRISPR enzyme.

88. 88.
El método del párrafo 86, en el que dicha escisión da como resultado transcripción disminuida de un gen fijado como objetivo. The method of paragraph 86, wherein said cleavage results in decreased transcription of a target gene.

89.89.
El método del párrafo 86, que comprende además reparar dicho polinucleótido fijado como objetivo escindido por recombinación homóloga con un polinucleótido de plantilla exógena, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido fijado como objetivo.  The method of paragraph 86, further comprising repairing said target-fixed polynucleotide cleaved by homologous recombination with an exogenous template polynucleotide, wherein said repair results in a mutation comprising insertion, deletion or replacement of one or more nucleotides of said target polynucleotide.

90. 90.
El método del párrafo 89, en el que dicha mutación da como resultado uno o más cambios de aminoácidos en una proteína expresada de un gen que comprende la secuencia diana. The method of paragraph 89, wherein said mutation results in one or more amino acid changes in an expressed protein of a gene comprising the target sequence.

91. 91.
Un método para desarrollar un agente biológicamente activo que module un caso de señalización celular asociado a un gen de enfermedad, que comprende: A method for developing a biologically active agent that modulates a case of cellular signaling associated with a disease gene, comprising:

a.to.
poner en contacto un compuesto de ensayo con una célula modelo según uno cualquiera de los párrafos 86-90 y  contacting a test compound with a model cell according to any one of paragraphs 86-90 and

b.b.
detectar un cambio en una lectura que sea indicativo de una reducción o un aumento de un caso de señalización celular asociado a dicha mutación en dicho gen de enfermedad, desarrollándose de ese modo dicho agente biológicamente activo que module dicho caso de señalización celular asociado a dicho gen de enfermedad.  detecting a change in a reading that is indicative of a reduction or an increase in a case of cellular signaling associated with said mutation in said disease gene, thereby developing said biologically active agent that modulates said case of cellular signaling associated with said gene of disease

92. 92.
Un polinucleótido recombinante que comprende una secuencia guía aguas arriba de una secuencia de emparejamiento tracr, en el que la secuencia guía cuando se expresa dirige la unión específica de la secuencia de un complejo CRISPR a una correspondiente secuencia diana presente en una célula eucariota. A recombinant polynucleotide comprising a guide sequence upstream of a tracr pairing sequence, in which the guide sequence when expressed directs the specific binding of the sequence of a CRISPR complex to a corresponding target sequence present in a eukaryotic cell.

93.93.
El polinucleótido recombinante del párrafo 89, en el que la secuencia diana es una secuencia vírica presente en una célula eucariota.  The recombinant polynucleotide of paragraph 89, wherein the target sequence is a viral sequence present in a eukaryotic cell.

94.94.
El polinucleótido recombinante del párrafo 89, en el que la secuencia diana es un protooncogén o un oncogén.  The recombinant polynucleotide of paragraph 89, wherein the target sequence is a protooncogene or an oncogene.

Aunque se han presentado realizaciones preferidas de la presente invención y se han descrito en la presente memoria, será evidente para los expertos en la materia que tales realizaciones se proporcionan como ejemplo solamente. Ahora tendrán lugar numerosas variaciones, cambios y sustituciones para los expertos en la materia sin apartarse de la invención. Se debería entender que se pueden emplear diversas alternativas a las realizaciones de la invención descritas en la presente memoria en la práctica de la invención. Se desea que las siguientes reivindicaciones definan el alcance de la invención y que los métodos y estructuras dentro del alcance de estas Although preferred embodiments of the present invention have been presented and described herein, it will be apparent to those skilled in the art that such embodiments are provided as an example only. Many variations, changes and substitutions will now take place for those skilled in the art without departing from the invention. It should be understood that various alternatives to the embodiments of the invention described herein can be employed in the practice of the invention. It is desired that the following claims define the scope of the invention and that the methods and structures within the scope of these

reivindicaciones y sus equivalentes estén cubiertos así. claims and their equivalents are covered as well.

Referencias References

Claims (23)

REIVINDICACIONES 1. Una composición que no se encuentra en la naturaleza o lograda, que comprende un sistema vector que comprende uno o más vectores que comprenden: 1. A composition that is not found in nature or achieved, comprising a vector system comprising one or more vectors comprising: I. un primer elemento regulador ligado de manera operable a una secuencia de polinucleótidos de ARN quimérico (ARNqui) del sistema CRISPR-Cas, en el que la secuencia de polinucleótidos comprende: I. a first regulatory element operably linked to a chimeric RNA polynucleotide sequence (siRNA) of the CRISPR-Cas system, wherein the polynucleotide sequence comprises:
(a)(to)
una secuencia guía capaz de hibridarse a una secuencia diana en una célula eucariota,  a guide sequence capable of hybridizing to a target sequence in a eukaryotic cell,
(b)(b)
una secuencia de emparejamiento tracr y  a tracr pairing sequence and
(c)(C)
una secuencia tracr y  a tracr sequence and
II. un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende al menos una o más secuencias de localización nuclear (las NLS) en la proximidad de un extremo de la enzima CRISPR, II. a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising at least one or more nuclear localization sequences (the NLS) in the vicinity of one end of the CRISPR enzyme, en la que (a), (b) y (c) se disponen en una orientación 5’ a 3’, en la que los componentes I y II se sitúan en vectores iguales o diferentes del sistema, en la que cuando se transcribe, la secuencia de emparejamiento tracr hibrida a la secuencia tracr y la secuencia in which (a), (b) and (c) are arranged in a 5 ’to 3’ orientation, in which components I and II are placed in the same or different vectors of the system, in which when transcribed, the tracr pairing sequence hybridizes to the tracr sequence and the sequence guía dirige la unión específica de la secuencia de un complejo de CRISPR a la secuencia diana, guide directs the specific binding of the sequence of a CRISPR complex to the target sequence, en la que el complejo de CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y en la que la secuencia de polinucleótidos de ARN quimérico comprende dos o más horquillas. wherein the CRISPR complex comprises the CRISPR enzyme complexed with (1) the guiding sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and in which the polynucleotide sequence Chimeric RNA comprises two or more hairpins.
2. Una composición que no se encuentra en la naturaleza o lograda, que comprende un sistema vector que comprende uno o más vectores que comprenden: 2. A composition that is not found in nature or achieved, comprising a vector system comprising one or more vectors comprising: I. un primer elemento regulador ligado de manera operable a: I. a first regulatory element operably linked to:
(a)(to)
una secuencia guía capaz de hibridar a una secuencia diana en una célula eucariota y  a guide sequence capable of hybridizing to a target sequence in a eukaryotic cell and
(b)(b)
una secuencia de emparejamiento tracr,  a tracr pairing sequence,
II. un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzima que codifica una enzima CRISPR que comprende al menos una o más secuencias de localización nuclear (las NLS) en la proximidad de un extremo de la enzima CRISPR y II. a second regulatory element operably linked to an enzyme coding sequence encoding a CRISPR enzyme comprising at least one or more nuclear localization sequences (the NLS) in the vicinity of one end of the CRISPR enzyme and III. un tercer elemento regulador ligado de manera operable a una secuencia tracr, III. a third regulatory element operably linked to a tracr sequence, en la que los componentes, I, II y III se sitúan en vectores iguales o los mismos o diferentes vectores del sistema, en la que cuando se transcribe, la secuencia de emparejamiento de tracr se hibrida a la secuencia tracr y la secuencia guía dirige la unión específica de la secuencia de un complejo de CRISPR a la secuencia diana y in which the components, I, II and III are placed in the same or the same or different vectors of the system, in which when transcribed, the tracr pairing sequence hybridizes to the tracr sequence and the guiding sequence directs the specific binding of the sequence of a CRISPR complex to the target sequence and en la que el complejo de CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se híbrida a la secuencia diana y (2) la secuencia de emparejamiento tracr que se híbrida a la secuencia tracr. wherein the CRISPR complex comprises the CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence.
3. 3.
La composición según la reivindicación 1, en la que se usan secuencias de polinucleótidos de ARNqui múltiples, para proporcionar un sistema multiplexado o según la reivindicación 2, en la que se usan secuencias guía múltiples y una secuencia tracr única, para proporcionar un sistema multiplexado. The composition according to claim 1, wherein multiple RNA polynucleotide sequences are used, to provide a multiplexed system or according to claim 2, wherein multiple guide sequences and a single tracr sequence are used, to provide a multiplexed system.
4.Four.
Un sistema de enzima CRISPR multiplexado, en el que el sistema comprende un sistema vector como se describe en la reivindicación 1, en el que en el sistema multiplexado se usan múltiples secuencias de polinucleótidos de ARNqui o en el que el sistema comprende un sistema vector como se describe en la reivindicación 2, en el que en el sistema multiplexado se usan múltiples secuencias guía y una secuencia tracr única.  A multiplexed CRISPR enzyme system, wherein the system comprises a vector system as described in claim 1, wherein multiple RNA polynucleotide sequences are used in the multiplexed system or in which the system comprises a vector system such as It is described in claim 2, wherein in the multiplexed system multiple guide sequences and a single tracr sequence are used.
5. 5.
La composición o el sistema según una cualquiera de las reivindicaciones 1, 2, 3 o 4, en que el primer elemento regulador es un activador de polimerasa III. The composition or system according to any one of claims 1, 2, 3 or 4, wherein the first regulatory element is a polymerase III activator.
6. 6.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que el segundo elemento regulador es un activador de polimerasa II. The composition or system according to any one of the preceding claims, wherein the second regulatory element is a polymerase II activator.
7.7.
La composición o el sistema según la reivindicación 2 o una cualquiera de las reivindicaciones 3 a 6 cuando sea  The composition or system according to claim 2 or any one of claims 3 to 6 whenever
dependiente de la reivindicación 2, en que el tercer elemento regulador es un activador de polimerasa III. dependent on claim 2, wherein the third regulatory element is a polymerase III activator.
8.8.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que la enzima CRISPR comprende una o más NLS de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota.  The composition or system according to any one of the preceding claims, wherein the CRISPR enzyme comprises one or more NLS of sufficient strength to conduct the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.
9. 9.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que la secuencia tracr presenta al menos 50% de complementariedad de secuencia a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. The composition or system according to any one of the preceding claims, wherein the tracr sequence has at least 50% sequence complementarity along the length of the tracr pairing sequence when optimally aligned.
10. 10.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que la enzima CRISPR es una enzima del sistema CRISPR de tipo II, preferiblemente en la que la enzima CRISPR es una enzima Cas9. The composition or system according to any one of the preceding claims, wherein the CRISPR enzyme is an enzyme of the type II CRISPR system, preferably wherein the CRISPR enzyme is a Cas9 enzyme.
11. eleven.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. The composition or system according to any one of the preceding claims, wherein the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell.
12.12.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, en que la secuencia guía tiene al menos 15 nucleótidos de longitud.  The composition or system according to any one of the preceding claims, wherein the guide sequence is at least 15 nucleotides in length.
13. 13.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, cuando dependa de la reivindicación 1, en que la secuencia de polinucleótidos de ARN quimérico comprende dos, tres, cuatro o cinco horquillas. The composition or system according to any one of the preceding claims, when dependent on claim 1, wherein the chimeric RNA polynucleotide sequence comprises two, three, four or five hairpins.
14. 14.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, cuando dependa de la reivindicación 1, en que los componentes I y II están situados en el mismo vector del sistema o cuando dependa de la reivindicación 2, en que los componentes I, II y III están situados en el mismo vector del sistema. The composition or system according to any one of the preceding claims, when it depends on claim 1, in which the components I and II are located in the same system vector or when it depends on claim 2, in which the components I, II and III are located in the same system vector.
15. fifteen.
La composición o el sistema según una cualquiera de las reivindicaciones precedentes, cuando dependa de la reivindicación 1, en que los componentes I y II están situados en diferentes vectores del sistema o cuando dependa de la reivindicación 2, en que los componentes I, II y III están situados en diferentes vectores del sistema. The composition or system according to any one of the preceding claims, when it depends on claim 1, in which components I and II are located in different vectors of the system or when it depends on claim 2, in which components I, II and III are located in different system vectors.
16. 16.
Una célula huésped eucariota que comprende la composición o el sistema según una cualquiera de las reivindicaciones precedentes. A eukaryotic host cell comprising the composition or system according to any one of the preceding claims.
17.17.
Un organismo no humano que comprende la célula huésped eucariota según la reivindicación 16.  A non-human organism comprising the eukaryotic host cell according to claim 16.
18.18.
Un estuche que comprende la composición según una cualquiera de las reivindicaciones 1 a 15 e instrucciones para usar dicho estuche.  A case comprising the composition according to any one of claims 1 to 15 and instructions for using said case.
19.19.
Un método ex vivo o in vivo para alterar la expresión de un sitio genómico de interés en una célula eucariota, que comprende:  An ex vivo or in vivo method for altering the expression of a genomic site of interest in a eukaryotic cell, comprising:
poner en contacto el sitio genómico con la composición según una cualquiera de las reivindicaciones 1 a 15 y determinar si la expresión del sitio genómico ha sido alterada, siempre que el método no comprenda un procedimiento para modificar la identidad genética de la línea germinal de seres humanos. contacting the genomic site with the composition according to any one of claims 1 to 15 and determining whether the expression of the genomic site has been altered, provided that the method does not comprise a procedure for modifying the genetic identity of the germline of humans .
20. twenty.
El método según la reivindicación 19, en el que la secuencia guía dirige la unión específica de la secuencia del complejo CRISPR a la secuencia diana basándose en la presencia de una secuencia motivo de CRISPR. The method according to claim 19, wherein the guide sequence directs the specific binding of the sequence of the CRISPR complex to the target sequence based on the presence of a CRISPR motif sequence.
21.twenty-one.
El método según la reivindicación 20, en el que la secuencia motivo de CRISPR es NAG.  The method according to claim 20, wherein the CRISPR motif sequence is NAG.
22. 22
Un método para seleccionar una o más célula(s) procariota(s) introduciendo una o más mutaciones en un gen que comprende un polinucleótido objetivo en una o más célula(s) procariota(s), comprendiendo el método: A method for selecting one or more prokaryotic cell (s) by introducing one or more mutations into a gene comprising a target polynucleotide in one or more prokaryotic cell (s), the method comprising:
introducir uno o más vectores en la célula o las célula(s) procariota(s), en el que uno o más vectores conducen la expresión de uno más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr, una secuencia tracr y una plantilla de edición y introducing one or more vectors into the cell or prokaryotic cell (s), in which one or more vectors lead to the expression of one more of: a CRISPR enzyme, a guide sequence linked to a tracr pairing sequence, a tracr sequence and an editing template and en el que cada una de una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr, una secuencia tracr y una plantilla de edición están presentes en la célula o las células; wherein each of a CRISPR enzyme, a guide sequence linked to a tracr pairing sequence, a tracr sequence and an editing template are present in the cell or cells; en el que la plantilla de edición comprende una o más mutaciones que se tienen que introducir en el gen y una o más mutaciones suprimen la escisión de enzima CRISPR; wherein the editing template comprises one or more mutations that have to be introduced into the gene and one or more mutations suppress the cleavage of CRISPR enzyme; permitir la recombinación homóloga de la plantilla de edición con el polinucleótido objetivo en la célula o las células que se tienen que seleccionar para introducir de ese modo una o más de esas mutaciones que supriman la escisión de enzima CRISPR en el gen; allow homologous recombination of the editing template with the target polynucleotide in the cell or cells that have to be selected to thereby introduce one or more of those mutations that suppress the cleavage of CRISPR enzyme in the gene; permitir que un complejo CRISPR se una al polinucleótido objetivo para efectuar escisión del polinucleótido objetivo en dicho gen, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a una secuencia diana en el polinucleótido objetivo y (2) la secuencia de emparejamiento tracr que se allowing a CRISPR complex to bind to the target polynucleotide to effect cleavage of the target polynucleotide in said gene, wherein the CRISPR complex comprises the CRISPR enzyme complexed with (1) the guide sequence that hybridizes to a target sequence in the target polynucleotide and (2) the tracr pairing sequence that is 5 hibrida a la secuencia tracr, 5 hybridizes to the tracr sequence, en el que la escisión por el complejo CRISPR del polinucleótido objetivo induce la muerte celular, in which cleavage by the CRISPR complex of the target polynucleotide induces cell death, permitir que se seleccionen de ese modo una o más célula(s) procariota(s) en las que se haya introducido una o más mutaciones. allow one or more prokaryotic cell (s) to be selected in which one or more mutations have been introduced.
23. El método según la reivindicación 22, en el que la enzima CRISPR es una enzima del sistema CRISPR de tipo II, 10 preferiblemente en el que la enzima CRISPR es Cas9. 23. The method according to claim 22, wherein the CRISPR enzyme is an enzyme of the type II CRISPR system, preferably wherein the CRISPR enzyme is Cas9. 144 145 146 144 145 146 150 151 152 150 151 152 hypothetical protein = proteína hipotética; HNH endonuclease = endonucleasa HNH; Mcra/HNH-like CRISPRassociated nuclease Csn1 = Csn1 de endonucleasa asociada a CRISPR de tipo Mcra/HNH; putative HNH endonuclease domain protein = proteína de dominio de la endonucleasa HNH putativa; CRISPR-associated endonuclease Csn1 = Csn1 de endonucleasa asociada a CRISPR; Restriction endonuclease = endonucleasa de restricción; exopolyphosphatase = exopolifosfatasa; conserved hypothetical protein = proteína hipotética conservada; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; putative CRISPR-associated (Cas) Protein = Proteína (Cas) asociada a CRISPR putativa; hypothetical protein = hypothetical protein; HNH endonuclease = HNH endonuclease; Mcra / HNH-like CRISPRassociated nuclease Csn1 = Csn1 of endonuclease associated with CRISPR of type Mcra / HNH; putative HNH endonuclease domain protein = putative HNH endonuclease domain protein; CRISPR-associated endonuclease Csn1 = Csn1 of endonuclease associated with CRISPR; Restriction endonuclease = restriction endonuclease; exopolyphosphatase = exopolyphosphatase; conserved hypothetical protein = conserved hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; putative CRISPR-associated (Cas) Protein = Protein (Cas) associated with putative CRISPR; Putative cytoplasmic protein = proteína citoplasmática putativa; cytoplasmic protein = proteína citoplasmática; hypothetical protein = proteína hipotética; CRISPR-associated Protein Csn1 = Csn1 Proteína asociada a CRISPR; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPR-associated Protein Cas9/Csn1, subtype II = Proteína Cas9/Csn1 asociada a CRISPR, subtipo II; possible CRISPR-associated protein = Proteína asociada a CRISPR posible; conserved hypothetical protein = proteína hipotética conservada; Putative cytoplasmic protein = putative cytoplasmic protein; cytoplasmic protein = cytoplasmic protein; hypothetical protein = hypothetical protein; CRISPR-associated Protein Csn1 = Csn1 Protein associated with CRISPR; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPR-associated Protein Cas9 / Csn1, subtype II = Cas9 / Csn1 protein associated with CRISPR, subtype II; possible CRISPR-associated protein = Protein associated with CRISPR possible; conserved hypothetical protein = conserved hypothetical protein; Putative CRISPR-associated Protein Csx12 family = familia Csx12 de proteína asociada a CRISPR putativa; hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPR-associated Protein Cas9/Csn1, subtype II = Proteína Cas9/Csn1 asociada a CRISPR, subtipo II; conserved hypothetical protein = proteína hipotética conservada; CRISPR-system related protein = proteína relacionada con el sistema CRISPR; CRISPR-system like protein = proteína de tipo sistema CRISPR; CRISPRassociated endomuclease Csn1 family protein = proteína de la familia Csn1 de endonucleasa asociada a CRISPR; membrane protein = proteína de membrana; CRISPR-associated large protein (provisional), putative = proteína grande asociada a CRISPR (provisional) putativa; CRISPR-associated CasSe = CasSe asociada a CRISPR. Putative CRISPR-associated Protein Csx12 family = Csx12 family of putative CRISPR associated protein; hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPR-associated Protein Cas9 / Csn1, subtype II = Cas9 / Csn1 protein associated with CRISPR, subtype II; conserved hypothetical protein = conserved hypothetical protein; CRISPR-system related protein = protein related to the CRISPR system; CRISPR-system like protein = CRISPR system type protein; CRISPRassociated endomuclease Csn1 family protein = Csn1 family of endonuclease family associated with CRISPR; membrane protein = membrane protein; CRISPR-associated large protein (provisional), putative = large protein associated with CRISPR (provisional) putative; CRISPR-associated CasSe = CasSe associated with CRISPR. Putative CRISPR-associated Protein = proteína asociada a CRISPR putativa; hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPRassociated Protein Cas9/Csn1, subtype II = Proteína Cas9/Csn1 asociada a CRISPR, subtipo II; CRISPR-associated endonuclease Csn1 family protein = proteína de la familia Csn1 de endonucleasa asociada a CRISPR; CRISPRassociated CasSe family protein = proteína de la familia CasSe asociada a CRISPR Putative CRISPR-associated Protein = putative CRISPR associated protein; hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPRassociated Protein Cas9 / Csn1, subtype II = Cas9 / Csn1 protein associated with CRISPR, subtype II; CRISPR-associated endonuclease Csn1 family protein = Csn1 family of endonuclease family associated with CRISPR; CRISPRassociated CasSe family protein = CasSe family protein associated with CRISPR Putative CRISPR-associated (Cas) Protein = proteína (Cas) asociada a CRISPR putativa; hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPRassociated endonuclease Csn1 family protein = proteína de la familia Csn1 de endonucleasa asociada a CRISPR; conserved hypothetical protein = proteína hipotética conservada; Csn1-like CRISPR-associated protein = proteína asociada a CRISPR de tipo Csn1; Putative CRISPR-associated (Cas) Protein = protein (Cas) associated with putative CRISPR; hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPRassociated endonuclease Csn1 family protein = Csn1 family of endonuclease family associated with CRISPR; conserved hypothetical protein = conserved hypothetical protein; Csn1-like CRISPR-associated protein = CRISPR associated protein of type Csn1; Putative CRISPR-associated (Cas) Protein = proteína (Cas) asocida a CRISPR putativa; hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPRassociated endonuclease Csn1 family protein = proteína de la familia Csn1 de endonucleasa asociada a CRISPR; conserved hypothetical protein = proteína hipotética conservada; Csn1-like CRISPR-associated protein = proteína asociada a CRISPR de tipo Csn1; Putative CRISPR-associated (Cas) Protein = protein (Cas) associated with putative CRISPR; hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPRassociated endonuclease Csn1 family protein = Csn1 family of endonuclease family associated with CRISPR; conserved hypothetical protein = conserved hypothetical protein; Csn1-like CRISPR-associated protein = CRISPR associated protein of type Csn1; Hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPR-associated endonuclease Csn1 family protein = proteína de la familia Csn1 de endonucleasa asociada a CRISPR; conserved hypothetical protein = proteína hipotética conservada; Csn1-like CRISPR-associated protein = proteína asociada a CRISPR de tipo Csn1; CRISPR-system-like protein = Proteína de tipo sistema CRISPR; CRISPR-associated protein Cas9/Csn1= proteína Cas9/Csn1asociada a CRISPR Hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPR-associated endonuclease Csn1 family protein = Csn1 family of endonuclease family associated with CRISPR; conserved hypothetical protein = conserved hypothetical protein; Csn1-like CRISPR-associated protein = CRISPR associated protein of type Csn1; CRISPR-system-like protein = CRISPR system type protein; CRISPR-associated protein Cas9 / Csn1 = Cas9 / Csn1 protein associated with CRISPR Hypothetical protein = proteína hipotética; CRISPR-associated Protein Csn1 family = familia Csn1 Proteína asociada a CRISPR; possible CRISPR-associated protein = Proteína asociada a CRISPR posible; conserved hypothetical protein = proteína hipotética conservada. Hypothetical protein = hypothetical protein; CRISPR-associated Protein Csn1 family = family Csn1 Protein associated with CRISPR; possible CRISPR-associated protein = Protein associated with CRISPR possible; conserved hypothetical protein = conserved hypothetical protein. Hypothetical protein = proteína hipotética; CRISPR-associated Protein, Csn1 family = Proteína asociada a CRISPR, familia Csn1; CRISPR-associated protein Cas9/Csn1, subtype II= proteína Cas9/Csn1asociada a CRISPR, subtipo II; Putative cytoplasmic protein = proteína citoplasmática putativa; cytoplasmic protein = proteína citoplasmática Hypothetical protein = hypothetical protein; CRISPR-associated Protein, Csn1 family = Protein associated with CRISPR, family Csn1; CRISPR-associated protein Cas9 / Csn1, subtype II = Cas9 / Csn1 protein associated with CRISPR, subtype II; Putative cytoplasmic protein = putative cytoplasmic protein; cytoplasmic protein = cytoplasmic protein 210 211 210 211 226 227 226 227 233 234 233 234
ES13812430.0T 2012-12-12 2013-12-12 CRISPR-Cas systems, methods and component compositions for sequence manipulation Active ES2635244T3 (en)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261736527P 2012-12-12 2012-12-12
US201261736527P 2012-12-12
US201361748427P 2013-01-02 2013-01-02
US201361748427P 2013-01-02
US201361757972P 2013-01-29 2013-01-29
US201361757972P 2013-01-29
US201361768959P 2013-02-25 2013-02-25
US201361768959P 2013-02-25
US201361791409P 2013-03-15 2013-03-15
US201361791409P 2013-03-15
US201361835931P 2013-06-17 2013-06-17
US201361835931P 2013-06-17
PCT/US2013/074611 WO2014093595A1 (en) 2012-12-12 2013-12-12 Crispr-cas component systems, methods and compositions for sequence manipulation

Publications (1)

Publication Number Publication Date
ES2635244T3 true ES2635244T3 (en) 2017-10-03

Family

ID=55306645

Family Applications (3)

Application Number Title Priority Date Filing Date
ES13812430.0T Active ES2635244T3 (en) 2012-12-12 2013-12-12 CRISPR-Cas systems, methods and component compositions for sequence manipulation
ES14188820.6T Active ES2618531T3 (en) 2012-12-12 2013-12-12 CRISPR-Cas systems, methods and component compositions for sequence manipulation
ES17162030T Active ES2861623T3 (en) 2012-12-12 2013-12-12 CRISPR-Cas Systems, Methods, and Component Compositions for Sequence Manipulation

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES14188820.6T Active ES2618531T3 (en) 2012-12-12 2013-12-12 CRISPR-Cas systems, methods and component compositions for sequence manipulation
ES17162030T Active ES2861623T3 (en) 2012-12-12 2013-12-12 CRISPR-Cas Systems, Methods, and Component Compositions for Sequence Manipulation

Country Status (4)

Country Link
DK (1) DK2825654T3 (en)
ES (3) ES2635244T3 (en)
HK (2) HK1208045A1 (en)
RU (1) RU2701662C9 (en)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CN108699116A (en) 2015-10-23 2018-10-23 哈佛大学的校长及成员们 The CAS9 albumen of evolution for gene editing
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
AU2017342543B2 (en) 2016-10-14 2024-06-27 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
JP7191388B2 (en) 2017-03-23 2022-12-19 プレジデント アンド フェローズ オブ ハーバード カレッジ Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
WO2020191171A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
MX2022014008A (en) 2020-05-08 2023-02-09 Broad Inst Inc Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence.

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003290937A1 (en) * 2002-11-15 2004-06-15 Trustees Of Boston University Cis/trans riboregulators
EP3284833B1 (en) * 2005-08-26 2021-12-01 DuPont Nutrition Biosciences ApS Use of crispr associated genes (cas)
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
WO2012164565A1 (en) * 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes

Also Published As

Publication number Publication date
RU2019127238A (en) 2019-09-20
ES2618531T3 (en) 2017-06-21
HK1208045A1 (en) 2016-02-19
RU2701662C2 (en) 2019-09-30
RU2701662C9 (en) 2019-10-31
RU2015128102A3 (en) 2018-12-21
RU2015128102A (en) 2018-12-21
HK1247961A1 (en) 2018-10-05
ES2861623T3 (en) 2021-10-06
DK2825654T3 (en) 2017-08-21

Similar Documents

Publication Publication Date Title
US20240117365A1 (en) Crispr-cas component systems, methods and compositions for sequence manipulation
US20200354742A1 (en) CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
ES2635244T3 (en) CRISPR-Cas systems, methods and component compositions for sequence manipulation
ES2553782T3 (en) Systems engineering, methods and guide compositions optimized for sequence manipulation
EP2848690B1 (en) Crispr-cas component systems, methods and compositions for sequence manipulation
ES2552535T3 (en) CRISPR-Cas systems and methods to alter the expression of gene products