[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2348355T3 - Bibliotecas combinatorias de dominios monoméricos. - Google Patents

Bibliotecas combinatorias de dominios monoméricos. Download PDF

Info

Publication number
ES2348355T3
ES2348355T3 ES02725828T ES02725828T ES2348355T3 ES 2348355 T3 ES2348355 T3 ES 2348355T3 ES 02725828 T ES02725828 T ES 02725828T ES 02725828 T ES02725828 T ES 02725828T ES 2348355 T3 ES2348355 T3 ES 2348355T3
Authority
ES
Spain
Prior art keywords
domains
domain
monomeric
monomer
multimer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02725828T
Other languages
English (en)
Inventor
Willem P.C. Stemmer
Joost A. Kolkman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amgen Mountain View Inc
Original Assignee
Amgen Mountain View Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amgen Mountain View Inc filed Critical Amgen Mountain View Inc
Application granted granted Critical
Publication of ES2348355T3 publication Critical patent/ES2348355T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

Un método para identificar un multímero que se una a una molécula diana, comprendiendo los métodos, (a) proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y es un dominio de clase A del receptor de LDL; (b) escrutar la biblioteca de polipéptidos en busca de la afinidad para una molécula diana; (c) identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana; (d) conectar el primer dominio monomérico a una pluralidad de diferentes dominios monoméricos para formar una biblioteca de diferentes multímeros, comprendiendo los multímeros el primer dominio monomérico y uno de una pluralidad de diferentes dominios monoméricos; (e) escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y (f) identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.

Description

Bibliotecas combinatorias de dominios monoméricos.
Antecedentes de la invención
Los análisis de las secuencias de proteínas y de las estructuras tridimensionales han revelado que muchas proteínas están compuestas por un número discreto de dominios monoméricos. La mayoría de las proteínas con dominios monoméricos discretos es extracelular o constituye las porciones extracelulares de las proteínas unidas a la membrana.
Una importante característica de un dominio monomérico discreto es su capacidad para plegarse independientemente o con alguna ayuda limitada. La ayuda limitada puede incluir la ayuda de una o varias chaperoninas (p. ej., una proteína asociada con un receptor (RAP)). La presencia de uno o varios iones metálicos también ofrece ayuda limitada. La capacidad para plegarse independientemente evita el plegamiento erróneo del dominio cuando es insertado en el entorno de una nueva proteína. Esta característica ha permitido que los dominios monoméricos discretos sean evolutivamente móviles. Como resultado, los dominios discretos se han dispersado durante la evolución y ahora existen por otra parte en proteínas no relacionadas. Algunos dominios, incluyendo los dominios de tipo III de fibronectina y el dominio de tipo inmunoglobina, existen en numerosas proteínas, mientras otros dominios solamente se encuentran en un número limitado de proteínas.
Las proteínas que contienen estos dominios están involucradas en una variedad de procedimientos, tales como transportadores celulares, movimiento de colesterol, transducción de la señal y funciones de señalización que están implicadas en el desarrollo y la neurotransmisión. Véase Herz, Lipoprotein receptors: beacons to neurons?, (2001) Trends in Neurosciences 24(4):193-195; Goldstein y Brown, The Cholesterol Quartet, (2001) Science 292: 1310-1312. La función de un dominio monomérico discreto a menudo es específica pero también contribuye a la actividad global de la proteína o polipéptido. Por ejemplo, el dominio de clase A del receptor de LDL (también referido como módulo de clase A, una repetición de tipo complemento o un dominio A) está implicado en la unión al ligando mientras el dominio ácido gamma-carboxiglutámico (Gla) que se encuentra en las proteínas de coagulación dependientes de vitamina K está implicado en la unión de alta afinidad a las membranas de fosfolípidos. Otros dominios monoméricos discretos incluyen, p. ej., el dominio de tipo factor de crecimiento epidérmico (EGF) en el activador de plasminógeno de tipo tisular que media la unión a células del hígado y regula de ese modo el aclaramiento de esta enzima fibrinolítica de la circulación y la cola citoplásmica del receptor de LDL que está implicada en la endocitosis mediada por receptores.
Las proteínas individuales pueden poseer uno o más dominios monoméricos discretos. Estas proteínas a menudo se denominan proteínas mosaico. Por ejemplo, los miembros de la familia del receptor de LDL contienen cuatro dominios estructurales principales: las repeticiones del dominio A ricas en cisteína, las repeticiones de tipo precursor del factor de crecimiento epidérmico, un dominio transmembrana y un dominio citoplásmico. La familia del receptor de LDL incluye miembros que: 1) son receptores de la superficie celular; 2) reconocen ligandos extracelulares; y 3) los internalizan para su degradación por lisosomas. Véase Hussain et al., The Mammalian Low-Density Lipoprotein Receptor Family, (1999) Annu. Rev. Nutr. 19:141-72. Por ejemplo, algunos miembros incluyen receptores de lipoproteínas de muy baja densidad (VLDL-R), receptor 2 de apolipoproteína E, proteína relacionada con LDLR (LRP) y megalina. Los miembros de la familia tienen las siguientes características: 1) expresión en la superficie celular; 2) unión al ligando extracelular que consiste en repeticiones del dominio A; 3) requerimiento de calcio para la unión al ligando; 4) reconocimiento de la proteína asociada al receptor y la apolipoproteína (apo) E; 5) dominio de homología con el precursor del factor de crecimiento epidérmico (EGF) que contiene repeticiones YWTD; 6) región que abarca la membrana sencilla; y 7) endocitosis mediada por el receptor de diferentes ligandos. Véase Hussain, supra. Con todo, los miembros se unen a diversos ligandos estructuralmente distintos.
Resulta ventajoso desarrollar métodos para generar y optimizar las propiedades deseadas de estos dominios monoméricos discretos. Sin embargo, los dominios monoméricos discretos, si bien están estructuralmente conservados, no están conservados a nivel de nucleótidos o aminoácidos, excepto para ciertos aminoácidos, p. ej., los residuos de cisteína del dominio A. De este modo, los métodos de recombinación de nucleótidos existentes se quedan cortos para generar y optimizar las propiedades deseadas de estos dominios monoméricos discretos.
La presente invención está dirigida a estos y otros problemas.
Breve resumen de la invención
La presente invención proporciona un método para identificar un multímero que se une a una molécula diana, comprendiendo el método,
(a)
proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y está en un dominio de clase A del receptor de LDL;
(b)
escrutar la biblioteca de polipéptidos en busca de afinidad hacia una molécula diana;
(c)
identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana;
(d)
conectar el primer dominio monomérico a una pluralidad de dominios monoméricos diferentes para formar una biblioteca de multímeros diferentes, comprendiendo los multímeros el primer dominio monomérico y uno de la pluralidad de dominios monoméricos diferentes;
(e)
escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y
(f)
identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.
En algunas realizaciones, al menos tres dominios monoméricos se unen a la misma molécula diana.
Adicionalmente se describen en la presente memoria métodos que comprenden una etapa adicional de mutación de al menos un dominio monomérico, proporcionando de ese modo una genoteca que comprende dominios monoméricos mutados. La etapa de mutación puede comprender recombinar una pluralidad de fragmentos polinucleotídicos de al menos un polinucleótido que codifica un dominio monomérico. La etapa de mutación puede comprender una evolución dirigida. La etapa de mutación puede comprender una mutagénesis dirigida al sitio.
Adicionalmente se describen en la presente memoria métodos que comprenden: escrutar la biblioteca de dominios monoméricos en busca de afinidad hacia una segunda molécula diana; identificar un dominio monomérico que se une a una segunda molécula diana; conectar al menos un dominio monomérico con afinidad hacia la primera molécula diana con al menos un dominio monomérico con afinidad hacia una segunda molécula diana, formando de ese modo una biblioteca de multímeros; escrutar la biblioteca de multímeros en busca de la capacidad de unirse a la primera y segunda moléculas diana; e identificar un multímero que se une a la primera y segunda moléculas diana, identificando de ese modo un multímero que se une específicamente a una primera y una segunda moléculas diana.
Ciertos métodos descritos en la presente memoria comprenden adicionalmente: proporcionar una segunda biblioteca de dominios monoméricos; escrutar la segunda biblioteca de dominios monoméricos en busca de afinidad hacia al menos una segunda molécula diana; identificar un segundo dominio monomérico que se une a la segunda molécula diana; conectar los dominios monoméricos identificados que se unen a la primera molécula diana o la segunda molécula diana, formando de ese modo una biblioteca de multímeros; escrutar la biblioteca de multímeros en busca de la capacidad de unirse a la primera y segunda moléculas diana; e identificar un multímero que se une a la primera y segunda moléculas diana.
La molécula diana se puede seleccionar del grupo que consiste en un antígeno viral, un antígeno bacteriano, un antígeno fúngico, una enzima, una proteína de la superficie celular, un inhibidor de enzima, una molécula informadora, y un receptor. El antígeno viral puede ser un polipéptido requerido para la replicación viral. La primera y al menos segunda moléculas diana pueden ser diferentes componentes del mismo sistema de replicación viral. El multímero seleccionado se puede unir a al menos dos serotipos del mismo virus.
En algunas realizaciones, la biblioteca de multímeros es expresada como una presentación en fagos, presentación en ribosomas o presentación sobre la superficie celular.
En algunas realizaciones, los dominios monoméricos están conectados por un conector polipeptídico. Como se describe en la presente memoria, el conector polipeptídico puede ser un conector asociado naturalmente con el dominio monomérico. En algunas realizaciones, el conector polipeptídico es una variante de un conector asociado naturalmente con un dominio monomérico. La etapa de conexión puede comprender conectar los dominios monoméricos con una variedad de conectores de diferentes longitudes y composiciones.
La presente invención también proporciona polipéptidos que comprenden los multímeros seleccionados descritos antes.
La presente invención también proporciona polinucleótidos que codifican los multímeros seleccionados como se ha descrito antes.
La presente invención también proporciona bibliotecas de multímeros formadas como se ha descrito antes.
La presente invención también proporciona métodos para identificar un multímero que se une a al menos una molécula diana, que comprende las etapas de: proporcionar una biblioteca de multímeros, donde cada multímero comprende al menos dos dominios monoméricos y donde cada dominio monomérico comprende al menos dos enlaces disulfuro, tiene 30 - 100 aminoácidos, es un dominio de clase A del receptor de LDL y los dominios monoméricos están separados por un conector heterólogo; y escrutar la biblioteca de multímeros en busca de multímeros que se unen a la molécula diana. En algunas realizaciones, los métodos comprenden adicionalmente identificar los multímeros que se unen a la molécula diana que tienen avidez por la molécula diana que es mayor que la avidez de un único dominio monomérico por la molécula diana. En algunas realizaciones, uno o más de los multímeros comprenden un dominio monomérico que se une específicamente a una segunda molécula diana.
La presente invención también proporciona bibliotecas de multímeros. En algunas realizaciones, cada multímero comprende al menos dos dominios monoméricos conectados por un conector; cada dominio monomérico muestra una especificidad de unión para una molécula diana; y cada dominio monomérico es un dominio monomérico que no existe naturalmente.
La presente invención también proporciona polipéptidos que comprenden al menos dos dominios monoméricos separados por una secuencia conectora heteróloga. En algunas realizaciones, cada dominio monomérico se une específicamente a una molécula diana; y cada dominio es un dominio monomérico de una proteína que no existe naturalmente.
Adicionalmente se describen en la presente memoria polipéptidos que comprenden un primer dominio monomérico que se une a una primera molécula diana y un segundo dominio monomérico que se une a una segunda molécula diana. Los polipéptidos pueden comprender dos dominios monoméricos, teniendo cada dominio monomérico una especificidad de unión que es específica para un sitio diferente de la misma molécula diana. Los polipéptidos pueden comprender adicionalmente un dominio monomérico que tiene una especificidad de unión para una segunda molécula diana.
Como se describe adicionalmente en la presente memoria, los dominios monoméricos de una biblioteca, multímero o polipéptido pueden ser idénticos al menos en 70%.
Definiciones
A menos que se indique de otro modo, las siguientes definiciones sustituyen a las de la técnica.
El término "dominio monomérico" o "monómero" se utiliza indistintamente en la presente memoria para hacer referencia a una región discreta encontrada en una proteína o polipéptido. Un dominio monomérico forma una estructura tridimensional nativa en solución en ausencia de secuencias de aminoácidos nativas colindantes. Los dominios monoméricos de la invención se unirán específicamente a una molécula diana. Por ejemplo, un polipéptido que forma una estructura tridimensional que se une a una molécula diana es un dominio monomérico. Según se utiliza en la presente memoria, el término "dominio monomérico" no incluye la región determinante de la complementariedad (CDR) de un anticuerpo.
El término "variante de dominio monomérico" hace referencia a un dominio que resulta de la manipulación humana de una secuencia de un dominio monomérico. Los ejemplos de los cambios manipulados por el hombre incluyen, p. ej., la mutagénesis al azar, la mutagénesis específica del sitio, el barajado, la evolución dirigida, etc. El término "variante de dominio monomérico" no abarca una región determinante de la complementariedad (CDR) mutagenizada de un anticuerpo.
El término "multímero" se utiliza en la presente memoria para indicar un polipéptido que comprende al menos dos dominios monoméricos y/o inmunodominios (p. ej., al menos dos dominios monoméricos, al menos dos inmuno-dominios, o al menos un dominio monomérico y al menos un inmuno-dominio). Los dominios monoméricos y/o inmuno-dominios separados en un multímero pueden ser reunidos por medio de un conector. Un multímero también es conocido como una proteína mosaico combinatoria o una proteína mosaico recombinante.
El término "ligando", también referido en la presente memoria como "molécula diana", abarca una amplia variedad de sustancias y moléculas, que oscilan entre moléculas simples y dianas complejas. Las moléculas diana pueden ser proteínas, ácidos nucleicos, lípidos, carbohidratos o cualquier otra molécula capaz de reconocer un dominio polipeptídico. Por ejemplo, una molécula diana puede incluir un compuesto químico (esto es, un compuesto no biológico tal como, p. ej., una molécula orgánica, una molécula inorgánica, o una molécula que tiene átomos tanto orgánicos como inorgánicos, pero excluyendo polinucleótidos y proteínas), una mezcla de compuestos químicos, una matriz de compuestos localizados espacialmente, una macromolécula biológica, una biblioteca de presentación de péptidos en bacteriófagos, una biblioteca de presentación de péptidos en polisomas, un extracto elaborado a partir de materiales biológicos tales como células o tejidos bacterianos, vegetales, fúngicos, o animales (p. ej., mamíferos), una proteína, una toxina, una hormona peptídica, una célula, un virus, o similar. Otras moléculas diana incluyen, p. ej., una célula completa, un tejido completo, una mezcla de proteínas relacionadas o no relacionadas, una mezcla de virus o cepas bacterianas o similares. Las moléculas diana también pueden ser definidas mediante la inclusión en análisis de escrutinio descritos en la presente memoria o intensificando o inhibiendo una interacción de proteínas específicas (esto es, un agente que inhibe selectivamente una interacción de unión entre dos polipéptidos predeterminados).
Según se utiliza en la presente memoria, el término "inmuno-dominios" hace referencia a dominios de unión a proteínas que contienen al menos una región determinante de la complementariedad (CDR) de un anticuerpo. Los inmuno-dominios pueden ser dominios inmunológicos de origen natural (esto es, aislados de la naturaleza) o pueden ser dominios inmunológicos de origen no natural que han sido alterados mediante manipulación humana (p. ej., mediante métodos de mutagénesis, tales como, por ejemplo, mutagénesis al azar, mutagénesis específica del sitio, y similares, así como mediante métodos de evolución dirigida, tales como, por ejemplo, PCR propensa a error recursiva, recombinación recursiva, y similares). Los diferentes tipos de inmuno-dominios que son adecuados para su uso en la práctica de la presente invención incluyen un mini-anticuerpo ("minibody"), un anticuerpo de un sólo dominio, un fragmento variable de cadena sencilla (ScFv), y un fragmento Fab.
El término "mini-anticuerpo" hace referencia en la presente memoria a un polipéptido que codifica solamente 2 regiones determinantes de la complementariedad (CDR) de origen natural o no natural (p. ej., mutagenizadas) que existen en el dominio variable de la cadena pesada o el dominio variable de la cadena ligera, o una de sus combinaciones. Un ejemplo de un mini-anticuerpo es descrito por Pessi et al., A designed metal-binding protein with a novel fold, (1993) Nature 362:367-369. Se ilustra esquemáticamente un multímero de mini-anticuerpos en la Figura 11A. Los círculos representan mini-anticuerpos, y las líneas gruesas representan los radicales conectores que unen los inmunodominios entre sí.
Según se utiliza en la presente memoria, el término "anticuerpo de dominio sencillo" hace referencia al dominio variable de la cadena pesada ("V_{H}") de un anticuerpo, esto es, un dominio variable de la cadena pesada sin un dominio variable de la cadena ligera. Los anticuerpos de dominio sencillo ilustrativos empleados en la práctica de la presente invención incluyen, por ejemplo, el dominio variable de la cadena pesada de Camélido (aproximadamente 118 a 136 residuos de aminoácido) como describen Hamers-Casterman, C. et al., Naturally occurring antibodies devoid of light chains (1993) Nature 363:446-448, y Dumoulin, et al., Single-domain antibody fragments with high conformational stability (2002) Protein Science 11:500-515. En la Figura 11B se representa un multímero de anticuerpos de dominio sencillo. Las elipses representan los anticuerpos de dominio sencillo, y las líneas gruesas representan los radicales conectores que unen los anticuerpos de dominio sencillo entre sí.
Los términos "fragmento variable de cadena sencilla" o "ScFv" se utilizan indistintamente en la presente memoria para hacer referencia a dominios variables de cadenas pesadas y ligeras de anticuerpos que están unidos por un conector peptídico que tiene al menos 12 residuos de aminoácido. Los fragmentos variables de cadena sencilla contemplados para su uso en la práctica de la presente invención incluyen aquellos descritos por Bird, et al., Single-chain antigen-binding proteins (1988) Science 242(4877):423-426 y Huston et al., Protein engineering of antibody binding sites: recovery of specific activity in an anti-digoxin single-chain Fv analogue produced in Escherichia coli (1988) Proc Natl Acad Sci U S A 85(16):5879-83. En la Figura 11C se ilustra un multímero de fragmentos variables de cadena sencilla. Las líneas discontinuas representan el conector peptídico que une los dominios variables de la cadena pesada y ligera entre sí. Las líneas gruesas representan los radicales conectores que unen los dominios variables de la cadena pesada entre sí.
Según se utiliza en la presente memoria, el término "fragmento Fab" hace referencia a un inmuno-dominio que tiene dos cadenas de proteína, una de las cuales es una cadena ligera que consiste en dos dominios de la cadena ligera (dominio variable V_{L} y dominio constante C_{L}) y una cadena pesada que consiste en dos dominios pesados (esto es, un dominio variable V_{H} y uno constante C_{H}). Los fragmentos Fab empleados en la práctica de la presente invención incluyen aquellos que tienen un enlace disulfuro intercatenario en el extremo C de cada componente pesado y ligero, así como aquellos que no tienen semejante enlace disulfuro C-terminal. Cada fragmento tiene aproximadamente 47 kD. Los fragmentos Fab son descritos por Pluckthun y Skerra, Expression of functional antibody Fv and Fab fragments in Escherichia coli (1989) Methods Enzymol 178:497-515. En la Figura 11D se representa un multímero de fragmentos Fab. Las elipses de color blanco representan el componente de la cadena pesada del fragmento Fab, las elipses rellenas representan el componente de la cadena ligera del Fab.
El término "conector" se utiliza en la presente memoria para indicar un radical o grupo de radicales que unen o conectan dos o más dominios monoméricos separados discretos. El conector permite que los dominios monoméricos separados discretos permanezcan separados cuando se unen en un multímero. El radical conector es típicamente un radical sustancialmente lineal. Los conectores adecuados incluyen polipéptidos, ácidos polinucleicos, ácidos peptidonucleicos y similares. Los conectores adecuados también incluyen radicales alquileno opcionalmente sustituidos que tienen uno o más átomos de oxígeno incorporados al esqueleto carbonado. Típicamente, el peso molecular del conector es menor de aproximadamente 2000 daltons. Más típicamente, el peso molecular del conector es menor de aproximadamente 1500 daltons y normalmente es menor de aproximadamente 1000 daltons. El conector puede ser suficientemente pequeño para permitir que los dominios monoméricos separados discretos cooperen, p. ej., cuando cada uno de los dominios monoméricos separados discretos de un multímero se unen a la misma molécula diana mediante sitios de unión separados. Los conectores ilustrativos incluyen un polinucleótido que codifica un polipéptido, o un polipéptido de aminoácidos u otros radicales de origen natural. El conector puede ser una porción de una secuencia nativa, una de sus variantes, o una secuencia sintética. Los conectores pueden comprender, p. ej., aminoácidos de origen natural, de origen no natural, o una combinación de ambos.
El término "separado" se utiliza en la presente memoria para indicar una propiedad de un radical que es independiente y permanece independiente incluso cuando forma complejos con otros radicales, incluyendo por ejemplo, otros dominios monoméricos. Un dominio monomérico es un dominio separado en una proteína debido a que tiene una propiedad independiente que puede ser reconocida y separada de la proteína. Por ejemplo, la capacidad de unión al ligando del dominio A en el LDLR es una propiedad independiente. Otros ejemplos de separado incluyen los dominios monoméricos separados en un multímero que siguen siendo dominios independientes separados incluso cuando forman complejos o se unen entre sí en el multímero por medio de un conector. Otro ejemplo de la propiedad de separado son los sitios de unión separados en un multímero para un ligando.
Según se utiliza en la presente memoria, "la evolución dirigida" hace referencia a un procedimiento por medio del cual se generan variantes polinucleotídicas, se expresan, y se escrutan en busca de una actividad (p. ej., un polipéptido con actividad de unión) en un procedimiento recursivo. Se seleccionan uno o más candidatos en el escrutinio y el procedimiento se repite después utilizando polinucleótidos que codifican los candidatos seleccionados para generar nuevas variantes. La evolución dirigida implica al menos dos rondas de generación de la variación y puede incluir 3, 4, 5, 10, 20 o más rondas de generación de la variación y la selección. La variación puede ser generada mediante cualquier método conocido por los experto en la técnica, incluyendo, p. ej., PCR propensa al error, barajado de genes, mutagénesis química y similares.
El término "barajado" se utiliza en la presente memoria para indicar la recombinación entre secuencias no idénticas. En algunas realizaciones, el barajado puede incluir el cruzamiento por medio de recombinación homóloga o por medio de recombinación no homóloga, por ejemplo por medio de los sistemas cre/lox y/o flp/frt. El barajado se puede llevar a cabo empleando una variedad de formatos diferentes, incluyendo por ejemplo, formatos de barajado in vitro e in vivo, formatos de barajado in silico, formatos de barajado que utilizan moldes bicatenarios o monocatenarios, formatos de barajado basados en cebadores, formatos de barajado basados en la fragmentación de ácido nucleico, y formatos de barajado mediados por oligonucleótidos, todos los cuales se basan en eventos de recombinación entre secuencias no idénticas y se describen con más detalle o se refieren en la presente memoria más abajo, así como otros formatos basados en la recombinación similares.
El término "al azar" según se utiliza en la presente memoria hace referencia a una secuencia de polinucleótidos o una secuencia de aminoácidos compuesta por dos o más aminoácidos y construida mediante un procedimiento estocástico o al azar. La secuencia de polinucleótidos o la secuencia de aminoácidos al azar pueden incluir motivos en marco o armazón, que pueden comprender secuencias invariables.
El término "pseudo-al azar" según se utiliza en la presente memoria hace referencia a un grupo de secuencias, de polinucleótidos o polipéptidos, que tienen una variabilidad limitada, de manera que el grado de variabilidad de los residuos en algunas posiciones está limitado, pero se permite cualquier posición pseudo-al azar, al menos cierto grado de variación de residuos.
Los términos "polipéptido", "péptido", y "proteína" se utilizan en la presente memoria indistintamente para hacer referencia a una secuencia de aminoácidos de dos o más aminoácidos.
La "sustitución de aminoácidos conservativa" hace referencia a la intercambiabilidad de residuos que tienen cadenas laterales similares. Por ejemplo, un grupo de aminoácidos que tienen cadenas laterales alifáticas es glicina, alanina, valina, leucina, e isoleucina; un grupo de aminoácidos que tienen cadenas laterales hidroxiladas alifáticas es serina y treonina; un grupo de aminoácidos que tienen cadenas laterales que contienen amida es asparagina y glutamina; un grupo de aminoácidos que tienen cadenas laterales aromáticas es fenilalanina, tirosina, y triptófano; un grupo de aminoácidos que tienen cadenas laterales alcalinas es lisina, arginina, e histidina; y un grupo aminoácidos que tienen cadenas laterales que contienen azufre es cisteína y metionina. Los grupos preferidos de sustitución conservativa de aminoácidos son: valina-leucina-isoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina, y asparagina-glutamina.
La frase "secuencia de ácido nucleico" hace referencia a un polímero de cadena sencilla o doble de bases desoxirribonucleotídicas o ribonucleotídicas leídas desde el extremo 5' al 3'. Esto incluye ADN cromosómico, plásmidos auto-replicantes y ADN o ARN que desempeñan un papel estructural primario.
El término "que codifica" hace referencia a una secuencia de polinucleótidos que codifica uno o más aminoácidos. El término no requiere un codón de iniciación o terminación. Una secuencia de aminoácidos puede estar codificada por uno cualquiera de los seis marcos de lectura diferentes proporcionados por una secuencia de polinucleótidos.
El término "promotor" hace referencia a regiones o secuencias localizadas aguas arriba y/o aguas abajo del inicio de la transcripción que están implicadas en el reconocimiento y la unión de la ARN polimerasa y otras proteínas para iniciar la transcripción.
Un "vector" hace referencia a un polinucleótido, que cuando es independiente del cromosoma anfitrión, es susceptible de replicación en un organismo anfitrión. Los ejemplos de los vectores incluyen los plásmidos. Los vectores tienen típicamente un origen de replicación. Los vectores pueden comprender, p. ej., terminadores de la transcripción y la traducción, secuencias de iniciación de la transcripción y la traducción, y promotores útiles para la regulación de la expresión del ácido nucleico concreto.
El término "recombinante" cuando se utiliza haciendo referencia, p. ej., a una célula, o ácido nucleico, proteína, o vector, indica que la célula, ácido nucleico, proteína o vector, ha sido modificado mediante la introducción de un ácido nucleico heterólogo o proteína o la alteración de un ácido nucleico o proteína nativos, o que la célula deriva de una célula modificada de este modo. Así, por ejemplo, las células recombinantes expresan genes que no se encuentran en la forma nativa (no recombinante) de la célula o expresan genes nativos que son expresados anómalamente de otro modo, expresados a la baja o no expresados en absoluto.
La frase "se une específicamente (o selectivamente)" a un polipéptido, cuando hace referencia a un monómero o multímero, hace referencia a una reacción de unión que puede ser determinante de la presencia del polipéptido en una población heterogénea de proteínas y otros compuestos biológicos. De este modo, en condiciones convencionales o en análisis utilizados en los análisis de unión de anticuerpos, el monómero o multímero especificados se unen a una molécula diana concreta por encima del fondo (p. ej., 2X, 5X, 10X o más por encima del fondo) y no se une de una manera significativa a otras moléculas presentes en la muestra.
Los términos "identidad" o porcentaje de "identidad", en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, hacen referencia a dos o más secuencias o subsecuencias que son iguales. "Esencialmente idéntico" hace referencia a dos o más secuencias de ácidos nucleicos o polipéptidos que tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son iguales (esto es, una identidad de 60%, opcionalmente una identidad de 65%, 70%, 75%, 80%, 85%, 90%, o 95% a lo largo de una región especificada, o, cuando no se especifica, a lo largo de una secuencia completa), cuando se comparan y se alinean para una correspondencia máxima a lo largo de una ventana de comparación, o una región designada medida utilizando uno de los siguientes algoritmos de comparación de secuencias o mediante alineamiento manual e inspección visual. Opcionalmente, la identidad o identidad sustancial existe a lo largo de una región que tiene al menos aproximadamente 50 nucleótidos de longitud, o más preferiblemente a lo largo de una región que tiene de 100 a 500 o 1000 o más nucleótidos de longitud.
El término "conector heterólogo", cuando se utiliza en referencia a un multímero, indica que el multímero comprende un conector y un monómero que no se encuentran en la misma relación entre sí en la naturaleza (p. ej., forman una proteína de fusión).
Breve descripción de los dibujos
La Figura 1 ilustra esquemáticamente el tipo, número y orden de dominios monoméricos encontrados en los miembros de la familia de receptores de LDL. Estos dominios monoméricos incluyen dominios Molinillo \beta, dominios de tipo EGF y dominios de clase A del receptor de LDL. Los miembros mostrados incluyen el receptor de lipoproteínas de baja densidad (LDLR), el receptor 2 de ApoE (ApoER2), el receptor de lipoproteínas de muy baja densidad (VLDLR), la proteína 2 relacionada con LDLR (LRP2) y la proteína 1 relacionada con el LDLR (LRP1).
La Figura 2 ilustra esquemáticamente el alineamiento de la secuencia de aminoácidos parcial de una variedad de dominios de clase A del receptor de LDL que incluyen dos secuencias de LPR1 humanas, dos secuencias de LRP2 humanas, dos secuencias de LDLR humanas, dos secuencias de LDVR humanas, una secuencia de LRP3 humana, una secuencia de MAT humana, una secuencia de CO6 humana, una secuencia de SORL humana, para demostrar las cisteínas conservadas.
La Figura 3, panel A ilustra esquemáticamente un ejemplo de un dominio A. El panel A ilustra esquemáticamente aminoácidos conservados en un dominio A de aproximadamente 40 aminoácidos de longitud. Los residuos de cisteína conservados están indicados por C, y los aminoácidos cargados negativamente están indicados por un círculo con un signo menos ("-"). Los círculos con una "H" indican residuos hidrófobos. El panel B ilustra esquemáticamente dos dominios A plegados conectados por un conector. El panel B también indica dos sitios de unión a calcio, los círculos oscuros con Ca^{+2}, y tres enlaces disulfuro en cada dominio A plegado para un total de 6 enlaces disulfuro.
La Figura 4 indica algunos de los ligandos reconocidos por la familia de receptores de LDL, que incluyen inhibidores, proteasas, complejos de proteasa, complejos portadores de vitaminas, proteínas implicadas en el metabolismo de lipoproteínas, ligandos no humanos, antibióticos, virus, y otros.
La Figura 5 ilustra esquemáticamente un esquema general para identificar dominios monoméricos que se unen a un ligando, aislar los dominios monoméricos seleccionados, crear multímeros de los dominós monoméricos seleccionados uniendo los dominios monoméricos seleccionados en diversas combinaciones y escrutar los multímeros para identificar los multímeros que comprenden más de un monómero que se une a un ligando.
La Figura 6 es una representación esquemática de otra estrategia de selección (selección guiada). Se identifica un dominio monomérico con propiedades de unión apropiadas a partir de una biblioteca de dominios monoméricos. El dominio monomérico identificado es conectado después con un dominio monomérico de otra biblioteca de dominios monoméricos para formar una biblioteca de multímeros. La biblioteca de multímeros es escrutada para identificar un par de dominios monoméricos que se unen simultáneamente a la diana. Este procedimiento se puede repetir después hasta obtener las propiedades de unión óptimas en el multímero.
La Figura 7 muestra el procedimiento de multimerización de los dominios monoméricos. Los aciertos con monómeros de unión a la diana son amplificados a partir de un vector. Esta mezcla de dominios monoméricos y/o inmuno-dominios de unión a la diana es escindida después y mezclada con una combinación óptima de conector y oligonucleótidos tapón. Los multímeros que se generan son clonados después en un vector adecuado para la segunda etapa de selección para la identificación de multímeros de unión a la diana.
La Figura 8 representa aminoácidos comunes en cada posición del dominio A. Los porcentajes encima de las posiciones de los aminoácidos hacen referencia al porcentaje de dominios A de origen natural con la inter-cisteína espaciadora desplegada. Los residuos de aminoácidos potenciales representados bajo cada posición de aminoácido representan residuos comunes en esa posición. Los seis aminoácidos finales, representados como círculos de color más claro, representan secuencias conectoras. Las dos columnas de residuos de aminoácidos en cursiva en las posiciones 2 y 3 del conector representan residuos de aminoácidos que no existen en esa posición. Cualquier otro aminoácido (p. ej., A, D, E, G, H, I, K, L, N, P, Q, R, S, T, y V) puede ser incluido en estas posiciones.
La Figura 9 muestra la frecuencia de aparición de residuos de aminoácidos en los dominios A de origen natural para los dominios A con el siguiente espaciamiento entre cisteínas: CX_{6}CX_{4}CX_{6}CX_{5}CX_{8}C.
La Figura 10 representa un alineamiento de dominios A. En la parte superior e inferior de la figura, las letras pequeñas (a-q) indican residuos conservados. Los aminoácidos predominantes en estas posiciones y el porcentaje de tiempo que se observaron en los dominios A nativos se ilustran en la parte inferior de la figura.
La Figura 11 representa posibles conformaciones de multímeros comprendidos por inmuno-dominios. La Figura 11A ilustra un multímero de mini-anticuerpos. La Figura 11B ilustra un multímero de anticuerpos de dominio sencillo. La Figura 11C ilustra un multímero de inmuno-dominios de scfv. La Figura 11D ilustra un multímero de fragmentos Fab.
La Figura 12 representa la conexión de dominios mediante conectores parciales.
La Figura 13 ilustra formaciones de anillos multiméricos ilustrativas.
La Figura 14 ilustra diferentes conformaciones multiméricas de cadenas pesadas y ligeras de Fv.
\vskip1.000000\baselineskip
Descripción detallada de la invención
La invención proporciona un enfoque mejorado para la selección y optimización de las propiedades de los dominios monoméricos de clase A del receptor de LDL discretos para crear multímeros. En particular, esta descripción describe métodos, composiciones y kits para identificar dominios monoméricos de clase A del receptor de LDL discretos que se unen a un ligando o mezcla de ligandos deseados y crear multímeros (también conocidos como proteínas mosaico combinatorias o proteínas mosaico recombinantes) que comprenden dos o más dominios monoméricos y/o inmuno-dominios que están unidos a través de un conector. Los multímeros pueden ser escrutados para identificar aquellos que tienen un fenotipo mejorado tal como una avidez o afinidad mejorados o una especificidad alterada para el ligando o la mezcla de ligandos, en comparación con el dominio monomérico discreto.
1. Dominios Monoméricos Discretos
Los dominios monoméricos pueden ser cadenas polipeptídicas con aproximadamente 30 a aproximadamente 100 aminoácidos. De un modo similar, un dominio monomérico de la presente invención comprende de 30 a aproximadamente 100 aminoácidos. Los dominios monoméricos y los inmuno-dominios pueden mantener una conformación estable en solución. La conformación estable contiene enlaces disulfuro (p. ej., al menos dos, o tres o más enlaces disulfuro). Los enlaces disulfuro se pueden formar opcionalmente entre dos residuos de cisteína.
Las publicaciones que describen dominios monoméricos y proteínas mosaico y las referencias citadas allí incluyen las siguientes: Hegyi, H y Bork, P., On the classification and evolution of protein modules, (1997) J. Protein Chem., 16(5):545-551; Baron et al., Protein modules (1991) Trends Biochem. Sci., 16(1):13-7; Ponting et al., Evolution of domain families, (2000), Adv. Protein Chem., 54:185-244; Doolittle, The multiplicity of domains in proteins, (1995) Annu. Rev. Biochem 64:287-314; Doolitte y Bork, Evolutionarily mobile modules in proteins (1993) Scientific American, 269 (4):50-6; y Bork, Shuffled domains in extracellular proteins (1991), FEBS letters 286(1-2):47-54. Los dominios monoméricos de la presente invención también incluyen aquellos dominios encontrados en la base de datos Pfam y la base de datos SMART. Véase Schultz, et al., SMART: una herramienta basada en la red para el estudio de dominios móviles genéticamente, (2000) Nucleic Acid Res. 28(1):231-34.
Los dominios monoméricos adecuados para su uso en la práctica de la presente invención son el dominio de clase A del receptor de LDL. La Figura 1 presenta esquemáticamente diferentes clases de dominios monoméricos encontrados en las moléculas de la familia del receptor de LDL.
Otros rasgos de los dominios monoméricos incluyen la capacidad para unir ligandos (p. ej., como en el dominio de clase A del receptor de LDL, la capacidad para unirse a un ión (p. ej., unión a Ca^{2+} mediante el dominio A del receptor de LDL).
Las características de un dominio monomérico incluyen la capacidad para plegarse independientemente y la capacidad para formar una estructura estable. De este modo, la estructura del dominio monomérico a menudo está conservada, aunque la secuencia de polinucleótidos que codifica el monómero no necesita estar conservada. Por ejemplo, la estructura del dominio A está conservada entre los miembros de la familia del dominio A, mientras la secuencia de ácidos nucleicos del dominio A no lo está. De este modo, por ejemplo, un dominio monomérico se clasifica como un dominio A por sus residuos de cisteína y su afinidad por el calcio, no necesariamente por su secuencia de ácidos nucleicos. Véase, la Figura 2.
Específicamente, los dominios A (denominados a veces "repeticiones de tipo complemento") contienen aproximadamente 30-50 aminoácidos. En algunas realizaciones, los dominios comprenden aproximadamente 35-45 aminoácidos y en algunos casos aproximadamente 40 aminoácidos. En los 30-50 aminoácidos, existen aproximadamente 6 restos cisteína. De las seis cisteínas, los enlaces disulfuro típicamente se encuentran entre las siguientes cisteínas: C1 y C3, C2 y C5, C4 y C6. El dominio A constituye un radical de unión al ligando. Los residuos de cisteína del dominio son disulfuro conectado para formar un radical funcionalmente independiente, estable, compacto. Véase la Figura 3. Las agrupaciones de estas repeticiones forman un dominio de unión al ligando, y una agrupación diferencial puede conferir especificidad con respecto a la unión al ligando.
Las secuencias ilustrativas del dominio A y las secuencias consenso se representan en las Figuras 2, 3 y 8. La Figura 9 presenta la localización y aparición de residuos en los dominios A con el siguiente espaciamiento entre cisteínas. Además, la Figura 10 representa un número de dominios A y proporciona una lista de aminoácidos conservados. Una secuencia consenso típica útil para identificar dominios A es la siguiente: C-[VILMA]-X_{(5)}-C-[DNH]-X_{(3)}-[DENQHT]-C-X_{(3,4)}-[STADE]-[DEH]-[DE]-X_{(1,5)}-C, donde los residuos entre corchetes indican posibles residuos en una posición. "X_{(#)}" indica el número de residuos. Estos residuos pueden ser cualquier residuo de aminoácido. Los paréntesis que contienen dos números hacen referencia a la gama de aminoácidos que pueden ocupar esa posición (p. ej., "[DE]-X_{(1,5)}-C" significa que los aminoácidos DE están seguidos por 1, 2, 3, 4, ó 5 residuos, seguido por C). Esta secuencia consenso representa solamente la porción del dominio A que comienza en la tercera cisteína. Un segundo consenso es el siguiente: C-X_{(3-15)}-C-X_{(4-15)}-C-X_{(6-7)}-C-[N,D]-X_{(3)}-[D,E,N,Q,H,S,T]-C-X_{(4,6)}-D-E-X_{(2-8)}-C. El segundo consenso pronostica residuos de aminoácidos que abarcan los seis residuos de cisteína. En algunas realizaciones, las variantes del dominio A comprenden secuencias esencialmente idénticas a cualquiera de las secuencias descritas antes.
Hasta la fecha, se han identificado al menos 190 dominios A humanos basándose en secuencias de ADNc. Véase, p. ej., la Figura 10. Las proteínas ilustrativas que contienen dominios A incluyen, p. ej., componentes del complemento (p. ej., C6, C7, C8, C9, y Factor I), serina proteasas (p. ej., enteropeptidasa, matriptasa, y corina), proteínas transmembrana (p. ej., ST7, LRP3, LRP5 y LRP6) y receptores endocíticos (p. ej., receptor relacionado con Sortilina, receptor de LDL, VLDLR, LRP1, LRP2, y ApoER2). Los dominios A y las variantes de dominios A pueden ser fácilmente empleados en la práctica de la presente invención como dominios monoméricos y sus variantes. Se puede encontrar una descripción adicional de dominios A en las siguientes publicaciones y las referencias allí citadas: Howell y Hertz, The LDL receptor gene family: signaling functions during development, (2001) Current Opinion in Neurobiology 11:74-81; Herz (2001), supra; Krieger, The "best" of cholesterols, the "worst" of cholesterols: A tale of two receptors, (1998) PNAS 95: 4077-4080; Goldstein y Brown, The Cholesterol Quartet, (2001) Science, 292: 1310-1312; y, Moestrup y Verroust, Megalin- and Cubilin-Mediated Endocytosis of Protein-Bound Vitamins, Lipids, and Hormones in Polarized Epithelia, (2001) Ann. Rev. Nutr. 21:407-28.
Las descripciones de algunos dominios monoméricos adicionales se pueden encontrar en las siguientes publicaciones y en las referencias allí citadas: Yamazaki et al., Elements of Neural Adhesion Molecules and a Yeast Vacuolar Protein Sorting Receptor are Present in a Novel Mammalian Low Density Lipoprotein Receptor Family Member, (1996) Journal of Biological Chemistry 271(40) 24761-24768; Nakayama et al., Identification of High-Molecular-Weight Proteins with Multiple EGF-like Motifs by Motif-Trap Screening, (1998) Genomics 51:27-34; Liu et al, Genomic Organization of New Candidate Tumor Suppressor Gene, LRP1B, (2000) Genomics 69:271-274; Liu et al., The Putative Tumor Suppressor LRP1B, a Novel Member of the Low Density Lipoprotein (LDL) Receptor Family, Exhibits Both Overlapping and Distinct Properties with the LDL Receptor-related Protein, (2001) Journal of Biological Chemistry 276(31):28889-28896; Ishii et al, cDNA of a New Low-Density Lipoprotein Receptor-Related Protein and Mapping of its Gene (LRP3) to Chromosome Bands 19q12-q13.2, (1998) Genomics 51:132-135; Orlando et al, Identification of the second cluster of ligand binding repeats in megalin as a site for receptor-ligand interactions, (1997) PNAS USA 94:2368-2373; Jeon y Shipley, Vesicle-reconstituted Low Density Lipoprotein Receptor, (2000) Journal of Biological Chemistry 275(39):30458-30464; Simmons et al., Human Low Density Lipoprotein Receptor Fragment, (1997) Journal of Biological Chemistry 272(41):25531-25536; Fass et al., Molecular Basis of familial hypercholesterolaemia from structure of LDL receptor module, (1997) Nature 388:691-93; Daly et al., Three-dimensional structure of a cysteine-rich repeat from the low-density lipoprotein receptor, (1995) PNAS USA 92:6334-6338; North y Blacklow, Structural Independence of Ligand-Binding Modules Five and Six of the LDL Receptor, (1999) Biochemistry 38:3926-3935; North and Blacklow, Solution Structure of the Sixth LDL-A module of the LDL Receptor, (2000) Biochemistry 39:25640-2571; North y Blacklow, Evidence that Familial Hypercholesterolemia Mutations of the LDL Receptor Cause Limited Local Misfolding in an LDL-A Module Pair, (2000) Biochemistry 39:13127-13135; Beglova et al., Backbone Dynamics of a Module Pair from the Ligand-Binding Domain of the LDL Receptor, (2001) Biochemistry 40:2808-2815; Bieri et al., Folding, Calcium binding, and Structural Characterization of a Concatemer of the First and Second Ligand-Binding Modules of the Low-Density Lipoprotein Receptor, (1998) Biochemistry 37:10994-11002; Jeon et al., Implications for familial hypercholesterolemia from the structure of the LDL receptor YWTD-EGF domain pair, (2001) Nature Structural Biology 8(6):499-504; Kurniawan et al., NMR structure of a concatemer of the first and second ligand-binding modules of the human low-density lipoprotein receptor, (2000) Protein Science 9:1282-1293; Esser et al., Mutational Analysis of the Ligand Binding Domain of the Low Density poprotein Receptor, (1988) Journal of Biological Chemistry 263(26):13282-13290; Russell et al., Different Combinations of Cysteine-rich Repeats Mediate Binding of Low Density Lipoprotein Receptor to Two Different Proteins, (1989) Journal of Biological Chemistry 264(36):21682-21688; Davis et al., Acid-dependent ligand dissociation and recycling of LDL receptor mediated by growth factor homology region, (1987) Nature 326:760-765; Rong et al., Conversion of a human low-density lipoprotein receptor ligand-binding repeat to a virus receptor: Identification of residues important for ligand specificity, (1998) PNAS USA 95:8467-8472; Agnello et al., Hepatitis C virus and other Flaviviridae viruses enter cells via low density lipoprotein receptor; (1999) PNAS 96(22):12766-12771; Esser y Russell, Transport-deficient Mutations in the Low Density lipoprotein receptor, (1988) Journal of Biological Chemistry 263(26):13276-13281; Davis et al., The Low Density Lipoprotein Receptor, (1987) Journal of Biological Chemistry 262(9):4075-4082; y, Peacock et al., Human Low Density Lipoprotein Receptor Expressed in Xenopus Oocytes, (1988) Journal of Biological Chemistry 263(16):7838-7845.
Otras publicaciones que describen las proteínas VLDLR, ApoER2 y LRP1 y sus dominios monoméricos incluyen las siguientes así como las referencias allí citadas: Savonen et al., The Carboxyl-terminal Domain of Receptor-associated Protein Facilitates Proper Folding and Trafficking of the Very Low Density Lipoprotein Receptor by Interaction with the Three Amino-terminal Ligand-binding Repeats of the Receptor, (1999) Journal of Biological Chemistry 274(36):25877-25882; Hewat et al., The cellular receptor to human rhinovirus 2 binds around the 5-fold axis and not in the canyon: a structural view, (2000) EMBO Journal 19(23):6317-6325; Okun et al., VLDL Receptor Fragments of Different Lengths Bind to Human Rhinovirus HRV2 with Different Stoichiometry, (2001) Journal of Biological Chemistry 276(2):1057-1062; Rettenberger et al., Ligand Binding Properties of the Very Low Density Lipoprotein Receptor, (1999) Journal of Biological Chemistry 274(13):8973-8980; Mikhailenko et al., Functional Domains of the very low density lipoprotein receptor: molecular analysis of ligand binding and acid-dependent ligand dissociation mechanisms, (1999) Journal of Cell Science 112:3269-3281; Brandes et al., Alternative Splicing in the Ligand Binding Domain of Mouse ApoE Receptor-2 Produces Receptor Variants Binding Reelin but not alpa2-rnacroglobulin, (2001) Journal of Biological Chemistry 276(25):22160-22169; Kim et al., Exon/Intron Organization, Chromosome Localization, Alternative Splicing, and Transcription Units of the Human Apolipoprotein E Receptor 2 Gene, (1997) Journal of Biological Chemistry 272(13):8498-8504; Obermoeller-McCormick et al., Dissection of receptor folding and ligand-binding property with functional minireceptors of LDL receptor-related protein, (2001) Journal of Cell Science 114(5):899-908; Horn et al., Molecular Analysis of Ligand Binding of the Second Cluster of Complement-type Repeats of the Low Density Lipoprotein Receptor-related Protein, (1997) Journal of Biological Chemistry 272(21):13608-13613; Neels et al., The Second and Fourth Cluster of Class A Cysteine-rich Repeats of the Low Density Lipoprotein Receptor-related Protein Share Ligand binding Properties, (1999) Journal of Biological Chemistry 274(44):31305-31311; Obermoeller et al., Differential Functions of the Triplicated Repeats Suggest Two Independent Roles for the Receptor-Associated Protein as a Molecular Chaperone, (1997) Journal of Biological Chemistry 272(16):10761-10768; Andersen et al., Identification of the Minimal Functional Unit in the Low Density Lipoprotein Receptor-related Protein for Binding the Receptor-associated Protein (RAP), (2000) Journal of Biological Chemistry 275(28):21017-21024; Andersen et al., Specific Binding of alpha-Macroglobulin to Complement-Type Repeat CR4 of the Low-Density Lipoprotein Receptor-Related Protein, (2000) Biochemistry 39:10627-10633; Vash et al., Three Complement-Type Repeats of the Low-Density Lipoprotein Receptor-Related Protein Define a.Common Binding Site for RAP, PAI-1, and Lactoferrin, (1998) Blood 92(9):3277-3285; Dolmer et al., NMR Solution Structure of Complement-like Repeat CR3 from the Low Density Lipoprotein Receptor-related Protein, (2000) Journal of Biological Chemistry 275(5):3264-3269; Huang et al., NMR Solution Structure of Complement-like Repeat CR8 from the Low Density Lipoprotein Receptor-related Protein, (1999) Journal of Biological Chemistry 274(20):14130-14136; y Liu et al., Uptake of HIV-1 Tat protein mediated by low-density lipoprotein receptor-related protein disrupts the neuronal metabolic balance of the receptor ligands, (2000) Nature Medicine 6(12):1380-1387.
Otras referencias referentes a dominios monoméricos también incluyen las siguientes publicaciones y referencias allí citadas: FitzGerald et al, Pseudomonas Exotoxin-mediated Selection Yields Cells with Altered Expression of Low Density Lipoprotein Receptor-related Protein, (1995) Journal of Cell Biology, 129: 1533-41; Willnow y Herz, Genetic deficiency in low density lipoprotein receptor-related protein confers cellular resistance to Pseudomonas exotoxin A, (1994) Journal of Cell Science, 107:719-726; Trommsdorf et al., Interaction of Cytosolic Adaptor Proteins with Neuronal Apolipoprotein E Receptors and the Amyloid Precursor Protein, (1998) Journal of Biological Chemistry, 273(5): 33556-33560; Stockinger et al., The Low Density Lipoprotein Receptor Gene Family, (1998) Journal of Biological Chemistry, 273(48): 32213-32221; Obermoeller et al., Ca+2 and Receptor-associated Protein are independently required for proper folding and disulfide bond formation of the low density lipoprotein receptor-related protein, (1998) Journal of Biological Chemistry, 273(35):22374-22381; Sato et al., 39-kDa receptor-associated protein (RAP) facilitates secretion and ligand binding of extracellular region of very-low-density-lipoprotein receptor: implications for a distinct pathway from low-density-lipoprotein receptor, (1999) Biochem. J., 341:377-383; Avromoglu et al, Functional Expression of the Chicken Low Density Lipoprotein Receptor-related Protein in a mutant Chinese Hamster Ovary Cell Line Restores Toxicity of Pseudomonas Exotoxin A and Degradation of alpha2 Macroglobulin, (1998) Journal of Biological Chemistry, 273(11) 6057-6065; Kingsley y Krieger, Receptor-mediated endocytosis of low density lipoprotein: Somatic cell mutants define multiple genes required for expression of surface-receptor activity, (1984) PNAS USA, 81:5454-5458; Li et al, Differential Functions of Members of the Low Density Lipoprotein Receptor Family Suggests by their distinct endocystosis rates, (2001) Journal of Biological Chemistry 276(21):18000-18006; y, Springer, An Extracellular beta-Propeller Module Predicted in Lipoprotein and Scavenger Receptors, Tyrosine Kinases, Epidermal Growth Factor Precursor, and Extracellular Matrix Components, (1998) J. Mol. Biol. 283:837-862.
Los polinucleótidos (también referidos como ácidos nucleicos) que codifican los dominios monoméricos se emplean típicamente para elaborar dominios monoméricos a través de su expresión. Los ácidos nucleicos que codifican dominios monoméricos pueden ser obtenidos de una variedad de fuentes diferentes. Las genotecas de dominios monoméricos pueden ser preparadas expresando una pluralidad de ácidos nucleicos diferentes que codifican dominios monoméricos de origen natural, dominios monoméricos alterados (esto es, variantes de dominios monoméricos), o sus combinaciones.
La invención proporciona métodos de identificación de dominios monoméricos que se unen a un ligando seleccionado o deseado o una mezcla de ligandos. En algunas realizaciones, los dominios monoméricos y/o inmuno-dominios se identifican o seleccionan con respecto a una propiedad deseada (p. ej., afinidad de unión) y después los dominios monoméricos y/o inmuno-dominios forman multímeros. Véase, p. ej., la Figura 5. Para esas realizaciones, se puede utilizar cualquier método que de como resultado la selección de dominios con una propiedad deseada (p. ej., una propiedad de unión específica). Por ejemplo, los métodos pueden comprender proporcionar una pluralidad de ácidos nucleicos diferentes, codificando cada ácido nucleico un dominio monomérico; traducir la pluralidad de ácidos nucleicos diferentes, proporcionando de ese modo una pluralidad de dominios monoméricos diferentes; escrutar la pluralidad de dominios monoméricos diferentes en busca de la unión al ligando o la mezcla de ligandos deseados; e, identificar miembros de la pluralidad de dominios monoméricos diferentes que se unen al ligando o mezcla de ligandos deseados.
Como se ha mencionado antes, los dominios monoméricos pueden ser de origen natural o alterado (variantes no naturales). El término "de origen natural" se utiliza en la presente memoria para indicar que un objeto puede ser encontrado en la naturaleza. Por ejemplo, los dominios monoméricos naturales pueden incluir dominios monoméricos humanos u opcionalmente, dominios derivados de diferentes especies o fuentes, p. ej., mamíferos, primates, roedores, peces, pájaros, reptiles, plantas, etc. Los dominios monoméricos de origen natural pueden ser obtenidos mediante numerosos métodos, p. ej., mediante amplificación por PCR del ADN genómico o el ADNc.
Los dominios monoméricos de la presente invención pueden ser dominios de origen natural o variantes de origen no natural. Las genotecas de dominios monoméricos empleadas en la práctica de la presente invención pueden contener dominios monoméricos de origen natural, variantes de dominios monoméricos de origen no natural, o una de sus combinaciones.
Las variantes de dominios monoméricos pueden incluir dominios ancestrales, dominios quiméricos, dominios al azar, dominios mutados, y similares. Por ejemplo, los dominios ancestrales se pueden basar en el análisis filogenético. Los dominios quiméricos son dominios en los cuales una o más regiones son remplazadas por las regiones correspondientes de otros dominios de la misma familia. Los dominios al azar son dominios en los cuales una o más regiones se han aleatorizado. La aleatorización se puede basar en una aleatorización completa, u, opcionalmente, una aleatorización parcial basada en la distribución natural.
Los dominios monoméricos no naturales o los dominios monoméricos alterados se pueden producir mediante numerosos métodos. Se puede utilizar cualquier método de mutagénesis, tal como la mutagénesis dirigida al sitio y la mutagénesis al azar (p. ej., mutagénesis química) para producir variantes. En algunas realizaciones, se emplea la PCR propensa a errores para crear variantes. Los métodos adicionales incluyen el alineamiento de una pluralidad de dominios monoméricos de origen natural alineando aminoácidos conservados en la pluralidad de dominios monoméricos de origen natural; y, diseñando el dominio monomérico de origen no natural mediante el mantenimiento de los aminoácidos conservados e insertando, suprimiendo o alterando los aminoácidos en torno a los aminoácidos conservados para generar el dominio monomérico de origen no natural. En una realización, los aminoácidos conservados comprenden cisteínas. En otra realización, la etapa de inserción utiliza aminoácidos al azar, u opcionalmente, la etapa de inserción utiliza porciones de los dominios monoméricos de origen natural. Los aminoácidos pueden ser insertados sintéticamente o pueden ser codificados por un ácido nucleico.
Los ácidos nucleicos que codifican fragmentos de los dominios monoméricos de origen natural y/o los inmuno-dominios también se pueden mezclar y/o recombinar (p. ej., utilizando fragmentos producidos químicamente o enzimáticamente) para generar dominios monoméricos y/o inmuno-dominios modificados, completos. Los fragmentos y el dominio monomérico también pueden ser recombinados manipulando los ácidos nucleicos que codifican los dominios o sus fragmentos. Por ejemplo, se puede utilizar la ligación de un constructo de ácido nucleico que codifica fragmentos del dominio monomérico para generar un dominio monomérico alterado.
Los dominios monoméricos alterados también pueden ser generados proporcionando una colección de oligonucleótidos sintéticos (p. ej., oligonucleótidos solapantes) que codifican una secuencia conservada, al azar, al pseudo-azar, o definida de secuencias peptídicas que después son insertadas mediante ligación en un sitio predeterminado en un polinucleótido que codifica un dominio monomérico. De un modo similar, la diversidad de secuencia de uno o más dominios monoméricos puede ser ampliada mutando el dominios o los dominios monoméricos mediante mutagénesis dirigida al sitio, mutación al azar, mutación al pseudo-azar, mutación kernal definida, mutación basada en codones, y similares. Las moléculas de ácido nucleico resultantes pueden ser propagadas en un anfitrión para la clonación y amplificación. Los ácidos nucleicos pueden ser barajados.
Adicionalmente se describe en la presente memoria un método para recombinar una pluralidad de ácidos nucleicos que codifican dominios monoméricos y escrutar la genoteca resultante en busca de dominios monoméricos que se unen al ligando o mezcla de ligandos deseados o similar. Los ácidos nucleicos de dominios monoméricos seleccionados también pueden ser retro-cruzados mediante barajado con secuencias de polinucleótido que codifican secuencias neutras (esto es, que tienen un efecto funcional insustancial sobre la unión), tal como por ejemplo, mediante retro-cruzamiento con una secuencia de tipo salvaje o de origen natural esencialmente idéntica a una secuencia seleccionada para producir dominios monoméricos funcionales de tipo nativo. Generalmente, durante el retro-cruzamiento, se aplica la selección posterior para conservar la propiedad, p. ej., la unión al ligando.
Como se describe en la presente memoria la biblioteca de monómeros puede ser preparada mediante barajado. En tal caso, los dominios monoméricos se aíslan y se barajan para recombinar combinatoriamente las secuencias de ácido nucleico que codifican los dominios monoméricos (la recombinación se puede producir entre o en los dominios monoméricos, o ambos). La primera etapa implica identificar un dominio monomérico que tenga la propiedad deseada, p. ej., afinidad por un cierto ligando. Si bien durante la recombinación se mantienen los aminoácidos conservados, las secuencias de ácido nucleico que codifican los dominios monoméricos se pueden recombinar, o recombinar y unir en multímeros.
La selección de dominios monoméricos y/o inmuno-dominios a partir de una biblioteca de dominios se puede completar mediante una variedad de procedimientos. Por ejemplo, un método de identificación de dominios monoméricos y/o inmuno-dominios que tienen una propiedad deseada implica traducir una pluralidad de ácidos nucleicos, donde cada ácido nucleico codifica un dominio monomérico y/o inmuno-dominio, escrutar los polipéptidos codificados por la pluralidad de ácidos nucleicos, e identificar esos dominios monoméricos y/o inmuno-dominios que, p. ej., se unen a un ligando o una mezcla de ligandos deseados, produciendo de ese modo un dominio monomérico y/o inmuno-dominio seleccionado. Los dominios monoméricos y/o inmuno-dominios expresados por cada uno de los ácidos nucleicos pueden ser sometidos a ensayo en busca de su capacidad para unirse al ligando mediante métodos conocidos en la técnica (esto es, inmunopurificación, cromatografía de afinidad, análisis FACS).
Como se ha mencionado antes, la selección de los dominios monoméricos y/o inmuno-dominios se puede basar en la unión a un ligando tal como una proteína diana u otra molécula diana (p. ej., lípido, carbohidrato, ácido nucleico y similares). Otras moléculas pueden ser incluidas opcionalmente en los métodos junto con la diana, p. ej., iones tales como Ca^{+2}. El ligando puede ser un ligando conocido, p. ej., un ligando que se sabe que se une a uno de una pluralidad de dominios monoméricos, o p. ej., el ligando deseado puede ser un ligando de un dominio monomérico desconocido. Véase, p. ej., la Figura 4, que ilustra algunos de los ligandos que se unen al dominio A. Otras selecciones de dominios monoméricos y/o inmuno-dominios se pueden basar, p. ej., en la inhibición o potenciación de una función específica de una proteína diana o una actividad. La actividad de la proteína diana puede incluir, p. ej., endocitosis o internalización, inducción del sistema del segundo mensajero, regulación al alza o regulación a la baja de un gen, unión a una matriz extracelular, liberación de una o varias moléculas, o un cambio en la conformación. En este caso, no se necesita que el ligando sea conocido. La selección también puede incluir el uso de análisis de alto rendimiento.
Cuando un dominio monomérico y/o inmuno-dominio se selecciona basándose en su capacidad para unirse a un ligando, el fundamento de selección puede incluir la selección basada en una tasa de disociación lenta, que normalmente es predictiva de una elevada afinidad. La valencia del ligando también se puede variar para controlar la afinidad de unión media de los dominios monoméricos y/o inmuno-dominios seleccionados. El ligando se puede unir a una superficie o sustrato a densidades variables, por ejemplo incluyendo un compuesto competidor, mediante dilución, o mediante otro método conocido por los expertos en la técnica. Se puede utilizar una elevada densidad (valencia) de ligando predeterminado para enriquecer en dominios monoméricos que tengan una afinidad relativamente baja, mientras una densidad baja (valencia) se puede enriquecer preferentemente en dominios monoméricos de afinidad superior.
Se pueden utilizar una variedad de vectores de presentación informadores para expresar ácidos nucleicos que codifican los dominios monoméricos, inmuno-dominios y/o multímeros de la presente invención y para someter a ensayo una actividad deseada. Por ejemplo, un sistema de presentación en fagos es un sistema en el cual se expresan dominios monoméricos como proteínas de fusión sobre la superficie de fagos (Pharmacia, Milwaukee Wis.). La presentación en fagos puede implicar la presentación de una secuencia polipeptídica que codifique dominios monoméricos y/o inmuno-dominios sobre la superficie de un bacteriófago filamentoso, típicamente como una fusión con una proteína de la envoltura del bacteriófago.
Generalmente en estos métodos, cada partícula de fago o célula sirve como un miembro de una genoteca individual que presenta una única especie de polipéptido presentado además de las secuencias de proteínas del fago natural o célula. La pluralidad de ácidos nucleicos se clona en el ADN del fago en un sitio que da como resultado la transcripción de una proteína de fusión, una porción de la cual está codificada por la pluralidad de ácidos nucleicos. El fago que contiene una molécula de ácido nucleico experimenta replicación y transcripción en la célula. La secuencia líder de la proteína de fusión dirige el transporte de la proteína de fusión hacia la punta de la partícula del fago. De este modo, la proteína de fusión que está parcialmente codificada por el ácido nucleico es presentada sobre la partícula del fago para la detección y selección mediante los métodos descritos más arriba y más abajo. Por ejemplo, la genoteca de fagos se puede incubar con un ligando predeterminado (deseado), de manera que las partículas de fago que presentan una secuencia de una proteína de fusión que se une al ligando se puedan separar diferencialmente de aquellas que no presenten secuencias polipeptídicas que se unan al ligando predeterminado. Por ejemplo, la separación se puede proporcionar inmovilizando el ligando predeterminado. Las partículas de fago (esto es, los miembros de la genoteca) que se unen al ligando inmovilizado son recuperadas después y replicadas para amplificar la subpoblación de fagos seleccionados para una ronda subsiguiente de enriquecimiento de afinidad y replicación de fagos. Después de varias rondas de enriquecimiento de afinidad y replicación de fagos, los miembros de la genoteca de fagos que se seleccionan de este modo se aíslan y la secuencia de nucleótidos que codifica la secuencia de polipéptidos presentada se determina, identificando de ese modo la secuencia o las secuencias de polipéptidos que se unen al ligando predeterminado. Tales métodos se describen adicionalmente en las publicaciones de patentes PCT Núms. 91/17271, 91/18980, y 91/19818 y 93/08278.
Los ejemplos de otros sistemas de presentación incluyen presentaciones en ribosomas, una presentación ligada a nucleótidos (véanse, p. ej., las Patentes de los Estados Unidos Núms. 6.281.344; 6.194.550, 6.207.446, 6.214.553, y 6.258.558), presentaciones en superficies celulares y similares. Las presentaciones en superficies celulares incluyen una variedad de células, p. ej., células de E. coli, levadura y/o mamífero. Cuando se utiliza una célula como presentación, los ácidos nucleicos, p. ej., obtenidos mediante amplificación por PCR seguida de digestión, son introducidos en la célula y traducidos. Opcionalmente, los polipéptidos que codifican los dominios monoméricos o los multímeros de la presente invención pueden ser introducidos, p. ej., mediante inyección, en la célula.
La invención también incluye composiciones que son producidas mediante los métodos de la presente invención. Por ejemplo, la presente invención incluye dominios monoméricos seleccionados o identificados a partir de una genoteca y/o genotecas que comprenden dominios monoméricos producidos mediante los métodos de la presente invención.
La presente invención también proporciona bibliotecas de dominios monoméricos. Las bibliotecas pueden incluir, p. ej., aproximadamente 100, 250, 500 dominios monoméricos, o la biblioteca puede incluir, p. ej., aproximadamente 100, 250, 500 o más polipéptidos que codifican dominios monoméricos. Las bibliotecas pueden incluir dominios monoméricos que contienen el mismo marco de cisteínas, p. ej., dominios A.
Como se describe en la presente memoria, las genotecas se pueden escrutar en busca de una propiedad deseada tal como la unión de un ligando o una mezcla de ligandos deseados. Por ejemplo, los miembros de la biblioteca de dominios monoméricos se pueden presentar y pre-escrutar en busca de la unión a un ligando o mezcla de ligandos conocidos o desconocidos. Las secuencias de los dominios monoméricos se pueden mutagenizar después (p. ej., recombinar, alterar químicamente, etc.) o alterar de otro modo y los nuevos dominios monoméricos se pueden escrutar de nuevo en busca de la unión al ligando o la mezcla de ligandos con una afinidad mejorada. Los dominios monoméricos seleccionados se pueden combinar o unir para formar multímeros, que después se pueden escrutar en busca de una afinidad o avidez mejoradas o una especificidad alterada para el ligando o la mezcla de ligandos. La especificidad alterada puede significar que la especificidad se amplía, p. ej., unión de múltiples virus relacionados, u opcionalmente la especificidad alterada puede significar que la especificidad se estrecha, p. ej., la unión en una región específica de un ligando. Los expertos en la técnica reconocerán que hay varios métodos disponibles para calcular la avidez. Véanse, p. ej., Mammen et al., Angew Chem Int. Ed. 37:2754-2794 (1998); Muller et al., Anal. Biochem. 261:149-158
(1998).
Los expertos en la técnica reconocerán que las etapas de generación de la variación y el escrutinio en busca de una propiedad deseada se pueden repetir (esto es, realizar recursivamente) para optimizar los resultados. Por ejemplo, en una genoteca de presentación en fagos u otro formato similar, se puede realizar un primer escrutinio de una genoteca con una restricción relativamente inferior, seleccionando de ese modo tantas partículas asociadas con una molécula diana como sea posible. Las partículas seleccionadas se pueden aislar después y los polinucleótidos que codifican el monómero o multímero se pueden aislar de las partículas. Después se pueden generar variaciones adicionales partir de estas secuencias y con posterioridad rastrear a una afinidad superior. La Figura 7 ilustra un ciclo genérico de selección y generación de la variación.
Los polipéptidos de las composiciones están incluidos en la presente invención. Por ejemplo, la presente invención proporciona una pluralidad de ácidos nucleicos diferentes donde cada ácido nucleico codifica al menos dos dominios monoméricos de clase A del receptor de LDL.
2. Multímeros (también denominados Proteínas Mosaico Recombinante o Proteínas Mosaico Combinatorias)
Los métodos para generar multímeros son un rasgo de la presente invención. Los multímeros comprenden al menos dos dominios monoméricos de la clase A de los receptores de LDL. Por ejemplo, los multímeros de la invención pueden comprender de 2 a aproximadamente 10 dominios monoméricos y/o inmuno-dominios, de 2 y aproximadamente 8 dominios monoméricos y/o inmuno-dominios, de aproximadamente 3 y aproximadamente 10 dominios monoméricos y/o inmuno-dominios, aproximadamente 7 dominios monoméricos y/o inmuno-dominios, aproximadamente 6 dominios monoméricos y/o inmuno-dominios, aproximadamente 5 dominios monoméricos y/o inmuno-dominios, o aproximadamente 4 dominios monoméricos y/o inmuno-dominios. En algunas realizaciones, el multímero comprende al menos 3 dominios monoméricos y/o inmuno-dominios. Típicamente, los dominios monoméricos han sido pre-seleccionados para la unión a la molécula diana de interés.
En algunas realizaciones, cada dominio monomérico se une específicamente a una molécula diana. En algunas de estas realizaciones, cada monómero se une a una posición diferente (análoga a un epítopo) de una molécula diana. Múltiples dominios monoméricos y/o inmuno-dominios que se unen a la misma molécula diana dan como resultado un efecto sobre la avidez que produce una mejora de la avidez del multímero por la molécula diana en comparación con cada monómero individual. En algunas realizaciones, el multímero tiene una avidez de al menos aproximadamente 1,5, 2, 3, 4, 5, 10, 20, 50 o 100 veces la avidez de un dominio monomérico solo.
En otra realización, el multímero comprende dominios monoméricos con especificidades para diferentes moléculas diana. Por ejemplo, los multímeros de tales dominios monoméricos diversos se pueden unir específicamente a componentes de un sistema de replicación viral o diferentes serotipos de un virus. En algunas realizaciones, al menos un dominio monomérico se une a una toxina y al menos un dominio monomérico se une a una molécula de la superficie celular, actuando de ese modo como un mecanismo para dirigir la toxina. En algunas realizaciones, al menos dos dominios monoméricos y/o inmuno-dominios del multímero se unen a moléculas diana diferentes en una célula o tejido diana. De un modo similar, las moléculas terapéuticas pueden ser dirigidas a la célula o tejido uniendo un agente terapéutico a un monómero que también contiene otros dominios monoméricos y/o inmuno-dominios que tienen especificidad de unión a la célula o tejido.
Los multímeros pueden comprender una variedad de combinaciones de dominios monoméricos. Por ejemplo, en un único multímero, los dominios monoméricos seleccionados pueden ser iguales o idénticos, opcionalmente, diferentes o no idénticos. Además, los dominios monoméricos seleccionados pueden comprender varios dominios monoméricos diferentes de la misma familia de dominios monoméricos, o varios dominios monoméricos de diferentes familias de dominios, u opcionalmente, una combinación de ambos.
Los multímeros que se generan en la práctica de la presente invención pueden ser cualquiera de los siguientes:
(1)
Un homo-multímero (un multímero del mismo dominio, esto es, A1-A1-A1-A1);
(2)
Un hetero-multímero de diferentes dominios de la misma clase de dominios, p. ej., A1-A2-A3-A4. Por ejemplo, el hetero-multímero incluye multímeros en los que A1, A2, A3 y A4 son diferentes variantes de origen no natural de un dominio de clase A del receptor de LDL concreto, o donde algunos de A1, A2, A3, y A4 son variantes de origen natural de un dominio de clase A del receptor de LDL (véase, p. ej., la Figura 10).
Las bibliotecas de multímeros empleadas en la práctica de la presente invención pueden contener homo-multímeros, hetero-multímeros de diferentes dominios monoméricos (naturales o no naturales) de los dominios de clase A del receptor de LDL.
Los dominios no necesitan ser seleccionados antes de que los dominios se unan para formar multímeros. Por otra parte, los dominios pueden ser seleccionados en busca de su capacidad para unirse a una molécula diana antes de unirse en multímeros. De este modo, por ejemplo, un multímero puede comprender dos dominios que se unen a una molécula diana y un tercer dominio que se une a una segunda molécula diana.
Los dominios monoméricos seleccionados se unen por medio de un conector para formar un multímero. Por ejemplo, se coloca un conector entre cada dominio monomérico separado discreto en un multímero.
La unión de los dominios monoméricos seleccionados por medio de un conector se puede completar utilizando una variedad de mecanismos conocidos en la técnica. Por ejemplo, el ensamblaje combinatorio de los polinucleótidos que codifican los dominios monoméricos seleccionados se puede lograr mediante ligación de ADN, u opcionalmente, mediante reacciones de solapamiento de auto-cebado basadas en PCR. El conector puede ser anclado a un monómero antes de que el monómero sea identificado por su capacidad para unirse a un multímero diana o después de que el monómero haya sido seleccionado por su capacidad para unirse a un multímero diana.
El conector puede ser de origen natural, sintético o una combinación de ambos. Por ejemplo, el conector sintético puede ser un conector aleatorizado, p. ej., tanto en secuencia como en tamaño. En un aspecto, el conector aleatorizado puede comprender una secuencia completamente aleatorizada, u opcionalmente, el conector aleatorizado se puede basar en secuencias conectoras naturales. El conector puede comprender, p. ej. un radical no peptídico, un polinucleótido, un polipéptido o similar.
Un conector puede ser rígido, o alternativamente, flexible, o una combinación de ambos. La flexibilidad del conector puede ser una función de la composición tanto del conector como de los dominios monoméricos con los cuales interacciona el conector. El conector une dos dominios monoméricos seleccionados, y mantiene los dominios monoméricos como dominios monoméricos separados discretos. El conector puede permitir que los dominios monoméricos separados discretos cooperen aunque mantengan sus propiedades separadas tales como múltiples sitios de unión separados para el mismo ligando en un multímero, o p. ej., múltiples sitios de unión separados para diferentes ligandos en un multímero.
La elección de un conector adecuado para un caso específico en el que dos o más dominios monoméricos (esto es cadenas polipeptídicas) van a ser conectados puede depender de una variedad de parámetros incluyendo, p. ej. la naturaleza de los dominios monoméricos, la estructura y naturaleza de la diana a la cual se debe unir el multímero polipeptídico y/o la estabilidad del conector peptídico hacia la proteolisis y la oxidación.
La presente invención proporciona métodos para optimizar la elección del conector una vez que se han identificado los dominios monoméricos/variantes deseados. Generalmente, las bibliotecas de multímeros que tienen una composición que es fija con respecto a la composición de dominios monoméricos, pero variable en la composición y longitud del conector, se puede preparar fácilmente y escrutar como se ha descrito antes.
Típicamente, el polipéptido conector puede incluir predominantemente residuos de aminoácido seleccionados del grupo que consiste en Gly, Ser, Ala y Thr. Por ejemplo, el conector peptídico puede contener al menos 75% (calculado basándose en el número total de residuos del conector peptídico), por ejemplo al menos 80%, p. ej. al menos 85% o al menos 90% de residuos de aminoácido seleccionados del grupo que consiste en Gly, Ser, Ala y Thr. El conector peptídico también puede consistir en residuos de Gly, Ser, Ala y/o Thr solamente. El polipéptido conector debe tener una longitud, que sea adecuada para conectar dos dominios monoméricos de tal manera que adopten entre sí la conformación relativa correcta de forma que conserven la actividad deseada, por ejemplo como antagonistas de un receptor dado.
Una longitud adecuada para este propósito es una longitud de al menos uno y típicamente menos de aproximadamente 50 residuos de aminoácido, tal como 2-25 residuos de aminoácido, 5-20 residuos de aminoácido, 5-15 residuos de aminoácido, 8-12 residuos de aminoácido u 11 residuos. De un modo similar, el polipéptido que codifica un conector puede oscilar en tamaño, p. ej., de aproximadamente 2 a aproximadamente 15 aminoácidos, de aproximadamente 3 a aproximadamente 15, de aproximadamente 4 a aproximadamente 12, aproximadamente 10, aproximadamente 8, o aproximadamente 6 aminoácidos. En los métodos y composiciones que implican ácidos nucleicos, tales como ADN, ARN, o combinaciones de ambos, el polinucleótido que contiene la secuencia conectora puede tener, p. ej., entre aproximadamente 6 nucleótidos y aproximadamente 45 nucleótidos, entre aproximadamente 9 nucleótidos y aproximadamente 45 nucleótidos, entre aproximadamente 12 nucleótidos y aproximadamente 36 nucleótidos, aproximadamente 30 nucleótidos, aproximadamente 24 nucleótidos, o aproximadamente 18 nucleótidos. Del mismo modo, los residuos de aminoácido seleccionados para la inclusión en el polipéptido conector deben mostrar propiedades que no interfieran significativamente en la actividad o función del multímero polipeptídico. De este modo, el conector peptídico no debe mostrar en general, una carga que no concuerde con la actividad o función del multímero polipeptídico, o interfiera en el plegamiento interno, o forme enlaces u otras interacciones con residuos de aminoácido en uno o más de los dominios monoméricos que pudieran impedir gravemente la unión del multímero polipeptídico a la diana en cuestión.
Como se describe en la presente memoria, el conector peptídico se selecciona de una biblioteca en la que los residuos de aminoácido del conector peptídico están aleatorizados para un grupo específico de dominios monoméricos en un multímero polipeptídico concreto. Se podría utilizar un conector flexible para encontrar combinaciones adecuadas de dominios monoméricos, que después se optimiza utilizando esta biblioteca al azar de conectores variables para obtener conectores con una longitud y geometría óptimas. Los conectores óptimos pueden contener el número mínimo de residuos de aminoácido del tipo correcto que participan en la unión a la diana y restringir el movimiento relativo de los dominios monoméricos entre sí en el multímero polipeptídico cuando no está unido a la
diana.
El uso de conectores peptídicos de origen natural así como artificiales para conectar polipéptidos en polipéptidos de fusión conectados novedosos es bien conocido en la bibliografía (Hallewell et al. (1989), J. Biol. Chem. 264, 5260-5268; Alfthan et al. (1995), Protein Eng. 8, 725-731; Robinson & Sauer (1996), Biochemistry 35, 109-116; Khandekar et al. (1997), J. Biol. Chem. 272, 32190-32197; Fares et al. (1998), Endocrinology 139,2459-2464; Smallshaw et al. (1999), Protein Eng. 12, 623-630; US 5,856,456).
Un ejemplo en el que el uso de conectores peptídicos es amplio es para la producción de anticuerpos de cadena sencilla en los que las regiones variables de una cadena ligera (V_{L}) y una cadena pesada (V_{H}) están unidas por un conector artificial, y existe un gran número de publicaciones sobre este campo concreto. Un conector peptídico ampliamente utilizado es un péptido de 15 unidades que consiste en tres repeticiones de una secuencia de aminoácidos Gly-Gly-Gly-Gly-Ser ((Gly_{4}Ser)_{3}). Se han utilizado otros conectores y se han utilizado la tecnología de presentación en fagos así como la tecnología de fagos infectivos selectivos para diversificar y seleccionar secuencias conectoras apropiadas (Tang et al. (1996), J. Biol. Chem. 271, 15682-15686; Hennecke et al. (1998), Protein Eng. 11, 405-410). Se han utilizado conectores peptídicos para conectar cadenas individuales en proteínas hetero- y homo-diméricas tales como el receptor de las células T, el represor Cro de lambda, el represor Arc del fago P22, IL-12, TSH, FSH, IL-5, y el interferón-\gamma. También se han empleado conectores peptídicos para crear polipéptidos de fusión. Se han utilizado diferentes conectores y en el caso del represor Arc, se ha utilizado la presentación en fagos para optimizar la longitud del conector y la composición para un aumento de la estabilidad de la proteína de cadena sencilla (Robinson y Sauer (1998), Proc. Natl. Acad. Sci. USA 95, 5929-5934).
Otro tipo de conector es una inteína, esto es, un tramo peptídico que es expresado con el polipéptido de cadena sencilla, pero separado post-traduccionalmente mediante empalme de proteínas. El uso de inteínas es revisado por F.S. Gimble en Chemistry and Biology, 1998, Vol 5, Núm. 10 págs. 251-256.
Otro modo más de obtener un conector adecuado es mediante la optimización de un conector simple, p. ej. (Gly_{4}Ser)_{n}, por medio de mutagénesis al azar.
Como se ha mencionado antes, generalmente se prefiere que el conector peptídico posea al menos cierta flexibilidad. Por consiguiente, en algunas realizaciones, el conector peptídico contiene 1-25 residuos de glicina, 5-20 residuos de glicina, 5-15 residuos de glicina o 8-12 residuos de glicina. El péptido conector contendrá típicamente al menos 50% de residuos de glicina, por ejemplo al menos 75% de residuos de glicina. El conector peptídico puede comprender solamente residuos de glicina.
El conector peptídico puede, además de residuos de glicina, comprender otros residuos, en particular residuos seleccionados del grupo que consiste en Ser, Ala y Thr, en particular Ser. De este modo, un ejemplo de un conector peptídico específico incluye un conector peptídico que tiene la secuencia de aminoácidos Gly_{x}-Xaa-Gly_{y}-Xaa-Gly_{z}, donde cada Xaa se selecciona independientemente del grupo que consiste en Ala, Val, Leu, Ile, Met, Phe, Trp, Pro, Gly, Ser, Thr, Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu, y donde cada uno de x, y y z son números enteros en el intervalo de 1-5. En algunas realizaciones, cada Xaa se selecciona independientemente del grupo que consiste en Ser, Ala y Thr, en particular Ser. Más concretamente, el conector peptídico tiene la secuencia de aminoácidos Gly-Gly-Gly-Xaa-Gly-Gly-Gly-Xaa-Gly-Gly-Gly, donde cada Xaa se selecciona independientemente del grupo que consiste en Ala, Val, Leu, Ile, Met, Phe, Trp, Pro, Gly, Ser, Thr, Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu. Como se describe en la presente memoria, cada Xaa se puede seleccionar independientemente del grupo que consiste en Ser, Ala y Thr, en particular Ser.
En algunos casos puede ser deseable o necesario proporcionar cierta rigidez al conector peptídico. Esto se puede completar incluyendo residuos de prolina en la secuencia de aminoácidos del conector peptídico. De este modo, el conector peptídico puede comprender al menos un residuo de prolina en la secuencia de aminoácidos del conector peptídico. Por ejemplo, el conector peptídico tiene una secuencia de aminoácidos, donde al menos 25%, por ejemplo al menos 50%, p. ej. al menos 75%, de los residuos de aminoácido son residuos de prolina. Como se describe en la presente memoria, el conector peptídico comprende solamente residuos de prolina.
Asimismo se describen en la presente memoria conectores peptídicos modificados de tal manera que se introduce un residuo de aminoácido que comprende un grupo de anclaje para un radical no polipeptídico. Los ejemplos de tal residuo de aminoácido pueden ser un residuo de cisteína (al cual se ancla con posterioridad el radical no polipeptídico) o la secuencia de aminoácidos puede incluir un sitio de N-glicosilación in vivo (anclando de ese modo un radical azúcar (in vivo) al conector peptídico).
El conector peptídico puede comprender al menos un residuo de cisteína, tal como un residuo de cisteína. De este modo, en algunas realizaciones de la invención el conector peptídico comprende residuos de aminoácido seleccionados del grupo que consiste en Gly, Ser, Ala, Thr y Cys. Semejante conector peptídico puede comprender solamente un residuo de cisteína.
El conector peptídico descrito en la presente memoria puede comprender residuos de glicina y residuos de cisteína, por ejemplo solamente residuos de glicina y residuos de cisteína. Típicamente, se puede incluir sólo un residuo de cisteína por conector peptídico. De este modo, un ejemplo de un conector peptídico específico que comprende un residuo de cisteína, incluye un conector peptídico que tiene la secuencia de aminoácidos Gly_{n}-Cys-Gly_{m}, donde n y m son cada uno números enteros de 1-12, p. ej., de 3-9, de 4-8, o de 4-7. Más concretamente, el conector peptídico puede tener la secuencia de aminoácidos GGGGG-C-GGGGG.
Este enfoque (esto es la introducción de un residuo de aminoácido que comprende un grupo de anclaje para un radical no polipeptídico) también se puede utilizar para los conectores que contienen prolina más rígida. Por consiguiente, el conector peptídico puede comprender residuos de prolina y cisteína, tal como residuos de prolina y cisteína solamente. Un ejemplo de un conector peptídico que contiene prolina específico que comprende un residuo de cisteína, incluye un conector peptídico que tiene la secuencia de aminoácidos Pro_{n}-Cys-Pro_{m}, donde n y m son cada uno números enteros de 1-12, preferiblemente de 3-9, por ejemplo de 4-8 o de 4-7. Más concretamente, el conector peptídico puede tener la secuencia de aminoácidos PPPPP-C-PPPPP.
El propósito de introducir un residuo de aminoácido, tal como un residuo de cisteína, que comprende un grupo de anclaje para un radical no polipéptido es anclar con posterioridad un radical no polipeptídico a dicho residuo. Por ejemplo, los radicales no polipeptídicos pueden mejorar la vida media en suero del multímero polipeptídico. De este modo, el residuo de cisteína se puede anclar covalentemente a un radical no polipeptídico. Los ejemplos preferidos de los radicales no polipeptídios incluyen moléculas poliméricas, tales como PEG o mPEG, en particular mPEG así como agentes terapéuticos no polipeptídicos.
El experto reconocerá que se pueden utilizar otros residuos de aminoácido distintos de cisteína para anclar un no polipéptido al conector peptídico. Un ejemplo concreto de tales otros residuos incluye el acoplamiento del radical no polipeptídico a un residuo de lisina.
Otra posibilidad de introducir un grupo de anclaje específico del sitio para un radical no polipeptídico en el conector peptídico es la introducción de un sitio de N-glicosilación in vivo, tal como un sitio de N-glicosilación in vivo, en el conector peptídico. Por ejemplo, se puede introducir un sitio de N-glicosilación in vivo en un conector peptídico que comprende residuos de aminoácido seleccionados del grupo que consiste en Gly, Ser, Ala y Thr. Se entenderá que con el fin de asegurar que, en efecto, se ha anclado un radical azúcar a dicho sitio de N-glicosilación in vivo, la secuencia de nucleótidos que codifica el multímero polipeptídico debe ser insertada en un anfitrión de expresión eucariótico, glicosilante.
Un ejemplo específico de un conector peptídico que comprende un sitio de N-glicosilación in vivo es un conector peptídico que tiene la secuencia de aminoácidos Gly_{n}-Asn-Xaa-Ser/Thr-Gly_{m}, preferiblemente Gly_{n}-Asn-Xaa-Thr-Gly_{m}, donde Xaa es cualquier residuo de aminoácido excepto prolina, y donde n y m son cada uno números enteros de 1-8, preferiblemente en el intervalo de 2-5.
A menudo, las secuencias de aminoácidos de todos los conectores peptídicos presentes en el multímero polipeptídico serán idénticas. Sin embargo, en ciertos conectores las secuencias de aminoácidos de todos los conectores peptídicos presentes en el multímero polipeptídico pueden ser diferentes. Se cree que esto último es particularmente relevante en caso de que el multímero polipeptídico sea un trímero o tetrámero polipeptídico y concretamente en casos en los que un residuo de aminoácido que comprende un grupo de anclaje para un radical no polipeptídico está incluido en el conector peptídico.
\newpage
Bastante a menudo, será deseable o necesario anclar solamente unos pocos, típicamente solo uno, radicales no polipeptídicos/radical (por ejemplo mPEG, un radical azúcar o un agente terapéutico no polipeptídico) al multímero polipeptídico con el fin de lograr el efecto deseado, tal como una vida media en suero prolongada. Evidentemente, en el caso de un trímero polipeptídico, que contendrá dos conectores peptídicos, solamente se requiere modificar un conector peptídico, p. ej. mediante la introducción de un residuo de cisteína, mientras la modificación del otro conector peptídico típicamente no será necesaria. En este caso todos (ambos) conectores peptídicos del multímero polipeptídico (trímero) son diferentes.
Por consiguiente, como se describe en la presente memoria, las secuencias de aminoácidos de todos los conectores peptídicos presentes en el multímero polipeptídico son idénticas excepto por uno, dos o tres conectores peptídicos, por ejemplo excepto por uno o dos conectores peptídicos, en particular excepto por un conector peptídico, que tiene/tienen una secuencia de aminoácidos que comprende un residuo de aminoácido que comprende un grupo de anclaje para un radical no polipeptídico. Los ejemplos preferidos de tales residuos de aminoácido incluyen residuos de cisteína de sitios de N-glicosilación in vivo.
Un conector puede ser una secuencia conectora nativa o sintética. Un conector nativo ilustrativo incluye, p. ej., la secuencia entre la última cisteína de un primer dominio A de receptor de LDL y la primera cisteína de un segundo dominio A de receptor de LDL y puede ser utilizado como secuencia conectora. El análisis de diferentes conexiones de dominios A revela que los conectores nativos oscilan de al menos 3 aminoácidos a menos de 20 aminoácidos, p. ej., 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, o 18 aminoácidos de longitud. No obstante, los expertos en la técnica reconocerán que se pueden utilizar secuencias conectoras más largas o más cortas. Una secuencia conectora del dominio A ilustrativa se representa en la Figura 8. El conector es un hexámero con la siguiente secuencia A_{1}A_{2}A_{3}A_{4}A_{5}A_{6}, donde A_{1} se selecciona entre los aminoácidos A, P, T, Q, E y K; A_{2} y A_{3} son cualquier aminoácido excepto C, F, Y, W, o M; A_{4} se selecciona entre los aminoácidos S, G y R; A_{5} se selecciona entre los aminoácidos H, P, y R; y A_{6} es el aminoácido T.
Los métodos para generar multímeros a partir de dominios monoméricos pueden incluir unir los dominios seleccionados con al menos un conector para generar al menos un multímero, p. ej., el multímero puede comprender al menos dos de los dominios monoméricos y el conector. El multímero o los multímeros son escrutados después en busca de una mejora de la avidez y la afinidad o una alteración de la especificidad para el ligando o la mezcla de ligandos deseados en comparación con los dominios monoméricos seleccionados.
En otros métodos descritos en la presente memoria, los dominios multiméricos seleccionados se unen con al menos un conector para generar al menos dos multímeros, donde los dos multímeros comprenden dos o más de los dominios monoméricos seleccionados y el conector. Los dos o más multímeros son escrutados en busca de una mejora en la avidez o afinidad o una alteración de la especificidad para el ligando o la mezcla de ligandos deseados en comparación con los dominios monoméricos seleccionados, Las composiciones de dos o más multímeros producidas mediante el método anterior también se describen en la presente memoria.
Típicamente, los multímeros de la presente invención son un único polipéptido discreto. Los multímeros de radicales de conector parcial-domino-conector parcial están asociados con múltiples polipéptidos, correspondiendo cada uno a un radical de conector parcial-dominio-conector parcial.
En algunos polipéptidos descritos en la presente memoria, el multímero seleccionado comprende más de dos dominios. Tales multímeros pueden ser generados por etapas, p. ej., donde la adición de cada nuevo dominio es sometida a ensayo individualmente y el efecto de los dominios es sometido a ensayo de una manera secuencial. Véase, p. ej., la Figura 6. En otros polipéptidos descritos en la presente memoria, los dominios están conectados para formar multímeros que comprenden más de dos dominios y seleccionados por su unión sin conocimiento previo de cómo se unen multímeros más pequeños, o alternativamente, cómo se une cada dominio.
Los métodos descritos en la presente memoria también incluyen métodos de desarrollo de multímeros. Los métodos pueden comprender, p. ej., cualquiera de, o todas las siguientes etapas: proporcionar una pluralidad de ácidos nucleicos diferentes, donde cada ácido nucleico codifica un dominio monomérico; traducir la pluralidad de ácidos nucleicos diferentes, lo que proporciona una pluralidad de dominios monoméricos diferentes; escrutar la pluralidad de dominios monoméricos diferentes en busca de la unión del ligando o mezcla de ligandos deseados; identificar miembros de la pluralidad de dominios monoméricos diferentes que se unen al ligando o mezcla de ligandos deseados, lo que proporciona dominios monoméricos seleccionados; unir los dominios monoméricos seleccionados con al menos un conector para generar al menos un multímero, donde el al menos un multímero comprende al menos dos de los dominios monoméricos seleccionados y al menos un conector; y, escrutar el al menos un multímero en busca de una mejora de la afinidad o avidez o una alteración de la especificidad para el para el ligando o la mezcla de ligandos deseados en comparación con los dominios monoméricos seleccionados.
Se puede introducir una variación adicional insertando conectores de diferente longitud y composición entre los dominios. Esto permite la selección de conectores óptimos entre dominios. En algunos métodos descritos en la presente memoria la longitud y composición óptimas de los conectores permitirá una unión óptima de los dominios. En algunos métodos descritos en la presente memoria los dominios con afinidades de unión concretas se conectan por medio de diferentes conectores y se seleccionan los conectores óptimos en un análisis de unión. Por ejemplo, se seleccionan los dominios por las propiedades de unión deseadas y después se constituye una biblioteca que comprende una variedad de conectores. La biblioteca puede ser escrutada después para identificar los conectores óptimos. Alternativamente, se pueden formar bibliotecas de multímeros en las que el efecto del dominio o el conector sobre la unión a la molécula diana no es conocido.
Los métodos descritos en la presente memoria también incluyen generar uno o más multímeros seleccionados proporcionando una pluralidad de dominios monoméricos. La pluralidad de dominios monoméricos se escruta en busca de la unión de un ligando o mezcla de ligandos deseados. Los miembros de la pluralidad de dominios que se unen al ligando o mezcla de ligandos deseados se identifican, proporcionando de ese modo dominios con una afinidad deseada. Los dominios identificados se unen con al menos un conector para generar los multímeros, donde cada multímero comprende al menos dos de los dominios seleccionados y al menos un conector; y, los multímeros se escrutan en busca de una mejora de la afinidad o avidez o una alteración de la especificidad para el ligando o la mezcla de ligandos deseados en comparación con los dominios seleccionados, identificando de ese modo los uno o más multímeros seleccionados.
La selección de multímeros se puede completar utilizando una variedad de técnicas que incluyen aquellas mencionadas más arriba para identificar los dominios monoméricos. Otros métodos de selección incluyen, p. ej., una selección basada en una mejora de la afinidad o avidez o una alteración de la especificidad para el ligando en comparación con los dominios monoméricos seleccionados. Por ejemplo, una selección se puede basar en la unión selectiva a tipos específicos de células, o a un grupo de células relacionadas o tipos de proteínas (p. ej., diferentes serotipos de virus). La optimización de la propiedad seleccionada para, p. ej., la avidez de un ligando, se puede lograr después recombinando los dominios, así como también manipulando la secuencia de aminoácidos de los dominios monoméricos individuales o el dominio conector o la secuencia de nucleótidos que codifica tales dominios, como se menciona en la presente invención.
Un método para identificar multímeros se puede completar presentando los multímeros. Como con los dominios monoméricos, los multímeros son opcionalmente expresados o presentados sobre una variedad de sistemas de presentación, p. ej., presentación en fagos, presentación en ribosomas, presentación unida a nucleótidos (véanse, p. ej., las Patentes de los estados Unidos Núms. 6.281.344; 6.194.550, 6.207.446, 6.214.553, y 6.258.558) y/o la presentación en la superficie celular, como se ha descrito antes. Las presentaciones en la superficie celular pueden incluir pero no están limitadas a células de E. coli, levadura o mamífero. Además, las genotecas de presentación de multímeros con múltiples sitios de unión pueden ser inmunopurificadas en busca de avidez o afinidad o especificidad alterada para un ligando o para múltiples ligandos.
Otras variaciones incluyen el uso de múltiples compuestos de unión, de manera que los dominios monoméricos, multímeros o bibliotecas de estas moléculas pueden ser escrutados simultáneamente en busca de una multiplicidad de ligandos o compuestos que tienen diferente especificidad de unión. Se pueden escrutar concomitantemente múltiples ligandos o compuestos predeterminados en una sola biblioteca, o escrutar secuencialmente frente a numerosos dominios monoméricos o multímeros. En una variación, múltiples ligandos o compuestos, cada uno codificado en una cuenta separada (o subgrupo de cuentas), pueden ser mezclados e incubados con dominios monoméricos, multímeros o bibliotecas de estas moléculas en condiciones de unión adecuadas. La colección de cuentas, que comprenden múltiples ligandos o compuestos, puede ser utilizada después para aislar, mediante selección por afinidad, los dominios monoméricos, los multímeros seleccionados o miembros de la biblioteca. Generalmente, las rondas de escrutinio por afinidad posteriores pueden incluir la misma mezcla de cuentas, subgrupos de las mismas, o cuentas que contienen solamente uno o dos ligandos o compuestos individuales. Este enfoque permite un escrutinio eficaz, y es compatible con la automatización en el laboratorio, el procesamiento por lotes, y los métodos de escrutinio de alto
rendimiento.
Como se describe en la presente memoria, los multímeros pueden ser escrutados simultáneamente en busca de su capacidad para unirse a múltiples ligandos, donde cada ligando comprende una marca diferente. Por ejemplo, cada ligando puede ser marcado con una marca fluorescente diferente, puesto en contacto simultáneamente con un multímero o biblioteca de multímeros. Los multímeros con la afinidad deseada son identificados después (p. ej., mediante clasificación FACS) basándose en la presencia de marcas conectadas a las marcas deseadas.
Los multímeros seleccionados de los métodos anteriores pueden ser manipulados adicionalmente, p. ej., mediante recombinación o barajado de los multímeros seleccionados (se puede producir recombinación entre o con multímeros o ambos), mutación de los multímeros seleccionados, y similares. Esto da como resultado multímeros alterados que pueden ser escrutados y seleccionados en busca de miembros que tienen una propiedad mejorada en comparación con el multímero seleccionado, produciendo de ese modo multímeros alterados seleccionados.
Los conectores, multímeros o multímeros seleccionados producidos mediante los métodos anteriores y siguientes se describen en la presente memoria. Se proporcionan las bibliotecas que comprenden multímeros, p. ej., una biblioteca que comprende aproximadamente 100, 250, 500 o más miembros producidos mediante los métodos de la presente invención o seleccionados mediante los métodos de la presente invención. Como se describe en la presente memoria, también están incluidas una o más células que comprenden miembros de las bibliotecas. Las bibliotecas de los polipéptidos recombinantes también se describen en la presente memoria p. ej., una biblioteca que comprende aproximadamente 100, 250, 500 o más polipéptidos recombinantes diferentes.
\newpage
Las composiciones descritas en la presente memoria se pueden unir a una matriz de un material de afinidad, p. ej., los polipéptidos recombinantes. Los ejemplos del material de afinidad incluyen, p. ej., cuentas, una columna, un soporte sólido, y/o similares.
Los conectores adecuados descritos en la presente memoria incluyen un heterodímero obligado de radicales conectores parciales. El término "heterodímero obligado" hace referencia en la presente memoria a un dímero de dos radicales conectores parciales que difieren entre sí en su composición, y que se asocian entre sí de una manera no covalente, específica para unir entre sí dos dominios. La asociación específica es tal que los dos conectores parciales se asocian esencialmente entre sí en comparación con la asociación con otros conectores parciales. De este modo, en contraste con los multímeros de la presente invención que están expresados como un único polipéptido, los multímeros de dominios que están conectados por medio de heterodímeros se ensamblan a partir de unidades discretas de conector parcial-monómero-conector parcial. El ensamblaje de los heterodímeros se puede lograr, por ejemplo, mediante mezclado. De este modo, si los conectores parciales son segmentos polipeptídicos, cada unidad de conector parcial-monómero-conector parcial puede ser expresada en forma de un péptido discreto antes del ensamblaje del multímero. Se puede añadir un enlace disulfuro para bloquear covalentemente los péptidos juntos siguiendo el emparejamiento no covalente correcto. En la Figura 12 se representa un multímero que contiene tales heterodímeros obligados. Los radicales conectores parciales que son apropiados para formar heterodímeros obligados incluyen, por ejemplo, polinucleótidos, polipéptidos, y similares. Por ejemplo, cuando el conector parcial es un polipéptido, se producen los dominios de unión individualmente junto con su péptido de conexión único (esto es, un conector parcial) y más tarde se combinan para formar multímeros. El orden espacial de los dominios de unión en el multímero está regido por la especificidad de la unión heterodimérica de cada conector parcial. Los conectores parciales pueden contener secuencias de aminoácidos terminales que se unen específicamente a una secuencia de aminoácidos heteróloga definida. Un ejemplo de semejante secuencia de aminoácidos es el activador de la cabeza del neuropéptido de Hydra como describen Bodenmuller et al. El activador de la cabeza del neuropéptido pierde su actividad biológica mediante dimerización, (1986) EMBO J 5(8):1825-1829. Véase, p. ej., la Patente de los Estados Unidos Núm. 5.491.074 y el documento WO 94/28173. Estos conectores parciales permiten que se produzca el multímero primero como unidades conectoras parciales del monómero o unidades de conector parcial-monómero-conector parcial que después se mezclan entre sí y se permite que se ensamblen en el orden ideal basándose en las especificidades de unión de cada conector parcial.
Cuando el conector parcial comprende un motivo de unión al ADN, cada dominio monomérico tiene un conector parcial aguas arriba y uno aguas abajo (esto es, Lp-dominio-Lp, donde "Lp" es una representación de un conector parcial) que contiene una proteína de unión al ADN con una especificidad de unión al ADN específicamente única. Estos dominios pueden ser producidos individualmente y después ensamblados en un multímero específico mezclando los dominios con fragmentos de ADN que contienen las secuencias de nucleótidos apropiadas (esto es, los sitios de reconocimiento específico para las proteínas de unión al ADN de los conectores parciales de los dos dominios deseados) con el fin de unir los dominios en el orden deseado. Adicionalmente, se pueden ensamblar los mismos dominios en muchos multímeros diferentes mediante la adición de secuencias de ADN que contienen diferentes combinaciones de sitios de reconocimiento de proteínas de unión al ADN. La aleatorización adicional de las combinaciones de los sitios de reconocimiento de las proteínas de unión al ADN en los fragmentos de ADN puede permitir el ensamblaje de bibliotecas de multímeros. El ADN puede ser sintetizado con análogos de esqueleto para evitar la degradación in vivo.
Una ventaja significativa de la presente invención es que se pueden utilizar ligandos conocidos, o ligandos desconocidos para seleccionar los dominios monoméricos y/o multímeros. No se requiere una información previa referente a la estructura del ligando para aislar los dominios monoméricos de interés o los multímeros de interés. Los dominios monoméricos identificados pueden tener actividad biológica, lo que significa que incluyen al menos una afinidad de unión específica para un ligando seleccionado o deseado, y, en algunos casos, incluirá adicionalmente la capacidad de bloquear la unión de otros compuestos, para estimular o inhibir las rutas metabólicas, para actuar como señal o mensajero, para estimular o inhibir la actividad celular, y similares.
Se puede utilizar un único ligando, u opcionalmente una variedad de ligandos para seleccionar los dominios monoméricos, y/o multímeros. Un dominio monomérico de la presente invención se puede unir a un único ligando o a una variedad de ligandos. Un multímero de la presente invención puede tener múltiples sitios de unión discretos para un único ligando, u opcionalmente, puede tener múltiples sitios de unión para una variedad de ligandos.
Las aplicaciones potenciales de los multímeros de la presente invención son diversas. Por ejemplo, la invención se puede utilizar en la aplicación para crear antagonistas, donde los dominios monoméricos seleccionados o multímeros bloquean la interacción entre dos proteínas. Opcionalmente, la invención puede generar agonistas. Por ejemplo, los multímeros que se unen a dos proteínas diferentes, p. ej., enzima y sustrato, pueden intensificar la función de la proteína, incluyendo, por ejemplo, la actividad enzimática y/o la conversión del sustrato.
Otras aplicaciones incluyen el direccionamiento celular. Por ejemplo, los multímeros que consisten en dominios monoméricos y/o inmuno-dominios que reconocen proteínas de la superficie celular específicas se pueden unir selectivamente a ciertos tipos celulares. Las aplicaciones que implican dominios monoméricos y/o inmuno-dominios como agentes antivirales también están incluidas. Por ejemplo, los multímeros que se unen a diferentes epítopos sobre la partícula del virus pueden ser útiles como agentes antivirales debido a la polivalencia. Otras aplicaciones pueden incluir, pero no están limitadas a, purificación de proteínas, detección de proteínas, biosensores, experimentos de captura por afinidad de ligandos y similares. Además, se pueden sintetizar dominios o multímeros en masa mediante métodos convencionales para cualquier uso adecuado, p. ej., como agente terapéutico o de diagnóstico.
Como se describe en la presente memoria, el multímero comprende dominios monoméricos con especificidades para diferentes proteínas. Las diferentes proteínas pueden estar relacionadas o no relacionadas. Los ejemplos de las proteínas relacionadas incluyen miembros de una familia de proteínas o diferentes serotipos de un virus. Alternativamente, los dominios monoméricos y/o inmuno-dominios de un multímero pueden dirigir diferentes moléculas de una ruta fisiológica (p. ej., diferentes proteínas de la coagulación de la sangre). Como se describe adicionalmente en la presente memoria, los dominio monoméricos y/o inmuno-dominios se unen a proteínas en rutas no relacionadas (p. ej., dos dominios se unen a factores de la sangre, otros dos dominios se unen a proteínas relacionadas con la inflamación y un quinto se une a la albúmina del suero).
3. Método de Tratamiento Terapéutico y Profiláctico - Incluido Solamente como Referencia
La presente patente también describe métodos de tratamiento terapéutico y profiláctico de una enfermedad o trastorno mediante la administración in vivo o ex vivo de uno o más ácidos nucleicos o polipéptidos de la invención descritos antes (o composiciones que comprenden un excipiente farmacéuticamente aceptable y uno o más de tales ácidos nucleicos o polipéptidos) a un sujeto, incluyendo, p. ej., un mamífero, incluyendo un ser humano, primate, ratón, cerdo, vaca, cabra, conejo, rata, cobaya, hámster, caballo, oveja; o un vertebrado no mamífero tal como un ave (p. ej., un pollo o un pato), pez, o invertebrado.
En métodos ex vivo, se obtienen una o más células o una población de células de interés del sujeto (p. ej., células tumorales, muestra de tejido tumoral, células de órganos, células de la sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosa, hígado, intestinos, bazo, estómago, sistema linfático, cérvix, vagina, próstata, boca, lengua, etc.) o se separan del sujeto y se ponen en contacto con una cantidad de un dominio monomérico y/o multímero seleccionado de la invención que es eficaz en el tratamiento profiláctico o terapéutico de una enfermedad, trastorno, u otra afección. Las células puestas en contacto se devuelven o liberan después al sujeto en el sitio del cual se obtuvieron u otro sitio (p. ej., incluyendo aquellos definidos antes) de interés en el sujeto que se vaya a tratar. Si se desea, las células puestas en contacto se pueden injertar en un tejido, órgano, o sitio de un sistema (incluyendo todos los descritos antes) de interés en el sujeto utilizando técnicas de injerto convencionales y bien conocidas o, p. ej., liberar en el sistema sanguíneo o linfático utilizando técnicas de liberación o transfusión convencionales.
Se describen en la presente memoria métodos in vivo en los cuales se ponen en contacto una o más células o una población de células de interés del sujeto directamente o indirectamente con una cantidad de un dominio monomérico y/o multímero seleccionado de la invención eficaz en el tratamiento profiláctico o terapéutico de la enfermedad, trastorno, u otra afección. en formatos de contacto/administración directos, el dominio monomérico y/o multímero seleccionado se administran típicamente o se transfieren directamente a las células a tratar o al sitio del tejido de interés (p. ej., células tumorales, muestras de tejido tumoral, células de órganos, células de la sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestinos, bazo, estómago, sistema linfático, cérvix, vagina, próstata; boca, lengua, etc.) mediante cualquiera de una variedad de formatos, incluyendo administración tópica, inyección (p. ej., utilizando una aguja o jeringa), o vacuna o liberación con pistola génica, presionando en el tejido, órgano, o sitio de la piel. El dominio monomérico y/o multímero seleccionados pueden ser liberados, por ejemplo, intramuscularmente, intradérmicamente, subdérmicamente, subcutáneamente, oralmente, intraperitonealmente, intratecalmente, intravenosamente, o colocados en una cavidad del organismo (incluyendo, p. ej., durante la cirugía), o mediante inhalación o administración vaginal o rectal.
En los formatos de contacto/administración indirectos in vivo, el dominio monomérico y/o multímero seleccionado se administra típicamente o se transfiere indirectamente a las células a tratar o al tejido de interés, incluyendo los descritos antes (tales como, p. ej., células de la piel, sistemas de órganos, sistema linfático, o sistema de células sanguíneas, etc.), poniendo en contacto o administrando el polipéptido de la invención directamente a una o más células o poblaciones de células cuya tratamiento se puede facilitar. Por ejemplo, células tumorales del organismo del sujeto que se vaya a tratar poniendo en contacto las células del sistema sanguíneo o linfático, piel, o un órgano con una cantidad suficiente del dominio monomérico y/o multímero seleccionado de manera que se produzca el reparto del dominio monomérico y/o multímero seleccionado al sitio de interés (p. ej., tejido, órgano, o células de interés de o sistema sanguíneo o linfático en el organismo) y de como resultado el tratamiento profiláctico o terapéutico efectivo. Semejante contacto, administración, o transferencia se realizan típicamente utilizando una o más rutas o modos de administración descritos.
Adicionalmente se describen en la presente memoria métodos ex vivo en los cuales se obtienen o se separan una o más células de interés o una población de células de interés del sujeto (p. ej., células tumorales, muestra de tejido tumoral, células de órganos, células sanguíneas, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestinos, bazo, estómago, sistema linfático, cérvix, vagina, próstata, boca, lengua, etc.) del sujeto y se transforman poniendo en contacto dichas una o más células o población de células con un constructo polinucleotídico que comprende una secuencia de ácido nucleico de la invención que codifica un polipéptido biológicamente activo de interés (p. ej., un dominio monomérico y/o multímero seleccionado) que es eficaz en el tratamiento profiláctico o terapéutico de la enfermedad, trastorno, u otra afección. Las una o más células o poblaciones de células se ponen en contacto con una cantidad suficiente del constructo polinucleotídico y un promotor que controla la expresión de dicha secuencia de ácido nucleico de manera que se produzca la absorción del constructo polinucleotídico (y el promotor) en las células y de como resultado una expresión suficiente de la secuencia de ácido nucleico diana para producir una cantidad del polipéptido biológicamente activo, codificando un dominio monomérico y/o multímero seleccionados, eficaz para tratar profilácticamente o terapéuticamente la enfermedad, trastorno, o afección. El constructo polinucleotídico puede incluir una secuencia promotora (p. ej., una secuencia promotora de CMV) que controla la expresión de la secuencia de ácido nucleico de la invención y/o, si se desea, una o más secuencias de nucleótidos adicionales que codifican al menos uno o más de otro polipéptido de la invención, una citoquina, coadyuvante, o molécula co-estimuladora, u otro polipéptido de interés.
Después de la transfección, las células transformadas se devuelven, liberan, o transfieren al sujeto, al sitio del tejido o sistema del cual fueron obtenidas o a otro sitio (p. ej., células tumorales, muestra de tejido tumoral, células de órganos, células de la sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestinos, bazo, estómago, sistema linfático, cérvix, vagina, próstata, boca, lengua, etc.) que se van a tratar en el sujeto. Si se desea, las células pueden ser injertadas sobre un tejido, piel, órgano, o sistema corporal de interés en el sujeto utilizando técnicas de injerto convencionales o bien conocidas o liberadas en el sistema sanguíneo o linfático utilizando técnicas de liberación o transfusión convencionales. Semejante reparto, administración, o transferencia de células transformadas se realiza típicamente utilizando una o más de las rutas o modos de administración descritos antes. La expresión del ácido nucleico diana se produce naturalmente o puede ser inducida (como se describe con mayor detalle más abajo) y se expresa una cantidad del polipéptido codificado suficiente y eficaz para tratar la enfermedad o afección en el sitio o sistema de tejidos.
Asimismo se describen en la presente memoria métodos in vivo en los cuales una o más células de interés o una población de células del sujeto (p. ej., incluyendo aquellas células y sistemas de células y sujetos descritos antes) son transformadas en el organismo del sujeto poniendo en contacto las células o población de células con (o administrando o transfiriendo a las células o población de células que utilizan una o más de las rutas o modos de administración descritos antes) un constructo polinucleotídico que comprende una secuencia de ácido nucleico de la invención que codifica un polipéptido biológicamente activo de interés (p. ej., un dominio monomérico y/o multímero seleccionado) que es eficaz en el tratamiento profiláctico o terapéutico de la enfermedad, trastorno, u otra afección.
El constructo polinucleotídico puede ser administrado o transferido directamente a células que padecen una enfermedad o trastorno (p. ej., mediante contacto directo utilizando una o más de las rutas o modos de administración descritos antes). Alternativamente, el constructo polinucleotídico puede ser administrado o transferido indirectamente a células que padecen una enfermedad o trastorno poniendo en contacto primero directamente las células no enfermas o células con otra enfermedad utilizando una o más de las rutas o modos de administración descritos antes con una cantidad suficiente del constructo polinucleotídico que comprende la secuencia de ácido nucleico que codifica el polipéptido biológicamente activo, y un promotor que controla la expresión de la secuencia de ácido nucleico, de manera que se produzca la absorción del constructo polinucleotídico (y el promotor) en las células y de como resultado una expresión suficiente de la secuencia de ácido nucleico de la invención para producir una cantidad del polipéptido biológicamente activo eficaz para tratar profilácticamente o terapéuticamente la enfermedad o trastorno, y por medio de lo cual el constructo polinucleotídico o el polipéptido expresado resultante es transferido naturalmente o automáticamente desde el sitio, sistema, tejido u órgano del organismo del sujeto de liberación inicial al organismo del sujeto al sitio, órgano o sistema del organismo del sujeto enfermos (p. ej., a través del sistema sanguíneo o linfático). La expresión del ácido nucleico diana se produce naturalmente o puede ser inducido (como se describe con mayor detalle más abajo) de manera que una cantidad del polipéptido expresado sea suficiente y eficaz para tratar la enfermedad o afección en el sitio o sistema tisular. El constructo polinucleotídico puede incluir una secuencia promotora (p. ej., una secuencia promotora de CMV) que controla la expresión de la secuencia de ácido nucleico y/o, si se desea, una o más secuencias de nucleótidos adicionales que codifican al menos uno o más de los otros polipéptidos de la invención, una citoquina, un coadyuvante, o una molécula co-estimuladora, u otro polipéptido de interés.
En cada uno de los métodos de tratamiento in vivo y ex vivo descritos antes, se puede administrar o liberar una composición que comprende un excipiente y el polipéptido o ácido nucleico de la invención. Asimismo se describe en la presente memoria, una composición que comprende un excipiente farmacéuticamente aceptable y un polipéptido o ácido nucleico que puede ser administrada o liberada al sujeto como se ha descrito antes en una cantidad eficaz para tratar la enfermedad o trastorno.
Como se describe adicionalmente en la presente memoria, en cada método de tratamiento in vivo y ex vivo descrito antes, la cantidad de polinucleótido administrado a las células o al sujeto puede ser una cantidad tal que se produzca la absorción de dicho polinucleótido en una o más células del sujeto y de como resultado una expresión suficiente de dicha secuencia de ácido nucleico para producir una cantidad de un polipéptido biológicamente activo eficaz para intensificar una respuesta inmunitaria en un sujeto, incluyendo una respuesta inmunitaria inducida por un inmunógeno (p. ej., un antígeno). Para cada uno de tales métodos, la cantidad de polipéptido administrado a las células o al sujeto puede ser una cantidad suficiente para intensificar una respuesta inmunitaria en el sujeto, incluyendo la inducida por un inmunógeno (p. ej., un antígeno).
Adicionalmente se describe en la presente memoria un método de tratamiento in vivo o in vivo en el cual se utiliza un constructo polinucleotídico (o una composición que comprende un constructo polinucleotídico) para liberar un polipéptido fisiológicamente activo en un sujeto. La expresión del constructo polinucleotídico puede ser inducida utilizando un sistema de expresión génica inducible de conexión y desconexión. Los ejemplos de tales sistemas de expresión génica de conexión y desconexión incluyen el Sistema de Expresión Génica Tet-On® y el Sistema de Expresión Génica Tet-Off® (véase, p. ej., Catálogo Clontech 2000, págs. 110-111 para una descripción detallada de cada uno de tales sistemas), respectivamente. Otros sistemas de expresión génica de conexión y desconexión controlables o inducibles son conocidos por los expertos normales en la técnica. Con semejante sistema, la expresión del ácido nucleico del constructo polinucleotídico puede ser regulada de una manera precisa, reversible, y cuantitativa. La expresión génica del ácido nucleico diana puede ser inducida, por ejemplo, una vez que las células transfectadas estables que contienen el constructo polinucleotídico que comprende el ácido nucleico diana son liberadas o transferidas o puestas en contacto con el sitio del tejido, órgano o sistema de interés. Tales sistemas son particularmente ventajosos en los métodos de tratamiento y formatos en los cuales es beneficioso retrasar o controlar precisamente la expresión del ácido nucleico diana (p. ej., para dar tiempo para completar una operación quirúrgica y/o curación después de la cirugía; para dar tiempo para que el constructo polinucleotídico que comprende el ácido nucleico diana alcance el sitio, las células, o el tejido que se vaya a tratar; para dar tiempo para que el injerto que contiene las células transformadas con el constructo se incorporen al tejido u órgano sobre el que, o en el que ha sido empalmado o anclado, etc.).
4. Manipulación Adicional de Dominios Monoméricos y/o Ácidos Nucleicos Multiméricos y Polipéptidos - Descrita en la Presente Memoria Solamente como Referencia
Como se ha mencionado antes, el polipéptido de la presente invención puede ser alterado. Las descripciones de una variedad de procedimientos diversos que generan procedimientos para generar secuencias de ácido nucleico modificadas o alteradas que codifican estos polipéptidos se describen más arriba y más abajo en las siguientes publicaciones y en las referencias allí citadas: Soong, N. et al., Molecular breeding of viruses, (2000) Nat Genet 25(4):436-439; Stemmer, et al., Molecular breeding of viruses for targeting and other clinical properties, (1999) Tumor Targeting 4:1-4; Ness et al., DNA Shuffling of subgenomic sequences of subtilisin, (1999) Nature Biotechnology 17:893-896; Chang et al, Evolution of a cytokine using DNA family shuffling, (1999) Nature Biotechnology 17:793-797; Minshull y Stemmer, Protein evolution by molecular breeding, (1999) Current Opinion in Chemical Biology 3:284-290; Christians et al., Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling, (1999) Nature Biotechnology 17:259-264; Crameri et al., DNA shuffling of a family of genes from diverse species accelerates directed evolution, (1998) Nature 391:288-291; Crameri et al., Molecular evolution of an arsenate detoxification pathway by DNA shuffling, (1997) Nature Biotechnology 15:436-438; Zhang et al., Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening (1997) Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al., Applications of DNA Shuffling to Pharmaceuticals and Vaccines, (1997) Current Opinion in Biotechnology 8:724-733; Crameri et al, Construction and evolution of antibody-phage libraries by DNA shuffling, (1996) Nature Medicine 2:100-103; Crameri et al., Improved green fluorescent protein by molecular evolution using DNA shuffling, (1996) Nature Biotechnology 14:315-319; Gates et al., Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer', (1996) Journal of Molecular Biology 255:373-386; Stemmer, Sexual PCR and Assembly PCR, (1996) In: The Encyclopedia of Molecular Biology. VCH Publishers, Nueva York. págs.447-457; Crameri y Stemmer, Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes, (1995) BioTechniques 18:194-195; Stemmer et al., Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxy-ribonucleótidos, (1995) Gene, 164:49-53; Stemmer, The Evolution of Molecular Computation, (1995) Science 270: 1510; Stemmer. Searching Sequence Space, (1995) Bio/Technology 13:549-553; Stemmer, Rapid evolution of a protein in vitro by DNA shuffling, (1994) Nature 370:389-391; y Stemmer, DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751.
Los métodos mutacionales de generación de diversidad incluyen, por ejemplo, la mutagénesis dirigida al sitio (Ling et al., Approaches to DNA mutagenesis: an overview, (1997) Anal Biochem. 254(2): 157-178; Dale et al., Oligonucleotide-directed random mutagenesis using the phosphorothioate method, (1996) Methods Mol. Biol. 57:369-374; Smith, In vitro mutagenesis, (1985) Ann. Rev. Genet. 19:423-462; Botstein & Shortle, Strategies and applications of in vitro mutagenesis, (1985) Science 229:1193-1201; Carter, Site-directed mutagenesis, (1986) Biochem. J. 237:1-7; y Kunkel, The efficiency of oligonucleotide directed mutagenesis, (1987) in Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, D.M.J. eds., Springer Verlag, Berlin)); la mutagénesis utilizando moldes que contienen uracilo (Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection, (1985) Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al., Rapid and efficient site-specific mutagenesis without phenotypic selection, (1987) Methods in Enzymol. 154, 367-382; and Bass et al., Mutant Trp repressors with new DNA-binding specificities, (1988) Science 242:240-245); la mutagénesis dirigida por oligonucleótidos ((1983) Methods in Enzymol. 100: 468-500; (1987) Methods in Enzymol. 154: 329-350; Zoller & Smith, Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment, (1982) Nucleic Acids Res. 10:6487-6500; Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, (1983) Methods in Enzymol. 100:468-500; y Zoller & Smith, Oligonucleótido-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template, (1987) Methods in Enzymol. 154:329-350); la mutagénesis de ADN modificado con fosforotioato (Taylor et al., The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA, (1985) Nucl. Acids Res. 13: 8749-8764; Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA, (1985) Nucl. Acids Res. 13: 8765-8787; Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis, (1986) Nucl. Acids Res. 14: 9679-9698; Sayers et al., Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, (1988) Nucl. Acids Res. 16:791-802; y Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucl. Acids Res. 16: 803-814); la mutagénesis utilizando ADN dúplex con espacios (Kramer et al., The gapped duplex DNA approach to oligonucleotide-directed mutation construction, (1984) Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz Oligonucleótido-directed construction of mutations via gapped duplex DNA, (1987) Methods in Enzymol. 154:350-367; Kramer et al., Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations, (1988) Nucl. Acids Res. 16: 7207; y Fritz et al., Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro, (1988) Nucl. Acids Res. 16: 6987-6999).
Los métodos adecuados adicionales incluyen la reparación puntual de los emparejamientos erróneos (Kramer et al., Point Mismatch Repair, (1984) Cell 38:879-887), la mutagénesis utilizando cepas anfitrionas con una reparación deficiente (Carter et al., Improved oligonucleotide site-directed mutagenesis using M13 vectors, (1985) Nucl. Acids Res. 13: 4431-4443; y Carter, Improved oligonucleotide-directed mutagenesis using M13 vectors, (1987) Methods in Enzymol. 154: 382-403), la mutagénesis por deleción (Eghtedarzadeh & Henikoff, Use of oligonucleotides to generate large deletions, (1986) Nucl. Acids Res. 14: 5115), la selección mediante restricción y la purificación mediante restricción (Wells et al., Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin, (1986) Phil. Trans. R. Soc. Lond. A 317: 415-423), la mutagénesis mediante síntesis génica total (Nambiar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, (1984) Science 223: 1299-1301; Sakamar y Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin), (1988) Nucl. Acids Res. 14: 6361-6372; Wells et al., Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites, (1985) Gene 34:315-323; y Grundström et al., Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis, (1985) Nucl. Acids Res. 13: 3305-3316), la reparación por rotura de la dobre hebra (Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis, (1986) Proc. Natl. Acad. Sci. USA, 83:7177-7181; y Arnold, Protein engineering for unusual environments, (1993) Current Opinion in Biotechnology 4:450-455). Se pueden encontrar detalles adicionales sobre muchos de los métodos anteriores en Methods in Enzymology Volumen 154, que también describe controles útiles para subsanar problemas con diferentes métodos de mutagénesis.
Los detalles adicionales referentes a los métodos de generación de diversidad se pueden encontrar en las siguientes patentes de los Estados Unidos, publicaciones PCT y solicitudes, y publicaciones EPO: Patente de los Estados Unidos Núm. 5.605.793 de Stemmer (25 Febrero, 1997), "Methods for In Vitro Recombination"; Patente de los Estados Unidos Núm. 5.811.238 de Stemmer et al. (22 Septiembre, 1998) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Patente de los Estados Unidos Núm. 5.830.721 de Stemmer et al. (3 Noviembre, 1998), "DNA Mutagenesis by Random Fragmentation and Reassembly"; Patente de los Estados Unidos Núm. 5.834.252 de Stemmer, et al. (10 Noviembre, 1998) "End-Complementary Polymerase Reaction"; Patente de los Estados Unidos Núm. 5.837.458 de Minshull, et al. (7 Noviembre, 1998), "Methods and Compositions for Cellular and Metabolic Engineering"; Documento WO 95/22625, Stemmer y Crameri, "Mutagenesis by Random Fragmentation and Reassembly"; Documento WO 96/33207 de Stemmer yd Lipschutz "End Complementary Polymerase Chain Reaction"; Documento WO 97/20078 de Stemmer y Crameri "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Documento WO 97/35966 mediante Minshull y Stemmer, "Methods and Compositions for Cellular and Metabolic Engineering"; Documento WO 99/41402 de Punnonen et al. "Targeting of Genetic Vaccine Vectors"; Documento WO 99/41383 de Punnonen et al. "Antigen Library Immunization"; Documento WO 99/41369 de Punnonen et al. "Genetic Vaccine Vector Engineering"; Documento WO 99/41368 de Punnonen et al. "Optimization of Immunomodulatory Properties of Genetic Vaccines"; Documento EP 752008 de Stemmer y Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly"; Documento EP 0932670 de Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; Documento WO 99/23107 de Stemmer et al., "Modification of Virus Tropism and Host Range by Viral Genome Shuffling"; Documento WO 99/21979 de Apt et al., "Human Papillomavirus Vectors"; Documento WO 98/31837 de del Cardayre et al. "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; Documento WO 98/27230 de Patten y Stemmer, "Methods and Compositions for Polypeptide Engineering"; Documento WO 98/27230 de Stemmer et al., "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection", Documento WO 00/00632, "Methods for Generating Highly Diverse Libraries", Documento WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences", Documento WO 98/42832 de Arnold et al., "Recombination of Polynucleotide Sequences Using Random or Defined Primers", Documento WO 99/29902 de Arnold et al., "Method for Creating Polynucleotide and Polypeptide Sequences", Documento WO 98/41653 de Vind, "An in Vitro Method for Construction of a DNA Library", Documento WO 98/41622 de Borchert et al., "Method for Constructing a Library Using DNA Shuffling", y Documento WO 98/42727 de Pati y Zarling, "Sequence Alterations using Homologous Recombination"; Documento WO 00/18906 de Patten et al., "Shuffling of Codon-Altered Genes"; Documento WO 00/04190 de del Cardayre et al. "Evolution of Whole Cells and Organisms by Recursive Recombination"; Documento WO 00/42561 de Crameri et al., "Oligonucleotide Mediated Nucleic Acid Recombination"; Documento WO 00/42559 de Selifonov y Stemmer "Methods of Populating Data Structures for Use in Evolutionary Simulations"; Documento WO 00/42560 de Selifonov et al., "Methods for Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics"; Documento WO 01/23401 de Welch et al., "Use of Codon-Varied Oligonucleotide Synthesis for Synthetic Shuffling"; y Documento PCT/US01/06775 "Single-Stranded Nucleic Acid Template-Mediated Recombination and Nucleic Acid Fragment Isolation" de Affholter.
Otro aspecto descrito en la presente memoria incluye la clonación y expresión de dominios monoméricos, dominios monoméricos seleccionados, multímeros y/o multímeros seleccionados que codifican ácidos nucleicos. De este modo, los dominios multiméricos pueden ser sintetizados como una única proteína utilizando sistemas de expresión bien conocidos en la técnica. Además de los muchos textos indicados arriba, los textos generales que describen técnicas biológicas moleculares útiles en la presente memoria, incluyendo el uso de vectores, promotores y muchos otros tópicos relevantes para expresar ácidos nucleicos tales como dominios monoméricos, dominios monoméricos seleccionados, multímeros y/o multímeros seleccionados, incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (2^{a} Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 1989 ("Sambrook") y Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, una empresa conjunta entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (suplementado durante 1999) ("Ausubel")). Los ejemplos de las técnicas suficientes para dirigir a los expertos en la técnica a través de los métodos de amplificación in vitro, útiles en la identificación, el aislamiento y la clonación de dominios monoméricos y multímeros que codifican ácidos nucleicos, incluyendo la reacción en cadena de la polimerasa (PCR), la reacción en cadena de la ligasa (LCR), la amplificación con replicasa Q\exists; y otras técnicas mediadas por la ARN polimerasa (p. ej., NASBA), se encuentran en Berger, Sambrook, y Ausubel, así como Mullis et al., (1987) Patente de los Estados Unidos Núm. 4.683.202; PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, CA (1990) (Innis); Arnheim & Levinson (1 Octubre, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3, 81-94; (Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86, 1173; Guatelli et al. (1990) Proc. Natl. Acad. Sci. USA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35, 1826; Landegren et al., (1988) Science 241, 1077-1080; Van Brunt (1990) Biotechnology 8, 291-294; Wu y Wallace, (1989) Gene 4, 560; Barringer et al. (1990) Gene 89, 117, y Sooknanan y Malek (1995) Biotechnology 13: 563-564. Los métodos mejorados de clonación in vitro de ácidos nucleicos amplificados son descritos por Wallace et al., Patente de los Estados Unidos Núm. 5.426.039. Los métodos mejorados de amplificación de ácidos nucleicos grandes mediante PCR son resumidos por Cheng et al. (1994) Nature 369: 684-685 y las referencias allí citadas, en los que se generan amplicones de PCR de hasta 40 kb. Un experto en la técnica apreciará que esencialmente cualquier ARN puede ser convertido en un ADN de doble hebra adecuado para la digestión con enzimas de restricción, la expansión por PCR y la secuenciación utilizando la transcriptasa inversa y una polimerasa. Véase, Ausubel, Sambrook y Berger, todas más arriba.
Los vectores descritos en la presente memoria pueden ser introducidos en células anfitrionas, y los dominios monoméricos, los dominios monoméricos seleccionados, los multímeros y/o los multímeros seleccionados de la invención pueden ser producidos mediante mecanismos recombinantes. Las células anfitrionas son diseñadas genéticamente (esto es, transducidas, transformadas o transfectadas) con los vectores descritos en la presente memoria que pueden ser, por ejemplo, un vector de clonación o un vector de expresión. El vector puede estar, por ejemplo, en forma de un plásmido, una partícula viral, un fago, etc. Las células anfitrionas diseñadas genéticamente pueden ser cultivadas en medio nutriente convencional modificado como sea apropiado para activar promotores, seleccionar transformantes, o amplificar el gen o los genes del dominio monomérico, el dominio monomérico seleccionado, el multímero y/o el multímero seleccionado de interés. Las condiciones de cultivo, tales como la temperatura, el pH y similares, son aquellas utilizadas previamente con la célula anfitriona seleccionada para la expresión, y serán evidentes para los expertos en la técnica y en las referencias citadas en la presente memoria, incluyendo, p. ej., Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, Nueva York y las referencias allí citadas.
Como se describe en la presente memoria, los polipéptidos de la invención también pueden ser producidos en células no animales tales como plantas, levaduras, hongos, bacterias y similares. En efecto, como se ha indicado antes, la presentación en fagos es una técnica especialmente relevante para producir tales polipéptidos. Además de Sambrook, Berger y Ausubel, se pueden encontrar detalles referentes al cultivo celular en Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. Nueva York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg Nueva York) y Atlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL.
También se describe en la presente memoria la alteración de dominios monoméricos, y/o multímeros para mejorar las propiedades farmacológicas, para reducir la inmunogenicidad, o para facilitar el transporte del multímero y/o el dominio monomérico a una célula o tejido (p. ej., a través de la barrera hemato-encefálica, o a través de la piel). Estos tipos de alteraciones incluyen una variedad de modificaciones (p. ej., la adición de grupos azúcar o glicosilación), la adición de PEG, la adición de dominios de proteína que se unen a cierta proteína (p. ej., HAS u otra proteína del suero), la adición de fragmentos de proteínas o secuencias que señalan el movimiento o transporte en, fuera de y a través de una célula. También se pueden añadir componentes adicionales a un multímero y/o dominio monomérico para manipular las propiedades del multímero y/o dominio monomérico. También se puede añadir una variedad de componentes incluyendo, p. ej., un dominio que se une a un receptor conocido (p. ej., un dominio de una proteína de la región Fc que se une a un receptor de Fc), una o varias toxinas o una porción de una toxina, un prodominio que puede ser opcionalmente escindido para activar el multímero o dominio monomérico, una molécula informadora (p. ej., proteína fuorescente verde), un componente que se une a una molécula informadora (tal como un radionúclido para radioterapia, biotina o avidina) o un combinación de modificaciones.
5 Kits - Descritos en la presente memoria solamente como Referencia
Los kits que comprenden los componentes necesarios en los métodos (típicamente en una forma no mezclada) y los componentes de los kits (materiales de envasado, instrucciones para utilizar los componentes y/o los métodos, uno o más recipientes (tubos de reacción, columnas, etc.)) para contener los componentes se describen en la presente memoria. Los kits pueden contener una biblioteca de multímeros, o un único tipo de multímero. Los kits también pueden incluir reactivos adecuados para promover la unión a la molécula diana, tales como tampones o reactivos que facilitan la detección, incluyendo moléculas marcadas detectablemente. Los patrones para la calibración de la unión del ligando a un dominio monomérico o similar, también pueden estar incluidos en los kits de la invención.
Asimismo se describen en la presente memoria análisis de unión comercialmente valiosos y kits para poner en práctica los análisis. En algunos de los análisis se emplean uno o más ligandos para detectar la unión de un dominio monomérico, y/o multímero. Tales análisis se basan en cualquier método conocido en la técnica, p. ej., citometría de flujo, microscopía fluorescente, resonancia de plasmón, y similares, para detectar la unión de uno o varios ligandos al dominio monomérico y/o multímero.
También se proporcionan los kits basados en el análisis. Los kits incluyen típicamente un recipiente, y uno o más ligandos. Los kits opcionalmente comprenden instrucciones para realizar los análisis, reactivos de detección adicionales, tampones, o instrucciones para el uso de cualquiera de estos componentes, o similares. Alternativamente, los kits pueden incluir células, vectores, (p. ej., vectores de expresión, vectores de secreción que comprenden un polipéptido de la invención), para la expresión de un dominio monomérico y/o un multímero de la invención.
6. Sistemas Integrados - Descritos Solamente como Referencia
También se describen en la presente memoria ordenadores, medios legibles con ordenador y sistemas integrados que comprenden una serie de caracteres correspondientes a dominios monoméricos, dominios monoméricos seleccionados, multímeros y/o multímeros seleccionados y ácidos nucleicos que codifican tales polipéptidos. Estas secuencias pueden ser manipuladas mediante métodos de barajado in silico, o mediante un soporte lógico de alineamiento de secuencias o procesamiento de texto convencional.
Por ejemplo, diferentes tipos de similitud y consideraciones de restricción variable y longitud de la serie de caracteres pueden ser detectados y reconocidos en los sistemas integrados en la presente memoria. Por ejemplo, se han diseñado muchos métodos de determinación de la homología para el análisis comparativo de secuencias de polímeros, para la corrección ortográfica en el procesamiento de textos, y para la recuperación de datos de diferentes bases de datos. Con una interpretación de las interacciones del complemento por pares de la doble hélice entre las 4 nucleobases principales en los polinucleótidos naturales, también se pueden utilizar modelos que simulan la hibridación de series de polinucleótidos homólogos complementarios como fundamento de un alineamiento de secuencias u otras operaciones realizadas típicamente sobre las series de caracteres correspondientes a las secuencias en la presente memoria (p. ej., manipulaciones del procesamiento de textos, construcción de figuras que comprenden series de caracteres de una secuencia o subsecuencia, tablas de rendimiento, etc.). Un ejemplo de un paquete de soporte lógico con GOs para calcular la similitud de secuencias es BLAST, que puede ser adaptado a la presente invención mediante aportación de series de caracteres correspondientes a las secuencias de la presente memoria.
BLAST es descrito por Altschul et al., (1990) J. Mol. Biol. 215:403-410. El soporte lógico para realizar análisis BLAST es asequible públicamente a través del National Center for Biotechnology Information (asequible en la Red Informática Mundial en ncbi.nlm.nih.gov). Este algoritmo implica identificar primero pares de secuencia de elevada puntuación (HSP en sus siglas en inglés) identificando palabras cortas de longitud W en la secuencia problema, que emparejan o satisfacen cierta puntuación umbral T con valor positivo cuando se alinean con una palabra de la misma longitud de una secuencia de la base de datos. T es referdio como el umbral de puntuación de la palabra vecina (Altschul et al., supra). Estos aciertos de la palabra vecina inicial actúan como semillas para iniciar las búsquedas para encontrar HSP que las contengan. Los éxitos de las palabras se amplían después en ambas direcciones a lo largo de cada secuencia tanto como se pueda incrementar la puntuación del alineamiento cumulativo. Las puntuaciones cumulativas se calculan utilizando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos de emparejamiento; siempre > 0) y N (puntuación de penalización para residuos de emparejamientos erróneos; siempre < 0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación cumulativa. La extensión de los aciertos de palabras en cada dirección se detiene cuando: la puntuación de alineamiento cumulativo cae en una cantidad X desde su valor máximo alcanzado; la puntuación cumulativa tiende a cero o menos, debido a la acumulación de uno o más alineamientos de residuos de puntuación negativa; o se alcanza el extremo de cualquier secuencia. Los parámetros del algoritmo BLAST W, T, y X determinan la sensibilidad y velocidad del alineamiento. El programa BLASTN (para secuencias de nucleótidos) utiliza por defecto una longitud de palabra (W) de 11, una esperanza (E) de 10, un corte de 100, M=5, N=-4, y una comparación de ambas hebras. Para las secuencias de aminoácidos, el programa BLASTP utiliza por defecto una longitud de palabra (W) de 3, una esperanza (E) de 10, y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915).
Un ejemplo adicional de un algoritmo de alineamiento de secuencias útil es PILEUP. PILEUP crea un alineamiento de múltiples secuencias a partir de un grupo de secuencias relacionadas utilizando alineamientos por pares, progresivos. También puede trazar un árbol que muestra las relaciones de agrupación utilizadas para crear el alineamiento. PILEUP utiliza una simplificación del método de alineamiento progresivo de Feng & Doolittle, (1987) J. Mol. Evol. 35:351-360. El método utilizado es similar al método descrito por Higgins & Sharp, (1989) CABIOS 5:151-153. El programa puede alinear, p. ej., hasta 300 secuencias de una longitud máxima de 5.000 letras. El procedimiento de alineamiento múltiple comienza con el alineamiento por pares de las dos secuencias más similares, produciendo una agrupación de dos secuencias alineadas. Esta agrupación se puede alinear después con la siguiente secuencia o agrupación más relacionada de secuencias alineadas. Dos agrupaciones de secuencias pueden ser alineadas mediante una simple extensión del alineamiento por pares de dos secuencias individuales. El alineamiento final se logra mediante una serie de alineamientos por pares, progresivo. El programa también puede ser utilizado para trazar un dendrograma o representación en árbol de relaciones de agrupamientos. El programa se ejecuta diseñando secuencias específicas y sus coordenadas de aminoácidos o nucleótidos para las regiones de comparación de la secuencia. Por ejemplo, con el fin de determinar los aminoácidos conservados en una familia de dominios monoméricos o para comparar las secuencias de dominios monoméricos en una familia, la secuencia de la invención, o los ácidos nucleicos codificantes, se alinean para proporcionar información sobre la estructura-función.
En un aspecto descrito en la presente memoria se utiliza el sistema computarizado para realizar la recombinación de secuencia "in silico" o el barajado de las series de caracteres correspondientes a los dominios monoméricos. Una variedad de tales métodos se expone en "Methods For Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics" de Selifonov y Stemmer, presentado el 5 de Febrero, 1999 (USSN 60/118854) y "Methods For Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics" de Selifonov y Stemmer, presentada el 12 de Octubre, 1999 (USSN 09/416,375). En resumen, se utilizan operadores genéticos en algoritmos genéticos para cambiar secuencias dadas, p. ej., imitando eventos genéticos tales como la mutación, recombinación, muerte y similares. El análisis multi-dimensional para optimizar las secuencias se puede realizar también en el sistema computarizado, p. ej., como se describe en la solicitud '375.
Un sistema digital también puede ordenar a un sintetizador de oligonucleótidos que sintetice oligonucleótidos, p. ej., utilizados para la reconstrucción o recombinación génicas, o para organizar oligonucleótidos de fuentes comerciales (p. ej., imprimiendo los impresos de solicitud apropiados o conectándose a un impreso de solicitud en la Red).
El sistema digital también puede incluir elementos de salida para controlar la síntesis de ácido nucleico (p. ej., basándose en una secuencia o un alineamiento de un dominio monomérico recombinante, p. ej., barajado como en la presente memoria), esto es, un sistema integrado de la invención incluye opcionalmente un sintetizador de oligonucleótidos o un controlador de la síntesis de oligonucleótidos. El sistema puede incluir otras operaciones que se producen aguas abajo de un alineamiento u otra operación realizada utilizando una serie de caracteres correspondiente a una secuencia de la presente memoria, p. ej., como se ha indicado antes con referencia a los análisis.
Ejemplos
El siguiente ejemplo se ofrece para ilustrar, no para limitar la invención reivindicada.
Ejemplo 1
Este ejemplo describe la selección de dominios monoméricos y la creación de multímeros.
Los materiales de partida para identificar dominios monoméricos y crear multímeros a partir de los dominios monoméricos y los procedimientos seleccionados pueden derivar de cualquiera de una variedad de secuencias humanas y/o no humanas. Por ejemplo, para producir un dominio monomérico seleccionado con una unión específica a un ligando o mezcla de ligandos deseados, se seleccionan uno o más genes de dominios monoméricos a partir de una familia de dominios monoméricos que se unen a cierto ligando. Las secuencias de ácido nucleico que codifican el uno o más genes de dominios monoméricos pueden ser obtenidas mediante amplificación por PCR de ADN genómico o ADNc, u opcionalmente, pueden ser producidas sintéticamente utilizando oligonucleótidos solapantes.
Muy comúnmente, estas secuencias se clonan después en un formato de presentación sobre la superficie celular (esto es, presentación en la superficie bacteriana, de levadura, o de mamífero (COS); presentación en fagos) para la expresión y el escrutinio. Las secuencias recombinantes son transfectadas (transducidas o transformadas) en la célula anfitriona apropiada en la que son expresadas y presentadas sobre la superficie de la célula. Por ejemplo, las células pueden ser teñidas con un ligando deseado marcado (p. ej., marcado fluorescentemente). Las células teñidas se clasifican mediante citometría de flujo, y los genes que codifican los dominios monoméricos son recuperados (p. ej., mediante aislamiento de plásmidos, PCR o expansión y clonación) de las células positivas. El procedimiento de tinción y clasificación se puede repetir múltiples veces (p. ej., utilizando concentraciones progresivamente decrecientes del ligando deseado hasta que se obtiene el nivel de enriquecimiento deseado). Alternativamente, se puede utilizar cualquier método de escrutinio o detección conocido en la técnica que se pueda emplear para identificar las células que se unen al ligando o mezcla de ligandos deseados.
Los genes que codifican los dominios monoméricos seleccionados recuperados de las células de unión al ligando o mezcla de ligandos deseados pueden ser opcionalmente recombinados de acuerdo con cualquiera de los métodos descritos en la presente memoria o en las referencias citadas. Las secuencias recombinantes producidas en esta ronda de diversificación son escrutadas después mediante el mismo o diferente método para identificar genes recombinantes con una afinidad mejorada para el ligando deseado o diana. El procedimiento de diversificación y selección se repite opcionalmente hasta que se obtiene una afinidad deseada.
Los ácidos nucleicos del dominio monomérico seleccionado elegidos mediante los métodos pueden ser unidos entre sí por medio de una secuencia conectora para crear multímeros, p. ej., mediante ensamblaje combinatorio de secuencias de ácido nucleico que codifican los dominios monoméricos seleccionados mediante ligación de ADN, u opcionalmente, reacciones de solapamiento autocebado, basadas en PCR. Las secuencias de ácido nucleico que codifican los multímeros son clonadas después en un formato de presentación en la superficie celular (esto es, presentación en la superficie de células bacterianas, de levadura, o de mamífero (COS); presentación en fagos) para su expresión y escrutinio. Las secuencias recombinantes son transfectadas (transducidas o transformadas) en la célula anfitriona apropiada donde son expresadas y presentadas sobre la superficie de la célula. Por ejemplo, las células pueden ser teñidas con un ligando o mezcla de ligandos deseados, marcados, p. ej., marcados fluorescentemente. Las células teñidas se clasifican mediante citometría de flujo, y los genes que codifican los multímeros seleccionados se recuperan (p. ej., mediante PCR o expansión y clonación) de las células positivas. Las células positivas incluyen multímeros con una avidez o afinidad mejorada o una especificidad alterada hacia el ligando o mezcla de ligandos deseados en comparación con los dominios monoméricos seleccionados. El procedimiento de tinción y clasificación se puede repetir múltiples veces (p. ej., utilizando concentraciones progresivamente decrecientes del ligando o mezcla de ligandos deseados hasta obtener un nivel de enriquecimiento deseado). Alternativamente, se puede emplear cualquier método de escrutinio o detección conocido en la técnica que se puede utilizar para identificar células que se unen al ligando o mezcla de ligandos deseados.
Los genes que codifican el multímero seleccionado recuperados de las células de unión al ligando o mezcla de ligandos deseados pueden ser opcionalmente recombinados de acuerdo con cualquiera de los métodos descritos en la presente memoria o en las referencias citadas. Las secuencias recombinantes producidas en esta ronda de diversificación son escrutadas después mediante el mismo o diferente método para identificar los genes recombinantes con una avidez o afinidad mejoradas o una especificidad alterada para el ligando deseado o diana. El procedimiento de diversificación y selección se repite opcionalmente hasta que se obtiene una avidez o afinidad deseadas o una especificidad alterada.
Ejemplo 2
Este ejemplo describe el desarrollo de una biblioteca de multímeros formada por dominios C2.
Se crea una genoteca de secuencias de ADN que codifican dominios monoméricos C2 mediante PCR de ensamblaje como describen Stemmer et al., Gene 164, 49-53 (1995). Los oligonucleótidos utilizados en esta reacción de PCR son:
1
Los fragmentos de la PCR se digieren con BamHI y XhoI. Los productos de la digestión se separan sobre un gel de agarosa al 1,5% y los fragmentos del dominio C2 se purifican a partir del gel. Los fragmentos de ADN se ligan en los correspondientes sitios de restricción del vector pYD1 de presentación en la superficie de levadura (Invitrogen).
La mezcla de ligación se utiliza para la transformación de la cepa de levadura EBY100. Los transformantes se seleccionan haciendo crecer las células en medio selectivo que contiene glucosa (-Trp) a 30ºC.
La presentación en la superficie de la biblioteca de dominios C2 es inducida haciendo crecer las células en medio selectivo que contiene galactosa a 20ºC. Las células se enjuagan con PBS y después se incuban con proteína diana marcada fluorescentemente y se enjuagan de nuevo en PBS.
Después las células se clasifican mediante FACS y las células positivas se hacen crecer de nuevo en medio selectivo que contiene glucosa. Se puede utilizar el cultivo celular para una segunda ronda de clasificación o se puede utilizar para el aislamiento del ADN plasmídico. El ADN plasmídico purificado se utiliza como molde para amplificar por PCR las secuencias de ADN que codifican el dominio C2.
Los oligonucleótidos utilizados en esta reacción de PCR son:
2
Los fragmentos de la PCR son digeridos después con AlwNI, los productos de la digestión son separados sobre un gel de agarosa al 1,5% y los fragmentos del dominio C2 son purificados del gel. Con posterioridad, los fragmentos de la PCR son multimerizados mediante ligación de ADN en presencia de fragmentos de terminación. Los fragmentos de terminación se enumeran más abajo:
Terminación1:
3
Terminación2:
4
La mezcla de ligación es digerida después EcoRI y HindIII.
Los multímeros se separan sobre gel de agarosa al 1% y los fragmentos de ADN correspondientes a terminación1-C2-C2-terminación2 se purifican del gel. Los fragmentos terminación1-C2-C2-terminación2 se amplifican mediante PCR utilizando cebadores 5'-aattcaacgctactaccat-3' y 5'-agcttcattacccaaatcaac-3' y con posterioridad se digieren con BamHI y XhoI. Opcionalmente, los polinucleótidos que codifican los multímeros se pueden someter a una ronda adicional de escrutinio de afinidad (p. ej., análisis FACS como se ha descrito antes).
Con posterioridad, se aíslan y se secuencian los aglutinantes de alta afinidad. El ADN que codifica los aglutinantes de alta afinidad se clona en un vector de expresión y se replican en un anfitrión adecuado. Las proteínas expresadas se purifican y caracterizan.
\vskip1.000000\baselineskip
Ejemplo 3
Este ejemplo describe el desarrollo de una genoteca de trímeros que comprende dominios A de receptores de LDL.
Se crea una genoteca de secuencias de ADN que codifican dominios A monoméricos mediante PCR de ensamblaje como describen Stemmer et al., Gene 164, 49-53 (1995). Los oligonucleótidos utilizados en esta reacción de PCR son:
5
donde R=A/G, Y=C/T, M=A/C, K=G/T, S=C/G, W=A/T, B=C/G/T, D=A/G/T, H=A/C/T, V=A/C/G, y N=A/C/G/T.
Los fragmentos de PCR se digieren con XmaI y SfiI. Los productos de digestión se separan sobre gel de agarosa al 3% y los fragmentos del dominio A se purifican a partir del gel. Los fragmentos de ADN se ligan después en los sitios de restricción correspondientes del vector de presentación en fagos fuse5-HA, un derivado de fuse5. La mezcla de ligación es sometida a electroporación en células E. coli electrocompetentes (cepa F p. ej. Top10 o MC1061). Las células E. coli transformadas se desarrollan durante la noche en medio 2xYT que contiene 20 \mug/ml de tetraciclina.
Los viriones se purifican a partir de este cultivo mediante precipitación con PEG. La proteína diana se inmoviliza sobre una superficie sólida (p. ej. placa Petri o placa de microtitulación) directamente mediante incubación en NaHCO_{3} 0,1 M o indirectamente a través de una conexión biotina-estreptavidina. Los viriones purificados se añaden a un número típico de ~1-3 x 10^{11} TU. La placa Petri o la placa de microtitulación se incuba a 4ºC, se lava varias veces con tampón de lavado (TBS/Tween) y los fagos unidos se hacen eluir añadiendo glicina.tampón HCl. El producto eluido se neutraliza añadiendo Tris-HCl 1 M (pH 9,1).
Los fagos se amplifican y se utilizan con posterioridad como aporte para una segunda ronda de selección de afinidad. El ADNss se extrae del producto eluido final utilizando el kit QIAprep M13 kit. El ADNss se utiliza como molde para amplificar mediante PCR los dominios A que codifican las secuencia de ADN.
Los oligonucleótidos utilizados en esta reacción de PCR son:
5'-aagcctcagcgaccgaa
5'-agcccaataggaacccat
Los fragmentos de la PCR se digieren con AlwNI y BglI. Los productos de la digestión se separan sobre gel de agarosa al 3% y los fragmentos del dominio A se purifican del gel. Los fragmentos de la PCR se multimerizan mediante ligación con ADN en presencia de los siguientes fragmentos de terminación:
Terminación1:
6
Terminación2:
7
La mezcla de ligación se digiere con EcoRI y HindIII.
Los multímeros se separan sobre gel de agarosa al 1% y los fragmentos de ADN correspondientes a terminación1-A-A-A-terminación2 se purifican del gel. Los fragmentos terminación1-A-A-A-terminación2 se amplifican con posterioridad mediante PCR utilizando cebadores 5'-agcttcattacccaaatcaac-3' y 5' aattcaacgctactaccat-3' y con posterioridad se digieren con XmaI y SfiI. Los polinucleótidos seleccionados se clonan después en un sistema de expresión en fagos y se prueba su afinidad por la proteína diana.
Los aglutinantes de alta afinidad se aíslan y secuencian con posterioridad. El ADN que codifica los aglutinantes de alta afinidad se clona en un vector de expresión y se expresa con posterioridad en un anfitrión adecuado. La proteína expresada se purifica y se caracteriza después.

Claims (17)

1. Un método para identificar un multímero que se una a una molécula diana, comprendiendo los métodos,
(a)
proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y es un dominio de clase A del receptor de LDL;
(b)
escrutar la biblioteca de polipéptidos en busca de la afinidad para una molécula diana;
(c)
identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana;
(d)
conectar el primer dominio monomérico a una pluralidad de diferentes dominios monoméricos para formar una biblioteca de diferentes multímeros, comprendiendo los multímeros el primer dominio monomérico y uno de una pluralidad de diferentes dominios monoméricos;
(e)
escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y
(f)
identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.
\vskip1.000000\baselineskip
2. El método de la reivindicación 1, donde el multímero seleccionado comprende al menos tres dominios monoméricos.
3. El método de cualquiera de las reivindicaciones precedentes, donde la biblioteca de multímeros se expresa como una presentación en fagos, una presentación en ribosomas, o una presentación en la superficie celular.
4. El método de cualquiera de las reivindicaciones precedentes, donde los dominios monoméricos están conectados por un conector polipeptídico heterólogo.
5. Un método para identificar un multímero que se une a al menos una molécula diana, comprendiendo el método:
(a)
proporcionar una biblioteca de multímeros, donde cada multímero comprende al menos dos dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos y comprende al menos dos enlaces disulfuro, separados por un conector heterólogo donde los dominios monoméricos son dominios de clase A del receptor de LDL; y
(b)
escrutar la biblioteca de multímeros en busca de multímeros que se unen a la molécula diana.
\vskip1.000000\baselineskip
6. El método de la reivindicación 5, que comprende adicionalmente identificar los multímeros que se unen a la molécula diana que tienen una avidez por la molécula diana que es mayor que la avidez de un dominio monomérico sencillo por la molécula diana.
7. El método de la reivindicación 5 o la reivindicación 6, donde uno o más de los multímeros comprende un dominio monomérico que se une específicamente a una segunda molécula diana.
8. Una biblioteca de multímeros, donde
(a)
cada multímero comprende al menos dos dominios monoméricos conectados por un conector heterólogo, donde cada dominio monomérico tiene 30-100 aminoácidos y comprende al menos dos enlaces disulfuro; y
(b)
los dominios monoméricos son dominios de clase A del receptor de LDL.
\vskip1.000000\baselineskip
9. La biblioteca de la reivindicación 8, donde cada dominio monomérico de los multímeros es un dominio monomérico de origen no natural.
10. La biblioteca de la reivindicación 8, donde los dominios monoméricos están conectados por un conector polipeptídico.
11. El método o la biblioteca de cualquiera de las reivindicaciones anteriores, donde la biblioteca contiene al menos 100 miembros.
12. Un polipéptido que comprende al menos dos dominios monoméricos separados por un conector heterólogo, donde cada dominio monomérico tiene 30-100 aminoácidos y comprende al menos dos enlaces disulfuro, donde cada dominio monomérico se une específicamente a una molécula diana y donde los dominios monoméricos son dominios de clase A del receptor de LDL.
13. El polipéptido de la reivindicación 12, donde cada dominio monomérico es un dominio monomérico de proteína de origen no natural.
14. El polipéptido de la reivindicación 12, donde el polipéptido comprende un primer dominio monomérico que se une a una primera molécula diana y un segundo dominio monomérico que se une a una segunda molécula diana.
15. El polipéptido de la reivindicación 12, donde el polipéptido comprende dos dominios monoméricos, teniendo cada uno especificidad de unión por un sitio diferente en una primera molécula diana.
16. El polipéptido de la reivindicación 12, donde el polipéptido comprende al menos tres dominios monoméricos.
17. El polipéptido de la reivindicación 12, donde los dominios monoméricos están conectados por un segundo conector polipeptídico.
ES02725828T 2001-04-26 2002-04-26 Bibliotecas combinatorias de dominios monoméricos. Expired - Lifetime ES2348355T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US28682301P 2001-04-26 2001-04-26
US286823P 2001-04-26
US337209P 2001-11-19
US333359P 2001-11-26
US374107P 2002-04-18

Publications (1)

Publication Number Publication Date
ES2348355T3 true ES2348355T3 (es) 2010-12-03

Family

ID=43401971

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02725828T Expired - Lifetime ES2348355T3 (es) 2001-04-26 2002-04-26 Bibliotecas combinatorias de dominios monoméricos.

Country Status (1)

Country Link
ES (1) ES2348355T3 (es)

Similar Documents

Publication Publication Date Title
EP1390535B1 (en) Combinatorial libraries of monomer domains
US20060286603A1 (en) Combinatorial libraries of monomer domains
AU2002256371A1 (en) Combinatorial libraries of monomer domains
US20050048512A1 (en) Combinatorial libraries of monomer domains
US20050164301A1 (en) LDL receptor class A and EGF domain monomers and multimers
US20040175756A1 (en) Methods for using combinatorial libraries of monomer domains
US7968681B2 (en) c-MET kinase binding proteins
US20050053973A1 (en) Novel proteins with targeted binding
US20050089932A1 (en) Novel proteins with targeted binding
US20100204052A1 (en) Protein scaffolds and uses thereof
CN101878303B (zh) 使用包含非天然氨基酸的蛋白质进行定向进化
US7786262B2 (en) IL-6 binding proteins
WO1992002536A1 (en) Systematic polypeptide evolution by reverse translation
EP1539943A2 (en) Method for identifying mhc-presented peptide epitopes for t cells
KR20130065215A (ko) 단백질 골격모듈을 포함하는 융합 폴리펩타이드 및 이를 이용한 목적 단백질에 특이적인 펩타이드 라이브러리 스크리닝 방법
ES2348355T3 (es) Bibliotecas combinatorias de dominios monoméricos.
CA2587463A1 (en) Protein scaffolds and uses therof
CN112375741A (zh) 一种高表达sars-cov2-rbd的细胞株及其方法
Björklund Microtubule associated proteins 1B and 1S: interactions with NR1 and NR3A