ES2348355T3 - Bibliotecas combinatorias de dominios monoméricos. - Google Patents
Bibliotecas combinatorias de dominios monoméricos. Download PDFInfo
- Publication number
- ES2348355T3 ES2348355T3 ES02725828T ES02725828T ES2348355T3 ES 2348355 T3 ES2348355 T3 ES 2348355T3 ES 02725828 T ES02725828 T ES 02725828T ES 02725828 T ES02725828 T ES 02725828T ES 2348355 T3 ES2348355 T3 ES 2348355T3
- Authority
- ES
- Spain
- Prior art keywords
- domains
- domain
- monomeric
- monomer
- multimer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Peptides Or Proteins (AREA)
Abstract
Un método para identificar un multímero que se una a una molécula diana, comprendiendo los métodos, (a) proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y es un dominio de clase A del receptor de LDL; (b) escrutar la biblioteca de polipéptidos en busca de la afinidad para una molécula diana; (c) identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana; (d) conectar el primer dominio monomérico a una pluralidad de diferentes dominios monoméricos para formar una biblioteca de diferentes multímeros, comprendiendo los multímeros el primer dominio monomérico y uno de una pluralidad de diferentes dominios monoméricos; (e) escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y (f) identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.
Description
Bibliotecas combinatorias de dominios
monoméricos.
Los análisis de las secuencias de proteínas y de
las estructuras tridimensionales han revelado que muchas proteínas
están compuestas por un número discreto de dominios monoméricos. La
mayoría de las proteínas con dominios monoméricos discretos es
extracelular o constituye las porciones extracelulares de las
proteínas unidas a la membrana.
Una importante característica de un dominio
monomérico discreto es su capacidad para plegarse independientemente
o con alguna ayuda limitada. La ayuda limitada puede incluir la
ayuda de una o varias chaperoninas (p. ej., una proteína asociada
con un receptor (RAP)). La presencia de uno o varios iones metálicos
también ofrece ayuda limitada. La capacidad para plegarse
independientemente evita el plegamiento erróneo del dominio cuando
es insertado en el entorno de una nueva proteína. Esta
característica ha permitido que los dominios monoméricos discretos
sean evolutivamente móviles. Como resultado, los dominios discretos
se han dispersado durante la evolución y ahora existen por otra
parte en proteínas no relacionadas. Algunos dominios, incluyendo los
dominios de tipo III de fibronectina y el dominio de tipo
inmunoglobina, existen en numerosas proteínas, mientras otros
dominios solamente se encuentran en un número limitado de
proteínas.
Las proteínas que contienen estos dominios están
involucradas en una variedad de procedimientos, tales como
transportadores celulares, movimiento de colesterol, transducción de
la señal y funciones de señalización que están implicadas en el
desarrollo y la neurotransmisión. Véase Herz, Lipoprotein receptors:
beacons to neurons?, (2001) Trends in Neurosciences
24(4):193-195; Goldstein y Brown, The
Cholesterol Quartet, (2001) Science 292: 1310-1312.
La función de un dominio monomérico discreto a menudo es específica
pero también contribuye a la actividad global de la proteína o
polipéptido. Por ejemplo, el dominio de clase A del receptor de LDL
(también referido como módulo de clase A, una repetición de tipo
complemento o un dominio A) está implicado en la unión al ligando
mientras el dominio ácido gamma-carboxiglutámico
(Gla) que se encuentra en las proteínas de coagulación dependientes
de vitamina K está implicado en la unión de alta afinidad a las
membranas de fosfolípidos. Otros dominios monoméricos discretos
incluyen, p. ej., el dominio de tipo factor de crecimiento
epidérmico (EGF) en el activador de plasminógeno de tipo tisular
que media la unión a células del hígado y regula de ese modo el
aclaramiento de esta enzima fibrinolítica de la circulación y la
cola citoplásmica del receptor de LDL que está implicada en la
endocitosis mediada por receptores.
Las proteínas individuales pueden poseer uno o
más dominios monoméricos discretos. Estas proteínas a menudo se
denominan proteínas mosaico. Por ejemplo, los miembros de la familia
del receptor de LDL contienen cuatro dominios estructurales
principales: las repeticiones del dominio A ricas en cisteína, las
repeticiones de tipo precursor del factor de crecimiento
epidérmico, un dominio transmembrana y un dominio citoplásmico. La
familia del receptor de LDL incluye miembros que: 1) son receptores
de la superficie celular; 2) reconocen ligandos extracelulares; y
3) los internalizan para su degradación por lisosomas. Véase Hussain
et al., The Mammalian Low-Density
Lipoprotein Receptor Family, (1999) Annu. Rev. Nutr.
19:141-72. Por ejemplo, algunos miembros incluyen
receptores de lipoproteínas de muy baja densidad
(VLDL-R), receptor 2 de apolipoproteína E, proteína
relacionada con LDLR (LRP) y megalina. Los miembros de la familia
tienen las siguientes características: 1) expresión en la
superficie celular; 2) unión al ligando extracelular que consiste en
repeticiones del dominio A; 3) requerimiento de calcio para la
unión al ligando; 4) reconocimiento de la proteína asociada al
receptor y la apolipoproteína (apo) E; 5) dominio de homología con
el precursor del factor de crecimiento epidérmico (EGF) que
contiene repeticiones YWTD; 6) región que abarca la membrana
sencilla; y 7) endocitosis mediada por el receptor de diferentes
ligandos. Véase Hussain, supra. Con todo, los miembros se
unen a diversos ligandos estructuralmente distintos.
Resulta ventajoso desarrollar métodos para
generar y optimizar las propiedades deseadas de estos dominios
monoméricos discretos. Sin embargo, los dominios monoméricos
discretos, si bien están estructuralmente conservados, no están
conservados a nivel de nucleótidos o aminoácidos, excepto para
ciertos aminoácidos, p. ej., los residuos de cisteína del dominio
A. De este modo, los métodos de recombinación de nucleótidos
existentes se quedan cortos para generar y optimizar las
propiedades deseadas de estos dominios monoméricos discretos.
La presente invención está dirigida a estos y
otros problemas.
La presente invención proporciona un método para
identificar un multímero que se une a una molécula diana,
comprendiendo el método,
- (a)
- proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y está en un dominio de clase A del receptor de LDL;
- (b)
- escrutar la biblioteca de polipéptidos en busca de afinidad hacia una molécula diana;
- (c)
- identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana;
- (d)
- conectar el primer dominio monomérico a una pluralidad de dominios monoméricos diferentes para formar una biblioteca de multímeros diferentes, comprendiendo los multímeros el primer dominio monomérico y uno de la pluralidad de dominios monoméricos diferentes;
- (e)
- escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y
- (f)
- identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.
En algunas realizaciones, al menos tres dominios
monoméricos se unen a la misma molécula diana.
Adicionalmente se describen en la presente
memoria métodos que comprenden una etapa adicional de mutación de
al menos un dominio monomérico, proporcionando de ese modo una
genoteca que comprende dominios monoméricos mutados. La etapa de
mutación puede comprender recombinar una pluralidad de fragmentos
polinucleotídicos de al menos un polinucleótido que codifica un
dominio monomérico. La etapa de mutación puede comprender una
evolución dirigida. La etapa de mutación puede comprender una
mutagénesis dirigida al sitio.
Adicionalmente se describen en la presente
memoria métodos que comprenden: escrutar la biblioteca de dominios
monoméricos en busca de afinidad hacia una segunda molécula diana;
identificar un dominio monomérico que se une a una segunda molécula
diana; conectar al menos un dominio monomérico con afinidad hacia la
primera molécula diana con al menos un dominio monomérico con
afinidad hacia una segunda molécula diana, formando de ese modo una
biblioteca de multímeros; escrutar la biblioteca de multímeros en
busca de la capacidad de unirse a la primera y segunda moléculas
diana; e identificar un multímero que se une a la primera y segunda
moléculas diana, identificando de ese modo un multímero que se une
específicamente a una primera y una segunda moléculas diana.
Ciertos métodos descritos en la presente memoria
comprenden adicionalmente: proporcionar una segunda biblioteca de
dominios monoméricos; escrutar la segunda biblioteca de dominios
monoméricos en busca de afinidad hacia al menos una segunda
molécula diana; identificar un segundo dominio monomérico que se une
a la segunda molécula diana; conectar los dominios monoméricos
identificados que se unen a la primera molécula diana o la segunda
molécula diana, formando de ese modo una biblioteca de multímeros;
escrutar la biblioteca de multímeros en busca de la capacidad de
unirse a la primera y segunda moléculas diana; e identificar un
multímero que se une a la primera y segunda moléculas diana.
La molécula diana se puede seleccionar del grupo
que consiste en un antígeno viral, un antígeno bacteriano, un
antígeno fúngico, una enzima, una proteína de la superficie celular,
un inhibidor de enzima, una molécula informadora, y un receptor. El
antígeno viral puede ser un polipéptido requerido para la
replicación viral. La primera y al menos segunda moléculas diana
pueden ser diferentes componentes del mismo sistema de replicación
viral. El multímero seleccionado se puede unir a al menos dos
serotipos del mismo virus.
En algunas realizaciones, la biblioteca de
multímeros es expresada como una presentación en fagos, presentación
en ribosomas o presentación sobre la superficie celular.
En algunas realizaciones, los dominios
monoméricos están conectados por un conector polipeptídico. Como se
describe en la presente memoria, el conector polipeptídico puede ser
un conector asociado naturalmente con el dominio monomérico. En
algunas realizaciones, el conector polipeptídico es una variante de
un conector asociado naturalmente con un dominio monomérico. La
etapa de conexión puede comprender conectar los dominios
monoméricos con una variedad de conectores de diferentes longitudes
y composiciones.
La presente invención también proporciona
polipéptidos que comprenden los multímeros seleccionados descritos
antes.
La presente invención también proporciona
polinucleótidos que codifican los multímeros seleccionados como se
ha descrito antes.
La presente invención también proporciona
bibliotecas de multímeros formadas como se ha descrito antes.
La presente invención también proporciona
métodos para identificar un multímero que se une a al menos una
molécula diana, que comprende las etapas de: proporcionar una
biblioteca de multímeros, donde cada multímero comprende al menos
dos dominios monoméricos y donde cada dominio monomérico comprende
al menos dos enlaces disulfuro, tiene 30 - 100 aminoácidos, es un
dominio de clase A del receptor de LDL y los dominios monoméricos
están separados por un conector heterólogo; y escrutar la biblioteca
de multímeros en busca de multímeros que se unen a la molécula
diana. En algunas realizaciones, los métodos comprenden
adicionalmente identificar los multímeros que se unen a la molécula
diana que tienen avidez por la molécula diana que es mayor que la
avidez de un único dominio monomérico por la molécula diana. En
algunas realizaciones, uno o más de los multímeros comprenden un
dominio monomérico que se une específicamente a una segunda molécula
diana.
La presente invención también proporciona
bibliotecas de multímeros. En algunas realizaciones, cada multímero
comprende al menos dos dominios monoméricos conectados por un
conector; cada dominio monomérico muestra una especificidad de
unión para una molécula diana; y cada dominio monomérico es un
dominio monomérico que no existe naturalmente.
La presente invención también proporciona
polipéptidos que comprenden al menos dos dominios monoméricos
separados por una secuencia conectora heteróloga. En algunas
realizaciones, cada dominio monomérico se une específicamente a una
molécula diana; y cada dominio es un dominio monomérico de una
proteína que no existe naturalmente.
Adicionalmente se describen en la presente
memoria polipéptidos que comprenden un primer dominio monomérico
que se une a una primera molécula diana y un segundo dominio
monomérico que se une a una segunda molécula diana. Los
polipéptidos pueden comprender dos dominios monoméricos, teniendo
cada dominio monomérico una especificidad de unión que es
específica para un sitio diferente de la misma molécula diana. Los
polipéptidos pueden comprender adicionalmente un dominio monomérico
que tiene una especificidad de unión para una segunda molécula
diana.
Como se describe adicionalmente en la presente
memoria, los dominios monoméricos de una biblioteca, multímero o
polipéptido pueden ser idénticos al menos en 70%.
A menos que se indique de otro modo, las
siguientes definiciones sustituyen a las de la técnica.
El término "dominio monomérico" o
"monómero" se utiliza indistintamente en la presente memoria
para hacer referencia a una región discreta encontrada en una
proteína o polipéptido. Un dominio monomérico forma una estructura
tridimensional nativa en solución en ausencia de secuencias de
aminoácidos nativas colindantes. Los dominios monoméricos de la
invención se unirán específicamente a una molécula diana. Por
ejemplo, un polipéptido que forma una estructura tridimensional que
se une a una molécula diana es un dominio monomérico. Según se
utiliza en la presente memoria, el término "dominio monomérico"
no incluye la región determinante de la complementariedad (CDR) de
un anticuerpo.
El término "variante de dominio monomérico"
hace referencia a un dominio que resulta de la manipulación humana
de una secuencia de un dominio monomérico. Los ejemplos de los
cambios manipulados por el hombre incluyen, p. ej., la mutagénesis
al azar, la mutagénesis específica del sitio, el barajado, la
evolución dirigida, etc. El término "variante de dominio
monomérico" no abarca una región determinante de la
complementariedad (CDR) mutagenizada de un anticuerpo.
El término "multímero" se utiliza en la
presente memoria para indicar un polipéptido que comprende al menos
dos dominios monoméricos y/o inmunodominios (p. ej., al menos dos
dominios monoméricos, al menos dos inmuno-dominios,
o al menos un dominio monomérico y al menos un
inmuno-dominio). Los dominios monoméricos y/o
inmuno-dominios separados en un multímero pueden
ser reunidos por medio de un conector. Un multímero también es
conocido como una proteína mosaico combinatoria o una proteína
mosaico recombinante.
El término "ligando", también referido en
la presente memoria como "molécula diana", abarca una amplia
variedad de sustancias y moléculas, que oscilan entre moléculas
simples y dianas complejas. Las moléculas diana pueden ser
proteínas, ácidos nucleicos, lípidos, carbohidratos o cualquier otra
molécula capaz de reconocer un dominio polipeptídico. Por ejemplo,
una molécula diana puede incluir un compuesto químico (esto es, un
compuesto no biológico tal como, p. ej., una molécula orgánica, una
molécula inorgánica, o una molécula que tiene átomos tanto
orgánicos como inorgánicos, pero excluyendo polinucleótidos y
proteínas), una mezcla de compuestos químicos, una matriz de
compuestos localizados espacialmente, una macromolécula biológica,
una biblioteca de presentación de péptidos en bacteriófagos, una
biblioteca de presentación de péptidos en polisomas, un extracto
elaborado a partir de materiales biológicos tales como células o
tejidos bacterianos, vegetales, fúngicos, o animales (p. ej.,
mamíferos), una proteína, una toxina, una hormona peptídica, una
célula, un virus, o similar. Otras moléculas diana incluyen, p.
ej., una célula completa, un tejido completo, una mezcla de
proteínas relacionadas o no relacionadas, una mezcla de virus o
cepas bacterianas o similares. Las moléculas diana también pueden
ser definidas mediante la inclusión en análisis de escrutinio
descritos en la presente memoria o intensificando o inhibiendo una
interacción de proteínas específicas (esto es, un agente que inhibe
selectivamente una interacción de unión entre dos polipéptidos
predeterminados).
Según se utiliza en la presente memoria, el
término "inmuno-dominios" hace referencia a
dominios de unión a proteínas que contienen al menos una región
determinante de la complementariedad (CDR) de un anticuerpo. Los
inmuno-dominios pueden ser dominios inmunológicos de
origen natural (esto es, aislados de la naturaleza) o pueden ser
dominios inmunológicos de origen no natural que han sido alterados
mediante manipulación humana (p. ej., mediante métodos de
mutagénesis, tales como, por ejemplo, mutagénesis al azar,
mutagénesis específica del sitio, y similares, así como mediante
métodos de evolución dirigida, tales como, por ejemplo, PCR propensa
a error recursiva, recombinación recursiva, y similares). Los
diferentes tipos de inmuno-dominios que son
adecuados para su uso en la práctica de la presente invención
incluyen un mini-anticuerpo ("minibody"), un
anticuerpo de un sólo dominio, un fragmento variable de cadena
sencilla (ScFv), y un fragmento Fab.
El término
"mini-anticuerpo" hace referencia en la
presente memoria a un polipéptido que codifica solamente 2 regiones
determinantes de la complementariedad (CDR) de origen natural o no
natural (p. ej., mutagenizadas) que existen en el dominio variable
de la cadena pesada o el dominio variable de la cadena ligera, o una
de sus combinaciones. Un ejemplo de un
mini-anticuerpo es descrito por Pessi et al.,
A designed metal-binding protein with a novel fold,
(1993) Nature 362:367-369. Se ilustra
esquemáticamente un multímero de mini-anticuerpos
en la Figura 11A. Los círculos representan
mini-anticuerpos, y las líneas gruesas representan
los radicales conectores que unen los inmunodominios entre sí.
Según se utiliza en la presente memoria, el
término "anticuerpo de dominio sencillo" hace referencia al
dominio variable de la cadena pesada ("V_{H}") de un
anticuerpo, esto es, un dominio variable de la cadena pesada sin un
dominio variable de la cadena ligera. Los anticuerpos de dominio
sencillo ilustrativos empleados en la práctica de la presente
invención incluyen, por ejemplo, el dominio variable de la cadena
pesada de Camélido (aproximadamente 118 a 136 residuos de
aminoácido) como describen Hamers-Casterman, C.
et al., Naturally occurring antibodies devoid of light
chains (1993) Nature 363:446-448, y Dumoulin, et
al., Single-domain antibody fragments with high
conformational stability (2002) Protein Science
11:500-515. En la Figura 11B se representa un
multímero de anticuerpos de dominio sencillo. Las elipses
representan los anticuerpos de dominio sencillo, y las líneas
gruesas representan los radicales conectores que unen los
anticuerpos de dominio sencillo entre sí.
Los términos "fragmento variable de cadena
sencilla" o "ScFv" se utilizan indistintamente en la
presente memoria para hacer referencia a dominios variables de
cadenas pesadas y ligeras de anticuerpos que están unidos por un
conector peptídico que tiene al menos 12 residuos de aminoácido. Los
fragmentos variables de cadena sencilla contemplados para su uso en
la práctica de la presente invención incluyen aquellos descritos por
Bird, et al., Single-chain
antigen-binding proteins (1988) Science
242(4877):423-426 y Huston et al.,
Protein engineering of antibody binding sites: recovery of specific
activity in an anti-digoxin
single-chain Fv analogue produced in Escherichia
coli (1988) Proc Natl Acad Sci U S A
85(16):5879-83. En la Figura 11C se ilustra
un multímero de fragmentos variables de cadena sencilla. Las líneas
discontinuas representan el conector peptídico que une los dominios
variables de la cadena pesada y ligera entre sí. Las líneas gruesas
representan los radicales conectores que unen los dominios
variables de la cadena pesada entre sí.
Según se utiliza en la presente memoria, el
término "fragmento Fab" hace referencia a un
inmuno-dominio que tiene dos cadenas de proteína,
una de las cuales es una cadena ligera que consiste en dos dominios
de la cadena ligera (dominio variable V_{L} y dominio constante
C_{L}) y una cadena pesada que consiste en dos dominios pesados
(esto es, un dominio variable V_{H} y uno constante C_{H}). Los
fragmentos Fab empleados en la práctica de la presente invención
incluyen aquellos que tienen un enlace disulfuro intercatenario en
el extremo C de cada componente pesado y ligero, así como aquellos
que no tienen semejante enlace disulfuro C-terminal.
Cada fragmento tiene aproximadamente 47 kD. Los fragmentos Fab son
descritos por Pluckthun y Skerra, Expression of functional antibody
Fv and Fab fragments in Escherichia coli (1989) Methods
Enzymol 178:497-515. En la Figura 11D se representa
un multímero de fragmentos Fab. Las elipses de color blanco
representan el componente de la cadena pesada del fragmento Fab,
las elipses rellenas representan el componente de la cadena ligera
del Fab.
El término "conector" se utiliza en la
presente memoria para indicar un radical o grupo de radicales que
unen o conectan dos o más dominios monoméricos separados discretos.
El conector permite que los dominios monoméricos separados
discretos permanezcan separados cuando se unen en un multímero. El
radical conector es típicamente un radical sustancialmente lineal.
Los conectores adecuados incluyen polipéptidos, ácidos
polinucleicos, ácidos peptidonucleicos y similares. Los conectores
adecuados también incluyen radicales alquileno opcionalmente
sustituidos que tienen uno o más átomos de oxígeno incorporados al
esqueleto carbonado. Típicamente, el peso molecular del conector es
menor de aproximadamente 2000 daltons. Más típicamente, el peso
molecular del conector es menor de aproximadamente 1500 daltons y
normalmente es menor de aproximadamente 1000 daltons. El conector
puede ser suficientemente pequeño para permitir que los dominios
monoméricos separados discretos cooperen, p. ej., cuando cada uno
de los dominios monoméricos separados discretos de un multímero se
unen a la misma molécula diana mediante sitios de unión separados.
Los conectores ilustrativos incluyen un polinucleótido que codifica
un polipéptido, o un polipéptido de aminoácidos u otros radicales de
origen natural. El conector puede ser una porción de una secuencia
nativa, una de sus variantes, o una secuencia sintética. Los
conectores pueden comprender, p. ej., aminoácidos de origen
natural, de origen no natural, o una combinación de ambos.
El término "separado" se utiliza en la
presente memoria para indicar una propiedad de un radical que es
independiente y permanece independiente incluso cuando forma
complejos con otros radicales, incluyendo por ejemplo, otros
dominios monoméricos. Un dominio monomérico es un dominio separado
en una proteína debido a que tiene una propiedad independiente que
puede ser reconocida y separada de la proteína. Por ejemplo, la
capacidad de unión al ligando del dominio A en el LDLR es una
propiedad independiente. Otros ejemplos de separado incluyen los
dominios monoméricos separados en un multímero que siguen siendo
dominios independientes separados incluso cuando forman complejos o
se unen entre sí en el multímero por medio de un conector. Otro
ejemplo de la propiedad de separado son los sitios de unión
separados en un multímero para un ligando.
Según se utiliza en la presente memoria, "la
evolución dirigida" hace referencia a un procedimiento por medio
del cual se generan variantes polinucleotídicas, se expresan, y se
escrutan en busca de una actividad (p. ej., un polipéptido con
actividad de unión) en un procedimiento recursivo. Se seleccionan
uno o más candidatos en el escrutinio y el procedimiento se repite
después utilizando polinucleótidos que codifican los candidatos
seleccionados para generar nuevas variantes. La evolución dirigida
implica al menos dos rondas de generación de la variación y puede
incluir 3, 4, 5, 10, 20 o más rondas de generación de la variación y
la selección. La variación puede ser generada mediante cualquier
método conocido por los experto en la técnica, incluyendo, p. ej.,
PCR propensa al error, barajado de genes, mutagénesis química y
similares.
El término "barajado" se utiliza en la
presente memoria para indicar la recombinación entre secuencias no
idénticas. En algunas realizaciones, el barajado puede incluir el
cruzamiento por medio de recombinación homóloga o por medio de
recombinación no homóloga, por ejemplo por medio de los sistemas
cre/lox y/o flp/frt. El barajado se puede llevar a cabo empleando
una variedad de formatos diferentes, incluyendo por ejemplo,
formatos de barajado in vitro e in vivo, formatos de
barajado in silico, formatos de barajado que utilizan moldes
bicatenarios o monocatenarios, formatos de barajado basados en
cebadores, formatos de barajado basados en la fragmentación de
ácido nucleico, y formatos de barajado mediados por
oligonucleótidos, todos los cuales se basan en eventos de
recombinación entre secuencias no idénticas y se describen con más
detalle o se refieren en la presente memoria más abajo, así como
otros formatos basados en la recombinación similares.
El término "al azar" según se utiliza en la
presente memoria hace referencia a una secuencia de polinucleótidos
o una secuencia de aminoácidos compuesta por dos o más aminoácidos y
construida mediante un procedimiento estocástico o al azar. La
secuencia de polinucleótidos o la secuencia de aminoácidos al azar
pueden incluir motivos en marco o armazón, que pueden comprender
secuencias invariables.
El término "pseudo-al azar"
según se utiliza en la presente memoria hace referencia a un grupo
de secuencias, de polinucleótidos o polipéptidos, que tienen una
variabilidad limitada, de manera que el grado de variabilidad de
los residuos en algunas posiciones está limitado, pero se permite
cualquier posición pseudo-al azar, al menos cierto
grado de variación de residuos.
Los términos "polipéptido", "péptido",
y "proteína" se utilizan en la presente memoria indistintamente
para hacer referencia a una secuencia de aminoácidos de dos o más
aminoácidos.
La "sustitución de aminoácidos
conservativa" hace referencia a la intercambiabilidad de residuos
que tienen cadenas laterales similares. Por ejemplo, un grupo de
aminoácidos que tienen cadenas laterales alifáticas es glicina,
alanina, valina, leucina, e isoleucina; un grupo de aminoácidos que
tienen cadenas laterales hidroxiladas alifáticas es serina y
treonina; un grupo de aminoácidos que tienen cadenas laterales que
contienen amida es asparagina y glutamina; un grupo de aminoácidos
que tienen cadenas laterales aromáticas es fenilalanina, tirosina,
y triptófano; un grupo de aminoácidos que tienen cadenas laterales
alcalinas es lisina, arginina, e histidina; y un grupo aminoácidos
que tienen cadenas laterales que contienen azufre es cisteína y
metionina. Los grupos preferidos de sustitución conservativa de
aminoácidos son:
valina-leucina-isoleucina,
fenilalanina-tirosina,
lisina-arginina, alanina-valina, y
asparagina-glutamina.
La frase "secuencia de ácido nucleico" hace
referencia a un polímero de cadena sencilla o doble de bases
desoxirribonucleotídicas o ribonucleotídicas leídas desde el
extremo 5' al 3'. Esto incluye ADN cromosómico, plásmidos
auto-replicantes y ADN o ARN que desempeñan un
papel estructural primario.
El término "que codifica" hace referencia a
una secuencia de polinucleótidos que codifica uno o más aminoácidos.
El término no requiere un codón de iniciación o terminación. Una
secuencia de aminoácidos puede estar codificada por uno cualquiera
de los seis marcos de lectura diferentes proporcionados por una
secuencia de polinucleótidos.
El término "promotor" hace referencia a
regiones o secuencias localizadas aguas arriba y/o aguas abajo del
inicio de la transcripción que están implicadas en el reconocimiento
y la unión de la ARN polimerasa y otras proteínas para iniciar la
transcripción.
Un "vector" hace referencia a un
polinucleótido, que cuando es independiente del cromosoma anfitrión,
es susceptible de replicación en un organismo anfitrión. Los
ejemplos de los vectores incluyen los plásmidos. Los vectores
tienen típicamente un origen de replicación. Los vectores pueden
comprender, p. ej., terminadores de la transcripción y la
traducción, secuencias de iniciación de la transcripción y la
traducción, y promotores útiles para la regulación de la expresión
del ácido nucleico concreto.
El término "recombinante" cuando se utiliza
haciendo referencia, p. ej., a una célula, o ácido nucleico,
proteína, o vector, indica que la célula, ácido nucleico, proteína o
vector, ha sido modificado mediante la introducción de un ácido
nucleico heterólogo o proteína o la alteración de un ácido nucleico
o proteína nativos, o que la célula deriva de una célula modificada
de este modo. Así, por ejemplo, las células recombinantes expresan
genes que no se encuentran en la forma nativa (no recombinante) de
la célula o expresan genes nativos que son expresados anómalamente
de otro modo, expresados a la baja o no expresados en absoluto.
La frase "se une específicamente (o
selectivamente)" a un polipéptido, cuando hace referencia a un
monómero o multímero, hace referencia a una reacción de unión que
puede ser determinante de la presencia del polipéptido en una
población heterogénea de proteínas y otros compuestos biológicos. De
este modo, en condiciones convencionales o en análisis utilizados
en los análisis de unión de anticuerpos, el monómero o multímero
especificados se unen a una molécula diana concreta por encima del
fondo (p. ej., 2X, 5X, 10X o más por encima del fondo) y no se une
de una manera significativa a otras moléculas presentes en la
muestra.
Los términos "identidad" o porcentaje de
"identidad", en el contexto de dos o más secuencias de ácidos
nucleicos o polipéptidos, hacen referencia a dos o más secuencias o
subsecuencias que son iguales. "Esencialmente idéntico" hace
referencia a dos o más secuencias de ácidos nucleicos o polipéptidos
que tienen un porcentaje especificado de residuos de aminoácidos o
nucleótidos que son iguales (esto es, una identidad de 60%,
opcionalmente una identidad de 65%, 70%, 75%, 80%, 85%, 90%, o 95%
a lo largo de una región especificada, o, cuando no se especifica,
a lo largo de una secuencia completa), cuando se comparan y se
alinean para una correspondencia máxima a lo largo de una ventana
de comparación, o una región designada medida utilizando uno de los
siguientes algoritmos de comparación de secuencias o mediante
alineamiento manual e inspección visual. Opcionalmente, la
identidad o identidad sustancial existe a lo largo de una región que
tiene al menos aproximadamente 50 nucleótidos de longitud, o más
preferiblemente a lo largo de una región que tiene de 100 a 500 o
1000 o más nucleótidos de longitud.
El término "conector heterólogo", cuando se
utiliza en referencia a un multímero, indica que el multímero
comprende un conector y un monómero que no se encuentran en la misma
relación entre sí en la naturaleza (p. ej., forman una
proteína de fusión).
La Figura 1 ilustra esquemáticamente el tipo,
número y orden de dominios monoméricos encontrados en los miembros
de la familia de receptores de LDL. Estos dominios monoméricos
incluyen dominios Molinillo \beta, dominios de tipo EGF y
dominios de clase A del receptor de LDL. Los miembros mostrados
incluyen el receptor de lipoproteínas de baja densidad (LDLR), el
receptor 2 de ApoE (ApoER2), el receptor de lipoproteínas de muy
baja densidad (VLDLR), la proteína 2 relacionada con LDLR (LRP2) y
la proteína 1 relacionada con el LDLR (LRP1).
La Figura 2 ilustra esquemáticamente el
alineamiento de la secuencia de aminoácidos parcial de una variedad
de dominios de clase A del receptor de LDL que incluyen dos
secuencias de LPR1 humanas, dos secuencias de LRP2 humanas, dos
secuencias de LDLR humanas, dos secuencias de LDVR humanas, una
secuencia de LRP3 humana, una secuencia de MAT humana, una
secuencia de CO6 humana, una secuencia de SORL humana, para
demostrar las cisteínas conservadas.
La Figura 3, panel A ilustra esquemáticamente un
ejemplo de un dominio A. El panel A ilustra esquemáticamente
aminoácidos conservados en un dominio A de aproximadamente 40
aminoácidos de longitud. Los residuos de cisteína conservados están
indicados por C, y los aminoácidos cargados negativamente están
indicados por un círculo con un signo menos ("-"). Los
círculos con una "H" indican residuos hidrófobos. El panel B
ilustra esquemáticamente dos dominios A plegados conectados por un
conector. El panel B también indica dos sitios de unión a calcio,
los círculos oscuros con Ca^{+2}, y tres enlaces disulfuro en cada
dominio A plegado para un total de 6 enlaces disulfuro.
La Figura 4 indica algunos de los ligandos
reconocidos por la familia de receptores de LDL, que incluyen
inhibidores, proteasas, complejos de proteasa, complejos portadores
de vitaminas, proteínas implicadas en el metabolismo de
lipoproteínas, ligandos no humanos, antibióticos, virus, y
otros.
La Figura 5 ilustra esquemáticamente un esquema
general para identificar dominios monoméricos que se unen a un
ligando, aislar los dominios monoméricos seleccionados, crear
multímeros de los dominós monoméricos seleccionados uniendo los
dominios monoméricos seleccionados en diversas combinaciones y
escrutar los multímeros para identificar los multímeros que
comprenden más de un monómero que se une a un ligando.
La Figura 6 es una representación esquemática de
otra estrategia de selección (selección guiada). Se identifica un
dominio monomérico con propiedades de unión apropiadas a partir de
una biblioteca de dominios monoméricos. El dominio monomérico
identificado es conectado después con un dominio monomérico de otra
biblioteca de dominios monoméricos para formar una biblioteca de
multímeros. La biblioteca de multímeros es escrutada para
identificar un par de dominios monoméricos que se unen
simultáneamente a la diana. Este procedimiento se puede repetir
después hasta obtener las propiedades de unión óptimas en el
multímero.
La Figura 7 muestra el procedimiento de
multimerización de los dominios monoméricos. Los aciertos con
monómeros de unión a la diana son amplificados a partir de un
vector. Esta mezcla de dominios monoméricos y/o
inmuno-dominios de unión a la diana es escindida
después y mezclada con una combinación óptima de conector y
oligonucleótidos tapón. Los multímeros que se generan son clonados
después en un vector adecuado para la segunda etapa de selección
para la identificación de multímeros de unión a la diana.
La Figura 8 representa aminoácidos comunes en
cada posición del dominio A. Los porcentajes encima de las
posiciones de los aminoácidos hacen referencia al porcentaje de
dominios A de origen natural con la inter-cisteína
espaciadora desplegada. Los residuos de aminoácidos potenciales
representados bajo cada posición de aminoácido representan residuos
comunes en esa posición. Los seis aminoácidos finales, representados
como círculos de color más claro, representan secuencias
conectoras. Las dos columnas de residuos de aminoácidos en cursiva
en las posiciones 2 y 3 del conector representan residuos de
aminoácidos que no existen en esa posición. Cualquier otro
aminoácido (p. ej., A, D, E, G, H, I, K, L, N, P, Q, R, S, T, y V)
puede ser incluido en estas posiciones.
La Figura 9 muestra la frecuencia de aparición
de residuos de aminoácidos en los dominios A de origen natural para
los dominios A con el siguiente espaciamiento entre cisteínas:
CX_{6}CX_{4}CX_{6}CX_{5}CX_{8}C.
La Figura 10 representa un alineamiento de
dominios A. En la parte superior e inferior de la figura, las letras
pequeñas (a-q) indican residuos conservados. Los
aminoácidos predominantes en estas posiciones y el porcentaje de
tiempo que se observaron en los dominios A nativos se ilustran en la
parte inferior de la figura.
La Figura 11 representa posibles conformaciones
de multímeros comprendidos por inmuno-dominios. La
Figura 11A ilustra un multímero de
mini-anticuerpos. La Figura 11B ilustra un multímero
de anticuerpos de dominio sencillo. La Figura 11C ilustra un
multímero de inmuno-dominios de scfv. La Figura 11D
ilustra un multímero de fragmentos Fab.
La Figura 12 representa la conexión de dominios
mediante conectores parciales.
La Figura 13 ilustra formaciones de anillos
multiméricos ilustrativas.
La Figura 14 ilustra diferentes conformaciones
multiméricas de cadenas pesadas y ligeras de Fv.
\vskip1.000000\baselineskip
La invención proporciona un enfoque mejorado
para la selección y optimización de las propiedades de los dominios
monoméricos de clase A del receptor de LDL discretos para crear
multímeros. En particular, esta descripción describe métodos,
composiciones y kits para identificar dominios monoméricos de clase
A del receptor de LDL discretos que se unen a un ligando o mezcla
de ligandos deseados y crear multímeros (también conocidos como
proteínas mosaico combinatorias o proteínas mosaico recombinantes)
que comprenden dos o más dominios monoméricos y/o
inmuno-dominios que están unidos a través de un
conector. Los multímeros pueden ser escrutados para identificar
aquellos que tienen un fenotipo mejorado tal como una avidez o
afinidad mejorados o una especificidad alterada para el ligando o
la mezcla de ligandos, en comparación con el dominio monomérico
discreto.
Los dominios monoméricos pueden ser cadenas
polipeptídicas con aproximadamente 30 a aproximadamente 100
aminoácidos. De un modo similar, un dominio monomérico de la
presente invención comprende de 30 a aproximadamente 100
aminoácidos. Los dominios monoméricos y los
inmuno-dominios pueden mantener una conformación
estable en solución. La conformación estable contiene enlaces
disulfuro (p. ej., al menos dos, o tres o más enlaces disulfuro).
Los enlaces disulfuro se pueden formar opcionalmente entre dos
residuos de cisteína.
Las publicaciones que describen dominios
monoméricos y proteínas mosaico y las referencias citadas allí
incluyen las siguientes: Hegyi, H y Bork, P., On the classification
and evolution of protein modules, (1997) J. Protein Chem.,
16(5):545-551; Baron et al., Protein
modules (1991) Trends Biochem. Sci.,
16(1):13-7; Ponting et al., Evolution
of domain families, (2000), Adv. Protein Chem.,
54:185-244; Doolittle, The multiplicity of domains
in proteins, (1995) Annu. Rev. Biochem 64:287-314;
Doolitte y Bork, Evolutionarily mobile modules in proteins (1993)
Scientific American, 269 (4):50-6; y Bork, Shuffled
domains in extracellular proteins (1991), FEBS letters
286(1-2):47-54. Los dominios
monoméricos de la presente invención también incluyen aquellos
dominios encontrados en la base de datos Pfam y la base de datos
SMART. Véase Schultz, et al., SMART: una herramienta basada
en la red para el estudio de dominios móviles genéticamente, (2000)
Nucleic Acid Res. 28(1):231-34.
Los dominios monoméricos adecuados para su uso
en la práctica de la presente invención son el dominio de clase A
del receptor de LDL. La Figura 1 presenta esquemáticamente
diferentes clases de dominios monoméricos encontrados en las
moléculas de la familia del receptor de LDL.
Otros rasgos de los dominios monoméricos
incluyen la capacidad para unir ligandos (p. ej., como en el dominio
de clase A del receptor de LDL, la capacidad para unirse a un ión
(p. ej., unión a Ca^{2+} mediante el dominio A del receptor de
LDL).
Las características de un dominio monomérico
incluyen la capacidad para plegarse independientemente y la
capacidad para formar una estructura estable. De este modo, la
estructura del dominio monomérico a menudo está conservada, aunque
la secuencia de polinucleótidos que codifica el monómero no necesita
estar conservada. Por ejemplo, la estructura del dominio A está
conservada entre los miembros de la familia del dominio A, mientras
la secuencia de ácidos nucleicos del dominio A no lo está. De este
modo, por ejemplo, un dominio monomérico se clasifica como un
dominio A por sus residuos de cisteína y su afinidad por el calcio,
no necesariamente por su secuencia de ácidos nucleicos.
Véase, la Figura 2.
Específicamente, los dominios A (denominados a
veces "repeticiones de tipo complemento") contienen
aproximadamente 30-50 aminoácidos. En algunas
realizaciones, los dominios comprenden aproximadamente
35-45 aminoácidos y en algunos casos
aproximadamente 40 aminoácidos. En los 30-50
aminoácidos, existen aproximadamente 6 restos cisteína. De las seis
cisteínas, los enlaces disulfuro típicamente se encuentran entre las
siguientes cisteínas: C1 y C3, C2 y C5, C4 y C6. El dominio A
constituye un radical de unión al ligando. Los residuos de cisteína
del dominio son disulfuro conectado para formar un radical
funcionalmente independiente, estable, compacto. Véase la Figura 3.
Las agrupaciones de estas repeticiones forman un dominio de unión al
ligando, y una agrupación diferencial puede conferir especificidad
con respecto a la unión al ligando.
Las secuencias ilustrativas del dominio A y las
secuencias consenso se representan en las Figuras 2, 3 y 8. La
Figura 9 presenta la localización y aparición de residuos en los
dominios A con el siguiente espaciamiento entre cisteínas. Además,
la Figura 10 representa un número de dominios A y proporciona una
lista de aminoácidos conservados. Una secuencia consenso típica
útil para identificar dominios A es la siguiente:
C-[VILMA]-X_{(5)}-C-[DNH]-X_{(3)}-[DENQHT]-C-X_{(3,4)}-[STADE]-[DEH]-[DE]-X_{(1,5)}-C,
donde los residuos entre corchetes indican posibles residuos en una
posición. "X_{(#)}" indica el número de residuos. Estos
residuos pueden ser cualquier residuo de aminoácido. Los paréntesis
que contienen dos números hacen referencia a la gama de aminoácidos
que pueden ocupar esa posición (p. ej.,
"[DE]-X_{(1,5)}-C" significa
que los aminoácidos DE están seguidos por 1, 2, 3, 4, ó 5 residuos,
seguido por C). Esta secuencia consenso representa solamente la
porción del dominio A que comienza en la tercera cisteína. Un
segundo consenso es el siguiente:
C-X_{(3-15)}-C-X_{(4-15)}-C-X_{(6-7)}-C-[N,D]-X_{(3)}-[D,E,N,Q,H,S,T]-C-X_{(4,6)}-D-E-X_{(2-8)}-C.
El segundo consenso pronostica residuos de aminoácidos que abarcan
los seis residuos de cisteína. En algunas realizaciones, las
variantes del dominio A comprenden secuencias esencialmente
idénticas a cualquiera de las secuencias descritas antes.
Hasta la fecha, se han identificado al menos 190
dominios A humanos basándose en secuencias de ADNc. Véase, p.
ej., la Figura 10. Las proteínas ilustrativas que contienen
dominios A incluyen, p. ej., componentes del complemento (p. ej.,
C6, C7, C8, C9, y Factor I), serina proteasas (p. ej.,
enteropeptidasa, matriptasa, y corina), proteínas transmembrana (p.
ej., ST7, LRP3, LRP5 y LRP6) y receptores endocíticos (p. ej.,
receptor relacionado con Sortilina, receptor de LDL, VLDLR, LRP1,
LRP2, y ApoER2). Los dominios A y las variantes de dominios A
pueden ser fácilmente empleados en la práctica de la presente
invención como dominios monoméricos y sus variantes. Se puede
encontrar una descripción adicional de dominios A en las siguientes
publicaciones y las referencias allí citadas: Howell y Hertz, The
LDL receptor gene family: signaling functions during development,
(2001) Current Opinion in Neurobiology 11:74-81;
Herz (2001), supra; Krieger, The "best" of cholesterols,
the "worst" of cholesterols: A tale of two receptors, (1998)
PNAS 95: 4077-4080; Goldstein y Brown, The
Cholesterol Quartet, (2001) Science, 292:
1310-1312; y, Moestrup y Verroust, Megalin- and
Cubilin-Mediated Endocytosis of
Protein-Bound Vitamins, Lipids, and Hormones in
Polarized Epithelia, (2001) Ann. Rev. Nutr.
21:407-28.
Las descripciones de algunos dominios
monoméricos adicionales se pueden encontrar en las siguientes
publicaciones y en las referencias allí citadas: Yamazaki et
al., Elements of Neural Adhesion Molecules and a Yeast Vacuolar
Protein Sorting Receptor are Present in a Novel Mammalian Low
Density Lipoprotein Receptor Family Member, (1996) Journal of
Biological Chemistry 271(40) 24761-24768;
Nakayama et al., Identification of
High-Molecular-Weight Proteins with
Multiple EGF-like Motifs by
Motif-Trap Screening, (1998) Genomics
51:27-34; Liu et al, Genomic Organization of
New Candidate Tumor Suppressor Gene, LRP1B, (2000) Genomics
69:271-274; Liu et al., The Putative Tumor
Suppressor LRP1B, a Novel Member of the Low Density Lipoprotein
(LDL) Receptor Family, Exhibits Both Overlapping and Distinct
Properties with the LDL Receptor-related Protein,
(2001) Journal of Biological Chemistry
276(31):28889-28896; Ishii et al, cDNA
of a New Low-Density Lipoprotein
Receptor-Related Protein and Mapping of its Gene
(LRP3) to Chromosome Bands 19q12-q13.2, (1998)
Genomics 51:132-135; Orlando et al,
Identification of the second cluster of ligand binding repeats in
megalin as a site for receptor-ligand interactions,
(1997) PNAS USA 94:2368-2373; Jeon y Shipley,
Vesicle-reconstituted Low Density Lipoprotein
Receptor, (2000) Journal of Biological Chemistry
275(39):30458-30464; Simmons et al.,
Human Low Density Lipoprotein Receptor Fragment, (1997) Journal of
Biological Chemistry 272(41):25531-25536;
Fass et al., Molecular Basis of familial
hypercholesterolaemia from structure of LDL receptor module, (1997)
Nature 388:691-93; Daly et al.,
Three-dimensional structure of a
cysteine-rich repeat from the
low-density lipoprotein receptor, (1995) PNAS USA
92:6334-6338; North y Blacklow, Structural
Independence of Ligand-Binding Modules Five and Six
of the LDL Receptor, (1999) Biochemistry
38:3926-3935; North and Blacklow, Solution Structure
of the Sixth LDL-A module of the LDL Receptor,
(2000) Biochemistry 39:25640-2571; North y
Blacklow, Evidence that Familial Hypercholesterolemia Mutations of
the LDL Receptor Cause Limited Local Misfolding in an
LDL-A Module Pair, (2000) Biochemistry
39:13127-13135; Beglova et al., Backbone
Dynamics of a Module Pair from the Ligand-Binding
Domain of the LDL Receptor, (2001) Biochemistry
40:2808-2815; Bieri et al., Folding, Calcium
binding, and Structural Characterization of a Concatemer of the
First and Second Ligand-Binding Modules of the
Low-Density Lipoprotein Receptor, (1998)
Biochemistry 37:10994-11002; Jeon et al.,
Implications for familial hypercholesterolemia from the structure of
the LDL receptor YWTD-EGF domain pair, (2001)
Nature Structural Biology 8(6):499-504;
Kurniawan et al., NMR structure of a concatemer of the first
and second ligand-binding modules of the human
low-density lipoprotein receptor, (2000) Protein
Science 9:1282-1293; Esser et al., Mutational
Analysis of the Ligand Binding Domain of the Low Density poprotein
Receptor, (1988) Journal of Biological Chemistry
263(26):13282-13290; Russell et al.,
Different Combinations of Cysteine-rich Repeats
Mediate Binding of Low Density Lipoprotein Receptor to Two Different
Proteins, (1989) Journal of Biological Chemistry
264(36):21682-21688; Davis et al.,
Acid-dependent ligand dissociation and recycling of
LDL receptor mediated by growth factor homology region, (1987)
Nature 326:760-765; Rong et al., Conversion
of a human low-density lipoprotein receptor
ligand-binding repeat to a virus receptor:
Identification of residues important for ligand specificity, (1998)
PNAS USA 95:8467-8472; Agnello et al.,
Hepatitis C virus and other Flaviviridae viruses enter cells via
low density lipoprotein receptor; (1999) PNAS
96(22):12766-12771; Esser y Russell,
Transport-deficient Mutations in the Low Density
lipoprotein receptor, (1988) Journal of Biological Chemistry
263(26):13276-13281; Davis et al., The
Low Density Lipoprotein Receptor, (1987) Journal of Biological
Chemistry 262(9):4075-4082; y, Peacock et
al., Human Low Density Lipoprotein Receptor Expressed in
Xenopus Oocytes, (1988) Journal of Biological Chemistry
263(16):7838-7845.
Otras publicaciones que describen las proteínas
VLDLR, ApoER2 y LRP1 y sus dominios monoméricos incluyen las
siguientes así como las referencias allí citadas: Savonen et
al., The Carboxyl-terminal Domain of
Receptor-associated Protein Facilitates Proper
Folding and Trafficking of the Very Low Density Lipoprotein Receptor
by Interaction with the Three Amino-terminal
Ligand-binding Repeats of the Receptor, (1999)
Journal of Biological Chemistry
274(36):25877-25882; Hewat et al., The
cellular receptor to human rhinovirus 2 binds around the
5-fold axis and not in the canyon: a structural
view, (2000) EMBO Journal 19(23):6317-6325;
Okun et al., VLDL Receptor Fragments of Different Lengths
Bind to Human Rhinovirus HRV2 with Different Stoichiometry, (2001)
Journal of Biological Chemistry
276(2):1057-1062; Rettenberger et al.,
Ligand Binding Properties of the Very Low Density Lipoprotein
Receptor, (1999) Journal of Biological Chemistry
274(13):8973-8980; Mikhailenko et al.,
Functional Domains of the very low density lipoprotein receptor:
molecular analysis of ligand binding and
acid-dependent ligand dissociation mechanisms,
(1999) Journal of Cell Science 112:3269-3281;
Brandes et al., Alternative Splicing in the Ligand Binding
Domain of Mouse ApoE Receptor-2 Produces Receptor
Variants Binding Reelin but not
alpa2-rnacroglobulin, (2001) Journal of Biological
Chemistry 276(25):22160-22169; Kim et
al., Exon/Intron Organization, Chromosome Localization,
Alternative Splicing, and Transcription Units of the Human
Apolipoprotein E Receptor 2 Gene, (1997) Journal of Biological
Chemistry 272(13):8498-8504;
Obermoeller-McCormick et al., Dissection of
receptor folding and ligand-binding property with
functional minireceptors of LDL receptor-related
protein, (2001) Journal of Cell Science
114(5):899-908; Horn et al., Molecular
Analysis of Ligand Binding of the Second Cluster of
Complement-type Repeats of the Low Density
Lipoprotein Receptor-related Protein, (1997)
Journal of Biological Chemistry
272(21):13608-13613; Neels et al., The
Second and Fourth Cluster of Class A Cysteine-rich
Repeats of the Low Density Lipoprotein
Receptor-related Protein Share Ligand binding
Properties, (1999) Journal of Biological Chemistry
274(44):31305-31311; Obermoeller et
al., Differential Functions of the Triplicated Repeats Suggest
Two Independent Roles for the Receptor-Associated
Protein as a Molecular Chaperone, (1997) Journal of Biological
Chemistry 272(16):10761-10768; Andersen et
al., Identification of the Minimal Functional Unit in the Low
Density Lipoprotein Receptor-related Protein for
Binding the Receptor-associated Protein (RAP),
(2000) Journal of Biological Chemistry
275(28):21017-21024; Andersen et al.,
Specific Binding of alpha-Macroglobulin to
Complement-Type Repeat CR4 of the
Low-Density Lipoprotein
Receptor-Related Protein, (2000) Biochemistry
39:10627-10633; Vash et al., Three
Complement-Type Repeats of the
Low-Density Lipoprotein
Receptor-Related Protein Define a.Common Binding
Site for RAP, PAI-1, and Lactoferrin, (1998) Blood
92(9):3277-3285; Dolmer et al., NMR
Solution Structure of Complement-like Repeat CR3
from the Low Density Lipoprotein Receptor-related
Protein, (2000) Journal of Biological Chemistry
275(5):3264-3269; Huang et al., NMR
Solution Structure of Complement-like Repeat CR8
from the Low Density Lipoprotein Receptor-related
Protein, (1999) Journal of Biological Chemistry
274(20):14130-14136; y Liu et al.,
Uptake of HIV-1 Tat protein mediated by
low-density lipoprotein
receptor-related protein disrupts the neuronal
metabolic balance of the receptor ligands, (2000) Nature Medicine
6(12):1380-1387.
Otras referencias referentes a dominios
monoméricos también incluyen las siguientes publicaciones y
referencias allí citadas: FitzGerald et al, Pseudomonas
Exotoxin-mediated Selection Yields Cells with
Altered Expression of Low Density Lipoprotein
Receptor-related Protein, (1995) Journal of Cell
Biology, 129: 1533-41; Willnow y Herz, Genetic
deficiency in low density lipoprotein
receptor-related protein confers cellular resistance
to Pseudomonas exotoxin A, (1994) Journal of Cell Science,
107:719-726; Trommsdorf et al., Interaction
of Cytosolic Adaptor Proteins with Neuronal Apolipoprotein E
Receptors and the Amyloid Precursor Protein, (1998) Journal of
Biological Chemistry, 273(5): 33556-33560;
Stockinger et al., The Low Density Lipoprotein Receptor Gene
Family, (1998) Journal of Biological Chemistry, 273(48):
32213-32221; Obermoeller et al., Ca+2 and
Receptor-associated Protein are independently
required for proper folding and disulfide bond formation of the low
density lipoprotein receptor-related protein,
(1998) Journal of Biological Chemistry,
273(35):22374-22381; Sato et al.,
39-kDa receptor-associated protein
(RAP) facilitates secretion and ligand binding of extracellular
region of
very-low-density-lipoprotein
receptor: implications for a distinct pathway from
low-density-lipoprotein receptor,
(1999) Biochem. J., 341:377-383; Avromoglu et
al, Functional Expression of the Chicken Low Density Lipoprotein
Receptor-related Protein in a mutant Chinese
Hamster Ovary Cell Line Restores Toxicity of Pseudomonas Exotoxin A
and Degradation of alpha2 Macroglobulin, (1998) Journal of
Biological Chemistry, 273(11) 6057-6065;
Kingsley y Krieger, Receptor-mediated endocytosis
of low density lipoprotein: Somatic cell mutants define multiple
genes required for expression of surface-receptor
activity, (1984) PNAS USA, 81:5454-5458; Li et
al, Differential Functions of Members of the Low Density
Lipoprotein Receptor Family Suggests by their distinct endocystosis
rates, (2001) Journal of Biological Chemistry
276(21):18000-18006; y, Springer, An
Extracellular beta-Propeller Module Predicted in
Lipoprotein and Scavenger Receptors, Tyrosine Kinases, Epidermal
Growth Factor Precursor, and Extracellular Matrix Components,
(1998) J. Mol. Biol. 283:837-862.
Los polinucleótidos (también referidos como
ácidos nucleicos) que codifican los dominios monoméricos se emplean
típicamente para elaborar dominios monoméricos a través de su
expresión. Los ácidos nucleicos que codifican dominios monoméricos
pueden ser obtenidos de una variedad de fuentes diferentes. Las
genotecas de dominios monoméricos pueden ser preparadas expresando
una pluralidad de ácidos nucleicos diferentes que codifican dominios
monoméricos de origen natural, dominios monoméricos alterados (esto
es, variantes de dominios monoméricos), o sus combinaciones.
La invención proporciona métodos de
identificación de dominios monoméricos que se unen a un ligando
seleccionado o deseado o una mezcla de ligandos. En algunas
realizaciones, los dominios monoméricos y/o
inmuno-dominios se identifican o seleccionan con
respecto a una propiedad deseada (p. ej., afinidad de unión) y
después los dominios monoméricos y/o
inmuno-dominios forman multímeros. Véase, p.
ej., la Figura 5. Para esas realizaciones, se puede utilizar
cualquier método que de como resultado la selección de dominios con
una propiedad deseada (p. ej., una propiedad de unión específica).
Por ejemplo, los métodos pueden comprender proporcionar una
pluralidad de ácidos nucleicos diferentes, codificando cada ácido
nucleico un dominio monomérico; traducir la pluralidad de ácidos
nucleicos diferentes, proporcionando de ese modo una pluralidad de
dominios monoméricos diferentes; escrutar la pluralidad de dominios
monoméricos diferentes en busca de la unión al ligando o la mezcla
de ligandos deseados; e, identificar miembros de la pluralidad de
dominios monoméricos diferentes que se unen al ligando o mezcla de
ligandos deseados.
Como se ha mencionado antes, los dominios
monoméricos pueden ser de origen natural o alterado (variantes no
naturales). El término "de origen natural" se utiliza en la
presente memoria para indicar que un objeto puede ser encontrado en
la naturaleza. Por ejemplo, los dominios monoméricos naturales
pueden incluir dominios monoméricos humanos u opcionalmente,
dominios derivados de diferentes especies o fuentes, p. ej.,
mamíferos, primates, roedores, peces, pájaros, reptiles, plantas,
etc. Los dominios monoméricos de origen natural pueden ser obtenidos
mediante numerosos métodos, p. ej., mediante amplificación por PCR
del ADN genómico o el ADNc.
Los dominios monoméricos de la presente
invención pueden ser dominios de origen natural o variantes de
origen no natural. Las genotecas de dominios monoméricos empleadas
en la práctica de la presente invención pueden contener dominios
monoméricos de origen natural, variantes de dominios monoméricos de
origen no natural, o una de sus combinaciones.
Las variantes de dominios monoméricos pueden
incluir dominios ancestrales, dominios quiméricos, dominios al
azar, dominios mutados, y similares. Por ejemplo, los dominios
ancestrales se pueden basar en el análisis filogenético. Los
dominios quiméricos son dominios en los cuales una o más regiones
son remplazadas por las regiones correspondientes de otros dominios
de la misma familia. Los dominios al azar son dominios en los
cuales una o más regiones se han aleatorizado. La aleatorización se
puede basar en una aleatorización completa, u, opcionalmente, una
aleatorización parcial basada en la distribución natural.
Los dominios monoméricos no naturales o los
dominios monoméricos alterados se pueden producir mediante numerosos
métodos. Se puede utilizar cualquier método de mutagénesis, tal
como la mutagénesis dirigida al sitio y la mutagénesis al azar (p.
ej., mutagénesis química) para producir variantes. En algunas
realizaciones, se emplea la PCR propensa a errores para crear
variantes. Los métodos adicionales incluyen el alineamiento de una
pluralidad de dominios monoméricos de origen natural alineando
aminoácidos conservados en la pluralidad de dominios monoméricos de
origen natural; y, diseñando el dominio monomérico de origen no
natural mediante el mantenimiento de los aminoácidos conservados e
insertando, suprimiendo o alterando los aminoácidos en torno a los
aminoácidos conservados para generar el dominio monomérico de
origen no natural. En una realización, los aminoácidos conservados
comprenden cisteínas. En otra realización, la etapa de inserción
utiliza aminoácidos al azar, u opcionalmente, la etapa de inserción
utiliza porciones de los dominios monoméricos de origen natural. Los
aminoácidos pueden ser insertados sintéticamente o pueden ser
codificados por un ácido nucleico.
Los ácidos nucleicos que codifican fragmentos de
los dominios monoméricos de origen natural y/o los
inmuno-dominios también se pueden mezclar y/o
recombinar (p. ej., utilizando fragmentos producidos químicamente o
enzimáticamente) para generar dominios monoméricos y/o
inmuno-dominios modificados, completos. Los
fragmentos y el dominio monomérico también pueden ser recombinados
manipulando los ácidos nucleicos que codifican los dominios o sus
fragmentos. Por ejemplo, se puede utilizar la ligación de un
constructo de ácido nucleico que codifica fragmentos del dominio
monomérico para generar un dominio monomérico alterado.
Los dominios monoméricos alterados también
pueden ser generados proporcionando una colección de
oligonucleótidos sintéticos (p. ej., oligonucleótidos solapantes)
que codifican una secuencia conservada, al azar, al
pseudo-azar, o definida de secuencias peptídicas
que después son insertadas mediante ligación en un sitio
predeterminado en un polinucleótido que codifica un dominio
monomérico. De un modo similar, la diversidad de secuencia de uno o
más dominios monoméricos puede ser ampliada mutando el dominios o
los dominios monoméricos mediante mutagénesis dirigida al sitio,
mutación al azar, mutación al pseudo-azar, mutación
kernal definida, mutación basada en codones, y similares. Las
moléculas de ácido nucleico resultantes pueden ser propagadas en un
anfitrión para la clonación y amplificación. Los ácidos nucleicos
pueden ser barajados.
Adicionalmente se describe en la presente
memoria un método para recombinar una pluralidad de ácidos nucleicos
que codifican dominios monoméricos y escrutar la genoteca
resultante en busca de dominios monoméricos que se unen al ligando
o mezcla de ligandos deseados o similar. Los ácidos nucleicos de
dominios monoméricos seleccionados también pueden ser
retro-cruzados mediante barajado con secuencias de
polinucleótido que codifican secuencias neutras (esto es, que
tienen un efecto funcional insustancial sobre la unión), tal como
por ejemplo, mediante retro-cruzamiento con una
secuencia de tipo salvaje o de origen natural esencialmente idéntica
a una secuencia seleccionada para producir dominios monoméricos
funcionales de tipo nativo. Generalmente, durante el
retro-cruzamiento, se aplica la selección posterior
para conservar la propiedad, p. ej., la unión al ligando.
Como se describe en la presente memoria la
biblioteca de monómeros puede ser preparada mediante barajado. En
tal caso, los dominios monoméricos se aíslan y se barajan para
recombinar combinatoriamente las secuencias de ácido nucleico que
codifican los dominios monoméricos (la recombinación se puede
producir entre o en los dominios monoméricos, o ambos). La primera
etapa implica identificar un dominio monomérico que tenga la
propiedad deseada, p. ej., afinidad por un cierto ligando. Si bien
durante la recombinación se mantienen los aminoácidos conservados,
las secuencias de ácido nucleico que codifican los dominios
monoméricos se pueden recombinar, o recombinar y unir en
multímeros.
La selección de dominios monoméricos y/o
inmuno-dominios a partir de una biblioteca de
dominios se puede completar mediante una variedad de
procedimientos. Por ejemplo, un método de identificación de dominios
monoméricos y/o inmuno-dominios que tienen una
propiedad deseada implica traducir una pluralidad de ácidos
nucleicos, donde cada ácido nucleico codifica un dominio monomérico
y/o inmuno-dominio, escrutar los polipéptidos
codificados por la pluralidad de ácidos nucleicos, e identificar
esos dominios monoméricos y/o inmuno-dominios que,
p. ej., se unen a un ligando o una mezcla de ligandos deseados,
produciendo de ese modo un dominio monomérico y/o
inmuno-dominio seleccionado. Los dominios
monoméricos y/o inmuno-dominios expresados por cada
uno de los ácidos nucleicos pueden ser sometidos a ensayo en busca
de su capacidad para unirse al ligando mediante métodos conocidos
en la técnica (esto es, inmunopurificación, cromatografía de
afinidad, análisis FACS).
Como se ha mencionado antes, la selección de los
dominios monoméricos y/o inmuno-dominios se puede
basar en la unión a un ligando tal como una proteína diana u otra
molécula diana (p. ej., lípido, carbohidrato, ácido nucleico y
similares). Otras moléculas pueden ser incluidas opcionalmente en
los métodos junto con la diana, p. ej., iones tales como Ca^{+2}.
El ligando puede ser un ligando conocido, p. ej., un ligando que se
sabe que se une a uno de una pluralidad de dominios monoméricos, o
p. ej., el ligando deseado puede ser un ligando de un dominio
monomérico desconocido. Véase, p. ej., la Figura 4, que
ilustra algunos de los ligandos que se unen al dominio A. Otras
selecciones de dominios monoméricos y/o
inmuno-dominios se pueden basar, p. ej., en la
inhibición o potenciación de una función específica de una proteína
diana o una actividad. La actividad de la proteína diana puede
incluir, p. ej., endocitosis o internalización, inducción del
sistema del segundo mensajero, regulación al alza o regulación a la
baja de un gen, unión a una matriz extracelular, liberación de una
o varias moléculas, o un cambio en la conformación. En este caso, no
se necesita que el ligando sea conocido. La selección también puede
incluir el uso de análisis de alto rendimiento.
Cuando un dominio monomérico y/o
inmuno-dominio se selecciona basándose en su
capacidad para unirse a un ligando, el fundamento de selección
puede incluir la selección basada en una tasa de disociación lenta,
que normalmente es predictiva de una elevada afinidad. La valencia
del ligando también se puede variar para controlar la afinidad de
unión media de los dominios monoméricos y/o
inmuno-dominios seleccionados. El ligando se puede
unir a una superficie o sustrato a densidades variables, por
ejemplo incluyendo un compuesto competidor, mediante dilución, o
mediante otro método conocido por los expertos en la técnica. Se
puede utilizar una elevada densidad (valencia) de ligando
predeterminado para enriquecer en dominios monoméricos que tengan
una afinidad relativamente baja, mientras una densidad baja
(valencia) se puede enriquecer preferentemente en dominios
monoméricos de afinidad superior.
Se pueden utilizar una variedad de vectores de
presentación informadores para expresar ácidos nucleicos que
codifican los dominios monoméricos, inmuno-dominios
y/o multímeros de la presente invención y para someter a ensayo una
actividad deseada. Por ejemplo, un sistema de presentación en fagos
es un sistema en el cual se expresan dominios monoméricos como
proteínas de fusión sobre la superficie de fagos (Pharmacia,
Milwaukee Wis.). La presentación en fagos puede implicar la
presentación de una secuencia polipeptídica que codifique dominios
monoméricos y/o inmuno-dominios sobre la superficie
de un bacteriófago filamentoso, típicamente como una fusión con una
proteína de la envoltura del bacteriófago.
Generalmente en estos métodos, cada partícula de
fago o célula sirve como un miembro de una genoteca individual que
presenta una única especie de polipéptido presentado además de las
secuencias de proteínas del fago natural o célula. La pluralidad de
ácidos nucleicos se clona en el ADN del fago en un sitio que da como
resultado la transcripción de una proteína de fusión, una porción
de la cual está codificada por la pluralidad de ácidos nucleicos.
El fago que contiene una molécula de ácido nucleico experimenta
replicación y transcripción en la célula. La secuencia líder de la
proteína de fusión dirige el transporte de la proteína de fusión
hacia la punta de la partícula del fago. De este modo, la proteína
de fusión que está parcialmente codificada por el ácido nucleico es
presentada sobre la partícula del fago para la detección y selección
mediante los métodos descritos más arriba y más abajo. Por ejemplo,
la genoteca de fagos se puede incubar con un ligando predeterminado
(deseado), de manera que las partículas de fago que presentan una
secuencia de una proteína de fusión que se une al ligando se puedan
separar diferencialmente de aquellas que no presenten secuencias
polipeptídicas que se unan al ligando predeterminado. Por ejemplo,
la separación se puede proporcionar inmovilizando el ligando
predeterminado. Las partículas de fago (esto es, los miembros de la
genoteca) que se unen al ligando inmovilizado son recuperadas
después y replicadas para amplificar la subpoblación de fagos
seleccionados para una ronda subsiguiente de enriquecimiento de
afinidad y replicación de fagos. Después de varias rondas de
enriquecimiento de afinidad y replicación de fagos, los miembros de
la genoteca de fagos que se seleccionan de este modo se aíslan y la
secuencia de nucleótidos que codifica la secuencia de polipéptidos
presentada se determina, identificando de ese modo la secuencia o
las secuencias de polipéptidos que se unen al ligando
predeterminado. Tales métodos se describen adicionalmente en las
publicaciones de patentes PCT Núms. 91/17271, 91/18980, y 91/19818 y
93/08278.
Los ejemplos de otros sistemas de presentación
incluyen presentaciones en ribosomas, una presentación ligada a
nucleótidos (véanse, p. ej., las Patentes de los Estados
Unidos Núms. 6.281.344; 6.194.550, 6.207.446, 6.214.553, y
6.258.558), presentaciones en superficies celulares y similares. Las
presentaciones en superficies celulares incluyen una variedad de
células, p. ej., células de E. coli, levadura y/o mamífero.
Cuando se utiliza una célula como presentación, los ácidos
nucleicos, p. ej., obtenidos mediante amplificación por PCR seguida
de digestión, son introducidos en la célula y traducidos.
Opcionalmente, los polipéptidos que codifican los dominios
monoméricos o los multímeros de la presente invención pueden ser
introducidos, p. ej., mediante inyección, en la célula.
La invención también incluye composiciones que
son producidas mediante los métodos de la presente invención. Por
ejemplo, la presente invención incluye dominios monoméricos
seleccionados o identificados a partir de una genoteca y/o
genotecas que comprenden dominios monoméricos producidos mediante
los métodos de la presente invención.
La presente invención también proporciona
bibliotecas de dominios monoméricos. Las bibliotecas pueden incluir,
p. ej., aproximadamente 100, 250, 500 dominios monoméricos, o la
biblioteca puede incluir, p. ej., aproximadamente 100, 250, 500 o
más polipéptidos que codifican dominios monoméricos. Las bibliotecas
pueden incluir dominios monoméricos que contienen el mismo marco de
cisteínas, p. ej., dominios A.
Como se describe en la presente memoria, las
genotecas se pueden escrutar en busca de una propiedad deseada tal
como la unión de un ligando o una mezcla de ligandos deseados. Por
ejemplo, los miembros de la biblioteca de dominios monoméricos se
pueden presentar y pre-escrutar en busca de la unión
a un ligando o mezcla de ligandos conocidos o desconocidos. Las
secuencias de los dominios monoméricos se pueden mutagenizar después
(p. ej., recombinar, alterar químicamente, etc.) o alterar de otro
modo y los nuevos dominios monoméricos se pueden escrutar de nuevo
en busca de la unión al ligando o la mezcla de ligandos con una
afinidad mejorada. Los dominios monoméricos seleccionados se pueden
combinar o unir para formar multímeros, que después se pueden
escrutar en busca de una afinidad o avidez mejoradas o una
especificidad alterada para el ligando o la mezcla de ligandos. La
especificidad alterada puede significar que la especificidad se
amplía, p. ej., unión de múltiples virus relacionados, u
opcionalmente la especificidad alterada puede significar que la
especificidad se estrecha, p. ej., la unión en una región
específica de un ligando. Los expertos en la técnica reconocerán que
hay varios métodos disponibles para calcular la avidez. Véanse,
p. ej., Mammen et al., Angew Chem Int. Ed.
37:2754-2794 (1998); Muller et al., Anal.
Biochem. 261:149-158
(1998).
(1998).
Los expertos en la técnica reconocerán que las
etapas de generación de la variación y el escrutinio en busca de
una propiedad deseada se pueden repetir (esto es, realizar
recursivamente) para optimizar los resultados. Por ejemplo, en una
genoteca de presentación en fagos u otro formato similar, se puede
realizar un primer escrutinio de una genoteca con una restricción
relativamente inferior, seleccionando de ese modo tantas partículas
asociadas con una molécula diana como sea posible. Las partículas
seleccionadas se pueden aislar después y los polinucleótidos que
codifican el monómero o multímero se pueden aislar de las
partículas. Después se pueden generar variaciones adicionales
partir de estas secuencias y con posterioridad rastrear a una
afinidad superior. La Figura 7 ilustra un ciclo genérico de
selección y generación de la variación.
Los polipéptidos de las composiciones están
incluidos en la presente invención. Por ejemplo, la presente
invención proporciona una pluralidad de ácidos nucleicos diferentes
donde cada ácido nucleico codifica al menos dos dominios
monoméricos de clase A del receptor de LDL.
Los métodos para generar multímeros son un rasgo
de la presente invención. Los multímeros comprenden al menos dos
dominios monoméricos de la clase A de los receptores de LDL. Por
ejemplo, los multímeros de la invención pueden comprender de 2 a
aproximadamente 10 dominios monoméricos y/o
inmuno-dominios, de 2 y aproximadamente 8 dominios
monoméricos y/o inmuno-dominios, de aproximadamente
3 y aproximadamente 10 dominios monoméricos y/o
inmuno-dominios, aproximadamente 7 dominios
monoméricos y/o inmuno-dominios, aproximadamente 6
dominios monoméricos y/o inmuno-dominios,
aproximadamente 5 dominios monoméricos y/o
inmuno-dominios, o aproximadamente 4 dominios
monoméricos y/o inmuno-dominios. En algunas
realizaciones, el multímero comprende al menos 3 dominios
monoméricos y/o inmuno-dominios. Típicamente, los
dominios monoméricos han sido pre-seleccionados
para la unión a la molécula diana de interés.
En algunas realizaciones, cada dominio
monomérico se une específicamente a una molécula diana. En algunas
de estas realizaciones, cada monómero se une a una posición
diferente (análoga a un epítopo) de una molécula diana. Múltiples
dominios monoméricos y/o inmuno-dominios que se unen
a la misma molécula diana dan como resultado un efecto sobre la
avidez que produce una mejora de la avidez del multímero por la
molécula diana en comparación con cada monómero individual. En
algunas realizaciones, el multímero tiene una avidez de al menos
aproximadamente 1,5, 2, 3, 4, 5, 10, 20, 50 o 100 veces la avidez
de un dominio monomérico solo.
En otra realización, el multímero comprende
dominios monoméricos con especificidades para diferentes moléculas
diana. Por ejemplo, los multímeros de tales dominios monoméricos
diversos se pueden unir específicamente a componentes de un sistema
de replicación viral o diferentes serotipos de un virus. En algunas
realizaciones, al menos un dominio monomérico se une a una toxina y
al menos un dominio monomérico se une a una molécula de la
superficie celular, actuando de ese modo como un mecanismo para
dirigir la toxina. En algunas realizaciones, al menos dos dominios
monoméricos y/o inmuno-dominios del multímero se
unen a moléculas diana diferentes en una célula o tejido diana. De
un modo similar, las moléculas terapéuticas pueden ser dirigidas a
la célula o tejido uniendo un agente terapéutico a un monómero que
también contiene otros dominios monoméricos y/o
inmuno-dominios que tienen especificidad de unión a
la célula o tejido.
Los multímeros pueden comprender una variedad de
combinaciones de dominios monoméricos. Por ejemplo, en un único
multímero, los dominios monoméricos seleccionados pueden ser iguales
o idénticos, opcionalmente, diferentes o no idénticos. Además, los
dominios monoméricos seleccionados pueden comprender varios dominios
monoméricos diferentes de la misma familia de dominios monoméricos,
o varios dominios monoméricos de diferentes familias de dominios, u
opcionalmente, una combinación de ambos.
Los multímeros que se generan en la práctica de
la presente invención pueden ser cualquiera de los siguientes:
- (1)
- Un homo-multímero (un multímero del mismo dominio, esto es, A1-A1-A1-A1);
- (2)
- Un hetero-multímero de diferentes dominios de la misma clase de dominios, p. ej., A1-A2-A3-A4. Por ejemplo, el hetero-multímero incluye multímeros en los que A1, A2, A3 y A4 son diferentes variantes de origen no natural de un dominio de clase A del receptor de LDL concreto, o donde algunos de A1, A2, A3, y A4 son variantes de origen natural de un dominio de clase A del receptor de LDL (véase, p. ej., la Figura 10).
Las bibliotecas de multímeros empleadas en la
práctica de la presente invención pueden contener
homo-multímeros, hetero-multímeros
de diferentes dominios monoméricos (naturales o no naturales) de los
dominios de clase A del receptor de LDL.
Los dominios no necesitan ser seleccionados
antes de que los dominios se unan para formar multímeros. Por otra
parte, los dominios pueden ser seleccionados en busca de su
capacidad para unirse a una molécula diana antes de unirse en
multímeros. De este modo, por ejemplo, un multímero puede comprender
dos dominios que se unen a una molécula diana y un tercer dominio
que se une a una segunda molécula diana.
Los dominios monoméricos seleccionados se unen
por medio de un conector para formar un multímero. Por ejemplo, se
coloca un conector entre cada dominio monomérico separado discreto
en un multímero.
La unión de los dominios monoméricos
seleccionados por medio de un conector se puede completar utilizando
una variedad de mecanismos conocidos en la técnica. Por ejemplo, el
ensamblaje combinatorio de los polinucleótidos que codifican los
dominios monoméricos seleccionados se puede lograr mediante ligación
de ADN, u opcionalmente, mediante reacciones de solapamiento de
auto-cebado basadas en PCR. El conector puede ser
anclado a un monómero antes de que el monómero sea identificado por
su capacidad para unirse a un multímero diana o después de que el
monómero haya sido seleccionado por su capacidad para unirse a un
multímero diana.
El conector puede ser de origen natural,
sintético o una combinación de ambos. Por ejemplo, el conector
sintético puede ser un conector aleatorizado, p. ej., tanto en
secuencia como en tamaño. En un aspecto, el conector aleatorizado
puede comprender una secuencia completamente aleatorizada, u
opcionalmente, el conector aleatorizado se puede basar en
secuencias conectoras naturales. El conector puede comprender, p.
ej. un radical no peptídico, un polinucleótido, un polipéptido o
similar.
Un conector puede ser rígido, o
alternativamente, flexible, o una combinación de ambos. La
flexibilidad del conector puede ser una función de la composición
tanto del conector como de los dominios monoméricos con los cuales
interacciona el conector. El conector une dos dominios monoméricos
seleccionados, y mantiene los dominios monoméricos como dominios
monoméricos separados discretos. El conector puede permitir que los
dominios monoméricos separados discretos cooperen aunque mantengan
sus propiedades separadas tales como múltiples sitios de unión
separados para el mismo ligando en un multímero, o p. ej., múltiples
sitios de unión separados para diferentes ligandos en un
multímero.
La elección de un conector adecuado para un caso
específico en el que dos o más dominios monoméricos (esto es
cadenas polipeptídicas) van a ser conectados puede depender de una
variedad de parámetros incluyendo, p. ej. la naturaleza de los
dominios monoméricos, la estructura y naturaleza de la diana a la
cual se debe unir el multímero polipeptídico y/o la estabilidad del
conector peptídico hacia la proteolisis y la oxidación.
La presente invención proporciona métodos para
optimizar la elección del conector una vez que se han identificado
los dominios monoméricos/variantes deseados. Generalmente, las
bibliotecas de multímeros que tienen una composición que es fija
con respecto a la composición de dominios monoméricos, pero variable
en la composición y longitud del conector, se puede preparar
fácilmente y escrutar como se ha descrito antes.
Típicamente, el polipéptido conector puede
incluir predominantemente residuos de aminoácido seleccionados del
grupo que consiste en Gly, Ser, Ala y Thr. Por ejemplo, el conector
peptídico puede contener al menos 75% (calculado basándose en el
número total de residuos del conector peptídico), por ejemplo al
menos 80%, p. ej. al menos 85% o al menos 90% de residuos de
aminoácido seleccionados del grupo que consiste en Gly, Ser, Ala y
Thr. El conector peptídico también puede consistir en residuos de
Gly, Ser, Ala y/o Thr solamente. El polipéptido conector debe tener
una longitud, que sea adecuada para conectar dos dominios
monoméricos de tal manera que adopten entre sí la conformación
relativa correcta de forma que conserven la actividad deseada, por
ejemplo como antagonistas de un receptor dado.
Una longitud adecuada para este propósito es una
longitud de al menos uno y típicamente menos de aproximadamente 50
residuos de aminoácido, tal como 2-25 residuos de
aminoácido, 5-20 residuos de aminoácido,
5-15 residuos de aminoácido, 8-12
residuos de aminoácido u 11 residuos. De un modo similar, el
polipéptido que codifica un conector puede oscilar en tamaño, p.
ej., de aproximadamente 2 a aproximadamente 15 aminoácidos, de
aproximadamente 3 a aproximadamente 15, de aproximadamente 4 a
aproximadamente 12, aproximadamente 10, aproximadamente 8, o
aproximadamente 6 aminoácidos. En los métodos y composiciones que
implican ácidos nucleicos, tales como ADN, ARN, o combinaciones de
ambos, el polinucleótido que contiene la secuencia conectora puede
tener, p. ej., entre aproximadamente 6 nucleótidos y
aproximadamente 45 nucleótidos, entre aproximadamente 9 nucleótidos
y aproximadamente 45 nucleótidos, entre aproximadamente 12
nucleótidos y aproximadamente 36 nucleótidos, aproximadamente 30
nucleótidos, aproximadamente 24 nucleótidos, o aproximadamente 18
nucleótidos. Del mismo modo, los residuos de aminoácido
seleccionados para la inclusión en el polipéptido conector deben
mostrar propiedades que no interfieran significativamente en la
actividad o función del multímero polipeptídico. De este modo, el
conector peptídico no debe mostrar en general, una carga que no
concuerde con la actividad o función del multímero polipeptídico, o
interfiera en el plegamiento interno, o forme enlaces u otras
interacciones con residuos de aminoácido en uno o más de los
dominios monoméricos que pudieran impedir gravemente la unión del
multímero polipeptídico a la diana en cuestión.
Como se describe en la presente memoria, el
conector peptídico se selecciona de una biblioteca en la que los
residuos de aminoácido del conector peptídico están aleatorizados
para un grupo específico de dominios monoméricos en un multímero
polipeptídico concreto. Se podría utilizar un conector flexible para
encontrar combinaciones adecuadas de dominios monoméricos, que
después se optimiza utilizando esta biblioteca al azar de conectores
variables para obtener conectores con una longitud y geometría
óptimas. Los conectores óptimos pueden contener el número mínimo de
residuos de aminoácido del tipo correcto que participan en la unión
a la diana y restringir el movimiento relativo de los dominios
monoméricos entre sí en el multímero polipeptídico cuando no está
unido a la
diana.
diana.
El uso de conectores peptídicos de origen
natural así como artificiales para conectar polipéptidos en
polipéptidos de fusión conectados novedosos es bien conocido en la
bibliografía (Hallewell et al. (1989), J. Biol. Chem. 264,
5260-5268; Alfthan et al. (1995), Protein
Eng. 8, 725-731; Robinson & Sauer (1996),
Biochemistry 35, 109-116; Khandekar et al.
(1997), J. Biol. Chem. 272, 32190-32197; Fares et
al. (1998), Endocrinology 139,2459-2464;
Smallshaw et al. (1999), Protein Eng. 12,
623-630; US 5,856,456).
Un ejemplo en el que el uso de conectores
peptídicos es amplio es para la producción de anticuerpos de cadena
sencilla en los que las regiones variables de una cadena ligera
(V_{L}) y una cadena pesada (V_{H}) están unidas por un
conector artificial, y existe un gran número de publicaciones sobre
este campo concreto. Un conector peptídico ampliamente utilizado es
un péptido de 15 unidades que consiste en tres repeticiones de una
secuencia de aminoácidos
Gly-Gly-Gly-Gly-Ser
((Gly_{4}Ser)_{3}). Se han utilizado otros conectores y
se han utilizado la tecnología de presentación en fagos así como la
tecnología de fagos infectivos selectivos para diversificar y
seleccionar secuencias conectoras apropiadas (Tang et al.
(1996), J. Biol. Chem. 271, 15682-15686; Hennecke
et al. (1998), Protein Eng. 11, 405-410). Se
han utilizado conectores peptídicos para conectar cadenas
individuales en proteínas hetero- y homo-diméricas
tales como el receptor de las células T, el represor Cro de lambda,
el represor Arc del fago P22, IL-12, TSH, FSH,
IL-5, y el interferón-\gamma.
También se han empleado conectores peptídicos para crear
polipéptidos de fusión. Se han utilizado diferentes conectores y en
el caso del represor Arc, se ha utilizado la presentación en fagos
para optimizar la longitud del conector y la composición para un
aumento de la estabilidad de la proteína de cadena sencilla
(Robinson y Sauer (1998), Proc. Natl. Acad. Sci. USA 95,
5929-5934).
Otro tipo de conector es una inteína, esto es,
un tramo peptídico que es expresado con el polipéptido de cadena
sencilla, pero separado post-traduccionalmente
mediante empalme de proteínas. El uso de inteínas es revisado por
F.S. Gimble en Chemistry and Biology, 1998, Vol 5, Núm. 10 págs.
251-256.
Otro modo más de obtener un conector adecuado es
mediante la optimización de un conector simple, p. ej.
(Gly_{4}Ser)_{n}, por medio de mutagénesis al azar.
Como se ha mencionado antes, generalmente se
prefiere que el conector peptídico posea al menos cierta
flexibilidad. Por consiguiente, en algunas realizaciones, el
conector peptídico contiene 1-25 residuos de
glicina, 5-20 residuos de glicina,
5-15 residuos de glicina o 8-12
residuos de glicina. El péptido conector contendrá típicamente al
menos 50% de residuos de glicina, por ejemplo al menos 75% de
residuos de glicina. El conector peptídico puede comprender
solamente residuos de glicina.
El conector peptídico puede, además de residuos
de glicina, comprender otros residuos, en particular residuos
seleccionados del grupo que consiste en Ser, Ala y Thr, en
particular Ser. De este modo, un ejemplo de un conector peptídico
específico incluye un conector peptídico que tiene la secuencia de
aminoácidos
Gly_{x}-Xaa-Gly_{y}-Xaa-Gly_{z},
donde cada Xaa se selecciona independientemente del grupo que
consiste en Ala, Val, Leu, Ile, Met, Phe, Trp, Pro, Gly, Ser, Thr,
Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu, y donde cada uno de x,
y y z son números enteros en el intervalo de 1-5.
En algunas realizaciones, cada Xaa se selecciona independientemente
del grupo que consiste en Ser, Ala y Thr, en particular Ser. Más
concretamente, el conector peptídico tiene la secuencia de
aminoácidos
Gly-Gly-Gly-Xaa-Gly-Gly-Gly-Xaa-Gly-Gly-Gly,
donde cada Xaa se selecciona independientemente del grupo que
consiste en Ala, Val, Leu, Ile, Met, Phe, Trp, Pro, Gly, Ser, Thr,
Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu. Como se describe en
la presente memoria, cada Xaa se puede seleccionar
independientemente del grupo que consiste en Ser, Ala y Thr, en
particular Ser.
En algunos casos puede ser deseable o necesario
proporcionar cierta rigidez al conector peptídico. Esto se puede
completar incluyendo residuos de prolina en la secuencia de
aminoácidos del conector peptídico. De este modo, el conector
peptídico puede comprender al menos un residuo de prolina en la
secuencia de aminoácidos del conector peptídico. Por ejemplo, el
conector peptídico tiene una secuencia de aminoácidos, donde al
menos 25%, por ejemplo al menos 50%, p. ej. al menos 75%, de los
residuos de aminoácido son residuos de prolina. Como se describe en
la presente memoria, el conector peptídico comprende solamente
residuos de prolina.
Asimismo se describen en la presente memoria
conectores peptídicos modificados de tal manera que se introduce un
residuo de aminoácido que comprende un grupo de anclaje para un
radical no polipeptídico. Los ejemplos de tal residuo de aminoácido
pueden ser un residuo de cisteína (al cual se ancla con
posterioridad el radical no polipeptídico) o la secuencia de
aminoácidos puede incluir un sitio de
N-glicosilación in vivo (anclando de ese
modo un radical azúcar (in vivo) al conector peptídico).
El conector peptídico puede comprender al menos
un residuo de cisteína, tal como un residuo de cisteína. De este
modo, en algunas realizaciones de la invención el conector peptídico
comprende residuos de aminoácido seleccionados del grupo que
consiste en Gly, Ser, Ala, Thr y Cys. Semejante conector peptídico
puede comprender solamente un residuo de cisteína.
El conector peptídico descrito en la presente
memoria puede comprender residuos de glicina y residuos de cisteína,
por ejemplo solamente residuos de glicina y residuos de cisteína.
Típicamente, se puede incluir sólo un residuo de cisteína por
conector peptídico. De este modo, un ejemplo de un conector
peptídico específico que comprende un residuo de cisteína, incluye
un conector peptídico que tiene la secuencia de aminoácidos
Gly_{n}-Cys-Gly_{m}, donde n y
m son cada uno números enteros de 1-12, p. ej., de
3-9, de 4-8, o de
4-7. Más concretamente, el conector peptídico puede
tener la secuencia de aminoácidos
GGGGG-C-GGGGG.
Este enfoque (esto es la introducción de un
residuo de aminoácido que comprende un grupo de anclaje para un
radical no polipeptídico) también se puede utilizar para los
conectores que contienen prolina más rígida. Por consiguiente, el
conector peptídico puede comprender residuos de prolina y cisteína,
tal como residuos de prolina y cisteína solamente. Un ejemplo de un
conector peptídico que contiene prolina específico que comprende un
residuo de cisteína, incluye un conector peptídico que tiene la
secuencia de aminoácidos
Pro_{n}-Cys-Pro_{m}, donde n y
m son cada uno números enteros de 1-12,
preferiblemente de 3-9, por ejemplo de
4-8 o de 4-7. Más concretamente, el
conector peptídico puede tener la secuencia de aminoácidos
PPPPP-C-PPPPP.
El propósito de introducir un residuo de
aminoácido, tal como un residuo de cisteína, que comprende un grupo
de anclaje para un radical no polipéptido es anclar con
posterioridad un radical no polipeptídico a dicho residuo. Por
ejemplo, los radicales no polipeptídicos pueden mejorar la vida
media en suero del multímero polipeptídico. De este modo, el
residuo de cisteína se puede anclar covalentemente a un radical no
polipeptídico. Los ejemplos preferidos de los radicales no
polipeptídios incluyen moléculas poliméricas, tales como PEG o
mPEG, en particular mPEG así como agentes terapéuticos no
polipeptídicos.
El experto reconocerá que se pueden utilizar
otros residuos de aminoácido distintos de cisteína para anclar un
no polipéptido al conector peptídico. Un ejemplo concreto de tales
otros residuos incluye el acoplamiento del radical no polipeptídico
a un residuo de lisina.
Otra posibilidad de introducir un grupo de
anclaje específico del sitio para un radical no polipeptídico en el
conector peptídico es la introducción de un sitio de
N-glicosilación in vivo, tal como un sitio de
N-glicosilación in vivo, en el conector
peptídico. Por ejemplo, se puede introducir un sitio de
N-glicosilación in vivo en un conector
peptídico que comprende residuos de aminoácido seleccionados del
grupo que consiste en Gly, Ser, Ala y Thr. Se entenderá que con el
fin de asegurar que, en efecto, se ha anclado un radical azúcar a
dicho sitio de N-glicosilación in vivo, la
secuencia de nucleótidos que codifica el multímero polipeptídico
debe ser insertada en un anfitrión de expresión eucariótico,
glicosilante.
Un ejemplo específico de un conector peptídico
que comprende un sitio de N-glicosilación in
vivo es un conector peptídico que tiene la secuencia de
aminoácidos
Gly_{n}-Asn-Xaa-Ser/Thr-Gly_{m},
preferiblemente
Gly_{n}-Asn-Xaa-Thr-Gly_{m},
donde Xaa es cualquier residuo de aminoácido excepto prolina, y
donde n y m son cada uno números enteros de 1-8,
preferiblemente en el intervalo de 2-5.
A menudo, las secuencias de aminoácidos de todos
los conectores peptídicos presentes en el multímero polipeptídico
serán idénticas. Sin embargo, en ciertos conectores las secuencias
de aminoácidos de todos los conectores peptídicos presentes en el
multímero polipeptídico pueden ser diferentes. Se cree que esto
último es particularmente relevante en caso de que el multímero
polipeptídico sea un trímero o tetrámero polipeptídico y
concretamente en casos en los que un residuo de aminoácido que
comprende un grupo de anclaje para un radical no polipeptídico está
incluido en el conector peptídico.
\newpage
Bastante a menudo, será deseable o necesario
anclar solamente unos pocos, típicamente solo uno, radicales no
polipeptídicos/radical (por ejemplo mPEG, un radical azúcar o un
agente terapéutico no polipeptídico) al multímero polipeptídico con
el fin de lograr el efecto deseado, tal como una vida media en suero
prolongada. Evidentemente, en el caso de un trímero polipeptídico,
que contendrá dos conectores peptídicos, solamente se requiere
modificar un conector peptídico, p. ej. mediante la introducción de
un residuo de cisteína, mientras la modificación del otro conector
peptídico típicamente no será necesaria. En este caso todos (ambos)
conectores peptídicos del multímero polipeptídico (trímero) son
diferentes.
Por consiguiente, como se describe en la
presente memoria, las secuencias de aminoácidos de todos los
conectores peptídicos presentes en el multímero polipeptídico son
idénticas excepto por uno, dos o tres conectores peptídicos, por
ejemplo excepto por uno o dos conectores peptídicos, en particular
excepto por un conector peptídico, que tiene/tienen una secuencia
de aminoácidos que comprende un residuo de aminoácido que comprende
un grupo de anclaje para un radical no polipeptídico. Los ejemplos
preferidos de tales residuos de aminoácido incluyen residuos de
cisteína de sitios de N-glicosilación in
vivo.
Un conector puede ser una secuencia conectora
nativa o sintética. Un conector nativo ilustrativo incluye, p. ej.,
la secuencia entre la última cisteína de un primer dominio A de
receptor de LDL y la primera cisteína de un segundo dominio A de
receptor de LDL y puede ser utilizado como secuencia conectora. El
análisis de diferentes conexiones de dominios A revela que los
conectores nativos oscilan de al menos 3 aminoácidos a menos de 20
aminoácidos, p. ej., 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, o 18 aminoácidos de longitud. No obstante, los expertos en la
técnica reconocerán que se pueden utilizar secuencias conectoras más
largas o más cortas. Una secuencia conectora del dominio A
ilustrativa se representa en la Figura 8. El conector es un
hexámero con la siguiente secuencia
A_{1}A_{2}A_{3}A_{4}A_{5}A_{6}, donde A_{1} se
selecciona entre los aminoácidos A, P, T, Q, E y K; A_{2} y
A_{3} son cualquier aminoácido excepto C, F, Y, W, o M; A_{4}
se selecciona entre los aminoácidos S, G y R; A_{5} se selecciona
entre los aminoácidos H, P, y R; y A_{6} es el aminoácido T.
Los métodos para generar multímeros a partir de
dominios monoméricos pueden incluir unir los dominios seleccionados
con al menos un conector para generar al menos un multímero, p. ej.,
el multímero puede comprender al menos dos de los dominios
monoméricos y el conector. El multímero o los multímeros son
escrutados después en busca de una mejora de la avidez y la
afinidad o una alteración de la especificidad para el ligando o la
mezcla de ligandos deseados en comparación con los dominios
monoméricos seleccionados.
En otros métodos descritos en la presente
memoria, los dominios multiméricos seleccionados se unen con al
menos un conector para generar al menos dos multímeros, donde los
dos multímeros comprenden dos o más de los dominios monoméricos
seleccionados y el conector. Los dos o más multímeros son escrutados
en busca de una mejora en la avidez o afinidad o una alteración de
la especificidad para el ligando o la mezcla de ligandos deseados
en comparación con los dominios monoméricos seleccionados, Las
composiciones de dos o más multímeros producidas mediante el método
anterior también se describen en la presente memoria.
Típicamente, los multímeros de la presente
invención son un único polipéptido discreto. Los multímeros de
radicales de conector
parcial-domino-conector parcial
están asociados con múltiples polipéptidos, correspondiendo cada
uno a un radical de conector
parcial-dominio-conector
parcial.
En algunos polipéptidos descritos en la presente
memoria, el multímero seleccionado comprende más de dos dominios.
Tales multímeros pueden ser generados por etapas, p. ej., donde la
adición de cada nuevo dominio es sometida a ensayo individualmente
y el efecto de los dominios es sometido a ensayo de una manera
secuencial. Véase, p. ej., la Figura 6. En otros
polipéptidos descritos en la presente memoria, los dominios están
conectados para formar multímeros que comprenden más de dos
dominios y seleccionados por su unión sin conocimiento previo de
cómo se unen multímeros más pequeños, o alternativamente, cómo se
une cada dominio.
Los métodos descritos en la presente memoria
también incluyen métodos de desarrollo de multímeros. Los métodos
pueden comprender, p. ej., cualquiera de, o todas las siguientes
etapas: proporcionar una pluralidad de ácidos nucleicos diferentes,
donde cada ácido nucleico codifica un dominio monomérico; traducir
la pluralidad de ácidos nucleicos diferentes, lo que proporciona
una pluralidad de dominios monoméricos diferentes; escrutar la
pluralidad de dominios monoméricos diferentes en busca de la unión
del ligando o mezcla de ligandos deseados; identificar miembros de
la pluralidad de dominios monoméricos diferentes que se unen al
ligando o mezcla de ligandos deseados, lo que proporciona dominios
monoméricos seleccionados; unir los dominios monoméricos
seleccionados con al menos un conector para generar al menos un
multímero, donde el al menos un multímero comprende al menos dos de
los dominios monoméricos seleccionados y al menos un conector; y,
escrutar el al menos un multímero en busca de una mejora de la
afinidad o avidez o una alteración de la especificidad para el para
el ligando o la mezcla de ligandos deseados en comparación con los
dominios monoméricos seleccionados.
Se puede introducir una variación adicional
insertando conectores de diferente longitud y composición entre
los dominios. Esto permite la selección de conectores óptimos entre
dominios. En algunos métodos descritos en la presente memoria la
longitud y composición óptimas de los conectores permitirá una unión
óptima de los dominios. En algunos métodos descritos en la presente
memoria los dominios con afinidades de unión concretas se conectan
por medio de diferentes conectores y se seleccionan los conectores
óptimos en un análisis de unión. Por ejemplo, se seleccionan los
dominios por las propiedades de unión deseadas y después se
constituye una biblioteca que comprende una variedad de conectores.
La biblioteca puede ser escrutada después para identificar los
conectores óptimos. Alternativamente, se pueden formar bibliotecas
de multímeros en las que el efecto del dominio o el conector sobre
la unión a la molécula diana no es conocido.
Los métodos descritos en la presente memoria
también incluyen generar uno o más multímeros seleccionados
proporcionando una pluralidad de dominios monoméricos. La
pluralidad de dominios monoméricos se escruta en busca de la unión
de un ligando o mezcla de ligandos deseados. Los miembros de la
pluralidad de dominios que se unen al ligando o mezcla de ligandos
deseados se identifican, proporcionando de ese modo dominios con una
afinidad deseada. Los dominios identificados se unen con al menos
un conector para generar los multímeros, donde cada multímero
comprende al menos dos de los dominios seleccionados y al menos un
conector; y, los multímeros se escrutan en busca de una mejora de
la afinidad o avidez o una alteración de la especificidad para el
ligando o la mezcla de ligandos deseados en comparación con los
dominios seleccionados, identificando de ese modo los uno o más
multímeros seleccionados.
La selección de multímeros se puede completar
utilizando una variedad de técnicas que incluyen aquellas
mencionadas más arriba para identificar los dominios monoméricos.
Otros métodos de selección incluyen, p. ej., una selección basada
en una mejora de la afinidad o avidez o una alteración de la
especificidad para el ligando en comparación con los dominios
monoméricos seleccionados. Por ejemplo, una selección se puede basar
en la unión selectiva a tipos específicos de células, o a un grupo
de células relacionadas o tipos de proteínas (p. ej., diferentes
serotipos de virus). La optimización de la propiedad seleccionada
para, p. ej., la avidez de un ligando, se puede lograr después
recombinando los dominios, así como también manipulando la secuencia
de aminoácidos de los dominios monoméricos individuales o el
dominio conector o la secuencia de nucleótidos que codifica tales
dominios, como se menciona en la presente invención.
Un método para identificar multímeros se puede
completar presentando los multímeros. Como con los dominios
monoméricos, los multímeros son opcionalmente expresados o
presentados sobre una variedad de sistemas de presentación, p. ej.,
presentación en fagos, presentación en ribosomas, presentación unida
a nucleótidos (véanse, p. ej., las Patentes de los estados
Unidos Núms. 6.281.344; 6.194.550, 6.207.446, 6.214.553, y
6.258.558) y/o la presentación en la superficie celular, como se ha
descrito antes. Las presentaciones en la superficie celular pueden
incluir pero no están limitadas a células de E. coli,
levadura o mamífero. Además, las genotecas de presentación de
multímeros con múltiples sitios de unión pueden ser
inmunopurificadas en busca de avidez o afinidad o especificidad
alterada para un ligando o para múltiples ligandos.
Otras variaciones incluyen el uso de múltiples
compuestos de unión, de manera que los dominios monoméricos,
multímeros o bibliotecas de estas moléculas pueden ser escrutados
simultáneamente en busca de una multiplicidad de ligandos o
compuestos que tienen diferente especificidad de unión. Se pueden
escrutar concomitantemente múltiples ligandos o compuestos
predeterminados en una sola biblioteca, o escrutar secuencialmente
frente a numerosos dominios monoméricos o multímeros. En una
variación, múltiples ligandos o compuestos, cada uno codificado en
una cuenta separada (o subgrupo de cuentas), pueden ser mezclados e
incubados con dominios monoméricos, multímeros o bibliotecas de
estas moléculas en condiciones de unión adecuadas. La colección de
cuentas, que comprenden múltiples ligandos o compuestos, puede ser
utilizada después para aislar, mediante selección por afinidad, los
dominios monoméricos, los multímeros seleccionados o miembros de la
biblioteca. Generalmente, las rondas de escrutinio por afinidad
posteriores pueden incluir la misma mezcla de cuentas, subgrupos de
las mismas, o cuentas que contienen solamente uno o dos ligandos o
compuestos individuales. Este enfoque permite un escrutinio eficaz,
y es compatible con la automatización en el laboratorio, el
procesamiento por lotes, y los métodos de escrutinio de alto
rendimiento.
rendimiento.
Como se describe en la presente memoria, los
multímeros pueden ser escrutados simultáneamente en busca de su
capacidad para unirse a múltiples ligandos, donde cada ligando
comprende una marca diferente. Por ejemplo, cada ligando puede ser
marcado con una marca fluorescente diferente, puesto en contacto
simultáneamente con un multímero o biblioteca de multímeros. Los
multímeros con la afinidad deseada son identificados después (p.
ej., mediante clasificación FACS) basándose en la presencia de
marcas conectadas a las marcas deseadas.
Los multímeros seleccionados de los métodos
anteriores pueden ser manipulados adicionalmente, p. ej., mediante
recombinación o barajado de los multímeros seleccionados (se puede
producir recombinación entre o con multímeros o ambos), mutación de
los multímeros seleccionados, y similares. Esto da como resultado
multímeros alterados que pueden ser escrutados y seleccionados en
busca de miembros que tienen una propiedad mejorada en comparación
con el multímero seleccionado, produciendo de ese modo multímeros
alterados seleccionados.
Los conectores, multímeros o multímeros
seleccionados producidos mediante los métodos anteriores y
siguientes se describen en la presente memoria. Se proporcionan las
bibliotecas que comprenden multímeros, p. ej., una biblioteca que
comprende aproximadamente 100, 250, 500 o más miembros producidos
mediante los métodos de la presente invención o seleccionados
mediante los métodos de la presente invención. Como se describe en
la presente memoria, también están incluidas una o más células que
comprenden miembros de las bibliotecas. Las bibliotecas de los
polipéptidos recombinantes también se describen en la presente
memoria p. ej., una biblioteca que comprende aproximadamente 100,
250, 500 o más polipéptidos recombinantes diferentes.
\newpage
Las composiciones descritas en la presente
memoria se pueden unir a una matriz de un material de afinidad, p.
ej., los polipéptidos recombinantes. Los ejemplos del material de
afinidad incluyen, p. ej., cuentas, una columna, un soporte sólido,
y/o similares.
Los conectores adecuados descritos en la
presente memoria incluyen un heterodímero obligado de radicales
conectores parciales. El término "heterodímero obligado" hace
referencia en la presente memoria a un dímero de dos radicales
conectores parciales que difieren entre sí en su composición, y que
se asocian entre sí de una manera no covalente, específica para
unir entre sí dos dominios. La asociación específica es tal que los
dos conectores parciales se asocian esencialmente entre sí en
comparación con la asociación con otros conectores parciales. De
este modo, en contraste con los multímeros de la presente invención
que están expresados como un único polipéptido, los multímeros de
dominios que están conectados por medio de heterodímeros se
ensamblan a partir de unidades discretas de conector
parcial-monómero-conector parcial.
El ensamblaje de los heterodímeros se puede lograr, por ejemplo,
mediante mezclado. De este modo, si los conectores parciales son
segmentos polipeptídicos, cada unidad de conector
parcial-monómero-conector parcial
puede ser expresada en forma de un péptido discreto antes del
ensamblaje del multímero. Se puede añadir un enlace disulfuro para
bloquear covalentemente los péptidos juntos siguiendo el
emparejamiento no covalente correcto. En la Figura 12 se representa
un multímero que contiene tales heterodímeros obligados. Los
radicales conectores parciales que son apropiados para formar
heterodímeros obligados incluyen, por ejemplo, polinucleótidos,
polipéptidos, y similares. Por ejemplo, cuando el conector parcial
es un polipéptido, se producen los dominios de unión individualmente
junto con su péptido de conexión único (esto es, un conector
parcial) y más tarde se combinan para formar multímeros. El orden
espacial de los dominios de unión en el multímero está regido por
la especificidad de la unión heterodimérica de cada conector
parcial. Los conectores parciales pueden contener secuencias de
aminoácidos terminales que se unen específicamente a una secuencia
de aminoácidos heteróloga definida. Un ejemplo de semejante
secuencia de aminoácidos es el activador de la cabeza del
neuropéptido de Hydra como describen Bodenmuller et al. El
activador de la cabeza del neuropéptido pierde su actividad
biológica mediante dimerización, (1986) EMBO J
5(8):1825-1829. Véase, p. ej., la
Patente de los Estados Unidos Núm. 5.491.074 y el documento WO
94/28173. Estos conectores parciales permiten que se produzca el
multímero primero como unidades conectoras parciales del monómero o
unidades de conector
parcial-monómero-conector parcial
que después se mezclan entre sí y se permite que se ensamblen en el
orden ideal basándose en las especificidades de unión de cada
conector parcial.
Cuando el conector parcial comprende un motivo
de unión al ADN, cada dominio monomérico tiene un conector parcial
aguas arriba y uno aguas abajo (esto es,
Lp-dominio-Lp, donde "Lp" es
una representación de un conector parcial) que contiene una
proteína de unión al ADN con una especificidad de unión al ADN
específicamente única. Estos dominios pueden ser producidos
individualmente y después ensamblados en un multímero específico
mezclando los dominios con fragmentos de ADN que contienen las
secuencias de nucleótidos apropiadas (esto es, los sitios de
reconocimiento específico para las proteínas de unión al ADN de los
conectores parciales de los dos dominios deseados) con el fin de
unir los dominios en el orden deseado. Adicionalmente, se pueden
ensamblar los mismos dominios en muchos multímeros diferentes
mediante la adición de secuencias de ADN que contienen diferentes
combinaciones de sitios de reconocimiento de proteínas de unión al
ADN. La aleatorización adicional de las combinaciones de los sitios
de reconocimiento de las proteínas de unión al ADN en los fragmentos
de ADN puede permitir el ensamblaje de bibliotecas de multímeros.
El ADN puede ser sintetizado con análogos de esqueleto para evitar
la degradación in vivo.
Una ventaja significativa de la presente
invención es que se pueden utilizar ligandos conocidos, o ligandos
desconocidos para seleccionar los dominios monoméricos y/o
multímeros. No se requiere una información previa referente a la
estructura del ligando para aislar los dominios monoméricos de
interés o los multímeros de interés. Los dominios monoméricos
identificados pueden tener actividad biológica, lo que significa que
incluyen al menos una afinidad de unión específica para un ligando
seleccionado o deseado, y, en algunos casos, incluirá
adicionalmente la capacidad de bloquear la unión de otros
compuestos, para estimular o inhibir las rutas metabólicas, para
actuar como señal o mensajero, para estimular o inhibir la actividad
celular, y similares.
Se puede utilizar un único ligando, u
opcionalmente una variedad de ligandos para seleccionar los dominios
monoméricos, y/o multímeros. Un dominio monomérico de la presente
invención se puede unir a un único ligando o a una variedad de
ligandos. Un multímero de la presente invención puede tener
múltiples sitios de unión discretos para un único ligando, u
opcionalmente, puede tener múltiples sitios de unión para una
variedad de ligandos.
Las aplicaciones potenciales de los multímeros
de la presente invención son diversas. Por ejemplo, la invención se
puede utilizar en la aplicación para crear antagonistas, donde los
dominios monoméricos seleccionados o multímeros bloquean la
interacción entre dos proteínas. Opcionalmente, la invención puede
generar agonistas. Por ejemplo, los multímeros que se unen a dos
proteínas diferentes, p. ej., enzima y sustrato, pueden intensificar
la función de la proteína, incluyendo, por ejemplo, la actividad
enzimática y/o la conversión del sustrato.
Otras aplicaciones incluyen el direccionamiento
celular. Por ejemplo, los multímeros que consisten en dominios
monoméricos y/o inmuno-dominios que reconocen
proteínas de la superficie celular específicas se pueden unir
selectivamente a ciertos tipos celulares. Las aplicaciones que
implican dominios monoméricos y/o inmuno-dominios
como agentes antivirales también están incluidas. Por ejemplo, los
multímeros que se unen a diferentes epítopos sobre la partícula del
virus pueden ser útiles como agentes antivirales debido a la
polivalencia. Otras aplicaciones pueden incluir, pero no están
limitadas a, purificación de proteínas, detección de proteínas,
biosensores, experimentos de captura por afinidad de ligandos y
similares. Además, se pueden sintetizar dominios o multímeros en
masa mediante métodos convencionales para cualquier uso adecuado, p.
ej., como agente terapéutico o de diagnóstico.
Como se describe en la presente memoria, el
multímero comprende dominios monoméricos con especificidades para
diferentes proteínas. Las diferentes proteínas pueden estar
relacionadas o no relacionadas. Los ejemplos de las proteínas
relacionadas incluyen miembros de una familia de proteínas o
diferentes serotipos de un virus. Alternativamente, los dominios
monoméricos y/o inmuno-dominios de un multímero
pueden dirigir diferentes moléculas de una ruta fisiológica (p.
ej., diferentes proteínas de la coagulación de la sangre). Como se
describe adicionalmente en la presente memoria, los dominio
monoméricos y/o inmuno-dominios se unen a proteínas
en rutas no relacionadas (p. ej., dos dominios se unen a factores
de la sangre, otros dos dominios se unen a proteínas relacionadas
con la inflamación y un quinto se une a la albúmina del suero).
La presente patente también describe métodos de
tratamiento terapéutico y profiláctico de una enfermedad o
trastorno mediante la administración in vivo o ex vivo
de uno o más ácidos nucleicos o polipéptidos de la invención
descritos antes (o composiciones que comprenden un excipiente
farmacéuticamente aceptable y uno o más de tales ácidos nucleicos o
polipéptidos) a un sujeto, incluyendo, p. ej., un mamífero,
incluyendo un ser humano, primate, ratón, cerdo, vaca, cabra,
conejo, rata, cobaya, hámster, caballo, oveja; o un vertebrado no
mamífero tal como un ave (p. ej., un pollo o un pato), pez, o
invertebrado.
En métodos ex vivo, se obtienen una o más
células o una población de células de interés del sujeto (p.
ej., células tumorales, muestra de tejido tumoral, células de
órganos, células de la sangre, células de la piel, pulmón, corazón,
músculo, cerebro, mucosa, hígado, intestinos, bazo, estómago,
sistema linfático, cérvix, vagina, próstata, boca, lengua,
etc.) o se separan del sujeto y se ponen en contacto con una
cantidad de un dominio monomérico y/o multímero seleccionado de la
invención que es eficaz en el tratamiento profiláctico o
terapéutico de una enfermedad, trastorno, u otra afección. Las
células puestas en contacto se devuelven o liberan después al
sujeto en el sitio del cual se obtuvieron u otro sitio (p.
ej., incluyendo aquellos definidos antes) de interés en el
sujeto que se vaya a tratar. Si se desea, las células puestas en
contacto se pueden injertar en un tejido, órgano, o sitio de un
sistema (incluyendo todos los descritos antes) de interés en el
sujeto utilizando técnicas de injerto convencionales y bien
conocidas o, p. ej., liberar en el sistema sanguíneo o
linfático utilizando técnicas de liberación o transfusión
convencionales.
Se describen en la presente memoria métodos
in vivo en los cuales se ponen en contacto una o más células
o una población de células de interés del sujeto directamente o
indirectamente con una cantidad de un dominio monomérico y/o
multímero seleccionado de la invención eficaz en el tratamiento
profiláctico o terapéutico de la enfermedad, trastorno, u otra
afección. en formatos de contacto/administración directos, el
dominio monomérico y/o multímero seleccionado se administran
típicamente o se transfieren directamente a las células a tratar o
al sitio del tejido de interés (p. ej., células tumorales,
muestras de tejido tumoral, células de órganos, células de la
sangre, células de la piel, pulmón, corazón, músculo, cerebro,
mucosas, hígado, intestinos, bazo, estómago, sistema linfático,
cérvix, vagina, próstata; boca, lengua, etc.) mediante
cualquiera de una variedad de formatos, incluyendo administración
tópica, inyección (p. ej., utilizando una aguja o jeringa),
o vacuna o liberación con pistola génica, presionando en el tejido,
órgano, o sitio de la piel. El dominio monomérico y/o multímero
seleccionados pueden ser liberados, por ejemplo, intramuscularmente,
intradérmicamente, subdérmicamente, subcutáneamente, oralmente,
intraperitonealmente, intratecalmente, intravenosamente, o
colocados en una cavidad del organismo (incluyendo, p. ej.,
durante la cirugía), o mediante inhalación o administración vaginal
o rectal.
En los formatos de contacto/administración
indirectos in vivo, el dominio monomérico y/o multímero
seleccionado se administra típicamente o se transfiere
indirectamente a las células a tratar o al tejido de interés,
incluyendo los descritos antes (tales como, p. ej., células
de la piel, sistemas de órganos, sistema linfático, o sistema de
células sanguíneas, etc.), poniendo en contacto o
administrando el polipéptido de la invención directamente a una o
más células o poblaciones de células cuya tratamiento se puede
facilitar. Por ejemplo, células tumorales del organismo del sujeto
que se vaya a tratar poniendo en contacto las células del sistema
sanguíneo o linfático, piel, o un órgano con una cantidad suficiente
del dominio monomérico y/o multímero seleccionado de manera que se
produzca el reparto del dominio monomérico y/o multímero
seleccionado al sitio de interés (p. ej., tejido, órgano, o
células de interés de o sistema sanguíneo o linfático en el
organismo) y de como resultado el tratamiento profiláctico o
terapéutico efectivo. Semejante contacto, administración, o
transferencia se realizan típicamente utilizando una o más rutas o
modos de administración descritos.
Adicionalmente se describen en la presente
memoria métodos ex vivo en los cuales se obtienen o se
separan una o más células de interés o una población de células de
interés del sujeto (p. ej., células tumorales, muestra de
tejido tumoral, células de órganos, células sanguíneas, células de
la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado,
intestinos, bazo, estómago, sistema linfático, cérvix, vagina,
próstata, boca, lengua, etc.) del sujeto y se transforman
poniendo en contacto dichas una o más células o población de células
con un constructo polinucleotídico que comprende una secuencia de
ácido nucleico de la invención que codifica un polipéptido
biológicamente activo de interés (p. ej., un dominio
monomérico y/o multímero seleccionado) que es eficaz en el
tratamiento profiláctico o terapéutico de la enfermedad, trastorno,
u otra afección. Las una o más células o poblaciones de células se
ponen en contacto con una cantidad suficiente del constructo
polinucleotídico y un promotor que controla la expresión de dicha
secuencia de ácido nucleico de manera que se produzca la absorción
del constructo polinucleotídico (y el promotor) en las células y de
como resultado una expresión suficiente de la secuencia de ácido
nucleico diana para producir una cantidad del polipéptido
biológicamente activo, codificando un dominio monomérico y/o
multímero seleccionados, eficaz para tratar profilácticamente o
terapéuticamente la enfermedad, trastorno, o afección. El constructo
polinucleotídico puede incluir una secuencia promotora (p.
ej., una secuencia promotora de CMV) que controla la expresión
de la secuencia de ácido nucleico de la invención y/o, si se desea,
una o más secuencias de nucleótidos adicionales que codifican al
menos uno o más de otro polipéptido de la invención, una citoquina,
coadyuvante, o molécula co-estimuladora, u otro
polipéptido de interés.
Después de la transfección, las células
transformadas se devuelven, liberan, o transfieren al sujeto, al
sitio del tejido o sistema del cual fueron obtenidas o a otro sitio
(p. ej., células tumorales, muestra de tejido tumoral,
células de órganos, células de la sangre, células de la piel,
pulmón, corazón, músculo, cerebro, mucosas, hígado, intestinos,
bazo, estómago, sistema linfático, cérvix, vagina, próstata, boca,
lengua, etc.) que se van a tratar en el sujeto. Si se desea,
las células pueden ser injertadas sobre un tejido, piel, órgano, o
sistema corporal de interés en el sujeto utilizando técnicas de
injerto convencionales o bien conocidas o liberadas en el sistema
sanguíneo o linfático utilizando técnicas de liberación o
transfusión convencionales. Semejante reparto, administración, o
transferencia de células transformadas se realiza típicamente
utilizando una o más de las rutas o modos de administración
descritos antes. La expresión del ácido nucleico diana se produce
naturalmente o puede ser inducida (como se describe con mayor
detalle más abajo) y se expresa una cantidad del polipéptido
codificado suficiente y eficaz para tratar la enfermedad o afección
en el sitio o sistema de tejidos.
Asimismo se describen en la presente memoria
métodos in vivo en los cuales una o más células de interés o
una población de células del sujeto (p. ej., incluyendo
aquellas células y sistemas de células y sujetos descritos antes)
son transformadas en el organismo del sujeto poniendo en contacto
las células o población de células con (o administrando o
transfiriendo a las células o población de células que utilizan una
o más de las rutas o modos de administración descritos antes) un
constructo polinucleotídico que comprende una secuencia de ácido
nucleico de la invención que codifica un polipéptido biológicamente
activo de interés (p. ej., un dominio monomérico y/o
multímero seleccionado) que es eficaz en el tratamiento profiláctico
o terapéutico de la enfermedad, trastorno, u otra afección.
El constructo polinucleotídico puede ser
administrado o transferido directamente a células que padecen una
enfermedad o trastorno (p. ej., mediante contacto directo
utilizando una o más de las rutas o modos de administración
descritos antes). Alternativamente, el constructo polinucleotídico
puede ser administrado o transferido indirectamente a células que
padecen una enfermedad o trastorno poniendo en contacto primero
directamente las células no enfermas o células con otra enfermedad
utilizando una o más de las rutas o modos de administración
descritos antes con una cantidad suficiente del constructo
polinucleotídico que comprende la secuencia de ácido nucleico que
codifica el polipéptido biológicamente activo, y un promotor que
controla la expresión de la secuencia de ácido nucleico, de manera
que se produzca la absorción del constructo polinucleotídico (y el
promotor) en las células y de como resultado una expresión
suficiente de la secuencia de ácido nucleico de la invención para
producir una cantidad del polipéptido biológicamente activo eficaz
para tratar profilácticamente o terapéuticamente la enfermedad o
trastorno, y por medio de lo cual el constructo polinucleotídico o
el polipéptido expresado resultante es transferido naturalmente o
automáticamente desde el sitio, sistema, tejido u órgano del
organismo del sujeto de liberación inicial al organismo del sujeto
al sitio, órgano o sistema del organismo del sujeto enfermos (p.
ej., a través del sistema sanguíneo o linfático). La expresión
del ácido nucleico diana se produce naturalmente o puede ser
inducido (como se describe con mayor detalle más abajo) de manera
que una cantidad del polipéptido expresado sea suficiente y eficaz
para tratar la enfermedad o afección en el sitio o sistema tisular.
El constructo polinucleotídico puede incluir una secuencia promotora
(p. ej., una secuencia promotora de CMV) que controla la
expresión de la secuencia de ácido nucleico y/o, si se desea, una o
más secuencias de nucleótidos adicionales que codifican al menos uno
o más de los otros polipéptidos de la invención, una citoquina, un
coadyuvante, o una molécula co-estimuladora, u otro
polipéptido de interés.
En cada uno de los métodos de tratamiento in
vivo y ex vivo descritos antes, se puede administrar o
liberar una composición que comprende un excipiente y el polipéptido
o ácido nucleico de la invención. Asimismo se describe en la
presente memoria, una composición que comprende un excipiente
farmacéuticamente aceptable y un polipéptido o ácido nucleico que
puede ser administrada o liberada al sujeto como se ha descrito
antes en una cantidad eficaz para tratar la enfermedad o
trastorno.
Como se describe adicionalmente en la presente
memoria, en cada método de tratamiento in vivo y ex
vivo descrito antes, la cantidad de polinucleótido administrado
a las células o al sujeto puede ser una cantidad tal que se
produzca la absorción de dicho polinucleótido en una o más células
del sujeto y de como resultado una expresión suficiente de dicha
secuencia de ácido nucleico para producir una cantidad de un
polipéptido biológicamente activo eficaz para intensificar una
respuesta inmunitaria en un sujeto, incluyendo una respuesta
inmunitaria inducida por un inmunógeno (p. ej., un antígeno).
Para cada uno de tales métodos, la cantidad de polipéptido
administrado a las células o al sujeto puede ser una cantidad
suficiente para intensificar una respuesta inmunitaria en el
sujeto, incluyendo la inducida por un inmunógeno (p. ej., un
antígeno).
Adicionalmente se describe en la presente
memoria un método de tratamiento in vivo o in vivo en
el cual se utiliza un constructo polinucleotídico (o una
composición que comprende un constructo polinucleotídico) para
liberar un polipéptido fisiológicamente activo en un sujeto. La
expresión del constructo polinucleotídico puede ser inducida
utilizando un sistema de expresión génica inducible de conexión y
desconexión. Los ejemplos de tales sistemas de expresión génica de
conexión y desconexión incluyen el Sistema de Expresión Génica
Tet-On® y el Sistema de Expresión Génica
Tet-Off® (véase, p. ej., Catálogo Clontech
2000, págs. 110-111 para una descripción detallada
de cada uno de tales sistemas), respectivamente. Otros sistemas de
expresión génica de conexión y desconexión controlables o
inducibles son conocidos por los expertos normales en la técnica.
Con semejante sistema, la expresión del ácido nucleico del
constructo polinucleotídico puede ser regulada de una manera
precisa, reversible, y cuantitativa. La expresión génica del ácido
nucleico diana puede ser inducida, por ejemplo, una vez que las
células transfectadas estables que contienen el constructo
polinucleotídico que comprende el ácido nucleico diana son
liberadas o transferidas o puestas en contacto con el sitio del
tejido, órgano o sistema de interés. Tales sistemas son
particularmente ventajosos en los métodos de tratamiento y formatos
en los cuales es beneficioso retrasar o controlar precisamente la
expresión del ácido nucleico diana (p. ej., para dar tiempo
para completar una operación quirúrgica y/o curación después de la
cirugía; para dar tiempo para que el constructo polinucleotídico
que comprende el ácido nucleico diana alcance el sitio, las
células, o el tejido que se vaya a tratar; para dar tiempo para que
el injerto que contiene las células transformadas con el constructo
se incorporen al tejido u órgano sobre el que, o en el que ha sido
empalmado o anclado, etc.).
Como se ha mencionado antes, el polipéptido de
la presente invención puede ser alterado. Las descripciones de una
variedad de procedimientos diversos que generan procedimientos para
generar secuencias de ácido nucleico modificadas o alteradas que
codifican estos polipéptidos se describen más arriba y más abajo en
las siguientes publicaciones y en las referencias allí citadas:
Soong, N. et al., Molecular breeding of viruses, (2000) Nat
Genet 25(4):436-439; Stemmer, et al.,
Molecular breeding of viruses for targeting and other clinical
properties, (1999) Tumor Targeting 4:1-4; Ness
et al., DNA Shuffling of subgenomic sequences of subtilisin,
(1999) Nature Biotechnology 17:893-896; Chang et
al, Evolution of a cytokine using DNA family shuffling, (1999)
Nature Biotechnology 17:793-797; Minshull y
Stemmer, Protein evolution by molecular breeding, (1999) Current
Opinion in Chemical Biology 3:284-290; Christians
et al., Directed evolution of thymidine kinase for AZT
phosphorylation using DNA family shuffling, (1999) Nature
Biotechnology 17:259-264; Crameri et al., DNA
shuffling of a family of genes from diverse species accelerates
directed evolution, (1998) Nature 391:288-291;
Crameri et al., Molecular evolution of an arsenate
detoxification pathway by DNA shuffling, (1997) Nature Biotechnology
15:436-438; Zhang et al., Directed evolution
of an effective fucosidase from a galactosidase by DNA shuffling and
screening (1997) Proc. Natl. Acad. Sci. USA
94:4504-4509; Patten et al., Applications of
DNA Shuffling to Pharmaceuticals and Vaccines, (1997) Current
Opinion in Biotechnology 8:724-733; Crameri et
al, Construction and evolution of
antibody-phage libraries by DNA shuffling, (1996)
Nature Medicine 2:100-103; Crameri et al.,
Improved green fluorescent protein by molecular evolution using DNA
shuffling, (1996) Nature Biotechnology 14:315-319;
Gates et al., Affinity selective isolation of ligands from
peptide libraries through display on a lac repressor 'headpiece
dimer', (1996) Journal of Molecular Biology
255:373-386; Stemmer, Sexual PCR and Assembly PCR,
(1996) In: The Encyclopedia of Molecular Biology. VCH Publishers,
Nueva York. págs.447-457; Crameri y Stemmer,
Combinatorial multiple cassette mutagenesis creates all the
permutations of mutant and wildtype cassettes, (1995) BioTechniques
18:194-195; Stemmer et al.,
Single-step assembly of a gene and entire plasmid
form large numbers of oligodeoxy-ribonucleótidos,
(1995) Gene, 164:49-53; Stemmer, The Evolution of
Molecular Computation, (1995) Science 270: 1510; Stemmer. Searching
Sequence Space, (1995) Bio/Technology 13:549-553;
Stemmer, Rapid evolution of a protein in vitro by DNA
shuffling, (1994) Nature 370:389-391; y Stemmer, DNA
shuffling by random fragmentation and reassembly: In vitro
recombination for molecular evolution, (1994) Proc. Natl. Acad. Sci.
USA 91:10747-10751.
Los métodos mutacionales de generación de
diversidad incluyen, por ejemplo, la mutagénesis dirigida al sitio
(Ling et al., Approaches to DNA mutagenesis: an overview,
(1997) Anal Biochem. 254(2): 157-178; Dale
et al., Oligonucleotide-directed random
mutagenesis using the phosphorothioate method, (1996) Methods Mol.
Biol. 57:369-374; Smith, In vitro
mutagenesis, (1985) Ann. Rev. Genet. 19:423-462;
Botstein & Shortle, Strategies and applications of in
vitro mutagenesis, (1985) Science 229:1193-1201;
Carter, Site-directed mutagenesis, (1986) Biochem.
J. 237:1-7; y Kunkel, The efficiency of
oligonucleotide directed mutagenesis, (1987) in Nucleic Acids &
Molecular Biology (Eckstein, F. y Lilley, D.M.J. eds., Springer
Verlag, Berlin)); la mutagénesis utilizando moldes que contienen
uracilo (Kunkel, Rapid and efficient site-specific
mutagenesis without phenotypic selection, (1985) Proc. Natl. Acad.
Sci. USA 82:488-492; Kunkel et al., Rapid and
efficient site-specific mutagenesis without
phenotypic selection, (1987) Methods in Enzymol. 154,
367-382; and Bass et al., Mutant Trp
repressors with new DNA-binding specificities,
(1988) Science 242:240-245); la mutagénesis dirigida
por oligonucleótidos ((1983) Methods in Enzymol. 100:
468-500; (1987) Methods in Enzymol. 154:
329-350; Zoller & Smith,
Oligonucleotide-directed mutagenesis using
M13-derived vectors: an efficient and general
procedure for the production of point mutations in any DNA
fragment, (1982) Nucleic Acids Res. 10:6487-6500;
Zoller & Smith, Oligonucleotide-directed
mutagenesis of DNA fragments cloned into M13 vectors, (1983)
Methods in Enzymol. 100:468-500; y Zoller &
Smith, Oligonucleótido-directed mutagenesis: a
simple method using two oligonucleotide primers and a
single-stranded DNA template, (1987) Methods in
Enzymol. 154:329-350); la mutagénesis de ADN
modificado con fosforotioato (Taylor et al., The use of
phosphorothioate-modified DNA in restriction enzyme
reactions to prepare nicked DNA, (1985) Nucl. Acids Res. 13:
8749-8764; Taylor et al., The rapid
generation of oligonucleotide-directed mutations at
high frequency using phosphorothioate-modified DNA,
(1985) Nucl. Acids Res. 13: 8765-8787; Nakamaye
& Eckstein, Inhibition of restriction endonuclease Nci I
cleavage by phosphorothioate groups and its application to
oligonucleotide-directed mutagenesis, (1986) Nucl.
Acids Res. 14: 9679-9698; Sayers et al.,
Y-T Exonucleases in
phosphorothioate-based
oligonucleotide-directed mutagenesis, (1988) Nucl.
Acids Res. 16:791-802; y Sayers et al.,
Strand specific cleavage of
phosphorothioate-containing DNA by reaction with
restriction endonucleases in the presence of ethidium bromide,
(1988) Nucl. Acids Res. 16: 803-814); la
mutagénesis utilizando ADN dúplex con espacios (Kramer et
al., The gapped duplex DNA approach to
oligonucleotide-directed mutation construction,
(1984) Nucl. Acids Res. 12: 9441-9456; Kramer &
Fritz Oligonucleótido-directed construction of
mutations via gapped duplex DNA, (1987) Methods in Enzymol.
154:350-367; Kramer et al., Improved
enzymatic in vitro reactions in the gapped duplex DNA
approach to oligonucleotide-directed construction of
mutations, (1988) Nucl. Acids Res. 16: 7207; y Fritz et al.,
Oligonucleotide-directed construction of mutations:
a gapped duplex DNA procedure without enzymatic reactions in
vitro, (1988) Nucl. Acids Res. 16:
6987-6999).
Los métodos adecuados adicionales incluyen la
reparación puntual de los emparejamientos erróneos (Kramer et
al., Point Mismatch Repair, (1984) Cell
38:879-887), la mutagénesis utilizando cepas
anfitrionas con una reparación deficiente (Carter et al.,
Improved oligonucleotide site-directed mutagenesis
using M13 vectors, (1985) Nucl. Acids Res. 13:
4431-4443; y Carter, Improved
oligonucleotide-directed mutagenesis using M13
vectors, (1987) Methods in Enzymol. 154: 382-403),
la mutagénesis por deleción (Eghtedarzadeh & Henikoff, Use of
oligonucleotides to generate large deletions, (1986) Nucl. Acids
Res. 14: 5115), la selección mediante restricción y la purificación
mediante restricción (Wells et al., Importance of
hydrogen-bond formation in stabilizing the
transition state of subtilisin, (1986) Phil. Trans. R. Soc. Lond. A
317: 415-423), la mutagénesis mediante síntesis
génica total (Nambiar et al., Total synthesis and cloning of
a gene coding for the ribonuclease S protein, (1984) Science 223:
1299-1301; Sakamar y Khorana, Total synthesis and
expression of a gene for the a-subunit of bovine
rod outer segment guanine nucleotide-binding protein
(transducin), (1988) Nucl. Acids Res. 14: 6361-6372;
Wells et al., Cassette mutagenesis: an efficient method for
generation of multiple mutations at defined sites, (1985) Gene
34:315-323; y Grundström et al.,
Oligonucleotide-directed mutagenesis by microscale
'shot-gun' gene synthesis, (1985) Nucl. Acids Res.
13: 3305-3316), la reparación por rotura de la dobre
hebra (Mandecki, Oligonucleotide-directed
double-strand break repair in plasmids of
Escherichia coli: a method for site-specific
mutagenesis, (1986) Proc. Natl. Acad. Sci. USA,
83:7177-7181; y Arnold, Protein engineering for
unusual environments, (1993) Current Opinion in Biotechnology
4:450-455). Se pueden encontrar detalles adicionales
sobre muchos de los métodos anteriores en Methods in Enzymology
Volumen 154, que también describe controles útiles para subsanar
problemas con diferentes métodos de mutagénesis.
Los detalles adicionales referentes a los
métodos de generación de diversidad se pueden encontrar en las
siguientes patentes de los Estados Unidos, publicaciones PCT y
solicitudes, y publicaciones EPO: Patente de los Estados Unidos
Núm. 5.605.793 de Stemmer (25 Febrero, 1997), "Methods for In
Vitro Recombination"; Patente de los Estados Unidos Núm.
5.811.238 de Stemmer et al. (22 Septiembre, 1998) "Methods
for Generating Polynucleotides having Desired Characteristics by
Iterative Selection and Recombination"; Patente de los Estados
Unidos Núm. 5.830.721 de Stemmer et al. (3 Noviembre, 1998),
"DNA Mutagenesis by Random Fragmentation and Reassembly";
Patente de los Estados Unidos Núm. 5.834.252 de Stemmer, et
al. (10 Noviembre, 1998) "End-Complementary
Polymerase Reaction"; Patente de los Estados Unidos Núm.
5.837.458 de Minshull, et al. (7 Noviembre, 1998), "Methods
and Compositions for Cellular and Metabolic Engineering";
Documento WO 95/22625, Stemmer y Crameri, "Mutagenesis by Random
Fragmentation and Reassembly"; Documento WO 96/33207 de Stemmer
yd Lipschutz "End Complementary Polymerase Chain Reaction";
Documento WO 97/20078 de Stemmer y Crameri "Methods for Generating
Polynucleotides having Desired Characteristics by Iterative
Selection and Recombination"; Documento WO 97/35966 mediante
Minshull y Stemmer, "Methods and Compositions for Cellular and
Metabolic Engineering"; Documento WO 99/41402 de Punnonen et
al. "Targeting of Genetic Vaccine Vectors"; Documento WO
99/41383 de Punnonen et al. "Antigen Library
Immunization"; Documento WO 99/41369 de Punnonen et al.
"Genetic Vaccine Vector Engineering"; Documento WO 99/41368 de
Punnonen et al. "Optimization of Immunomodulatory
Properties of Genetic Vaccines"; Documento EP 752008 de Stemmer y
Crameri, "DNA Mutagenesis by Random Fragmentation and
Reassembly"; Documento EP 0932670 de Stemmer "Evolving
Cellular DNA Uptake by Recursive Sequence Recombination";
Documento WO 99/23107 de Stemmer et al., "Modification of
Virus Tropism and Host Range by Viral Genome Shuffling";
Documento WO 99/21979 de Apt et al., "Human Papillomavirus
Vectors"; Documento WO 98/31837 de del Cardayre et al.
"Evolution of Whole Cells and Organisms by Recursive Sequence
Recombination"; Documento WO 98/27230 de Patten y Stemmer,
"Methods and Compositions for Polypeptide Engineering";
Documento WO 98/27230 de Stemmer et al., "Methods for
Optimization of Gene Therapy by Recursive Sequence Shuffling and
Selection", Documento WO 00/00632, "Methods for Generating
Highly Diverse Libraries", Documento WO 00/09679, "Methods for
Obtaining in Vitro Recombined Polynucleotide Sequence Banks
and Resulting Sequences", Documento WO 98/42832 de Arnold et
al., "Recombination of Polynucleotide Sequences Using Random
or Defined Primers", Documento WO 99/29902 de Arnold et
al., "Method for Creating Polynucleotide and Polypeptide
Sequences", Documento WO 98/41653 de Vind, "An in Vitro
Method for Construction of a DNA Library", Documento WO 98/41622
de Borchert et al., "Method for Constructing a Library
Using DNA Shuffling", y Documento WO 98/42727 de Pati y Zarling,
"Sequence Alterations using Homologous Recombination";
Documento WO 00/18906 de Patten et al., "Shuffling of
Codon-Altered Genes"; Documento WO 00/04190 de
del Cardayre et al. "Evolution of Whole Cells and
Organisms by Recursive Recombination"; Documento WO 00/42561 de
Crameri et al., "Oligonucleotide Mediated Nucleic Acid
Recombination"; Documento WO 00/42559 de Selifonov y Stemmer
"Methods of Populating Data Structures for Use in Evolutionary
Simulations"; Documento WO 00/42560 de Selifonov et al.,
"Methods for Making Character Strings, Polynucleotides &
Polypeptides Having Desired Characteristics"; Documento WO
01/23401 de Welch et al., "Use of
Codon-Varied Oligonucleotide Synthesis for Synthetic
Shuffling"; y Documento PCT/US01/06775
"Single-Stranded Nucleic Acid
Template-Mediated Recombination and Nucleic Acid
Fragment Isolation" de Affholter.
Otro aspecto descrito en la presente memoria
incluye la clonación y expresión de dominios monoméricos, dominios
monoméricos seleccionados, multímeros y/o multímeros seleccionados
que codifican ácidos nucleicos. De este modo, los dominios
multiméricos pueden ser sintetizados como una única proteína
utilizando sistemas de expresión bien conocidos en la técnica.
Además de los muchos textos indicados arriba, los textos generales
que describen técnicas biológicas moleculares útiles en la presente
memoria, incluyendo el uso de vectores, promotores y muchos otros
tópicos relevantes para expresar ácidos nucleicos tales como
dominios monoméricos, dominios monoméricos seleccionados,
multímeros y/o multímeros seleccionados, incluyen Berger y Kimmel,
Guide to Molecular Cloning Techniques, Methods in Enzymology
volumen 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook
et al., Molecular Cloning - A Laboratory Manual (2^{a}
Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold
Spring Harbor, Nueva York, 1989 ("Sambrook") y Current
Protocols in Molecular Biology, F.M. Ausubel et al., eds.,
Current Protocols, una empresa conjunta entre Greene Publishing
Associates, Inc. y John Wiley & Sons, Inc., (suplementado
durante 1999) ("Ausubel")). Los ejemplos de las técnicas
suficientes para dirigir a los expertos en la técnica a través de
los métodos de amplificación in vitro, útiles en la
identificación, el aislamiento y la clonación de dominios
monoméricos y multímeros que codifican ácidos nucleicos, incluyendo
la reacción en cadena de la polimerasa (PCR), la reacción en cadena
de la ligasa (LCR), la amplificación con replicasa Q\exists; y
otras técnicas mediadas por la ARN polimerasa (p. ej.,
NASBA), se encuentran en Berger, Sambrook, y Ausubel, así como
Mullis et al., (1987) Patente de los Estados Unidos Núm.
4.683.202; PCR Protocols A Guide to Methods and Applications (Innis
et al. eds) Academic Press Inc. San Diego, CA (1990) (Innis);
Arnheim & Levinson (1 Octubre, 1990) C&EN
36-47; The Journal Of NIH Research (1991) 3,
81-94; (Kwoh et al. (1989) Proc. Natl. Acad.
Sci. USA 86, 1173; Guatelli et al. (1990) Proc. Natl. Acad.
Sci. USA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35,
1826; Landegren et al., (1988) Science 241,
1077-1080; Van Brunt (1990) Biotechnology 8,
291-294; Wu y Wallace, (1989) Gene 4, 560; Barringer
et al. (1990) Gene 89, 117, y Sooknanan y Malek (1995)
Biotechnology 13: 563-564. Los métodos mejorados de
clonación in vitro de ácidos nucleicos amplificados son
descritos por Wallace et al., Patente de los Estados Unidos
Núm. 5.426.039. Los métodos mejorados de amplificación de ácidos
nucleicos grandes mediante PCR son resumidos por Cheng et al.
(1994) Nature 369: 684-685 y las referencias allí
citadas, en los que se generan amplicones de PCR de hasta 40 kb. Un
experto en la técnica apreciará que esencialmente cualquier ARN
puede ser convertido en un ADN de doble hebra adecuado para la
digestión con enzimas de restricción, la expansión por PCR y la
secuenciación utilizando la transcriptasa inversa y una polimerasa.
Véase, Ausubel, Sambrook y Berger, todas más
arriba.
Los vectores descritos en la presente memoria
pueden ser introducidos en células anfitrionas, y los dominios
monoméricos, los dominios monoméricos seleccionados, los multímeros
y/o los multímeros seleccionados de la invención pueden ser
producidos mediante mecanismos recombinantes. Las células
anfitrionas son diseñadas genéticamente (esto es, transducidas,
transformadas o transfectadas) con los vectores descritos en la
presente memoria que pueden ser, por ejemplo, un vector de
clonación o un vector de expresión. El vector puede estar, por
ejemplo, en forma de un plásmido, una partícula viral, un fago,
etc. Las células anfitrionas diseñadas genéticamente pueden ser
cultivadas en medio nutriente convencional modificado como sea
apropiado para activar promotores, seleccionar transformantes, o
amplificar el gen o los genes del dominio monomérico, el dominio
monomérico seleccionado, el multímero y/o el multímero seleccionado
de interés. Las condiciones de cultivo, tales como la temperatura,
el pH y similares, son aquellas utilizadas previamente con la célula
anfitriona seleccionada para la expresión, y serán evidentes para
los expertos en la técnica y en las referencias citadas en la
presente memoria, incluyendo, p. ej., Freshney (1994) Culture of
Animal Cells, a Manual of Basic Technique, tercera edición,
Wiley-Liss, Nueva York y las referencias allí
citadas.
Como se describe en la presente memoria, los
polipéptidos de la invención también pueden ser producidos en
células no animales tales como plantas, levaduras, hongos, bacterias
y similares. En efecto, como se ha indicado antes, la presentación
en fagos es una técnica especialmente relevante para producir tales
polipéptidos. Además de Sambrook, Berger y Ausubel, se pueden
encontrar detalles referentes al cultivo celular en Payne et
al. (1992) Plant Cell and Tissue Culture in Liquid Systems John
Wiley & Sons, Inc. Nueva York, NY; Gamborg y Phillips (eds)
(1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods
Springer Lab Manual, Springer-Verlag (Berlin
Heidelberg Nueva York) y Atlas and Parks (eds) The Handbook of
Microbiological Media (1993) CRC Press, Boca Raton, FL.
También se describe en la presente memoria la
alteración de dominios monoméricos, y/o multímeros para mejorar las
propiedades farmacológicas, para reducir la inmunogenicidad, o para
facilitar el transporte del multímero y/o el dominio monomérico a
una célula o tejido (p. ej., a través de la barrera
hemato-encefálica, o a través de la piel). Estos
tipos de alteraciones incluyen una variedad de modificaciones (p.
ej., la adición de grupos azúcar o glicosilación), la adición de
PEG, la adición de dominios de proteína que se unen a cierta
proteína (p. ej., HAS u otra proteína del suero), la adición de
fragmentos de proteínas o secuencias que señalan el movimiento o
transporte en, fuera de y a través de una célula. También se pueden
añadir componentes adicionales a un multímero y/o dominio
monomérico para manipular las propiedades del multímero y/o dominio
monomérico. También se puede añadir una variedad de componentes
incluyendo, p. ej., un dominio que se une a un receptor conocido
(p. ej., un dominio de una proteína de la región Fc que se une a un
receptor de Fc), una o varias toxinas o una porción de una toxina,
un prodominio que puede ser opcionalmente escindido para activar el
multímero o dominio monomérico, una molécula informadora (p. ej.,
proteína fuorescente verde), un componente que se une a una
molécula informadora (tal como un radionúclido para radioterapia,
biotina o avidina) o un combinación de modificaciones.
Los kits que comprenden los componentes
necesarios en los métodos (típicamente en una forma no mezclada) y
los componentes de los kits (materiales de envasado, instrucciones
para utilizar los componentes y/o los métodos, uno o más
recipientes (tubos de reacción, columnas, etc.)) para contener los
componentes se describen en la presente memoria. Los kits pueden
contener una biblioteca de multímeros, o un único tipo de multímero.
Los kits también pueden incluir reactivos adecuados para promover
la unión a la molécula diana, tales como tampones o reactivos que
facilitan la detección, incluyendo moléculas marcadas
detectablemente. Los patrones para la calibración de la unión del
ligando a un dominio monomérico o similar, también pueden estar
incluidos en los kits de la invención.
Asimismo se describen en la presente memoria
análisis de unión comercialmente valiosos y kits para poner en
práctica los análisis. En algunos de los análisis se emplean uno o
más ligandos para detectar la unión de un dominio monomérico, y/o
multímero. Tales análisis se basan en cualquier método conocido en
la técnica, p. ej., citometría de flujo, microscopía fluorescente,
resonancia de plasmón, y similares, para detectar la unión de uno o
varios ligandos al dominio monomérico y/o multímero.
También se proporcionan los kits basados en el
análisis. Los kits incluyen típicamente un recipiente, y uno o más
ligandos. Los kits opcionalmente comprenden instrucciones para
realizar los análisis, reactivos de detección adicionales,
tampones, o instrucciones para el uso de cualquiera de estos
componentes, o similares. Alternativamente, los kits pueden incluir
células, vectores, (p. ej., vectores de expresión, vectores de
secreción que comprenden un polipéptido de la invención), para la
expresión de un dominio monomérico y/o un multímero de la
invención.
También se describen en la presente memoria
ordenadores, medios legibles con ordenador y sistemas integrados
que comprenden una serie de caracteres correspondientes a dominios
monoméricos, dominios monoméricos seleccionados, multímeros y/o
multímeros seleccionados y ácidos nucleicos que codifican tales
polipéptidos. Estas secuencias pueden ser manipuladas mediante
métodos de barajado in silico, o mediante un soporte lógico
de alineamiento de secuencias o procesamiento de texto
convencional.
Por ejemplo, diferentes tipos de similitud y
consideraciones de restricción variable y longitud de la serie de
caracteres pueden ser detectados y reconocidos en los sistemas
integrados en la presente memoria. Por ejemplo, se han diseñado
muchos métodos de determinación de la homología para el análisis
comparativo de secuencias de polímeros, para la corrección
ortográfica en el procesamiento de textos, y para la recuperación de
datos de diferentes bases de datos. Con una interpretación de las
interacciones del complemento por pares de la doble hélice entre
las 4 nucleobases principales en los polinucleótidos naturales,
también se pueden utilizar modelos que simulan la hibridación de
series de polinucleótidos homólogos complementarios como fundamento
de un alineamiento de secuencias u otras operaciones realizadas
típicamente sobre las series de caracteres correspondientes a las
secuencias en la presente memoria (p. ej., manipulaciones del
procesamiento de textos, construcción de figuras que comprenden
series de caracteres de una secuencia o subsecuencia, tablas de
rendimiento, etc.). Un ejemplo de un paquete de soporte lógico con
GOs para calcular la similitud de secuencias es BLAST, que puede
ser adaptado a la presente invención mediante aportación de series
de caracteres correspondientes a las secuencias de la presente
memoria.
BLAST es descrito por Altschul et al.,
(1990) J. Mol. Biol. 215:403-410. El soporte lógico
para realizar análisis BLAST es asequible públicamente a través del
National Center for Biotechnology Information (asequible en la Red
Informática Mundial en ncbi.nlm.nih.gov). Este algoritmo implica
identificar primero pares de secuencia de elevada puntuación (HSP
en sus siglas en inglés) identificando palabras cortas de longitud W
en la secuencia problema, que emparejan o satisfacen cierta
puntuación umbral T con valor positivo cuando se alinean con una
palabra de la misma longitud de una secuencia de la base de datos. T
es referdio como el umbral de puntuación de la palabra vecina
(Altschul et al., supra). Estos aciertos de la palabra vecina
inicial actúan como semillas para iniciar las búsquedas para
encontrar HSP que las contengan. Los éxitos de las palabras se
amplían después en ambas direcciones a lo largo de cada secuencia
tanto como se pueda incrementar la puntuación del alineamiento
cumulativo. Las puntuaciones cumulativas se calculan utilizando,
para las secuencias de nucleótidos, los parámetros M (puntuación de
recompensa para un par de residuos de emparejamiento; siempre >
0) y N (puntuación de penalización para residuos de emparejamientos
erróneos; siempre < 0). Para las secuencias de aminoácidos, se
utiliza una matriz de puntuación para calcular la puntuación
cumulativa. La extensión de los aciertos de palabras en cada
dirección se detiene cuando: la puntuación de alineamiento
cumulativo cae en una cantidad X desde su valor máximo alcanzado;
la puntuación cumulativa tiende a cero o menos, debido a la
acumulación de uno o más alineamientos de residuos de puntuación
negativa; o se alcanza el extremo de cualquier secuencia. Los
parámetros del algoritmo BLAST W, T, y X determinan la sensibilidad
y velocidad del alineamiento. El programa BLASTN (para secuencias
de nucleótidos) utiliza por defecto una longitud de palabra (W) de
11, una esperanza (E) de 10, un corte de 100, M=5, N=-4, y una
comparación de ambas hebras. Para las secuencias de aminoácidos, el
programa BLASTP utiliza por defecto una longitud de palabra (W) de
3, una esperanza (E) de 10, y la matriz de puntuación BLOSUM62
(véase Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci. USA
89:10915).
Un ejemplo adicional de un algoritmo de
alineamiento de secuencias útil es PILEUP. PILEUP crea un
alineamiento de múltiples secuencias a partir de un grupo de
secuencias relacionadas utilizando alineamientos por pares,
progresivos. También puede trazar un árbol que muestra las
relaciones de agrupación utilizadas para crear el alineamiento.
PILEUP utiliza una simplificación del método de alineamiento
progresivo de Feng & Doolittle, (1987) J. Mol. Evol.
35:351-360. El método utilizado es similar al método
descrito por Higgins & Sharp, (1989) CABIOS
5:151-153. El programa puede alinear, p. ej., hasta
300 secuencias de una longitud máxima de 5.000 letras. El
procedimiento de alineamiento múltiple comienza con el alineamiento
por pares de las dos secuencias más similares, produciendo una
agrupación de dos secuencias alineadas. Esta agrupación se puede
alinear después con la siguiente secuencia o agrupación más
relacionada de secuencias alineadas. Dos agrupaciones de secuencias
pueden ser alineadas mediante una simple extensión del alineamiento
por pares de dos secuencias individuales. El alineamiento final se
logra mediante una serie de alineamientos por pares, progresivo. El
programa también puede ser utilizado para trazar un dendrograma o
representación en árbol de relaciones de agrupamientos. El programa
se ejecuta diseñando secuencias específicas y sus coordenadas de
aminoácidos o nucleótidos para las regiones de comparación de la
secuencia. Por ejemplo, con el fin de determinar los aminoácidos
conservados en una familia de dominios monoméricos o para comparar
las secuencias de dominios monoméricos en una familia, la secuencia
de la invención, o los ácidos nucleicos codificantes, se alinean
para proporcionar información sobre la
estructura-función.
En un aspecto descrito en la presente memoria se
utiliza el sistema computarizado para realizar la recombinación de
secuencia "in silico" o el barajado de las series de
caracteres correspondientes a los dominios monoméricos. Una
variedad de tales métodos se expone en "Methods For Making
Character Strings, Polynucleotides & Polypeptides Having
Desired Characteristics" de Selifonov y Stemmer, presentado el 5
de Febrero, 1999 (USSN 60/118854) y "Methods For Making Character
Strings, Polynucleotides & Polypeptides Having Desired
Characteristics" de Selifonov y Stemmer, presentada el 12 de
Octubre, 1999 (USSN 09/416,375). En resumen, se utilizan operadores
genéticos en algoritmos genéticos para cambiar secuencias dadas, p.
ej., imitando eventos genéticos tales como la mutación,
recombinación, muerte y similares. El análisis
multi-dimensional para optimizar las secuencias se
puede realizar también en el sistema computarizado, p. ej., como se
describe en la solicitud '375.
Un sistema digital también puede ordenar a un
sintetizador de oligonucleótidos que sintetice oligonucleótidos, p.
ej., utilizados para la reconstrucción o recombinación génicas, o
para organizar oligonucleótidos de fuentes comerciales (p. ej.,
imprimiendo los impresos de solicitud apropiados o conectándose a un
impreso de solicitud en la Red).
El sistema digital también puede incluir
elementos de salida para controlar la síntesis de ácido nucleico
(p. ej., basándose en una secuencia o un alineamiento de un
dominio monomérico recombinante, p. ej., barajado como en la
presente memoria), esto es, un sistema integrado de la invención
incluye opcionalmente un sintetizador de oligonucleótidos o un
controlador de la síntesis de oligonucleótidos. El sistema puede
incluir otras operaciones que se producen aguas abajo de un
alineamiento u otra operación realizada utilizando una serie de
caracteres correspondiente a una secuencia de la presente memoria,
p. ej., como se ha indicado antes con referencia a los
análisis.
El siguiente ejemplo se ofrece para ilustrar, no
para limitar la invención reivindicada.
Ejemplo
1
Este ejemplo describe la selección de dominios
monoméricos y la creación de multímeros.
Los materiales de partida para identificar
dominios monoméricos y crear multímeros a partir de los dominios
monoméricos y los procedimientos seleccionados pueden derivar de
cualquiera de una variedad de secuencias humanas y/o no humanas.
Por ejemplo, para producir un dominio monomérico seleccionado con
una unión específica a un ligando o mezcla de ligandos deseados, se
seleccionan uno o más genes de dominios monoméricos a partir de una
familia de dominios monoméricos que se unen a cierto ligando. Las
secuencias de ácido nucleico que codifican el uno o más genes de
dominios monoméricos pueden ser obtenidas mediante amplificación por
PCR de ADN genómico o ADNc, u opcionalmente, pueden ser producidas
sintéticamente utilizando oligonucleótidos solapantes.
Muy comúnmente, estas secuencias se clonan
después en un formato de presentación sobre la superficie celular
(esto es, presentación en la superficie bacteriana, de levadura, o
de mamífero (COS); presentación en fagos) para la expresión y el
escrutinio. Las secuencias recombinantes son transfectadas
(transducidas o transformadas) en la célula anfitriona apropiada en
la que son expresadas y presentadas sobre la superficie de la
célula. Por ejemplo, las células pueden ser teñidas con un ligando
deseado marcado (p. ej., marcado fluorescentemente). Las células
teñidas se clasifican mediante citometría de flujo, y los genes que
codifican los dominios monoméricos son recuperados (p. ej.,
mediante aislamiento de plásmidos, PCR o expansión y clonación) de
las células positivas. El procedimiento de tinción y clasificación
se puede repetir múltiples veces (p. ej., utilizando concentraciones
progresivamente decrecientes del ligando deseado hasta que se
obtiene el nivel de enriquecimiento deseado). Alternativamente, se
puede utilizar cualquier método de escrutinio o detección conocido
en la técnica que se pueda emplear para identificar las células que
se unen al ligando o mezcla de ligandos deseados.
Los genes que codifican los dominios monoméricos
seleccionados recuperados de las células de unión al ligando o
mezcla de ligandos deseados pueden ser opcionalmente recombinados de
acuerdo con cualquiera de los métodos descritos en la presente
memoria o en las referencias citadas. Las secuencias recombinantes
producidas en esta ronda de diversificación son escrutadas después
mediante el mismo o diferente método para identificar genes
recombinantes con una afinidad mejorada para el ligando deseado o
diana. El procedimiento de diversificación y selección se repite
opcionalmente hasta que se obtiene una afinidad deseada.
Los ácidos nucleicos del dominio monomérico
seleccionado elegidos mediante los métodos pueden ser unidos entre
sí por medio de una secuencia conectora para crear multímeros, p.
ej., mediante ensamblaje combinatorio de secuencias de ácido
nucleico que codifican los dominios monoméricos seleccionados
mediante ligación de ADN, u opcionalmente, reacciones de
solapamiento autocebado, basadas en PCR. Las secuencias de ácido
nucleico que codifican los multímeros son clonadas después en un
formato de presentación en la superficie celular (esto es,
presentación en la superficie de células bacterianas, de levadura, o
de mamífero (COS); presentación en fagos) para su expresión y
escrutinio. Las secuencias recombinantes son transfectadas
(transducidas o transformadas) en la célula anfitriona apropiada
donde son expresadas y presentadas sobre la superficie de la célula.
Por ejemplo, las células pueden ser teñidas con un ligando o mezcla
de ligandos deseados, marcados, p. ej., marcados fluorescentemente.
Las células teñidas se clasifican mediante citometría de flujo, y
los genes que codifican los multímeros seleccionados se recuperan
(p. ej., mediante PCR o expansión y clonación) de las células
positivas. Las células positivas incluyen multímeros con una avidez
o afinidad mejorada o una especificidad alterada hacia el ligando o
mezcla de ligandos deseados en comparación con los dominios
monoméricos seleccionados. El procedimiento de tinción y
clasificación se puede repetir múltiples veces (p. ej., utilizando
concentraciones progresivamente decrecientes del ligando o mezcla
de ligandos deseados hasta obtener un nivel de enriquecimiento
deseado). Alternativamente, se puede emplear cualquier método de
escrutinio o detección conocido en la técnica que se puede utilizar
para identificar células que se unen al ligando o mezcla de ligandos
deseados.
Los genes que codifican el multímero
seleccionado recuperados de las células de unión al ligando o mezcla
de ligandos deseados pueden ser opcionalmente recombinados de
acuerdo con cualquiera de los métodos descritos en la presente
memoria o en las referencias citadas. Las secuencias recombinantes
producidas en esta ronda de diversificación son escrutadas después
mediante el mismo o diferente método para identificar los genes
recombinantes con una avidez o afinidad mejoradas o una
especificidad alterada para el ligando deseado o diana. El
procedimiento de diversificación y selección se repite opcionalmente
hasta que se obtiene una avidez o afinidad deseadas o una
especificidad alterada.
Ejemplo
2
Este ejemplo describe el desarrollo de una
biblioteca de multímeros formada por dominios C2.
Se crea una genoteca de secuencias de ADN que
codifican dominios monoméricos C2 mediante PCR de ensamblaje como
describen Stemmer et al., Gene 164, 49-53
(1995). Los oligonucleótidos utilizados en esta reacción de PCR
son:
Los fragmentos de la PCR se digieren con BamHI y
XhoI. Los productos de la digestión se separan sobre un gel de
agarosa al 1,5% y los fragmentos del dominio C2 se purifican a
partir del gel. Los fragmentos de ADN se ligan en los
correspondientes sitios de restricción del vector pYD1 de
presentación en la superficie de levadura (Invitrogen).
La mezcla de ligación se utiliza para la
transformación de la cepa de levadura EBY100. Los transformantes se
seleccionan haciendo crecer las células en medio selectivo que
contiene glucosa (-Trp) a 30ºC.
La presentación en la superficie de la
biblioteca de dominios C2 es inducida haciendo crecer las células en
medio selectivo que contiene galactosa a 20ºC. Las células se
enjuagan con PBS y después se incuban con proteína diana marcada
fluorescentemente y se enjuagan de nuevo en PBS.
Después las células se clasifican mediante FACS
y las células positivas se hacen crecer de nuevo en medio selectivo
que contiene glucosa. Se puede utilizar el cultivo celular para una
segunda ronda de clasificación o se puede utilizar para el
aislamiento del ADN plasmídico. El ADN plasmídico purificado se
utiliza como molde para amplificar por PCR las secuencias de ADN
que codifican el dominio C2.
Los oligonucleótidos utilizados en esta reacción
de PCR son:
Los fragmentos de la PCR son digeridos después
con AlwNI, los productos de la digestión son separados sobre un gel
de agarosa al 1,5% y los fragmentos del dominio C2 son purificados
del gel. Con posterioridad, los fragmentos de la PCR son
multimerizados mediante ligación de ADN en presencia de fragmentos
de terminación. Los fragmentos de terminación se enumeran más
abajo:
Terminación1:
Terminación2:
La mezcla de ligación es digerida después EcoRI
y HindIII.
Los multímeros se separan sobre gel de agarosa
al 1% y los fragmentos de ADN correspondientes a
terminación1-C2-C2-terminación2
se purifican del gel. Los fragmentos
terminación1-C2-C2-terminación2
se amplifican mediante PCR utilizando cebadores
5'-aattcaacgctactaccat-3' y
5'-agcttcattacccaaatcaac-3' y con
posterioridad se digieren con BamHI y XhoI. Opcionalmente, los
polinucleótidos que codifican los multímeros se pueden someter a una
ronda adicional de escrutinio de afinidad (p. ej., análisis FACS
como se ha descrito antes).
Con posterioridad, se aíslan y se secuencian los
aglutinantes de alta afinidad. El ADN que codifica los aglutinantes
de alta afinidad se clona en un vector de expresión y se replican en
un anfitrión adecuado. Las proteínas expresadas se purifican y
caracterizan.
\vskip1.000000\baselineskip
Ejemplo
3
Este ejemplo describe el desarrollo de una
genoteca de trímeros que comprende dominios A de receptores de
LDL.
Se crea una genoteca de secuencias de ADN que
codifican dominios A monoméricos mediante PCR de ensamblaje como
describen Stemmer et al., Gene 164, 49-53
(1995). Los oligonucleótidos utilizados en esta reacción de PCR
son:
donde R=A/G, Y=C/T, M=A/C, K=G/T,
S=C/G, W=A/T, B=C/G/T, D=A/G/T, H=A/C/T, V=A/C/G, y
N=A/C/G/T.
Los fragmentos de PCR se digieren con XmaI y
SfiI. Los productos de digestión se separan sobre gel de agarosa al
3% y los fragmentos del dominio A se purifican a partir del gel. Los
fragmentos de ADN se ligan después en los sitios de restricción
correspondientes del vector de presentación en fagos
fuse5-HA, un derivado de fuse5. La mezcla de
ligación es sometida a electroporación en células E. coli
electrocompetentes (cepa F p. ej. Top10 o MC1061). Las células
E. coli transformadas se desarrollan durante la noche en
medio 2xYT que contiene 20 \mug/ml de tetraciclina.
Los viriones se purifican a partir de este
cultivo mediante precipitación con PEG. La proteína diana se
inmoviliza sobre una superficie sólida (p. ej. placa Petri o placa
de microtitulación) directamente mediante incubación en NaHCO_{3}
0,1 M o indirectamente a través de una conexión
biotina-estreptavidina. Los viriones purificados se
añaden a un número típico de ~1-3 x 10^{11} TU. La
placa Petri o la placa de microtitulación se incuba a 4ºC, se lava
varias veces con tampón de lavado (TBS/Tween) y los fagos unidos se
hacen eluir añadiendo glicina.tampón HCl. El producto eluido se
neutraliza añadiendo Tris-HCl 1 M (pH 9,1).
Los fagos se amplifican y se utilizan con
posterioridad como aporte para una segunda ronda de selección de
afinidad. El ADNss se extrae del producto eluido final utilizando el
kit QIAprep M13 kit. El ADNss se utiliza como molde para amplificar
mediante PCR los dominios A que codifican las secuencia de ADN.
Los oligonucleótidos utilizados en esta reacción
de PCR son:
5'-aagcctcagcgaccgaa
5'-agcccaataggaacccat
Los fragmentos de la PCR se digieren con AlwNI y
BglI. Los productos de la digestión se separan sobre gel de agarosa
al 3% y los fragmentos del dominio A se purifican del gel. Los
fragmentos de la PCR se multimerizan mediante ligación con ADN en
presencia de los siguientes fragmentos de terminación:
Terminación1:
Terminación2:
La mezcla de ligación se digiere con EcoRI y
HindIII.
Los multímeros se separan sobre gel de agarosa
al 1% y los fragmentos de ADN correspondientes a
terminación1-A-A-A-terminación2
se purifican del gel. Los fragmentos
terminación1-A-A-A-terminación2
se amplifican con posterioridad mediante PCR utilizando cebadores
5'-agcttcattacccaaatcaac-3' y 5'
aattcaacgctactaccat-3' y con posterioridad se
digieren con XmaI y SfiI. Los polinucleótidos seleccionados se
clonan después en un sistema de expresión en fagos y se prueba su
afinidad por la proteína diana.
Los aglutinantes de alta afinidad se aíslan y
secuencian con posterioridad. El ADN que codifica los aglutinantes
de alta afinidad se clona en un vector de expresión y se expresa con
posterioridad en un anfitrión adecuado. La proteína expresada se
purifica y se caracteriza después.
Claims (17)
1. Un método para identificar un multímero que
se una a una molécula diana, comprendiendo los métodos,
- (a)
- proporcionar una biblioteca de polipéptidos, comprendiendo los polipéptidos diferentes dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos, comprende al menos dos enlaces disulfuro, y es un dominio de clase A del receptor de LDL;
- (b)
- escrutar la biblioteca de polipéptidos en busca de la afinidad para una molécula diana;
- (c)
- identificar al menos un primer polipéptido que comprende un primer dominio monomérico que se une específicamente a una molécula diana;
- (d)
- conectar el primer dominio monomérico a una pluralidad de diferentes dominios monoméricos para formar una biblioteca de diferentes multímeros, comprendiendo los multímeros el primer dominio monomérico y uno de una pluralidad de diferentes dominios monoméricos;
- (e)
- escrutar la biblioteca de multímeros en busca de la capacidad para unirse a la molécula diana; y
- (f)
- identificar un multímero que se une específicamente a la molécula diana, donde el multímero comprende el primer dominio monomérico y un segundo dominio monomérico.
\vskip1.000000\baselineskip
2. El método de la reivindicación 1, donde el
multímero seleccionado comprende al menos tres dominios
monoméricos.
3. El método de cualquiera de las
reivindicaciones precedentes, donde la biblioteca de multímeros se
expresa como una presentación en fagos, una presentación en
ribosomas, o una presentación en la superficie celular.
4. El método de cualquiera de las
reivindicaciones precedentes, donde los dominios monoméricos están
conectados por un conector polipeptídico heterólogo.
5. Un método para identificar un multímero que
se une a al menos una molécula diana, comprendiendo el método:
- (a)
- proporcionar una biblioteca de multímeros, donde cada multímero comprende al menos dos dominios monoméricos, donde cada dominio monomérico tiene 30-100 aminoácidos y comprende al menos dos enlaces disulfuro, separados por un conector heterólogo donde los dominios monoméricos son dominios de clase A del receptor de LDL; y
- (b)
- escrutar la biblioteca de multímeros en busca de multímeros que se unen a la molécula diana.
\vskip1.000000\baselineskip
6. El método de la reivindicación 5, que
comprende adicionalmente identificar los multímeros que se unen a
la molécula diana que tienen una avidez por la molécula diana que es
mayor que la avidez de un dominio monomérico sencillo por la
molécula diana.
7. El método de la reivindicación 5 o la
reivindicación 6, donde uno o más de los multímeros comprende un
dominio monomérico que se une específicamente a una segunda molécula
diana.
8. Una biblioteca de multímeros, donde
- (a)
- cada multímero comprende al menos dos dominios monoméricos conectados por un conector heterólogo, donde cada dominio monomérico tiene 30-100 aminoácidos y comprende al menos dos enlaces disulfuro; y
- (b)
- los dominios monoméricos son dominios de clase A del receptor de LDL.
\vskip1.000000\baselineskip
9. La biblioteca de la reivindicación 8, donde
cada dominio monomérico de los multímeros es un dominio monomérico
de origen no natural.
10. La biblioteca de la reivindicación 8, donde
los dominios monoméricos están conectados por un conector
polipeptídico.
11. El método o la biblioteca de cualquiera de
las reivindicaciones anteriores, donde la biblioteca contiene al
menos 100 miembros.
12. Un polipéptido que comprende al menos dos
dominios monoméricos separados por un conector heterólogo, donde
cada dominio monomérico tiene 30-100 aminoácidos y
comprende al menos dos enlaces disulfuro, donde cada dominio
monomérico se une específicamente a una molécula diana y donde los
dominios monoméricos son dominios de clase A del receptor de
LDL.
13. El polipéptido de la reivindicación 12,
donde cada dominio monomérico es un dominio monomérico de proteína
de origen no natural.
14. El polipéptido de la reivindicación 12,
donde el polipéptido comprende un primer dominio monomérico que se
une a una primera molécula diana y un segundo dominio monomérico que
se une a una segunda molécula diana.
15. El polipéptido de la reivindicación 12,
donde el polipéptido comprende dos dominios monoméricos, teniendo
cada uno especificidad de unión por un sitio diferente en una
primera molécula diana.
16. El polipéptido de la reivindicación 12,
donde el polipéptido comprende al menos tres dominios
monoméricos.
17. El polipéptido de la reivindicación 12,
donde los dominios monoméricos están conectados por un segundo
conector polipeptídico.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28682301P | 2001-04-26 | 2001-04-26 | |
US286823P | 2001-04-26 | ||
US337209P | 2001-11-19 | ||
US333359P | 2001-11-26 | ||
US374107P | 2002-04-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2348355T3 true ES2348355T3 (es) | 2010-12-03 |
Family
ID=43401971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES02725828T Expired - Lifetime ES2348355T3 (es) | 2001-04-26 | 2002-04-26 | Bibliotecas combinatorias de dominios monoméricos. |
Country Status (1)
Country | Link |
---|---|
ES (1) | ES2348355T3 (es) |
-
2002
- 2002-04-26 ES ES02725828T patent/ES2348355T3/es not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1390535B1 (en) | Combinatorial libraries of monomer domains | |
US20060286603A1 (en) | Combinatorial libraries of monomer domains | |
AU2002256371A1 (en) | Combinatorial libraries of monomer domains | |
US20050048512A1 (en) | Combinatorial libraries of monomer domains | |
US20050164301A1 (en) | LDL receptor class A and EGF domain monomers and multimers | |
US20040175756A1 (en) | Methods for using combinatorial libraries of monomer domains | |
US7968681B2 (en) | c-MET kinase binding proteins | |
US20050053973A1 (en) | Novel proteins with targeted binding | |
US20050089932A1 (en) | Novel proteins with targeted binding | |
US20100204052A1 (en) | Protein scaffolds and uses thereof | |
CN101878303B (zh) | 使用包含非天然氨基酸的蛋白质进行定向进化 | |
US7786262B2 (en) | IL-6 binding proteins | |
WO1992002536A1 (en) | Systematic polypeptide evolution by reverse translation | |
EP1539943A2 (en) | Method for identifying mhc-presented peptide epitopes for t cells | |
KR20130065215A (ko) | 단백질 골격모듈을 포함하는 융합 폴리펩타이드 및 이를 이용한 목적 단백질에 특이적인 펩타이드 라이브러리 스크리닝 방법 | |
ES2348355T3 (es) | Bibliotecas combinatorias de dominios monoméricos. | |
CA2587463A1 (en) | Protein scaffolds and uses therof | |
CN112375741A (zh) | 一种高表达sars-cov2-rbd的细胞株及其方法 | |
Björklund | Microtubule associated proteins 1B and 1S: interactions with NR1 and NR3A |