MXPA03003810A - Genes de glifosato n-acetiltransferasa (gat) novedosos. - Google Patents
Genes de glifosato n-acetiltransferasa (gat) novedosos.Info
- Publication number
- MXPA03003810A MXPA03003810A MXPA03003810A MXPA03003810A MXPA03003810A MX PA03003810 A MXPA03003810 A MX PA03003810A MX PA03003810 A MXPA03003810 A MX PA03003810A MX PA03003810 A MXPA03003810 A MX PA03003810A MX PA03003810 A MXPA03003810 A MX PA03003810A
- Authority
- MX
- Mexico
- Prior art keywords
- amino acid
- acid residue
- polypeptide
- glyphosate
- transgenic plant
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
- C12N15/8275—Glyphosate
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
Abstract
En la presente se proveen proteinas novedosas, que incluyen proteinas capaces de catalizar la acetilacion de glifosato y otras proteinas estructuralmente relacionadas. Tambien se proveen polinucleotidos novedosos capaces de codificar estas proteinas, composiciones que incluyen una o mas de estas proteinas y/o polinucleotidos novedosos, celulas recombinantes y plantas transgenicas que incluyen estos compuestos novedosos, metodos de diversificacion que comprenden los compuestos novedosos y metodos para utilizar los compuestos. Algunos de los metodos y compuestos novedosos proporcionados en la presente pueden ser utilizados para hacer a un organismo, tal como una planta, resistente a glifosato.
Description
GENIS DE GLIFOSATO N-ACETILTRANSFERASA (GAT) NOVEDOSOS REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS Esta solicitud reivindica la prioridad y el beneficio de la Solicitud de Patente Provisional Norteamericana No. de Serie 60/244,385 presentada el 30 de octubre del 2000, la descripción de la cual es incorporada en la presente por referencia en su totalidad para todos los propósitos . NOTIFICACION DE DERECHOS DE AUTOR CONFORME A 37 C.F.R.S 1.71(E) Una porción de la descripción de este documento de patente contiene material que es subordinado a la protección de derechos de autor. El propietario de derechos de autor no tiene objeción para la reproducción por facsímil mediante cualquiera del documento de patente o la descripción de patente, ya que se presenta en el archivo o registros de patente de la Oficina de Patentes y Marcas, pero de otra manera se reserva todos los derechos de autor cualquiera que sean. ANTECEDENTES DE LA INVENCION La selectividad del cultivo a herbicidas específicos puede ser conferida al diseñar genes en cultivos que codifican enzimas de metabolización de herbicida apropiadas. En otros casos estas enzimas, y los ácidos nucleicos que las codifican, se originan en una planta. En otros casos ellas son derivadas de otros organismos, tales como microbios. Ver, por ejemplo, Padgette y colaboradores (1996) "New weed control opportunities : Development of soybeans with a Round UP Ready™ gene" en Herbicide-Resistant Crops (Duke,, ed.), pp54-84, CRC Press, Boca Ratón; y Vasil (1996) "Phosphínothricin-resistant crops" en Herbicide-Resistant Crops (Duke, ed.), pp85-91. En realidad, las plantas transgénicas se han diseñado para expresar una variedad de genes de tolerancia/metabolización del herbicida, a partir de una variedad de organismos. Por ejemplo, la acetohldroxi ácido sintasa, que se ha encontrado que hace a las plantas que expresen esta enzima resistente a múltiples tipos de herbicidas, se ha introducido a una variedad de plantas (ver, por ejemplo, Hattori y colaboradores (1995) M l Gen Genet 246:419. Otros genes que confieren tolerancia a los herbicidas incluyen: un gen que codifica una proteina quimérica del citocromo P4507A1 de rata y NADPH-citocromo P450 ox doreductasa de levadura (Shiota y colaboradores (1994) Plant PhysiolPlant Physiol 106:17), genes para glutationa reductasa y superóxido dismutasa (Aono y colaboradores (1995) Plant Cell Physiol 36:1687, y genes para varias fosfotransferasas (Datta y colaboradores (1992) Plant Mol Biol 20:619. Un herbicida que es el sujeto de mucha investigación a este respecto es la N-fosfonometilglicina, comúnmente referida como glifosato. El glifosato es el herbicida de mayor venta en el mundo, con ventas proyectadas que alcanzan 5 billones de dólares para el 2003. Es un herbicida de amplio espectro que extermina las plantas tanto de hoja ancha como de tipo hierba. Un modo exitoso de la resistencia al glifosato a escala comercial en las plantas transgénicas es mediante la introducción de un gen Agrobacterium CP4 5-enolpiruvilshikimato-3-fosfato sintasa modificado (después en la presente referido como EPSP 3intasa o EPSPS) . El transgen está dirigido al cloroplasto donde es capaz de continuar sintetizando la EPSP del ácido fosfoenolpirúvico (PEP) y shikimato-3-fosf to en la presencia de glifosato. En contraste, la EPSP sintasa natural es inhibida por el glifosato . Sin el transgen, las plantas rociadas con glifosato rápidamente mueren debido a la inhibición de la EPSP sintasa que interrumpe la trayectoria corriente abajo necesaria para el aminoácido aromático, la hormona y la biosintesis de vitamina. Las plantas transgénicas de soya resistentes al CP4 glifosato son comercializadas, por ejemplo, por Monsanto bajo el nombre "Round UP Ready™". En el medio ambiente, el mecanismo predominante mediante el cual glifosato es degradado es a través del metabolismo de la microflora de la tierra. El metabolito primario de glifosato en la tierra se ha identificado como ácido aminometilfosfónico (AMPA) , que es finalmente convertido en amoniaco, fosfato y dióxido de carbono- El esquema metabólico propuesto que describe la degradación de glifosato en la tierra a través de la ruta AMPA es mostrado en la Figura 8. Una ruta metabólica alternativa para la descomposición del glifosato por ciertas bacterias de la tierra, la ruta de sarcosina, ocurre via la segmentación inicial de la unión C-P para dar fosfato inorgánico y sarcosina, como es representado en la Figura 9. Otro paquete de herbicida/cultivo transgénico exitoso es el glufosinato ( fosfinotricina) y la cualidad LibertyLink™ comercializada, por ejemplo, por Aventis . El glufosinato también es un herbicida de amplio espectro. Su objetivo es la enzima glutamato sintasa del cloroplasto. Las plantas resistentes llevan el gen de barra del Streptomyces hygroscopicus y obtienen resistencia mediante la actividad de la N-acetilación de la barra, que modifica y destoxifica al glufosinato . Una enzima capaz de acetilar la amina primaria de AMPA es reportada en la solicitud PCT No. WO00/29596. La enzima no fue descrita para ser capaz de acetilar un compuesto con una amina secundaria (por ejemplo, glifosato) . Mientras que una variedad de estrategias de resistencia al herbicida, son disponibles como es mencionado anteriormente, los procedimientos adicionales tendrán valor comercial considerable. La presente invención provee, por ejemplo, polinucleótidos y polipéptidos novedosos para conferir tolerancia al herbicida, asi como otros numerosos beneficios como llegaran a ser evidentes durante la revisión de la descripción. BREVE DESCRIPCION DE LA INVENCION Un objeto de la presente invención es proporcionar métodos y reactivos para volver a un organismo, tal como una planta, resistente a glifosato. Estos y otros objetivos de la invención son proporcionados por una o más de las modalidades descritas a continuación. Una modalidad de la invención provee polipéptidos novedosos referidos en la presente como polipéptidos de GAT. Los polipéptidos de GAT son caracterizados por su similaridad estructural entre si, por ejemplo, en términos de similaridad de secuencia cuando los polipéptidos de GAT son alineados entre si. Algunos polipéptidos de GAT poseen actividad de glifosato N-acetil transferasa, es decir, la capacidad para catalizar la acetilación de glifosato. Algunos polipéptidos de GAT también son capaces de catalizar la acetilación de análogos de glifosato y/o metabolitos de glifosato, por ejemplo, ácido aminometilfosfónico . También se proveen polinucleótidos novedosos referidos en la presente como polinucleótidos de GAT. Los polinucleótidos de GAT son caracterizados por su capacidad para codificar polipéptidos de GAT. En algunas modalidades de la invención, un polinucleótido de GAT es diseñado para la mejor expresión de la planta al reemplazar uno o más codones de origen con un codón sinónimo que es preferencialmente utilizado en plantas con relación al codón de origen. En otras modalidades, un polinucleótido de GAT es modificado por la introducción de una secuencia de nucleótidos que codifican un péptido de tránsito de cloroplasto N-terminal. Los polipéptidos de GAT, polinucleótidos de GAT y la actividad de glifosato N-acetil transferasa se describen en más detalle después . La invención además incluye ciertos fragmentos de los polipéptidos de GAT y polinucleótidos de GAT descritos en la presente. La invención incluye variantes no naturales de los polipéptidos y polinucleótidos descritos en la presente, en donde uno o más aminoácidos del polipéptido codificado se han mutado . La invención además provee una construcción de ácido nucleico que comprende un polinucleótido de la invención. La construcción puede ser un vector, tal como un vector de transformación de planta. En algunos aspectos, un vector de la invención comprenderá una secuencia de T-DNA. La construcción opcionalmente puede incluir una secuencia reguladora (por ejemplo, un promotor) operablemente enlazada a un polinucleótido de GAT, donde el promotor es heterólogo con respecto al polinucleótido y efectivo para ocasionar la expresión suficiente del polipéptido codificado para aumentar la tolerancia a glifosato de una célula de planta transformada con la construcción de ácido nucleico. En algunos aspectos de la invención, un polinucleótido de GAT funciona como un marcador seleccíonable, por ejemplo, en una planta, bacterias, actinomycetes, levadura, algas u otros hongos. Por ejemplo, un organismo, que se ha transformado con un vector que incluye un marcador seleccíonable de polinucleótido de GAT puede ser seleccionado en base a su capacidad para crecer en la presencia de glifosato. Un gen marcador de GAT puede ser utilizado para la selección o clasificación para células transformadas que expresan el gen. La invención además provee vectores con cualidades apiladas, es decir, vectores que codifican una GAT y que también incluyen una segunda secuencia de polinucleótido que codifica un segundo polipéptido que confiere una cualidad fenotípica detectable en una célula u organismo que expresa el segundo polipéptido a un nivel efectivo. La cualidad fenotípica detectable puede funcionar como un marcador seleccíonable, por ejemplo, al conferir resistencia al herbicida, resistencia a la plaga, o al proporcionar alguna clase de marcador visible. En una modalidad, la invención proporciona una s
composición que comprende dos o más polinucleótidos de la invención . Las composiciones que contienen dos o más polinucleótidos de GAT o polipéptidos codificados son una característica de la invención. En algunos casos, estas composiciones son bibliotecas de ácidos nucleicos que contienen, por ejemplo, por lo menos 3 o más de tales ácidos nucleicos. Las composiciones producidas al digerir los ácidos nucleicos de la invención con una endonucleasa de restricción, una DNAsa o una RNAasa, o de otra manera al fragmentar los ácidos nucleicos, por ejemplo, el corte mecánico, segmentación química, etc., también son una característica de la invención, como son las composiciones producidas al incubar un ácido nucleico de la invención con trifosfatos de desoxirubonucleótido y una polimerasa de ácido nucleico, tal como una polimerasa de ácido nucleico termoestable . Las células transducidas por un vector de la invención, o que de otra manera incorporan el ácido nucleico de la invención, son un aspecto de la invención- En una modalidad preferida, las células expresan un polipéptido codificado por el ácido nucleico. En algunas modalidades, las células que incorporan los ácidos nucleicos de la invención son células de plantas . Las plantas transgénicas , las células de plantas transgénicas y las explantaciones de las plantas transgénicas que incorporan los ácidos nucleicos de la invención también son una característica de la invención. En algunas modalidades, las plantas transgénicas, las células de plantas transgénicas o las explantaciones de plantas transgénicas expresan un polipéptido exógeno con actividad de glifosato N-acetiltransferasa codificada por el ácido nucleico de la invención. La invención también proporciona semillas transgénicas producidas por las plantas transgénicas de la invención. La invención además proporciona plantas transgénicas o explantaciones de plantas transgénicas que tienen tolerancia aumentada a glifosato debido a la expresión de un polipéptido con actividad de glifosato N-acetiltransferasa y un polipéptido que imparte tolerancia al glifosato por otro mecanismo, tal como, una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y/o una glifosato óxido-reductasa tolerante al glifosato. En una modalidad adicional, la invención proporciona plantas transgénicas o explantaciones de plantas transgénicas que tienen tolerancia aumentada al glifosato, asi como tolerancia a un herbicida adicional debido a la expresión de un polipéptido con actividad de glifosato N-acetiltransferasa, un polipéptido que imparte tolerancia al glifosato por otro mecanismo, tal como una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y/o una glifosato óxido-reductasa tolerante al glifosato y un polipéptido que imparte tolerancia al herbicida adicional, tal como, una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. La invención también provee plantas transgénicas o explantaciones de plantas transgénicas que tienen tolerancia aumentada a glifosato, asi como tolerancia a un herbicida adicional debido a la expresión de un polipéptido con actividad de glifosato N-acetiltransferasa y un polipéptido que imparte tolerancia al herbicida adicional, tal como, una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada . Métodos para producir los polipéptidos de la invención al introducir los ácidos nucleicos que las codifican en células y luego que expresan y las recuperan de las células o el medio de cultivo son una característica de I I
la invención. En modalidades preferidas, las células que expresan los polipéptidos de la invención son células de plantas transgénicas . Los polipéptidos que son enlazados especificamente por un antisuero policlonal que reacciona contra un antigeno derivado de la SEQ ID NOS: 6-10 y 263-514, pero no una secuencia relacionada que ocurre en forma natural, por ejemplo, tal como un péptido representado por una subsecuencia del número de acceso GenBank CAA70664, asi como anticuerpos que son producidos al administrar un antigeno derivado de una o más de SEQ ID NOS: 6-10 y 263-514, y/o que enlazan específicamente a tales antigenos y que no enlazan específicamente a un polipéptido que ocurre en forma natural correspondiente al número de acceso GenBank CAA70664, son todas características de la invención. Otro aspecto de la invención se refiere a métodos de diversificación de polinucleótido para producir polinucleótidos y polipéptidos de GAT novedosos al recombinar o mutar los ácidos nucleicos de la invención in vitro o in vivo. En una modalidad, la recombinación produce por lo menos una biblioteca de polinucleótidos de GAT recombinantes . Las bibliotecas así producidas son modalidades de la invención, como son células que comprenden las bibliotecas. Además, los métodos para producir un polinucleótido de GAT modificado al mutar un ácido nucleico de la invención son modalidades de la invención. Los polinucleótidos y polipéptidos de GAT recombinantes y mutantes producidos por los métodos de la invención también son modalidades de la invención. En algunos aspectos de la invención, la diversificación se obtiene al utilizar la recombinación recursiva, que puede ser realizada in vitro, in vivo, in silico, o una combinación de las mismas. Algunos ejemplos de métodos de diversificación descritos en más detalle después, son los métodos evasivos de familia y los métodos evasivos sintéticos . La invención provee métodos para producir una planta transgénica resistente a glifosato o célula de planta que involucra transformar una planta o célula de planta con un polinucleótido que codifica glifosato N-acetiltransferasa y opcionalmente regenera una planta transgénica de la célula de planta transformada. En algunos aspectos, el polinucleótido es un polinucleótido de GAT, opcionalmente un polinucleótido de GAT derivado de una fuente bacteriana. En algunos aspectos de la invención, el método puede comprender cultivar la planta transformada o la célula de planta en una concentración de glifosato que inhibe el crecimiento de una planta de tipo silvestre de la misma especie sin inhibir el crecimiento de la planta transformada. El método puede comprender cultivar la planta transformada o la célula de planta o progenie de la planta o célula de planta en concentraciones incrementadas de glifosato y/o en una concentración de glifosato que es letal a una planta de tipo silvestre o célula de planta de la misma especie. Una planta transgénica resistente a glifosato producida por este método puede ser propagada, por ejemplo al cruzarla con una segunda planta, de tal manera, que al menos algo de progenie de la cruza exhibe tolerancia a glifosato . La invención además provee de métodos para controlar selectivamente malas hierbas en un campo que contiene un cultivo que involucra plantar el campo con semillas de cultivo o plantas que son tolerantes a glifosato como un resultado de ser transformadas por un gen que codifica una glifosato N-acetiltransferasa y aplicar al cultivo y malas hierbas en el campo una cantidad suficiente de glifosato para controlar las malas hierbas sin afectar significativamente el cultivo. La invención además provee métodos para controlar malas hierbas en un campo y prevenir la emergencia de malas hierbas resistentes a glifosato en un campo que contiene un cultivo que involucra plantar el campo con semillas de cultivo o plantas que son tolerantes al glifosato como un resultado de ser transformadas por un gen que codifica una glifosato N-acetiltransferasa y un gen que codifica un polipéptido que imparte tolerancia al glifosato por otro mecanismo, tal como, una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y/o una glifosato óxido-reductasa tolerante al glifosato y aplicar al cultivo y a las malas hierbas en el campo una cantidad suficiente de glifosato para controlar la malas hierbas sin afectar significativamente el cultivo. En una modalidad adicional, la invención provee métodos para controlar malas hierbas en un campo y prevenir la emergencia de malas hierbas resistentes al herbicida en un campo que contiene un cultivo que involucra plantar el campo con semillas de cultivo o plantas que son tolerantes a glifosato como un resultado de ser transformadas en un gen que codifica una glifosato N-acetiltran ferasa, un gen que codifica un polipéptido que imparte tolerancia al glifosato por otro mecanismo, tal como, una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y/o una glifosato óxido-reductasa tolerante al glifosato y un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional, tal como, una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada y al aplicar al cultivo y a las malas hierbas en el campo una cantidad suficiente de glifosato y un herbicida adicional tal como, un inhibidor de hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialatos, fosfinotricina, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor protox para controlar las malas hierbas sin afectar significativamente el cultivo. La invención además provee métodos para controlar malas hierbas en un campo y prevenir la emergencia de malas hierbas resistentes a herbicida en un campo que contiene un cultivo, que involucra plantar el campo con semillas de cultivo o plantas que son tolerantes a glifosato como un resultado de ser transformadas con un gen que codifica una glifosato N-acetiltransferasa y un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional, tal como, una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imid zolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada y al aplicar al cultivo y a las malas hierbas en el campo una cantidad suficiente de glifosato y un herbicida adicional, tal como, un inhibidor de hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialafos, fosfinotricina, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor protox para controlar las malas hierbas sin afectar significativamente el cultivo. La invención además provee métodos para producir una planta genéticamente transformada que es tolerante hacia el glifosato que involucra insertar en el genoma de una célula de planta, una molécula de DNA de doble hebra recombinante que comprende: (i) un promotor que funciona en células de planta para ocasionar la producción de una secuencia de RNA; (ii) una secuencia de DNA estructural que ocasiona la producción de una secuencia de RNA que codifica una GAT; y (iii) una región 3' no traducida que funciona en células de planta para ocasionar la adición de un estiramiento de poliadenil nucleótidos al extremo 3 ' de la secuencia de RNA; donde el promotor es heterólogo con respecto a la secuencia de DNA estructural y adaptado para ocasionar la expresión suficiente del polipéptido codificado para aumentar la tolerancia a glifosato en una célula de planta transformada con la molécula de DNA; obtener una célula de planta transformada; y regenerar de la célula de planta transformada una planta genéticamente transformada que ha incrementado la tolerancia al glifosato. La invención además provee métodos para producir un cultivo que involucra cultivar una planta de cultivo que es tolerante al glifosato como un resultado de ser transformada con un gen que codifica una glifosato N-acetiltransferasa, bajo condiciones tales que la planta de cultivo produce un cultivo; y cosechar una planta de la planta de cultivo. Estos métodos frecuentemente incluyen aplicar glifosato a la planta de cultivo a una concentración efectiva para controlar malas hierbas. Plantas de cultivo ejemplares incluyen algodón, maiz y semillas de soya. La invención también proporciona computadoras, medio leíble en computadora y sistemas integrados, incluyendo bases de datos que están compuestas de registros de secuencias que incluyen cadenas de caracteres correspondientes a las SEQ ID NOs: 1-154. Tale3 sistemas integrados opcionalmente incluyen, uno o más conjuntos de instrucciones para seleccionar, alinear, traducir, invertir-traducir o visualizar cualquiera o más cadenas de caracteres correspondientes a las SEQ ID NOs:l-154, entre si y/o con alguna secuencia de ácido nucleico o aminoácidos adicionales. BREVE DESCRIPCION DE LAS FIGURAS La Figura 1 representa la N-acetilación de glifosato catalizado por una glifosato N-acetiltransferasa ( "GAT" ) . La Figura 2 ilustra la detección espectroscópica de masas del N-acetilglifosato producido por un cultivo de Bacillus ejemplar que expresa una actividad de GAT natural. La Figura 3 es una tabla que ilustra la identidad relativa entre las secuencias de GAT aisladas de diferentes cepas de bacterias y yitl de Bacillus subtilis .
La Figura 4 es un mapa del plásmido pMAXY2120 para la expresión y purificación de la enzima GAT de cultivos de E. coli. La Figura 5 es una salida de la espectrometría de masas que muestra la producción de N-acetilglifosato incrementada a través del tiempo en una mezcla de reacción de enzima de GAT típica . La Figura 6 es una gráfica de los datos cinéticos de una enzima de GAT de la cual se calculó una KM de 2.9 mM para glifosato. La Figura 7 es una gráfica de los datos cinéticos tomados de los datos de la Figura 6 de la cual una de 2 uM se calculó para Acetil CoA. La Figura 8 es un esquema que describe la degradación de glifosato en la tierra a través de la ruta de AMPA. La Figura 9 es un esquema que describe la ruta de sarcosina de la degradación de glifosato. La Figura 10 es la matriz BLOSUM62. La Figura 11 es un mapa del plásmido pMAXY2190. La Figura 12 representa una construcción de T-D A con el marcador seleccionable gat. La Figura 13 representa un vector de expresión de levadura con el marcador seleccionable gat. DISCUSION DETALLADA La presente invención se refiere a una clase novedosa de enzimas que exhiben actividad de N-acetiltransferasa . En un aspecto, la invención se refiere a una clase novedosa de enzimas capaces de acetilar glifosato y análogos de glifosato, por ejemplo, enzimas que poseen actividad de glifosato N-acetiltransferasa ("GAT") . Tales enzimas son caracterizadas por la capacidad para acetilar la amina secundaria de un compuesto. En algunos aspectos de la invención, el compuesto es un herbicida, por ejemplo, glifosato, como es ilustrado esquemáticamente en la Figura 1. El compuesto también puede ser un análogo de glifosato o un producto metabólico de degradación de glifosato, por ejemplo, ácido aminometilfosfónico. Aunque la acetilación de glifosato es un paso catalítico clave en una ruta metabólica para el catabolismo de glifosato, la acetilación enzimática de glifosato por enzimas que ocurren en forma natural, aisladas o recombinantes no se han descrito previamente. Asi, los ácidos nucleicos y polipéptidos de la invención proveen una nueva ruta bioquímica para diseñar la resistencia al herbicida . En un aspecto, la invención provee genes novedosos que codifican polipéptidos de GAT. Los polinucleótidos de GAT aislados y recombinantes correspondientes a polinucleótidos que ocurren en forma natural, asi como recombinantes y diseñados, por ejemplo, polinucleótidos de GAT diversificados son una característica de la invención. Los polinucleótidos de GAT son e emplificados por las SEQ ID NOS: 1-5 y 11-262. Las secuencias de polinucleótido y polipéptido de GAT especificas son provistas como ejemplos para ayudar a ilustrar la invención, y no se proponen para limitar el alcance del género de polinucleótidos y polipéptidos de GAT descritos y/o reivindicados en la presente. La invención también provee métodos para generar y seleccionar bibliotecas diversificadas para producir polinucleótidos de GAT adicionales, incluyendo polinucleótidos que codifican polipéptidos de GAT con características mejoradas y/o aumentadas, por ejemplo, Km alterado para glifosato, tasa incrementada de catálisis, estabilidad incrementada, etc., en base a la selección de un constituyente de polinucleótido de la biblioteca para las nuevas o mejoradas actividades descritas en la presente. Tales polinucleótidos son especialmente de manera favorable empleados en la producción de plantas transgénicas resistentes a glifosato. Los polipéptidos de GAT de la invención exhiben una actividad enzimática novedosa. Especificamente, la acetilación enzimática del glifosato herbicida sintético no se ha reconocido antes de la presente invención. Asi, los polipéptidos descritos en la presente, por ejemplo, como es ejemplificado por SEQ ID NOS: 6-10 y 263-514, definen una ruta bioquímica novedosa para la destoxificación de glifosato que es funcional in vivo, por ejemplo, en plantas. Por consiguiente, los ácidos nucleicos y polipéptidos de la invención son de utilidad significante en la generación de plantas resistentes a glifosato al proveer nuevos ácidos nucleicos, polipéptidos y rutas bioquímicas para el diseño de la selectividad de herbicida en plantas transgénicas . DEFINICIONES Antes de describir la presente invención en detalle, se va a entender que esta invención no está limitada a composiciones o sistemas biológicos particulares, que por supuesto pueden varia . También se va a entender que la terminología utilizada en la presente es para el propósito de describir modalidades particulares solamente, y no se propone para ser limitativa. Como se utiliza en esta especificación y en las reivindicaciones anexa3, la3 formas singulares "un", "una" y "el" incluyen referencias plurales a menos que el contexto claramente lo dicte de otra manera. Así, por ejemplo, la referencia a "un dispositivo" incluye una combinación de dos o más de tales dispositivos, la referencia a '"una construcción de fusión de gen" incluye mezclas de construcciones y similares. A menos que se defina de otra manera, todos los términos técnicos y científicos usados en la presente tienen un significado como es entendido comúnmente por un experto ordinario en la técnica, a la cual la invención pertenece. Aunque algunos métodos y materiales similares o equivalentes a aquellos descritos en la presente, pueden ser utilizados en la práctica para la prueba de la presente invención, ejemplos específicos de materiales y métodos apropiados son descritos en la presente. En la descripción y reivindicación de la presente invención, la siguiente terminología será utilizada de acuerdo con las definiciones expuestas después. Para propósitos de la presente invención, el término "glifosato" debe ser considerado que incluye cualquier forma herbicidamente efectiva de
N-fosfonometilglicina (incluyendo cualquier sal de la misma) y otras formas que dan por resultado la producción del anión de glifosato en la planta. El término "análogo de glifosato" se refiere a cualquier análogo estructural de glifosato que tiene la capacidad de inhibir la EPSPS a niveles tales que el análogo de glifosato es herbicidamente efectivo. Como se utiliza en la presente, el término "actividad de glifosato-N-acetiltransferasa" o "actividad de GAT" se refiere a la capacidad para catalizar la acetilación del grupo amina secundario del glifosato, como es ilustrado, por ejemplo, en la Figura 1. Una glifosato-N-acetiltransferasa o "GAT" es una enzima que cataliza la acetilación del grupo amina del glifosato, un análogo de glifosato, y/o un metabolito primario de glifosato (es decir, AMPA o sarcosina) . En algunas modalidades preferidas de la invención, una GAT es capaz de transferir el grupo acetilo de AcetilCoA a la amina secundaria del glifosato y la amina primaria de AMPA. Las GATs ejemplares descritas en la presente son activas del pH 5-9, con actividad óptima en el rango de pH 6.5-8.0. La actividad puede ser cuantificada utilizando varios parámetros cinéticos bien conocidos en la técnica, por ejemplo, cat, M, y Estos parámetros cinéticos pueden ser determinados como es descrito después en el Ejemplo 7. Los términos "polinucleótido", "secuencia de nucleótidos" y "ácido nucleico" son utilizados para referirse a un polímero de nucleótidos (A,C,T,U,G, etc., o análogos de nucleótidos que ocurren en forma natural o artificiales), por ejemplo, DNA o RNA, o una representación de los mismos, por ejemplo, una cadena de caracteres, etc., dependiendo del contexto relevante. Un polinucleótido dado o polinucleótido complementario puede ser determinado de cualquier secuencia de nucleótidos especificada. De manera similar, una "secuencia de aminoácidos" es un polímero de aminoácidos (una proteina, polipéptido, etc.) o una cadena de caracteres que representa un polímero de aminoácidos, dependiendo del contexto. Los términos "proteína", "polipéptido" y "péptido" son utilizados intercambiablemente en la presente. Un polinucleótido, polipéptido u otro componente es "aislado", cuando es parcial o completamente separado de los componentes con los cuales está normalmente asociado (otras proteínas, ácidos nucleicos, células, reactivos sintéticos, etc.). Un ácido nucleico o polipéptido es "recombinante" cuando es artificial o diseñado, o derivado de una proteina o ácido nucleico artificial o diseñado. Por ejemplo, un polinucleótido que es insertado en un vector o cualquier otra ubicación heteróloga, por ejemplo, en un genoma de un organismo recombinante, de tal manera que no es asociada con las secuencias de nucleótidos que normalmente flaquean el polinucleótido como es encontrado en la naturaleza es un polinucleótido recombinante. Una proteina expresada in vitro o in vivo de un polinucleótido recombinante es un ejemplo de un polipéptido recombinante. Del mismo modo, una secuencia de polinucleótido que no se presenta en la naturaleza, por ejemplo una variante de un gen que ocurre en forma natural, es recombinante. Los términos "polipéptido de glifosato N-acetiltransferasa" y "polipéptido de GAT" son utilizados intercambiablemente para referirse a cualquiera de una f milia de polipéptidos novedosos proporcionados en la presente.
Los términos "polinucleótido de glifosato N-acetiltransferasa" y "polinucleótido de GAT" son utilizados intercambiablemente para referirse a un polinucleótido que codifica un polipéptido de GAT. Una "subsecuencia" o "fragmento" es cualquier porción de una secuencia completa. La numeración de un polimero de aminoácido o nucleótido corresponde a la numeración de un polimero de aminoácido seleccionado o ácido nucleico cuando la posición de un componente monomérico dado (residuo de aminoácido, nucleótido incorporado, etc.) del polimero corresponde a la misma posición del residuo en un polipéptido o polinucleótido de referencia seleccionado. Un vector es una composición para facilitar la transducción de la célula por un ácido nucleico seleccionado, o expresión del ácido nucleico en la célula. Los vectores incluyen, por ejemplo, plásmidos, cósmidos, virus, YACs, bacterias, polilisina, vectores de integración de cromosoma, vectores episomales, etc. "Substancialmente una longitud completa de un polinucleótido o secuencia de aminoácidos" se refiere a por lo menos aproximadamente 70%, generalmente a por lo menos aproximadamente 80%, o típicamente por lo menos aproximadamente 90% o más de una secuencia. Como se utiliza en la presente, un "anticuerpo" se refiere a una proteina que comprende uno o más polipéptidos substancial o parcialmente codificados por genes de inmunoglobulina o fragmentos de genes de inmunoglobulina. Los genes de inmunoglobulina reconocidos incluyen los genes de la región constante kappa, lambda, alfa, gamma, delta, epsilon y mu, asi como innumerables genes de la región variable de inmunoglobulina- Las cadenas ligeras son clasificadas ya sea como kappa o lambda. Las cadenas pesadas son clasificadas como gamma, mu, alfa, delta o epsilon, que a su vez definen las clases de inmunoglobulina IgG, IgM, IgA, IgD e IgE, respectivamente. Una unidad estructural de inmunoglobulina (anticuerpo) tipica comprende un tetramero. Cada tetramero está compuesto de dos pares idénticos de cadenas de polipéptido, cada par que tiene una cadena "ligera" (aproximadamente 25 kD) y una cadena "pesada" (aproximadamente 50-70 kD) - El N-terminal de cada cadena define una región variable de aproximadamente 100 a 110 o más aminoácidos principalmente sensibles para el reconocimiento del antigeno. Los términos cadena ligera variable (VL) y cadena pesada variable (VH) se refieren en estas cadenas ligera y pesada respectivamente. Los anticuerpos existen como inmunoglobulinas intactas o como un número de fragmentos bien caracterizados producidos por la digestión de varias peptidasas. Asi, por ejemplo, la pepsina digiere un anticuerpo debajo de los enlaces de disulfuro en la región principal para producir F(ab) '2, un dimero de Fab que por si mismo es una cadena ligera unida a VH-CH1 con un enlace de disulfuro. La F(ab) '2 puede ser reducida bajo condiciones moderadas para romper en enlace de disulfuro en la región principal para convertir de esta manera el dimero (Fab') 2 en un monómero Fab'. El monómero Fab' es esencialmente un Fab con parte de la región principal (ver, Fundamental Immunology, 4th Edición, W.E. Paul (ed), Raven Press, N.Y. (1998), para una descripción más detallada de otros fragmentos de anticuerpos) . Mientras que varios fragmentos de anticuerpos son definidos en términos de la digestión de un cuerpo intacto, un experto apreciará que tales fragmentos Fab' se pueden sintetizar de nuevo ya sea químicamente o al utilizar la metodología DNA recombinante. Asi, el término anticuerpo, como se utiliza en la presente, también incluye fragmentos de anticuerpos ya sea producidos mediante la modificación de anticuerpos enteros o sintetizados de nuevo utilizando metodologías de DNA recombinante. Los anticuerpos incluyen anticuerpos de una sola cadena, incluyendo los anticuerpos Fv (sFv) de una sola cadena, en los cuales una cadena pesada variable y una cadena ligera variable están unidas con untamente (directamente o a través de un enlazador de péptido) para formar un polipéptido continuo. Un "péptido de tránsito de cloroplasto" es una secuencia de aminoácidos que es traducida en conjunción con una proteina y dirige la proteina al cloroplasto u otros tipos de plástida presentes en la célula en la cual se hace la proteina. "Secuencia de tránsito de cloroplasto" se refiere a una secuencia de nucleótidos que codifica un péptido de tránsito de cloroplasto. "Un péptido de señal" es una secuencia de aminoácidos que es traducida en conjunción con una proteina y dirige la proteina al sistema secretorio (Chrispeel3, J.J., (1991) Ann. Rev. Plant Phys. Plant Mol. Biol. 42:21-53). Si la proteina va a ser dirigida a una vacuola, una señal objetivo vacuolar (supra) puede adicionalmente ser adicionada, o si es al retículo endoplásmico, se puede adicionar una señal de retención de retículo endoplásmico (supra) . Si la proteína va a ser dirigida al núcleo, cualquier péptido de señal presente debe ser removido y en cambio incluida una señal de localización nuclear (Raikhel, N. (1992) Plant Phys. 100:1627-1632). Los términos "diversificacíón" y "diversidad", como son aplicados a un polinucleótido, se refieren a la generación de una pluralidad de formas modificadas de un polinucleótido de origen, o pluralidad de polinucleótidos de origen. En el caso donde el polinucleótido codifica un polipéptido, la diversidad de la secuencia de nucleótido del polinucleótido puede dar por resultado la diversidad en el polipéptido codificado correspondiente, por ejemplo, una acumulación diversa de polinucleótidos que codifica una pluralidad de variantes de polipéptido. En algunas modalidades de la invención, esta diversidad de secuencia es aprovechada al clasificar/seleccionar una biblioteca de polinucleótidos diversificados por variantes con atributos funcionales deseables, por ejemplo, un polinucleótido que codifica un polipéptido de GAT con características funcionales aumentadas . El término "codificación" se refiere a la capacidad de una secuencia de nucleótidos para codificar uno o más aminoácidos . El término no requiere un codón de inicio o detención. Una secuencia de aminoácidos puede ser codificada en cualquiera de seis diferentes cuadros de lectura proporcionados por una secuencia de polinucleótido y su complemento. Cuando se utiliza en la presente, el término "variante artificial" se refiere a un polipéptido que tiene actividad de GAT, que es codificado por un polinucleótido de GAT modificado, por ejemplo, una forma modificada de cualquiera de SEQ ID NOS: 1-5 y 11-262, o de un polinucleótido de GAT que ocurre en forma natural aislado de un organismo- El polinucleótido modificado, del cual se produce una variante artificial cuando es expresada en un huésped adecuado, es obtenido a través de la intervención humana mediante la modificación de un polinucleótido de GAT.
El término "construcción de ácido nucleico" o "construcción de polinucleótido" significa una molécula de ácido nucleico, ya sea de una sola o doble hebra, que es aislada de un gen que ocurre en forma natural o que se ha modificado para contener segmentos de ácidos nucleicos en una manera que de otra manera no existirían en la naturaleza. El término construcción de ácido nucleico es sinónimo con el término "cásete de expresión" cuando la construcción de ácido nucleico contiene las secuencias de control requeridas para la expresión de una secuencia de codificación de la presente invención. El término "secuencias de control" se define en la presente para incluir todos los componentes, que son necesarios o ventajosos para la expresión de un polipéptido de la presente invención. Cada secuencia de control puede ser natural o extraña a la secuencia de nucleótido que codifica el polipéptido. Tales secuencias de control incluyen, pero no están limitadas a, una guia, secuencia de poliadenilación, secuencia de propéptido, promotor, secuencia de péptido de señal, y terminador de transcripción. En un mínimo, las secuencias de control incluyen un promotor y señales de detención transcripcionales y traduccionales . Las secuencias de control pueden ser proporcionadas con enlazadores para el propósito de introducir sitios de restricción específicos que facilitan la ligación de las secuencias de control con la región de codificación de la secuencia de nucleótidos que codifica un polipéptido. El término "operablemente enlazado" se define en la presente como una configuración en la cual una secuencia de control es apropiadamente colocada en una posición relativa en la secuencia de codificación de la secuencia de DNA de tal manera que la secuencia de control dirige la expresión de un polipéptido . Cuando se utiliza en la presente el término "secuencia de codificación" se propone para cubrir una secuencia de nucleótidos que directamente/ especifica la secuencia de aminoácidos de su producto de proteina. Los limites de la secuencia de codificación son generalmente determinados por un cuadro de lectura abierto, que usualmente comienza con el codón de inicio ATG. La secuencia de codificación típicamente incluye un DNA, cDNA, y/o secuencia de nucleótidos recombinante . En el presente contexto, el término "expresión" incluye cualquier paso involucrado en la producción de polipéptido incluyendo, pero no limitado, a transcripción, modificación postranscripcional, traducción, modificación postranslacional y secreción. En el presente contexto, el término "vector de expresión" cubre una molécula de DNA, lineal o circular, que comprende un segmento que codifica un polipéptido de la invención, y que es operablemente enlazado a segmentos adicionales que se proporcionan para su transcripción. El término "célula huésped", como se utiliza en la presente, incluye cualquier tipo de célula susceptible a la transformación con la construcción de ácido nucleico. El término "planta" incluye plantas enteras, órganos/estructuras vegetativas brotadas {por ejemplo, hojas, tallos y tubérculos), raices, flores y órganos/estructuras florales (por ejemplo, brácteas, sépalos, pétalos, estambres, carpelos, anteras y óvulos), semilla (incluyendo embrión, endosperma y tegumento) y fruto (el ovario maduro), tejido de planta (por ejemplo, tejido vascular, tejido de fondo y simi lares) y células (por ejemplo, células de protección, óvulos, tricomas y similares) y la progenie de lo mismo. Las clases de plantas que pueden ser utilizadas en el método de la invención es generalmente tan amplia como la clase de plantas superiores e inferiores dispuestas a las técnicas de transformación, incluyendo angioespermas (plantas monocotiledóneas y dicotiledóneas), gimnospermas, heléchos y alga3 multicelulares. Esto incluye plantas de una variedad de niveles de ploidia, incluyendo aneuploide, poliploide, diploide, haploide y hemicigoto . El término "heterólogo" como se utiliza en la presente, describe una relación entre dos o más elementos que indica que los elementos normalmente no son encontrados en proximidad entre si en la naturaleza. Asi, por ejemplo, una secuencia de polinucleótido es "heteróloga" a un organismo o a una segunda secuencia de polinucleótido si se origina de una especie extraña, o, si es de la misma especie, es modificada de su forma original. Por ejemplo, un promotor operablemente enlazado a una secuencia de codificación heteróloga se refiere a una secuencia de codificación de una especie diferente de aquella de la cual se derivó el promotor, o, si es de la misma especie, una secuencia de codificación que no está naturalmente asociada con el promotor (por ejemplo, una secuencia de codificación genéticamente diseñada o un alelo de un ecotipo o variedad diferentes). Un ejemplo de un , polipéptido heterólogo es un polipéptido expresado de un polinucleótido recombinante en un organismo transgénico. Los polinucleótidos y polipéptidos heterólogos son formas de moléculas recombinantes . Una variedad de términos adicionales son definidos o de otra manera caracterizados en la presente. GLIFOSATO N-ACITILTBAN3rERASA3 En un aspecto, la invención proporciona una familia novedosa de enzimas aisladas o recombinantes referidas en la presente como "glifosato N-acetiltransferasas", "GATs", o "enzimas de GAT" . Las GATs son enzimas que tienen actividad de GAT, de preferencia actividad suficiente para conferir algún grado de tolerancia al glifosato en una planta transgénica diseñada para expresar la GA . Algunos ejemplos de GATs incluyen polipéptidos de GAT, descritos en más detalle enseguida. Por supuesto, la tolerancia al glifosato mediada por GAT es una función compleja de la actividad de GAT, los niveles de expresión de GAT en la planta transgénica, la planta particular, la naturaleza y la sincronización de la aplicación herbicida, etc. Un experto en la técnica puede determinar sin experimentación indebida el nivel de actividad de GAT requerida para efectuar la tolerancia al glifosato en un contexto particular. La actividad de GAT puede ser caracterizada utilizando los parámetros cinéticos convencionales I at, M, y Kcar./KM. Kc,lt se puede pensar como una medición de la tasa de acetilación, particularmente a altas concentraciones de substrato, M es una medición de la afinidad de la GAT para sus substratos (por ejemplo, AcetilCoA y glifosato) , y es una medición de la eficiencia catalítica que toma tanto la afinidad del substrato y la tasa catalítica en cuenta - este parámetro es particularmente importante en la situación en donde la concentración de un substrato es por lo menos parcialmente limitativa de la tasa. En general, una GAT con un Kcat o Kcat/Kn superior es un catalizador más eficiente que otra GAT con Kcat o Kcat/Kn inferior. Un GAT con un KM inferior es un catalizador más eficiente que otra GAT con KM superior.
Asi, para determinar si una GAT es más efectiva que otra, se pueden comparar los parámetros cinéticos para las do3 enzimas- La importancia relativa de ?^, K^/KM y KM variará dependiendo del contexto en el cual la GAT será esperada a que funcione, por ejemplo, la concentración efectiva anticipada de gl fosato con relación a KM para glifosato. La actividad de GAT también puede ser caracterizada en términos de cualquiera de un número de caracteristicas funcionales, por ejemplo, la estabilidad, susceptibilidad a la inhibición o activación por otras moléculas, etc. POLIPEPTIDOS DE GLIFOSATO N-ACETILTR¾NS1¾RASAS En un aspecto, la invención proporciona una familia novedosa de polipéptidos aislados o recombinados referidos en la presente como "polipéptidos de glifosato N-acetiltransferasa" o "polipéptidos de GAT", Los polipéptidos de GAT se caracterizan por su similaridad estructural a una familia novedosa de GA s . Muchos, pero no todos los polipéptidos de GAT son GATs . La distinción es que las GATs se definen en términos de la función, mientras que los polipéptidos de GAT se definen en términos de la estructura. Un subcon unto de los polipéptidos de GAT consiste de aquellos polipéptidos de GAT que tienen actividad de GAT, de preferencia a un nivel que funcionará para conferir resistencia al glifosato en una planta transgénica que expresa la proteina a un nivel efectivo. Algunos polipéptidos sanción de extensión de espacio de 1. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que puede ser óptimamente alineada con una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514 para generar una marca de similaridad de por lo menos 440, 445, 450, 455, 460, 465, 470, 475, 480, 485, 490, 495, 500, 505, 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640, 645, 650, 655, 660, 665, 670, 675, 680, 685, 690, 695, 700, 705, 710, 715, 720, 725, 730, 735, 740, 745, 750, 755 o 760 utilizando la matriz BLOSUM62, una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO.457 para generar una marca de similaridad de por lo menos 430 utilizando la matriz BLOSUM62, una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO.457 para generar una marca de similaridad de por lo menos 440, 445, 450, 460, 465, 470, 475, 480, 485, 490, 495, 500, 505, 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640, 645, 650, 655, 660, 665, 670, 675, 680, 685, 690, 695, 700, 705, 710, 715, 720, 725, 730, 735, 740, 745, 750, 755 o 760 utilizando la matriz BLOSUM62 , una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO. 45 para generar una marca de similaridad de por lo menos 430 utilizando la matriz BLOSUM62, una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO.445 para generar una marca de similaridad de por lo menos 440, 445, 450, 460, 465, 470, 475, 480, 485, 490, 495, 500, 505, 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640, 645, 650, 655, 660, 665, 670, 675, 680, 685, 690, 695, 700, 705, 710, 715, 720, 725, 730, 735, 740, 745, 750, 755 o 760 utilizando la matriz BLOSUM62 , una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO: 300 para generar una marca de similaridad de por lo menos 430 utilizando la matriz BL0SUM62, una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que puede ser óptimamente alineada con la SEQ ID NO: 300 para generar una marca de similaridad de por lo menos 440, 445, 450, 460, 465, 470, 475, 480, 485, 490, 495, 500, 505, 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640, 645, 650, 655, 660, 665, 670, 675, 680, 685, 690, 695, 700, 705, 710, 715, 720, 725, 730, 735, 740, 745, 750, 755 o 760 utilizando la matriz BLOSUM62, una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1. Dos secuencias son "óptimamente alineadas" cuando ellas son alineadas para la marca de similaridad utilizando una matriz de sustitución de aminoácido definida (por ejemplo, BLOSUM62), sanción de existencia de espacio, y sanción de extensión de espacio para llegar a la marca más alta posible para ese par de secuencias . Las matrices de sustitución de aminoácidos y su uso en la cuantificación de la similaridad entre dos secuencias son bien conocidas en la técnica y descritas, por ejemplo, en Dayhoff y colaboradores (1978) "A model of evolutionary change in proteins". En "Atlas of Protein Sequence and Structure", Vol. 5, Suppl . 3 (ed. M.O. Dayhoff) , p 345-352. Nati. Biomed. Res. Found. , Washington, DC y Henikoff y colaboradores (1992) Proc. Nati. Acad. Sci. USA 89:10915-10919. La matriz BLOSUM62 (Fig. 10) frecuentemente es utilizada como una matriz de sustitución de marca de error en los protocolos de alineación de secuencia tal como Gapped BLAST 2.0 La sanción de existencia de espacio es impuesta por la introducción de un solo espacio de aminoácido en una de las secuencias alineadas, y la sanción de extensión de espacio es impuesta para cada posición de aminoácido vacia adicional insertada en un espacio ya abierto. La alineación es definida por las posiciones de aminoácidos de cada secuencia en la cual comienza y termina la alineación, y opcionalmente por la inserción de un espacio o múltiples espacios en una o ambas secuencias, para llegar a la marca posible más alta. Mientras que la alineación óptima y la marca puede ser realizada manualmente, el proceso es facilitado mediante el uso de un algoritmo de alineación implementado en computadora, por ejemplo, gapped BLAST 2.0, descrito en Altschul y colaboradores, (1997) Nucleic Acids Res. 25:3389-3402, y hecho disponible al público en el National Center for Biotechnology Information ebsite (http://www.ncbi.nlm.nih.gov). Las alineaciones óptimas, incluyendo múltiples alineaciones, pueden ser preparadas utilizando, por ejemplo, PSI-BLAST, disponible a través de http://www.ncbi.nljii.nih.gov y descrito por Altschul y colaboradores, (1997) Nucleic Acids Res. 25:3389-3402. Con respecto a una secuencia de aminoácidos que es óptimamente alineada con una secuencia de referencia, un residuo de aminoácido "corresponde a" la posición en la secuencia de referencia con la cual es residuo es emparejado en la alineación. La "posición" es denotada por un número que secuencialmente identifica cada aminoácido en la secuencia de referencia basado en su posición relativa al N-terminal. Por ejemplo, en SEQ ID NO: 300 la posición 1 es M, la posición 2 es I, la posición 3 es E, etc. Cuando una secuencia de prueba es óptimamente alineada con la SEQ ID NO: 300, un residuo en la secuencia de prueba que se alinea con la E en la posición 3 se dice que "corresponde a la posición 3" de la SEQ ID NO:300. Debido a las supresiones, inserciones, truncamientos, fusiones, etc., que deben ser tomados en cuenta cuando se determina una alineación óptima, en general el número de residuo de aminoácido en una secuencia de prueba como es determinado al contar simplemente de la N-terminal no necesariamente será lo mismo como el número de su posición correspondiente en la secuencia de referencia. Por ejemplo, en un caso donde hay una supresión en una secuencia de prueba alineada, no habrá aminoácido que corresponda a una posición en la secuencia de referencia en el sitio de supresión. Donde hay una inserción en una secuencia de referencia alineada, esa inserción no corresponderá a alguna posición de aminoácido en la secuencia de referencia. En el caso de truncamiento o fusiones pueden haber estiramientos de aminoácidos en ya sea la secuencia de referencia o alineada que no corresponde a cualquier aminoácido en la secuencia correspondiente . El término "polipéptido de GAT" además se refiere a cualquier polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con una secuencia de aminoácido seleccionada del grupo que consiste de SEQ ID NOS: 6-10 Y 263-514. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 Y 263-514. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con SEQ ID NO.457. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tienen por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con SEQ ID NO. 57. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con SEQ ID NO.445. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%f 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99 de identidad de secuencia con SEQ ID NO. 45. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con SEQ ID NO.300. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tienen por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con SEQ ID NO.300. El término "polipéptido de GAT" además se refiere a cualquier polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 1-96 de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 Y 263-514. Algunos aspectos de la invención pertenecen a polipéptidos que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 1-96 de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. Un aspecto de la invención pertenece a un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 1-96 de SEQ ID NO.457. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99 de identidad de secuencia con los residuos 1-96 de SEQ ID NO.457. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 1-96 de SEQ ID NO.445. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 1-96 de SEQ ID NO.445. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 1-96 de SEQ ID NO.300. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 1-96 de SEQ ID NO.300.
El termino ""polipéptido de GAT" además se refiere a cualquier polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 51-146 de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 Y 263-514. Algunos aspectos de la invención pertenecen a polipéptidos que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 51-146 de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. Un aspecto de la invención pertenece a un polipéptido que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 51-146 de SEQ ID NO.457. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99 de identidad de secuencia con los residuos 51-146 de SEQ ID NO.457. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 51-146 de SEQ ID NO.445. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 51-146 de SEQ ID NO.445. Un aspecto de la invención pertenece a un polipéptido de GAT que comprende una secuencia de aminoácidos que tiene por lo menos 40% de identidad de secuencia con los residuos 51-146 de SEQ ID NO.300. Algunos aspectos de la invención pertenecen a polipéptidos de GAT que comprenden una secuencia de aminoácidos que tiene por lo menos 60%, 70%, 80%, 90%, 92%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los residuos 51-146 de SEQ ID NO.300. Como se utiliza en la presente, el término "identidad" o "por ciento de identidad" cuando se utiliza con respecto a un par particular de secuencias de aminoácidos alineadas, se refiere al por ciento de identidad de secuencia de aminoácido que es obtenida por el análisis ClustalW (versión W 1.8 disponible de European Bioinformatic3 Institute, Cambridge, UK) , contando el número de igualaciones idénticas en la alineación y dividiendo tal número de igualaciones idénticas por el más grande de (i) la longitud de las secuencias alineadas, y (ii)96, y utilizando los siguientes parámetros Clustal W de error para lograr alineaciones similares a pares, lentas/precisae - Sanción Abierta de Espacio: 10; Sanción de Extensión de Espacio : 0.10; Matriz de Peso de Proteina : serie Gonnet; Matriz de Peso de DNA: IUB; Alineaciones Similares a Pares Lentas/Rápidas Toggle = Alineación LENTA o COMPLETA. En otro aspecto, la invención proporciona un polipéptido aislado o recom inante que comprende por lo menos 20, o alternativamente, 50, 75, 100, 125 o 140 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. En otro aspecto, la invención proporciona un polipéptido aislado o recombinante que comprende por lo menos 20, o alternativamente, 50, 100 o 140 aminoácidos contiguos de SEQ ID NO: 57. En otro aspecto, la invención proporciona un polipéptido aislado o recombinante que comprende por lo menos 20, o alternativamente, 50, 100 o 140 aminoácidos contiguos de SEQ ID NO: 45. En otro aspecto, la invención proporciona un polipéptido aislado o recombinante que comprende por lo menos 20, o alternativamente, 50, 100 o 140 aminoácidos contiguos de SEQ ID NO: 300. En otro aspecto, la invención proporciona un polipéptido que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 90% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones : (a) en las posiciones 2, 4, 15, 19, 26, 28, 31, 45, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 123, 129, 139 y/o 145 el residuo de aminoácido es Bl y (b) en las posiciones 3, 5, 8, 10, 11, 14, 17, 18, 24, 27, 32, 37, 38, 47, 48, 49, 52, 57, 58, 61, 62, 63, 68, 69, 79, 80, 82, 83, 89, 92, 100, 101, 104, 119, 120, 124, 125, 126, 128, 131, 143 y/o 144 el residuo de aminoácidos es B2 en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. Cuando se utiliza para especificar un aminoácido o residuo de aminoácido, las designaciones de letras individuales A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W y y tienen su significado estándar como se utiliza en la técnica y como es proporcionado en la Tabla 2 en la presente. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 80% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 129, 139 y/o 145 el residuo de aminoácido es Zl; (b) en las posiciones 31 y/o 45 el residuo de aminoácido es Z2; (c) en las posiciones 8 y/o 89 el residuo de aminoácido es 23; (d) en las posiciones 82, 92, 101 y/o 120 el residuo de aminoácido es Z4; (e) en las posiciones 3, 11, 27 y/o 79 el residuo de aminoácido es Z5; (f) en la posición 123 el residuo de aminoácido es Zl o Z2; (g) en las posiciones 12, 33, 35, 39, 53, 59, 112, 132, 135, 140 y/o 146 el residuo de aminoácido es Zl o Z3; (h) en la posición 30 el residuo de aminoácido es Zl o Z4; (i) en la posición 6 el residuo de aminoácido es Zl o Z6; (j) en las posiciones 81 y/o 113 el residuo de aminoácido es Z2 o Z3; (k) en las posiciones 138 y/o 142 el residuo de aminoácido es Z2 o Z4; (1) en las posiciones 5, 17, 24, 57, 61, 124 y/o 126 el residuo de aminoácido es Z3 o Z4; (m) en la posición 104 el residuo de aminoácido es Z3 o Z5; (o) en las posiciones 38, 52, 62 y/o 69 el residuo de aminoácido es Z3 o Z6; (p) en las posiciones 14, 119 y/o 144 el residuo de aminoácido es Z4 o Z5; (q) en la posición 18 el residuo de aminoácido es Z4 o Z6; (r) en las posiciones 10, 32, 48, 63, 80 y/o 83 el residuo de aminoácido es Z5 o 26; (s) en la posición 40 el residuo de aminoácido es Zl, Z2 o Z3; (t) en las posiciones 65 y/o 96 el residuo de aminoácido es Zl, Z3 o Z5; (u) en las posiciones 84 y/o 115 el residuo de aminoácido es Zl, Z3 o Z4 (v) en la posición 93 el residuo de aminoácido es Z2, Z3 o Z4; ( ) en la posición 130 el residuo de aminoácido es Z2, Z4 o Z6; (x) en las posiciones 47 y/o 58 el residuo de aminoácido es Z3, Z4 o Z6 (y) en las posiciones 49, 68, 100 y/o 143 el residuo de aminoácido es Z3, Z4 o Z5 (z) en la posición 131 el residuo de aminoácido es Z3, Z5 o Z6 (aa) en las posiciones 125 y/o 128 el residuo de aminoácido es Z4, Z5 o Z6; (ab) en la posición 67 el residuo de aminoácido es Zl, Z3, Z4 o Z5; (ac) en la posición 60 el residuo de aminoácido es Zl, Z4, Z5 o Z6; y (ad) en la posición 37 el residuo de aminoácido es Z3, Z4, Z5 o Z6 en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W, y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T Z4 es un aminoácido seleccionado del grupo que consiste de R, H, y K Z5 es un aminoácido seleccionado del grupo que consiste de D y E y 6 es un aminoácido seleccionado del grupo que consiste de C, G, y P. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 90% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 90% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 50, 64, 72, 75, 76, 78, 94, 98, 110, 121 y/o 141 el residuo de aminoácido es Zl; y (b) en las posiciones 13, 46, 56, 70, 107, 117 y/o 118 el residuo de aminoácido e3 Z2; (c) en las posiciones 23, 55, 71, 77, 88 y/o 109 el residuo de aminoácido es Z3; (d) en las posiciones 16, 21, 41, 73, 85, 99 y/o 111 el residuo de aminoácido es Z4; (e) en las posiciones 34 y/o 95 el residuo de aminoácido es Z5 (f) en la posición 22, 25, 29, 43, 44, 66, 74, 87, 102, 108, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y K; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 80% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones: (a) en la posición 2 el residuo de aminoácido es I o L; (b) en la posición 3 el residuo de aminoácido es E o D; (c) en la posición 4 el residuo de aminoácido es V, A o I; (d) en la posición 5 el residuo de aminoácido es , R o N; (e) en la posición 6 el residuo de aminoácido es P o L; (f) en la posición 8 el residuo de aminoácido es N, S o T; (g) en la posición 10 el residuo de aminoácido es E o G; (h) en la posición 11 el residuo de aminoácido es D o E; (i) en la posición 12 el residuo de aminoácido es T o A; (j) en la posición 14 el residuo de aminoácido es E o K; (k) en la posición 15 el residuo de aminoácido es I o L; (1) en la posición 17 el residuo de aminoácido es H o Q; (m) en la posición 18 el residuo de aminoácido es R, C o K; (n) en la posición 19 el residuo de aminoácido es I o V; (o) en la posición 24 el residuo de aminoácido es Q o R; (p) en la posición 26 el residuo de aminoácido es L o I; (q) en la posición 27 el residuo de aminoácido es E o D; (r) en la posición 28 el residuo de aminoácido es A o V; (s) en la posición 30 el residuo de aminoácido es K, M o R; (t) en la posición 31 el residuo de aminoácido es Y o F; (u) en la posición 32 el residuo de aminoácido es E o G (v) en la posición 33 el residuo de aminoácido es T, A o S (w) en la posición 35 el residuo de aminoácido es L, S o M; (x) en la posición 37 el residuo de aminoácido es R» G, E o Q; (y) en la posición 38 el residuo de aminoácido es G o S; (z) en la posición 39 el residuo de aminoácido es T, A o 3; (aa) en la posición 40 el residuo de aminoácido es F, L o S; (ab) en la posición 45 el residuo de aminoácido es Y o F; (ac) en la posición 47 el residuo de aminoácido es R. Q o G; (ad) en la posición 48 el residuo de aminoácido es G 0 D; (ae) en la posición 49 el residuo de aminoácido e3 K, R, E o Q; (af) en la posición 51 el residuo de aminoácido es 1 o V; (ag) en la posición 52 el residuo de aminoácido es s, C o G (ah) en la posición 53 el residuo de aminoácido es I o T; (ai) en la posición 54 el 34
residuo de aminoácido es A o V; (aj) en la posición 57 el residuo de aminoácido es H o N; (ak) en la posición 58 el residuo de aminoácido es Q, K, N o P; (al) en la posición 59 el residuo de aminoácido es A o S; (am) en la posición 60 el residuo de aminoácido es E, K, G, V o D; (an) en la posición 61 el residuo de aminoácido es H o Q; (ao) en la posición 62 el residuo de aminoácido es P, S o T; (ap) en la posición 63 el residuo de aminoácido es E, G o D; (aq) en la posición 65 el residuo de aminoácido es E, D, V o Q (ar) en la posición 67 el residuo de aminoácido es Q, E, R, L, H o K; (as) en la posición 68 el residuo de aminoácido es K, R, E o N (at) en la posición 69 el residuo de aminoácido es Q o P; (au) en la posición 79 el residuo de aminoácido es E o D (av) en la posición 80 el residuo de aminoácido es G o E; (aw) en la posición 81 el residuo de aminoácido es Y, N o F; (ax) en la posición 82 el residuo de aminoácido es R o H (ay) en la posición 83 el residuo de aminoácido es E, G o D; (az) en la posición 84 el residuo de aminoácido es Q, R o L; (ba) en la posición 86 el residuo de aminoácido es A o V; (bb) en la posición 89 el residuo de aminoácido es T o S; (be) en la posición 90 el residuo de aminoácido es L 0 i; (bd) en la posición 91 el residuo de aminoácido es I o V; (be) en la posición 92 el residuo de aminoácido es R o K; (bf) en la posición 93 el residuo de aminoácido es H, Y O Q (bg) en la posición 96 el residuo de aminoácido es E, A O Q (bh) en la posición 97 el residuo de aminoácido es L o i; (bi) en la posición 100 el residuo de aminoácido es K, R, N o E; (bj) en la posición 101 el residuo de aminoácido es K o R; (bk) en la posición 103 el residuo de aminoácido es A o V; (bl) en la posición 104 el residuo de aminoácido es D o N; (bm) en la posición 105 el residuo de aminoácido es L o M; (bn) en la posición 106 el residuo de aminoácido es L o i; (bo) en la posición 112 el residuo de aminoácido es T o I; (bp) en la posición 113 el residuo de aminoácido es S, T o F; (bq) en la posición 114 el residuo de aminoácido es A o v; (br) en la posición 115 el residuo de aminoácido es S, R o A; (bs) en la posición 119 el residuo de aminoácido es K, E o R (bt) en la posición 120 el residuo de aminoácido es K o R; (bu) en la posición 123 el residuo de aminoácido es F o L; (bv) en la posición 124 el residuo de aminoácido es S o R; (bw) en la posición 125 el residuo de aminoácido es E, K, G o D; (bx) en la posición 126 el residuo de aminoácido es Q o H; (by) en la posición 128 el residuo de aminoácido es E, G <o (bz) en la posición 129 el residuo de aminoácido es V, I .o A; (ca) en la posición 130 el residuo de aminoácido es Y, H, F o C; (cb) en la posición 131 el residuo de aminoácido es D, G, N o E; (ce) en la posición 132 el residuo de aminoácido es I, T, A, M, V o L; (cd) en la posición 135 el residuo de aminoácido es V, T, A o I; (ce) en la posición 138 el residuo de aminoácido es H o Y; (cf) en la posición 139 el residuo de aminoácido es I o V; (cg) en la posición 140 el residuo de aminoácido es L o S; (ch) en la posición 142 el residuo de aminoácido es Y o H; (ci) en la posición 143 el residuo de aminoácido es K, T o E; (cj) en la posición 144 el residuo de aminoácido es , E o R; (ck) en la posición 145 el residuo de aminoácido es L o I; y (el) en la posición 146 el residuo de aminoácido es T o A. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como sigue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514, por lo menos 80% de los residuos de aminoácido en el polipéptido que corresponden a las siguientes posiciones conforman a las siguientes restricciones: (a) en la posición 9, 76, 94 y 110 el residuo de aminoácido es A; (b) en la posición 29 y 108 el residuo de aminoácido es C; (c) en la posición 34 el residuo de aminoácido es D; (d) en la posición 95 el residuo de aminoácido es E; (e) en la posición 56 el residuo de aminoácido es F; (f) en la posición 43, 44, 66, 74, 87, 102, 116, 122, 127 y 136 el residuo de aminoácido es G; (g) en la posición 41 el residuo de aminoácido es H (h) en la posición 7 el residuo de aminoácido es I; (i) en la posición 85 el residuo de aminoácido es K; (j) en la posición 20, 36, 42, 50, 72, 78, 98 y 121 el residuo de aminoácido es L; (Je) en la posición 1, 75 y 141 el residuo de aminoácido es M; (1) en la posición 23, 64 y 109 el residuo de aminoácido es N; (m) en la posición 22, 25, 133, 134 y 137 el residuo de aminoácido es P; (n) en la posición 71 el residuo de aminoácido es Q; (o) en la posición 16, 21, 73, 99 y 111 el residuo de aminoácido es R; (p) en la posición 55 y 88 el residuo de aminoácido es S; (q) en la posición 77 el residuo de aminoácido es T; (r) en la posición 107 el residuo de aminoácido es ; y (s) en la posición 13, 46, 70, 117 y 118 el residuo de aminoácido es Y. Algunos polipéptidos de GAT preferidos de la invención se caracterizan como 3igue. Cuando se alinean óptimamente con una secuencia de aminoácidos de referencia seleccionada del grupo que consiste de SEQ ID N0:6-1Ó y 263-514, el residuo de aminoácido en el polipéptido que corresponde a la posición 28 es V o A. Valina en la posición 28 generalmente se correlaciona con Km reducida, mientras que la alanina en esa posición generalmente se correlaciona con Kc,lt incrementada. Otros polipéptidos de GAT preferidos son caracterizados por tener 127 (es decir, un I en posición 27), M30, S35, R37, 339, G48, K49, N57, Q58, P62, Q65, Q67, K68, E83, S89, A96, E96, R101, T112, A114, K119, K120, E128, V129, D131, T131, V134, R144, 1145 o T146 o cualquier combinación de los mismos. Algunos polipéptidos de GAT preferidos de la invención comprenden una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. La invención además proporciona polipéptidos de GAT preferidos que son caracterizados por una combinación de las restricciones de posición de residuo de un aminoácido extraño . Además, la invención proporciona polinucleótidos de GAT que codifican los polipéptidos de GAT preferidos descritos anteriormente, y secuencias de nucleótidos complementarias de los mismos . Algunos aspectos de la invención pertenecen particularmente al subcon unto de cualquiera de las categorías descritas anteriormente de polipéptidos de GAT que tiene actividad de GAT, como es descrita en la presente. Estos polipéptidos de GAT son preferidos, por ejemplo, para el uso como agentes para conferir resistencia al glifosato en una planta. Ejemplos de niveles deseados de actividad de GAT son descritos en la presente. En un aspecto, los polipéptidos de GAT comprenden una secuencia de aminoácidos codificada por una forma recombinante o aislada de ácidos nucleicos que ocurren en forma natural, aislados de una fuente natural, por ejemplo una cepa bacteriana. Los polinucleótidos de tipo silvestre que codifican tales polipéptidos de GAT pueden ser especificamente clasificados por técnicas estándares conocidas en la técnica . Los polipéptidos definidos por SEQ ID NO: 6 a SEQ ID NO: 10, por ejemplo, fueron descubiertos por la clonación de expresión de secuencias de cepas de Bacillus que exhiben actividad de GAT, como es descrito en más detalle después . La invención también incluye polipéptidos aislados o recombinantes que son codificados por un polinucleótido aislado o recombinante que comprende una secuencia de nucleótidos que se utiliza baja condiciones severas sobre substancialmente la longitud completa de una secuencia de nucleótidos seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262, 3us complementos y secuencias de nucleótidos que codifican una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 Y 263-514, incluyendo sus complementos. La invención además incluye cualquier polipéptido que tiene actividad de GAT que es codificada por un fragmento de cualquiera de los polinucleótidos que codifican GAT descritos en la presente. La invención también proporciona fragmentos de polipéptidos de GAT que pueden ser empalmados conjuntamente para formar un polipéptido de GAT funcional. El empalme se puede realizar in vivo o in vitro, y puede involucrar un empalme cis o trans (es decir, intramolecular o intermolecular) . Los fragmentos por si mismos pueden, pero no necesitan, tener actividad de GAT. Por ejemplo, dos o más segmentos de un polipéptido de GAT pueden ser separados por inteinas; remoción de la secuencia de inteina por el cis-empalme da por resultado un polipéptido de GAT funcional. En otro ejemplo, un polipéptido de GAT encriptado puede ser expresado como dos o más fragmentos separados; el transempalme de estos segmentos da por resultado la recuperación de un polipéptido de GAT funcional. Varios aspectos de empalme cis y trans, encripción de gen, e introducción de secuencias de intervención son descritas en más detalle en las solicitudes de patentes norteamericanas Nos. 09/517,933 y 09/710,686, ambas de las cuales son incorporadas por referencia en la presente en su totalidad. En general, la invención incluye cualquier polipéptido codificado por un polinucleótido de GAT modificado derivado por mutación, recombinación de secuencia recursiva, y/o di ersif cación de la secuencia de polinucleótido descritas en la presente. En algunos aspectos de la invención, un polipéptido de GAT es modificado por una sola o múltiples sustituciones de aminoácidos, una supresión, una inserción, o una combinación de uno o más de esto3 tipos de modificaciones. Las substituciones pueden ser conservativas, o no conservativas, pueden alterar la función o no alterar la función, y pueden adicionar nueva función. Las inserciones y supresiones pueden ser substanciales, tales como el caso de un truncamiento de un fragmento substancial de la secuencia/ o en la función de secuencia adicional, ya sea internamente o en N o C terminal. En algunas modalidades de la invención, un polipéptido de GAT es parte de una proteina de fusión que comprende una adición funcional, tal como, por ejemplo, una señal de secreción, un péptido de tránsito de cloroplasto, un residuo de purificación, o cualquiera de otros numerosos grupos funcionales que serán evidentes para la persona experta, y que son descritos en más detalle en otra parte en esta especificación. Los polipéptidos de la invención pueden contener uno o más aminoácidos modificados. La presencia de aminoácidos modificados puede ser ventajosa en, por ejemplo,
(a) incrementar el periodo de vida in vivo del polipéptido,
(b) reducir o incrementar la antigenicidad del polipéptido,
(c) incrementar la estabilidad de almacenamiento del polipéptido. El (los) aminoácido (s) es (son) modificado (s) , por ejemplo, cotraduccionalmente o postraduccionalmente durante la producción recombinante (por ejemplo, la glicosilación N-enlazada en las porciones N-X-S/T durante la expresión en células mamlferas) o modificado por medios sintéticos. Ejemplos no limitativos de un aminoácido modificado incluyen un aminoácido glicosilado, un aminoácido sulfatado, un aminoácido prenilatado (por ejemplo, farnesilado, geranilgeranilado) , un aminoácido acetilado, un aminoácido acilado, un aminoácido PEG-ilado, un aminoácido biotinilado, un aminoácido carboxilado, un aminoácido fosforilado y similares. Las referencias adecuadas para guiar a un experto en la modificación de aminoácidos están en todas partes en la literatura. Protocolos de ejemplos son encontrados en alker (1998) Protein Protocole on CD-ROM Human Press, Towata, NJ. Los métodos recombinantes para producir y aislar polipéptidos de GAT de la invención son descritos en la presente. Además de la producción recombinante, los polipéptidos se pueden producir mediante la síntesis de péptido de directo utilizando técnicas en fase sólida (por ejemplo, Stewart y colaboradores (1969) Solid-Phase Peptide Synthesis, H Freeman Co, San Francisco; Merrifield J (1963) J. Am. Chem. Soc. 85:2149-2154) . La síntesis de péptido se puede realizar utilizando técnicas manuales o mediante la automatización. La síntesis automatizada se puede obtener, por ejemplo, utilizando Applied Biosystems 431A Peptide Synthesizer (Perkin Elmer, Foster City, Calif.) de acuerdo con las instrucciones proporcionadas por el fabricante. Por ejemplo, las subsecuencias pueden ser sintetizadas químicamente por separado y combinadas utilizando métodos químicos para proporcionar polipéptidos de GAT de longitud completa. Los péptidos también pueden ser ordenados de una variedad de fuentes. En otro aspecto de la invención, un polipéptido de GAT de la invención es utilizado para producir anticuerpos que tienen, por ejemplo, usos de diagnóstico;, relacionados con la actividad, distribución y expresión de los polipéptidos de GAT, por ejemplo, en varios tejidos de una planta transgénica. Los polipéptidos homólogos de GAT para la inducción de anticuerpos no requieren actividad biológica, sin embargo, el polipéptido u oligopéptido debe ser antigénico. Los péptidos utilizados para inducir anticuerpos específicos pueden tener una secuencia de aminoácidos que consiste de por lo menos 10 aminoácidos, de preferencia por lo menos 15 o 20 aminoácidos. Estiramientos cortos de un polipéptido de GAT pueden ser fusionados con otra proteina, tal como la hemocianina de lapa de punta, y el anticuerpo producido contra la molécula quimérica. Métodos para producir anticuerpos monoclonales son conocidos para aquellos expertos en la técnica, y muchos anticuerpos son disponibles. Ver, por ejemplo, Coligan (1991) Current Protocols in Immunology Wiley/Greene, NY; y Harlow y Lañe (1989) Antibodies: A Laboratory Manual Cold Spring Harbor Press, NY; Stites y colaboradores (eds.) Basic and Clinical Immunology (4th ed) Lange Medical Publications, Los Altos, CA, y referencias citadas en la misma; Goding (1986) Monoclonal Antibodies: Principies and Practice (2d ed. )
Academic Press, New York, NY; y Kohler y Milstein (1975) Nature 256: 495-497. Otras técnicas adecuadas para la preparación de anticuerpos incluyen la selección de bibliotecas de anticuerpos recombinantes en vectores fago o similares. Ver, Huse y colaboradores (1989) Science 246: 1275-1281; y Ward y colaboradores (1989) Natu e 341: 544-546. Los anticuerpos monoclonales y policlonales específicos y antisueros usualmente enlazarán con un KD de por lo menos aproximadamente 0.1 µ?, de preferencia por lo menos aproximadamente 0.01 uM o mejor, y más típicamente de preferencia, 0.001 µ? o mejor. Detalles adicionales de la producción de anticuerpo y las técnicas de ingeniería pueden ser encontrados en Borrebaeck (ed) (1995) Antibody Engineerinq, 2r'd Edition Freeman and Company, NY (Borrebaeck); McCaffety y colaboradores (1996) Antibody Engineering, A Practical Approach IRL at Oxford Press. Oxford, England (McCaffety), y Paul (1995) Antibody Engineering Protocola Humana Press, Towata, NJ (Paul) . Variaciones de Secuencia Los polipéptidos de GAT de la presente invención incluyen variaciones conservativamente modificadas de las secuencias descritas en la presente como SEQ ID NOS: 6-10 y 263-514. Tales variaciones conservativamente modificadas comprenden sustituciones, adiciones o supresiones que alteran, adicionan o suprimen un solo aminoácido o un pequeño porcentaje de aminoácidos (típicamente menos de 63
aproximadamente 5%, más típicamente menos de aproximadamente 4%, 2% o 1¾) en cualquiera de SEQ ID NOS: 6-10 y 263-514. Por ejemplo, una variación conservativamente modificada (por ejemplo, supresión) del polipéptido de 146 aminoácidos identificado en la presente como SEQ ID NO: 6 tendrá una longitud de por lo menos 140 aminoácidos, de preferencia por lo menos 141 aminoácidos, más de preferencia por lo menos 144 aminoácidos, y aún más de preferencia por lo menos 146 aminoácidos, correspondientes a una supresión de menos de aproximadamente 5%, 4%, 2% o aproximadamente 1%, o menor de la secuencia de polipéptido. Otro ejemplo de una variación conservativamente modificada (por ejemplo, una "variación conservativamente substituida") del polipéptido identificado en la presente como SEQ ID NO: 6 contendrá "substituciones conservativas", de acuerdo con seis grupos de substitución expuestos en la Tabla 2 (infra), en hasta aproximadamente 7 residuos (es decir, menos de aproximadamente 5%) del polipéptido de 146 aminoácidos . Los homólogos de la secuencia de polipéptido GAT de la invención, incluyendo secuencias conservativamente substituidas, pueden estar presentes como parte de secuencias de polipéptido más grandes tal como ocurre en un polipéptido de GAT, en una fusión de GAT con una secuencia de señal, por ejemplo, una secuencia objetivo de cloroplasto, o en la adición de uno o más dominios para la purificación de la proteina, (por ejemplo, segmentos poli his, segmentos FLAG tag, etc.). En este último caso los dominios funcionales adicionales tienen poco o nada de efecto en la actividad de la porción de GAT de la proteina, o donde los dominios adicionales pueden ser removidos mediante los pasos de procesamiento de pos-síntesis tal como mediante el tratamiento con una proteasa. Definición de Polipéptidos por Inmunorreactividad Debido a que los polipéptidos de la invención proporcionan una nueva clase de enzimas con una actividad definida, es decir, la acetilación de glifosato, los polipéptidos también proporcionan nuevas características estructurales que pueden ser reconocidas, por ejemplo, en ensayos inmunológicos . La generación de antisueros que específicamente enlazan los polipéptidos de la invención, a3Í como los polipéptidos que son enlazados por tales antisueros, son una característica de la invención. La invención incluye polipéptidos de GAT que específicamente enlazan a, o que son específicamente inmunorreactivos con un anticuerpo o antisuero generado contra un inmunógeno que comprende una secuencia de aminoácidos seleccionada de una o más de SEQ ID NO: 6 a SEQ ID NO: 10. Para eliminar la reactividad cruzada con otros homólogos de GAT, los anticuerpos o sueros son substraídos con proteínas relacionadas disponibles, tales como aquellas representadas por las proteínas o péptidos correspondientes a los números de acceso GenBank disponibles como la fecha de presentación de esta solicitud, y ejemplificado por CAA70664, Z99109 y Y09476. Donde el número de acceso corresponde a un ácido nucleico, un polipéptido codificado por el ácido nucleico es generado y utilizado para los propósitos de substracción de anticuerpo/antisuero. La Figura 3 tabula la identidad relativa entre los polipéptidos de GAT ejemplares y la secuencia más estrechamente relacionada disponible en GenbanJc, Yitl. La función de Yitl natural todavía tiene que ser puesta en claro, pero la enzima se ha mostrado que posee actividad de GAT detectable . En un formato típico, el inmunoensayo utiliza un antisuero policlonal que se resaltó contra uno o má3 polipéptidos que comprenden una o más de las secuencias correspondientes a una o más de SEQ ID NOS: 6-10 y 263-514, o una subsecuencia sustancial de la misma (es decir, por lo menos aproximadamente 30% de la secuencia de longitud completa proporcionada) . El conjunto completo de inmunógenos de polipéptido potenciales derivados de SEQ ID NOS: 6-10 y 263-514 son colectivamente referidos enseguida como "los polipéptidos inmunogénicos" , Los antisueros resultantes son opcionalmente seleccionados para tener baja reactividad cruzada contra otras secuencias relacionadas y cualquiera de tal reactividad cruzada es removida mediante la inmunoabsorción con una o más de las secuencias relacionadas, antes del uso del antisuero policlonal en el inmunoensayo. Con el fin de producir antisueros para el uso en un inmunoensayo, uno o más de los polipéptidos inmunogénicos es producido y purificado como es descrito en la presente. Por ejemplo, la proteina recombinante puede ser producida en una linea de células bacterianas. Una raza innata de ratones (utilizada en este ensayo ya que los resultados son más reproducibles debido a la identidad genética virtual de los ratones) es inmunizada con la(s) proteina (s) inmunogénica { s) en combinación con un adyuvante estándar, tal como el adyuvante de Freund y un protocolo de inmunización de ratón estándar (ver, Harlow y Lañe (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York, para una descripción estándar de generación de anticuerpo, formatos de inmunoensayo y condiciones que pueden ser utilizadas para determinar la inmunorreactividad especifica) . Alternativamente, uno o más polipéptidos sintéticos o recombinantes derivados de las secuencias descritas en la presente es conjugado a una proteina portadora y utilizado como un inmunógeno. Los sueros policlonales son recolectados y titulados contra el polipéptido inmunogénico en un inmunoensayo, por ejemplo, un inmunoenyaso en fase sólida con una o más de las proteínas inmunogénicas inmovilizadas en un soporte sólido. Los antisueros policlonales con un titulo de 10b o más grande son seleccionados, acumulados y substraídos con polipéptidos relacionados, por ejemplo, aquellos identificados de GENBANK como es mencionado, para producir antisueros policlonales titulados, acumulados, substraídos. Los antisueros policlonales titulados, acumulados, substraídos son probados para la reactividad cruzada contra los polipéptidos relacionados. De preferencia por lo menos dos de las GATs inmunogénicas son utilizadas en esta determinación, de preferencia en conjunción con por lo menos dos de los polipéptidos relacionados, para identificar anticuerpos que son especificamente enlazados por la(s) proteina(s) inmunogénica (s) . En este ensayo comparativo las condiciones de enlace discriminatorias son determinadas para los antisueros policlonales titulados, substraídos, que dan por resultado por lo menos aproximadamente una relación de señal a ruido más alta de 5-10 veces, para el enlace de los antisueros policlonales titulados a los polipéptidos de GAT inmunogénicos comparado con el enlace con los polipéptidos relacionados. Esto es, la severidad de la relación de enlace es ajustada mediante la adición de competidores no específicos tales como albúmina o leche seca sin grasa, o al ajustar las condiciones de sal, temperatura o similares.
Estas condiciones de enlace son utilizadas en ensayos subsecuentes para determinar de prueba esta específicamente enla2ado por los antisueros policlonales substraídos acumulados. En particular, los polipéptidos de prueba que muestran por lo menos una relación de señal a ruido más alta que 2-5x que los polipéptidos de control bajo condiciones de enlace discriminatorias, y por lo menos aproximadamente una relación de señal a ruido de ½ como e3 comparado con los polipéptidos inmunogénicos, comparte similaridad estructural substancial con el polipéptido inmunogénico comparado con la GAT conocida, y es, por lo tanto un polipéptido de la invención . En otro ejemplo, los inmunoensayos en el formato de enlace competitivos son utilizados para la detección de un polipéptido de prueba. Por ejemplo, como se mencionó, los anticuerpos de reactividad cruzada son retirados de la mezcla de antisueros acumulados mediante la inmunoabsorción con los polipéptidos de GAT de control. El (los) polipéptido (s) inmunogénico ( s) todos son inmovilizados a un soporte sólido que es expuesto a los antisueros acumulados substraídos. Las proteínas de suero se adicionan al ensayo para competir para el enlace con los antisueros extraídos acumulados. La capacidad de l (las) proteina(s) de prueba para competir para el enlace con los antisueros extraídos acumulados compara la (3) proteina(s) inmovilizada (s) es comparada con la capacidad del (los) polipéptido ( s ) inmunogénico (s) adicionados al ensayo para competir por el enlace (los polipéptidos inmunogénicos compiten efectivamente con los polipéptidos inmunogénicos inmovilizados para el enlace con los antisueros acumulados) . El por ciento de reactividad cruzada para las proteínas de prueba es calculado, utilizando cálculos estándares . En un ensayo paralelo, la capacidad de las proteínas de control para competir para el enlace de los antisueros extraídos acumulados es opcionalmente determinada con la capacidad del (los) polipéptido (s) inmunogénico (s) para competir para el enlace con los antisueros. Nuevamente, el por ciento de reactividad cruzada para los polipéptidos de control es calculado, utilizando cálculos estándares. Donde el por ciento de reactividad usada es de por lo meno3 5-10x tan alto para I03 polipéptidos de prueba, los polipéptidos de prueba se dice que enlazan específicamente los antisueros substraídos acumulados. En general, los antisueros inmunoabsorbidos y acumulados pueden ser utilizados en un inmunoensayo de enlace competitivo como es descrito en la presente, para comparar cualquier polipéptido de prueba con el (los) polipéptido {s) inmunogénico (s) . Con el fin de hacer esta comparación, los dos polipéptidos son cada uno analizados en un amplio rango de concentraciones y la cantidad de cada polipéptido requerida para inhibir 50% el enlace a los antisueros extraídos a la proteina inmovilizada, es determinado utilizando técnicas estándares. Si la cantidad de polipéptido de prueba requerida es menos que dos veces la cantidad del polipéptido inmunogénico que es requerido, entonces el polipéptido de prueba se dice que enlaza específicamente a un anticuerpo generado a la proteina inmunogénica, siempre y cuando la cantidad sea de por lo menos aproximadamente 5-10x tan alta como para un polipéptido de control. Como una determinación final de especificidad, los antisueros acumulados son opcionalmente completamente inmunosorbidos con el (los) polipéptido ( s) inmunogénico (s) (antes que los polipéptidos de control) hasta que poco o nada de enlace de los antisueros acumulados substraídos del polipéptido inmunogénico resultantes con el (los) polipéptido ( s ) inmunogénico ( s ) utilizado en la inmunosorción es detectable. Este antisuero completamente inmunosorbido luego es probado para la reactividad con el polipéptido de prueba. Si se observa poca o nada de reactividad (es decir, no má3 de 2x de la relación de señal a ruido observada para la relación de antisueros completamente inmunosorbidos al polipéptido inmunogénico) , entonces el polipéptido de prueba es específicamente enlazado por los antisueros producidos por la proteina inmunogénica. POLINUCLEOTIDOS DE GLIFOSATO DE N-ACETILTRANSFERASA En un aspecto, la invención proporciona una familia novedosa de polinucleótidos aislados o recombinantes referidos en la presente como "polinucleótidos de glifosato N-acetiltransferasa" o "polinucleótidos de GAT". Las secuencias del polinucleótido de GAT son caracterizadas por la capacidad para codificar un polipéptido de GAT. En general, la invención incluye cualquier secuencia de nucleótidos que codifica cualquiera de los polipéptidos de GAT novedosos descritos en la presente. En algunos aspectos de la invención, se prefiere un polinucleótido de GAT que codifique un polinucleótido de GAT con actividad de GAT. En un aspecto, los polinucleótidos de GAT comprenden formas recombinantes o aisladas de ácidos nucleicos que ocurren en forma natural aislados de un organismo, por ejemplo una cepa bacteriana. Los polinucleótidos de GAT ejemplares, por ejemplo SEQ ID N0:1 a SEQ ID NO: 5, fueron descubiertos mediante la clonación de expresión de las secuencias de las cepas de Bacillus que exhiben actividad de GAT. Brevemente, una recolección de aproximadamente de 500 cepas de Bacillus y Pseudomonas se clasificaron por la capacidad natural para el N-acetilato glifosato. Las cepas se cultivaron en LB durante la noche, se cosecharon por centrifugación, se permeabiliza on en tolueno diluido, y luego se lavaron y se resuspendieron en una mezcla de reacción que contiene regulador, glifosato 5mM y acetil-CoA 200 µ?. Las células se incubaron en la mezcla de reacción por entre 1 y 48 horas, tiempo en el cual se adicionó un volumen igual de metanol a la reacción. Las células luego se formaron en pelotillas mediante la centrifugación y el sobrenadante se filtró antes del análisis mediante la espectrometria de masas de modo de ión de origen. El producto de la reacción fue positivamente identificado como N-acetilglifosato al comparar el perfil de espectrometria de masas de la mezcla de reacción con un estándar de N-acetilglifosato como es mostrado en la Figura 2. La detección del producto fue dependiente de la inclusión de ambos substratos (acetilCoA y glifosato) y fue anulada mediante la desnaturalización con calor de las células bacterianas . Los polinucleótidos de GAT individuales luego se clonaron de las cepae identificadas mediante la clasificación funcional. El DNA genómico se preparó y parcialmente se digirió con enzima Sau3Al. Los fragmentos de aproximadamente 4 Kb se clonaron en un vector de expresión E. coli. Y se transformaron en E. Coli. electrocompetente . Los clones individuales que exhiben actividad de GAT se identificaron mediante la espectrometria de masas siguiendo una reacción como es descrito previamente, excepto que el lavado de tolueno se reemplazó mediante la permeabilización con PMBS. Los fragmentos genómicos se secuenciaron y se identificó el cuadro de lectura abierto del polipéptido de GAT putativo-codificación. La identificación del gen de GAT se confirmó mediante la expresión del cuadro de lectura abierto en E. coli y la detección de altos niveles de N-acetilglifosato producido de mezclas de reacción. En otro aspecto de la invención, los polinucleótidos de GAT se producen al diversificar, por ejemplo, recombinar y/o mutar uno o más polinucleótidos de GAT que ocurren de forma natural, aislados, o recombinantes . Como es descrito en más detalle en otra parte de la presente, frecuentemente es posible generar polinucleótidos de GAT diversificados que codifican polipéptidos de GAT con atributos funcionales superiores, por ejemplo, función catalítica incrementada, estabilidad incrementada, nivel de expresión superior, que un polinucleótido de GAT utilizado como un substrato u origen en el proceso de diversificación. Los polinucleótidos de la invención tienen una variedad de usos en, por ejemplo: producción recombinante (es decir, expresión) de los polipéptidos de GAT de la invención; como transgenes (es decir, confieren resistencia al herbicida en plantas transgénicas) ; como marcadores seleccionables para la transformación y mantenimiento del plásmido; como inmunogenos como sondas de diagnóstico para la presencia de ácidos nucleicos complementarios o parcialmente complementarios (incluyendo para la detección de ácidos nucleicos de codificación de GAT naturales; como substratos para la generación de diversidad adicional, por ejemplo, reacciones de recombinación o reacciones de mutación para producir nuevos y/o mejorados homólogos de GAT, y similares. Es importante observar que ciertas utilidades especificas, substanciales y creíbles de los polinucleótidos de GAT no requieren que el polinucleótido codifique un polipéptido con actividad de GAT substancial. Por ejemplo, los polinucleótidos de GAT que no codifican enzimas activas pueden ser fuentes valiosas de polinucleótidos de origen para el uso en procedimientos de diversificación para llegar a las variantes de polinucleótido de GAT, o polinucleótidos de no GAT, con propiedades funcionales deseables (por ejemplo, alta kcat o kcat/Km, baja Km, alta estabilidad hacia el calor u otro factor ambiental, altas tasas de transcripción o traducción, resistencia a la segmentación proteolitica, reducción de antigenicidad, etc.). Por ejemplo, las secuencias de nucleótidos que codifican variantes de proteasa con poca o nada actividad detectable se han utilizado como polinucleótidos de origen en experimentos de tergiversación de DNA para producir progenie que codifica proteasas altamente activas (Ness y colaboradores (1999) Nature Biotechnology 17:893-96) . Las secuencias de polinucleótidos producidas mediante los métodos de generación de diversidad o métodos de recombinación de secuencia recursiva C'RS ") (por ejemplo, tergiversación de DNA) son una característica de la invención. Los métodos de mutación y recombinación que utilizan los ácidos nucleicos descritos en la presente son una característica de la invención. Por ejemplo, un método de la invención incluye la recombinación de manera recursiva de una o más secuencias de nucleótidos de la invención como es descrito antes y después con uno o más nucleótidos adicionales. Los paeos de recombinación son opcionalmente realizados in vivo, ex vivo, in silico o in vitro. La generación de diversidad o la recombinación de la secuencia recursiva produce por lo menos una biblioteca de polinucleótidos de GAT modificados, recombinantes . Los polxpéptidos codificados por los miembros de esta biblioteca son incluidos en la invención. También se contemplan usos de los polinucleótidos, también referidos en la presente como oligonucleótidos, que tienen típicamente por lo menos 12 bases, de preferencia por lo menos 15, más de preferencia por lo menos 20, 30 o 50 o más bases, que se hibridizan bajo condiciones severas o altamente severas a una secuencia de polinucleótido de GAT. Los polinucleótidos se pueden utilizar como sondas, cebadores, agentes de sentido y antisentido, y similares de acuerdo con los métodos como se han mencionado en la presente .
De acuerdo con la presente invención, los polinucleótidos de GAT, incluyendo secuencias de nucleótidos que codifican polipéptidos de GAT, fragmentos de polipéptidos de GAT, proteinas de fusión relacionadas, o equivalentes funcionales de las mismas, son utilizados en moléculas de D A recombinantes que dirigen la expresión de los polipéptidos de GAT en células huésped apropiadas, tales como células bacterianas o de plantas . Debido a la generación inherente del código genético, otras secuencias de ácidos nucleicos que codifican substancialmente la misma o una secuencia de aminoácidos funcionalmente equivalente, también puede ser utilizada para clonar y expresar los polinucleótidos de GAT. La invención provee polinucleótidos de GAT que codifican el producto de transcripción y/o transducción que son subsecuentemente empalmados para finalmente producir polipéptidos de GAT. El empalme se puede producir in vitro o in vivo, y puede involucrar el empalme cis o trans. El substrato para el empalme puede ser polinucleótidos (por ejemplo, transcripciones de RNA) o polipéptidos. Un ejemplo de empalme cis de un polinucleótido es donde un intrón insertado en una secuencia de codificación es removido y las dos regiones de exón flaqueantes son empalmadas para generar una secuencia de codificación de polipéptidos de GAT. Un ejemplo de empalme trans seria donde un polinucleótido de GAT es encriptado al separar la secuencia de codificación en dos o más fragmentos que pueden ser transcriptos por separado y luego empalmados para formar la secuencia de codificación de GAT longitud completa. El uso de una secuencia aumentadora de empalme (que puede ser introducida es una construcción de la invención) puede facilitar el empalme ya sea en cis o trans. Los empalmes cis o trans de los polipéptidos son descritos en más detalle en otra parte en la presente . La descripción más detallada del empalme cis y tran3 3e puede encontrar en las solicitudes de patentes norteamericanas Nos. 09/517,933 y 09/710,686. Asi, algunos polinucleótidos de GAT no codifican directamente un polipéptido de GAT de longitud completa, sino más bien codifican un fragmento o fragmentos de un polipéptido de GAT. Estos polinucleótidos de GAT se pueden utilizar para expresar un polipéptido de GAT funcional a través de un mecanismo que involucra empalme, donde el empalme puede ocurrir en el nivel del polinucleótido (por ejemplo, intrón/exón y/o polipéptido (por ejemplo, inteina/exteina) . Esto puede ser útil, por ejemplo, en el contorno de la expresión de la actividad de GAT, puesto que el polipéptido de GAT funcional solamente será expresado si todos los fragmentos requeridos son expresados en un medio ambiente que permite que los procesos de empalme generen producto funcional. En otro ejemplo, la introducción de una o más secuencias de inserción en un polinucleótido de GAT puede periodo de vida más largo, comparado con transcripciones producida de una secuencia no optimizada. Los codones de detención de traducción también pueden ser modificados para reflejar la preferencia del huésped. Por ejemplo, los codones de detención preferidos para S: cerevisíae y mamíferos son UAA y UGA respectivamente. El codón de detención preferido para las plantas monocotiledóneas es UGA, mientras que los insectos E. Coli. Prefieren utilizar UAA como el codón de detención (Dalphin ME y colaboradores (1996) Míe. Acids Res. 24:216-218). La metodología para utilizar una secuencia de nucleótidos para la expresión en una planta es provista, por ejemplo, en la patente norteamericana No. 6,015,891, y las referencias citas en la misma. Una modalidad de la invención incluye un polinucleótido de GAT que tiene codones óptimos para la expresión en un huésped relevante, por ejemplo, un huésped de planta transgénica. Esto es particularmente deseable cuando un polinucleótido de GAT de origen bacteriano es introducido en una planta transgénica, por ejemplo, para conferir resistencia al glifosato a la planta. Las secuencias de polinucleótidos de la presente invención pueden ser diseñadas con el fin de alterar un polinucleótido de GAT para una variedad de razones, incluyendo pero no limitadas a, alteraciones que modifican la clonación, procesamiento y/o expresión del producto de gen.
Por ejemplo, las alteraciones pueden ser introducidas utilizando técnicas que son bien conocidas en la técnica, por ejemplo, mutagénesis dirigida al sitio, para insertar nuevos sitios de restricción, alterar patrones de glicosilación, cambiar la preferencia del codón, introducir sitios de empalme, etc. Como es descrito en más detalle en la presente, los polinucleótidos de la invención incluyen secuencias que codifican polipéptidos de GAT novedosos y secuencias complementarias a las secuencias de codificación, y fragmentos novedosos de la secuencia de codificación y complementos de los mismos. Los polinucleótidos pueden estar en la forma de RNA o en la forma de DNA, e incluyen RNA, cRNA, RNA y DNA sintético, DNA y cDNA genómico. Los polinucleótidos pueden ser de doble hebra o de una sola hebra, y si son de una sola hebra, puede ser la hebra de codificación o la hebra de no codificación (antisentido, complementaria) . Los polinucleótidos opcionalmente incluyen la secuencia de codificación de un polinucleótido de GAT (i) en aislamiento, (ii) en combinación con secuencia de codificación adcional, para codificar, por ejemplo, una proteina de fusión, una pre-proteina, una prepro-proteina, o similar, (iii) en combinación con secuencias de no codificación, tales como intrones o inteinas, elementos de control tal como un promotor, un aumentador, un elemento terminador, o regiones no traducidas 5' y/o 3' efectivas para la expresión de la secuencia de codificación en un huésped adecuado, y/o (iv) en un vector o ambiente de huésped en el cual el polinucleótido de GAT es un gen heterólogo. Las secuencias también pueden ser encontradas en combinación con formulaciones de composición típicas de ácidos nucleicos, incluyendo en la presencia de portadores, reguladores, adyuvantes, excipientes y similares. Los polinucleótidos y oligonucleótidos de la invención se pueden preparar mediante los métodos de fase sólida estándares, de acuerdo con métodos sintéticos conocidos. Típicamente, los fragmentos de hasta aproximadamente 100 bases son individualmente sintetizados, luego unidos (por ejemplo, mediante los métodos de ligación enzim tica o química, o métodos mediados con polimerasa) para formar esencialmente cualquier secuencia continua deseada . Por ejemplo, los polinucleótidos y oligonucleótidos de la invención se pueden preparar mediante loa síntesis química utilizando, por ejemplo, el método de fosforamidita clásico descrito por Becaucage y colaboradores (1981) Tetrahedron etters 22:18569-69, o el método descrito por Matthes y colaboradores (1984) EMBO J. 3:801-05-, por ejemplo, como es típicamente practicado en métodos sintéticos automatizados . De acuerdo con el método de fosforamidita, los oligonucleótidos son sintetizados, por ejemplo, en un sintetizador de D A automatizado, purificados, recocidos, ligados y clonados en vectores apropiados . Además, esencialmente cualquier ácido nucleico puede ser ordenado a la medida de cualquiera de una variedad de fuentes comerciales, tales como The Midland Certifies Reagent Company (mcr8oligos .com) , The Great American Gene Company (http://www.genco.com), ExpresGen Inc.
(www.expressgwn.com) , Operon Technologies Inc. (Alameda, CA) y muchas otras. De manera similar, los péptidos y anticuerpos pueden ser ordenados a la medida de cualquiera de una variedad de fuentes, tal como PeptidoGenic (pki-meccnet.com), HT1 Bio-products, Inc. (http://www.htibio.com), BMA Biomedicals Lth (U.K.), Bio. Síntesis, Inc., y muchas otras. Los polinucleótidos también se pueden sintetizar por técnicas bien conocidas como es descrito en la literatura técnica. Ver, por ejemplo, Carruthers y colaboradores, Cold Spríng Harbor Symp. Quant . Blol . . 47:411-418(1982), y Adams y colaboradores, J. Jim . Chem . Soc . 105:661 (1983) . Los fragmentos de DNA de doble hebra luego pueden ser obtenidos ya sea al sintetizar la hebra complementaria y al recocer las hebras conjuntamente bajo condiciones apropiadas, o al adicionar la hebra complementaria utilizando polimerasa de DNA con una secuencia cebadora adecuada. Textos generales que describen técnicas biológicas moleculares útiles en la presente, incluyendo mutagénesis, incluyen Berger y Kimmel, Guide to Molecular Cloninq Techniques, Methods in Enzimoloqy, volumen 152 Academic Press, Inc., San Diego, CA ("Berger"); Sambrook y colaboradores, Molecular Cloning - A Laboratory Manual (2nd Ed.), volúmenes 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook"); and Current Protocols in Molecular Biology, F.M. Ausubel y colaboradores, eds . , Current Protocols, una empresa conjunta entre Greene Publishing Associates, Inc. y John Wiley £ Sons, Inc., ( suplementado hasta 2000) ("Ausubel") . Ejemplos de técnicas suficientes para personas directas con la técnica a través de los métodos de amplificación in vi tro, incluyendo la reacción en cadena de polimerasa (PCR), la reacción de cadena de ligasa (LCR) , la amplificación de QB-replicasa y otras técnicas mediadas con polimerasa de RNA (por ejemplo, NASBA) , son encontradas en Berger, Sambrook y Ausubel, asi como Mullis y colaboradores (1987) patente norteamericana No. 4,683,202; PCR Protocols A Guide to Methods and Applications (Innis y colaboradores, eds) Academic Press Inc. San Diego, CA (1990); Arnheim & Levinson (1 de Octubre de 1990) Chemical and Engineering News 36-47; The Journal Of NIH Research (1991) 3:81-94; Kwoh y colaboradores (1989) Proc. Nati. Acad. Sci. USA 86:1173; Guatelli y colaboradores (1990) Proc. Nati. Acad. Sci. USA 87:1874; Lomell y colaboradores (1989) J^ Clin. Chem. 35:1826; Landergren y colaboradores., (1988) Science 241:1077-1080; Van Brunt (1990) Biotechnology 8:291; Wu y Wallace, (1989) Gene 4:560; Barringer y colaboradores (1990) Gene 89:117 y Sooknanan y Malek (1995) Biotechnology 13:563-564. Los métodos mejorados para clonar ácidos nucleicos amplificados in vitro son descritos en Wallace y colaboradores, patente norteamericana No. 5,426,039. Los métodos mejorados para amplificar ácidos nucleicos grandes por PCR son resumidos en Cheng y colaboradores (1994) Nature 369:684-685 y las referencias en la misma, en la cual las amplificaciones de PCR de hasta 40kb son generadas. Un experto apreciará que esencialmente cualquier RNA puede ser convertido en un DNA de doble hebra adecuado para la digestión por restricción, la expansión de PCR y la secuenciación, utilizando transcriptasa inversa y una polimerasa. Ver, Ausbel, Sambrook y Berger, all supra. Variaciones de Secuencia Será apreciado por aquellos expertos en la técnica que debido a la degeneración del código genético, se puede producir una multitud de secuencias de nucleótidos que codifican polipéptidos de GAT de la invención, algunas de las cuales llevan identidad substancial a la3 secuencias de ácido nucleico explícitamente descritas en la presente. Tabla 1 Tabla de Codones Aminoácidos Codón Alaniña Ala A GCA GCC GCG GCU Cistelna Cys C UGC UGU Acido aspártico As D GAC GAU Acido glutámico Glu E GAA GAG Fenilalanina Phe F UUC UUU Glicina Gly G GGA GGC GGG GGU Histidina His H CAC CAU Isoleucina lie I AUA AUC AUU Lisina Lys K AAA AAG Leucina Leu L UUA UUG CUA CUC CUG CUU
Metionina Met M AUG Asparagina Asn N AAC AAU Prolina Pro P CCA CCC CCG CCU Glutamina Gln Q CAA. CAG Arginina Arg R AGA AGG CGA CGC CGG CGU
Serina Ser S AGC AGU UCA UCC UCG UCU
Treonína Thr T ACA ACC ACG ACU Valina Val V GUA GUC GUG GUU Triptofano Trp w UGG Tirosina Tyr Y UAC UAU
Por ejemplo, la inspección de la tabla de codones (tabla 1) muestra que los codones AGA, AGG, CGA, CGC, CGG y CGU todos codifican el aminoácido arginina. Asi, en cada posición en los ácidos nucleicos de la invención donde una arginina es especificada por un codón, el codón puede ser alterado a cualquiera de los codones correspondientes descritos anteriormente sin alterar el polipéptido modificado. Se entiende que U en una secuencia de R A corresponde a T en una secuencia de DNA. Utilizando, como un ejemplo, la secuencia de ácido nucleico correspondiente a los nucleótidos 1-15 de SEQ ID N0:1, ATG ATT GAA GTC AAA, una variación inactiva de esta secuencia incluye AGT ATC GAG GTG AAG, ambas secuencias que codifican la secuencia de aminoácidos MIEVK, correspondiente a los aminoácidos 1-5 de SEQ ID NO: 6. Tales "variaciones inactivas" son una especie de "variaciones conservativamente modificadas" discutidas en lo siguiente. Un experto reconocerá que cada codón en un ácido nucleico (excepto AUG, que es ordinariamente el único codón para metionina) puede ser modificado por técnicas estándares para codificar un polipéptido funcionalmente idéntico. Por consiguiente cada variación inactiva de un ácido nucleico que codifica un polipéptido esta implícita en cualquier secuencia descrita. La invención proporciona cada una y cada variación posible de secuencia de ácido nucleico que codifica un polipéptido de la invención que se podria hacer al seleccionar combinaciones basadas en elecciones de codones posibles. Estas combinaciones se hacen de acuerdo con el código genético triplete estándar (por ejemplo, como es expuesto en la Tabla 1) como es aplicado a la secuencia de ácido nucleico que codifica un polipéptido homólogo de GAT de la invención. Todas las variaciones tales de cada ácido nucleico en la presente son específicamente proporcionadas y descritas por consideración de la secuencia en combinación con el código genético. Cualquier variante puede ser producida como se menciona en la presente. Un grupo de dos o más codones diferentes que, cuando es traducido en el mismo contexto, todos codifican el mismo aminoácido, son referidos en la presente como "codones sinónimos" . Como es descrito en la presente, en algunos aspectos de la invención un polinucleótido de GAT es diseñado para utilizar el uso del codón en un organismo huésped deseado, por ejemplo un huésped de planta. El término "optimizado" u "óptimo" no se propone que sean restringidos a la combinación muy mejor posible de codones, sino simplemente indica que la secuencia de codificación como un total posee un uso mejorado de codones con relación a un polinucleótido precursor del cual fue derivado. Asi, en un aspecto la invención proporciona un método para producir una variante de polinucleótido de GAT al reemplazar por lo menos un codón de origen en una secuencia de nucleótidos con un codón sinónimo que es preferencialmente utilizado en un organismo huésped deseado, por ejemplo, una planta, con relación al codón de origen.
"Variaciones conservativamente modificadas" o, simplemente, "variaciones conservativas" de una secuencia de ácido nucleico particular se refieren a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas, o, donde el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencialmente idénticas . Un experto reconocerá que las substituciones individuales, supresiones o adiciones que alteran, adicionan y suprimen un aminoácido individual o un pequeño porcentaje de aminoácidos (típicamente menor que 5%, más típicamente menor que 4%, 2% o 1%, o menor) en una secuencia codificada son "variaciones conservativamente modificadas" donde las alteraciones dan por resultado la supresión de un aminoácido, la adición de un aminoácido, la substitución de un aminoácido con un aminoácido químicamente similar. Las tablas de substituciones conservativas que proporcionan aminoácidos funcionalmente similares son bien conocidas en la técnica. La Tabla 2 expone seis grupos que contienen aminoácidos que son "substituciones conservativas" entre si. Tabla 2 Grupos de Substitución Conservativa 1 Alanina(A) Serina(S) Treonina(T) 2 Acido aspártico(D) Acido Glutámico(E) Í 3 Asparagina (N) Glutamina (Q) Arginina (R) Lisina (K) ? 5 j Isoleucina (I) Leucina (L) Metionina(M) Valina(V) i fi l 6 Fenilalanina (F) Tirosina(Y) Triptofano (W)
Asi, "variaciones conservativamente sustituidas" de una secuencia de polipéptido listada de la presente invención incluye substituciones de un pequeño porcentaje, típicamente menor que 5%, más típicamente menor que 2% y frecuentemente menor que 1%, de los aminoácidos de la secuencia de polipéptido, con un aminoácido conservativamente seleccionado del mismo grupo de substitución conservativa . Por ejemplo, una variación conservativamente substituida del polipéptido identificado en la presente como SEQ ID NO: 6 contendrá "substituciones conservativas", de acuerdo con los seis grupos definidos anteriormente, en hasta 7 residuos (es decir, 5% de los aminoácidos) en el polipéptido de 146 aminoácidos. En un ejemplo adicional, si cuatro substituciones conservativas fueron localizadas en la región correspondiente a los aminoácidos 21 a 30 de la SEQ ID NO: 6, ejemplos de variaciones conservativamente substituidas de esta región, RPN QPL EAC M, incluyen: KPQ QPV ESC M y KPN NPL DAC V y similares, de acuerdo con las substituciones conservativas listadas en la Tabla 2 (en el ejemplo anterior, las substituciones conservativas están subrayadas) . El listado de una secuencia de proteina en la presente, en conjunción con la tabla de substitución anterior, provee un listado de expresión de todas las proteínas conservativamente substituidas . Finalmente, la adición de secuencias que no alteran la actividad codificable de una molécula de ácido nucleico tal como la adición de una secuencia no funcional o de no codificación, es una variación conservativa del ácido nucleico básico. Un experto apreciará que muchas variables conservativas de las construcciones de ácido nucleico que son descritas producen una construcción funcionalmente idéntica. Por ejemplo, como se discutió anteriormente, debido a la degeneración del código genético, "las substituciones inactivas" (es decir, substituciones en una secuencia de ácido nucleico que no da por resultado una alteración en un polipéptido codificado) son una característica implicada de cada secuencia de ácido nucleico que codifica un aminoácido. De manera similar, "las substituciones de aminoácido conservativas" en uno o unos cuantos aminoácidos en una secuencia de aminoácidos son substituidas con diferentes aminoácidos, con propiedades altamente similares, también son fácilmente identificadas que son altamente similares a una construcción descrita. Tales variaciones conservativas de cada secuencia descrita son una característica de la presente invención . Las modificaciones no conservativas de un ácido nucleico en particular son aquellas que substituyen cualquier aminoácido no caracterizado como una substitución conservativa. Por ejemplo, cualquier substitución que cruza los enlaces de los seis grupos expuestos en la Tabla 2. Estos incluyen las substituciones de aminoácidos básicos acidicos por aminoácidos neutros (por ejemplo, Asp, Glu, Asn, o Gln por Val, lie, Leu o Met) , aminoácido aromático por aminoácidos básicos o acidicos (por ejemplo, Phe, Tyr o Trp por Asp, Asn, Glu o Gln) o cualquier otra substitución que no reemplaza un aminoácido con un aminoácido similar. Hibridación de Acido Nucleico Los ácidos nucleicos se "hibridizan" cuando se asocian, típicamente en solución. Los ácidos nucleicos se hibridizan debido a una variedad de fuerzas fisicoquímicas bien caracterizas, tal como la unión de hidrógeno, la exclusión de solvente, el apilado de base y similares. Una guia extensiva para la hibridización de ácidos nucleicos es encontrada en Tijssen (1993) Laboratory Techniques ín Biochemistry and Molecular Biology-Hibrldlzation wíth Nacleíc Acid Probes, part. I, chapter 2, "Overview of principies of hibridization and strategy of nucleic acid probé assays," (Elsevier, New York) , asi como en Ausubel, supra, Hames y Higgins (1995) Gene Probes 1, IRL Press at Oxford Univers ty Press, Oxford, England (Hames y Higgins 1) y Hames y Higgins
(1995) Gene Probes 2, IRL Press at Oxford University Press, Oxford, England (Hames y Higgins 2) proporcionan detalles de la sintesis, marcación, detección y cuantificación de DNA y RNA, incluyendo oligonucleótidos . Las "condiciones de lavado de hibridización severa" en el contexto de los experimentos de hibridización de ácido nucleico, tal como las hibridizaciones de Southern y Northern, son dependientes de la secuencia, y son diferentes bajo diferentes parámetros ambientales. Una guia extensiva para la hibridización de ácidos nucleicos es encontrada en Tijssen (1993), supra, y en Hames y Higgins 1 y Hames y Higgins 2, supra. Para propósitos de la presente invención, generalmente, las condiciones de hibridización y lavado "altamente severas" son seleccionadas que son de aproximadamente 5°C o menos, menor que el punto de fusión térmico (Tm) para la secuencia especifica a una intensidad iónica definida y pH (como es mencionado en lo siguiente, las condiciones altamente severas también pueden ser referidas en términos comparativos) . La Tm es la temperatura (bajo la intensidad iónica definida y pH) en la cual 50¾ de la secuencia de prueba se hibridiza a una sonda perfectamente igualada. Las condiciones muy severas son seleccionadas para ser iguales a la Tm para una sonda particular. La Tm de un doble de ácido nucleico indica la temperatura en la cual el doble es 50% desnaturalizado bajo las condiciones dadas y representa una medición directa de la estabilidad del hibrido de ácido nucleico. Así, la Tm corresponde a la temperatura correspondiente al punto medio en la transición de la hélice a la espiral aleatoria; depende de la longitud, la composición del nucleótido, la intensidad iónica para estiramientos largos de nucleótidos . Después de la hibridización, el material de ácido nucleico no hibridizado puede ser removido mediante una serie de lavados, la severidad de la cual puede ser ajustada dependiendo de los resultados deseados. Las condiciones de lavado de baja severidad (por ejemplo, utilizando sal superior y temperatura menor) incrementa la sensibilidad, pero pueden producir señales de hibridización no especificas y altas señales de fondo. Las condiciones de severidad más altas (por ejemplo, utilizando sal inferior y temperatura superior que es cercana a la temperatura de hibridización) disminuye la señal de fondo, típicamente con solo la señal específica restante. Ver, Rapley R. y Walker, J.M. eds . Molecular Biomethods Handbook (Humana Press, Inc. 1998) (después en la presente "Rapley and Walker"), que es incorporada en la presente por referencia en su totalidad para todos los propósitos. La Tm de un doble de DNA-DNA se puede estimar utilizando la Ecuación 1 como sigue: Tro(°C) =- 81.5°C + 16.6(logioM) + 0.41 (%G + C) - 0.72 (¾f) - 500/n, donde M es la molaridad de los cationes monovalentes (usualmente Na+), ( G + C) es el porcentaje de los nucleótidos guanosina (G) y cistosina (C) , (¾f) es el porcentaje de formalización y n es el número de bases de nucleótidos (es decir, la longitud) del híbrido. Ver, Rapley y alker, supra. La Tm de un doble de RNA-DNA se puede estimar al utilizar la Ecuación 2 como sigue: Tm(°C) = 79.8°C + 18.5(log-ioM) + 0.58(%G + C) - 11.8(%G + C)z - 0.56(%f) - 820/n, donde M es la molaridad de los cationes monovalentes (usualmente Na+) , (%G + C) es el porcentaje de los nucleótidos guanosina (G) y cistosina (C) , (%f) es el porcentaje de formamida y n es el número de bases de nucleótidos (es decir, la longitud) del híbrido. Id. Las Ecuaciones 1 y 2 son típicamente precisas solamente para dobles de híbrido más largos que aproximadamente 100-200 nucleótidos. Id. La Tm de secuencias de ácido nucleico más cortas que 50 nucleótidos puede ser calculada como sigue:
Tm(°C) = 4 (G + C) + 2(A + T), donde A (adenina) , C, T (timina) , y G son los números de los nucleótidos correspondientes. Un ejemplo de condiciones de hibridización severas para la hibridización de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en una mancha de Southern o northern es 50% formalina con 1 mg de heparina a 42°C, con la hibridización que es llevada a cabo durante la noche. Un ejemplo de condiciones de lavado severas es un lavado 0.2x SSC a 65°C durante 15 minutos (ver Sambrook, supra para una descripción del regulador SSC) . Frecuentemente el lavado de alta severidad es precedido por un lavado de baja severidad para remover la señal de sonda de fondo. Un ejemplo del lavado de baja severidad es 2x SSC a 40°C durante 15 minutos. En general, una relación de señal a ruido de 2.5x-5x (o mayor) que aquella observada para una sonda no relacionada en el ensayo de hibridización particular indica la detección de una hibridación específica. La detección de la hibridización menos severa entre dos secuencias en el contexto de la presente invención indica similaridad estructural relativamente fuerte u homología a, por ejemplo, los ácidos nucleicos de la presente invención proporcionados en los listados de secuencia en la presente. Como se mencionó, "las condiciones altamente severas" son seleccionadas para ser de aproximadamente 5°C o menos, menor que el punto de fusión térmico (Tm) para la secuencia especifica a una intensidad iónica definida y pH. Las secuencias objetivo que están estrechamente relacionadas o idénticas a la secuencia de nucleótidos de interés, (por ejemplo, "sonda") pueden ser identificadas bajo condiciones altamente severas . Las condiciones de menor severidad son apropiadas para secuencias que son menos complementarias . Ver, por ejemplo, Rapley y Walker, supra. La hibridización comparativa se puede utilizar para identificar ácidos nucleicos de la invención, y este método de hibridización comparativo es un método preferido para distinguir ácidos nucleicos de la invención. La detección de la hibridización altamente severa entre dos secuencias de nucleótidos en el contexto de la presente invención indica s milaridad/homologia estructural relativamente fuerte a, por ejemplo, los ácidos nucleicos proporcionados en el listado de secuencia en la presente. La hibridización altamente severa entre dos secuencias de nucleótidos demuestra un grado de similaridad u homología de la estructura, composición de base de nucleótido, arreglo u orden que es mayor que aquel detectado por las condiciones de hibridización severas . En particular, la detección de hibridización altamente severa en el contexto de la presente invención indica fuerte similaridad estructural u homología estructural (por ejemplo, estructura del nucleótido, composición base, arreglo u orden) a, por ejemplo, los ácidos nucleicos proporcionados en los listados de secuencias en la presente. Por ejemplo, es deseable identificar los ácidos nucleicos de prueba que hibridizan a los ácidos nucleicos ejemplares en la presente bajo condiciones severas. Asi, una medición de hibridización severa es la capacidad para hibridizar a uno de los ácidos nucleicos listados (por ejemplo, secuencias de ácido nucleico SEQ ID NO:l a SEQ ID NO:5 y SEQ ID NO: 11 a SEQ ID NO:262, y secuencias de polinucleótido complementarias de las mismas) bajo condiciones altamente severas (o condiciones muy severas, o condiciones de hibridización de ultra-alta severidad, o condiciones de hibridización de ultra-ultra alta severidad) , La hibridización severa (asi como las condiciones de hibridización altamente severas, de ultra-alta severidad o de ultra-ultra alta severidad) y las condiciones de lavado fácilmente se pueden determinar empíricamente para cualquier ácido nucleico de prueba. Por ejemplo, en la determinación de la hibridización altamente severa y las condiciones de lavado, la hibridización y las condiciones de lavado son gradualmente incrementadas (por ejemplo, al incrementar la temperatura, al disminuir la concentración de sal, al incrementar las concentraciones de detergente y/o al incrementar la concentración de solventes orgánicos, tal como formalina, en la hibridización o lavado) , hasta que se cumplen un conjunto de criterios seleccionados. Por ejemplo, la hibridización y las condiciones de lavado son gradualmente incrementadas hasta que una sonda que comprende uno o más secuencias de ácido nucleico seleccionadas de SEQ ID N0:1 a SEQ ID NO: 5 y SEQ ID NO: 11 a SEQ ID NO: 262, y las secuencias de polinucleótido complementarias de las mismas, se enlaza a un objetivo complementario perfectamente igualado (nuevamente, un ácido nucleico que comprende una o más secuencias de ácido nucleico seleccionadas de SEQ ID NO:l a SEQ ID NO: 5 y SEQ ID NO: 11 a SEQ ID NO: 262, y secuencias de polinucleótido complementarias de las mismas) , con una relación de señal a ruido que es de por lo menos aproximadamente 2.5x, y opcionalmente aproximadamente 5x o más alta que la observada para la hibridización de la sonda a un objetivo no igualado. En este caso, el objetivo no igualado es un ácido nucleico correspondiente a un ácido nucleico (diferente a aquellos en el listado de secuencia acompañante) que está presente en una base de datos pública tal como GenBank™ en el momento de presentación de la presente solicitud- Tales secuencias pueden ser identificadas en GenBank por un experto. Ejemplos incluyen los números de acceso Z99109 y Y09476. Tales secuencias adicionales pueden ser identificadas en por ejemplo, GenBank, por un experto ordinario en la técnica.
Un ácido nucleico de prueba se dice que hibridiza específicamente a un ácido nucleico de sonda cuando se hibridiza por lo menos ½ asi como la sonda para el objetivo complementario perfectamente igualado, es decir, con una relación de señal a ruido de por lo menos ½ tan alta como la hibridización de la sonda al objetivo bajo condiciones en la cual la sonda perfectamente igualada se enlaza al objetivo complementario pe fectamente igualado con una relación de señal a ruido que es por lo menos aproximadamente 2x-10x, y ocasionalmente de 20x, 50x o más grande que aquella observada para la hibridización a cualquiera de los polinucleótidos no igualados de Nos. de Acceso Z99109 y Y09476. La hibridización de ultra alta severidad y las condiciones de lavado son aquellas en las cuales la severidad de hibridización y las condiciones de lavado son incrementadas hasta que la relación de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente igualado es de por lo menos lOx tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo no igualados de números de Acceso GenBank Z99109 y Y09476. Un ácido nucleico objetivo que se hibridiza a una sonda bajo tales condiciones, con una relación de señal a ruido de por lo meno3 H que del ácido nucleico objetivo complementario perfectamente igualado se dice que enlaza a la sonda bajo condiciones de ultra alta severidad. De manera similar, aún niveles más altos de severidad pueden ser determinados al incrementar gradualmente la hibridización y/o las condiciones de lavado del ensayo de hibridización relevante. Por ejemplo, aquellos en los cuales la severidad de hibridización y las condiciones de lavado son incrementadas hasta que la relación de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente igualado es de por lo menos ???, 20X, 50X, 100X o 500X o mayor, tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo no igualados de números de Acceso GenBank Z99109 y Y09476. Un ácido nucleico objetivo que hibridiza a una sonda bajo tales condiciones, con una relación de señal a ruido de por lo menos ½ que del ácido nucleico objetivo complementario perfectamente igualado se dice que enlaza a la sonda bajo condiciones de ultra-ultra alta severidad. Los ácidos nucleicos objetivo que hibridizan a los ácidos nucleicos representados por SEQ ID NO:l a SEQ ID NO: 5 y SEQ ID NO: 11 a SEQ ID NO: 262, bajo condiciones de alta, ultra alta y ultra-ultra alta severidad son una característica de la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con una o unas cuantas sustituciones de ácido nucleico inactivas o conservativas comparadas con una secuencia de ácido nucleico dada.
Los ácidos nucleicos que no-se hibridizan entre si bajo condiciones severas todavía son sustancialmente idénticos si los polipéptidos que ellos codifican son sustancialmente idénticos. Esto ocurre, por ejemplo, cuando una copia de un ácido nucleico es creada utilizando la degeneración de codón máxima permitida por el código genético, o cuando los antisueros o antisuero generado contra una o más de SEQ ID NO: 6 a SEQ ID NO: 10 y 5EQ ID NO:263 a SEQ ID NO: 514, que se ha sustraído utilizando los polipéptidos codificados por secuencias de nucleótidos conocidas, incluyendo el número de Acceso GenBank CAA70664. Detalles adicionales de identificación inmunológica de polipéptidos de la invención son encontrados enseguida. Adicionalmente, para distinguir entre los dobles con las secuencias de menos de aproximadamente 100 nucleótidos, un procedimiento de hibridización TMACl conocido para aquellos expertos ordinarios en la técnica puede ser utilizado. Ver, por ejemplo, Sorg. ü*. y colaboradores 1 Nucleic Acids Res. (sept. 11, 1991) 19(17), incorporada en la presente por referencia en su totalidad para todos los propósitos. En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de SEQ ID NO:l a SEQ ID NO: 5 y SEQ ID NO: 11 a SEQ ID NO: 262. La subsecuencia única es única comparada con un ácido nucleico correspondiente a cualquiera de los números de acceso GenBank Z99109 y Y09476. Tales subsecuencias únicas pueden ser determinadas al alinear cualquiera de SEQ ID NO:l a SEQ ID NO: 5 y SEQ ID NO: 11 a SEQ ID NO: 262 contra el conjunto completo de ácidos nucleicos representados por los números de acceso GenBank Z99109 y Y09476 u otras secuencias relacionadas disponibles en bases de datos públicas como de la fecha de presentación de la presente solicitud. La alineación puede ser realizada utilizando el algoritmo de BLAST ajustado a los parámetros de error. Cualquier subsecuenc a única es útil, por ejemplo, como una sonda para identificar los ácidos nucleicos de la invención. De manera similar, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de SEQ ID NO: 6 a SEQ ID NO: 10 y SEQ ID NO:263 a SEQ ID NO: 514. Aqui, la subsecuencia única es única comparada con un polipéptido correspondiente al número de acceso GenBank CAA70664. Nuevamente aqui, el polipéptido es alineado contra las secuencias representadas por el número de acceso CAA70664. Notar que si la secuencia corresponde a una secuencia no traducida tal como un seudo gen, el polipéptido correspondiente es generado simplemente por la traducción in silico de la secuencia de ácido nucleico en una secuencia de aminoácidos, donde el cuadro de lectura es seleccionado para corresponder al cuadro de lectura de los polinucleótidos de GAT homólogos. La invención también proporciona ácidos nucleicos objetivos que se hibridizan bajo condiciones severas a un oligonucleótido de codificación única que codifica una subsecuencia única en un polipéptido seleccionado de SEQ ID NO: 6 a SEQ ID NO:10 y SEQ ID NO:263 a SEQ ID NO: 514, en donde la subsecuencia única es única comparada con un polipéptido correspondiente a cualquiera de los polipéptidos de control. Las secuencias únicas son determinadas como se mencionó anteriormente . En un ejemplo, las condiciones severas son seleccionadas tal que un oligonucleótido perfectamente complementario al oligonucleótido de codificación se hibridiza al oligonucleótido de codificación con por lo menos aproximadamente una relación de señal a ruido de 2.5x-10x más alta, de preferencia por lo menos aproximadamente 5-10x más alta que para la hibridización del oligonucleótido perfectamente complementario a un ácido nucleico de control correspondiente a cualquiera de los polipéptidos de control. Las condiciones pueden ser seleccionadas de tal manera que las más altas relaciones de señal a ruido son observadas en el ensayo particular que es utilizado, por ejemplo, aproximadamente 15x, 20x, 30x, 50x o más. En este ejemplo, el ácido nucleico objetivo se hibridiza al oligonucleótido de codificación única con una relación de señal a ruido de por lo menos 2x más alta, comparada con la hibridización del ácido nucleico de control al oligonucleótido de codificación. Nuevamente, se pueden seleccionar relaciones de señal a ruido más altas, por ejemplo, aproximadamente 2.5x# 5x, 10x, 20x, 30x, 50x o mayor. La señal particular dependerá de la etiqueta utilizada en el ensayo relevante, por ejemplo, como una etiqueta fluorescente, una etiqueta colorimétrica, una etiqueta radioactiva o similar. Vectores f Promotores y Sistemas de Expresión La presente invención también incluye construcciones recombinantes que comprenden una o más de las secuencias de ácido nucleico como se describen ampliamente antes. Las construcciones comprenden un vector, tal como, un plásmido, un cósmido, un fago, un virus, un cromosoma artificial bacteriano (BAC), un cromosoma artificial de levadura (YAC) , o similar, en el cual una secuencia de ácido nucleico de la invención se ha insertado en una orientación delantera o trasera. En un aspecto preferido de esta modalidad, la construcción además comprende secuencias regaladoras, incluyendo, por ejemplo, un promotor, operablemente enlazado a la secuencia. Grandes números de vectores y promotores adecuados son conocidos para aquellos expertos en la técnica y son comercialmente disponibles . Textos generales que describen técnicas biológicas moleculares útiles en la presente, incluyendo el uso de vectores, promotores y muchos otros temas relevantes, incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academia, Press, Inc., San Diego, CA (Berger); Sambrook y colaboradores, Molecular Cloning - A Laboratory Manual (2nd Ed.) Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") y Current Protocols in Molecular Biology, F.M. Ausubel y colaboradores, eds., Current Protocols, una empresa conjunta entre Greene Publishihg Associates, Inc. y John Wiley & Sons, Inc., ( suplementada hasta 1999) ("Ausubel") . Ejemplos de protocolos suficientes para dirigir personas expertas a través de los métodos de amplificación in vitro, incluyendo la reacción de cadena de polimerasa (PCR) , la reacción de cadena de ligasa (LCR) , la amplificación de Qp-replicasa y otras técnicas mediadas con polimerasa de RNA (por ejemplo, NASBA) , por ejemplo, para la producción de los ácidos nucleicos homólogos de la invención son encontrados en Berger, Sambrook, y Ausubel, asi como Mullís y colaboradores, (1987) patente norteamericana No. 4,683,202; PCR Protocols A Guide to Method3 and Applications (Innis y colaboradores eds) Academic Press Inc. San Diego, CA (1990) (Innis) ; Arnheim & Levinson (1 de octubre de 1990), C&EN 36-47; The Journal Of NIH Research (1991), 3, 81-94; (Kwoh y colaboradores (1989) Proc. Nati. Acad. Sci. USA 86, 1173; Guatelli y colaboradores (1990);
Proc. Nati. Acad. Sci. USA 87, 1874; Lomell y colaboradores (1989) J. Clin. Chem 35, 1826; Landegren y colaboradores (1988) Science 241, 1077-1080; Van Brunt (1990) Biotechnoloqy 8, 291-294; Wu y Wallace, (1989) Gene 4, 560, Barringer y colaboradores (1990) Gene 89, 117 y Sooknanan y Malek (1995) Biotechnology 13: 563-564. Métodos mejorados para la clonación de ácidos nucleicos amplificados in vitro son descritos en Wallace y colaboradores, en la patente norteamericana No. 5,426,039. Los métodos mejorados para amplificar ácidos nucleicos grandes por PCR son resumidos en Cheng y colaboradores (1994) Nature 369: 684-685 y las referencias citadas en la misma, en la cual las amplificaciones de PCR de hasta 40Kb son generadas. Un experto apreciará que esencialmente cualquier RNA puede ser convertido en un DNA de doble hebra adecuado para la digestión de restricción, expansión de PCR y la secuenciación utilizando la transcriptasa inversa y una polimerasa . Ver, por ejemplo, Ausubel, Sambrook y Berger all supra. La presente invención también se refiere a células huésped diseñadas que son transducidas (transformadas o transfectadas) con un vector de la invención (por ejemplo, un vector de clonación de la invención o un vector de expresión de la invención) , asi como la producción de polipéptidos de la invención mediante técnicas recombinantes . El vector puede ser, por ejemplo, un plásmido, una particula viral, un fago, etc . Las células huésped diseñadas pueden ser cultivadas en medios nutrientes convencionales modificados como es apropiado para la activación de promotores, transformantes de selección, o amplificación del gene homólogo de GAT. Las condiciones de cultivo, tal como temperatura, pH y similares, son aquellas previamente utilizadas por la célula huésped seccionada para expresión, y serán evidentes para aquellos expertos en la técnica y en las referencias citadas en la presente, incluyendo, por ejemplo, Sambrook, Ausubel y Berger, asi como por e emplo, Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en la misma. Los polipéptidos de GAT de la invención se pueden producir en células no animales tales como plantas, levadura, hongos, bacterias y similares. Además de Sambrook, Berger y Ausubel, los detalles que consideran el cultivo de células no animales se pueden encontrar en Payne y colaboradores (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Orqan Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL. Los polinucleótidos de la presente invención se pueden incorporar en cualquiera de una variedad de vectores de expresión adecuados para expresar un polipéptido. Vectores adecuados incluyen secuencias cromosomales, no cromosomales y de DNA sintético, por ejemplo, derivados de SV40; plásmidos bacterianos; DNA de fago; baculovirus; plásmidos de levadura, vectores derivados de combinaciones de plásmidos y DNA de fago, DNA viral tal como vaccinia, adenovirus, virus de sífilis de aves domésticas, pseudorrabias, adenovirus, virus adeno-asociado, retrovirus y muchos otros. Cualquier vector que transduce material genético en una célula, y, si la replicación es deseada, que es replicable y viable en el huésped relevante puede ser utilizado. Cuando se incorpora en un vector de expresión, un polinucleótido de la invención es operativamente enlazado a una secuencia de control de transcripción apropiada (promotor) para dirigir la síntesis de mRNA. Ejemplos de tales secuencias de control de transcripción particularmente adecuadas para el uso en plantas transgénicas incluyen los promotores del virus de mosaico de coliflor (CaMV) , virus de mosaico de escrofularia (FMV) y virus de banda de vena de fresa (SVBS) , descritos en la solicitud provisional norteamericana No. 60/245,354. Otros promotores conocidos para controlar la expresión de genes en células procarióticas o eucarióticas o sus virus y que pueden ser utilizadas en algunas modalidades de la invención incluyen el promotor SV40, promotor lac o trp de E. coli, promotor lamda PL de fago. Un vector de expresión opcionalmente contiene un sitio de enlace de ribosoma para la iniciación de traducción, y un terminador de transcripción. El vector también opcionalmente incluye secuencias apropiadas para amplificar la expresión, por ejemplo, un aumentador. Además, los vectores de expresión de la presente invención opcionalmente contienen uno o más genes marcadores seleccionables para proporcionar una cualidad fenotipica para la selección de células huésped transformadas, tal como la resistencia a dihidrofolato reductasa o a neomicina para el cultivo de célula eucariótica, o tal como la resistencia a tetraciclina o a ampicilina en E. coli . Los vectores de la presente invención se pueden emplear para transformar un huésped apropiado para permitir que el huésped exprese una proteina o polipéptido de la invención. Ejemplos de huéspedes de expresión apropiados incluyen: células bacterianas, tales como E. coli, B. subtilis, Streptomyces, y Salmonella typhimuriu , células fúngales, tales como Saccharomyces cerevisiae, Pichia pastorís, y Neurospora crassa; células de insecto tales como Drosop ila y Spodoptera frugiperda; células mamiferas tales como CHO, COS, BHK, HEK 293 o melanoma de Bowes; o células de planta o explantaciones, etc. Se entiende que no todas las células o lineas de células necesitan ser capaces de producir polipéptidos de GAT completamente funcionales; por ejemplo, los fragmentos antigénicos de un polipéptido de GAT pueden ser producidos. La invención no está limitada por las células huésped empleadas. En sistemas bacterianos, un número de vectores de expresión puede ser seleccionado dependiendo del uso propuesto para el polipéptido de GAT. Por ejemplo, cuando se necesitan cantidades grandes de polipéptido de GAT o fragmentos del mismo para la producción comercial o para inducción de anticuerpos, pueden ser deseables vectores que dirigen alto nivel de expresión de proteínas de fusión que son fácilmente purificados . Tales vectores incluyen, pero no están limitados a, vectores de clonación y expresión de . coli. multifuncionales tal como BLUESCRIPT (Stratagene) , en el cual la secuencia de codificación de polipéptido de GAT puede ser ligada en el vector en cuadro con secuencias para el Met amino-terminal y los 7 residuos subsecuentes de beta-galactosidasa de modo que se produce una proteina híbrida; vectores pIN (Van Heeke & Schuster (1989) J Biol Chem 264:5503-5509); vectores pET (Novagen, Madison I); y similares . De manera similar, en la levadura Saccharomyces cerevísiae un número de vectores que contienen promotores constitutivos o inducibles tales como factor alfa, alcohol oxidasa y PGH pueden ser utilizados para la producción de los polipéptidos de GAT de la invención. Para revisiones, ver Ausubel y colaboradores (supra) y Grant y colaboradores (1987; Methods in Enzymoloqy 153:516.544). En células huésped mamlferas, se puede utilizar una variedad de sistemas de expresión, incluyendo sistemas de base viral. En los casos donde es utilizado un adenovirus como un vector de expresión, una secuencia de codificación, por ejemplo, de un polipéptido de GAT, es opcionalmente ligada a un complejo de transcripción/traducción de adenovirus que consiste del promotor tardío y la secuencia líder tripartita. La inserción de una región de codificación del polipéptido de GAT en una región El o E3 no esencial del genoma viral dará por resultado un virus viable capaz de expresar una GAT en las células huésped infectadas (Logan y Shenk (1984) Proc Nati Acad Sci USA 81:3655-3659). Además, aumentadores de transcripción, tal como el aumentador de virus de sarcoma de licor (RSV), pueden ser utilizados para incrementar la expresión en células huésped mamlferas . De manera similar, en células de plantas, la expresión puede ser inducida desde un transgen integrado en un cromosoma de planta, o citoplásínicamente desde un ácido nucleico episomal o viral. En el caso de transgenes establemente integrados, frecuentemente es deseable proporcionar secuencias capaces de inducir la expresión constitutiva o inducible de los polinucleótidos de GAT de la invención, por ejemplo, utilizando secuencias reguladoras virales, por ejemplo, CaMV, o derivadas de plantas. Numerosas secuencias reguladoras derivadas de plantas han sido descritas, incluyendo secuencias con expresión directa en una manera especifica al tejido, por ejemplo, TobRB7, patatin B33, promotores de gen GRP, el promotor rbcS-3A y similares. Alternativamente, la expresión de alto nivel se puede alcanzar al expresar transientemente secuencias exógenas de un vector viral de planta, por ejemplo, TMV, MBV, etc, Típicamente, las plantas transgénicas que expresan constitutivamente un polinucleótido de GAT de la invención serán preferidas, y las secuencias reguladoras seleccionadas para asegurar la expresión estable constitutiva del polipéptido de GAT. En algunas modalidades de la presente invención, se prepara una construcción de polinucleótido de GAT adecuada para la transformación de células de plantas es preparada. Por ejemplo, un polinucleótido de GAT deseado puede ser incorporado en un cásete de expresión recombinante para facilitar la introducción del gen en una planta y la expresión subsecuente del polipéptido codificado. Un cásete de expresión típicamente comprenderá un polinucleótido de GAT, o fragmento funcional del mismo, operablemente enlazado a una secuencia promotora y otras secuencias reguladoras de iniciación transcripcional y traduccional que dirigirán la expresión de la secuencia en los tejidos propuestos (por ejemplo, planta entera, hojas, semillas) de la planta transformada . Por ejemplo, se puede emplear un promotor de planta fuertemente o débilmente constitutivo que dirigirá la expresión del polipéptido de GAT a todos los tejidos de una planta. Tales promotores son activos bajo la mayoria de condiciones ambientales y estados de desarrollo o diferenciación celular. Ejemplos de promotores constitutivos incluyen el promotor 1 ' o 2 ' derivado de T-DNA de Agrobacteríum tumefacíens, y otras regiones de iniciación de transcripción de varios genes de plantas conocidos para aquellos expertos. En situaciones en las cuales la sobreexpresión de un polinucleótido de GAT es perjudicial a la planta o de otra manera indeseable, un experto, en la revisión de esta descripción, reconocerá que los promotores constitutivos débiles pueden ser utilizados para bajos niveles de expresión. En aquellos casos donde los altos niveles de expresión no son dañinos a la planta, un promotor fuerte, por ejemplo, un t-RNA u otro promotor pol III, o un promotor pol II fuerte, tal como el promotor de virus de mosaico de coliflor, puede ser utilizado. Alternativamente, un promotor de planta puede estar bajo control ambiental. Tales promotores son referidos en la presente como promotores "inducibles". Ejemplos de condiciones ambientales que pueden afectar la transcripción por promotores inducibles incluyen el ataque por patógeno, condiciones anaeróbicas o la presencia de luz. Los promotores utilizados en la presente invención pueden ser "específicos al tejido" , como tales, bajo control de desarrollo en que el polinucleótido es expresado solamente en ciertos tejidos, tales como hojas y semillas. En modalidades es las cuales una o más secuencias de ácido nucleico endógenas al sistema de planta son incorporadas en la construcción, los promotores endógenos (o variantes de los mismos) de estos genes pueden ser empleados para dirigir la expresión de los genes en la planta transfectada. También 3e pueden utilizar promotores específicos al tejido para dirigir la expresión de polinucleótidos heterólogos. En general, el promotor particular utilizado en el cásete de expresión en plantas depende de la aplicación propuesta. Cualquiera de un número de promotores que dirigen la transcripción en células de plantas son adecuados . El promotor puede ser ya sea constitutivo o inducible. Además de los promotores mencionados anteriormente, los promotores de origen bacteriano que operan en las plantas incluyen el promotor de octopina sintasa, el promotor de nopalina sintasa y otros promotores derivados de plásmidos Ti naturales (ver, Herrara-Estrella y colaboradores (1983) Nature 303:209-213). Los promotores virales incluyen los promotores de RNA 35S y 19S del virus de mosaico de coliflor (Odell y colaboradores U7
(1985) Nature 313:810-812). Otros promotores de plantas incluyen el promotor de subunidad pequeña de ribulosa-1, 3-bifosfato carboxilasa y el promotor de faseolina. La secuencia promotora del gen E8 y otros genes también pueden ser utilizados. El aislamiento y la secuencia del promotor E8 es descrita en detalle en Deikman y Fischer (1988) EMBO J. 7:3315-3327. Para identificar promotores candidatos, las porciones 5' de un clon genómico es analizada para las secuencias características de las secuencias promotoras. Por ejemplo, los elementos de la secuencia promotora incluyen la secuencia de consenso de cuadro TATA ( TATAAT ) , que es usualmente de 20 a 30 pares base corriente arriba del sitio de inicio de transcripción. En las plantas, además de corriente arriba del cuadro TATA, en las posiciones -80 a -100, típicamente hay un elemento promotor con una serie de adeninas que circundan el trinucleótido G (o T ) como es descrito por Messing y colaboradores (1983) Genetic Engineering in Plants, osage y colaboradores (eds), pp 221-227. En la preparación de construcciones de polinucleótido, por ejemplo, vectores, de la invención, las secuencias diferentes al promotor y el polinucleótido co-unido también pueden ser empleadas. Si se desea la expresión de polipéptido normal, una región de poliadenilación en el extremo 3' de una región de codificación de GAT puede ser incluida. La región de poliadenilación puede ser derivada, por ejemplo, de una variedad de genes de planta o de T-DNA. La construcción también puede incluir un gen marcador que confiere un fenotipo selecciona le en las células de plantas. Por ejemplo, el marcador puede codificar la tolerancia a biocina, particularmente tolerancia a antibiótico, tal como tolerancia a kanamicina, G418, bleomicina, higromicina , o tolerancia a herbicida, tal como tolerancia a clorosulforón o fosfinotricina (el ingrediente activo en los herbicidas bialafos y Basta) . Las señales de iniciación especificas pueden ayudar en la traducción eficiente de una secuencia de codificación de polinucleótido de GAT de la presente invención. Estas señales pueden incluir, por ejemplo, el codón de iniciación ATG y las secuencias adyacentes . En los casos donde una secuencia de codificación de polipéptido de GAT, su codón de iniciación y las secuencias corriente arriba son insertadas en un vector de expresión apropiado, nada de señales de control traduccionales adicionales pueden ser necesarias. Sin embargo, en casos en donde solamente la secuencia de codificación (por ejemplo, una secuencia de codificación de proteina madura), o una porción de la misma, es insertada, se deben proporcionar señales de control de transcripción exógenas que incluyen el codón de iniciación. Además, el codón de iniciación debe estar en el cuadro de lectura correcto para asegurar la transcripción del inserto completo. Los elementos transcripcionales exógenos y los codones de iniciación pueden ser de varios orígenes, tanto naturales como sintéticos. La eficiencia de la expresión pueden ser aumentada mediante la inclusión de aumentadores apropiados al sistema de célula en uso (Scharf D y colaboradores (1994) Results Probl Cell Differ 20:125-62; Bittner y colaboradores (1987) Methods in Enzymol 153:516-544). Secuencias de Secreción/Localización Los polinucleótidos de la invención también pueden ser fusionados, por ejemplo, en el cuadro a ácidos nucleicos que codifican una secuencia de secreción/localización, a la expresión de polipéptido objetivo a un compartimiento celular deseado, membrana, u orgánelo de una célula mamifera, o para dirigir la secreción de polipéptido al espacio periplásmico o al medio de cultivo de célula. Tales secuencias son conocidas para aquellos expertos, e incluyen los péptidos líderes de secreción, secuencias objetivo de organelo (por ejemplo, secuencias de localización nuclear, señales de retención ER, secuencias de transito mitocóndricas, secuencias de tránsito de cloroplastos) , secuencias de localización/fi ación de membrana (por ejemplo, la secuencias de transferencia de detención, secuencias de fijación de GPI) , y similares.
En una modalidad preferida, un polinucleótido de la invención es fusionado en el cuadro con una secuencia de tránsito de cloroplasto N-terminal (o secuencias de péptido de tránsito de cloroplasto) derivado de un gen que codifica un polipéptido que es normalmente dirigido al cloroplasto. Tales secuencias son típicamente ricas en serina y treonina; son deficientes en aspartato, glutamato y tirosina y generalmente tienen un dominio central rico en aminoácidos positivamente cargados . Huéspedes de Expresión En una modalidad adicional, la presente invención se refiere a células huésped que contienen las construcciones descritas anteriormente. La célula huésped puede ser una célula eucariótica, tal como una célula mamifera, una célula de levadura, o una célula de planta, o la célula huésped puede ser una célula procariótica, tal como una célula bacteriana. La introducción de la construcción en la célula huésped puede ser efectuada mediante la transfección de fosfato de calcio, transfección mediada con DEAE-Dextrano, electroporación, u otras técnicas comunes (Davis, L., Dibner, M. , y Battey, I. (1986) Basic Methods in Molecular Biology) . Una cepa de célula huésped es opcionalmente seleccionada por su capacidad para modular la expresión de las secuencias insertadas o para procesar la proteina expresada en el aspecto deseado. Tales modificaciones de la proteina incluyen, pero no están limitadas a, acetilación, carboxilación, glicosilación, fosforilación, lipidación y acilación. El procesamiento post-traduccional que segmenta una "pre" o una "prepro" forma de la proteina también puede ser importante para inserción, correcta, doblamiento y/o función. Diferentes células huésped tales como E. Coli, Bacíllus sp.r células de levadura o mamiferas tales como CHO, HeLa, BH , MDCK, 293, W138, etc., tienen maquinaria celular y mecanismos característicos, por ejemplo, para actividades de post-traducción y pueden ser seleccionadas para asegurar la modificación y procesamiento deseado de la proteina extraña e introducida . Para la producción de alto rendimiento a largo plazo de proteinas recombinantes, se pueden utilizar sistemas de expresión estables. Por ejemplo, las células de planta, explantaciones o tejidos, por ejemplo, retoños, discos de hojas, que establemente expresan un polipéptido de la invención son transducidas utilizando vectores de expresión que contienen orígenes virales de replicación o elementos de expresión endógenos y un gen marcador seleccionable . Después de la introducción del vector, las células se pueden dejar crecer durante un periodo determinado que es apropiado para el tipo de célula, por ejemplo, 1 o más horas para células bacterianas, 1-4 dias para células de planta, 2-4 semanas para algunas explantaciones de planta, en un medio enriquecido antes de que sean cambiadas al medio selectivo. El propósito del marcador seleccionable es conferir resistencia a la selección, y su presencia permite el crecimiento y recuperación de células que expresan exitosamente las secuencias introducidas. Por ejemplo, las plantas transgénicas que expresan los polipéptidos de la invención pueden ser seleccionados directamente para resistencia al herbicida, glifosato. Los embriones resistentes derivados de explantaciones establemente transformadas pueden ser proliferados, por ejemplo, usando técnicas de cultivo de tejido apropiadas para el tipo de célula . Las células huésped transformadas con una secuencia de nucleótidos que codifican un polipéptido de la invención son opcionalmente cultivadas bajo condiciones adecuadas para la expresión y recuperación de la proteina codificada del cultivo de célula. La proteina o fragmento de la misma producida por una célula recombinante, puede ser secretada, unida a la membrana, o contenida intracelularmente, dependiendo de la secuencia y/o el vector utilizado. Como será entendido por aquellos expertos en la técnica, los vectores de expresión que contienen polinucleótidos de GAT de la invención pueden ser diseñados con secuencias de señal que dirigen la secreción de los polipéptidos maduros a través de una membrana de célula procariótica o eucariótica.
Secuencias de Polipéptidos Adicionales Los polinucleótidos de la presente invención también pueden comprender una secuencia de codificación fusionada en cuadro a una secuencia de marcadora que, por ejemplo, facilita la purificación del polipéptido purificado. Tales dominios que facilitan la purificación incluyen, pero no están limitados a, péptidos quelantes de metal tales como módulos de histidina-triptofano que permiten la purificación en metales inmovilizados, una secuencia que enlaza glutationa (por ejemplo, GST) , una porción de hemaglutinina (HA) (correspondiente a un epitope derivado de la protelna de hemaglutinina de influenza; Wilson y colaboradores (1984) Cell 37:767), secuencias de proteina de enlace de maltosa, el epitope FLAG utilizado en el sistema de purificación de extensión/afinidad de FLAGS (Immunex Corp, Seattle, WA) , y similares. La inclusión de una secuencia enlazadora de polipéptido segmentable de proteasa entre el dominio de purificación y la secuencia homóloga de GAT es útil para facilitar la purificación. Un vector de expresión contemplado para el uso en las composiciones y métodos descritos en la presente proporciona la expresión de una proteina de fusión que comprende un polipéptido de la invención fusionado en una región de polihistxdina separado por un sitio de segmentación de enterocinasa . Los residuos de histidina facilitan la purificación en I IAC (cromatografía de afinidad de ión de metal inmovilizado, como es descrito en Porath y colaboradores (1992) Protein Expresión and Purification 3:2663-281) mientras que el sitio de segmentación de enterocinasa proporciona un medio para separar el polipéptido homólogo de GAT de la proteina de fusión. Los vectores pGEX (Promega; Madison, wi) también pueden ser utilizados para expresar polipéptidos extraños como proteínas de fusión con glutationa S-transferasa (GST) . En general, tales proteínas de fusión son solubles y fácilmente pueden ser purificadas de células Usadas mediante la adsorción a cuentas de ligando-agarosa (por ejemplo, glutationa-agarosa en el caso de fusiones de GST) seguido por la elución en la presencia de ligando libre. Producción y Recuperación de Polipéptido Después de la transducción de una cepa huésped adecuada y el crecimiento de la cepa huésped a una densidad de célula apropiada, el promotor seleccionado es inducido por medios apropiados (por ejemplo, cambio de temperatura o inducción química) y las células son cultivadas por un periodo adicional. Las células típicamente son cosechadas por centrifugación, rotas por medios físicos o químicos, y el extracto crudo resultante es retenido para la purificación adicional. Las células microbianas empleadas en la expresión de proteínas pueden ser rotas mediante cualquier método conveniente, incluyendo el ciclo de congelación- descongelación, sonicación, rotura mecánica, o el uso de agentes de lisado de célula, u otros métodos, que son bien conocidos para aquellos expertos en la técnica. Como se mencionó, muchas referencias están disponibles para el cultivo y la producción de muchas células, incluyendo células de origen bacteriano, de planta, animal (especialmente mamífero) y archibacteriano . Ver, por ejemplo, Sambrook, Ausubel y Berger [all supra) , asi como Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en la misma; Doyle y Griffiths (1997) Mammalian Cell Culture: Essential Techniques John Wiley and Sons, NY; Humason (1979) Animal Tissue Techniques, cuarta edición W.H. Freeman and Company; y Ricciardelli y colaboradores (1989) In vitro Cell Dev. Biol. 25:1016-024. Para el cultivo y la regeneración de célula de planta, Payne y colaboradores (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (eds) (1995) Plant Cell Tissue and Orqan Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York); Jones ed. (1984) Plant Gene Transfer and Expression Protocola, Humana Press, Totowa, New Jersey and Plant Molecular Bioloqy (1993) R.R.D.Croy, Ed. Bios Scientific Publishers, Oxford, U.K. ISBN 0 12 198370 6. Medios de cultivo de célula en general son expuestos en Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL. La información adicional para el cultivo de células es encontrada en la literatura comercial disponible tal como Life Science Research Cell Culture Catalogue (1998) de Sigma-Aldrich, Inc. (St Louis, MO) ("Sigma-LSRCCC") y, por ejemplo, The Plant Culture Catalogue y suplemento (1997) también de Sigma-Aldrich, Inc. (St Louis, MO) ( "Sigma-PCCS") . Detalles adicionales que consideran la transformación de células de planta y la producción de plantas transgénicas son encontrados después. Los polipéptidos de la invención se pueden recuperar y purificar de cultivos de células recombinantes mediante cualquiera de un número de métodos bien conocidos en la técnica, incluyendo la precipitación con sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía de fosfocelulosa, cromatografía de interación hidrofóbica, cromatografía de afinidad (por ejemplo, utilizando cualquiera de los sistemas de marcación mencionados en la presente), cromatografía de hidroxilapatita y cromatografía de lectina . Se pueden utilizar pasos de redoblamiento de proteina, como es deseado, en la completación de la configuración de la proteina madura. Finalmente, la cromatografía liquida de alto desempeño (HPLC) se puede emplear en los pasos de purificación finales. Además de las referencias mencionadas anteriormente, una variedad de métodos de purificación son bien conocidos en la técnica, incluyendo, por ejemplo, aquellos expuestos en Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.; y Bollag y colaboradores (1996) Protein Methods, 2nd Edition Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook Humana Press, NJ, Harris y Angal (1990) Protein Purification Applications: A Practical Approach IRL Press at Oxford, Oxford, England; Harris y Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford, Oxford, England; Scopes (1993) Protein Purification: Principies and Practice 3rd Edition Springer Verlag, NY; Janson y Ryden (1998) Protein Purification: Principies, Hiqh Resolution Methods and Applications, Second Edition Wiley-VCH, NY; (1998) Protein Protocols on CD-ROM Humana Press, NJ. En algunos casos, es deseable producir el polipéptido de GAT de la invención en una gran escala adecuada para aplicaciones industriales y/o comerciales. En tales casos se emplean procedimientos de fermentación en volumen. Brevemente, un polinucleótido de GAT, por ejemplo, un polinucleótido que comprende cualquiera de SEQ ID NOS: 1-5 y 11-262 u otros ácidos nucleicos que codifican polipéptidos de GAT de la invención pueden ser clonados en un vector de expresión. Por ejemplo, la patente norteamericana No. 5,955,310 de Widner y colaboradores "METHODS FOR PRODUCING A POLIPEPTIDE IN A BACILLUS CELL", describe un vector con promotores en tánden, y secuencias de estabilización operablemente enlazadas a una secuencia de codificación de polipéptido. Después de la inserción del polinucleótido de interés en un vector, el vector es transformado en un huésped bacteriano, por ejemplo, una cepa PL1801IIE de Bacillus s btílís (amyE, apr, npr, spo : IIE : : Tn917 ) . La introducción de un vector de expresión en una célula Bacillus, por ejemplo, puede ser efectuada mediante la transformación de protoplastos (ver, por ejemplo, Chang y Cohén (1979) Molecular General Genetics 168:111), al utilizar células competentes (ver, por ejemplo, Young y Spizizin (1961) Journal of Bacteriology 81:823, o Dubnau y Davidoff-Abelson (1971) Journal of Molecular Bioloqy 56:209), por electroporación (ver, por ejemplo, Shigekawa y Do er (1988) Biotechniques 6:742), o por conjugación (ver, por ejemplo, Koehler y Thorne (1987) Journal of Bacteriology 169:5271), también Ausubel, Sambrook y Berger, all supra. Las células transformadas son cultivadas en un medio nutriente adecuado para la producción del polipéptido utilizando métodos que son conocidos en la técnica. La célula puede ser cultivada mediante el cultivo en matra2 de agitación, fermentación de pequeña escala o gran escala (incluyendo fermentaciones continuas, por lotes, alimentación por lotes o en estado sólido) en fermentadores de laboratorio o industriales llevados a cabo en un medio adecuado y bajo condiciones que permiten que el polipéptido sea expresado y/o aislado. El cultivo toma lugar en un medio nutriente adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, utilizando procedimientos conocidos en la técnica. Medios adecuados son disponibles de proveedores comerciales o se pueden preparar de acuerdo con composiciones publicadas (por ejemplo, en catálogos de la American Type Culture Collection) . El polipéptido secretado se puede recuperar directamente del medio . El polipéptido resultante se puede aislar por métodos conocidos en la técnica. Por ejemplo, el polipéptido se puede aislar del medio nutriente por procedimientos convencionales incluyendo, pero no limitados a, centrifugación, filtración, extracción, secado por roció, evaporación o precipitación. El polipéptido aislado luego puede ser purificado adicionalmente por una variedad de procedimientos conocidos en la técnica incluyendo, pero no limitados a, cromatografia (por ejemplo, intercambio iónico, afinidad, hidrofóbica, cromatoenfocamiento y exclusión de tamaño) , procedimientos electroforéticos (por ejemplo, enfocamiento isoeléctrico preparativo) , solubilidad diferencial (por ejemplo, precipitación con sulfato de amonio), o extracción (ver, por ejemplo, Bollag y colaboradores. (1996) Protein Methods, 2* Edition Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook Humana Press, NJ; Bollag y colaboradores (1996) Protein Methods, 2* Edition Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook Humana Press, NJ) . Los sistemas de transcripción/traducción libres de células también se pueden emplear para producir polipéptidos usando DNAs o RNAs de la presente invención. Varios de tales sistemas son comercialmente disponibles. Una guia general para los protocolos de transcripción y traducción in vitro se encuentra en Tyrams (1995) In vitro Transcription and Traslatlon Protocols: Methods in Molecular Biology Volumen 37, Garland Publishing, NY. SUBSTRATOS Y FORMATOS PARA LA RECOMBINACION DE SECUENCIA Los polinucleótidos de la invención ópcionalmente se utilizan como substratos para una variedad de procedimientos de generación de diversidad, por ejemplo, mutación, reacciones de recombinación y recombinación recursiva, además de su uso en los métodos de clonación estándares como son expuestos en, por ejemplo, Ausubel, Verger y Sambrook, es decir, para producir polinucléotidos y polipéptidos de GAT adicionales con propiedades deseadas. Una variedad de protocolos de generación de diversidad es disponible y descrita en la técnica. Los procedimientos se pueden utilizar por separado, y/o en combinación para producir una o más variantes de un polinucleótido o conjunto de polinucleótidos, asi como variantes de proteínas codificadas. Individual y colectivamente, estos procedimientos proporcionan maneras ampliamente aplicables, robustas, para generar polinucleótidos diversificados y conjuntos de polinucléotidos (incluyendo, por ejemplo, bibliotecas de polinucleótidos) útiles, por ejemplo, para la evolución de diseño o rápida de polinucleótidos, proteínas, rutas, células y/u organismos con nuevas y/o mejoradas características. El proceso para alterar la secuencia puede dar por resultado, por ejemplo, sustituciones de nucleótido individual, sustituciones de nucleótido múltiples y la inserción o supresión de regiones de la secuencia de ácido nucleico . Mientras que las distinciones y clasificaciones se hacen en el curso de la discusión consecuente por claridad, será apreciado que las técnicas frecuentemente no son mutuamente exclusivas. En realidad, los diversos métodos se pueden utilizar individualmente o en combinación, en paralelo o en serie, para ingresar a diversas variantes de secuencia. El resultado de cualquiera de los procedimientos de generación de diversidad descritos en la presente puede ser la generación de uno o mas polinucleótidos, que pueden ser seleccionados o clasificados por polinucleótidos que codifican proteínas con, o que confieren propiedades deseables. Después de la diversificación por uno o más de los métodos en la presente, o de otra manera disponibles para un experto, cualquiera de los polinucleótidos que son producidos pueden ser seleccionados por una actividad o propiedad deseada, por ejemplo Km alterado para glifosato, Km alterado para acetil CoA, uso de cofactores alternativos (por ejemplo, propionil CoA) con kcat incrementada, etc. Esto puede incluir la identificación de cualquier actividad que puede ser detectada, por ejemplo, en un formato automatizado o automatizarle, mediante cualquiera de los ensayos en la técnica. Por ejemplo, los homólogos de GAT con actividad especifica incrementada pueden ser detectados al analizar la conversión de glifosato a N-acetilglifosato, por ejemplo, mediante la espectometria de masas. Alternativamente, la capacidad mejorada para conferir resistencia al glifosato puede ser analizada al cultivar bacterias formadas por un ácido nucleico de la invención en agar, que contiene concentraciones incrementadas de glifosato o al rociar plantas transgénicas incorporando un ácido nucleico de la invención con glifosato. Una variedad de propiedades relacionadas (o aun no relacionadas) pueden ser evaluadas, en serie o en paralelo, a criterio del profesional. Los detalles adicionales que consideran la recombinación y selección para la tolerancia al herbicida pueden ser encontrados, por ejemplo, en "DNA SHUFFLING TO PRODUCE HERBICIDE RESISTA T CROPS" (USSN 09/373,333) presentada el 12 de agosto de 1999. Las descripciones de una variedad de procedimientos 134
fucosidase from a galactosidase by DNA shuffling and screening" Proc. Nati. Acad. Sci. USA 94:4504-4509; Patten y colaboradores (1997) "Aplications of DNA shuffling to Pharmaceuticals and Vaccines" Current Opinión in Biotechnology 8:724-733; Craraeri y colaboradores (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Crameri y colaboradores (1996) "Improved green fluorescent protein by molecular evolution using DNA shuffling" Nature Biotechnology 14:315-319; Gates y colaboradores (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor "headpiece dimer" Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" En: The Encyclopedia of Molecular Biology. VCH Publishers, New York. pp.447-457; Crameri y Stemmer (1995) "Combinatorial múltiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer y colaboradores, (1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxy-ribonucleotides" Gene, 164:49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270:1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370:389-391; y Stemmer (1994) "DNA shuffling by randora fragmentation and reassembly: In 135
vítro recombination for molecular evolution." Proc. Nati. Acad. Sci. USA 91:10747-10751. Los métodos mutacionales para generar diversidad incluyen, por ejemplo, la mutagénesis dirigida al sitio (Ling y colaboradores (1997) "Approaches to DNA mutagénesis: an overvie " Anal Biochem. 254 (2 ) : 157-178; Dale y colaboradores (1996) "Oligunucleotide-directed random mutagénesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagénesis" Ann. Rev. Genet. 19:423-462; Botstein & S ortle (1985) "Strategies and applications of in vitro mutagénesis" Science 229:1193-1201; Cárter (1986) "Site-directed mutagénesis" Biochem. J. 237:1-7; y unkel (1987) "The efficiency of oligonucleotide directed mutagénesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D.M.J. eds . , Springer Verlag, Berlín)); mutagénesis utilizando patrones que contienen uracilo (Kunkel (1985) "Rapid and efficient site-specific mutagénesis wíthout phenotypic selection" Proc. Nati. Acad. Sci. USA. 82:488-492; Kunkel y colaboradores (1987) "Rapid and efficient site-specific mutagénesis without phenotypic selection" Methods in Enzymol. 154, 367-382; y Bass y colaboradores (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245); mutagénesis dirigida al oligonucleótido (Methods in Enzymol. 100:468-500 (1983) ; Methods in Enzymol. 154:329-350 (1987); Zoller & Smith (1982) "Oligonucleotide- 136
directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; y Zoller & Smith (1987) "Oligonucleotide-directed mutagenesis: a simple method using t o oligonucleotide primers and a single stranded DNA témplate" Methods in Enzymol. 154:329-350; mutagénesis de DNA modificada con fosforotioato (Taylor y colaboradores (1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucí. Acids Res. 13:8749-8764; Taylor y colaboradores (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucí. Acids Res. 13:8765-8787 (1985); Nakamaye & Eckstein (1986) "Inhibltion of restriction endonuclease Nci I cleavage by phosphorothioate groups and its aplication to oligonucleotide-directed mutagenesis" Nucí. Acids Res. 14:9679-9698; Sayers y colaboradores (1988) "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucí, Acids Res. 16:791-802; y Sayers y colaboradores (1988) "Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucí.
137
Acíds Res. 16:803-814; mutagénesis utilizando DNA doble espaciado (Kramer y colaboradores (1984) "The gapped dúplex DNA approach to oligonucleotide-directed mutation construction" Nucí. Acids Res. 12:9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped dúplex DNA" 154:350-367; Kramer y colaboradores (1988) "Improved enzymatic in vitro reactions in the gapped dúplex DNA approach to oligonucleotide-directed construcción of mutations" Mucl. Acids Red. 16:7207; y Fritz y colaboradores (1988) "Oligonucleotide directed construction of mutations: a gapped dúplex DNA procedure without enzymatic reactions in vitro" Nucí. Acids Res. 16:6987-6999). Métodos adecuados adicionales incluyen la reparación de desigualación por punto (Kramer y colaboradores (1984) "Point Mismatch Repair" Cell 38:879-887), mutagénesis utilizando cepas de huésped deficientes de reparación (Cárter y colaboradores (1985) "Improved oligonucleotide site-directed mutagénesis using M13 vectors" Nucí. Acids Res. 13:4431-4443; y Cárter (1987) "Improved oligonucleotide-directed mutagénesis using M13 vectors" Methods in Enzymol. 154:382-403), mutagénesis de supresión (Eghtedarzadeh & Henikoff (1986) "Use of oligonucleotides to genérate large deletions Nucí. Acids Res. 14:5115), restricción-selección y restricción-selección y restricción-purificación (Welss y 138
colaboradores (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317:415-423), mutagénesis por síntesis de gen total (Nambiar y colaboradores (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223:1299-1301; Sakamar y Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein ( transducin) " Nucí. Acids Res. 14:6361-6372; Wells y colaboradores (1985) "Cassette mutagénesis: an efficient method for generation of múltiple mutations at defined sites" Gene 34:315-323; y Grundstróm y colaboradores (1985) "Oligonucleotide-directed mutagénesis by microscale ' shot-gun' gene synthesis" Nucí. Acids Res. 13:3305-3316), reparación de rompimiento de doble hebra (Mandecki (1986); Arnold (1993) "Potein engineering for unusual environments" Current Opinión in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagénesis" Proc. Nati. Acad. Sci. USA, 83:7177-7181). Detalles adicionales de muchos de los métodos anteriores se pueden encontrar en Methods in Enzymology Volumen 154, que también describe controles útiles para los problemas de reparación con varios métodos de mutagénesis. Detalles adicionales que consideran varios métodos 99/41369 por Punnonen y colaboradores "Genetic Vaccine Vector Engineering"; WO 99/41368 por Punnonen y colaboradores "Optimization of Immunomodulatory Properties of Genetic Vaccines"; EP 752008 por Stemmer y Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly" ; EP 0932670 por Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; WO 99/23107 por Stemmer y colaboradores, "Modification of Virus Tropism and Host Range by Viral Genoine Shuffling"; WO 99/21979 por Apt y colaboradores, "Human Papillomavirus Vectors"; WO 98/31837 por del Cardayre y colaboradores "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; WO 98/27230 por Patten and Stemmer, "Methods and Compositions for Polypeptide Engineering"; WO 98/13487 por Stemmer y colaboradores, "Methods for Optimization of Gene T erapy by Recursive Sequence Shuffling and Selection", WO 00/00632, "Methods for Generating Highly Diverse Librarles", WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences", WO 98/42832 por Arnold y colaboradores, "Recombination of Polynucleotide Sequences Using Random or Defined Primers", WO 99/29902 por Arnold y colaboradores, "Method for Creating Polynucleotide and Polypeptide Sequences", WO 98/41653 por Vind, "An in Vitro Method for Construction of a DNA Library", WO 98/41622 por Borchert y colaboradores, "Method for Constructing a Library 141
Using DNA Shuffling", y WO 98/42727 por Pati y Zarling, "Sequence Alterations using Homologous Recombination", WO 00/18906 por Patten y colaboradores "Shuffling of Codon-Altered Genes"; WO 00/04190 por del Cardayre y colaboradores "Evolution of Whole Cells and Organisms by Recursive Recombination" ; WO 00/42561 por Crameri y colaboradores, "Oligonucleotide Mediated Nucleic Acid Recombination"; WO 00/42559 por Selifonov y Stemmer "Methods of Populating Data Structures for Use in Evolutionary Simulations" ; WO 00/42560 por Selifonov y colaboradores, "Methods for Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics"; WO 01/23401 por Welch y colaboradores, "Use of Codon-Varied Oligonucleotide Synthesis for Synthetic Shuffling", y PCT/US01/06775 "Single-Stranded Nucleic Acid Template-Mediated Recombination and Nucleic Acid Fragment Isolation" by Affholter. Ciertas solicitudes norteamericanas proporcionan detalles adicionales que consideran varios métodos de generación de diversidad, incluyendo "SHUFFLING OF CODON ALTERED GENES" por Patten y colaboradores, presentada el 28 de septiembre de 1999, (USSN 09/407,800); "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION", por del Cardayre y colaboradores, presentada el 15 de julio de 1998 (USSN 09/166,188), y 15 de julio de 1999 (USSN 09/354,922); "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID 144
De manera similar, los ácidos nucleicos pueden ser recursivamente recombinados in vivo, por ejemplo, al permitir que ocurra la recombinación entre los ácidos nucleicos en las células. Muchos de tales formatos de recombinación in vivo son expuestos en las referencias mencionadas anteriormente. Tales formatos opcionalmente proporcionan la recombinación directa entre los ácidos nucleicos de interés, o proporcionan recombinación entre los vectores, virus, plásmidos, etc., que comprenden los ácidos nucleicos de interés, asi como otros formatos. Los detalles que consideran tales procedimientos son encontrados en las referencias mencionadas anteriormente. Los métodos de recombinación de genoma completo también se pueden utilizar, en los cuales los genomas completos de célullasa u otros organismos son recombinados, opcionalmente incluyendo enclavamiento de las mezclas de recombinación genómica con componentes de biblioteca deseados (por ejemplo, genes correspondientes a la ruta de la presente invención) . Estos métodos tienen muchas aplicaciones, incluyendo aquellas en las cuales la identificación de un gen objetivo no es conocida. Los detalles de tales métodos se encuentran, por ejemplo, en WO 98/31837 por del Cardayre y colaboradores "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination" ; y en, por ejemplo, PCT/US99/15972 por del Cardayre y colaboradores, también titulada "Evolution of Whole Cells and Organisms by Recursive 145
Sequence Recombination" . Asi, cualquiera de estos procesos y técnicas para la recombinación, recombinación recursiva, y recombinación de genoma completo solo o en combinación, se pueden utilizar para generar las secuencias de ácido nucleico modificadas y/o las construcciones de fusión de gen modificada de la presente invención. También se pueden utilizar métodos de recombinación sintéticos, en los cuales los oligonucleótidos corespondientes a objetivos de interés son sintetizados y reensamblados en reacciones de PCR o de ligación que incluyen oligonucleótidos que corresponden a mas de un ácido nucleico de origen, para generar de esta manera ácidos nucleicos recombinados. Los oligonucleótidos se pueden hacer mediante métodos de adición de nucleótidos estándares o se pueden hacer, por ejemplo, mediante procedimientos sintéticos de tri-nucleótido . Los detalles que consideran tales procedimientos se encuentran en las referencias mencionadas anteriormente, incluyendo, por ejemplo, WO 00/42561 por Crameri y colaboradores, "Olgonucleotide Mediated Nucleic Acid Recombination"/ WO 01/23401 por Welch y colaboradores "Use of Codon-Varied Oligonucleotide Synthesis for Synthetic Shuffling", WO 00/42560 por Selifonov y colaboradores, "Methods for Making Character Strings, Polynucleotides and Polypeptides Having Desired Characteristics", y WO 00/42559 por Selifonov y Stemmer "Methods of Populating Data 146
Structures for Use in Evolutionary Simulations" . Los métodos in silico de recombinación se pueden efectuar, en los cuales se utilizan algoritmos genéticos en una computadora para recombinar cadenas de secuencias que corresponden a ácidos nucleicos homólogos (o aun no homólogos) . Las cadenas de secuencia recombinadas resultantes opcionalmente se convierten en ácidos nucleicos mediante la síntesis de ácidos nucleicos que corresponden a las secuencias recombinadas, por ejemplo, de acuerdo con las técnicas de síntesis de oligonucleotido/reensamblaj e de gen. Este procedimiento puede generar variantes aleatorias parcialmente aleatorias o designadas. Muchos detalles que consideran la recombinación in silico, incluyendo el uso algoritmos genéticos, operadores genéticos y similares en sistemas de computadoras, combinados con la generación de ácidos nucleicos correspondientes (y/o proteínas), asi como combinaciones de ácido nucleico y/o proteínas designadas (por ejemplo, en base a la selección del sitio de cruzamiento) asi como los métodos de recombinación designados, pseudo aleatorios, o aleatorios son descritos en WO 00/42560 por Selifonov y colaboradores, "Methods for Making Character Strings, Polynucleotides and Polypeptides Having Desired Characteristics" y WO 00/42559 por Selifonov y Stemmer "Methods of Populating Data Structures for Use in Evolutionary Simulations". Los detalles extensivos que 147
consideran los métodos de recombinación in silico se encuentran en estas solicitudes. Esta metodología generalmente es aplicable a la presente invención para proporcionar la recombinación de secuencias de ácido nucleico y/o construcciones de fusión de gen que codifican proteínas involucradas en varias rutas metabólicas (tales como, por ejemplo, rutas biosintéticas carotenoides, rutas biosintéticas de ectoina, rutas biosintéticas de polihidroxialcanoato, rutas biosintéticas de policétido aromático y similares) in silico y/o la generación de ácidos nucleicos o proteínas correspondientes. Muchos métodos para ingresar la diversidad natural, por ejemplo, mediante la hibridización de diversos ácidos nucleicos o fragmentos de ácido nucleico a patrones de una sola hebra, seguidos por la polimerización y/o ligación para regenerar secuencias de longitud completa, opcionalmente seguido por la degradación de los patrones y recuperación de los ácidos nucleicos modificados resultantes pueden ser utilizados todos de manera similar. En un método que emplea un patrón de una sola hebra, la población de fragmentos derivada de la biblioteca ( s ) genómica ( s ) es recocida con ssDNA o RNA parcial o de manera frecuente aproximadamente de longitud completa correspondiente a la hebra opuesta. El montaje de genes quiméricos complejos de esta población luego es mediado mediante la remoción de nucleasa-base de los 148
extremos de fragmento no hibridizantes, la polimerización para llenar espacios entre tales fragmentos y la subsecuente ligación de una sola hebra. La hebra de polinucleótido de origen puede removida por digestión (por ejemplo, si RNA o que contiene racilo), separación magnética bajo condiciones de desnaturalización (si es marcado de una manera conductiva para tal separación) y otros métodos disponibles de separación/purificación. Alternativamente, la hebra de origen es opcionalmente copurificada con las hebras quiméricas y removidas durante los pasos de clasificación y procedimientos subsecuentes. Detalles adicionales que consideran este procedimiento se encuentran por ejemplo, en "Single Stranded Nucleic Acid Template-Mediated Recombination and Nucleic Acid Fragment Isolation" por Affholter, PCT/US01/06775. En otro procedimiento, las moléculas de una sola hebra se convierten a DNA de doble hebra (dsDNA) y las moléculas de dsDNA se enlazan a un soporte sólido mediante el enlace mediado por ligando. Después de la separación del DNA no enlazado, las moléculas de DNA seleccionadas son liberadas del soporte e introducidas en una célula huésped adecuada para generar una biblioteca enriquecida de secuencias que hibridizan a la sonda. Una biblioteca producida de esta manera proporciona un sustrato deseable para la diversificación adicional utilizando cualquiera de los procedimientos descritos en la presente.
149
Cualquiera de los formatos de recombinación generales precedentes pueden ser practicados en un aspecto reiterativo (por ejemplo, uno o más ciclos de mutación/recombinación u otros métodos de generación de diversidad, opcionalmente seguido por uno o más métodos de selección) para generar un conjunto más diverso de ácidos nucleicos recombinantes . La mutagénesis que emplea métodos de terminación de cadena de polinucleótido también han sido propuestos (ver, por ejemplo, la patente norteamericana No. 5,965,408, "Method of DNA reassembly by interrupting synthesis" a Short y las referencias anteriores) y puede ser aplicada a la presente invención. En este procedimiento, los DNAs de doble hebra correspondientes a uno o más genes que comparten las regiones de similaridad de secuencia son combinados y desnaturalizados en la presencia o ausencia de cebadores específicos para el gen. Los polinucleótidos de una sola hebra luego son recocidos e incubados en la presencia de una polimerasa y un reactivo de terminación de cadena (por ejemplo, irradiación ultravioleta, gama o de rayos X; bromuro de etidio u otros intercaladores; proteínas de enlace de DNA, tal como las proteínas de enlace de una sola hebra, factores de activación de transcripción, o histonas; hidrocarburos aromáticos policíclicos; cromo trivalente o una sal de cromo trivalente; o polimerización abreviada mediada por el termociclado 150
rápido, y similares), que dan por resultado la producción de moléculas dobles parciales. Las moléculas dobles parciales, por ejemplo, que contienen cadenas parcialmente extendidas, luego son desnaturalizadas y recocidas en vueltas subsecuentes de replicación o replicación parcial que dan por resultado polinucleótidos que comparten grandes variantes de similaridad de secuencia y que son diversificados con respecto a la población de inicio de las moléculas de DNA. Opcionalmente, los productos, o acumulaciones parciales de los productos, pueden ser amplificados en una o más etapas en el proceso. Los polinucleótidos producidos por un método de terminación de cadena, tal como es descrito anteriormente, son sustratos adecuados para cualquier otro formato de recombinación descrito. La diversidad también puede ser generada en ácidos nucleicos o poblaciones de ácido nucleico utilizando un procedimiento de recombinación llamado "truncamiento incrementado para la creación de enzimas híbridas" ( "ITCHY" ) descrito en Ostermeier y colaboradores (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Este procedimiento se puede utilizar para generar una biblioteca inicial de variantes que opcionalmente puede servir como un sustrato para uno o más métodos de recombinación in vitro o in vivo. Ver, también, Ostermeier y colaboradores (1999) "Combinatorial Protein 151
Engineering by Incremental Truncation"; Proc. Natl. Acad. Sci. USA, 96:3562-67; Ostermeier y colaboradores (1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts" , Biological and Medicinal Chemistry, 7:2139-44. Los métodos de mutación que dan por resultado la alteración de nucleótidos individuales o grupos de nucleótidos contiguos o no contiguos pueden ser empleados favorablemente para introducir diversidad de nucleótidos en la secuencia de ácido nucleico y/o construcciones de fusión de gen de la presente invención. Muchos métodos de mutagénesis son encontrados en las referencias citadas anteriormente; detalles adicionales que consideran métodos de mutagénesis se pueden encontrar en lo siguiente, que también pueden ser aplicados en la presente invención. Por ejemplo, la PCR propensa a error puede ser utilizada para generar variantes de ácido nucleico. Utilizando esta técnica, la PCR es realizada bajo condiciones donde la fidelidad de copiado de la polimerasa de DNA es baja, de tal manera que se obtiene una alta proporción de mutaciones puntuales a lo largo de la longitud completa del producto de PCR. Ejemplos de tales técnicas son encontrados en las referencias anteriores y como por ejemplo, en Leung y colaboradores (1989) Technique 1:11-15 y Caldwell y colaboradores (1992) PCR Methods Applic. 2:28-33. De manera 152
similar, el PCR de montaje se puede utilizar, en un proceso que involucra el proceso de montaje de un producto de PCR de una mezcla de fragmentos de DNA pequeños. Un gran número de reacciones de PCR diferentes puede ocurrir en paralelo en la misma mezcla de reacción, con los productos de una reacción que ceban los productos de otra reacción. La mutagénesis dirigida al oligonucleótido se puede utilizar para introducir mutaciones especificas al sitio en una secuencia de ácido nucleico de interés. Ejemplos de tales técnicas se encuentran en las referencias anteriores y, por ejemplo, en Reidhaar-Olson y colaboradores (1988) Science, 241:53-57. De manera similar, la mutagénesis de cásete se puede utilizar en un proceso que reemplaza una región pequeña de una molécula de DNA de doble hebra con un cásete de oligonucleótido sintético que difiere de la secuencia natural. El oligonucleótido puede contener, por ejemplo, secuencia (s) completa y/o parcialmente aleatorizada natural. La mutagénesis de conjunto recursivo es un proceso en el cual un algoritmo para la mutagénesis de proteina es utilizado para producir diferentes poblaciones de mutantes fenotipicamente relacionados, miembros de los cuales difieren de la secuencia de aminoácido. Este método utiliza un mecanismo de retroalimentación para inspeccionar vueltas sucesivas de la mutagénesis de cásete de combinación. Ejemplos de este procedimiento se encuentran en Arkin & 153
Youvan (1992) Proc. Nat . Acad. Sci. USA 89:7811-7815. La mutagénesis de conjunto exponencial se puede utilizar para generar bibliotecas de combinación con un alto porcentaje de mutantes únicos y funcionales. Grupos pequeños de residuos en una secuencia de interés son aleatorisados en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. Ejemplos de tales procedimientos se encuentran en Delegrave & Youvan (1993) Biotechnology Research 11:1548-1552. La mutagénesis in vivo se puede utilizar para generar mutaciones aleatorias en cualquier DNA clonado de interés al propagar el DNA, por ejemplo, en una cepa de E. coli que lleva mutaciones en una o más de las rutas de reparación de DNA. Estas cepas "mutadoras" tienen una tasa de mutación aleatoria más alta que aquella de un origen de tipo silvestre. La propagación del DNA en una de estas cepas eventualmente generará mutaciones aleatorias dentro del DNA. Tales procedimientos se describen en las referencias mencionadas anteriormente . Otros procedimientos para introducir diversidad en un genoma, por ejemplo un genoma bacteriano, fungal, animal o de planta puede ser utilizado en conjunción con los métodos descritos anteriormente y/o de referencia. Por ejemplo, además de los métodos anteriores, se han propuesto técnicas que producen multimeros de ácido nucléico adecuados para la 154
transformación o variedad de especies (ver, por ejemplo, Schellenberger patente norteamericana No. 5,756,316 y las referencias anteriores). La transformación de un huésped adecuado con tales multimeros, que consisten de genes que son divergentes con respecto entre sí (por ejemplo, derivados de la diversidad natural o a través de la aplicación de la mutagénesis dirigida al sitio, PCR propensa a error, pasaje a través de cepas bacterianas mutagénicas y similares), proporciona una fuente de diversidad de ácido nucleico para la diversificación de DNA, por ejemplo, mediante un proceso de recombinación in vivo como es indicado anteriormente. Alternativamente, una multiplicidad de regiones de compartimiento de polinucleótidos monoméricos o similaridad de secuencia parcial puede ser transformada en una especie huésped y recombinada in vivo por la célula huésped. Las vueltas subsecuentes de división celular se pueden utilizar para generar bibliotecas, miembros de las cuales, incluyen una población homogénea, individual, o acumulación de polinucleótidos monoméricos. Alternativamente, el ácido nucleico monomérico puede ser recuperado mediante técnicas estándares, por ejemplo, PCR y/o clonación, y recombinado en cualquiera de los formatos de recombinación, incluyendo los formatos de recombinación recursivos, descritos anteriormente . Métodos para generar bibliotecas de expresión de 155
multiespecies han sido descritos (además de la referencia mencionada anteriormente, ver, por ejemplo, Peterson y colaboradores (1998) patente norteamericana No. 5,783,431 "METHODS FOR GENERATING AND SCREENING NOVEL METABOLIC PATHWAYS", y Thompson y colaboradores (1998) patente norteamericana No. 5,824,485 METHODS FOR GENERATING AND SCREENING NOVEL ME ABOLIC PATHWAYS) y su uso para identificar actividades de proteina de interés han sido propuestos (además de las referencias mencionadas anteriormente, ver, Short (1999) patente norteamericana No, 5,958,672 "PROTEIN ACTIVITY SCREENING OF CLONES HAVING DNA FROM UNCULTI ATED MICROORGANISMS" ) . Las bibliotecas de expresión de multiespecies incluyen, en general, bibliotecas que comprenden cDNA o secuencias genómicas de una pluralidad de especies o cepas, operablemente enlazadas a secuencias reguladoras apropiadas, en un cásete de expresión. El cDNA y/o secuencias genómicas opcionalmente son aleatoriamente ligadas para aumentar adicionalmente la diversidad. El vector puede ser un vector de lanzadera adecuado para la transformación de expresión en más de una especie del organismo huésped, por ejemplo, especie bacteriana, células eucarióticas . En algunos casos, la biblioteca es desviada al preseleccionar secuencias que codifican una proteina de interés, o que hibridizan un ácido nucleico de interés. Cualquiera de tales bibliotecas puede ser proporcionada como 157
"Exploiting sequence space: shuffling in vivo formed complementarity determining regions into a master framework" Gene 215:471) antes de la diversificación de acuerdo con cualquiera de los métodos descritos en la presente. Las bibliotecas pueden ser desviadas hacia ácidos nucleicos que codifican proteínas con actividad de enzimas deseables. Por ejemplo, después de la identificación de un clon de una biblioteca que exhibe una actividad especificada, el clon puede ser mutagenizado utilizando cualquier método conocido para introducir alteraciones de DNA. Una biblioteca que comprende los homólogos mutagenisados luego es clasificada para una actividad deseada, que puede ser la misma o diferente de la actividad inicialmente especificada. Un ejemplo de tal procedimiento es propuesto en Short ( 1999 ) patente norteamericana No. 5 , 939 , 250 para "PRODUCTION OF ENZYMES HAVING DESIRED ACTIVITIES BY MUTAGENESIS" . Las actividades deseadas pueden ser identificadas mediante cualquier método conocido en la técnica. Por ejemplo, el documento WO 99/10539 propone que las bibliotecas de gen pueden ser clasificadas al combinar extractos de la biblioteca de genes con componentes obtenidos de células metabólicamente ricas y al identificar combinaciones que exhibe la actividad deseada. También se ha propuesto (por ejemplo, WO 98 / 58085 ) que los clones con actividades deseadas pueden ser identificados al insertar sustratos bioactivos en 159
captura o por una amplia variedad de otras estrategias conocidas en la técnica. Alternativamente, la población de DNA genómico de una sola hebra aislada puede ser fragmentada sin clonación adicional y utilizada directamente en, por ejemplo, un procedimiento basado en recombinación, que emplea un patrón de una sola hebra, como es descrito anteriormente. Los métodos "No Casuales" de generación de ácidos nucleicos y polipeptidos son afirmados en Short "Non-Stochastic Generation of Genetic Vaccines and Enzymes" O 00/46344. Estos métodos, incluyendo los métodos de reensamblaje de polinucleótidos no casuales propuestos y de mutagénesis de saturación in sitio, también son aplicados a la presente invención. La mutagénesis aleatoria o semi aleatoria utilizando oligonucleótidos impurificados o degenerados también es descrita en, por ejemplo, Arkin y Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Bíotechnology 10:297-300; Reidhaar-Olson y colaboradores (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208:564-86; Lim y Sauer (1991) "The role of internal packing interactions in determining the structure and stability of a protein" J. Mol. Blol. 219:359-76; Breyer y Sauer (1989) "Mutational analysis of the fine specificity of binding of monoclonal antibody 51F to lambda repressor" J. Biol. Chem. 264:13355-60); and "Walk- 160
Through Mutagenesis" (Crea, R; patentes norteamericanas Nos. 5,830,650 y 5,798,208, y patente EP 0527809 Bl). Será fácilmente apreciado que cualquiera de las técnicas descritas anteriormente adecuadas para enriquecer una biblioteca antes de la diversificación también se pueden utilizar para clasificar los productos, o bibliotecas de productos, producidos por los métodos de generación de diversidad. Cualquiera de los métodos descritos anteriormente se pueden practicar recursivamente o en combinación para alterar ácidos nucleicos, por ejemplo, polinucleótidos de codificación de GAT. Los kits para mutagénesis, construcción de biblioteca y otros métodos de generación de diversidad también son comercialmente disponibles. Por ejemplo, los kits son disponibles de, por ejemplo, Stratagene (por ejemplo, kit de mutagénesis dirigida al sitio QuickChange™; y kit de mutagénesis dirigida al sitio de doble hebra Chameleon™) , Bio/Can Scientific, Bio-Rad (por ejemplo, utilizando el método de Kunkel descrito anteriormente) , Borhringer Mannheim Corp., Clonetech Laoratories, DNA Technologies, Epicentre Technologies (por ejemplo, kit 5 prima 3 prima); Genpak Inc, Lemargo Inc, Life Technologies (Gibco BRL) , New EnglandBiolabs, Pharmacia Biotech, Promega Corp., Quantum Biotechnologies , Amersham International pie (por ejemplo, utilizando el método de Eckstein anterior), y Anglian 161
Biotechnology Ltd (por ejemplo, utilizando el método de Carter/ inter anterior) . Las referencias anteriores proporcionan muchos formatos mutacionales, incluyendo la recombinación, recombinación recursiva, mutación recursiva y combinaciones o recombinación con otras formas de mutagénesis, asi como muchas modificaciones de estos formatos. Sin considerar el formato de generación de diversidad que es utilizado, los ácidos nucleicos de la presente invención pueden ser recombinados (entre si, o con secuencias relacionadas (o aun no relacionadas) para producir un conjunto diverso de ácido nucleico recombinante para el uso en las construcciones de fusión de gen y construcciones de fusión de gen modificada de la presente invención, incluyendo por ejemplo, conjuntos de ácidos nucleicos homólogos asi como polipéptidos correspondientes . Muchas de las metodologías descritas anteriormente para generar polinucleótidos modificados generan un gran número de variantes diversas de una consecuencia o secuencias de origen. En algunas modalidades preferidas de la invención, la técnica de modificación (por ejemplo, alguna forma de tergiversación) es utilizada para generar una biblioteca de variantes que luego es clasificada para un nucleótido modificado o acumulación de polinucleótidos modificados que codifican algún atributo funcional deseado, por ejemplo, 162
actividad de GAT mejorada. Las actividades enzimáticas ejemplares pueden ser clasificadas e incluyen tasas catalíticas, convencionalmente caracterizadas en términos de constantes cinéticas tales como kcac y KM) especificidad de substrato, y suceptibilidad a la activación o inhibición por el substrato, producto u otras moléculas (por ejemplo, inhibidores o activadores) . Un ejemplo de selección para una actividad enzimática deseada ocasiona el cultivo de células huésped bajo condiciones que inhiben el crecimiento y/o supervivencia de células que no expresan suficientemente una actividad enzimática de interés, por e emplo, la actividad de GAT. La utilización de tal proceso de selección puede eliminarse de la consideración de todos los polinucleótidos modificados excepto aquellos que codifican una actividad enzimática deseada. Por ejemplo, en algunas modalidades de la invención las células huésped son mantenidas bajo condiciones que inhiben el crecimiento celular o la supervivencia en la ausencia de niveles suficientes de GAT, por ejemplo, una concentración de glifosato que es letal o inhibe el crecimiento de la planta de tipo silvestre de la misma variedad que no logra expresar el polinucleótido de GAT. Bajo estas condiciones, solamente una célula huésped que hospeda un ácido nucleico modificado que codifica actividad enzimática o actividades capaces de catalizar la producción 163
de niveles suficientes del producto sobrevivirá y crecerá. Algunas modalidades de la invención emplean múltiples vueltas de clasificación a concentraciones incrementadas de glifosato o un análogo de glifosato. En algunas modalidades de la invención, la espectometria de masas es utilizada para detectar la acetilación de glifosato o un análogo de glifosato metabolito . El uso de la espectometria de masas es descrito en mas detalles en los Ejemplos enseguida. Para la conveniencia y alto rendimiento frecuentemente es deseable clasificar/seleccionar ácidos nucleicos modificados deseados en un microorganismo, por ejemplo una bacteria tal como E. coli. Por otra parte, la clasificación en células de planta o plantas pueden en algunos casos ser preferibles donde el punto final es generar un ácido nucleico modificado para la expresión de un sistema de planta. En algunas modalidades preferidas de la invención el rendimiento es incrementado al clasificar acumulaciones de células huésped que expresan diferentes ácidos nucleicos modificados, ya sea solos o como parte de una construcción de fusión de gen. Cualquiera de las acumulaciones que muestran actividad significante pueden ser desarrolladas para identificar clones individuales que expresan actividad deseable.
164
La persona experta reconocerá que el análisis relevante, clasificación o método de selección variará dependiendo del organismo huésped deseado, etc. Normalmente es ventajoso emplear un ensayo que puede ser practicado en un formato de alto rendimiento. En ensayos de alto rendimiento, es posible clasificar varias miles de variantes diferentes en un solo dia. Por ejemplo, cada cavidad de una placa de microtitulo puede ser utilizada para correr un ensayo separado, o si la concentración o los efectos del tiempo de incubación van a ser observados, cada 5-10 cavidades pueden probar una sola variante . Además de los procedimientos fluidicos, es posible, como se mencionó anteriormente, simplemente cultivar células en placas o medios que seleccionan la función enzimática o metabólica deseada. Este procedimiento ofrece un método de clasificación simple y de alto rendimiento. Un número de sistemas robóticos bien conocidos también se han desarrollado para las químicas en fase de solución útiles en los sistemas de ensayo. Estos sistemas incluyen estaciones de trabajo automatizadas similares al aparato de síntesis automatizado desarrollado por Takeda Chemical Industries, LTD. (Osaka, Japón) y muchos sistemas robóticos que utilizan brazos robóticos (Zymate II, Zymark Corporation, Hopkinton, Ma.; Orea, Hewlett-Packard, Palo 165
Alto, CA) que imitan las operaciones sintéticas manuales realizadas por un científico. Cualquiera de los dispositivos anteriores son adecuados para la aplicación de la presente invención. La naturaleza e implementación de modificaciones de estos dispositivos (si los hay) de modo que puedan operar como es discutido en la presente con referencia al sistema integrado será evidente para aquellas personas expertas en la técnica relevante. Los sistemas de clasificación de alto rendimiento son comercialmente disponibles (ver, por ejemplo, Zymark Corp., Hopkinton, MA; Air Technical Industries, Mentor, OH; Beckman Instruments, Inc . Fullerton, CA; Precisión Systems, Inc., Natick, MA, etc.). Estos sistemas típicamente automatizan procedimientos completos incluyendo todo el pipeteo de muestra y reactivo, surtido de liquido, incubaciones sincronizadas, y lecturas finales de la microplaca en el (los) detector (es) apropiados para el ensayo. Estos sistemas configurables proporcionan alto rendimiento e inicio rápido asi como un alto grado de flexibilidad y adaptación. Los fabricantes de tales sistemas proporcionan protocolos detallados para los diversos dispositivos de alto rendimiento. Asi, por ejemplo, Zymark Corp. proporciona boletines técnicos que describen sistemas de clasificación para detectar la modulación de la transcripción de gen, 166
enlace de ligando y similares. Los procedimientos microfluidicos para la manipulación del reactivo también han sido desarrollados, por ejemplo, por Caliper Technologies (Mountain View, CA) . Las imágenes ópticas visualizadas (y, opcionalmente, registradas) por una cámara u otro dispositivo de registro (por ejemplo, un fotodiodo y dispositivo de almacenamiento de datos) son opcionalmente además procesados en cualquiera de las modalidades de la presente, por ejemplo, al digitalizar la imagen y/o almacenar y analizar la imagen en una computadora. Una variedad de equipo periférico comercialmente disponible y software está disponible para digitalizar, almacenar y analizar una imagen de video digitalizada o imagen en óptica digltalizada, por ejemplo, utilizando PC (Intel x86 o DOS™ compatible con chip de pentium OS™, WINDOWS™, WINDOWS NT™ o máquinas basadas en WINDOWS 95™) , MACINTOSH™, o computadoras basadas en UNIX (por ejemplo la estación de trabajo SUN™) . Un sistema convencional lleva luz del dispositivo de ensayo a una cámara del dispositivo acoplado a la carga empleada (CCD) , un uso común en la técnica. Una cámara de CCD incluye un arreglo de elementos de cuadro (pixeles) . La luz de la muestra es tomada en imagen en el CCD. Los pixeles particulares correspondientes a regiones de la muestra (por ejemplo, sitios de hibridización individual en un arreglo de 167
polímeros biológicos) son maestreadas para obtener lecturas de intensidad de luz para cada posición. Múltiples pixeles son procesados en paralelo para incrementar la velocidad. El aparato y los métodos de la invención son fácilmente utili2ados para visualizar cualquier muestra, por ejemplo, mediante técnicas microscópicas fluorescentes o de campo oscuro .
OTRAS COMPOSICIONES DE POLINUCLEOTIDO La invención también incluye composiciones que comprenden dos o mas polinucleótidos de la invención (por ejemplo, como substratos para recombinación) . La composición puede comprender una biblioteca de ácidos nucleicos recombinantes, donde la biblioteca contiene por lo menos 2, 3, 5 10, 20 ó 50 o más polinucleótidos. Los polinucleóticos son opcionalmente clonados en vectores de expresión, que proporcionan bibliotecas de expresión. La invención también incluye composiciones producidas al digerir uno o más polinucleótidos de la invención con una endonucleasa de restricción, una RNAsa, o una DNAsa (por ejemplo, como es realizado en ciertos de los formatos de recombinación mencionados anteriormente); y composiciones producidas al fragmentar o compartir uno o más polinucleótidos de la Invención por medios mecánicos (por ejemplo, sonicación, formación de vórtice, y similares), que 168
también pueden ser utilizados para proporcionar sustratos de recombinación en los métodos anteriores. De manera similar/ las composiciones que comprenden conjuntos de polinucleótidos correspondientes a más de un ácido nucleico de la invención, son útiles como sustratos de recombinación y son una característica de la invención. Por conveniencia, estas mezclas fragmentadas, compartidas o sintetizadas de oligonucleótidos son referidas como conjunto de ácidos nucleicos fragmentados. También incluidas en la invención están las composiciones producidas al incubar uno o más de los conjuntos de ácido nucleico fragmentados en la presencia de trifosfatos de ribonucleótido o desoxirribonucleótido de una polimerasa de ácido nucleico. Esta composición resultante forma una mezcla de recombinación para muchos de los formatos de recombinación mencionados anteriormente. La polimerasa de ácido nucleico puede ser de una polimerasa de RNA, una polimerasa de DNA, o una polimerasa de DNA dirigida a RNA, (por ejemplo, una "transcriptasa inversa"); la polimerasa puede ser, por ejemplo, una polimerasa de DNA termoestable (tal como, VENT, TAQ o similar) .
SISTEMAS INTEGRADOS La presente invención proporciona computadoras, medios leíbles en computadora y sistemas integrados que 169
comprenden cadenas de caracteres correspondientes a la información de secuencia en la presente para los polipéptidos y los ácidos nucleicos en la presente, incluyendo, por ejemplo, aquellas secuencias listadas en la presente y las diversas substituciones inactivas y las substituciones conservativas de las mismas. Por ejemplo, varios métodos y algoritmos genéticos (GAs) conocidos en la técnica pueden ser utilizados para detectar la homología o similaridad entre diferentes cadenas de caracteres, o pueden ser utilizadas para realizar otras funciones deseables para controlar archivos de salida, proporcionar la base para hacer presentaciones de información incluida en las secuencias y similares. Ejemplos incluyen BLAST, discutido supra. Asi, diferentes tipos de homología y similaridad de varias severidades y longitudes pueden ser detectados y reconocidos en los sistemas integrados en la presente. Por ejemplo, muchos métodos de determinación de homología han sido diseñados para el análisis comparativo de secuencias de biopolimeros, para inspeccionar por letras en el procesamiento de palabras, y para la recuperación de datos de varias bases de datos. Con un entendimiento de las interacciones del complemento similar a par de doble hélice entre 4 nucleobases principales en polinucleótidos naturales, modelos que simulan el recocido de las cadenas de 170
polinucleótido homologas complementarias también pueden ser utilizadas como un fundamento en la alineación de secuencia u otras operaciones típicamente realizadas en las cadenas de caracteres correspondientes a las secuencias en la presente, por ejemplo, la manipulación del procesamiento de palabras, la construcción de figuras que comprenden las cadenas de caracteres de secuencia o subsecuencia, tablas de salida, etc. Un ejemplo de un paquete de software con GAs para calcular la similaridad de secuencia es BLAST, que puede ser adaptada a la presente invención al introducir cadenas de caracteres correspondientes a las secuencias en la presente. De manera similar, las aplicaciones de escritorio estándares tal como el software de procesamiento de palabras (por ejemplo, Microsoft Word™ o Corel WordPerfect™) y el software de base de datos (por ejemplo, el software de hoja de cálculo tal como Microsoft Excel™, Corel Quattro Pro™, o los programas de base de datos tales como Microsoft Access™ o Paradox™) pueden ser adaptados a la presente invención al introducir una cadena de caracteres correspondiente a los homólogos de GAT de la invención (ya sea ácidos nucleicos o proteínas, o ambos). Por ejemplo, los sistemas integrados pueden incluir el software anterior que tiene la información de cadena de caracteres apropiada, por ejemplo, utilizada en conjunción con una interfase de usuario (por ejemplo, un GUI en un sistema de operación estándar tal como Windows, 171
Macintosh o sistema LINUX) para manipular cadenas de caracteres. Como se ha mencionado, los programas de alineación especializados tal como BLAST también pueden ser incorporados a los sistemas de la invención para la alineación de ácidos nucleicos o proteínas (o cadenas de caracteres correspondientes) . Los sistemas integrados para el análisis en la presente invención típicamente incluyen una computadora digital con software de GA para alinear secuencias, asi como conjuntos de datos introducidos en el sistema de software que comprende cualquiera de las secuencias en la presente. La computadora puede ser, por ejemplo, una PC (Intel x86 o DOS™ compatible con el chip Pentium, OS2™ WINDOWS™ WINDOWS NT™, WINDOIWS95™, WINDOWS 98™ máquina basada en LINUX, una MACINTOSH1", Power PC, o una basada en UNIX (por ejemplo, la estación de trabajo SUN™)) u otra computadora comercialmente común que es conocida para un experto. El software para la alineación o de otro modo manipulación de secuencias está disponible, o puede ser fácilmente construido por un experto utilizando un lenguaje de programación estándar tal como Visualbasic, Fortran, Basic, Java, o similar. Cualquier controlador o computadora opcionalmente incluye un monitor que es frecuentemente una pantalla de tubo de rayo catódico ("CRT") , una pantalla de panel plano (por ejemplo, una pantalla de cristal liquido de matriz activa, 172
pantalla de cristal liquido), u otras. El sistema de circuitos de la computadora frecuentemente es colocado en una caja que incluye numerosos chips de circuito integrados, tal como un microprocesador, memoria, circuitos de interfase y otros. La caja también opcionalmente incluye un accionamiento de disco duro, o accionamiento de disco flexible, un accionamiento removible de alta capacidad tal como un CD-ROM escribible, y otros elementos periféricos comunes. Los dispositivos de entrada tal como un tablero o ratón opcionalmente proporcionan la entrada de un usuario y para la selección del usuario de secuencias para ser comparados y de otra manera manipuladas en el sistema de computadoras relevante. La computadora típicamente incluye software apropiado para recibir instrucciones de usuario, ya sea en la forma de la entrada del usuario en un conjunto de campos de parámetro, por ejemplo, en un GUI, o en la forma de instrucciones preprogramadas, por ejemplo preprogramadas para una variedad de operaciones especificas diferentes. El software luego convierte estas instrucciones al lenguaje apropiado para instruir la operación de la dirección del fluido y el controlador de transporte para llevar a cabo la operación deseada. El software también puede incluir elementos de salida para controlar la síntesis de ácido nucleico (por 173
ejemplo, basado en una secuencia o una alineación de una secuencia en la presente) u otras operaciones que ocurren corriente abajo de una alineación u otra operación realizada utilizando una cadena de caracteres correspondiente a una secuencia en la presente. El equipo de síntesis de ácido nucleico por consiguiente, puede ser un componente en uno o más de sistemas integrados en la presente. En un aspecto adicional, la presente invención proporciona kits que comprenden los métodos, composición, sistemas y aparatos en la presente. Los kits de la invención opcionalmente comprenden uno o más de lo siguiente: (1) un aparato, sistema, componente del sistema o componente del aparato como es descrito en la presente; (2) instrucciones para practicar los métodos descritos en la presente y/o para operar el aparato o componentes del aparato en la presente y para utilizar las composiciones en la presente; (3) una o más composiciones o componentes de GAT; (4) un contenedor para contener componentes o composiciones, y, (5) materiales de envasado . En un aspecto adicional, la presente invención proporciona el uso de cualquier aparato, componente de aparato, composición o kit en la presente, para la práctica de cualquier método o ensayo en la presente, y para el uso de cualquier aparato o kit para practicar cualquier ensayo y método en la presente.
174
CELUIAS HUESPED Y ORGANISMOS La célula huésped puede ser eucariótica, por ejemplo, una célula eucariótica, una célula de planta, una célula animal, un protoplasto o un cultivo de tejido. La célula huésped opcionalmente comprende una pluralidad de células, por ejemplo, un organismo. Alternativamente, la célula huésped puede ser procariótica incluyendo, pero no limitada a, bacterias (es decir, bacterias gran positivas, bacterias púrpura, bacterias de azufre verde, bacteria de no azufre verde, cianobacterias, espiroquetas, termatogales, flavobacterias y bacteroides) y arcaebacterias (es decir, orarchaeota, Thermoproteus, Pyrodictium, Thermococcales , metanógenos, Archaeoglobus, y halófilos extremos) . Las plantas transgénicas, o células de planta, que incorporan los ácidos nucleicos GAT y/o que expresan los polipéptidos de GAT de la invención son una característica de la invención. La transformación de células de planta y protoplastos puede ser llevada a cabo esencialmente en cualquiera de las diversas maneras conocidas para aquellos expertos en la técnica de biología molecular de plantas, incluyendo pero no limitados a, los métodos descritos en la presente. Ver, en general, Methods in Enzymology, Vol. 153 (Recombínant DNA Part D) u y Grossman (eds.) 1987, Academic Press, incorporada en la presente por referencia. Como se utiliza en la presente, el término "transformación" significa 176
Louis, MO) (Sigma-PCCS) . Detalles adicionales que consideran el cultivo de las células de planta se encuentran en Croy, (ed.) (1993) Plant Molecular Biology Bios Scientific Publishers, Oxford, U.K. En una modalidad de esta invención, se preparan vectores recombinantes que incluyen uno o más polinucleótidos de GAT, adecuados para la transformación de células de planta. Una secuencia de DNA que codifica para el polipeptido de GAT deseado, por ejemplo, seleccionada de entre SEQ ID NOS: 1-5 y 11-262, es convenientemente utilizada para construir un cásete de expresión recombinante que puede ser introducido en la planta deseada. En el contexto de la presente invención, un cásete de expresión típicamente comprenderá un polinucleótido de GAT seleccionado, operablemente enlazado a una secuencia promotora y otras secuencias reguladoras de iniciación transcripcional y traduccional que son suficientes para dirigir la transcripción de la secuencia de GAT en los tejidos propuestos (por ejemplo, planta entera, hojas, raíces, etc.) de la planta transformada. Por ejemplo, un promotor de planta fuerte o débilmente constitutivo que dirige la expresión de un ácido nucleico de GAT en todos los tejidos de una planta puede ser favorablemente empleado. Tales promotores son activos bajo condiciones más ambientales y los estados de desarrollo o 177
diferenciación celular. Ejemplos de promotores constitutivos incluyen el 1'- o 2' -promotor de Agrobacterium tumefaciens, y otras regiones de iniciación de transcripción de varios genes de planta conocidas para aquellos expertos. Donde la sobreexpresión de un polipeptido de GAT de la invención es perjudicial a la planta, un experto, reconocerá que los promotores constitutivos débiles pueden ser utilizados para bajos niveles de expresión. En aquellos casos donde altos niveles de expresión no son peligrosos para la planta, un promotor fuerte, por ejemplo, un t-R A, u otro promotor pol III, o un promotor pol II fuerte, (por ejemplo, el promotor del virus de mosaico de coliflor, CaMV, promotor 35S) puede ser utilizado. Alternativamente, un promotor de planta puede estar bajo control ambiental. Tales promotores son referidos como promotores "inducibles" . Ejemplos de condiciones ambientales que pueden alterar la transcripción por proraotores inducibles incluyen el ataque por patógenos, condiciones anaeróbicas o la presencia de luz. En algunos casos, es deseable utilizar promotores que son "específicos al tejido" y/o están bajo control de desarrollo de tal manera que el polinucleótido de GAT es expresado solamente en ciertos tejidos o etapas de desarrollo, por ejemplo, hojas, raices, retoños, etc. Los promotores endógenos de genes relacionados con la tolerancia al herbicida y fenotipos relacionados son particularmente 178
útiles para inducir expresión de los ácidos nucléicos de GAT, por ejemplo, monoxigenasas de P450, glutationa-S-transferasas , homoglutationa-S-transferasas, glifosato oxidasas y 5-enolpiruvilshikimato-2-fosfato sintasas. Los promotores específicos del tejido también pueden ser utilizados para dirigir la expresión de genes estructurales heterólogos, incluyendo los polinucleótidos de GAT descritos en la presente. Así, los promotores pueden ser utilizados en casetes de expresión recorabinantes para inducir expresión de cualquier gen cuya expresión es deseable en las plantas transgénicas de la invención, por ejemplo, GAT y/o otros que confieren resistencia o tolerancia al herbicida, genes que influyen en otras características útiles, como por ejemplo, heterosis. De manera similar, los elementos aumentadores, por ejemplo, derivados de las secuencias reguladoras 5' o intrón de un gen heterólogo, también pueden ser utilizados para mejorar la expresión de un gen estructural heterólogo, tal como un polinucleótido de GAT. En general, el promotor particular utilizado en el cásete de expresión en plantas depende de la aplicación propuesta. Cualquiera de un número de promotores que dirigen la transcripción en las células de planta pueden ser adecuados. El promotor puede ser ya sea constitutivo o inducible. Además de los promotores mencionados anteriormente, los promotores de origen bacteriano que operan 179
en las plantas incluyen el promotor octopina sintasa, el promotor nopalina sintasa y otros promotores derivados de los plásmidos Ti. Ver, Herrera-Estrella y colaboradores (1983) Nature 303:209. Los promotores virales incluyen los promotores de RNA 35S y 19S de CaMV. Ver, Odell y colaboradores (1985) Nature 313:810. Otros promotores de planta incluyen el promotor de subunidad pequeña de ribulosa-1, 3-bisfosfato carboxilasa y el promotor de faseolina. La secuencia promotora del gen E8 (ver, Deikman y Fischer (1988) EMBO J 7:3315) y otros genes también son favorablemente utilizados. Los promotores específicos para las especies monocotiledóneas también son considerados (McElroy D-, Brettell R.I.S. 1994. Foreign gene expression in transgenic cereals. Trends Biotech., 12:62-68). Alternativamente, promotores novedosos con características útiles pueden ser identificados de cualquier fuente viral, bacteriana o de planta por métodos, incluyendo el análisis de secuencia, el aumentador o el cazador de promotor, similares, conocidos en la técnica. En la preparación de vectores de expresión de la invención, las secuencias diferentes al promotor y el gen de codificación de GAT también son favorablemente utilizadas . Si se desea la expresión de polipéptido apropiada, una región de poliadenilacion puede ser derivada del gen natural, de una variedad de otros genes de planta, o de T-DNA. Los péptidos 180
de señal/localización, que, por ejemplo, facilitan la translocación del polipéptido expresado a organelos internos (por ejemplo, cloroplastos ) o secreción extracelula , también pueden ser empleados. El vector que comprende el polinucleótido de GAT también puede incluir un gen marcador que confiere un fenotipo seleccionable en células de planta. Por ejemplo, el marcador puede codificar la tolerancia al biocida, particularmente tolerancia al antibiótico, tal como tolerancia a kanamicina, G417, bleomicina, higromicina, o tolerancia al herbicida, tal como tolerancia a clorosulfuron, o fof notricina . Los genes reportadores, que son utilizados para expresionar la expresión de gen y la localización de proteina, via los productos de reacción visualizables (por ejemplo, beta-glucuronidasa, beta-galactosidasa, y cloranfenicol acetiltransferasa) o mediante la visualización directa del producto de gen mismo (por ejemplo, la proteina fluorescente verde, GFP; Sheen y colaboradores (1995) The Plant Journal 8:777) puede ser utilizado, por ejemplo para inspeccionar la expresión de gen transiente en células de planta. Los sistemas de expresión transiente pueden ser explorados en células de planta, por ejemplo, la clasificación de cultivos de célula de planta para las actividades de tolerancia al herbicida. TRANSFORMACION DE PLANTA 181
Protoplastos Numerosos protocolos para el establecimiento de protoplastos transformables de una variedad de tipos de plantas y la transformación subsecuente de los protoplastos cultivados son disponibles en la técnica y son incorporados en la presente por referencia. Por ejemplo, ver Hashimoto y colaboradores (1990) Plant Physiol. 93:857; Fowke y Constabel (eds) (1994) Plant Protoplasts: Saunders y colaboradores (1993) Aplications of Plant In Vitro Technology Symposium. UPM 16-18; y Lyznik y colaboradores (1991) BioTechniques 10:295, cada una de las cuales es incorporada en la presente por referencia. Cloroplastos Los cloroplastos son un sitio de acción de algunas actividades de tolerancia al herbicida, y, en algunos casos, el polinucleótido de GAT es fusionado a un péptido de secuencia de tránsito de cloroplasto para facilitar la translocación de los productos de gen en los cloroplastos. En estos casos, puede ser ventajoso transformar el polinucleótido de GAT en los cloroplastos de las células huésped de plantas. Numerosos métodos son disponibles en la técnica para realizar la transformación y expresión del cloroplasto (por ejemplo, Daniell y colaboradores (1998) Nature Biotechnology 16:346; O'Neill y colaboradores The Plant Journal 3:729; Maliga (1993) TIBTECH 11:1). La 182
construcción de expresión comprende una secuencia reguladora transcripcional funcional en plantas operablemente enlazado a un polinucléotido que codifica el polipeptido GAT . Los casetes de expresión que son diseñados para funcionar en los cloroplastos (tal como un cásete de expresión que incluye un polinucleótido de GAT) incluye las secuencias necesarias para asegurar la expresión en los cloroplastos. Típicamente, la secuencia de codificaciones flanqueada por dos regiones de homología al genoma de cloroplástida para efectuar una recombinación homóloga con el genoma de cloroplasto; frecuentemente un gen marcador seleccionable está presente dentro de la secuencia de DNA de plástida flanqueante para facilitar la selección de cloroplastos transformados genéticamente estables en las células de plantas transplastónicas resultantes (ver, por ejemplo, Maliga (1993) y Daniell (1998), y las referencias citadas en las mismas). Métodos de transformación generales Las construcciones de DNA de la invención se pueden introducir en el genoma del huésped de planta deseado por una variedad de técnicas convencionales. Las técnicas para transformar una amplia variedad de especies de plantas superiores son bien conocidas y descritas en la literatura técnica y científica. Ver, por ejemplo, Payne, Gamborg, Croy, Jones, etc., todo supra, asi como, por ejemplo, Weising y colaboradores (1988) Ann. Rev. Genet. 22:421.
183
Por ejemplo, los DNAs pueden ser introducidos directamente en el DNA genómico de una célula de planta utilizando técnicas tales como electroporación y microinyección de protoplastos de célula de planta, las construcciones de DNA pueden ser introducidas directamente al tejido de planta utilizando métodos balísticos tal como el bombardeo de partículas de DNA. Alternativamente, las construcciones de DNA pueden ser combinadas con regiones flanqueantes de T-DNA adecuadas e introducidas en un vector huésped de Agrobacterium tumefaciens convencional. Las funciones de virulencia del huésped Agrobacterium dirigirán la inserción de la construcción y al marcador adyacente en el DNA de la célula de planta cuando la célula de planta es infectada por las bacterias . Las técnicas de microinyección son conocidas en la técnica y bien descritas en la literatura científica y de patentes. La introducción de construcciones de DNA utilizando la precipitación con polietilenglicol es descrita en Pazkowski y colaboradores (1984) EMBOJ 3:2717. Las técnicas de Electroporación son descritas en Fromm y colaboradores (1985) Proc Nat'l Acad Sci USA 82:5824. Las técnicas de transformación balística son descritas en Klein y colaboradores (1987) Nature 327:70; y Weeks y colaboradores Plant Physiol 102:1077. En algunas modalidades, las técnicas de 184
transformación mediadas con Agrobacterium son utilizadas para transferir las secuencias de GAT de la invención a plantas transgénicas . La transformación mediada por el Agrobacterium es ampliamente utilizada para la transformación de dicotiledóneas/ más sin embargo, ciertas monocotiledóneas también pueden ser transformadas por el Agrobacterium. Por ejemplo, la transformación por el Agrobacterium del arroz es descrito por Hiei y colaboradores (1984) Plant J. 6:271; patente norteamericana No. 5,187,073; patente norteamericana No. 5,591,616; Li y colaboradores (1991) Science in China 34:54; y Raineri y colaboradores (1990) Bio/Technology 8:33. El maiz, cebada, triticale y espárrago transformado mediante la transformación mediada por Agrobacterium también han sido descritos (Xu y colaboradores (1990) Chínese J Bot 2;81) . Las técnicas de transformación mediadas por
Agrobacterium toman ventaja de la capacidad del plásmido inductor del tumor (Ti) de A. Tumefaciens para integrarse en un genoma de célula de planta, para cotransferir un ácido nucleico de interés en una célula de planta. Típicamente, un vector de expresión es producido donde el ácido nucleico de interés, tal como un polinucleótido de GAT de la invención, es ligado en un plásmido autónomamente replicante que también contiene secuencias de T-DNA. Las secuencias de T-DNA típicamente flanquean el ácido nucleico del cásete de expresión de interés que comprende las secuencias de 185
integración del plásmido. Además del cásete de expresión, la T-DNA también típicamente incluye una secuencia marcadora, por ejemplo, genes de resistencia al antibiótico. El plásmido con el T-DNA y el c sete de expresión luego son trans fectados en células de Agrobacterium. Típicamente, para la transformación efectiva de células de planta, la bacteria de A. Tumefaciens también posee las regiones vir necesarias en un plásmido, o integradas en su cromosoma. Para una discusión de la transformación mediada por Agrobacterium, ver, Firoozabady y Kuehnle, (1995) Plant Cell Tissue and Organ Cultura Fundamental Methods., Gamborg y Phillips (eds.). Regeneración de Plantas Transgénicas Las células de plantas transformadas que son derivadas mediante las técnicas de transformación de plantas, que incluyen aquellas discutidas anteriormente, pueden ser cultivadas para generar una planta completa que posee el genotipo transformado (es decir, un polinucleótido de GAT) , y asi el fenotipo deseado, tal como resistencia adquirida (es decir, tolerancia) a un glifosato o a un análogo de glifosato. Tales técnicas de regeneración dependen de la manipulación de ciertas fitohormonas en un medio de crecimiento de cultivo de tejido, típicamente que depende del blocida y/o el marcador de herbicida que se ha introducido junto con las secuencias de nucleótidos deseadas. Alternativamente, la selección para la resistencia al 186
glifosato conferida por el polinucleótido de GAT de la invención puede ser realizada. La regeneración de la planta a partir de protoplastos cultivados es descrita en Evans y colaboradores ( 1983 ) Preotoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp 124- 17 6 , Macmillan Publishing Company, New York; y Binding ( 1985 ) Regeneration of Plants, Plant Protoplasts pp 21- 73 , CRC Press, Boca Ratón. La regeneración también puede ser obtenida del callo de la planta, explantaciones, órganos, o partes de la misma. Tales técnicas de regeneración son descritas generalmente en Klee y colaboradores ( 1987 ) Ann Rev of Plant Phys 38 : 467 . Ver también, por ejemplo, Payne y Gamborg. Después de la transformación con Agrobacterium, las explantaciones típicamente son transferidas al medio de selección. Un experto comprenderá que el medio de selección depende del marcador seleccionable que fue cotransfectado en las explantaciones. Después de una longitud adecuada de tiempo, los transformantes comenzarán a formar retoños. Después de que los retoños están de aproximadamente 1-2 cm en longitud, los retoños deben ser transferidos a un medio de raíz de retoño adecuado. La presión de selección debe ser mantenida en el medio de raiz y retoño. Típicamente, los transformantes desarrollarán raíces en aproximadamente 1-2 semanas y formarán plantidas. Después de que las plantidas son de aproximadamente 3-5 cm en 187
altura, ellas son colocadas en tierra estéril en macetas de fibra. Los expertos en la técnica comprenderán que los diferentes procedimientos de aclimatación son utilizados para obtener plantas transformadas de diferentes especies. Por ejemplo, después del desarrollo de una raiz y retoño, los cortes, asi como embriones somáticos de plantas transformadas, son transferidas al medio para el establecimiento de plantidas. Para una descripción de la selección y regeneración de plantas transformadas, ver, por ejemplo, Dodds y Roberts (1995) Experimenta in Plant Tissue Culture, 34 Ed., Cambridge University Press. También existen métodos para la transformación por Agrobacterium de Arabidopsis utilizando la infiltración al vacio (Bechtold N, , Ellis J. Y Pelletier G, 1993, In planta Agrobacterium mediated gene transfer by infiltration of adult Arabidopsis thaliana plants. CR Acad Sci Paris Life Sci 316:2294-1199) y la inmersión simple de plantas florecientes (Desfeux, C, Clough S.J., and Bent A.F., 2000, Female reproductive tissues are the primary target of Agrobacterium-mediated transformation by the Arabidopsis floral-dip method. Plant Physiol. 123:895-904). Utilizando estos métodos, las semillas transgénicas son producidas sin la necesidad por el cultivo de tejido. Existen variedades de plantas para las cuales los protocolos de transformación mediados por Agrobacterium 188
efectivos todavia tienen que ser desarrollados. Por ejemplo, la transformación de tejido exitosa acoplada con la regeneración del tejido transformado para producir una planta transgénica no ha sido reportadao para algunas de las variedades de algodón más comercialmente relevantes. No obstante, un procedimiento que puede ser utilizado con estas plantas involucra introducir establemente el polinucleótido en una variedad de planta relacionada via la transformación mediada por el Agrobacterium, confirmando la operabilidad, y luego al transferir el transgen a la cepa comercial deseada utilizando las técnicas de cruza o cruza hacia atrás sexuales estándares. Por ejemplo, en el caso del algodón, el Agrobacterium puede ser utilizado para transformar una linea Coker de Gossypium hlrustum (por ejemplo, lineas Coker 310, 312, 5110 Deltapine 61 o Stoneville 213), y luego el transgen puede ser introducido en otra variedad de G. Hirustum más comercialmente relevante mediante la cruza hacia atrás . Las plantas transgénicas de esta invención pueden ser caracterizadas ya sea genotipicamente o fenotípicamente para determinar la presencia de polinucleótido de GAT de la invención. El análisis genotipico puede ser realizado mediante cualquiera de un número de técnicas bien conocidas, incluyendo la amplificación de PCR del DNA genómico y la hibridízación del DNA genómico con sondas marcadas especificas. El análisis fenotipico incluye, por ejemplo, la 189
supervivencia de plantas o tejidos de plantas expuestos a un herbicida seleccionado tal como glifosato. Esencialmente cualquier planta puede ser transformada con los polinucleótidos de GAT de la invención. Las plantas adecuadas para la transformación y expresión de los polinucleótidos de GAT novedosos de esta invención incluyen especies agronómicamente y horticulturalmente importantes. Tales especies, incluyen pero no están restringidas a miembros de las familias: Graminae (incluyendo maíz, centeno, triticale, cebada, mijo, arroz, trigo, avena, etc.); Leguminosae (incluyendo guisantes, habas, lenteja, cacahuate, camote, caupis, guisantes aterciopelados, semilla de soya, trébol, alfalfa, lupino, algarroba, loto, trébol cloroso, glicina y arvejilla); Compositae (la familia más grande de plantas vasculares, incluyendo por lo menos 1,000 géneros, incluyendo los cultivos comerciales importantes tal como girasol) y Rosaciae (incluyendo frambuesa, albaricoque, almendro, durazno, rosal, etc.), asi como plantas de nueces (incluyendo nogal, pacana, avellana, etc.), y árboles forestales (incluyendo Pinus, Quercus, Pseutotsuga , Sequoia, Populus, etc . ) . Los objetivos adicionales para la modificación por los polinucleótidos de GAT de la invención, así como aquellos especificados anteriormente, incluyen plantas de los géneros: Agrostis, Allium, Antírrhinum, Aplum, Arachís, Asparagus , 190
Atropa, Avena (por ejemplo, avenas) , Bambusa, Brassica, Bromus, Browaalia , Camellia, Cannabis, Capsicum, Cicer, Chenopodiun, Chichorium, Citrus, Coffea, Coix, Cucumis, Curcubita , Cynodon, Dactylís , Datura, Daucus, Digitalis, Dioscorea , Elaeis, Eleusine, Festuca, Fragaria , Geranium, Gossypium, Glycíne, Helianthus, Heterocallís, Hevea, Hordeum (por ejemplo, cebada) , Hyoscya us, Ipomoea, Lactuca, Lens, Lilium, lnum, Lolium, Lotus, Lycopersicon, Majorana , Malus, Mangifera, Manihot, Medicago, Nemesia, Nicotiana, Onobrichís, Oryza, (por ejemplo, arroz), Panicum, Pelargoniu , Pennisetum (por ejemplo, mijo), Petunia, Pisum, Phaseolus, Phleum, Poa, Prunus, Ranunculus, Raphanus, Ribes, Ricinus, Rubus, Saccharum, Salpíglossis, Sécale (por ejemplo, centeno), Senecio, Setaria, Sinapis, Solanum, Sorghum, Stenotaphurum, Theobroma, Trifolium, Trígonella, Triticum (por ejemplo, trigo), Vicia, Vigna, Vitis, Zea (por ejemplo, maiz), y el Olyreae, y Pharoideae y muchos otros. Como se mencionó, las plantas en la familia Graminae son plantas particularmente objetivo para los métodos de la invención. Las plantas de cultivo comunes que son objetivos para la presente invención incluyen maiz, arroz, triticale, centeno, algodón, semilla de soya, sorgo, trigo, avena, cebada, mijo, girasol, cánola, guisantes, habas, lentejas, cacahuates, camotes, caupis, guisantes aterciopelados, trébol, alfalfa, lupino, algarroba, loto, trébol cloroso, 191
glicina, arvejilla y plantas de nueces (por ejemplo, nogal, pecana, etc . ) . En un aspecto, la invención proporciona un método para producir un cultivo al cultivar una planta de cultivo que es tolerante al glifosato como resultado de ser transformada con un gen que codifica un glifosato N-acetiltransferasa, bajo condiciones tales que la planta de cultivo produce un cultivo, y cosechar el cultivo. De preferencia, el glifosato es aplicado a la planta, o en la vecindad de la planta, una concentración efectiva para controlar malas hierbas sin prevenir a la planta de cultivo transgénica de que crezca y produzca el cultivo. La aplicación de glifosato puede ser antes de la plantación, o en cualquier momento después de la plantación hasta, e incluyendo el tiempo de cosecha. El glifosato puede ser aplicado una vez o múltiples veces. La sincronización de la aplicación de glifosato, cantidad aplicada, modo de aplicación y otros parámetros variarán basados en la naturaleza especifica de la planta de cultivo y el medio ambiente de crecimiento y puede ser fácilmente determinado por un experto en la técnica. La invención además provee el cultivo producido por este método. La invención provee la propagación de una planta que contiene un transgen de polinucleótido de GAT. La planta puede ser, por ejemplo, una monocotiledónea o dicotiledónea.
192
En un aspecto, la propagación comprende cruzar una planta que contiene un transgen de polinucleótido de GAT o una segunda planta, tal que por lo menos algo de progenie de la cruza exhibe tolerancia al glifosato. En un aspecto, la invención provee un método para controlar selectivamente malas hierbas en un campo donde un cultivo está siendo cultivado. El método involucra plantar semillas de cultivo o plantas que son tolerantes al glifosato como resultado de ser transformadas con un gen que codifica una GAT, por ejemplo, un polinucleótido de GAT, y aplicar al cultivo y a cualquiera de las malas hierbas una cantidad suficiente de glifosato para controlar las malas hierbas sin un impacto adverso significante en los cultivos. Es importante observar que no es necesario para el cultivo que sea totalmente insensible al herbicida, mientras que el beneficio derivado de la inhibición de malas hierbas sobrepase cualquier impacto negativo de glifosato o análogo de glifosato en el cultivo o planta de cultivo. La invención provee el uso de un polinucleótido de GAT como un gen marcador seleccionable . En esta modalidad de la invención, la presencia del polinucleótido de GAT en una célula u organismo confiere a la célula u organismo la cualidad genotipica detectable de resistencia al glifosato, permitiendo de esta manera seleccionar células u organismos que sean transformados con un gen de interés enlazado al 193
polinucleótido de GAT . Asi como por ejemplo, el polinucleótido de GAT puede ser introducido en una construcción de ácido nucleico, por ejemplo un vector, para permitir de esta manera la identificación de un huésped (por ejemplo, una célula o planta transgénica) que contiene la construcción de ácido nucleico al crecer el huésped en la presencia de glifosato y al seleccionar la capacidad para sobrevivir y/o crecer a una velocidad que es discerniblemente mayor que un huésped que carece de la construcción de ácido nucleico que sobreviviría o crecerla. Un polinucleótido de GAT puede ser utilizado como un marcador seleccionable en una amplia variedad de huéspedes que son sensibles a glifosato, incluyendo plantas, la mayoría de bacterias (incluyendo E. coli) , levaduras, algas y hongos. Un beneficio de utilizar la resistencia al herbicida como un marcador en plantas, opuesta a la resistencia al antibiótico convencional, es que se obvia el problema de algunos miembros del público de que la resistencia al antibiótico podria escapar al medio ambiente. Algunos datos experimentales de experimentos que demuestran el uso de un polinucleótido de GAT como un marcador seleccionable en sistemas huéspedes diversos son descritos en la sección de Ejemplos de esta especificación. Selección de polinucleótidos de gat que confieren resistencia al glifosato aumentada en plantas transgénicas .
194
Las bibliotecas de ácidos nucleicos que codifican GAT diversificadas de acuerdo con los métodos descritos en la presente pueden ser seleccionadas por la capacidad para conferir la resistencia al glifosato en plantas transgénicas . Después de uno o más ciclos de diversificación y selección, los genes de GAT modificados pueden ser utilizados como un marcador de selección para facilitar la producción y evaluación de plantas transgénicas como un medio para conferir resistencia al herbicida en plantas experimentales o de la agricultura. Por ejemplo, después de la diversificación de cualquiera o más de SEQ ID NO:l a SEQ ID NO : 5 para producir una biblioteca de polinucleótidos de GAT diversificados, una evaluación funcional inicial puede ser realizada al expresar la biblioteca de secuencias que codifica el GAT y el E. coli. Los polipéptidos de GAT expresados pueden ser purificados o parcialmente purificados como es descrito anteriormente, y clasificados para la cinética mejorada mediante la espectrometria de masas. Después de una o más rondas preliminares de diversificación y selección, los polinucleótidos que codifican polipéptidos de GAT mejorados son clonados en un vector de expresión de planta, operablemente enlazado a, por ejemplo, un promotor constitutivo fuerte, tal como el promotor CaMV 35S. Los vectores de expresión que comprenden los ácidos nucleicos de GAT modificados son transformados, típicamente por la 195
transformación mediada por Agrobacterium, en plantas huéspedes de Arabidipsis thaliana. Por ejemplo, los huéspedes de Arabidopsis son fácilmente transformados al sumergir inflorescencias en soluciones de Agrobacterium y al permitir que crezcan y lleguen a ser semilla. Miles de semillas son recuperadas en aproximadamente 6 semanas. Las semillas luego son recolectadas a granel de las plantas sumergidas y germinadas en la tierra. De esta manera es posible generar varios miles de plantas independientemente transformadas para la evaluación, constituyendo un formato de transformación de planta de alto rendimiento (HTP) . Las plántulas cultivadas en volumen son rociadas con glifosato y las plántulas sobrevivientes que exhiben resistencia al glifosato sobreviven el proceso de selección, mientras que las plantas no transgénicas y las plantas que incorporan ácidos nucleicos de GAT modificados menos favorables, son dañadas o exterminadas por el tratamiento con herbicida. Opcionalmente, los ácidos nucleicos que codifican GAT que confieren resistencia mejorada al glifosato son recuperados, por ejemplo, mediante la amplificación de PCR utilizando cebadores de T-DNA que flanquean los insertos de biblioteca, y utilizados en procedimientos de diversif cación adicionales o para producir plantas transgénicas adicionales de la misma o diferente especie. Si se desea, vueltas adicionales de diversificación y selección puede ser realizadas utilizando 196
concentraciones incrementadas de glifosato en cada selección subsecuente. De esta manera, se pueden obtener polinucleótidos y polipéptidos de GAT que confieren resistencia a concentraciones de glifosato útiles en las condiciones en campo. Resistencia al Herbicida Los mecanismos de resistencia al glifosato de la presente invención se pueden combinar con otros modos de resistencia al glifosato conocidos en la técnica para producir plantas y explantaciones de planta con resistencia al glifosato superior. Por ejemplo, las plantas tolerantes al glifosato se pueden producir al insertar en el genoma de la planta la capacidad para producir un nivel más alto de 5-enolpiruvilshikimato-3-fosfato sintasa (EPSP) como se describe más completamente en las patentes norteamericanas Nos. 6,248,876 Bl; 5,627,061; 5,804,425; 5,633,435; 5,145,783; 4,971,908; 5,312,910; 5,188,642; 4,940,835; 5, 866, 775; 6,225,114 Bl; 6, 130, 366; 5,310, 667; 4, 535, 060; 4,769,061; 5,633,448; 5,510,471; Re. 36,449; RE 37,287 E; y 5,491,288; y en las publicaciones internacionales O 97/04103; WO 00/66746; WO 01/66704; y WO 00/66747, que son incorporadas en la presente por referencia en sus totalidades para todos los propósitos. La resistencia al glifosato también es impartida a las plantas que expresan un gen que codifica una enzima de glifosato óxido-reductasa como es 197
descrito mas completamente en las patentes norteamericanas Nos. 5,776,760 y 5,463,175, que son incorporadas en la presente por referencia en sus totalidades para todos los propósitos . Además, el mecanismo de resistencia al glifosato de la presente invención se puede combinar con otros modos de resistencia al herbicida para proporcionar plantas y explantaciones de plantas que son resistentes al glifosato y uno o más de otros herbicidas. Por ejemplo, las hidroxifenilpiruvatodioxigenasas son enzimas que catalizan la reacción en la cual el para-hidroxifenilpiruvato (HPP) es transformado en homogenizado . Las moléculas que inhiben esta enzima, y que se enlazan en la enzima con el fin de inhibir la transformación del HPP en homogenizados son útiles como herbicidas. Plantas más resistentes a ciertos herbicidas son descritas en las patentes norteamericanas Nos. 6,245,968 Bl; 6,268,549; y 6,069,115; y en la publicación internacional WO 99/23886, que son incorporadas en la presente por referencia en sus totalidades para todos los propósitos. Los herbicidas de sulfonilurea e imidazolinona también inhiben el crecimiento de plantas superiores al bloquear la acetolactato sintasa (ALS) o acetohidroxi ácido sintasa (AHAS) . La producción de plantas tolerantes a la sulfonilurea e imidazolinona es descrita más completamente en las patentes norteamericanas Nos. 5,605,011; 5,013,659;
5,141,870/ 5,767,361; 5,731,180; 5,304,732; 4, 761, 373; 5,331,107; 5,928,937; y 5,378,824; en la publicación internacional WO 96/33270, que son incorporadas en la presente por referencia en sus totalidades para todos los propósitos. La glutamina sintetasa (GS) se presenta que es una enzima esencial y necesaria para el desarrollo y la vida de la mayoría de las células de planta. Los inhibidores de GS son tóxicos a las células de planta. Los herbicidas de glufosinato se han desarrollado basados en el efecto tóxico debido a la inhibición de GS en plantas . Estos herbicidas no son selectivos . Ellos inhiben el crecimiento de todas las diferentes especies de plantas presentes, ocasionando su destrucción total. El desarrollo de plantas que contienen una fosfinotricina acetil transferasa exógena es descrito en las patentes norteamericanas Nos. 5,969,213; 5,489,520, 5,550,318; 5,874,265; 5,919,675; 5,561,236; 5,648,477; 5,646,024; 6,177,616 Bl; y 5,879,903, que son incorporados en la presente por referencia en sus totalidades para todos los propósitos. La protoporfirinogen oxidasa (protox) es necesaria para la producción de clorofila, que es necesaria para toda la supervivencia de la planta. La enzima protox sirve como el objetivo para una variedad de compuestos herbicidas. Los herbicidas también inhiben el crecimiento de todas las 199
diferentes especies de plantas presentes, ocasionando su destrucción total. El desarrollo de plantas que contiene actividad de protox alterada que son resistentes a estos herbicidas son descritos en las patentes norteamericanas Nos. 6,288,306 Bl 6,282,837 Bl; y 5,767,373; y en la publicación internacional WO 01/12825, que son incorporadas en la presente por referencia en sus totalidades para todos los propósitos . EJEMPLOS Los siguientes ejemplos son ilustrativos y no limitativos . Un experto reconocerá una variedad de parámetros no críticos que pueden ser alterados para alcanzar resultados esencialmente similares. EJEMPLO 1: AISLAMIENTO DE POLINUCLEOTIDOS DE GAT NATURALES, NOVEDOSOS ¦ Cinco polinucleótidos de GAT naturales (es decir, polinucleótidos de GAT que ocurren naturalmente en un organismo no genéticamente modificado) se descubrieron mediante la clonación de expresión de secuencias de cepas de bacilos que exhiben actividad de GAT. Sus secuencias de nucleótidos se determinaron y son proporcionadas en la presente como SEQ ID NO:l a SEQ ID NO: 5. Brevemente, una colección de aproximadamente 500 cepas de Bacillus y Pseudomonas se clasificaron para la capacidad natural para el N-acetilato glifosato. Las cepas se cultivaron en LB durante 200
la noche, se cosecharon por centrifugación, se permeabilizaron en tolueno diluido y luego se lavaron y resuspendieron en una mezcla de reacción que contiene regulador, glifosato 5mM, y acetil-CoA 200uM. Las células se incubaron en la mezcla de reacción por entre 1 y 48 horas, tiempo en el cual un volumen igual de metanol se adicionó a la reacción. Las células luego se formaron en pelotillas mediante la centrifugación y el sobrenadante se filtró antes del análisis mediante la espectometría de masas de modo de ion de origen. El producto de la reacción fue positivamente identificado como N-acetilglifosato al comparar el perfil de espectometria de masas de la mezcla de reacción con un estándar de N-acetilglifosato como es mostrado en la Figura 2. La detección del producto fue dependiente de la inclusión de ambos sustratos (acetil CoA y glifosato) y se anuló al desnaturalizar con calor las células bacterianas. Los polinucleótidos de GAT individuales luego se clonaron de las cepas identificadas mediante la clasificación funcional. El DNA genómico se preparó y parcialmente se digirió con enzima Sau3Al . Los fragmentos de aproximadamente 4 b se clonaron en un vector de expresión de E. coli y se transformaron en E. coli electrocompetente . Los clones individuales que exhiben actividad de GAT se identificaron mediante la espectrometría de masas siguiendo una reacción como es descrito previamente excepto que el lavado de tolueno 201
se reemplazó mediante la permeabilización con PMBS . Los fragmentos genómicos se secuenciaron y se identificó el cuadro de lectura abierto que codifica el polipéptido de GAT putativo. La identidad del gen de GAT se confirmó mediante la expresión del cuadro de lectura abierto en E. coli y la detección de altos niveles de N-acetilglifosato producido de las mezclas de reacción.
EJEMPLO 2: CARACTERIZACION DE UN POLIPEPTIDO DE GAT AISLADO DE LA CEPA B6 DE B. LICHENIFORMIS. El DNA genómico de la cepa B6 de B. licheniformis se purificó, parcialmente se digirió con Sau3AI y los fragmentos de 1-10 Kb se clonaron en un vector de expresión de E. coli. Un clon con un inserto de 2.5 kb confirió la actividad de glifosato N-acetiltransferasa (GAT) en el huésped E. coli como es determinado con el análisis de espectrometría de masas . La secuenciación del inserto reveló un cuadro de lectura abierto completo individual de 441 pares base. La clonación subsecuente de este cuadro de lectura abierto confirmó que se codificó la enzima de GAT. Un plásmido, pMAXY212Q, mostrado en la figura 4, con el gen que codifica la enzima de GAT B6 se transformó en la cepa XL1 Blue de E. coli. Un inóculo al 10% de un cultivo saturado se adicionó al caldo Luria y el cultivo se incubó a 37 °C durante 1 hr. La expresión de GAT se indujo mediante la adición de 202
IPTG a una concentración de lmM. El cultivo se incubó 4 hrs. adicionales, después de lo cual, las células se cosecharon por centrifugación y la pelotilla de células se almacenó a -80°C. La lisis de las células se efectuó mediante la adición de 1 mi del siguiente regulador a 0.2 g de células: HEPES 25 mM, pH 7.3, KCl 100 mM y metanol al 10% (HKM) más EDTA O.lmM, DTT 1 mM, 1 mg/ml de lisozima de huevo de pollo, y un coctel inhibidor de proteasa obtenidos de Sigma y utilizados de acuerdo con las recomendaciones del fabricante. Después de 20 -minutos de incubación a ^em e artu a ambiente (por ejemplo 22-2.5°C) , la lisis se completó con s.onificación breve. El lisado se centrifugó y el sobrenadante se desalificó mediante el paso a través de Sephadex G25 equilibrado con HKM. La purificación parcial se obtuvo mediante la cromatografía de afinidad en CoA Agarose (Sigma) , La columna se equilibró con HKM y el extracto clarificado se dejó pasar a través bajo presión hidrostática . Las proteínas no de enlace se removieron al lavar la columna con HKM, y el GAT se diluyó con HKM que contiene coenzima A de 1 mM. Este procedimiento proporcionó 4 veces la purificación. En esta etapa, aproximadamente 65% del manchado de proteína observado en un gel de poliacrilamida de SOS cargado con lieado crudo fue debido al GAT, con otro 20% debido a la cloranfenicol acetiltransferasa codificada por el vector.
203
La purificación a homogeneidad se obtuvo mediante la filtración en gel de la proteina parcialmente purificada a través de Superdex 75 (Pharmacia) . La fase móvil fue HKM, en la cual la actividad de GAT eluyó a un volumen correspondiente a un radio molecular de 17 JcD. Este material fue homogéneo como es estimado por el manchado de Coomassie de una muestra de 3 g de GAT sometida a la electroforesis en gel de poliacrilamida de SDS en un gel de acrilamida al 12%, 1 mm de espesor. La purificación se alcanzó con un incremento de 6 veces en la actividad especifica. La M aparente para el glifosato se determinó en mezclas de reacción que contienen saturación (200 uM) de Acetil CoA, concentraciones variantes de glifosato, y ?µ? de GAT purificado en regulador que contiene morfolina 5mM ajustada a pH 7.7 con ácido acético y etilenglicol al 20%. Las velocidades de reacción iniciales se determinaron mediante la inspección continua de la hidrólisis del enlace de tioéster del Acetil CoA a 235 nm (E-3.4 OD/mM/cm) . La cinética de saturación hiperbólica se observó (Figura 5), de la cual se obtuvo una KM aparente de 2.9 ± 0.2 (SD) niM. La KM aparente para AcCoA se determinó en mezclas de reacción que contienen glifosato 5mM, concentraciones variantes de Acetil CoA, y GAT 0.19 uM en regulador que contiene morfolina 5mM ajustada a pH 7.7 con ácido acético y metanol al 50%. Las velocidades de reacción iniciales se 204
determinaron utilizando la detección espectrométrica de masas de N-acetil glifosato. Cinco µ? se inyectaron repetidamente al instrumento y las velocidades de reacción se obtuvieron al graficar el tiempo de reacción contra el área del pico o máximo integrado (Figura 6) . La cinética de saturación hiperbólica se observó (Figura 7), de la cual se derivó una KM aparente de 2uM. A partir de los valores para Vmax obtenidos a una concentración conocida de enzima, se calculó una kcat de 6/min.
EJEMPLO 3; PROCESO DE CLASIFICACION CON ESPECTROMETRIA DE MASAS (MS) La muestra (5ul) es retirada de una placa de microtitulo de 96 cavidades a una velocidad de una muestra cada 26 segundos e inyectada en el espectrómetro de masas (Micromass Quatro LC, espectrómetro de masas de triple cuadripolo) sin ninguna separación. La muestra se lleva en el espectrómetro de masas mediante una base móvil de agua/metanol (50:50) a una velocidad de flujo de 500 Ul/min. Cada muestra inyectada es ionizada mediante el proceso de ionización de electrorrociado negativo (voltaje de la aguja, -3.5 KV; voltaje del cono, 20 V; temperatura de la fuente, 120°C; temperatura de desolvatación, 250°C; flujo de gas del cono, 90 L/Hr; y flujo de gas de desolvatación, 600 L/Hr) . Los iones moleculares (m/z 210) formados durante este proceso 205
son seleccionados por el primer cuadripolo para realizar la disociación inducida por colisión (CID) en el segundo cuadripolo, donde la presión es ajustada a 5 x 1CT4 mBar y la energía de colisión es ajustada a 20 Ev. El tercer cuadripolo es ajustado para únicamente permitir a uno de los iones hijos (m/z 124) producidos de los iones de origen (m/z 210) para la obtención en el detector para el registro de señal. El primero y el tercer cuadripolo son ajustados a resolución unitaria, mientras que el fotomultiplicador es operado a 650 V. Los estándares de N-acetilglifosato puro son utilizados para la comparación y la integración del pico utilizada para estimar las concentraciones. Es posible detectar menos de 200 Nm de N-acetilglifosato mediante este método.
EJEMPLO 4: DETECCION DE ENZIMAS DE GAT NATURALES 0 DE BAJA ACTIVIDAD. Las enzimas de GAT naturales o de baja actividad típicamente tienen cat de aproximadamente 1 min-1 y KM para glifosato de 1.5-10 Mm. La M para acetil CoA es típicamente menor que 25 uM. Los cultivos bacterianos son cultivados en un medio rico, en placas de 96 cavidades profundas y 0.5 mi de células en fase estacionaria son cosechadas por centrifugación, lavadas con acetato de morfolina 5mM, pH 8, y resuspendidas en 0.1 mi de mezcla de reacción que contiene acetil CoA de 206
amonio 200µ?, glifosato de amonio 5mM, y 5 ug/ml de PMBS (Sigma) en acetato de morfolina 5 mM, pH8. La PMBS permeabiliza la membrana celular que permite que los sustratos y productos se muevan de las células al regulador sin liberar los contenidos celulares completos. Las reacciones se llevan a cabo a 25-37°C durante 1-48 horas. Las reacciones se detienen con un volumen igual de etanol al 100% y la mezcla completa se filtra en una placa de filtro MAHV Multiscreen de 0.45 µ? (Millipore) . Las muestras son analizadas utilizando un espectrómetro de masas como es descrito anteriormente y comparadas con estándares de N-acetilglifosato sintéticos.
EJEMPLO 5: DETECCION DE ENZIMAS DE GAT DE ALTA ACTIVIDAD Las enzimas de GAT de alta actividad típicamente tienen kcat de hasta 400 min"1 y Km por debajo de glifosato 0.1 mM. Los genes que codifican para enzimas de GAT son clonados en vectores de expresión de E. colí tal como pQE80 (Qiagen) e introducidos en cepas de E. coli tal como XL1 Blue (Stratagene) . Los cultivos son cultivados en 150 ul de medio rico (tal como LB con 50 ug/ml de carbenicilina) en placas de poliestireno de 96 cavidades de fondo en forma de U poco profundas para la fase tardia-log y diluidas 1:9 con medio fresco que contiene IPTG lmM(USB) . Después de 4-8 horas de 207
inducción, las células son cosechadas, lavadas con acetato de morfolina 5mM pH6.8 y resuspendidas en un volumen igual del mismo regulador de morfolina. Las reacciones son llevadas a cabo con hasta 10 ul de células lavadas. A niveles de actividad más altos, las células primero se diluyen hasta 1:200 y 5 ul es adicionado a 100 ul de mezcla de reacción. Para medir la actividad de GAT se puede utilizar la misma mezcla de reacción como es descrito para la baja actividad. Sin embargo, para la detección de enzimas de GAT altamente activas, la concentración de glifosato es reducida a 0.15-0.5 mM, el pH es reducido a 6.8, y las reacciones son llevadas a cabo durante 1 hora a 3 °C. La elaboración de la reacción en la detección de MS son como se describen en la presente.
EJEMPLO 6: PURIFICACION DE ENZIMAS DE GAT La purificación de la enzima se alcanza mediante la cromatografía de afinidad de Usados de células en CoA-agarosa y la filtración de gel en Superdex-75. Las cantidades de enzima de GAT purificada hasta 10 mg son obtenidas como sigue: Un cultivo de 100 mi de E. colí que lleva un polinucleótido de GAT en un vector pQE80 y cultivado durante la noche en LB que contiene 50 ug/ml de carbenicilina es utilizado para inocular 1L de LB más 50 ug/ml de carbenicilina. Después de 1 hr, se adiciona IPTG a lmM, y el cultivo se cultiva 6 hr adicionales. Las células son 208
cosechadas por centrifugación. La lisis se efectúa al suspender las células en HEPES 25 mM (pH 7.2), KCl 100 mM, metanol al 10% (llamado HKM), EDTA 0.1 mM, DTT lmM, coctel inhibidor de proteasa suminisrado por Sigma-Aldrich y lmg/ml de lisozima de huevo de pollo. Después de 30 minutos a temperatura ambiente, las células son brevemente sonicadas . El material particulado es removido por centrifugación, y el lisado es pasado a través de un lecho de coenzima A-Agarosa. La columna se lava con varios volúmenes de lecho de HKM y GAT es eluido en 1.5 volúmenes de lecho de HKM que contiene acetil-coenzima A lmM. La GAT en el eluato es concentrada por su retención arriba de una membrana de ultrafiltración Centricon YM 50. La purificación adicional es obtenida al pasar la proteina a través de una columna Superdex 75 a través de una serie de inyecciones de 0.6 mi. El pico de la actividad de GAT eluye a un volumen correspondiente a un peso molecular de 17 kD. Este método da por resultado la purificación de la enzima de GAT a la homogeneidad con >85% de recuperación. Un procedimiento similar es utilizado para obtener cantidades de 0.1 a 0.4 mg de hasta 96 variantes entremezcladas a la vez. El volumen de cultivo inducido es reducido de 1 a 10 mi, la cromatografía de afinidad de coenzima A-Agarosa es realizada en columnas de 0.15-ml empacadas en una placa de filtro MAHV (Millipore) y la cromatografía Superdex 75 es omitida.
209
EJEMPLO 7: PROTOCOLO ESTANDAR PARA LA DETERMINACION DE KCAT Y
KCat Y KM para glifosato de la proteina purificada son determinadas utilizando un ensayo espectofotométrico continuo, en la cual la hidrólisis del enlace de sulfoéster de AcCoA es inspeccionado a 235 nm. Las reacciones son realizadas a temperatura amiente (aproximadamente 23°C) en las cavidades de una placa de ensayo de 96 cavidades, con los siguientes componentes presentes en un volumen final de 0.3 mi: ????? 20 mM, pH 6.8, etilenglicol al 10%, acetil coenzima A 0.2 mM, y varias concentraciones de glifosato de amonio. En la comparación de la cinética de las 2 enzimas de GAT, ambas enzimas deben ser analizadas bajo la misma condición, por ejemplo, ambas a 23 °C. Kcat es calculada de vmají y la concentración de enzima, determinada por el ensayo de Bradford. KM es calculada de las velocidades de reacción iniciales obtenidas de las concentraciones de glifosato que varian de 0.125 a 10 mM, utilizando la transformación de Lineweaver-Burke de la ecuación de Michaelis-Menten . KCAT/ M es determinada al dividir el valor determinado para Kcat entre el valor determinado para KM. Utilizando esta metodología, los parámetros cinéticos para un número de polipéptidos de GAT e emplificados en la presente han sido determinados. Por ejemplo, la KCAT, KM y la KCAT/ M para el polipéptido de GAT 210
correspondiente a la SEQ ID NO: 445 se ha determinado que es de 322 min"1, 0.5 mM y 660 mM"1 min*1, respectivamente, utilizando las condiciones de ensayo descritas anteriormente. Las cat/ KM y las Kcat/KM para el polipéptido de GAT correspondiente a la SEQ ID NO: 457 se ha determinado que es de 118 min"1, 0.1 mM y 1184 mM'1 mín"1, respectivamente, utilizando las condiciones de ensayo descritas anteriormente. Las Kcat/ KM y la Kcat/KM para el polipéptido de GAT correspondiente a la serie de SEQ ID NO: 300 se ha determinado que es de 296 min-1, 0.65 mM y 456 mM"1 min"1, respectivamente, utilizando las condiciones de ensayo descritas anteriormente. Un experto en la técnica puede utilizar estos números para confirmar que un ensayo de actividad de GAT está generando parámetros cinéticos para una GAT adecuada para la comparación con los valores dados en la presente. Por ejemplo, las condiciones utilizadas para comparar la actividad de las GATs deben producir las mismas constantes cinéticas para las 3EQ ID NOS: 300, 445 Y 457 (dentro de la variación experimental normal) tales como aquellas reportadas en la presente, si las condiciones van a ser utilizadas para comparar una GAT de prueba con polipéptidos de GAT e emplificados en la presente. Los parámetros cinéticos para un número de variantes de polipéptido de GAT se determinaron de acuerdo con esta metodologia y son proporcionados en las Tablas 3, 4 y 5.
211
Tabla 3. Valores de kcat del polipéptído de GAT SEQ ID NO. ID da Clon KcAt {min"1)
SEQ ID NO: 263 13_10F6 48.6 SEQ ID NO:264 13 12G6 52.1 SEQ ID NO: 265 14_2A5 280.8 SEQ ID NO: 266 14_2C1 133.4 SEQ ID NO: 267 14_2F11 136.9 SEQ ID NO: 268 QUIMERA 155.4 SEQ ID NO: 269 10_12D7 77.3 SEQ ID NO:270 10_15F4 37.6 SEQ ID NO: 271 10_17D1 176.2 SEQ ID NO:272 10_17F6 47.9 SEQ ID NO: 273 10 18G9 24 SEQ ID NO: 274 10_1H3 76.2 SEQ ID NO: 275 10_20D10 86.2 SEQ ID NO:276 10_23F2 101.3 SEQ ID NO:277 10_2B8 108.4 SEQ ID NO: 278 10_2C7 135 SEQ ID NO:279 10_3G5 87.4 SEQ ID NO: 280 10_4H7 112 SEQ ID NO: 281 10_6D11 62.4 SEQ ID NO: 282 10_8C6 21.7 SEQ ID NO: 283 11C3 2.8 SEQ ID NO: 284 11G3 15.6 SEQ ID NO: 285 11H3 1.2 212
213
SEQ ID NO: 311 14_12H6 91.1
SEO. ID NO: 312 14_2B6 34.2
SEQ ID NO: 313 14_2G11 69.4
SEQ ID NO: 314 14_3B2 68.7
SEQ ID NO: 315 14_4H8 198.8
SEQ ID NO: 316 14 6A8 43.7
SEQ ID NO: 317 14_6B10 134.7
SEQ ID NO: 318 14_6D4 256
SEQ ID NO: 319 14_7A11 197.2
SEQ ID NO: 320 14_7A1 155.8
SEQ ID NO:321 14_7A9 245.9
SEQ ID NO: 322 14_7G1 136.7
SEQ ID NO: 323 14 7H9 64.4
SEQ ID NO: 324 14_8F7 90.5
SEQ ID NO: 325 15_10C2 69.9
SEQ ID NO: 326 15 10D6 67.1
SEQ ID NO: 327 15_11F9 76.4
SEQ ID NO: 328 15 11H3 61.9
SEQ ID NO: 329 15_12A8 77.1
SEQ ID NO: 330 15_12D6 148.6
SEQ ID NO: 331 15_12D8 59.7
SEQ ID NO: 332 15_12D9 59.7
SEQ ID NO: 333 15 3F10 48.7
SEQ ID NO: 334 15_3G11 71.5
SEQ ID NO: 335 15 4F11 80.3 214
SEQ ID NO: 336 15_4H3 93.3
SEQ ID NO: 337 15_6D3 85.9
SEQ ID NO: 338 15_6G11 36.9
SEQ ID NO: 339 15_9F6 59.6
SEQ ID NO: 340 15F5 0.5
SEQ ID NO:341 16A1 10.4
SEQ ID NO: 342 16H3 3.5
SEQ ID NO: 343 17C12 3.2
SEQ ID NO: 344 18D6 9.6
SEQ ID NO: 345 19C6 2.2
SEQ ID NO: 346 19D5 2.2
SEQ ID NO: 347 20A12 2.8
SEQ ID NO :348 20F2 3.9
SEQ ID NO: 349 2.10E+12 1.1
SEQ ID NO: 350 23H11 7.1
SEQ ID NO: 351 24C1 1.7
SEQ ID NO: 352 24C6 2.7
SEQ ID NO: 353 2.40E+08 8.9
SEQ ID NO: 354 2_8C3 24.8
SEQ ID NO: 355 2H3 16.1
SEQ ID NO: 356 30G8 10.2
SEQ ID NO: 357 3B_10C4 24.8
SEQ ID NO: 358 3B_10G7 19.6
SEQ ID NO: 359 3B_12B1 22.8
SEQ ID NO: 360 3B 12D10 5.4 215
SEQ ID NO: 361 3B_2E5 16.4
SEQ ID NO: 362 3C_10H3 33.9
SEQ ID NO: 363 3C 12H10 9.1
SEQ ID NO: 364 3C_9H8 11.7
SEQ ID NO: 365 4A_1B11 23.2
SEQ ID NO:366 4A_1C2 20.4
SEQ ID NO: 367 4B_13E1 37.2
SEQ ID NO: 368 4B_13G10 34.9
SEQ ID NO: 369 4B_16E1 17
SEQ ID NO: 370 4B_17A1 19.1
SEQ ID NO:371 4B_18F11 14.6
SEQ ID NO:372 4B_19C8 15.9
SEQ ID NO: 373 4B 1G4 3.7
SEQ ID NO:374 4B_21C6 11.8
SEQ ID NO: 375 4B_2H7 27
SEQ ID NO: 376 4B_2H8 38.3
SEQ ID NO: 377 4B_6D8 22.7
SEQ ID NO: 378 4B_7E8 20.5
SEQ ID NO:379 4C 8C9 9
SEQ ID NO: 380 4H1 1.3
SEQ ID NO:381 6_14D10 42.2
SEQ ID NO: 382 6_15G7 48.4
SEQ ID NO:383 6_16A5 43.8
SEQ ID NO: 384 6_16F5 35.2
SEQ ID NO: 385 6 17C5 35.2 216
217
219
SEQ ID NO: 61 11_3C12 49.07
SEQ ID NO: 62 11_3C3 214.02
SEQ ID NO:463 11_3C6 18 . 4
SEQ ID NO: 464 11_3D6 55.3
SEQ ID NO: 65 1_1G12 58.48
SEQ ID NO: 466 1_1H1 291
SEQ ID NO: 467 1_1H2 164
SEQ ID NO: 468 1_1H5 94
SEQ ID NO: 469 1_2A12 229
SEQ ID NO:470 1_2B6 138
SEQ ID NO: 471 1_2C 193
SEQ ID NO: 472 1_2D2 124
SEQ ID NO: 473 1 2D4 182
SEQ ID NO: 474 1_2F8 161
SEQ ID NO: 75 1_2H8 141
SEQ ID NO: 476 1_3A2 181
SEQ ID NO: 477 1-3D6 226
SEQ ID NO: 478 1_ F3 167
SEQ ID NO: 479 1 3H2 128
SEQ ID NO: 480 1_4C5 254
SEQ ID NO: 481 1_4D6 137
SEQ ID NO: 482 1_4H1 236
SEQ ID NO:483 1_5H5 214
SEQ ID NO:484 1_6F12 209
SEQ ID NO:485 1_6H6 274 220
SEQ ID NO: 486 3_11A10 135.41
SEQ ID NO: 487 3_14F6 188.43
SEQ ID NO: 88 3_15B2 104.13
SEQ ID NO: 489 3_6A10 126.48
SEQ ID NO: 90 3_6B1 263.08
SEQ ID NO: 491 3_7F9 193.55
SEQ ID NO: 492 3_8G11 99.14
SEQ ID NO: 93 4 1B10 77.09
SEQ ID NO: 494 5_2B3 56.75
SEQ ID NO:495 5 2D9 75.44
SEQ ID NO: 496 5 2F10 54.72
SEQ ID NO: 97 6_1A11 45.54
SEQ ID NO: 498 6_1D5 42.92
SEQ ID NO: 99 6_1F11 105.76
SEQ ID NO: 500 6_1F1 69.81
SEQ ID NO: 501 6_lH10 17.01
SEQ ID NO: 502 6_1H4 85.91
SEQ ID NO: 503 8_1F8 82.88
SEQ ID NO: 504 8_1G2 67.47
SEQ ID NO: 505 8 1G3 108.9
SEQ ID NO: 506 8_1H7 101.24
SEQ ID NO: 507 8_1H9 78.39
SEQ ID NO: 508 GAT1_21F12 5.4
SEQ ID NO: 509 GAT1_2 G3 4.9
SEQ ID NO: 510 GAT1_29G1 6.2 SEQ ID NO: 511 GA 1_32G1 4.5 SEQ ID NO: 512 GAT2_15G8 4.5 SEQ ID NO: 513 GAT2_19H8 4.1 SEQ ID NO: 514 GAT2_21F1 4.2
Tabla 4. Valores de M del polipéptido (glifosato) de GAT
SEQ ID NO. ID de Clon KMOHM) SEQ ID NO: 263 13_10F6 1.3 SEQ ID NO: 264 13_12G6 1.2 SEQ ID NO: 265 14_2A5 1.6 SEQ ID NO: 266 14 2C1 3.1 SEQ ID NO: 267 14_2F11 1.7 SEQ ID NO: 268 QUIMERA 1.3 SEQ ID NO:269 10_12D7 1.8 SEQ ID NO: 270 10_15F4 1 SEQ ID NO:271 10_17D1 2.2 SEQ ID NO: 272 10_17F6 1.4 SEQ ID NO:273 10__18G9 1.2 SEQ ID NO: 274 10 1H3 1.9 SEQ ID NO: 275 10_20D10 1.6 SEQ ID NO: 276 10_23F2 0.9 SEQ ID NO: 277 10_2B8 1.1 SEQ ID NO:278 10_2C7 1.4 SEQ ID NO:279 10_3G5 2 SEQ ID NO: 280 10 4H7 1.7 222
SEQ ID NO: 281 10 6D11 1.2
SEQ ID NO:282 10 8C6 0.7
SEQ ID NO: 283 11C3 3.1
SEQ ID NO: 284 11G3 1.7
SEQ ID N0:285 11H3 1.4
SEQ ID NO: 286 12_1F9 3
SEQ ID NO: 287 12_2G9 1.5
SEQ ID N0:288 12_3F1 0.9
SEQ ID NO: 289 12_5C10 1.5
SEQ ID NO: 290 12 6A10 1.1
SEQ ID NO:291 12_6D1 1.2
SEQ ID NO: 292 12_6F9 1.9
SEQ ID NO: 293 12_6H6 1.6
SEQ ID NO: 294 12_7D6 1.4
SEQ ID NO: 295 12_7G11 2
SEQ ID NO : 296 12F5 1.8
SEQ ID NO: 297 12G7 3.7
SEQ ID NO: 298 1_2H6 0.9
SEQ ID NO:299 13 12G12 0.69
SEQ ID NO: 300 13_6D10 0.65
SEQ ID NO: 301 13_7A7 0.5
SEQ ID NO: 302 13_7B12 1.7
SEQ ID NO: 303 13_7C1 1.5
SEQ ID NO: 304 13_8G6 0.61
SEQ ID NO: 305 13_9F6 1.3 223
224
225
SEQ ID NO: 356 30G8 1.6
SEQ ID NO: 357 3B_10C4 1.6
SEQ ID NO: 358 3B_10G7 1
SEQ ID NO: 359 3B_12B1 1.2
SEQ ID NO: 360 3B_12D10 0.9
SEQ ID NO: 361 3B_2E5 1.3
SEQ ID NO: 362 3C_10H3 1.1
SEQ ID NO: 363 3C_12H10 1.2
SEQ ID NO: 364 3C_9H8 1
SEQ ID NO: 365 AJ.B11 1.6
SEQ ID NO: 366 4A_1C2 1.2
SEQ ID NO: 367 4B_13E1 2
SEQ ID NO: 368 4B 13G10 7.6
SEQ ID NO: 369 B_16E1 1
SEQ ID NO: 370 4B_17A1 1.1
SEQ ID NO: 371 4B_18F11 1.7
SEQ ID NO:372 B_19C8 1.2
SEQ ID NO: 373 4B_1G4 1
SEQ ID NO: 374 4B_21C6 0.8
SEQ ID NO: 375 4B_2H7 6.2
SEQ ID NO: 376 4B_2H8 1.2
SEQ ID NO:377 4B 6D8 1.5
SEQ ID NO: 378 4B 7E8 1.2
SEQ ID NO:379 4C_8C9 0.6
SEQ ID NO: 380 4H1 1.4 226
227
228
229
SEQ ID NO: 56 10_4G5 0.58
SEQ ID NO: 457 10_4H4 0.1
SEQ ID NO: 458 11_3A11 0.1
SEQ ID NO: 59 11_3B1 0.63
SEQ ID NO: 460 11_3B5 0.26
SEQ ID NO: 461 11_3C12 0.1
SEQ ID NO: 62 11_3C3 0.22
SEQ ID NO: 63 11_3C6 0.21
SEQ ID NO: 464 11_3D6 0.1
SEQ ID NO: 465 1 1G12 0.1
SEQ ID NO: 466 1_1H1 1.8
SEQ ID NO: 467 1_1H2 0.44
SEQ ID NO: 468 1_1H5 1.5
SEQ ID NO: 469 1_2A12 1.3
SEQ ID NO:470 1_2B6 0.58
SEQ ID NO: 71 1 2C4 0.8
SEQ ID NO: 72 1_2D2 1.2
SEQ ID NO:473 1_2D4 1.2
SEQ ID NO: 74 1_ F8 1.9
SEQ ID NO:475 1_2H8 0.48
SEQ ID NO: 76 1_3A2 0.8
SEQ ID NO:477 1-3D6 3.5
SEQ ID NO: 478 1_3F3 1.5
SEQ ID NO: 479 1_3H2 0.7
SEQ ID NO: 80 1_4C5 0.93 230
231
SEQ ID NO: 506 8_1H7 0.1 SEQ ID NO: 507 8_1H9 0.1 SEQ ID NO : 508 GAT1_21F12 4.6 SEQ ID NO: 509 GA 1_2 G3 3.8 SEQ ID NO: 510 GA 1_29G1 4 SEQ ID NO: 511 GAT1_32G1 3.3 SEQ ID NO: 512 GAT2_15G8 2.8 SEQ ID NO: 513 GAT2_19H8 2.8 SEQ ID NO: 514 GAT2_21F1 4.2
Tabla 5. Valores de Kcat/KM del polipéptido de GAT
SEQ ID NO. ID de Clon SEQ ID NO:263 13_10F6 37.4 SEQ ID NO: 264 13_12G6 43.4 SEQ ID NO: 265 14 2A5 175.5 SEQ ID NO: 266 14 2C1 43 SEQ ID NO: 267 14_2F11 80.6 SEQ ID NO: 268 QUIMERA 119.6 SEQ ID NO: 269 10_12D7 43 SEQ ID NO: 270 10_15F4 37.6 SEQ ID NO: 271 10_17D1 80.1 SEQ ID NO: 272 10_17F6 34.2 SEQ ID NO: 273 10_18G9 20 SEQ ID NO: 274 10_1H3 40.1 SEQ ID NO: 275 10_20D10 53.9 232
SEQ ID NO:276 10_23F2 112.5
SEQ ID MO:277 10_2B8 98.5
SEQ ID NO:.278 10_2C7 96.4
SEQ ID NO: 279 10_3G5 43.7
SEQ ID NO:280 10_4H7 65.9
SEQ ID NO: 281 10_6D11 52
SEQ ID NO:282 10_8C6 31
SEQ ID NO:283 11C3 0.9
SEQ ID NO:284 11G3 8.9
SEQ ID NO:285 11H3 0.9
SEQ ID NO: 286 12 1F9 26.8
SEQ ID NO:287 12_2G9 101
SEQ ID NO: 288 12_3F1 49
SEQ ID NO:289 12_5C10 59.7
SEQ ID NO: 290 12_6A10 49.7
SEQ ID NO: 291 12 6D1 40.8
SEQ ID NO: 292 12_6F9 46.9
SEQ ID NO: 293 12_6H6 56.5
SEQ ID NO: 294 12 7D6 38.5
SEQ ID NO: 295 12_7G11 117.2
SEQ ID NO:296 12F5 1.7
SEQ ID NO: 297 12G7 0.6
SEQ ID NO:298 1_2H6 10.4
SEQ ID NO:299 13_12G12 52.4
SEQ ID NO: 300 13_6D10 456.1 233
234
SEQ ID NO: 326 15_10D6 67.1
SEQ ID NO: 327 15_11F9 76.4
SEQ ID NO:328 15 11H3 61.9
SEQ ID NO: 329 15_12A8 48.2
SEQ ID NO: 330 15_12D6 200.8
SEQ ID NO: 331 15_12D8 45.9
SEQ ID NO: 332 15_12D9 42.6
SEQ ID NO: 333 15_3F10 54.6
SEQ ID NO: 334 15_3G11 59.6
SEQ ID NO: 335 15_4F11 89.2
SEQ ID NO: 336 15_4H3 93.3
SEQ ID NO: 337 15_6D3 61.3
SEQ ID NO: 338 15_6G11 41
SEQ ID NO: 339 15_9F6 54.2
SEQ ID NO: 340 15F5 0.2
SEQ ID NO: 341 16A1 3.6
SEQ ID NO: 342 16H3 1.2
SEQ ID NO: 343 17C12 2.3
SEQ ID NO: 344 18D6 8
SEQ ID NO: 345 19C6 2
SEQ ID NO: 346 19D5 1.3
SEQ ID NO: 347 20Al2 2.5
SEQ ID NO: 348 20F2 2
SEQ ID NO: 3 9 2.10E+12 1.5
SEQ ID NO: 350 23H11 3.2 235
236
237
238
SEQ ID NO:426 9_18H2 22.7
SEQ ID NO:427 9_20F12 37.8
SEQ ID NO: 28 9_21C8 23.8
SEQ ID NO:429 9_22B1 35.8
SEQ ID NO: 30 9_23A10 21
SEQ ID NO: 31 9_24F6 58.3
SEQ ID NO: 32 9_4H10 67.5
SEQ ID NO: 433 9_4H8 78.5
SEQ ID NO: 34 9_8H1 44
SEQ ID NO: 435 9_9H7 40
SEQ ID NO: 436 9C6 5.1
SEQ ID NO: 37 9H11 1.7
SEQ ID NO: 438 0_4B10 279
SEQ ID NO: 439 0_5B11 406
SEQ ID NO: 440 0_5B3 367
SEQ ID NO: 441 0_5B4 301
SEQ ID NO: 442 0_5B8 522
SEQ ID NO:443 0_5C4 306
SEQ ID NO: 44 0_5D11 334
SEQ ID NO: 445 0_5D3 660
SEQ ID NO: 46 0_5D7 222
SEQ ID NO: 47 0 6B4 315
SEQ ID NO:448 0_6D10 1177
SEQ ID NO: 49 0_6D11 481
SEQ ID NO: 450 0_6F2 516 239
240
SEQ ID NO: 476 1_3A2 227
SEQ ID NO: 77 1-3D6 64
SEQ ID NO: 478 1_3F3 112
SEQ ID N0^479 1 3H2 183
SEQ ID NO: 4.80 1_4C5 273
SEQ ID NO: 81 1_4D6 98
SEQ ID NO:482 1 4H1 196
SEQ ID NO: 83 1 5H5 419
SEQ ID NO: 484 1_6F12 14
SEQ ID NO:485 1 6H6 259
SEQ ID NO: 486 3_11A10 796.55
SEQ ID NO: 87 3_14F6 753.73
SEQ ID NO: 488 3 15B2 1041.32
SE.Q ID NO; 489 3_6A10 191.64
SEQ ID NO: 490 3_6B1 611.81
SEQ ID NO: 91 3_7F9 667.4
SEQ ID NO: 4 2 3 8G11 991.44
SEQ ID NO:_ 93 4_1B10 770.91
SEQ ID NO:494 5_2B3 567.5
SEQ ID NO: 95 5_2D9 754.36
SEQ TD "NO : 496 5_2íU0 547.22
SEQ ID NO: 497 6_1A11 445.41
S£Q ID )_: 8 6_J.X)5 4 9.16
SEQ ID NO:499 6 1F11 1057.6
SEQ ID NO: 500 6_1F1 698.15 241
KM para AcCoA se mide utilizando el método de espectrometría de masas con muestr.eo repetido durante la reacción. Acetil-coenzima A y glifosato (sales de amonio) se colocan como soluciones de material 50 veces concentrado en una cavidad e una placa de muestra de espe£ xornetri de masas. Las reacciones se inician con la adición de enzima apropiadamente diluida en un regulador volátil, tal como acetato de morfolina o carbonato de amonio, pH 6.8 o 7.7. La muestra se inyecta repetidamente en el instrumento y tasas iniciales se calculan de gráficas de tiempo de retención y 242
área pico. KM se calcula como para glifosato. EJEMPLO 8: SELECCION DE E. COLI TRANSFORMADO Un gen g&t evolucionado (una quimera con un sitio de enlace de ribosoma de .8. líc eniformis natural (AACTGAAGGAGGAATCTC; SEQ ID NO: 515) unido directamente al extremo 5' de la secuencia de codificación GAT) se clonó en el vector de expresión pQE8Q {Qiagen) entre los sitios EcoRI y HindlII, dando pox resultado el l ticado pMAxy.2a.9Q (.Figura 11) . Esto eliminó el dominio His tag del plásmido y retuvo el gen de B-lactamasa confiriendo resistencia a los antibióticos arnpicilina y carbenicilina . pMAXY2190 se electroporó (£ioRad Gene Pulser) en células de E. coli XL1 Blue (Stratagene) . Las células se suspendieron en medio rico en SOC y se dejaron recuperar durante una hora. Las células luego se formaron en pelotillas suavemente, se lavaron una vez con medio mínimo M9 que carece de aminoácidos aromáticos (12.8 g/L de Na2HP04.7 H20, 3.0 g/L de ??2?04, 0.5 g/L de NaCl, 1.0 g/L de NH4C1, glucosa al 0.4%, MgS04 2 mM, CaCl2 0.1 mM, 10 mg/L de tiamina, 10 mg/L de prolina, 30 mg/L de carbenicilina) y se resuspendieron en 20 mi del mismo medio M9. Después del crecimiento durante la noche a 37°C a 250 rpm, volúmenes iguales de células se colocaran en placas en ya sea el medio M9 o en el medio M9 más glifosato 1 mM. El vector pQE80 sin gen gat se introdujo similarmente en células E. coll y se colocó en placas para colonias individuales para comparación.
243
Los resultados se resumen en la Tabla 6 y demuestran claramente que la actividad de GAT permite la selección y el crecimiento de células E. coli transformadas con menos de 1¾ de fondo. Notar que nada de inducción IPTG fue necesaria para la actividad de GAT suficiente para permitir el crecimiento de células transformadas. La transformación se verificó mediante el reaislamiento de pMAXY2190 de las células E. coli cultivadas en la presencia de glifosato.
Tabla 6. Selección de glifosato de pMAXY2190 en E. coli Número de colonias Plásmido M9 - glifosato M9 + glifosato lmM p AXY2190 568 512 PQE80 324 3
EJEMPLO 9: SELECCION DE CELULAS DE PLANTA TRANSFORMADAS La transformación mediada por Agrobacterium de células de planta ocurre a bajas eficiencias. Para permitir la propagación de células transformadas mientras que se inhibe la proliferación de células no transformadas, se necesita un marcador seleccionable . Marcadores antibióticos para kanamicina e higromicina y el gen bar de modificación de herbicida, que destoxifica el compuesto herbicida fosfin.otri.cin, son ejemplos de marcadores sele.ccionabl.es utilizados en plantas (Methods in Molecular Biolog , 1995, 244
49:9-18). Aquí los inventores demuestran que la actividad de GAT sirve como un marcador seleccionable eficiente para la transformación de planta. Un gen gat evolucionado (0_5B8) se clonó entre un promotor de planta (virus de banda de vena de fresa aumentado) y un terminador de ubicuinona y se introdujo en la región de T-DNA del vector binario pMAXY3793 adecuado para la transformación de células de planta vía EHA105 de Agrobacterium tumefaclens como es mostrado en la Figura 12. Un marcador GUS clasificable estuvo presente en el T-DNA para permitir la confirmación de la transformación. Retoños de tabaeo transgén-ieos se generaron utili-zando gliíosa-to como el único agente de selección. Yemas axilares de L. Xanthi de Nicotiana tabacum se subcultivaron en medio MS de mediana intensidad con sucrosa (1.5%) y Gelrite (0.3%) bajo 16-h de luz {35-42 µEins eins 9 s"1, lámparas fluorescentes blancas frías) .a 24 °C cada 2-3 semanas. Hojas jóvenes se extirparon de las plantas después de 2-3 semanas de s bcultivo y se cortaron en segmentos de 3 x 3 mm. EHA105 de A. tumefaciens se inoculó en medio LB y se cultivó durante la noche a una densidad de A600=* 1.0. Células se formaron en pelotillas a 4,000 rpm durante 5 minutos y se resuspendieron en 3 volúmenes de medio de cocultivación líquido compuesto de medio Murashige y Skoog { ?) (pH 5.2) con 2 mg/L de N6-benciladenina (BA) , glucosa al 1% y 400 µ? de acetisiringona . Las piezas de hojas luego se sumergieron 245
completamente en 20 mi de A. tumefaciens en placas Petri de 100 x 25 mm durante 30 min, se secaron con papel filtro en autoclave, luego se colocaron en medio de cocultivación sólido (Gelrite 0.3%) y se incubaron como es descrito J anteriormente. Después de 3 dias de cocultivación, 20-30 segmentos se transfirieron al medio de inducción de retoño basal compuesto de medio sólido MS (pH 5.7) con 2 mg/L de BA, sucrosa al 3%, Gelrite al 0.3%, 0-200 uM de glifosato y 400 ug/ml de Timentin. 0 Después de 3 semanas, los retoños fueron claramente evidentes en las explantaciones colocadas en medios sin glifosato sin considerar la presencia o ausencia del gen gat. La transferencia de T-DNA de ambas construcciones se confirmó mediante el manchado histoquimico GUS de hojas de retoños -3 regenerados. Concent ciones de glifosato mayores que 20 uM inhibieron completamente cualquier formación de retoño de las explantaciones que carecen de un gen gat. Las explantaciones infectadas con A. tumefaciens con la construcción gat regeneraron retoños a concentraciones 0 de glifosato de hasta 200 uM (el nivel más alto probado) . La transformación se confirmó mediante el manchado histoquimico GUS y mediante la amplificación del fragmento de PCR del gen gat utilizando c-eb~ador.es que recocen al promotor y las regiones 3' . Los resultados se resumen en la 5 Tabla 7.
246
Tabla 7. Regeneración de retoño de tabaco con selección glifosato
EJEMPLO 10; SELECCION DE GLIFOSATO DE LAS CELULAS DE LEVADURA TRANSFORMADAS Los marcadores de selección para la transformación de levadura son usualmente genes auxotrófieos que permiten el crecimien o de c.élujas tí.ajnsfpomadas en un medio que carece del aminoácido o nucleótido especifico. Debido a que Saccharomyces cerevisiae es sensible a glifosato, GAT también s-e puede utilizar como un marcador seleccionable . Para demostrar esto, un gen gat evolucionado (0_6D10) es clonado del vector pMAXY3793 de T-DNA (como es mostrado en el Ejemplo 9) como un fragmento PstI-Clal que contiene la región de codificación entera y ligado en p424TEF digerido de PstI-Clal (Gene, 1995, 156:119-122) como es mostrado en la Figura 13. Este plásmido contiene un origen de E. coli de replicación y un gen que confiere resistencia a carbenicilina asi como un marcador seleccionable auxótrofo de triptofano, TRP1 para la transformación de levadura.
247
La construcción que contiene gat es transformada en XL1 Blue de E. coll (Statagene) y colocada en placas en medio de agar de carbenicilina LB (50 ug/ml) . DNA de plásmido es preparado y utilizado para transformar la cepa YPH499 de levadura (Stratagene) utilizando un kit de transformación (BiolOl) . Cantidades iguales de células transformadas son colocadas en placas en medio de CSM-YNB-glucosa (BiolOl) que carece de todos los aminoácidos aromáticos ( trip.tofano, tirosina y fenilalanina) con glifosato adicionado. Por comparación, p424TEF que carece del gen gat también es introducido en YPH499 y colocado en placas como es descrito. Los resultados demuestran que la actividad de GAT funcionará como un marcador selecciónatele eficiente. La presencia del vector que contiene gat en colonias seleccionadas de glifosato se puede confirmar por reaislamiento del plásmido y el .análisis de digestión de restricción. Mientras que la invención anterior se ha descrito en algún detalle para propósitos de claridad y entendimiento, será claro para un experto en la técnica de una lectura de esta descripción que varios cambios en la forma y detalle se pueden hacer sin apartarse del alcance real de la invención. Por ejemplo, todas las técnicas, métodos, composiciones, aparatos y sistemas de&critos *n lo anterior se pueden utilizar en varias combinaciones. La invención se propone para incluir todos los métodos y reactivos descritos en la 248
presente, así como todos los polinucleótidos, polipéptidos, células, organismos, plantas, cultivos, etc., que son los productos de estos métodos y reactivos novedosos . Todas las publicaciones, patentes, solicitudes de patente, u otros documentos citados en esta solicitud son incorporados por referencia en su totalidad para todos los propósitos al . mismo grado como si cada publicación individual, patente, solicitud de patente u otro documento fuera individualmente indicado que es incorporado por referencia para todos los propósitos.
249
250
GATGTATAAGAAATTGGCATAA
SEQIDNO:5 NH5-2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC
TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
OCGTI CACCTCGGTGGATAT ACCAGGGCAAGCTGATC
AGCATCGCTICCTI CATAAAGCCGAACAT CAGAGCTT
GAGGGCGAAGAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGATACCGTGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATGOXtAAGAGCTTCT CGGAAAAAOG GGGCAGACCTTTTATGOTGCAATGCCAGGACATCTGTa AGCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACATACCQCCGATCGGACCTCATATITr GATGTATAAGAAATTGACGTAA
SEQIDNO:6 ST401 MIEV PINAEDTYEIRHRIUtf^^ GAT LGGYYRGKXJSIA5FH AEHSEI^GEEQYQIJG ATLEOY REQKAGSTL1RHAFF ,f . GADLLWCNARTSVSGYYE JFSE< 3EVYDlPnGPHILMY LT SEQH)NO:7 B6GAT MIEVKPINAEDTYEBtilRIL^ LGGYYRDRIJSIASFHQAEHSELEGQKQYQLRGMATLEGY REQ-^GSTURHAEELIJU-KOADli CNARTSVSGYY^ 3FSEOGGVYDIPPIGPHlIJvmXLT SEQIDNO:8 DS3 GAT MIEVKPINAEDTYHltfJR-li^ I KYY¾GKLJSIASFHNAEHSEI£GQKQYQLRGMA TLEG YllEQ AGSTIJRHAEELIJU G ADLLWCN ARIS V SG YYEKLGFSEOGGTYDIPPIGPmMYKKlA SEQIDNO:9 NHA-2 MffiVKPINAEDTYEIRHRIIJU'NQPL^ GAT LGGYYRGKIJSIASP?NAEH5EIJEGQKQYQI?GMATLEOY REQ A GSTLI HAEELJJKKGADL1-WCN AR1S VSG YYE L QUSEQGQIYDIPPIGPHIL Y l A SEQID H5-2 MIE VKPI AEDTYEIR HBIIJtf NQPLEACMY TDLIXK5 AFH NO.10 GAT I JGYYQG l-ISlASFHKAEHSELEGEEQYQUiGMATLEGY ????-Arvm ????????? I ???????G T wrMARTsvsnwro: LGKF^EVYDIPPIGPHrLMY KLT SEQID 13_10P6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:ll TGAGATCAGG<^CCGCATTCTCCGGCCGAAT GCCGC TGGAAGCATGCAAGTATGAAA(XGAT1 GCTCAGGGGT ACG TCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGC ATCGCCTCCTTTC ATC AAGCCG AAC ATCC AGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGATACCXnOAGCAAAAAGCGGGAAGCAC GCTCATXGCCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCGOACeJ 1 ?? ATGOTOCAACGCC AQGACGTCTOCG AGCGGGTACTATAAAAAGCTCXKKITCAGCGAACAGGG
CGAAGTX^ACGACATACCa XX7rCXK3ACCTCATArrTT GATGTATAAGAAATTGACGTAA
SEQID 13_12G6 ATOATTGAAGTCA CCAATAAACGCGGAAGATACGTA NO:12 raAGATCAGGGACCOCAT CTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTTGCTCAGGGGT
GCGTT CACCTCGGTGGATATTACCXSGGGCA^ AGCATCGCCTCCTTTCAT AAGCCX5AACATCCAGAGCTT 251
GAAOOCCAAAGACAGTATCAGCTGAGAGaQATGGCGA CAC TCJAAGGGTACCGTGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTrCGGAAAAAGGG GGCAGACCTCTTATOGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCITCAGCGAACAGGG
GAAGTCrACGACATACCGCCGACTGGG XCCATATITrG ATGTATAAGAAATTGACATAA
SEQ ID 14J2A5 ATGATTGAAGTCAAACCAATAAACOCGGAAGATACGTA NO: 13 TGAGATCAGGCACCGCATrCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAOTATGAAACCGATTrGCTCGGGAGC ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCC 1 "1 TAATC AAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGTOAGCAAAAAGCGGGAAGCAC
GCTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCGGACCrillATGGTGCAACGCCAGGACGTCXGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACACACCGCCGGTCGGACCTCATATnT G ATGTAT AAG AAATTGACG AA
SEQ ID 14J2C1 ATGATrGAAGTGAAACC A AT A A ACGCGG AAG ATACGTA NO: 14 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGOGT GeGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGGTC AGCATCGCTTCC TTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGaOATOGCGA CACTCGAAGOATACCGTGAGCAAAAAGCGGGCAOTACG (n ATCCOCCATGCCGAAGAGCTTCTTCGGAAAAAAGG CGCGGAC I n ATGGTGCAACGCCAÜGACATCTGCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACACACCGCCGACTGGGCCCCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 14^2F11 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 15 TG AGATCAGGC ACCGC ATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGT1 C AC 1 GGTGG AT ATTACCGGGGC AAGCTGGTC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG C rATCCOCCATGCCGAAGCGCTTCTTCGGAAAAAOGG GGCAGACCTCTTATGGTGCAACGCGAGGAGATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACACACCGCCGGCCGGACCCCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID CHTMERA ATGATTOAAOTCAAACCAATAAACGCGOAAGATACOTA NO: 16 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCÜATrTGCTCAGGGGl' GCGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTTC-ATCAAGCCGA^ GAAG CCAAAAACAGTATCAOCTOAGAGQGATGGCGA
CACTTGAAGOATACCGCGAGCAAAAAGCGGGCAGTACG 252
CTTATCCGCCATQCCGAAGAOC rCITCGGAAAAAaOG OOCAGACCrrnATGOTGCAACGCCAQGACATCTGCOA aCGGGTACTATAAAAAGCrCGOCTTCAGCGAACAGGGC GAAGTCTACGACACACCGCCGGTCGGA(XTCATATnTG ATGTATAAOAAATTGACGTAA
SEQ ID 10_12D7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 17 TGAGATCAGGCACCGNATTCTCCGGCCGAATCAGCCaC TGGAAGCATGCAAGTATGAAACCGATT GCTCGGGGGC
ACGCITCACCTCGGTGOA ATTACCGGGGCAAGCTGAT
CAGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATaaCG ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCA
CGCrCATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAG GGGGCAGACCTCTTATGGTGCAACGCCAGGACATCTaC GAGCGGGTAC ATAAAAAGCTCGGCTTCAGCGAACAAG
GCOAAGTCTACGACATACCGCCGACCGGACCCCATATT
TTGATGTATAAGAAATTGACGTAA
SEQ ID 1ÍL15F4 ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO: 18 TQAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATOTATGAAACCGATITGCTCAGGGGT
ACm'l'l A(X CGGTGGGTATTACCr XTGOAAG€TGGTC AOCATCGCTTCCTT CATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCAC
GCrcATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG GGGCAGACCTTrrATGGTGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTrcAGCGAACAAaG CGGGOTCTACGACATACCtXX¾KnX^KJA< TCATATm GATGTATAAGAAATTGACGTAA
SEQ ID 10_17D1 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 19 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TXKJAAGCA'rGCAAGTATGAAACCGATTTGCrCOGGGGC ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTrCATCAAGCCGAACATCCAaAGCTT GAAGGCCAAAAACAGTATCAGCTaAGAGGGATGGCGA CAC TGAAGGGTACCGCÍ3AGCAAAAAGCGGGCAGTACG CTTATCCGCCATGCCGAAGAGC rcrTCGGAAAAAGGG CGCAGAC 1 ' ? ' 1 ATGGTGC A ACGCC A GG AC ATCTGCGA aCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGGC GAAGTCTACGACACACCGCCGGTCGGACCTCATATTTTG
ATGTATAAOAAATTGACGTAA
SEQ ID 10_17F6 ATGA1TGAAGTCAAA CC AATAAACGCGGAAGA ACOTA NO:20 TCAGATCAGGCACXX ^TT rrcCGGCCaAATCAGCCGC TGGAAGCATGCAAGTATOAAACCGATT GCTCOGGGGC
ACGTTTCA(XTCGGTOGATArTACCGGGOCAAGCTGGTC AGCATCG I CCI TCATCAAGCCGAACATTCAGACKJrT G AAG<}<X' AAA A A(^GTATC AGCTG AG AGGG ATGGCG A CACITO AAGAGTACCXXIGAGCAAAAAGCGGGAAGCAC
GC TATCCGCCATGCCOAAGAGCTTCTTCGGAAAAAGG
GCGCAGACCTTTTATGGTGCAACGCCACiOACATCTGCG 253
AGCGGGTACTATAAAAAGCrcOOCT CAGCGAACAGQG CGAAGTCTACGACATACCOCCGGTCGaACCTCATATnT GATGTATAAGAAATTGACGTAA
SEQ DD I0_I8G9 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA N0:21 TGAGATCAGGCACCGCATTCTCCOGCCGAATCAGCCGC GGAAGCATOCAAGTATGAAACTGATTTGCTCGGTGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGG C
AGCATGGCTTCCTrrCATCAAGCCGAACATTCAQAG IT GAAGGCCAAAAACAGTATCAGC GAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG
GGGCAGACCTCTTATGO GCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGGGGTCTACGACATACCG< CK5TCGGACCTCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 10_1H3 ATOATIOAAGTCAAACCAATAAACGCGGAGGATACGTA NO:22 TGAGATCAGGCACCGCATTCTCCGGCCOAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCGGTGGATATTATCGGGGCAAGCTGGTC
AGCATCG<nTCCTTTCATCAAGCCGAACATCCAGAGCTT GAAGGCCGAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG CrTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAQG CGCGGAC l llATOGTGCAACG ^AGGA ATCTGCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGACCGGACCCCATATTTr GATGTATAAGAAATTGACATAA
SEQ ID 10_20D10 ATGATTGAAGTCAAACCAATAAACaCOGAAGATACGTA
NO:23 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGAl TGei-CGGGGGC ACGCTTCACCTCCrGTGGATArTACCGGGGCAAGCTGAT CAGCATCGCCT X TTCATX AAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAQCTGAGAGOGATGGCG
ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGCAGTAC
OCTTATCCGCCATGCCX3AAGAGCTTX7I CXK3AAAAAGG GGGCAGACCTTTTATCGTGCAACGCCAGGAG^TCroCG AGCGGCTACTATAAAAAGCTCGGCTTCAGCOAACAAGG
CGGGGTCTACGACATACCG<XGGTCGGACCTCATATTrT GATGTATAAQAAATTGACGTAA
SEQ ID 10J23F2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:24 TGAOATX1AGGCACCGCATACTCCGGCCGAATCAGCCGC TTGAAGCATGTATOTATOAAACCGATTTGCTCGGaGGC ACGTITCACCTC Kj GGATATTACCGGGGCAAGCTGGTC AGCATCGC1TCCTTTCATCAAGCCGAACACGCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGATACCGTOAGCAAAAAGCGGGCAGTACG
CTTATCCGCCA1X3CCGAAGAGCTTCTTCGGAAAAAGGG GGCAGACCTCTTATOGTGCAACGCCAGGACATCrGCGA GCGGGTACTATAAAAAG rCGGCTTCAGCGAACAGGGC G A AOT TACGACACACCGC€GGTCGGACCTCATATTTTG 254
ATGTATAAGAAATTGACGTAA
SEQ ID 1QJB8 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:25 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCOC TGGAAGCATGCAAOTATGAAACTGATTTGCTCGGGGGT
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTC IllCATCAAGCCGAACATCCAGAG TT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAOCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAG TTCTTCGGAAAAAGGG
GGCAGACCTCTTATGGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCrACGACACACCGCCGGTCGGACCTCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 10 _2C7 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO-.26 TGAGATCAGGCACCGCATTC CCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATOAAACCGATTTGCTCAGGGGT
G XJTTTCACCTCGOCGGATATTACCGGGGCAAGCTGAT
CAGCATCGCCTCri l'rCATCAAGCCGAACA'lX AGAGCT TGAAGGCCAAAAACAQTATCAGCTGAGAGGQATGGCG
ACACTCGAAGGGTACCGTGAGCAAAAAGCGGGAAQCA
CGCTCATCCGCCAI XXOAAGAGCTTCTTCGGAAAAAA
GGCGCGGACC ITRATGGTGCAACGCCAGGACATCTGC
GAGCGGOTACTATAAAAAGCTCGGCTTCAOCGAACAGG
GCGAAOTCTACGACACACCGCCGGTCGGACCTCATATT
TTGATGTATAAGAAATTOACGTAA
SEQ ID KL3G5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:27 TGAGATCAOGCACCGCATTCTCCGGCCXjAATCAGCCGC TGGAAOCATGCAAGTATGAAACCGArrTGCTCGGGOGC ACGTTTCACCTCOGT KJATATTACGGGGGCAAGCrGGTC AGCATCXX rCCTrTCATCAAGCCOAACATCCAGAGCrT GAAOGCCAAAAACAGTATCAGCTGAOAGGOATGGCGA
CACTrGAAGGGTACCGCGAGCAAAAAGCGGGAAGTAC GCTTATCCGCCAT rcCGAAGAGCTIXTnXX GGGCAGACCTTTT ATGGTG AACGCC A GG AC ATCTGCG AGCGGGTAC ATAAAAAÜCIX;GGCTTCAGCGAACAOGG CGAAGTCTACOACATACCGCCGACCGGACCCCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 10.4H7 ATGArrGAAGTCAAACCGATAAACGCGGAAGATACGTA NO:28 TOAGATCAGGCACCGGATT TCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTK- TCGGGOGC ACGTTTCA(X CGGTGGATATTA CGGG<JCAAGCTGGTC AGCATCOCTTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACACTA'ÍX:AGCTGAGAGGGATGGCGA CACTTXJAAGGGTACCGTGAGCAAAAAGCGGGCAOTACG TTATCCGCCATXXXX5AAGAOCTTCTTCGGAAAAAGGG GJCAGACCTTTTATGGTCK AACGCCAGOACATCTGCGA
GCGGGTACTATAAAAAG RCGGCTTCAGCGAACAGGGC
GAAGTCTACXJACATACCGCCGACAKJACCCCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 10_6D11 ATGATTGAAGTCAAACCAATAAACaCGGAAGATACGTA 255
NO:29 TCAGATCAGGCACCGCATTUTCCGGCCOAATGAGCCGC TGGAAGCATOCAAGTATOAAACCGATTTGCTCGGQGGC
ACGCT CACCTCGGTGGATATTACCGGGGCAAGCTGGT
CAGCATCGCTTCCTTTCATCAAGCCGAACATCCAOAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACGCTTGAAGGGTACCGTGAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCCGAAGAGCTTCTTCQGAAAAAGG
GGGCAGACCTTTTATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTC ACGACATACCGCCGGTCGGACCTCATATTTT GATGTATAAGAAATTGACGTAA
SEQ 1D 10 &C6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA N0:30 TGAGATCAGGCACCGCATTC CCGGCCOAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTXJCTCGGGGGT
GCG ITCACCTCGGTGGATATTACCGGGGCAAGCTGA C
AGCATCGCCTCC I IXJATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA CACTCGAAGGATACCGCGAGCAAAAAGCGGGAAGTAC GCTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAG GCCK!X3GACCTTI ATGGTGCAACGCCA0GAGATC1XKX3 AGCGGGTAC ATAAAAAGCTCGGCTrCAGCGAACAAGG CGGGGTC ACGACATACCG^GGTCGGACCTCATATnT GATGTATAAGAAATTGACGTAA
SEQ ID UC3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:31 TGAGATCAGGCACCOCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCrCGGTGGATATTACCAGGGCAAGCTGATC AGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAA A AACAGTATC AGCTG AG AGGG ATGGCGA
CGCTTGAAGGG ACCGCGAGCAAAAAGCGGGAAGTAC
GC TATCCGCCATC !CGAAGAGCTTCrTCGGAAAAAGG GGGCAGAC I r ATGGTGCAACGCCAOGACATCrGTG AG<X}C JTACTATAAAAAOCTCGGCTTCAGCGAACAAGG CGGGGTCTACGATATACCGCCGATXXX3ACCTCATATTTT GATGTATAAGAAATTGACATAA
SEQ I 11G3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA N032 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCGTGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGCGGATATTACCAGGGCAAGCTGAT
CAGCATCGCTTCCTTTCATCAAGCCGAACATTCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACGCTTOAAGGOTACCGCGAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCCGAAGAGCTTOTCGGAAAAAGG
GOGCAGACCTTTrATGGTGCAACGCCAGGACA CTOCO AGCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAAGG
CGGGGTCTACOATATACCGCCGATCGGACC CATATTTT
GATOTATAAOAAAITGGCATAA
SEQ ID 11H3 TGATTGAAG CAAACCAATAAACGCGGAAGATACGTA
NO.-33 TGAGATCAGGCACCG ATACTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT 256
257
OAAQGCCAAAAACAO ATCAGCTQAOAOGGATGQCOA
CACTTGAAOAGTACCQCGAGCAAAAAGCGGGAAGCAC
GCrCATCCGCCATaCCGAAGAGCTTCTTCGGAAAAAGG GGGCAGACCTTTTATGGTOCAACGCCAGGACA CTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACGCACCGCCGACCGGACC CATATITT
GATGTATAAGAAATTGACGTAA
SEQ ID 12J5A10 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:38 TGAGATCAGGCACCGCATTCTCCGOCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCAC rCGGCGGATATTACCGGGOCAAGCTGG CACJCATCGCCTCCTTTCATCAAGCCGAACATCCAGAG T
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCO
ACACTTOAAGGATACCGTGAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCA O GAAGAGCT CT CGGAAAAAGG
GGGCAGACX TTTATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACrATAAAAAGCTCGGCTTCAGCGAACAAGG CGGGGTCTACGACATACCGCCGGTCGGACC CATATTn' GATGTATAAGAAATTGACGTAA
SEQ ID 12_6D1 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:39 TGAGATCAGGCACCGCATTCTCCOGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGOATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCraAGAGGGATGGCGA CACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCAC
GCTCA.TCCGCCATGCCGAAGACH7I C TCGGAAAAAGa GGGCAGACCTTTTATOGTOCAACGCCAGGACATCTGCO
AGCGGGTACTATA AAAAGCTCGGCTTCAGCGAACAAGG
CGGGGTCTACGACATACCGCCTGTCGGACC CATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 12.6F9 ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA N0: 0 TGAGATCAOGCACCGCATT TC XJGCCGAATCAGCCGC TTGAAGCATGTAAOTATGAAACCGATTTOCTCGGGGGT
ACGTTTCACC CC^TOGATATTACCGTiGGCAAGCrcATC AGCATCGCCTa nTCATX^AGCCGAACATCCAGAGCTT GAACKJCCAAAAACAGTTATCAGCTGAGACWGATGGCaA CACTCGAAGGATACCGCGAGCAAAAAG XK3GAAGCAC GCTCATCCGCCATGCCGAAGAGCrTCrTCOGAAAAAGG GGGCAGACC TTTATGGTGCAACGC AGGACATCTGCG
AGCGGCTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTXJTACGACATACCGCCGACCGGA(X:CCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 12J5H6 ATOATTOAAGTCAAACCAATAAACGCGGAAGATACGTA N0:41 TCAGATCAGGCACCGCATACTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATOAAACXX5ATTTGCTCGGGGGC ACGTTTCAC rcGGTaGATATrACXJGGGG AAO TGGTC AG^ATX CC CCTTTCACCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGTGAGCAAAAAGCGGGCAGTACG 258
CTTATCCGCCATGCCGAAGCG T1 C 11 CGGA AAAAAGG CGCGGAC l'1'? ATGGTGCAACGCCAGGACATCTGCGA GCaGGTACTATAAAAAOCr X3GCTTCAGCGAACAGaGC GAAGTCTACGACATAC X.<XX3ACCGGACCCCATATnT GATGTATAAGAAATTGACATAA
SEQ ID 12J7D6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACOTA NO:42 TGAGATCAOGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAAC GATTTOCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGOTACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAOCTTCTTCGGAAAAAGGG
GGCAGACCTTITATGGTGCAACGCCAGGACATC GCGA
GCGGGTACTATAAAAAGCrcGGCT CAGCGAACAAOGC GGGGTCTACGACATACCGCCGACCGGACCCCATATnT GATGTATAAGAAATTGACGTAA
SEQ ID 12_7G11 ATGATTGAAG CAAACCAATAAACOCGGAAGATACGTA NO:43 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGOAAGCATGCAAGTATGAAACCaATTTGCTCGGGGGC ACGTTTCACCTCGGTOGATATTACCCKjGGCAAGCTGATC AGCATCGCCTCC TTCATCAAGCCGAACATTCAGAG TT
GAAGGCCAAAAACAGTATCAGCTGAGAGOGATGGCGA
CACTTGAAGGATACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGOTCTTCGGAAAAAGGG
GGCAGACCTTn'ATGGTGCAACGCCAGGACATCrOCGA GCGGOTAC ATAAAAAGCTCGGCITCAGCGAACAGGGC
GAAGTCrACGACACACCGCCGGTCGGACCi ATATTTTG ATCTATAAGAAA1TGACGTAA SEQ ID 12F5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO.-44 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
ACGTrrcACCTCGGTGGATATTACCAGGGCAAGCTGATC AGCATCG< I CCrTTCATAAAGCCGAACATTCAGAGCTT GAGGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CAC TGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG
C TATCCGCCATGCCGAAGAGCTTC TCGGAAAAAGGG
GGCAGACCTTTTATCKJrGCAATGCCAGOACATCrGTGA GCGOGTACrATAAAAAGCTCGGCT CAOCGAACAAGGC GGGATCTACGACATAC03CCGATCGGAC TCATATTTTG ATGTATAAGAAATTGACG AA
SEQ ID 12G7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:45 TGAGATGAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT
ACGTTTGACCTCGGTGOATATTACCAGGGCAAGCTGATC
AQCATCGC TCCTT CATAAAGCCGAACATTCAGAQCTT
GAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGATACCGTGAGCAAAAAGCGGGAAGCAC
AC CATCCOCCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCAGAC n'l'l ATGGTGCAACGCCAGOACATCTGTG 259
AOCGGGTACTATAAAAAGCKXK)CITCAOCOAACAGOa CGAAOTCTACOACATACCGCCGATCOOACC CATATITT GATGTATAAGAAATTGACGTAA
SEQ ) 1.2H6 ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO:46 TGAGATCAGGCACCGCATTCT XX3GCC0AATCAGCC K: TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
CKGTTTCACCTCQGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCIT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACrTGAAGGGTACCOCGAGCAAAAAGCGGGAAGTAC GCTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG
GGGCAGACCl 11 1 ATGGTGCAACGCCAGGACATCTGCO AGCGGGTACTATAAAAAGCTCGGCTrCAQCGAACAAGG CGGGGTCTACGACATACCGCCGATXX 3ACCrCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 13_12012 ATGATTXJAAGTCAAACCAATAAACGCGGAAGATACGTA NO:47 TGAGATCAOGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATOAAACCGATTTGCTCGGGGOT
ACGTTTCACC CGGTOGATATrACCGGGGCAAGCTGATC AGCATCGCTTCCTTTAATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAQCAAAAAGCGGGAAGTAC
GCTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCGGACCTTTTATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTAT AAAAAGCTCGGCTTC A GCG AACAGOG
CGAAGTX7TACGACATACCG XXK3TCGGACCTCATATTTT GATGC AT A AG AAATTG ACGTA A
SKQ ED 13__6D10 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA N0.48 TGAGATCAGGCACCUCArrcrCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTCGCrCGGAGGC ACGTTTCACX rCGGTGGATATTACCGGGGCAAGCTaATC AGCATCGCTTCCTTTAATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAAGAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAaaGTACCOTOAGCAAAAAGCGGGAAGCAC GCTCATCCX3CCATGCCGAAGAGCTTCTTCGGAAAAAGG GGGCAGACC CTTATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACACACCGCTOGTCOGA( CATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 13_7A7 ATGATCGAAGTCAAACCAATAAACGCGGAAGATACGTA NCK49 TGAGATCAG<:i ACCaCATTCÍX:caOCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCAGGAGT
GCGTTrCA(X CGGCGGATATTACCGGGGCAAGCTGAT CAGCATCGCCTCCTTTCACX^AAGCCGAACATCCAGAGCT TOAAGGCCAAAAACAGTATCAGCTGAGGGGGATGGCG
ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGTA
CGCTTAT XXK ATGC X AAGAGCT CTTCGGAAAAAG
GGCiGCAGACCll llATGG aC^CC CA >ACATCTOC GAGCGGGTACTATAAAAAG rCGGCTTCAGCGAACAGG GCGAAGTCTACGACACACCGCCGGTXX3GACCTCATATT 260
TTGATOTATAAGAAATTGACGTAA
SEQ ID 13_7B12 ATG ATTG AAGTC AAACC AAT AAACGCGGAAGATACGT A
NO:50 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATOCAAGTATGAAACCGATTTGCTCGGGAGC
ACGTTTCACC CGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCrCCTTTCATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGATACCGCGAGCAAAAAGCGGGCAGTAC
GCITATCCGfXATOCCGAAGAGCI CI CGGAAAAAAG GCGCGGACX I T GTGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACATACCOCCGACTGGGCCCCATA'rri'l' GATGTATAAGAAGTTGACGTAA
SEQ ID 13.7C1 ATGATTGAAGTCAAACCAATAAATGCGGAAGATACGTA NO:51 TGAGATCAGGCACCGCATACrCCGGCCGAA CAGCCGC TTGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCrcCTTTCATCAAGCCGAACATCCAGAACTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
C ACTTGAAGGATACCGTGAGC AAAA AGCGGGTAGTACG
CTTATCCGCCATGCCGAAGAGCrrCTTCGGAAAAAAGG CGCGG ACCmTOTGGTOr ACGCCAGGACATCTGC^ A GAGGGTACTATAAAAAOCTCGGCTTCAGCGAACAAG 7iC GAAGTCrACGACATACGGCCGACrGGOXCCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 13_8G6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:52 TGAGATCAOGCACCGC^TTCrCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGAT CGCTCGGOGGC
AOilTlCACCraSGCGGATATTACXXaGGGCAAGCraAT CAGCATCGCTTCCmAATCAAGCCaAACATCCAaAGCr TGAAGGTCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACO
CTTATXXXKX:ATGCCGAAGAGCTrCTTCGGAAAAAAGG CXKXjGACC nATGGTOCAACGCCAGGACQTCTGCGA GCGGGTACTATAAAAAGCTCGGCrTCAGCGAACAAGGC GGGGTCTACOACATACCG<XX3GTCGGACC CATATnTG ATGTATAAGAAATTGACGTAA
SEQ ID 13JÍF6 ATGATTGAAGTCAAACCAATAAACX)CGGAAGATACGTA NO:53 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TOaAAGCATOCAAGTATGAAACCOATCT K^rraGGGGC ACGTTTCACCTAGGTGGATATTACCGGGGCAAGC OAT
CAGCATCGCCTCCI rcATCAAGCCGAACATCCAGAGCT TGAAOGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGAOTACCGCGAGCAAAAAGCGGOAAGTA
CGCTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAG
GGGCiCAGACCITITATGGTGCAACGCCAGGACATCTGC GAGCGGGTACTATAAAAAGCTCGGC TCAGCOAACAGG
GCGAAGTCTACGACATACCGCCGGTCGGACCTCATATTT
TGATGTATAAGAAATTGACGTAA
SEQ ID 14_10C9 ATGATTOAAGTCAAACCAATAAACGCGGAAGATACGTA 2 1
NO:54 TQAGATCAGGCACCQCATACTCCGGCCGAATCAQCCGC T AG A AGC ATGC A AGT ATG AAACCGATTTGCTC AGGGGT
OCGTTTCACCTCGGTGGATATTACCGOGGCAAGCTGATC
AGCATCGCTTC ITTCA CAAGCTGAACATCCAGAGCTr G AAGGCC AAAAAC AGT ATC AGCTG AGAGGG ATGGCGA
CACTTGAAGAGTACCGCGAGCAAAAAGCX 3GAAGTAC GCTCATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG
GGGCAGACC1111ATOGTG€AACGCCAGGACGTCTGCG AaCGGGTACTATAAAAAGCTCGGCTrCAGCGAACAGGG CGAAGTCTACGACACACCGCCGGTCGGACCTCATATl l'l GATGTATAAGAAGTTGACGTAA
SEQ ID 14_10H3 ATGATTGAAGTCAAACCAATAAACGCOGAAGATACGTA NO:55 TGAGATCAGGCACCGCATTCTCCGGCCXJAATCAGCCGC TGGAAGCATGCAAGTATGAAACC JATTTGCTCAGGGGT
QCm TCACCTCGGCGGATATTACCGGGGCAAGCTGGT CAGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCr TGAAGGCCAAAAACAGTATCAGCraAGAGGGATGGCG ACA I GAAGAGTACCGCGAGCAAAAAGCGGOAAGCA
CGCrcATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAA GGCGCAQACCTI'rrATGUiÜCAA UC ACjüACATCTGC GAGCGGGTAC ATAAAAAGCTCGGCTTCAOCGAACAGG
GCGAAGTCTACGACACACCGCCGGTCGGACCTCATATT
TTGATGTATAAGAAGTTGACGTAA
SEQ ID 14_10H ATGATTGAAGTCAAACCAATAAACGCGOAAGATACGTA NO:56 TGAGATCAGGCACCGCATACTCCGGCCGAATCAGCCGC TGGAAGCATOCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCAC TCGGTGGATATTACCGGGGCAAGCTGGTC Af^ATCQCCTCCTTTCATCAAOCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGC GAGAGGGATGOCGA
CACTTGAAGGATACCGTGAQCAAAAAGCGGGCAGTAC» CTTATCCGCCATGCCGAAGAGCTTCTTCGOAAAAAAGG
CGCGGACCTTI GTGGTGCAACGCCAGGACATC GCGA
GCGGGTACTATAAAAAGCTCX3GCTTCAGCGAACAGGGC GAAGTX^ACGACACACCGCCGGTCGGACCTCATATTTTG ATGT ATAAGAAATTGAC AT AA
SEQ ID 14_11C2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:57 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATITGCTCGGGAGC
ACGTTTCACCTCGGCGGATATTACCGGOGCAAOCTGGT (^GCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCT TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGCAGTAC
GCTTATCCX3(XATGCCGAAGCGCTIX7rTCGGAAAAAGG GGGCAGACC ITrATGGTGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAG rCGGCTTCAGCGAACAGGG CGAA(3TCTACGACACACCGCCaACCGOACCCCATATTT TGATGTATAAGAAATTGACGTAA
SEQ ID 14_12D8 ATOATrGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:58 TGAGATCAGGCACCGCATTCTCCGGOCGAATCAQCCOC TTGAAGCA G AAGTATGAAACCGATTTOCTCGGGGGT 262
ACGTTTCACCrcOOCQOATATrACCOOGQCAAOCraGT CAGCATCOCXJTC ITrCATCAAOCCOAACATCCAOAGCr TGAAGOCCAAAAACAOTATCAOCTOAOAGGOATGGCO
ACACTTGAAGGATACCGTGAGCAAAAAGCTGGCAGTAC
GCTTATCCGCCATG CGAAGCGCTTCTTCGGAAAAAAG
GCGCGGACLTITIGTGGTGCAACG^AGGACATCTGCG AGCGGCTACTATAAAAAGCTCGGCITCAGGGAACAAGG
CGGGGTCTACGACATACCGCC GTCGGACCTCATArTTT GATGTAT A A O AAATTG ACGT AA
SEQ ID 14_12H6 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACG A NO:59 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT
GOTITrcACCTCGG GGATATTACCGGGGCAAGCrGATC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCrüAüAGGGATGGCGA CACrt GAAGAGTACCGCGAGCAAAAAGCGGGCAGTACG CTrATCCGGCATGCCGAAGAGCTrCTTCGGAAAAAAGO CGCGGACCTTTTGTGG GGAACXKXAGGACG CTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTUTACGACATACCGCCGAC GGGCCCCATATTTTO
ATGTATAAGAAATTGACGTAA
SEQ ID -4J2B6 ATGATTGAAGTCAAACCAATAAATGCGGAAGATACGTA NO:60 TGAGA'rCAGGCACCGCAT CTCCGGCCGAATCAGCCGC TGG AAGC ATGC A AG ATG A A ACCG AITrGCTCGGGGG ACGTITCA<XTCGG QGATATrACCGGGGCAAGCTOATC AGCATCGCTrCCTTTAATCAAGCCGAACA CCAQAGCTT GAAGGCCAAAAACAGTATCAOCTGAGAGGGATGGCGA
CAC CGAAGGATACCGTOAGCAAAAAGOGGGCAGTACG
CTTATCCG< ATGCCGAAGAGCnTC rCGGAAAAAAGG CGCGGACCTITrATOGrrGCAACGCCAGGACGTCTGCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGGC
GGGGTCTACGACATACCGCCGG CGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 14_2G11 ATGATTGAAGTCAAACCAATAAATGCGGAAGATACGTA N0:61 TGAGATCAGGCA(X;OCATTCTCa¾ :CGAATCAGCCGC TG AAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGGT(X}ATATrACCG K3GCAAaCTGGTC AGCATCGCCTCCTTT(^TCAAGCCGAACATCCAGAGCTT GAAGGC LAAAAAGAGTATCAGCTGAOAGGGATGGCGA
CACTCGAAGGGTACCGTGAGCAAAAAGCGGGCAGTACG
CTTATCCG<XATGCCGAAGAGC rrC TCGGAAAAAAGG COCGGAC rri'IGTGGlTJCAACGCCAGGACATCTGCGA GTGGGTACTATAAAAAaCTCGGCrrCAGCGAACAGGGC GAAGTCTACGACATACCX3CCGACT }CCCCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 14_3B2 ATGATTGAAGTCAAACCAATAAACGCGGAAOATACGTA NO:62 TGAGATCAGGCAíXGCArrCTCAGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGGTC
AGCATCGCCTOT TCATCAGGCCGAACATCX^AGAGCTT 263
GAAGGCCAAAAACAOTATCAOCrGAGAOaaA OGCQA CACTTGAAGOATACCGTGAGCAAAAAGCGGGAAGCAC
GCITATCCGCCATGCCGAAGCGCTTCTTCOGAAAAAAO
GCGCGGACCTTTTATGGTGCAACOCCAGOACATCrOCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGGGGTCTACGAC ATACCGCCGGCCGGACCTCATA 1 1 IT GATGTATAAGAAATTOACGTAA
SEQ ID 14_4H8 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA
NO:63 TGAGArcAGGCACCGCATTCTCCGGCCGAATCAOCCGC TGGAAOCATGCAAGTATGAAACCGATTTOCTCGGGAGC
ACGTTTCACCKXX- SGATArrACCGGGGCAAGCrGAT CAGCATCGCCTCCTTTCA CAAGCCGAACATCCAGAGCT
TOAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTCGAAGGGTACCGTGAGCAAAAAGCGGGAAGCA
CGCTCA CCGCCATGCCGAAGAO ITCTTCGGAAAAAA
GGCGCGGACCTTTTGTGGTGCAACGCCAGGACGTCTGC
GAGCGGCTACTATAAAAAGCrcGGCT CAGCOAACAGG GCGAAGTCTACGACACACCGCCGGTCGGACCTCATATT
TTGATGTATAAGAAATTGACGTAA
SEQ ID 14_6AS ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:64 TGAGATCAGGCACCGCA1TCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAA( GATTrGCrCGGGGGT ACGTTTCACCTCC 3TGaATATTAa:GGGGCAAGCTAGTC AGCATCGCTTCCTI AA CAAGCCGAACATCCAGAGC T
GAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCaTGAOCAAAAAGCGGGCAGTACG CrrATCCGCCATGCCGAAGAGCrrCTTCGGAAAAAAGG CGCGGACCl'rriGTGGTGCAACGCCAGGACATCTGCGA GCGGGTACTATAAAAAGCTCOGCITCAGCGAACAGOGC
GAAGTCrACGACACACCGCCGGTCGGACCTCATGTTTTG ATGTAT AAG AAATTG ACGT A A
SEQ ID 14JSBI0 ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO:65 TGAGATCAGGCACCGCATTCTXXCiGCCGAATCAGCCGC TGGAAGCATGCAAQTATGAAACCGATTTGCTCaaGaaT ACGTT CACCT GGTGGATATTACCGGOGCAAGCTGATC
AGCA'rCGCTTCCT TCATX:AAGCCaAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGATACCGTGAOCAAAAAGCQGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAGG
CGCGGAC ilATGGTGCAACGCCAGGACATCTGCGA GCGGGTAC ATAAAAAGCTCGGCTTCAGCGAACAAGGC
GGGGTCTACGACATGCCGCCGGTCmACCrcATATTT G ATGTATAAGAAG TGACOTAA
SEQ ID I4_6D4 ATOATTGAAGTCAAACCAATAAACGCOGAAGATACGTA NO:66 TGAGATCAGGCACCGCAT CTCCGACCGAATCAGCCGC TGGAAGCATGCAAGTATQAAACCGAT TGCTCQGAGGC
ACGTTTCA(XnXXKnX 3ATATTACCXXKJG AAGC GATC AG ATCGC TCCTTTAATCAAGCCGAACATCCAGAGCTT
GA AGGCCAA A AACAGTATC AGCTG AGAGGGATGGCG A
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAOTACG 264
CTTATCCGCCATGCCGAAGCX3CTrCrrCGGAAAAA0G0 GaCAGA rrCTTATGGTQCAACGCCAGGACATCTGCGA GCGGOTACTATAAAAAGCTCOGCTTCAGCGAACAGGGC
GAAGTCTACGA ACACCaccCSGTCGGACCTCATATTTTG ATOTATAAGAAATTGACGTAA
SEQ DD 14 .7A11 ATGATTGAAOTCAAACCAATAAACGCGGAGGATACGTA NO:67 TGAGATCAGGCACCaCATTCTCCGQCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGG GGATATTACCXjGGGCAAGCrGGTC AGC ATCGCCTCC ITC ATC AAGCCG AAC ATCC AGAGCTT
GAAGGCCTAAAACAGTATCAGCTGAGAGGGATGGCGAC
ACTCGAAGGGTACCGTGAGCAAAAAGCGGGAAGTACG
CTCATCCGCCATOCa3AAGAGCTTCTTCGGAAAAAGGG GGCAGACCTCrTATGGTGCAACGCCAGGACGTC GCGA GCGOa ACTATAAAAAGC CGOCTTCAQCGAACAGGGC GAAGTCrACGACACACGGCCGACCGGAarrCATATTIT GATOTATAAGAAATTQACGTAA
SEQ ID 14_7Al ATGATTGAAGTCAAACCAATAAACGCGGAGGATACGTA NO:68 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAOGGGT
GCGTTTCACCrcGGTGGATATTACCGGGGCAAGCTGGTC AGCATCGCC CCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCTAAAACAGTATCAGCTGAGAGGGATGGCGAC
ACTCGAAGGGTACCGTGAGCAAAAAGCOGGAAGTACG
CTCATCCGCCATGCCGAAGAGCITCT CX3GAAAAAGGG GGCAGACCTC TATGGTGCAACG XAGGACGTCTGCGA
GCGQGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACACACCGCCGACCGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID HJ7A9 ATQATTGAAGTCAAACCAATAAACGCGGAGGATACGTA NO:69 TGAGATCAGGCACCGCATTCTCCOGCCGAATCAGCCGC 1X3GAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT ACGTTTCACCTCGGCGGATATTA(^GGGGCAAGTTGGTC AGCATCGCCTCCTTTCATCAAOCCAAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTCGAAGGGTACCGTGAGCAAAAAGGGGGTAGTACG
C TATCCGCCATGCCOAAGAGCTTCTTCGGAAAAAAGG
CGCGGACCl ? ' J ? ATGGTGC AA CGCC AGG ACGTCTGCG A GCGGGTACTATAAAAAG COGCTTCAGCGAACAGGGC
GAAGTCl'ACOACACACCGCCGGTCGGACC CATAT TTG ATGTATAAGAAATTGACGTAA
SEQID 14J7G1 ATGATTGAAGTCAAACCAATAAACGCAGAAGATACGTA O:70 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGrATGAAACCGATTTGCTCAGGGGT GCGTTTCACCrCGGTOGATATTACCGGGOCAAGCTGATC AGCATCGCTTCC 1 1 1 AATC AAGCCG AAC ATCC AGAGCTT GAAGGCGAAAAACAGTATCAGTTGAGAGGGATGGCGA
CACTTGAAGAGTACCGTGAGCAAAAAGCGGGAAGTACG
C TATCCGCCATrjCCGAAGCGCTTCTTCGGAAAAAGGG GGCAGACCTCTTATGGTGCAACGCCAGGACATCTGCGA 265
GCGGGTACTATAAAAAOC CGGCTTC A GCOA AC AGGGC OAAGTCTACGACACACCGCCGGTCGOACCTCATATTTTG ATGT AT AA G AAATTG ACGTAA
SEQ ID 14J7H ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:71 TGAGATCAGGCACCGCATT rCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCGGCGGATATTACCGGGQCAAGCTGGT
CAGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCG
ACACTTGAAGGATACCGTGAGCAAAAAGCGOGAAGCA
CGCTCATCCGCCATGCCGAAGAGCTICTIX K3AAAAAA GGCGCGGACCTrTTGTGG GCAACGCCAGGACATCTGC G AGCGGGT A T ATAAAAAGCTCGGCTTCAGCG AAC AGG
GCGAAGrKTTACGACATACCGCCGGTCGGAC rcATATTT TGATOTATAAGAAATTGACGTAA
SEQ 1 14_8F7 ATGAT GAAG CAAACCAATAAACGCGGAAGATACGTA NO:72 TGAGATCAGGCACCGCATTCrCCGGCCGAATCAGCCGC T GAAGCATGCAAGTATGAAACCGATTTX3CTCGOGGGT ACGT TCACCTCGGCGGATATTACCGGGGCAAGCTX iT CAGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGAGTACCGCGAGCAAAAAGCQGGCAOTAC
GCTTATCCGCCATG GAAGCGCn CTTCGGAAAAAAG GCGCGGACCTITTGTGGIXX^AACGCCAGGACAI GCA AGCGGG ACT ATAAAAAGCTCGGCTTCAGCG AACAGGG
CGAAGTCTACOACATACCGCCGACTGGGCCCCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ 1D 15.10C2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO-.73 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAG ^TGCAAGTATGAAACCGAITIOCTCAGGGGT aCO TTX^CCTCOG GGATATTACCGaGGCAAOCTGGTC AGCATCGCCTCC ITCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGOAAGTACG
CTCATCCGCCATGCCGAAGAGCTTCnTCGGAAAAAGGG GGCAGACCTCTTATXXnGCAACOCCAGGACAACTGCGA GCaGGTACTATAAAAAGCTCGGC rCAGCGAACAGGGT GAA0TCTTCGACATACO3CCGACCGGACX CCATATTTTa ATGTATAAGAAATTGACGTAA
SEQ ID 15JL0D6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:74 TGAGATCAOGCACCaCAT CTCCaaCCGAATCAGCCOC TTGAAGCATGTATGTATOAAACCGATTTGCTCGGGGGC
ACGTTTCACCTAGGTOOATATTACCGGGGCAAGCTGGT
CAGCATCGCCTXTCTITCATC A AGCCGA ACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACT GAAGAGTACCGCGAGCAAAAAOCGGGAAGCA
CGCTCATCCX3CCATXK GAAGAGCI'l rrCGGAAAAAG GGGGCAGACX IXTrrATGGTGCAACGCCL^GGACATCTGC GAGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTCTACGACATACCGCCGG CGGACCTCATATTT 267
NO:79 TOAGAICAGGCACCGCATACTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCOOGGGT
ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGGT
CAGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAACTGAGAGGOATGGCG
ACACTTGAAGGATACCGTQAGCAAAAAGCOGOCAGTAC
GCT ATCCGCCATGCCGAAGAGCITCT COGAAAAAAG
GCGCGGAGJI ? ATGGTGC AACGCCAGGACGTCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CAAAGTC ACGACATACCGCCGGTCGGACCTCATATITr OATGTATAAGAAATTGACGTAA
SEQ ID 15.12D ATGATTGAAGTCAAACCAATAAACGCGGAGGATACGTA N0:80 OAGATCAGOCACCGCATTCTCCGOCCGAATCAGCCGC TGGAAGCATGCAAGTAIOAAACCGAT TGCTCAGGGGT
ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGGT
CAGCATCOCCTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTA CAGCTGAGAGGGATGGCG
ACACTCGAAGAGTACCGCGAGCAAAAAGCGGGAAGCA
CGCTCATCC K^CATGCCaAAGAGCTTCTTCGGAAAAAG GGGGCAGACCTCTTATGGTGCAACGCCAGGACATCTGC
GAGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTCTACGACATACCGCCGGTCGGACCTCATATTT
TGATG ATAAGAAATTGACATAA
SBQ ID 15_3F10 ATGATTOAAGTCAAACCAATAAACGCGGAAGATACGTA N0:81 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCOTT CACCTTGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGTTrcCTT CATCAAGCCGAACATXX^AGAGCTT GAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGTGAGCAAAAAGCGGGCAGCACG CirATCCGHXATOCCGAAGAGCTTC rcGOAAAAAAGG CGCGGACCTT TATOGTGCAACGCCAaaACATCTGCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCOAACAGGGC
GAAG CTACGACACACm GGCCGaACCrcATArnT GATGTATACGAAATTGACG AA
SEQ ID 15_3GU ATGATTGAAGTTAAACCAATAAACGCGGAAGATACGTA N0.82 TGAGATCAGGCACCOCATACTCCGGCCGAATCAGCCGC TTGAAGCATGCAAQTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACC CGGCGGATATTACCGGGGCAAaCTGGT CAGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGAG ACCGCXJAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCCGAAGAGCT CTTCGGAAAAAAG
GCGCGGACCITITGTGGTGCAACGCCAGGACOTCTGCG
AGCGGGTACTATAAAAAGCTCGGC TCAGCGAACAGGG
C AAGTCTACGACATACCGCCGGTCGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 15_4F11 ATGATTOAAGTCAAACCAATAAACGCGGAAGATACGTA NO:83 TAAGATCAGGCACCGCATACTCCGGCCGAATCAGCCOC TTCAAGCATGTATGTATGAAACCGATT GCTCGGGOGC 268
ACGTTrCACCTCOOTQOATATTACCGGGGCAAOCTOGTC AGCATa3CTTCC TrAATCAAGCCGAACATCCAQAGCTT GAAGGCCAAAAACAGTATCAGCTGAOAGOGATGOCGA
CACTTGAAGGGTACCGTGAGCAAAAAGCGGGCA TACG
C TATCCGCX^ATGCCGAAGCGCT CrTCGGAAGAAAGG CGCGGACXnTTTATGGTGCAACGCCAGGACATCrGCGA GCGGOTACTATAAAAAGCrcGGCTTCAGCGAACAGGGC GAAGTCTACGACATACCGCCGACCGGACCCCATATnT GATGTATAAGAAATTGACGTAA
SEQ ED 15_4H3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:84 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGCAAGTATGAAACCGATITGC CGGGGGT
ACX3 TTCACCTCGGCGGATATTACCX3GGGCAAGCTGOT CAGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGTA
CGCTTATCCGCCATG<XGAAGAGC rCITCOGAAAAAA GGCGCGGACCTITrATGGTGCAACGCCAGGACA CTGC GAGCGGOTACTATAAAAAGCTCGGCrTCAGCGAACAOG GCGAAGTCrACGACATACCGCCaACrOGGCCCCATATT TTGATGTATAAOAAATTGACGTAA
SEQ ID 15J5D3 ATGATTOAAGTCAAACCAATAAACGCGGAAGATACGTA NO:85 TGAGATCAGGCACCGCATACTCCGGCCGAATCAGCCGC TGGAAGCATGCAAOTATGAAACCGAT TGCTCX3GGGGT ACGTTTCACCTCXjGTGGATATTACCGGGGCAAGCTGATC AGCATCGCCTCCriTCATCAAGCCGAACACCCAGAGCTT GAAGGCCAAAAACAOTATCAGCTGAGAGGGATGGCaA CACITGAAGAGTACCGCGAOC A A AA AGCGGGAAGCAC
GCTCATCCGCCATGCCGAAGAGCTI CTTCGGAAAAAGG
GOGCAOACCTX?rrATGGT K:AACGCCAGGACATCTGCG AGCGOOTACTATAAAAAGC CGGCTTCAGCGAACAGGO
CGAAGTCTACGACATACCGCCGACCGGACCi ATATTrT GATGTATAAGAAATTGACGTAA
S Q DO 15_60? ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:86 TGAGATCAGGCACCGCATTCTCCGGCCGAATGAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGGTGGATArTACCGGGGCAAGCTGGTC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
OAAOGCCAAAAACAGTATCAGCrGAGAGGGATOGCGA CACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG
GGGCAGACXITlTrATGGTGCAACGCCAGGACATCTGCG AGCGGGTACrATAAAAAGCTCGGCTTCAGCGAACAGGG CAAAGTCTACGACATACCGCCGOTOTGA JTCATATTTT
GATGTATAAGAAGTTGACGTAA
SEQ ID 15_9F6 ATGATTGAAGTCAAACCAATAAA XKX3GAAGATACGTA NO:87 TGAGATCAGGCA(X K:ATTCTCCGGCCOAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGT ACGTTTCACCRCGGCGGATATTACCGGGGCAAGCTGAT C^GCATCGCCTCCTTTCAT AAGCCGAACATCCAGAGCT 269
TOAAGGCCAAAAACAGTATCAOCTGAGAOOOATCJOCG
ACACTCGAAGAGTACCGCGAGCAAAAAOCGGGCAGTA
CGCITATCCGCCATGCCGAAGAGCTTCITCGGAGAAAA
GGCGCGGACCTTTTATGGTGCAACGCCAGGACATCTGC
GAGCGOGTACTATAAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTCTACGACATACCGCCTGTCGGACCTCATATTT
TGATGTATAAGAAATTGACGTAA
SEQ E) 15F5 ATGATCGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:8S TGAGATCAGGCACCOCATTCTCCOGCCGAATCAGCCGC TGGAAGCA GCAAG ATGAAACCGATTTGCTCGGGGGT
ACGTTTC ACCTCGGTGGGT ACTACCGGGGC A AGCTG AT
CAGCATCGCrrCCTrrCATAAAGCCOAACATTCAGAGCT TOAGGGCGAAGAACAGTATCAGCTGAGAGGOATGGCG
ACGCTTGAAGGATACCGTOAGCAAAAAGCGGGCAGTAC
GCTTATCCGCTATGCCGAAGAGCTTCTTCGAAAAAAAG
GCGCGGACCTTTTATGGITGCAACGCCAGGACATCTGTG
AGCGGGTACTATAAAAAG rCGGCTTCAGCGAACAGGG CGAAGl - ACGACATACCG<XGATCGGACCTClATATnT GATGTATAAGAAAT GACGTAA
SEQ ID 16A1 ATGA TGAAGTCAAACCTATAAACGCGGAAGATACGTA NO:89 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAaCATGTATOTATGAAACTOATTrGCTCGGGGGT ACGCTTCACCTCGOTGGATATTACCAGGGCAAGCTGAT
CAGCATCGCT CCTT CATAAAGCCGAAC ATTCAGGGCT
TGAGGGCGAAGAACAGTATCAGCTGAGAOOGATGGCG
ACGCTCGAAGGGTACCGCOAGCAAAAAGCGGGCAGTA
CGCTTATCCGCCATG^GA GAGCTTCTTCGAAAAAAA GGCGCGGACCTTTTATGGTGCAATGCCAGGACATCTGT
GAGCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTCTACGACATACCGCCGATCGGACCTCATATTT
TGATGTATAAGAAATTOACGTAA
SEQ BD 16H3 ATGATTOACX3TCAAAC TATAAACGCGGAAGATACGTA N0:90 TOAGATCAaaCACOK:ATTCTCCGGCCGAATCAG X3C TXK3AAGCATGCAAG ATGAAACCGATTTGCTCGGGGGC ACGTTrCACCTCGGCGGATATTACCAGOGCAAGCrGAT CAGCATCCKX CCTTTCATCAAGCCGAACATTCAGAOCT
TGAAGGCCAAAA AC AGT ATCAGCTG AG AGGG ATGGCG
ACACTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGTA
CGCTCATCCG(X^ATGCCX5AAGAGCTT rTCGOAAAAAO GGGGCAGACCTTTTATGG GCAATGCCAGGACATCTGT
OAGCGGGTACTATGAAAAGCTCGGCrTCAGCGAACAGG GCGAAGTCTACOAC-ATACCG<XH3ATCGGACCrcATATrT TGATGTATAAGAAATTGACGTAA
SEQ ID 17C12 ATOATTGAAGTCAAACCAATAAGCACOOAAGATACGTA N0:91 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATL GCRCGGGGGT
GCGTTTCACCITX}GTOGATATTA<^ AGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAOTATCAGCTGAGAGGGATGGCGA
CACITO AAGGGTACCGCGAGCAAAAAGCGGGAAGTAC 270
GCirATCCOCCATGCCOAAGAGCTTCTTCGAAAAAAAO GCGCGGACCTnTATGGTGCAACGCCAGGACATCTGTG AGCGGOTACrATOAAAAOCTCGGCTTCAGCGAACAGGG COAAGTCTACGACATA<XG< XiATCGGACCTCATATnT GATGTATAAGAAATTGACGTAA
SEQ ID I8D6 ATG ATTGAAGTCAA ACCAATAAACGCGGAA OATACGTA NO:92 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCrCGGGGGC ACG I CACCTCGG GGATATTACCGGGGCAAGCTGATC
AGCATCGCTTXJC I CATAAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCAA
CGCrrGAAGGATACCGTGAGCAAAAAGCGGGAAGTACG CTTATCCGCCATGCCaAAGAGCTrCTTCGOAAAAAGGG GGCAGACCTrriATGGTGCAACGCCAGGACATC GCGA Ga3GCTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC GAAGTCTACGACATACCOCCGATCGGACXrrCATA'l l'l'l'G ATGTATAAGAAATTGGCATAA
SEQ ID 19C6 ATGATTGAAGTCAAACCAATAAACGCGGAAOATACGTA NO:93 TGAGATCAGGCAÍXGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATOAAACCGATT GCTCGGGGOT
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
TGCATCGCCTCCTTTCATCAAGCCGAACATRCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCT 1G AAGGGT ACCGCGAGC A AAAAGCGGG AAGTAC GCITATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGG
GGGCAOACCTTTTATGGTGCAATG( :AGGACATCTGTG AGAGGCTACTATGAAAAGCTCGG TTCAGCGAACAAOG
CCXK30TCRACGATATACCGCCOAT X3GACCTCATATTTT GATGTATAAGAAArroaCOTAA SEQ ID 19D5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA
NO: 4 TQAGATCAGGCAC GCATTCTCCGGCCGAA CAGCCGC TTGAAGCATG ATGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACC CGGTXJAATATTACCAGGGCAAGCTGATC
AGCATCGCTTCCTTTCATAAAO XXIAACATTCAGAGCTT
GAAGGCCAAAAACAG ATCAG TGAGAGGOATGH3COA CGCTTGAAGGGTACCGCGAGGAAAAAGCGGGCAGTACX3 CTCATCCGCCATGCCGAAGAGCTTX RTCGGAAAAAGGG
GGCAGAC NI AT 3G GCAA GCCAGOACATCTGTGA CKX3GCTACTATAAAAAGCTCX3G RCAGCGAACAGGGC GAAG CTACGACATACCGCCGATCGGACCTCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ JD 20A12 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:95 TGAGATCAGGCACCGCATTCrCCGGCCGAATCAGCCGC TTGAAGCATG ATG7ATOAAACCGATTTGCTCGGGGGT ACGTTTCACCTCGGTGOATATTACCAGGGCAAGCTGATC
AGCATCGCI CCTTTCATAATGCCGAACATTCAGACrCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTX3AAGGGTACCGTGAGCAAAAAGCGGGAAGCAC GCTCATC 3<XATGCCGAAGAGCTTCTTCGGAAAAAGG GGGTAGACCTTTTATGGTGCAACGCCAGGACATC OTG 271
AGCGGGTA TATAAAAAQCrCGGCrrcAGCGAACAAGO CGCKJATC TACOACATACCGCCGATCGGACCTCATATnT GATGTATAAGAAATTOGCATAA
SEQ ID 20F2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 6 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATG ATGAAACCGATTTOCTCGGGGGT
ACOTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCn CTTTCATCAAGCCGAACATTCAGAGCTT GAAGQ CAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGG ACCGCGAGCAAAAAGCGGGAAGTAC
GCTTATCCGTCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCAGACCTTTTATGOTGCAACGCCAGGACATCTGTG
AGCGGCTACTATGAAAAGCTCGG TTCAGCGAACAGGG
CGAAG CTACOACATACCGCCGATC KSACCTCATATrrr GATGTATAAGAAATTOACGTAA
SEQ ID 2.10E+12 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 7 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCXJATRROCTCGGGGGT
GCGTITCACCTCAGTGGATATTACCAGGGCAAGCRGATC
AGCATCGCI CCTTTCATCAAGCCGAACATTCAGAGCT
G AAGGCCA A A AA C A GTATC AGCTG AG AGGG ATGGCG A
CGCTTGAAGGATACCGTGAGCAAAAAGCGGOAAGCAC
GC CATCCGCCATGKX»AAOAGCRRCT CGGAAAAAAG GCGCAGACCTTTTATGGTOCAA(¾CCAGGACATCRGTG ACK:GGGTACTATAAAAAGCTCGG TTCAGCGAACAGOO CGAAGTCrACaACATACCGCCGATCGGACCTCATATTrr GATGTATAAGAAATTGACGTAA
SEQ ID 23H11 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:98 TGAGATCAGGCACOGCATT ! rCCGGCCGAATCAGCCGC TGGAGGCATGTATOTATGAAACCGATTTQCTCGGGGGT
ACGTTTCACCTCGGTGGATATlAC^AGGGCAAGCrGATC AGCATCGCTTCCTTTCATAAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCrrGAAGGGTACCGCOAGCAAAAAGCGGGCAGTACG CI ATCCG<XATGCCGAAGAGCTIX KXX3AAAAAAAGG CGCGGACCTTTTATGGTGCAATGCCAGGACATCTGCGA
GCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAG CTACGACATACCACCGATCGOACCTCATATnTG ATGTATAAGAAATTGGCATAA
SEQ ID 24C1 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:9 TGAGATCAGGCACCGCAT CTCCGOCCGAArcAGC X3C TGGAAGCATGCAAGTATGAAACCGATT GCTCGGGGGC
ACGTTTCACCTCGGCGGATATTATCGGGAí-lAGGCTGATC AOCATCGCrrCCT TCATCAAGCCGAACATTCAGAOCrr GAAGaCCAAAAACAGTATCAGCTGAGAGGGA GGCGA CGC TGAAGGG ACCOCGAGCAAAAAGCGGGAAGCAC
GCTCATCCOCX^ATOCCGAAGACJCTrC iXX iAAAAAGG GGGCAGAC rTTl'ATGG GCAACGCCAGGACATCTGTG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACATACCGCCGATCOGACCTCATATTTT 272
OATOTATAAGAAACTOACGTAA
SEQ ID 24C6 ATGATTGAAGTCAAACCTATAAACGCGGAAGATACG A NO.100 TGAGATCAGGCACCGCATTCTCCQGCCGAATCAGCCGC T GAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTOATC
AGCATCGCT CCTTTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAOCTGAGAGGGATGGCGA
COCTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGTAC GcTTATCCGCCATGCCOAAGAG Tri n a3AAAAAAAO GCGCGGACCTTTTATGGTGCAACGCCAGGATATCTGTO
AGCGGCTACTATAAAAAGCTCGGCTrCAGCGAACAAGG CGGGGTCTACGACATACCGCCGATCGGACCTCATATTTT
GATGTATAAG AA ATTGGC ATAA
SEQ ID 2. 0E+08 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO-.101 TGAGATCAGGCACCQCATTCTCCGGCCGAATCAGCCGC TGGAGGCA1X AAGTATGAAACCGATTTGCTCGGGGGC ACGTTTCATCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCG TTCCTT CATAATGCCOAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTG AAQG AT ACCGCG AGC AAAAAGCGGGC AGT ACG
CTTATCCGCCATGCCOAAGAGCTTCTrCGGAAAAAGGG GGCAGACCTTTTATGGTGCAATGCCAGGACATCTGCGA
GCGGCTAC ATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGGCATAA
SEQ ID 2„8C3 ATGAT OAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 102 TGAGATCAOOCACCGTAIIUI X:GGCCGAATCAGCCGC TTGAAGCATGTATG ATGAAACCGATTTGCTCGGGGGT
ACGTT RCAC CGGCGGATATTATCGGGACAGGCTGATC
AGCATCGC TCCTTTCATCAAGCCGAACATTCAGAGCRT
GAAGGKXAAAAACAGTATCAGCTGAGAGGGATGOCGA
CGCTTG AAGGGRACCGCGÁGCAAAAAGCGGGCAGT ACG
CTTATGCGCCATGCCGAAGAGCTRC TCGGAAAAAGGG
GGCAGACCTRTTATGGTGCAACGCCAGGACATCTGCGA
GCGC<rrACTATCAAAAC rcGGCTTC AGCG A AC AGGGC GAAGTCTACGACATACCGCCOATCGGACCTCATATTTTG ATGTATAAGAAATTGACQTAA
SEQ ID 2H3 ATGATTGAAGTCAAACCGATAAACGCGGAAGATACGTA NO.103 TGAGATCAGGCACCWCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGGAAGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCGGTGGATATTACCAGGGCAAOCTGATC
AGCACCGCTTCCTTTCATCAAGCC8A(^TTCAGAACTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCGAAAAGCGGGAAGTAC
GCTCATCCCIGCATGCOTAAGAGCRTTTTTCGGAAAAAGG
GGOCAGACX- rTTATGOTGCAACGCCAGGATATCTGCG AG<X3GG ACTATAAAAAGC CGGCTTCAGCGAACAAGG CGGGGTCTACGATATACCGCCGATCGGACCTCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 30G8 ATGATTGAAGTCAAACCAATAAACGCGOAAGATACGTA 273
NO: 104 TGAOATCAGGCAí QCATTCTCCGGCCGAA CAOCCGC TTGAAOCATG ATGTTTGAAACCGATTTGC CGGGGGTG
CGTTTCACCTCGGTGGATATTACCAGGGCAAGCTGATCA
GCATCGCTTCCTTTCATCAAGCCGAACATTCAGAGCTTG
AAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGAC
GCTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACGC
TTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAGGC
GCAGACCT 1TATGGTGCAACGCCAGGACATCTGTGAG CGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGCG
AAGTCTACGACATACCGCCGATCGGACCTCATAl l l'lGA TGTATAAGAAATTGACGTAA
SEQ ID 3B_10C4 ATGATTGAAGTCAGACCAATAAACGCGGAAGAT ACOTA NO: 105 TOAGATCAOGCACCGTATI TrCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCC ITCATCAAGCCGAACATTCAGAGCTT
GAAGGCXAAAAACAÜTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG
CITATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGGG
GGCAGACCTTrrATGGTG ^CGCCAGGACATCTGCGA GCG 3GTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC GAAGCCTACGACATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 3B_10O7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:106 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCGGTGGATAT ACCGGGGCAAGCTGATC
AG^ATCGCCTCG 11CATCAAG<X-X}AACATTCAOAGCrr GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG
C TATCCGCC ATGCCG AAG AGCTTCTTCGGAAAA AAGG
CGCGGACCTTTTATGGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGGC
GGGG CT ACGACATA CGCCGATCOGACCCCATATTITO
ATGTATAAGAAATTGACGTAA
SEQ ID 3B_12B1 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 107 TGAGA'rcAGGCACCGCATTCTCCGGCCGAA'rCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTOCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTTTGATCAAGCCGAACATTCAGAGCTT
GAAGGCC A AAAACAGT ATCAGCTOAGAGGOATOGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGTAC
GCTTATCCGCCATGCCGAAGAGCnCTTCGGAAAAAÜG GGGCAGACCTTTTATGGTGCAACGCCAOGACATCTGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTAC«ACATACX G X:GAlt¾3GACCTCATATrTT GATGTATAAGAAATTGACGTAA
SEQ ID 3B_12D10 ATGATTOAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 108 TGAGATCAGGCAC GI TTCIGCGGCCGAATCAGOCGC TGGAAGCATCTATOTACaAAACCGATTTGCTCGGGGGT 274
GCGTTTCACCTCGGTQGATATTACCGGOGCAAGCTOATC
AGCA CGCCTX CTTTCATCCAGCCGAACATTCAGAGCTT
G AAGGCC AA AAAC AGT ATC AGCTG AG AGGG ATGGCG A
CACTTGAAGGATACCGTGAGCAAAAAOCGGGCAGTACG
C TATCCGCCATGCCGAAGAG n CT CGGAAAAAAGG CGCGGACCTTTTATGGTGCAACGCCAGGATATCTGCGA
GCGGGTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGATCGGA(XCCATATTTrG ATGTATAAGAAAT GACGTAA
SEQ ID 3B_2E5 ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO: 109 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTrrcACCTCGGTGGATATTACCGGGaCAAGCrGATC AGCATCC XTKXnTrCATCAAGCCOAACATTCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAC jATACCGTGAGCAAAAAGCGGGCAGTACG CTTATCCGCCATGCCaAAGAGCTT ITCGGAAAAAGGG CGCGGACCTTTTATGGTGCAACGCCAGGACATCTGCGA
GCGGCTACTATGAAAAGCTCGGCTTCAGCAAACAGGGC
GAAGTCTACGACATACCGCCGATCGGAC rcATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 3CL10H3 ATGATTGAAOTCAAACCAATAAACGCGGAAGATACGTA NO: 110 TGAGATCAGGCACCGTATTCTCCOGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCaATTTGCTCGGGGGC ACGTTTCACCTCCHJTGGA ATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTI CATCAAGCCGAACATTCAGAGCTT
GAAGGCC AAAAACA GT ATC AGCTG AGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGAAGrACG CTTATCCGí ATGCCGAAOAGCTTCT CGGAAAAAOGG GGCAGACCTTl'l ATOGTGCAACGCCAGGATATCTGCGA GCGGCTACTATAAA.AAGCTCGGCTTCAGCGAACAAGGC GGO<7I rACGACATACCGCCGX3TCGOACCTCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 3C_12H10 ATGATTOAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO:lll TGAGATC^C ¾:ACX GCATTCTGCXKK:COAATrAGCCGC TTGAAGCATGTATGTATGAAACCX3ATTTGCTCGGGGGC ACG ITXL CCTCGGTGG AT ATT ACCX3GGGCAAGCTG ATC AGCATCGCCT CTTTCATCAAGÍXXJAACATTCAGAGCTT
GAAG ¾ AAAAACAGTATCAGCTGAGAC K3ATOGCGA CACTTGAAGGGTACCGTGOGCAAAAAGCGGGCAaTACG CITAT XGCCATK-KXGAAGAGCTTCTT^ CGCC^ACXri 'l^ATGGTGCAACGCCAGGACATCTGCGA GCGGCTACTA'IXjAAAAGCTCGC<n CAGCGAACAGGGC OAAGTCTACGACATACCGCCGATCGGACCTCATATTTTQ
ATGTATAAGAAATTGACGTAA
SEQ ID 3C_9H8 ATGATTGAAGTC A AACC A ATA A ACGCGG A AGATACGTA NO:112 TGAGATCAGGCACCOTATTCTCCGGCCGAATCAGCCGC TTGAAC lATGTATOTATOAAACCGATTrGCTOj ACGTTTCACCrcG XiGATATTATCAGGACAGGCTGATC AGCATCGCCTCCrTTCATCAAGCCGAACATTCAGAGCTT 276
AAAGGAGGCGATGCTGATCAGCTTGCCCCGGTAATATC
CACCOAGQTGAAACGTGCCCCCaAOCAAATCAGTTTCA TACTTGCATG TTCCAOCGGCTGATTCGOCCGOAGAATG
CGGTGCXrrcATCTCATACGTATCTTCCGCGTTTATTGGT TTGGCTTCAATCAT
SEQ ID 4B_16E1 ATGATTGAAGTCAAACCAATAAACGCGGAAOATACGTA NO: 117 TGAGATCAGGCACCGCAT CTCCX3GCCGAATCAGCCGC TGGAAGCATGCAAG ATGAAACCGAITTGCRCGGGGGT
ACG TTCACCTCGGCGGATATTACCGGGGCAAG RGAT
CAGGATCGCC CCTTTCATCAAGCCGAACATTCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGOOATGGCG
ACA TTGAAGGGTACCGCOAGCAAAAAGCGGGCAGTAC
GC TATCCGCCATGCCGAAGAGCTTC r<XK3AAAAAGG GGGCAGACCT TTATGGTGCAACGCCAGGACAT rOCG AGCGGGTAC ATAAAAAGCTCGGCTTCAGCQAACAAGG
CGGGGTX TACGATATACCGC<X}ATCO<3ACC rCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 4B_17A1 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 118 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGG AAGC AI GC A AGTATG AAACCG ATTTGC CGGGGGC
ACGTTTCACCrCGGCGGATATTACCGGGGCAAGCTGAT CAGCATCGCTTCCTTTCATCAAGCCGAGCATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACGC TGAAGAGTACCGCGAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCCGAAGAGCTTC TCGGAAAAAGG
GGGCAGACCTTTTATGGTGCAACGCCAGGACATCTGCG
AGCGGCTACTATGAAAAGCrcGGCTTCAGCGAACAGGG CGAAOTCTACGACATACX-XKXOATCGGACCTCATATn OATOTATAAGAAATTGACATAA
SEQ ID 4B_18F11 ATGATTGAAGTCAATCCAATAAACGCGGAAGATACGTA NO: 119 TGAGATCAOGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATG ATGAAACCGA RTGCTCGGGGGC
ACTJRCTCACCTCGGCOGATATTACCGGGOCAAGCTGAT
CAGCATCGCITCCTTTCATAATOCCGAACATTCAGAGCT
TGATGGCCAAAAACAGTATCAGCTGAGAOGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAOCGGGAAGCAC
GCTCATCCGCCATG(X;GAAGAGCTTCTTCGGAAAAAAG GCGCAGACC ITIATGGTGCAACGCCAGGACATCTGTG
AGCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGG
CGAAG CTACGACATACCC GATCOGAOCICATATTTC
GATGTATAAGAAATTGACGTAA
SEQ ID 4B_1 C8 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 120 TGAGATCAOGCACCGCATTCTCCGXJCCGAATCAGXXXKJ TGGAAGCATGCAAGTATGAAACCGATTTG rCGGGGGC ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGAT
CAG L TCGC ra;ri lCATCAAGCCGAACATCCAGAGCT TGAAGGCCAAAAACAGTATCAGCTGAGAGGaATGGCG ACOCTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGCA
CGCrcATCCGCCATCiCCGAAGAGCTTCTTCGGAAAAAG ??s<?^??0?1 ·G??0<? ?;??00?0 ?a?0????0€ 277
GAGCGGGTACTATAAAAAGCrCGOCTTCAGCGAACAAG GCGGGGTCTACGATATACCGCCGATCGGACCTCATATTT TGATGTATAAGAAATTGGCATAA
SEQ ID 4B_1G4 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACOTA N0:121 TGAGATCAGOCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTOCTCGOGGGT
GCGTTTCACCrCGGCGGATATTACCGGGGCAAGC GAT CAGCATCGCC CCTTTCATCAATCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAOAGGGATGGCG
ACGCTTGAAGGGTACCGCGAGCTAAAAGCGGGAAGTAC
GCTTATCCGCCATGCCGAAQAC3CI CTTCGGAAAAAAG GCGCGGACC ITrATGGTGCAACGCX^AGGATATCTGCG AGCGGGTACTATAAAAAGCrCGGCTTCAGCGAACAGGG CüAAGTCTACÜA ATACCGCCüATCGGACCTCATATí'í' GATG ATAAGAAATTGACGTAA
SEQ ID 4B_21C6 ATGATTGAAATCAAACCAATAAACGCGGAAGATACGTA NO:122 TGAGATCAGGCACOX:ATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGA TROCTCGGGGGC AOTTTTCACC CGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCITCCITIXJATCAAGCCGAACATTCAGAGCI
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA CACTTGAAGAGTACCGCGAG AAAAAGCGOGAAGCAC G X:ATCCGCCATGCCGAAGAGCTTCTTCXX3AAAAAAG GCGCGGAC iTl ATGGTGCAACGCCAGGATATCTGCG AGCGGCTACTATAAAAAGCTCGGCTTCAGCGAACAAGG CGGGGTCTACGATATACCGCCGATCGGACCTCATATnT GATGTATAAGAAATTGACGTAA
SEQ ID 4B_2H7 ATGATTGAAGTCAAACCAATAAACGCOGAAOATACGTA NO:123 TGAGATCAGGCACCOCATTCTCC^GCCGAATCAGCCGC TTGAAGCATGTATOTATGAAACCGATITGCTCGGGGGC ACQTTTCACCTCOGTCGATATTACCGGGGCAAGCTGATC
AGCATGGC rcCTTrcATCAAGCCGAACATTCAGAGCTT GAAGGCCAAAAACAGTACCAGCTGAGAGGOATGGCGA
CACTTQAAGGGTACCGCGAOCAAAAAGCGGGCAGTACG
CTT ATCCGCCATGCCG AAG AGCRRCTTCGG AAAAAGGG
GGCAGACC1TTTATGGTGCAACGCCAGGACATCTGCOA GCGGCTACTATAAAAAGCTCGGCTTCAGCGAACAAGGC
GGGGTCTACGGCATACCGCCGATCGGACCTQXTATTTTG
ATGTATAAGAAATTGACATAA
SEQ ID 4BJ2H8 ATGATTGAAGCCAAACCAATAAACGCGGAAGATACGTA NO:124 TGAGATCAOGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACTGATTTGCTCGGGGGC
ACX7T TCACXI CGGTGGATATTACCGGGGCAAGCTGATC AGCATCGCCTCC TTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
COCTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATGCCGAAGAGCTrCrrCGGAAAAAAG GCGCGGACCTTT ATGGTGCAACGCCAGGACATXTTGCQ
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTXrrACGACATACCGCCGATCGGACCTCATATTTT 278
GATGTATAAGAAATTGACGTAA
SÉQ ID 4B_6DS ATOATTGAAaTCAAACCAATAAACGCGGAAOATACGTA NO: 125 TGAGATCAGGCACCGCATACTCCGGCCGAATCAGCCGC TGGAAGCATGCAAOTATOAAACCGAT TOCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGC rcCTTTCATCAAGCCGAACAT rCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGGTACCGCGAGCAAAAAGCGGGTAGTACG ITATCCGCCATGCCGAAGAGCTTCTl'CGGAAAAAGGG GGCAGACCTTTTATGGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACATGGC
GAAG CTACGACATACCGCCGA CGGACCTCATATTTrG ATGTATAAGAAATTGACGTAA
SEQ ID 4BJ7E8 ATGATTGAAGTCAAACC VTAAACGCGGAAGAT ACOTA NO:126 TGAGATCAGGCACCGCA . rCTCCGGCCGAATCAOCCGC TGGAAGCATGCATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTXX3GTXK5ATAT ACCGGGGCAAGCTGATC AGCATCGC I ?TTCATCAAG< -<3AACATrcAGAG ?, GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCOGGCAGTACG
CTTATCCGCCATGCCGAAGAGCITCTTCGGAAAAAGGO
GGCAOACCTTTTATGGTGCAACGCCAGGACATCTOTOA
GCGGGTACTATAAAAAGCTXXKjCTrcAOCGAACAGGGC GAAGTCTACGACATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 4C_8C9 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 127 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTAlX AAACXlXiA'lTrGCl'CAGGGGT GCGTTTCACC CGGTGGATATTACCGGGGCAAGCTGATC
AGGATCXK TCCrrTCATGAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAOGG
GGCAGACCTriTATGGTGCAACGCCAGGACATCTGCGA GCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCXXXX ATCGGACCrcATATTTTG ATGTATAAGAAATTAACATAA
SEQ ID 4H1 ATGATTGAGGTGAAACCGATTAACGCAGAGGAGACCTA NO:128 TGAACTAAGGCATAGGATACTCAGACCACACCAGCCGA TAGAGGTTTGTATGTATOAAA«:GATTTACTTanX3GTO CCn TCACTTAOOXX-GUllTIACAC XK ^ClCTO CX:ATAGCTTCATTCCACCAGGCCGAÜCATCX:AOAACTCC AGGGCCAGAAACAATACCAACTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGACCAGAAAGCGGGATCGAGCCT
AATTAAACACOCTGAACAGATCCTTCGGAAGCGGGOGG
CGGACATGCTATCGTOCAATGCGCGGACATCCGCCGCT
GGCTACTACAAAAAGTTAGGCTTCAGCGAQCAGGGAGA
GGTATTTGAAACGCCGCCAGTAGGACCTCACATCGTAA GTATAAACGCCTCACATAA
SEQ ID 6_14D10 ATGATTGAAGTCAAACCAATAAACOCGGAAOATACGTA 280
ACGTTTCACCTCGG GOATATTACCOGGGCAAO TGATC
AOCATCGCTTCCTTTCATCAAGCCOAGCATCCAOAOCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATOGCGA
CACTTGAAGGAAACCGTGAGCAAAAAGCGGGCAGTAC
GCTTATCCG< ATGCCGAAGAGCT CTTCGGAAAAAGG GGGCAGACCT I ATCKJTGCAACGCCAGGACATCrGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACGTACCGCCGATCGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 6_18C7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO; 134 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAGGTATGAAACCGATTTGCTCGGGGGC
ACOTTTCACCTCGGTGGATATTATCGGGGCAAGCTGATC
AGCATCGCT1XX ITCATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGATACCG GAGCAAAAAGCGGGCAOTACG
CTTATCCGCCATGCCGAAGAGCTTC TCGGAAAAAGGG
GGCAGACCTTTTATGGTGCAACGCCAGGATATCTGCOA
GCGGGTACTATAAAAAGCTCGXJCTTCAGCGAACAGGGC
GAAGTTTACGACATACCGCCGGTCGGACCTCATAT IO ATGTATAAGAAATTGACOTAA
SEQ ID 6_18D7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 135 TGAGATCAGGCMCCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
ACGTTTCACCTCG TGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCXnTrCATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACITGAAGGGTACCGCaAGCAAAAAGCGGGAAGCAC GCTCATCCGCCATOCCGAAGAGCTTCTTCGGAAAAAAG
GCGCGGACCrmATGGTGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
GXJGGTCTACGACATACCGCCGGTCGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 6_19A10 ATGATTGAAGCCAAACCAATAAACGCGGAAGATACGTA NO: 136 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT A(_XJrTTGACCTCGGTGGATATTACCGGGGCAACK rGATC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCOA
CACTTGAAGGGTACCGCGAGCAAAAAGCGOGAAGTAC
GCTTATCCGCCATGCCGAAGAG nTCITCOGAAAAAGG GGGCAGACCTTTTATG rrGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACATACCGCCGACCGGACCCCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 6_19B6 ATGATTGAAGTCAAA CC AATAAACGCGGAAGATACGTA NO:137 TGAGATCAGGCACraCATTCTCCGGCCGAATCAGCCOC TTGAAGCATGTATGTATGAAACCGATTTGCTCAGGGGT G mTCA rrCGG GGATATTATCGGGC^AAGCTGATC AGCATCGCITCCrTTCATCAAGCCGAACATTCAGAGCIT 281
GAAGOCCAAAAACAQTATCAGCrGAGAaGOATOGCOA CACTCGAAGGATAOCGTGAGCAAAAAGCGGGCAGTACG
CTTATCCGCC ATGCCG AAGAG ' 1 MCI " I'CGG AAAAAGGG CGCAGACCrTTTATGGTGCAACGCCAGGACATCTGCGA GCGGCTACTATAAAAAGCTCGGCTTCAOCGAACAGGGC
GAAGTCTACGACATACCGCCGGTCGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 6^19C3 ATGAT GAAGTCAAACCAATAAACÜCGGAAOATACGTA NO: 138 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATX3CAAGTATOAAACCGATTTGCTCGGGGGT ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGAT
CAGCATCGCCTCCITTCATCAAGCCOAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGOATGGCG
ACACTTGAAGGATAC GTGAGCAAAAAGOGGGCAGTAC
GCTTATCCGCCATGCCGAAGAGCTTCITCGGAAAAAAG
GCGCGGACCTT TATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAQCTCGGCTTCAGCGAACAGGG
CGAAGTCTACGACATACCGCCGATCGGACCTCATATnT GATGTATAAGAAATTGACGTAA
SEQ ID 6_19C8 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 139 TGAGATCAGGCACCQCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGOGGGT
ACGTTACACCTCGGTGGATA ACC!GGGGCAAGCTGAT CAGCATCGCC CCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTAC
GCI ATCCGCCAAGCCGAAGAGCTTCITCGGAAAAAGG
GGGCAGACCTTTTATGGTOCAACGCCAGGACATCTGCG
AGCGGGTA rATAAAAAOC CGG TTCAG GAACAAOG CGGGGTCTACGACATACCGCCGGTCGGACC CATATnT GATGTATAAGGAATTGACGTAA
SEQ ID 6_20A7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 140 TGAGATCAGGCACCOCATTCTCCGGCCGAATCAGCCGC TTGAAOCATGTATGTATOAAACCGATTTOCTCAGGGOC
ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGAT
CAGCATCGCT XXrnTCATCAAGCCGAACATTC^ TGAAGGCC AA A AACAOTATCAO IG AG AaGGAlX iCG ACACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGCA
CGCrcATCCGCCATOCCGAAGAGCTTCTIX:GGAAAAAG GGGGCAGAC n'l TATGGTGCAACaCCAGaACATCTGC GAGCGGGTACTATAAAAAGCTCG irrTCAGCGAACAGG GCGAAGTCTACGACATACCGCCGQTCGGACCTCATATTT
TGATGTATAAGAAATTGACOTAA
SEQ ID 6 Z0A ATGATTGAAG CAAACCAATAAACGCGGGAGATACGTA NO: 141 TCAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCX3C TGGAAOCATGCAA fTATGAAACCGATTTG TCGGGGGC ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCIT
GAAOGXXAAAAACAOTATCAGCTGAGAGGGATGGCGA
CACrTGAAGGGTACCGCGAGCAAAAAOCGGGCAGTACG 282
C rATC^GCCATGCCGAAGAGCrTCTACGGAAAAAAGO CaCGGACCl'l'ri'ATQOTOCAACQCCAOGACATCTQCOA OCGOOTACTATAAAAAGCTCGGCTrCAOCOAACAAGGC GGGOT TACGACATAa GCCQGTCGGACCTCATATTrrG ATOTATAAGAAATTGACGTAA
SEQ ID 6 Z0H5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 142 TGAGATCAGGCACCGCATTCrCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGOGGGC
ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGAT
CAGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCT
TGAAGGCCAAAAACAGTATCAGCrGAaAGGGATGGCG ACACTTGAAGGATACCGTGAGCAAAAAGCGGGAAGTAC
GCrTATCCGCCATGCCGAAGAGCriCITCGGAAAAAAG GCGCGGACCTTTTATOG'rGCAACOCCAGGACAra^GCG AGCGGCrACTATAAAAAGCrCGGCTTCAGCGAACAGGG CGAAGT H'ACGAC^ACCGCCGATCGGACC CATATnT GATGTATAAGAAATTGACGTAA
SEQ ID 6_21F4 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 143 TGAGATCAGGCACCGCGTTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGC CGGGGGT
GCGTTTCACCrCGGTGGATATTACCGGGGCAAGC GATC AGCATCGCCTCCITrcATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCOA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCT C rcGGAAAAAAGG CGCGGACCTn ATGGTGCAACaCCAGGACATCTGCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGaC GAAGT TACGACGTACCGCCGGTCGGACCTCATATTITG
ATGTATAAGAAATTGACGTAA
SEQ ID 6_22C9 ATGATTGAAGTCAAACCAATAAACGCGGAAQATACGTA NO: 144 TGAGATCAGGCACCGCATTCTCCGGCCGAATCGGCCGC TTGAAGCATGI A'IGTATGAAACCGATTTOCTCGGGGGC ACGTTTCACCTCGGTCGATA'rrACCGGC lAAGCTGATC AGCATCOCClX:CrnGATCAAGCCGAACATCCAOGGCrT GAAGGCAAAAAACAGTA C1AGCTGAGAGGGATGGCGA CAC TGAAGAGTACCGCaAGCAAAAAGCGGGAAGCAC G I ATCCGCCATGCCGAAGAGCTTC TCGGAAAAAAG
GCOCGGAC I H ATGGTGCAACGCCAGGACTTCCGCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
AGGGGTCTACGACATACCGCCGGTCGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 6J22D9 ATOATTOAAGTCAAACCAATAAACOCGGAAGATACGTA NO: 145 TOAOATCACX ACCXJTATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCATGTATOAAACXXJATRTGCRCGAOGGC
ACGTTTCACCKX3CRRGGATATTACCGGGGCAAGCTOATC AGCATCX3C TCCI IGATCAAGCCGAC :ATTCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCOTGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAGG CGCX3GA< 'ri l lATGGTGCAACGCCAGGACATCTGCGA 283
GCGX3GTACTATAAAAAGCTCGX3CTTCAGCX3AACAGGGC GAAGTCTACOACATACCO XQO CGGACCTCATATnTO ATGTATAAGAAATTGACGTAA
SEQ ID 6_22H9 ATGATTGAAGTCAAACCAATAAACGCGOAAGATACGTA NO: 146 TGAGATCAGGCACCGCATTCTCCGOCCGAATCAGCCOC TTGAAGCATGTATGTATGAAACCGATTrGCTCGGGGGC ACGTTTCACCrCGGTGGATATTACCGGGGCAAGCTGATC AGCATCGCCTCCTl CATCAAGCCGAACATTCAGAGerr GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGATCAGTAC GCGAGCAAAAAGCGGGCAGTACG
CT ATCCGCCATGCCG AAG AGCTTCTTCGGAAAAAAGG
CGCAGACC'l l'lATGGTX-GAACXX CAG ACATCTGCGA GCGGG ACTATAAAAAGCTCGGC rCAGCGAACAGGGC OAAGTCTACGACATACCCW !GATCGXJACCCCATATrrrG ATGTATAAGAAATTGACGTAA
SEQ ID 6_23H3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 147 TOAGATX:AGGCACCGCATTCTCa3G<XGAATCAGCCGC TTGAAGCATCTATGTATGGAACTOATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTTCATCAAGCCGAGCAACCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGQATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG C rATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGOG GGCAGACCTTTTATGGTOCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAGCAAGGC
GGGGTCrACGACATACCOCCGaTCGGACCTCATAri l'iG ATGTATAAGAAATTGACGTAA
SEQ ID 6J23H7 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 148 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTOAAGCATGTAlX3TATGAAACCGArrrGCTCGGGGGC ACGTTTCACX CGGTGGATATTACCGGGGCAAGCTGATC
AOCATCGCTTCCTTTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGATACCGCGAOCAAAAAGCGGGAAGTAC
GCTTATCCGCCATGCAGAAGAGATTCTTCGGAAAAAAG
GCGCGOACCTCTTATGGTGCAACC :CAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGOGGTCTACGACATACCGCCGGTX:GGAC(^ATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 6_2H1 TGATTGAAGTCAAACCAATAAACOCGGAAGATACGTA NO: 149 TGAGATCAGGCACCGCGTRCRCCGGCCGAATCAGCCGC TGGAAGCATOTATGTATGAAACCGATRRGCTCGGGGOC
ACGTTTC ACCTCGGTGG ????G ACCGGGGC AAGCTG ATC
AGCATCGCCTCCTTTCATCAAG ^COAACATCCAGAGCTT GAAGGCCAAAAACCGTATCAGCTGAGAGGOATGGCGA
CACTTOAAGGATACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATCCCGAAGAGCTTCTTCGGAAAAAAGG
CGCGGACCITRTATGGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAATC ACGACATACCGCCXJATCGGAC RCATATTTTG 284
ATGTATAAGAAATTGACGTAA
SEQ ID 6_3D6 ATGATTGAAATCAAACCAATAAACGCGOAAGATACGTA NO: 150 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAOCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT
ACGTirCACCTCGGTGGATATTACCGAGGCAAGCrGATC AGCATCGCCrCCTI CATCAAGCC AACATCX:AGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAOGGATOOCGA
CTCTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGGG
GGCAGACCTTTTATGOTOCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAGGTCTACGACATAO:G< GGTCGGACCTCATA'ITTTG ATGTATAAGAAATTGACGTAA
SEQ ID 6_3G3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 151 TGAGATCAGGCACCGCATT TCCGGCCGAATCAGCCGC TGGAAGCATCTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGG 3GCAAGCTGATC AGCATCGCCTCCTTTCATCAAGCCGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACITGAAGGATACCGTGAGCAAAAAGCGOGCAOTACG
C TATCCGCCATCCCGAAGAGCTTCTrCGGAAAAAAGG CGCGGACCTITTATGGTOCAACGCC^GGACATCTGCOA GCGGCTACT AT AA AAAGCTCGGCTrC AGCG A A C AGGGC GAAGTCTACOACATACCGCCGGTCGGACCrcATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 6_3H2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 152 TGAGATCAGGCACCOCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCnXXKrraGATATTACCGGGGCAAGCTGATC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGGGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATGCCGAAOAGCIT TTGGGAAAAAGG
GGOCAGA XTrcTTATOOTOCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCrcGGCTTCAGCGAACAGGG CGAAGTX^ACGACATACCGCCGGTCGGACCTCATATITT GATGTATA GAAATTGACATAA
SEQ ID. 6„4A10 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 153 TOAGATCAGGCACCGCATTCTCCX3GCCGAATCAGCCGC TTGAAGC ATGT ATGTATG A A ACCG ATTTGCTCGGGGGC
ACGTTTCACCT03G1XK3ATATTACCGGGGCAAACTGATC AGCATCGCCTCX fTTCATCAAQCCGAACATCCAGAG IT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGCTTGAAGGATACCGTGAGCAAAAAGCGGGAAGTACG
CTrATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAGG CGCGGA«mTTATGGTG AACGCCAGGACATCTGCGA GCGGCTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGGTCGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEO ID 6^ B1 ATGATTOAAOTCAAACCAATAAACCíCGGAAGATACGTA ¦
NO: 154 TGAGATCAGOCACCGCOTACTCCGGCCGAATCAOCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
GGCATCGCTTC rTTCATCAAGCCGAACATCCAGAGCT GAAOGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG
CI ATCCGCCATGCCGAAGAGCITCTTCGGAAAAAGGG
GGCAGACCTTTTATGGTGCAACGCCAGGACATCTGCGA
GCGGCTACTATGAAAAGCTCGG ITCAGCQGACAOGGC
GAAGTCTACGACATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGACATAA
SEQ ID 6_5D11 ATGAT GAAGTCAAACCAATAAACGCQGAAGATACGTA NO: 155 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTOAAGCATGTATG ATGAAACCGATTTOCTCGGGGGC
ACXnTTCACCrCGGTGGATATTACCGGGOCAAGCTGATC AGCATCGCT CCTTTCATCAAGCCaAACATCCAGAGClT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAGCAAAAAGCGGGCAGTACG C rATCCGCCATOCCGAAGAGCTTCTTCGGAAAAAAGG CGCGGACCTrTTATGGTOCAACGCCAGGACATCTGCGA GCQGGTAC ATAAAAAGC CGGCTTCAGCGAACAaGGC GAAGTCTACGACATACCGCCGATCOGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 6_5F11 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:156 TaAQATCAGGCACCGCATTCrCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCrCOGTOGATATTACCGGGGCAAOCTAATC AGCATCGCTTCCTTTCATCAAG<XGAACA CCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCOA
CACT OA AG AGTACCGCG AOCAAAAAGCGGGAAGTAC
GCTTATCCGCCATG<XGAAGAGC rCTTCGGAAAAAAG GCGX-X JACCTTTTATGGTGCAACGCCAGGACATCTGCG AG X GTACrATAAAAAGCTCGGCTrCAGCGAACAGGG CGAAGTX ACGACATACCGCCGaTGGGACCTCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 6_5G ATGATTAAAGTCAAACCAATAAACXJCGGAAGATACGTA NO:157 TGAQATCAG K ACCOCATTC CCGGCCGAATCAGCCGC TOGAAGCATGTATGTATGAAACCGATT GCTCGGGGGC
ACGTTTCACCTCGGCOGATAITACCGGGGCAAGCTAAT
CAGCATCGCCTCCTTRCATCAAGCCGAACATTCAGAGCT GAAOGCCAAAAACAGTATCAGCTGAGAGOGATGGCG
ACGCI GAAGAGTACCGTGAGCAAAAAGCGGGCAGTAC
G N'ATCCGCCATGCCGAAGAG RTCTTCOGAAAAAGG OGGCAGACCTT1 ATOGTOCAACGCCAGGATATCTGCG AGCGGGTACTATAAAAAGCTCXÍGCTTCAGCGAACAAGG
CGGGGTCTACGACATACCGCCGGTCGGACCTCATA1TTT GATGTATAAGAAATTGACGTAA
SEQID 6_tíD5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATGCGTA NO: 158 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAAC GATTTGCTCGGGGGC 286
ACGTTTCACCrCG GOATAT ACrGGOGCAAGCTOAT CAGCATCGCTrCCTTTCATCAAQCCGAACATTCAGAOCT TGAAGGCCAAAAACAQTATCAGCTGAGAGGGATGGCG
ACACTTOAAGGG ACCGCGAGCAAAAAGCGGGCAG AC
GCTTATCCGCCATGCCGAAGAGCTTCTrCaaAAAAAAG GCGCGQACCTTTTOTGGTGCAACGCCAGGACATCTGCG
AGCGGGTAC ATAAAAAGCTCGGCTTCAGCGAACAAOG
CGGGGTCTACGACATACCGCCGOrcaGACXTCATATTTT GATOTATAAGAAATTGACGTAA
SEQ ID 6_7D1 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:159 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGAri GCTCAGGGGT GCGTTTCACC CGGTGGATATTACCGGGGCAAGCTOATC
AGCATCGCrTCCTTTCATCAAGCCGAACATTCAGAGCrT GAAGGCCAAAAACAGTATCAGCTGAGAGGOATGGCQA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG rrATCCGCCATGCCGAAGAGCTTrCTI CGGAAAAAGGG GGCAGACCTT TATGGTGCAACGCCAGOACATCrOCGA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAOGC
GGGGTCTACGACATACCGC03GTCGOACrrClATATTTrG ATGTATAAOAAATTGACGTAA
SEQ ID 6_8H3 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 160 TOAQATCAGGCACCG ATTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATOTATGAAACCGATTTQCTCGGGGGC
AC rmCACCTCGGTGGATATTACCGGOG<^AGCTOATC AÜ AT C XJrCCrrrcATCAAGCCGAACATCCAGAGCTT GAAGOCCAAAAACAGTA CAGCTGAGAGGGATXMCGA
CGCTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGTAC
GCT ATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAG
QCQCQOAC l 1 ? ? ATOGTGC A ACGCC AGG ACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGGGG CTACGACATACCGCCGGTCGGACCTCATATTTT
OATGTATAAGAAATTGACGTAA
SEQ ID 6_9G11 ATGATTGAAGTCAAACCAATAAACGCGOAAGATACGTA N0-.161 TGAGATCAGGCACXX ^ATTCTCCGGCCGAATC^GCCXJC TOOAAGCATGCAAGTATOAAACCGAT TGCTCGGGGOC
ACGCTTCACCTCGGTGOATATTACCGGGGCAAGCTGAT
CAGCATCG ITCC TrCATCAAGCCGAACATTCAGAGCT 1 TGAAGGCCAAAAACAGTATCAGCTQAGAGGGATGGCG ACGCTTGAAGGG ACCGCQAGCAAAAAGCGGOAAGTA (XK TATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAA GQCGC 3GAC TTTTATQGTGCAACGCCAGGACATCTGC GAGCGGGTACTATAAAAAOCTCGGCTTCAGCGAACAAG
GCGAAGTCTACGACATACCGCCGGTCGGACCTCATATTT
TGATGTATAAOAAATTGACGTAA
SEQ ID 6F1 ATOATTGAAG CAAACCAATAAACGCGGAAGATACGTA NO:162 TGAGATC A GGC ACCGC AT7"CTCCGGCCG AATC AGCCGC TTOAAOCATO ATGTATGAAACCOATITGCrCGGGOGT A XJl'ríXJACX CGGTGOATArrAC GGGGCAAGCrGG C TGCATCOCTTCCTTTCATAAAGCCGAACATTCAGAGCrT 287
GAAOGCCAAAAACAOTATCAGCTGAGAGGOATGGCOA
CGCTTOATGGATACCGCGAGCAAAAAGCGGGAAGCACG
CTCATCCGCCATGCCGAAGAGCTTCTTCGAAAAAAAGG
CGCGGACCTTTTATGGTGCAATGCCAGGACATCTGTGA
GCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGGTCGGACCTCATATITTG
ATGTATAAGAAATTGACGTAA
SEQ ID 7_1C4 ATGATTGAAGTCAAACCAATAAACGCOGAAGATACGTA NO: 163 TGAGATCAGGCACCGCATTCTCCGOCCGAATCAGCCGC TGOAAGCATGTATOTATGAAACCGATTTGCT XK 3GGC ACGlllCACCTCGGTGGATATTACCGGGOCAAGCTGATC AGCATCGCnxX U CATCAAG^CGAGCATCCAGAGCIT GAAGG CAAAAACAGTATCAGCTGAGAOOGATGGCGA
CACTrGAAGAGTACCGCGAGCAAAAAGCGGGCAÜTACü CITATCCOCCATGCCGAAGAGCTTCTTCC JAAAAAAGG
CGCGGACCTTTTATOGTGCAACGCCAGGACATCTGCGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGA AC AAGGC
GOGGTCTACGATATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGACGTAA
SEQ ID 7.2A10 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 164 TGAGATCAGGCACCQCATTCTCCGGCCGAATCAGCCOC TGGAAGCATGCAAGTATOAAACTGATTTGCTCGGGGGC
ACGTTTCATCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCOA
CGCTTGAAGGGTACCGCGAGCAAAAA GCGGG AAGCAC
GCTCATCCGCCATG XX AAGAG JI CTTCGGAAAAAAa GCGCGGACCTTTTATGGTGGAACGCCAGGACATCTOCG
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGGGGrC ACGATATACCGCCGATCGGACC CATATTTT GATGTATAAGAAATTGACG AA
SEQ ID 7.2A11 ATGATTGAAG CAAACCAATAAACGCGGAAGATACGTA NO: 165 TGAOATX1AGGGACCGCATTC CCGGCCGAATCAGCCGC TTGAAGCATGTATGTATOAAArXX3ATTTGCTCGGGGOC ACGTTrCACCrcOGTCGATATTACCGGGGCAAGCTGATC AGCATCGCTTCC rrCATCAAGCCGAACATTCAGAGCTT OAAGGCCAA AA ACAGTATCAGCTOAOAOGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGTAC
OCTTATCCGCCAT0CCGAAGAG rrCTTCGGAAAAAGG GX3GCAGACC1T1 ATGGTOCAACGCCAGGACATCTGOG AOCGOGTACTATAAAAAGCTCGGCTTCAGCGAACAAGG
CGGGGTCT ACG AC AT ACGGCCGGTCGGACCTC ATATTTT
GATGTATAACJAAA'ITGACGTAA SEQ ID 7_2D7 ATGAT1X1AAG CAAACCAATAAACGCGGAAOAT ACOTA NO: 166 TGAGATCAGGCACCGCATTCIXX GGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTOCTCOOGGGC
ACGTTrcACGTCGGTGGATATTACCGGGGCAAGCTGATC AGCATCGCCTCC rTCATCAAGGCGAACATrcAGAGCTT GAAGGCCAAAAACAfffATCACICrGAGAGGGATGGCGA CGCTTGAAGGOTACCGTGAGCAAAAAGCGGGAAGTACG 289
AGCOGGTACTATAAAAAG rCGOCTTCAGCGAACAOGG CGAA(-TCTACGACATACX:GCCGACTGGaCCCCATA,],l'l'l' GATG ATAAGAAATTGACGTAA
SEQ ID 9_15D5 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA N0: 171 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGACOCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTC ICATCA AGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACITO AAGOGTACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCraCCATGCCGAAGAOCTTCTTCGGAAAAAGGG GGCAGACCTCTrATOGTOCAACGCCAGGACATCTGCGA 0<X 3GTAC ATAAAAAGCTCaGCI CAGCGAACAGGGC GAAGTCTACGACATACCGCCGGTCGGACCTCATATriTG ATGTATAAGAAATTGACGTAA
SEQ ID 9_15D8 ATGATTaAAGTCAAACCAATAAACGCGGAAGATACGTA NO-.172 TGAGATCAGGCACCGCATACTCCGGCCGAATCAGCCOC TTGAAGCATG ATGTATOAAACCGATTTG rCGGGGGT ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGGT C^GCATCGCCTC nTCATCAAGCTGAACATCCAGAGCT TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGGGTACCG GAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCCGAAGCGCITCITCGGAAGAAAG
GCGCGGAC LITIATGGTGCAACGCCAGGACATCTGCG
AGCGGGTACTATAAAAAGCTCGG TTCAGCGAACAG G
CGAAGTCTACGACACACCGCCGGTCGGACCCCATATTTT
GATGTATAAGAAGTTGACGTAA
SEQ ID 9_15H3 ATGATTGAAOTCAAGCCAATAAACGCGGAAGATACGTA NO:173 GAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCOC TTGAAQCATOTATGTATGAAACCOATATGCTCAOGGGT
GCGTTTCACCTCGGTGGATATTACCGGGGCAAGCrGATC AGCATCGCCTCC rrCATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCACGAGCAAAAAGCGGGAAGCAC
GCTCATCCGCCATOCCGAAGAGCT CTTCGGAAAAAAa GCGCGGACCTTTTATGGTGCAACGCCAGGACATXJTGCG
AGCGGGTACTATAAAAAGCltXKK-TITAGCGAACAGGG CGAAGTCTACAACACACCGCCGGTTGGACCTCATATTTT
GATGTATAAGAAATTGACGTAA
SEQ ID 9_18H2 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:174 TGAGAT IAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATOTATGAAACCGATTTOCTCGGGGGC
ACGTTrCACCTCGGCGGATATTACCGGGGCAAGC GAT CAGCATCOCCTCCTTTCATCAAGCCGAACATCCAGAOCT
TQTAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACA
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAGGG
GOCAGACClll ATGGTGCAACGCCAOaACA CTGCGA GCGGQTACrATAAAAAGCrCGGCTTCAGCGAACAGGGC QAAGTCTACGACATACCGCCGCriXXXJACCTCATATTTTG ATGTATAAGAAATTGACGTAA SEQ ID 9_20F12 ATGATTGAAGTAAAACCAATAAACOCGGAAGATACGTA NO: 175 TOAGATCAGGCAC GCGTTCTCCGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTI CACCTCGGTGIGATATrAC^GGGGCGAGCTGG C AGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGTGAGCAAAAAGCGGGCAGTACG
CT ATCCGCC ATGCCGAAG AGCTTCTTCGOAA AAA AGO
CGCGGACCTTT GTGGTGCAACGCCAGGACATCTGCGA
GCGGOTACTATAAAAAGCTCOGCTTCAGCGAACAAGGC
GGGGTCTACGACATACCGCC<K3TCGGACCTCATATT1 G ATGTATAAGAAATTGACGTAA
SEQ ID 9 J21C8 ATGATTGAAGTCAAACCAATA A ACOCGGAAGATACGTA NO: 176 TGAGATCAGGCACCGCATrCTCXGGCCGAATCAGCCGC TGGAAGCATGTATGTATGAAACTOATI GCTCGGGGaC ACGTTTCACCTCGGCGGATATTACCGGGGCAAGCTGAT
CAGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTOAGAGGGATGGCa ACACTCGAAGGATACCGCGAGCAAAAAGCGGGCAGTA
COCTAATCCOCCATXK:CGAAGAGCTTCrrCGGAAAAAO GGGGCAGACClXrn'ATGGTGCAACGCCAGGACATCTGC GAGCGGGTACTATAAAAAGCTCGGCTTCAGCGATCAGO
GCGAAGTCTACGACATACCGCCGGTCGGACCTCATATTT
TOATGTATAAOAAATTGACGTAA
SEQ ID 9J22B1 ATOATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:177 TGAGATAAGGCACCOCATCCTCCGOCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGTT CACCrCGGTGGATATTACCGGGGCAAGCrGGTC AGCATCGCCTXXTTTCATCAAGCCOAACATCCAGAGC r GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGTGAGCAAAAAGCOGG AGTACG
CTTATCCX XATGCCGAAGAGCTTCTTCGGAAAAAGGG
GGCAGAC l^'l 'ATOGTGCAACXXXIAGGACATCTCK-XiA GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGA rTACCGCCGACCGGACCCCATATTTTG ATGTATAAGAAATTGACGTAA
SEQ ID 9_23A10 ATGATraAAGTCAAACCAATAAACGCGGAAGATACGTA N 178 TOAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAACJCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGCTTCACCTCOOTGGATATTACCGGGGCAAGCTCGT
CAGCATTGCTRCCTTTCATCAAGCCGAACATCCAGAGCT
TGAGGGCCAAAAACAOTATCAGCTGAGAOGGATOGCG
ACACTTGAAGGGTACCGCG KX:AAAAAOCGGGCAGTAC GCTTATCCGCCA'IG XGAAGAGCTTCTTXX}GAAAAAGG QGGCAQACCTT RATX3GTOCAATOCCAGGACAT TGCG AGCGGOTACTATAAAAAOCTCGGCTTCAGCGAACAAOG
CGGGGTCTA(XIACATACCGC( K3TX:GGACCTCATATTTT GATOTATAAGAAATTGACOTAA
SEO ID 9_24F6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA 291
NO:179 TOAOATCAGGCACCGCATTCTCAGGCCGAATCAOCCGC TAGAAGCATGCAAGTATGAAACCGATTTGCTCAGGGGT
GCGTTTCACCTCGGTGGATATTACCGGGGCAAG rGATC AGC ATCGCCTC 1" I ' 1C ATCAAGCCX3 AACATTCAG AGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGA GGCGA
CACTTGAAGGATACCGTGAGCAAAAAGCGGGCAGTACG CnATCCGCCATGCCOAAGCGCTTCTTCGGAAAAAAOG CGCGGACCTTTTGTGGTGCAACGCCAGGACGTCTGCGA
GCGGGTACTATAAAAAGCTCGGCTrCAGCGAACAGGGC GAAGTCTACGACATACXT!GCCGACC^JGACCCCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID 9_4H10 ATGATTGAAGTCAAACCAATAAACGCOGAAGATACGTA NO: 180 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAOCATGCAAGTATGAAACTGATTTGCTAGGGGGT
ACGCTTCACCTCGGTGGATATTACCGGGGCAAGCTGAT CAGCATCGCC CCTTTCA CAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGGGTACCGTGAGCAAAAAGCGOOCAGTAC
GCTTATCCGCCATGCCGAAGAG ITCTTCGGAAAAAGG
GCGCGGACCTTATATGGTGCAACXJCCAGGACATCRACXJ
AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGOG
CGAAGTCTACOACATACCGCCGOTCGOACC CATATRRT
GATGTATAAGAAATTGACATAA
SEQ ID 9_4H8 ATGATTGAAGTCAAACCAATAAATGCGGAAGAT ACOTA N0:1S1 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGAGGC
ACGTTTC ACCTAGGTGGAT ATT A CCGGGGCA AGCTG AT
CAGCATCG ITCCTTTAATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACACTTGAAGGGTACCGTGAGCAAAAAGCGGGCAGTAC
GCTTATCCGCCATGCX^AAQAGCTICI CGGAAAAAGG GGGCAGACCTTTrATGGTGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
CGAA0TCTACGACATAC 3CCGGTtX3GACCI ATATlTr GATGTATAAGAAATTGACATAA
SEQID 9_8H1 ATGATTGAAGTCAAACCAATAACCGCGGAAGATACGTA NO:182 TGAGATCAGGCACCGCATTCTCC - X!GAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGArrTGCTCOGGGGT ACGTTTCACCTCGGTGGATATTACCGaGGCAAGCTGATC AC ^ATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTAGAAGGGTACCGCGAGCAAAAAGCGGGCAGTAC
G CATC !GCCATGCCGAAGAGCTTCTTCGGA^ GGGCAGA<X-TTTTATGGTGCAACGCCAGAACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGGG
COAAQTCTACGACATACCGCXXjACCGaACCCCATATTTT GATOTATAAGAAATTOACGTAA
SEQ ID 9_9H7 ATOATTGAAGTCAAACCAATAAACGCGGAAGATGCGTA NO:183 lOAGATCAOGCACCGCATTCTCCGGCCGAATCAGCCOC TGGAAQ<^TGCAAGTATOAAACCGATTTGCTCGGGAaC 292
ACGTTTCACCTCGaiOGATATTACCGGGGCAAOCTGATC AGCATCGCCTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGAGTACCGCGAGCAAAAAGCGGGAAGTAC
GCITATCCGCCATGCCG AAG AGCTTCTTCGGA A A AAAG
GCGCGGAC rrriATGGTGCAACGCCAGGACATCTGCG AGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGOG
CGAAGTCTACGACATACCG :CTGTCGGACCrCATATTTT GATGTATAAGAAATTGACGTAA
SEQ ID C6 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO: 184 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATI GCTCGGGGGT
ACGTT CACCTCGGTGGATATTACCGGGGCAAGCTGATC
TGCATCGCCTCCTI CATCAAGC :GAACATTCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CGDTGAAGGGTACCGCGAGCAAAAAGCGGGAAOTAC
GCTTATCCGCCATGCCOAAGAGCTTCTRCAOAAAAAGG
GGGCAGACCrillATGGGCAAT- TCAGGACArcrG G AGAGGCrACTATGAAAAGCTCGGCTTCAGCOAACAAGG CGGGGTCTACGATATACC' JCCGATCGGACXJrCATATTTT GATGTATAAGAAATTGGCGTAA
SEQ ID 9H11 ATGATTGAAGTC AAACCAA T AAACOCGGAAGATACGTA NO: 185 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCOT TGGAAGCATGCAAG ATGAAACCGATTTGCTCGGGGGT
ACGTTTC ACCrCGGCGG AT AT ACCGG GGC AAGCTGAT CAGTCATCGXrTTCCTITCATAAAGCCGAACATTCAGAGCr TGAGGGCGAAGAACAGTATCAGCTGAGAGGGATGGCG
ACGCTTGAAGGATACCGTGAGC\AAAAGCGGGAAGCA CGCTCATX GCCATGCXX5AAGAG TTCTTCOGAAAAAG GGGGCAGA(XTTTTATGGTGCAATGCCAGGACATCTGT GAGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTCTACGACATACCGCCXiATCGGACCTGATATTT TGATGTATAAGAAATTGACGTAA
SEQ ID O ffilO ATGATAGAAGTGAAACCGATTAACGCAGAGGATACCTA NO: 186 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAGCGATTTAC TCGTGGTG
CATTTCACTTAGGCOGCITI ACACKX}aCAAACTGATTT CCATAGCTTGATTCCACX:AGGCCGA K^ACTCAGA(XTCG AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGATGAOAAAOCGGGATCGACTCT
AATTAAACACG TOAAGAAATTOTCGTAAGAGCJGC JG
CGGACATXX7TTTGGTGGAATGCGCGGACAACCGCCTCA GGCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAOA
GATATTTGATACGCCGCCAaTAOGACCTCA ATCCTGAT GTATAAAAGGCTCACATAA
SEQ ID 0_5B11 ATGATAOAGGTOAAACCaAT AACaCAGAGGATACCTA NO: 187 TOAAC AAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAG ¾ATTTACTTCGTGGTG CATTrcACTTAGGCGGCTTTrACGGGGGCAAACTGATTT (XATAGCnx:AlTCCA(XAGGCOTAGCACrcAGACCTCG 293
AAGG^CAGAAACAGTACCAGCTCCOAGOTATGGCTACC TTQGAAGGTrATCaTGATCAOAAAGCOGGATCaACTCT AATTAAACACGCTGAACAACTTCTTCGTAAGAGGGGGG
CGGACATGCTITGOTGCAATGCGCGGACATCCGCCrCA GGCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGA
GGTATTTGAAACGCCGCCAGTAGGACCTCACATCCTGA
TGTATAAAAAGATCACA
SEQ DD 0_5B3 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO: 188 TGAACrAAGOCATAOAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAACCGArrTACTTCGTGGTG C:ATTTCACTTAGGCOGCTTTrACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAOGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTA GG rACC TTGGAAGGTTATCGTGATCAGAAAGCX3GGATCGAGTCT AATTAAACACQCTGAACAACT C rCGTAAGAGGGOGO CGGACTTGCTI GGTGCAATGCXXX3GACATCCG< rCAG GCTACTACAAAAAOTTACiGCTTCAGCGAGCAGGGAGAG GTAlTrGATACGX:GCCAGTAGGACCrCACATC rGATG TATAAAAGGATCACA
SEQ ID 0_5B4 ATO I AGAGGIGAAACTGATTAACGCAGAGGATACCTA NO:189 TGAACTAAGGCATAGAATACTCAGACCAAACCAOCCGT TAGAAGCGTGTATGTATGAAACCGATTTACrrCGTGG G C ATTTC ACTT AGGCGGCTTTT AC AGGGGCAAACTG ATTT
CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCG
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGC ACC
TTGGAAGGTTTTCGTGATCAGAAAGCGGGATCGAGTCT
AATTAAACACGCrGAAGAAATrCTTCGTAAGAGGGGGG CGAACTTGCTTTGGTGTAATGCGCGGACATCCGCCTCAG
GCTACTACAAAAAGTTAGGCTTCAGCGAOCAGGGAGAG
GTATTTGATACGCCXXXÍAGTAGGACCTCACATCCTGATG
TATAAAAGGATCACA
SEQ ID 0_#B8 ATGATAGAGG GAAACCGATTAACGCAGAGGATACCTA NO:190 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAOCGArTTACT CGTGOTG CATTTCACTTAGGCGGC TTTACAGGG(3CAAAC GATrT CCATAGCTTCAT CCACCAGGCCGAGCACTCAGACCTCC
AAOGCCAGAAACAGTA(XAGCTCCGAGGTATGGCTACC TTGGAAGGTTATCGTGATCAGAAAGCGGGATCGAGTCT
AATTAGACACGCTGAACAAAT C TCGTAAGAGGGGGG
CGGACTTG C TTGGTGC A ATGCGCGGACATCCGCCTCAG
G TACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
ATATTTGATACGCCGCCAGTAGGACCTCACATCCTGATG
TATAAAAGGCTCACA
SEQ ID 0_5C ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO: 191 TGAAC AAGGCATAAAATACTCAGACCAAACCAGCCGT TAGAAGCGTGTATGTATOAAACCGAl TACrrCGTGGTG C^TTTCACI AGGCGGCI I'IACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAGGCCGAOCACTCAGGCCTCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCrACC TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGAGTAT | 294
AAT AAACACGCTOAAOAAATTCTTCGTAAGAAOGGGG XjGACTTOC TTGGTGCAATGCGCGGACC rCCGCCTCAG GCTACTACAAAAAGTrAGO TTCAGCGAGCAGGOAGAG ATATTTGACACGCCGCCAGTAGGACCTCACATCCTGATG TATAAAAGGATCACA
SEQ ID 0_5D11 ATGATAGAGG GAAACCGATTAACGCAGAGGATACXjrA NO: 192 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAGCGATITACrTCGTGGTG CATTTCACTTAGGCGG- TTTACAGGGGCAAACTGATTT CCATAGCTTCATTCCACX;AGGCCGAGCACTCAGACCTCC AAGGCCAGAAACAGTACCAOCTCCGAGGTATGACTACX: TTGGAAGGTTATCGTGAOCAGAAAGCGGGATCGACTCR
AATTAGACACGCTGAACAACTTCT1 GTAAGAGGGGGG CGGACTTGCTTTGGTOCAATGCGCGGACATCCGCCTCAG
GCTACTACAAAAGGTTAGGCTTCAGCGAGCAGGGAAAG
GTATTTGATACGCCGCCAGTAG 3ACCTCACATCCTGATG TATAAAAGGCTCACA
SEQ ID 0_5D3 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO: 193 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAGCGATTTACTTCGTGGTG CATTTCACTTAGGCGGC ATTACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC AAGGCCAGAAACAGTACCAGCrCCGAGGTATGGCTACC TIXMJAAGGTTATCGTGAGCAGAAAGCGGOATCGAG CT
AATTAAACACGCTGAAGAAATTCTTCGTAAGAGGGGGG
CGGA TTGCTTTGGTGTAATGCGCGGACATCCGCCTCAG
GCTACTACAAAAAGTTAGGCTTCAGCGAG AGGGAGAG
ATATTTÜAAACGCCGCCAGTAGGACCTCACATCCTGAT
GTATAAAAGGATCACATAA
SEQ ID 0_5D7 ATOATAOAAGTGAAACCGATTAACGCAGAGGAGACCTA NO: 194 TGAACTAAGGCATAGAATACI'CAGACCAAACCAGCCGA TAGAAGCGTGTATOTATOAAACCGATTTACTTCGTGOTG
CATT CACTTAGGCOG 'rrri ACAGGGGCAAACIOATTT CCATAGCTTCATTCCACCAG< :CGAG :ACTCAGAACTC GAAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTAC
CTTGGAAOG TATCGTGATCAGAAAGCGGGATCGAGTC
TAATTAGACACGCTGAACAACTTCTTCGTAAGAAGGGG
GCGAATATXXRITTGGTGTAATGCGCGGACAACCGCCTC
AGÜCTACTACAAAAAGHTAGGCTTCAGCGAGCAAGGAG
AGATATI GATACACCGCCAOTAGGACC CACATCXNO
ATOTATAAAAGGATCACA
SEQID 0_6B4 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACX TA NO:195 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTA' GAAAG ^GATTTACTTCGTGGTG (^CTTCACrrAGGCGGCrn ACAGGGOC^AACTGATrr CCATAGCI CAlTCCACCAGGCCGAG ACTCAGACtrCC AAGGCCAGAAACAGTACCAGCTCCGAOGTATGGCTACC
TTGGAAGürn'rcGTGATCAGAAAGCGGGATCGAGTCT AATTAGACACG rGAACAAATTCTTCGTAAGAGGGGGG CtX3ACTTGCT IX3GTGCAATGCGCGGACATCCGCCTCAG 295
GCTACTACAAAAAOTTAO<3CTTCAGCGAGCAO<JGAAAG GTAnTGATACGCCGCCAGTAGGACCTCACATCCTGATG TATAAAAGGATCACA
SEQ BD 0_6D10 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO: 196 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGT TAGAAGTGTGTATGTATGAAACCGATTTACTTCGTGGTG
CATTTCACT AGGCGGCTTI ACAGGGG AAAC GATTT
CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGOCTACC
TTQGAAGGTTATCGTGATCAGAAAGCGGGATCGAGTCX
AATTAGACACGC GAACAAATTCT CGTAAGAGGGGGG
CGGACATO^rrTGGTGCAATGCGCGGACATCCGCCrCA GGCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGA
GGTATTTGAAACGCCGCCAGTAGOACCTCACA'IXX'IXJA TGTATAAAAGGCTCACA
SEQ BD 0J5DH ATGATTGAAG CAAACCAATAAACGCGGAAGATACGTA NO: 197 TGAGATCAGGCACCGCATlXrrCCOGCCGAATCAGC G TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGCTTCACCTCGGTGGATATTACCGGGGCAAGCTGGT
CAGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCT
TGAAGGCCAAAAACAG ATCAGCTGAGAGGGATGGCG
ACGXnTGAAGOOTA(XG GAGCAAAAAGCGGGCAGTAC aC rATCCGCCATGCCGAAGAGCTTCrrCGGAAAAAGG GGGCAGAC 11 '1ATGGTG AACGCCAGOAC.ATCTGCG AGCGGGTACTATAAAAAG KX3G rrCAGCGAACAGGG CGAAGTX TACGACATACCOCCGGTCGQACCTCATATITT
GATGTATAAGAAATTOACGTAA
SEQ BD 0_6F2 ATGATAGAGGTGAAACCOATTAACGCAGAGGATACCTA NO: 198 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAG GTGTATGTATGAAAG GATTTACTTCGTGGTO
CATTTCACTTAGGCGGCTATTACAGGGGCAAACTGATTT
CCATAGCTTCAriCCACXlAG<X:CGAGCACTCAGAACTCC AAGGCCAGAAACAGTACCAGCTCCGAGGTA GGCTACC
TTGGAAGGT TTCGTGAGCAGAAAGCGGGATCGACTCT
AAT AOACACGCTGAACAAATTCTTCGTAAGAGGGGGG
CGGACATGCTTTGGTGCAATGCGCGGACATCCGCCTCA
GGCTACTACAAAAAGTrAGGCrTCAaCGAGCAOGGAGA GATATmATACOXXG^CAGTAGOACCTCACAT ^TGAT G ATAAAAGOATCACA
SEQ ED 0_6H9 ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:19 TGAACTAAGGCATAAAATACTCAGACCAAACCAOCCGA TAGAA XTrGTATGTATGAAACCGATTTACTTCGTGGTG CATTTCACTTAGGCGGCL'ri l ACGGGGGCAAACTGATTT CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCG
AAGGCCAGAAACAGTACCAGCTCCGAGOTATGGCTACC
TTGGAAGGTTATCGrGAGCAGAAAGCGGGATCGACTCr AATTAGACACGCTGAAGAAATTCTTCGTAAGAAGGGGG
COAACTTGCTTTGGTGCAATCCCKXX3ACATC^ GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
GTATTTGACACGCCGCCAGTAGOACCTCACATCCTGATO 296
TATAAAAQGCTCACA
SEQ ID 10_4C10 ATGATAGAGGTOAAACCGATTAACGCAOAGOATACCTA NO:200 TCAACTAAGGCATAAAATACTCAGACCAAACCAGCCGT TAGAAGTGTGTATGTATGAAACCGATTTA TTCGTGGTG
CATTTCACTTAGGCGGCTNTTACAGGGGCAAACTGATTT
CCATAGCTTCATTCCACCAOGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGC CCQAGGTATGGCTACC
TTGGAAGGTTATCGTGATCAGAAAGCGGGATCGAGTCT
AATTAAACACGCTGAACAAATTCr CGTAAGAGGGGGG CGOAC TGC'ri'l'GGTGCAATGCGCGGACATCCGCCTCA GGCTACTACAAAAAGTTAGGCITCAGCGAaCAGGGAGA GATATTrGATACGCCOCCAGTAGGACCTCACATCCTGAT G ATAAAAGGCTCACATAA
SEQ ID 10_4D5 ATGATAGAGGTGAAACCGATTAACGCAOAGGATACCTA NO-.2M TGAACTAAGGCATAGAATAC CAGACCAAACCAGCCGA TAGAAGTGTGTATG ATGAAACCGATTTACTTCG GG G
CA'IXrcACTTAGGCGGCTTTTACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCrCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGACTCT
AATTAQACACGC GAACAAATrCTTCaTAAGAGGOGGG CGGACTTGCTT GGTOCAATOCG<XíGACATCCOCCTCAO GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
GTAT GATACGCCGCCAGTAGGACCTCACATCCTGATG
TATAAAAGGATCACATAA
SEQ ID 10_4F2 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:202 TOLAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTTTGAAAGCGATTTACTTCG GGTG
CATTrcAC TAGGCGGCTTTTACAGGGGCAAACTGATTT CCATAGCTTX1ATTCCACCAGGCCGAGCACTCAGAACTCC AAGGCCAGAAACAGTACCAGCTCCGAÜGTATGGCTACC
TTGGAAGGTTATCG GAGCAGAAAGCGGGATCGAGTCT
AATTAG ACACGCTG A GAAATTCTTCGTAAG AGGGGGG
CGGACATGCI TOGTOTAATGCQCGGACATCCGCCTCA
GGCTACTACAAAAAGTTAGGCrrCAGCGAGCAGGGAGA GATATTTOAAACGCCGCCAGTAGGACCTCACATCCTGA
TGTATAAAAGGCTCACATAA
SEQ ID 10_4F ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:203 TGAAC AAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGTGTGTATGTATGAAACCGATTTACT CGTGGTG
GATTTCACTTAGGCXW ITrACAGGGOCAAACTGATTT CGATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGOAAGGTTTTCGTGAGCAGAAAGCGGGATCOAGTCT
AATTAGACACGCTGAACAAATTCrTXX7rAAGAGGGGGG CGGACTTQCT^ X7TGTAATGCGCC 3ACATCCGCCTCAG GCTACTACAAAAAGT AGGCTTCAGCGAGCAGGGAGAG
ATATT GATACGCCGCCAG AGGACCrCACATCCTGATG TATAAAAGOCTCACATAA
SEO ID 10_4G5 ATGATAGAGG GAAACCGATTAACGCAGAGGATACCTA 297
NO:20 TGAACTAAGGCATAOAATACTCAOACCAAACCAGCCGA TAGAAQCGTGTATGTTTGAAAGCGATTTACTTCGTGOTG CATT CACTTAOGCGGCTATTACAGOGGCAAACTGATTT CCATAG TCATTCCACCAGGCCGAGCACTCAGACCTCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC TTGGAAGGTTACCGCOATCAGAAAGCGGGATCGAGTCT AATTAGACACGCTGAACAAATTCTTCGTAAGAGGGGGG CGGACnXK rrGGTGíTAATGCGCGGACATCCGCCTCAG GCTAC ACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG ATATlTGATACGCCGCCAGTAGGACCrCACATCCrGATG TATAAAAGGCTCACATAA
SEQ ID 10_4H4 ATGCTAOAGGTGAAACCQATTAACGCAGAGGATACCTA NO:205 TGAACTAAGGCATAAAATACTCAGACCAAACCAG CGT TAGAAOTGTOTATGTATGAAACCGATT ACTTCGTGGTG
CATIRCACTTAGGCGGCTTTTACAGGGGCAAACTOATTT
CCATAGCTTCAT CCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGAGTCT
AATTAAACACGCTGAAGAAATTCTTCGTAAOAGGGGGG
CGGACTTGCTTTGGTGCAATGCGCGGACATCCGCCTCAG
GCTACTACAAAAAQTTAGGCTTCAGCGAGCAGGGAQAG
GTATTTGATACGCCaCCAGTAGGACCTCACATCCTGATG TATAAAAGGATCACATAA
SEQ ID 11_3A11 ATGATAGAAGTGAAACCGATTAACOCAGAGGATACCTA NO:206 TGAACTGAGGCATAAAATACTCAGACXAAACCAGCCGA TAGAAGTGTCTTATGTATGAAAGCGATTTACTTCGTGGTG
CATTTCACTTAGGCGGCT ITACAGGGGCAAACTGATTT
CCATAGCGTCATTCCACCAGGCCGAGCACCCAGACCTC
CAAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTAC
CTIX 3AAAAITATCGTGATCAGAAAGCGOGATCGAGTC TAAllAAACACGCTGAACAAATrCrTCGTAAGAGGGGG GCGGACITGCTTrGGTGCAATGCGCGGACATX GCCrCA GGCTACTACAAAAAGTTAGGC1TCAGCGAGCAGGGAGA GG ATTTGAAACGCCGCCAGTAGGACCTCACAIXXTOA
TGTATAAAAGGCTCACATAA
SEQ ID 11_3B1 ATG TAGAGOTGAAACXXJATTAACGCAGAGGATACCrA NO:207 TGAACTGAGGCATAOAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTTTGAAACCOATT ACTTCGTGGTO
CATTTCACI AGQCGGCT TTACAGGGGCAAACTGATrr CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAGTACCAACTCCGAGGTATGGCTACC
TTGGAAGGTTTTCOTGAGCAGAAAOCGGOATCGACTCT
AArrAGACACGCTGAAGAAATTC TCGTAAGAGGGGGG CGGACTTGCTTTGGTGCAATGCGCGGACATCCGCCTCAG
GCTACTACAAAAGGTTAGGCTTCAGCGAGCAGGGAGAG
ATATT GACACGCXX ^AOTAGGGCCTC^CATCCTGATG TATAAAAGGCTCACATAA
SEQ ID 11_3B5 ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:208 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAQAAC<XnOTATGITroAAAC<X3ATTTACITCX3TC 298
CATI CACTTAGGCCKJCTATTACAGGGGCAAACTGATTT
CCATAGCGTCATTCXTACCAGGCCGAGC^CrcGGAACrC CAAGGCCAGAAACAGTACCAGCTCCOAOGTATGGCrAC CrrGGAAGGTrATCG GATCAGAAAGCGGGATCGAGTC TAATTAGACACO GAACAAATTCTTCGTAAGAGOGGG
GCO ACATGKTTrGGTGCAATGCGCGGACATCCGCCTC AGGCTACTACAAAAAGT AGGCTTCAGCGAGCAGGGAG
AGGTATTTGATACGCCGCCAGTAGGACCTCACATCCra ATGTATAAAAGGATCACATAA
SEQ ID 11_3C12 ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:20 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCOT TAGAAGTG GTATGTATGAAACCGATTTACITCGTGGTG
CATTTCACTTGGCKX3GC1 '1 ACG<KKK ;AAACTGATTT CCATAGCGTCATTCCACCAGGCCGAGCACCCAGACCTC
CAAGGCCAGAAACAGTACCAGCTCCGAGGTATOGCTAC
CTTGGAAGGTTATCOTGATCAGAAAGCGGGATCGAOTC
TAATTAGACACG rGAACAACITCrrcGTAAOAGGGGO GCCiGAC TG<I I GGTGCAATGCGCG 3ACATCCGC rCA GGCTACTACAAAAAGT AGGCrrCAGCGAGCAGGGAGA GATATTCGAAACGCCGCCAGTAGGACCTCACAIXXTOA
TGTATAAAAGGATCACATAA
SEQ ID 11_3C3 ATGATAGAAGTGAAACCGATTAACGCAGAGGATACCTA NO:210 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAOCGATTrACTTCGTGGTG CACrrCACTrAGGCGOCrArrACAGGGGCAAACTGATTr CCATAGCGTCATTCCACCAaGCCGAGCACTCAGAACTC CAAOGCCAGAAACAGTACCAGCrCCGAGGTATGGCTAC TTGG A AGGTT ATCGTG AGC AG A A AGCGGG ATCG AGTC
TAATTAAACACGCTGAAGAAATTCTlXXiTAAGAGGGGG GCGGACT GCTITGGTOCAATGCGCGGACATCCGCCTCA
GGCTAC ACAAAAAGTrAGGCTTCAGCGAGCAGGGAGA GGTATTraACACGCCGCCAGTAGOACCTCACAT X GAT G ATAAAAGGATCACATAA
SEQ ID 11_3C6 ATGCTAOAOGTGAA ACCGATTAACGCAGAGGATACCTA NO:211 TOAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGCX3TGTATGTTTGAAAGCGATT ACT CGTGOTG CATTTCACTTAGOCGG ITrTACG XK3G AAACTGATrT CCATAGCTTCATTCCACCAGGCCGAGCACTCAOACCTCG
AAGGCCAGAAACAGTACCAGCTCCGAC JTATGGCTACC
I GGAAGGTTATCGTGAGCAGAAAGCGGGATCGACTCT
AATrAGACACGCTGAAGAAATTCTTCGTAAOAGGGGGG CGGACTTGC TTGGTGCAATGCGCG 5ACATC _X¾rCTCAG GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAQAG
ATATTTGATACGCCGCCAGTAGGACCTCACATCCTGATG
TATAAAAGGATCACATAA
SEQ ID 11 _3?? ATOATAGAGOTGAAACCGATTAACOCAGAGGATACCTA NO:212 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAGAAGTGTG ATOTATOAAACCX3ATTTACTTCG GGTG CAlTn-AC rAGG«K TITACAGGGOCAA CTGA^ CCATAG TTCATTCCACCAGGCCGAGCACTCAGACX CC 300
CTTATTAGOCACGCCGAOCAOATACTACGOAAAAOAOO GGCAGATCTGCTTrGGTGCAATGCACGCACGACAGCCG CCGGTTAC ATAAAAGGCITGGTTrTAGTGAGCAGGGC GAAGTTTTCGACACCCCGCCGGTTGGGCCGCACAI JAJIT ATGTACAAAAAACTCACT
SEQ ID 1_2A12 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACTrA N0.217 CGAACTrCGACACAGGATGCTGCGCeCTAATCAGCCGA TAGAGGCATGCAT jrATGAAAGCGAT rGC aCGGGGC TCGTTCCATTTGGGCGGGT CTATCGTGGCAAATTGATC
TCGATTOCGAU'1'l'lCCACCAAGC GAACAGTCAGAACT GGAAGGGCAAAAGCAGTATCAAT ACGAGGGATGGCG
ACCCTCGAAGGATACCGTGATCAGAAGGCTGGCTCTAC
GCTTATTAAGCACGCCGAGGAGATACTACGGAAAAAAG
GGGCAGATC GCTI GGTGCAATGCA(XKIACGTCAGCC GCCGGTrACTATAAAAGGCTTGGTnTAGTGAGCAGGG CGAAAl ri CGACACCCCGCCGGTTGGGCCGCACATTCT TATGTACAAAAGACTCACT
SEQ ID 1_2B6 ATGATAGAAGTGAAACCTATTAACGCAGAGGAGACTTA NO:218 CGAACTTCGACACAAGATCCTGCGCCCTAATCAGCCGTr AÜAGGCATGCATGTATGAAACCGATCTGCTGCGGGGCT
CGTTCCATTTGGGCGGCriTCTATOTrGOCAAATTaATCT CGATTGCGAGTTTCCACCAAGCTGAACACTCAGAACTG
GAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCGA
CCCTCGAAGGATTCCGTGATCAGAAGGCIOGCTCTTCGC; TTATTAAGCACGCCGAGGAGATACTACGOAAAAGAOGG
GCAGATCTGCTTTGGTGCAATGCACGCACGTCAGCCTCC
GGTTACTATAAAAAGCTTGGTTTTAGTGAGCAGGGCGA
AATTTTCGAAA(XCCGCCGGTTGGG(XGCACA'ITCTTAT GTACAAAAGACTCACT
SEQ ID 1JSC ATGCTAGAAGTGAAACCTA1TAACGCAGAGGAGACTTA NO:219 CGAACn CGACACAAGATCCTOCOCCCTAATCAGCCGA TAGAGGCATGCATGTATGAAACCX3ATCTGCTGCGGGGC TCXn CCATnXX GGGTTCTATCGTGGCCAATTGATC TCGATTOCGAGTTTCCACCAAGCTGAACACTCAGACCTO
CAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCGAC
CCTCGAAGGATACCGTOAGCAGAAGGCIGGCTCTACGC
TTATTAAGCACGCCGAGGAGCrACTACGGAAAAAAGGG GCAGATCTGCTTTGGTGCAATGCACGCACGACAGCCGC
CGGTTACTATAAAAAGCTTG<jn TAGTGAGCAGGGCG A AGTTTTCG ACA(XCCGCCGGTTGGGC X C ACATTCTT A TGTACAAAAAAA CACT
SEQ ID 1_2D2 ATQATAGAAG GAAACCTATTAACGCAGAGGATACTTA NO:220 CGAACTTCGACACAAGATCCTGCGCCCTAA'rcAG XX}lT AGAGQCATGCATGTATOAAAGCGATXnX rrOCGGAGCG CATTCCATTTGGGGGGGTrCTATCaTOaCAAATTOA CT (XJAITGCGAOTTTCCACAAAGCTGAACACTCAGAACTG CAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCGAC
CCTCGAAGGATACCGTGATCAGAAGGCTGGCTCTTCGC
TTATTAGGCACGCCGAGGAGATACTACGGAAAAGAGGG
GCAGATATGCTI jraCAATGCACGCACGTCAGCCGC CGGTTACTATAAAAGGCTTOGTI TAQTQAGCAGOOCO AAC7TTTTCaACACCXCG üJrTGOOCCGCACATTCTTA TGTACAAAAGAATCACTTAA
SEQID 1_2D4 ATGATAOAAGTGAAACCTATTAACGCAGAGGATACTTA NO:221 CGAACITCGACACAGOATCCrOCOCCCTAATCAGCCGA TAGAGGCATGCATGTA GAAAGCGATCTGCTGCGGGGC
TCGTI XíAriTGGGCGGGTT rATCGTGGCAAATTGATC TCGATTGCGAGTTTCCACCAAGCTGAACACTCAGACCTG
CAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCGAC
CCTCGAAGGATACCGTGAGCAGAAGGCn KKTrcrrCGC TTATTAAGCACGCCGAGCAGCTACTACGGAAAAAAGGG aCAGATATGCriTGGTOTAATGCACGCACGTCAGCCGC CGQTTACTATAAAAGG r GOlTTTAGTGAGCACGGCG AAATTTTCGAAACCCCGCCGQTTGGX-C^ TGTACAAAAGAATCACT
SEQID 1.2F8 ATGCTAGAAG GAAACCrATTAACGCAOAGGATACITA N0:222 CGAAC TCGACACAOGATCC GCGCCCrAATCAGCCGTr AGAGGCATGCATOTATGAAACCGA CTOCT K^GGGCT CGTTCCATTTGXXTG GTTCTATCGTGOCAAATTGATCT
CGATTGCGAGTTTCCACCAAGCTGAACATTCAGAACTG
GAAOGGCAAAAGCAGTATCAATTACGAGGGATGGCGA
CTCTCGAAGOATACCGTGATCAOAACiGCTGGC CTTCG C rATTAKJCACGCCGAOOAGATACTACGGAAAAGAGG GJCAGATATG TTTGGTGCAATGCACGCACGACAGCCG
CCG3TRACTATAAAAAG RTGGTTTTAGTGAGCAGGGC GAAATTTACGACACCCCG:CGGITG<K3CCG:ACATTC T ATGTACAAAAAACTCACT
SEQID 1_2H8 ATGATAGAAG GAAACCTATTAACGCAGAGGAGACTTA NO:223 CGAACTTCOACACAAOATCCTCKX -CCTAATCAGCCOTT AGAGGCATG^ATOTATGAAACCGATCIOCTOCGGGGCG COTT ATTTGGGCGGGTICTATO3TOaCAA^ CGATTGCGAGTI CCACCAAGCTGACCACTCAGAACTG
CAAGGGCAAAAGCAGTATCAATTACOAGGGATGGCaAC CCrXX3AAGGATACa3 GAGCAGAAGGCTOGCTCTACGC TTATTAGGCACGCCOAOCAGATACTACGGAAAAGAGGG
GCAOATt ACITrGGTGCAATOCACCK^CGTCAGCCGC CG<JI ACTATAAAAAG<nTGG TTTAGTGAGCACGGCG AAATTTTCOAAAÍXCCGCCaGTTGGGCCOCACATTCrTA TGTACAAAAGACTCACTTAA
SEQID 1_3A2 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACTTA NO:224 CGAACTTCGACACAGGATCC GCGCCC AATCAGCCGA TAGA JCATGCAIOTA GAAAGCGATCTGC GCGGGGC
GCGTTXXATTTGGGCGGGT CTATCGTOGCAAATTOATC
TCGATTTCOAG ITCCACCAAG rGAACACTCAGACCTO CAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCGAC
CCTeGAAOaATACCGTOAOCAGAAOGCItK3CICrrCX3C T ATTAGGCACGCCGAGGAGATACTACGOAAAAAAGGG
GCAGATATG nTGGTGCAATGCACGCACGACAGCCGC COGTT ACTAT AAAAGG TTGG' l ?? AGTGAGC AGGGCG AAGTTTTCGACACCCCGCCG<3 TG3GCCGCACATTCTr 302
TOTACAAAAOAATCACT
SEQ ID 1_3D6 A1GATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:225 TGAAC AAGGCATAOAATACTCAOACCAAACCAGCCGA TAGAAGTOTGTATGTATGAAACCGATTTACTTCGTGGTG
CATTTCACTTAGGCGG<n TTACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAGGCC 3AGCACTCAGACCrCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGAGTCT
AArrAAACACGCTOAACAAATrCTTCG AAGAGGGGGG CGGACTTG 'i'I GGTGCAATGCGCGGACAT0 GCCTCAG GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
GTATTTGATACGCCGCCAGTAGGACCTCACATCCTGATG
TATAAAAGGCTCACATAA
SEQ ID 1_3F3 ATGATAGAAGTGAAA X! rATTAACGCAGAGGAGACTTA NO:226 CGAACTTCGACAGAGGATCCTGCGCCCTAATCAGCCGA TAGAGGCATGlCATGTATOAAAGCGATCTGCrGCGGGOC TCGTTCCATTTGGGCCK3GTTCTATCGTGGCCAATTGATC TCGATTWGAGTTTCCACC^GCTGAACACTCAGAACT GCAAGGGCAAAAGCAGTATCAATTACQAGGGATGGCG
ACCCTCGAAGGATACCGTGAGCAGAAGGCTGGCTCTAC
GCTTATT AA GC ACGCCGAGG AGATACTACGG AAAAAAG
GGGCAGATCTGCITrGOTGCAATGCACGCACGTCAGCC GCCGGTTACTATAAAAGGCrTGGTTTTAOTGAGCACOO CGAAATTI CGACACCCCGCCGGTTOGGCCGCACATrCT TATGTACAAAAGAATCACT
SEQ ID 1_3H2 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACTTA NO:227 CGAACTTGGACACAGGATCCTGCOCCCTAATCAGCCOA TAGAGGCATGCATOTATGAAACCGATCIOCTGCGGGOC
GCG TCCATTTGGGCGGGTACTATCGTGGCCAATTGATC
TCOATTGCGAGTTTCCACAAAG<nX3AAClACrcAGAACT ÜCAAGGGCAAAAGCAGTATCAATTACGAGGGATGGCG
ACCCTCGAAGGATACCGTGAGCAGAAGGCTGG rCTAC GCI ATTAAGCACGCCGAGCAGCTACrACGGGAAAAAG GGGC AGAT ATOCTTTGOTGC AATGC A CGCACGTC AGCC
GCXX yrTACTATAAAAGGCTraGTTTTAGTGAGCAGGG COAAGTTIT X CA(XCCaC«K)riOGGCC TATG ACAAAAAACTCACT
SEQ ID 1_ C5 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACTTA NO:228 CGAACTTCGACACAAGATCCTGCGCCCTAATCAGCCGA TAGA GGC ATGCATGT ATG AAAGCG AT TQCTGCGGGGC
TCX-TrCCATITC 3G<X 3GTlCrAT^ IX^GATTGCGAGTTTCCACAAAGCTGAACACTCAGACCT GGAAGGGCAAAACCAGTA CAATTACGAGGGATGGCG
ACCC COAAOGATACCGTGAGCAGAAGGCTGGCTCrAC GCTTATTAGGCACGCCGAGGAGATACTACOGAAAAGAG OaGCAGATATGCTTTGGTGCAATCCACGCACGTCAGCC TCCGGTrACTATAAAAGGCTTOG l rAGTGAGCACGGC GAAATTTTCGACACCCCGCCGGTIXX3GCCGCACATTCTT ATGTACAAAAGACrCACl AA SEQ ID 1„4D6 ATGCTAGAAGTGAAACCTATrAACGCAGAGGATACrrA 303
NO:229 COAACTTCOACACAGQATCCrcCGCCCTAATCAGCCOA TAOAGGCATOCATOTATOAAACCGATCTOCTOCOGGOC
TCG7TCCATTTGO<I XX GTTCTATCGTG ;CAATTGATC TCGATIGCGAGTTTCCACAAAGCTGAACACTCAGACCT
GGAAGGGCAAAAGCAGTATCAATrACGAGGGATGGCG ACCCTCGAAGGATACCXJTGAGCAGAAGGCTGGCTCTAC
GCTTATTAGGCACGCCGAGCAGATACTACGGAAAAGAG
GGGCAGATATGCTCTGGTGCAATGCACGCACGTCAGCC
GCCGGTTACTATAAAAGGCTTGGTrTTAGTGAGCAGGG CGAAGTTT CGAAACCCCGCCGGTTGGGCCGCACATTCT
TATGTACAAAAGACTCACT
SEQ ID 1_4H1 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACTTA NO.-230 CGAACTTCGACACAGGATCCTGCGCXX AATCAGCCGTT AGAGGCATGCATGTATGAAACCGATCTGCTGCGGGGCT
CGTTCCATTTGGGCGGGTTXJTATCGTGGCAAATTGATCT
CGATTGCGAGTTTXXACCAAGCTGAACACTCAGACCTG
CAAGGGCAAAAGCAG ATCAATTACGAGGGATGGCGAC
CCTCOAAGGATACCGTGAGCAGAAGGCTGGCTCTACGC
TTATTAGGCACGCCGAGCAGCTACTACGGAAAAGAGGG
GCAGATCTGCTTTGGTGCAATGCACGCACGTCAGCCTCC
GGT ACTATAAAAGGCTTGGTTTTAGTGAGCACGGCGA
AGTTITCGACACCCCGCCGGTTGGGCCGCACATTCTTAT
GTACAAAAGACTCACT
SEQ ID 1_5H5 ATGCTAGAAGTGAAACCTATTAACGCAGAGGAGACTTA NO:231 CGAACTTCGACACAAGATCCTGCGCCC AATCAGCCOTT AGAGGCATXK:ATGTATOAAAGCOATCTGCTGCOGGGCT CGTIXXATI GGGCGCIGTAC ATCG GGCCAATRGATCT
CGATTGCGAGTTTCCACCAAGC GAACACTCAGAACTG
GAAGGGCAAAAGCAGTATCAATTACGAGGGATGOCGA
CCCTCGAAGGAT CC!GTGAGCAGAAGGCTGGCTCTACG CTrATTAAGCACGCCGAGCAGATACTACGGAAAAGAGG GGCAGATATGCTTTGGTGCAATGCACGCACGTCAGCCQ C 3GTTACTATAAAAACKn Ojm AaTGAaCACGGC QAAATTI COACACX-XXaCCGGTraGa X ^ ATGTACAAAAAACTCACTTAA
SEQ ID 1_6F12 ATGATAGAAGTGAAACCTATTAACGCAGAGGAGACTTA
NO-232 CGAA niXXJACACAOGATCCTGCGCCCTAATCAGCCGA TAGAGGCATGCATGTATGAAAGCGATCTOCTGCOGGGC
TCGTTCCATTTGGGCGGGT CTATCOT l SCAAATTOATC TCGATTGCGAGTTra^CCAAGCTGAACACTCAGACCTA GAAGGGCAAAAGCAGTATXIAATTACGAGGGATGGCGA
CCCTCGAAGGATACXXrrOATCAGAAGG TGGCTCTACG CTTATTAAGCACGCCGAGGAGCTACTACGGAAAAGAGG
GGCAG ATATG C TTGGTGC AATGCACGC ACGTCAGCCG
CCGGTTACTATAAAAGGCTTGG n'rAG GAGCACGGC GAAATTTACGAAACCCCGCCGG TGGGCCX3 ACATTCTT ATGTACAAAAAAATCACT
SEQ ID 1_6H6 ATGATAGAAGTXjAAACCTATTAACGCAGAGGATACTTA NO:233 CGAACITOlACACAAGATCCTGCaCCCTAATCAGCCGA TAGAOGCATGCATGTATOAAAGCGATCTOCTGCGGGGC 304
TCOT CCATTTOGGCGGGTTCTATCGTaGCCAATTGATC TCGATTGCGAGTTTCCACCAAGCTOAACACTCAGACCTG
GAAGCGCAAAAGCAGTATCAATTACGAGGGATGGCGA
CCCTCXJAAGGATACCGTGATCAGAAGGCTGOC CT CG
CTTATTAAGCACGCCGAGOAGATACTACGGAAAAGAGG
GGCAGATCKKJirrGGTGCAATCiCACGCACGTCAGCCa CCGGTTAC ATAAAAGGCITGGTTTTAGTGAGCAGGGC
GAAATTTTCGACACCCCGCCGGTTGGGCCGCACATTCTT
ATGTACAAAAAAATCACT
SEQ ID 3_??10 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:234 TGAACTAAGGCATAOAATACTCAGACCAAACCAGCCGA TAGAAGCGTGTATGTATGAAAGCGATTTACTTCGTGGTG
CATTTCACTTAGGCGGCTATTACAGGGGCAAACTGATT
CCATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTArcGTGAGCAOAAAGCOGGATCGAOTCT AGTTAAACACGCTGAAGAAATTCTTCGTAAGAGGGGGG
CX ACTlX3CITrGGTGTAATGCGCGGACATCCGCCTCAG GCTAC ACAAAAAGTTAGGCTTCAaCGAQCAGGGAGAG ATATTIX3AAACGCCGCCAOTAGGACCTCACATCCTGAT GTATAAAAGGATCACATAA
SEQ ID 3_14F6 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:23S TGAACTAAGOCATAGAATACTCAGACCAAACCAGCCGA TAGAAGCGTG ATGTATGAAAGCGATTTACTTCGTGGTG
CAII CACI AGGCGGCTTTTACAGGGGCAAACTGATTT
CCATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAG rATGGCTACC TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGAGTCT
AATTAAACACGCTGAAGAAATTCTTCGTAAGAGGGGGG
CGGAC IOCTTTGGTGTAA GCGCGGACG CCGCCTCAG
GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
ATATTTGAAACGCCGCCAGTAGGACCTCACATCCTGAT
GTATAAAAOGCTCACATAA
SEQ ID 3_15B2 ATGCT AG AGGTG AAACCG ATTAACGCAGAGG ATACCTA NO:236 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGT TAGAAGTC7IXJrATGTATGAAACCGATTTACTT -nX3GTQ CATrTCACT AGGCGGCTATTACGGGGGCAAACTGATTT CGATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGAGCAGAAAGCGGGATCGAGTCT
AATTAAACACGCTGAAGAAATTCTTCGTAAGAGGGGGG
CGGACTTGCTITIXK3TGTAATGCGCGGACATCCGCC CAG GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
AT TTTOAAACGCCGCCAGTAGOACCTCACATCCTGAT
GTATAAAAGGATCACATAA
SEQ ID 3J5A10 ATOATAGAAGTGAAACCGATTAACGCAGAGGATACCTA NC 237 TGAACTAAGOCATAGAATACTCAGACCAAACCAGCCGA 'lAGAAGCaimATGTATGAAAGCGATTTACTrCGTGGTG CATTTCACTTAGGCGGCTATTACAGGGGCAAACTGATTT CCATAGCT CATTCCACCAGGCCGAGCACTCAGAACTCC 306
AATTAOACACGCTOAACAAATTCTTCGTAAOAOGGGGO
CGGACATOCT1 OGTGCAATGCQCGGACATCCGCCTCA GGCTACTACAAAAAGTTAOOCTTCAGCGAGCAGGGAGA
GATATTTGAAACGCCGCCAOTAGGACCTCACATCCTGA
TGTATAAAAGGATCACATAA
SEQ ID 5_2B3 ATGATAGAAGTGAAACCTATTAACGCAGAGGATACCTA NO:242 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGT TAGAAGTGTGTATGTA GAAACCXJAT ACTTCX3 GG G CATTTCACT AGGCGGCTTTTACGGGGOCAAACTGATTT
CCATAG ITCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTXIATCAGAAAGCGGGATCGAGTCT
AATTAGACACGCTGAACAAAT CTTCGTAAGAGGGGGG
CGOACATGCTTTOOTGTAATGCGCGGACATCCGCCTG^ GGCTACTAC AAAAAGTTAGGCTTC AG CG AG C AGGG AG A
GATATTTGAAACGCCGCCAGTAGGACCTCACATCCTGA
TGTATAAAAGGATCACATAA
SEQ JD 5_2D9 ATGCTAGANGTGAAACCGATTAACGCAGAGGATACCTA NO:243 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGN TAGAAGTGTGTATGTATGAAANCGATTTACTTCGTGGTG
CATTTCACTTAGGCGGCTTTTACAGGGGCAAACTGATTT
CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAOTACCAGCTCCGAGGTATGGCTACC
TTaGAAGGTTATCGTGATCAGAAAGCOGGATCGAGTCT AATTAAACACGCTGAACAAATTCITCGTGAGAGOGGGG
CGGACATG ITroGTG AATGCGCGGACATCCGCCTCA GGCTACrACAAAAAGTTAGGCrTCAaCGAGCAGGGAGA CKJTATTTGACACGCCGCCAGTAGGACCTCACATCCTGAT
OTATAAAAGGCTCACATAA
SEQ tD 5„2F10 ATGCTAGAAGTGAAACCTATTAACGCAGAGGATACCTA NO:244 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGTGTGTATOTATGAAACCOATTTACITCGTGGTG
CATTrcACTTAGGCGGCTn ACGGGGGCAAACTGATTT CCATAOCTTCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGATCAGAAAGCGGGATCGAGTCT
AATTAGACACGCTOAACAAATTCTTCGTAAGAGGGGGG
CGGACATOCrTTGOTQCAATGCGCGGACATX GCCTCA GGCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGA
GATATTTGAAACOCCGCCAOTAGGACCTCACATCCTGA
TGTATAAAAGGCTCACATAA
SEQ I 6_1A11 ATaCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA N0.2 5 TGAACrAAGG^TAAAATACTCAGACCAAACCAGCCGT TAGAAGTXnxrTATGTATGAAACCGATTTACTTCOTGGTC CATTTCACTTAGGCOGCTTTTACAGGGGCAAACroATTT CCATAGCarCATTCCACCAGGCCOAGCACTCAGACCTC CAAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTAC
CITGaAAGGTTATCGTGATCAGAAAGCGGGATCGAGTC TAATTAGACACGC GAACAAATTCTTCGTAAGAGGGGG
GCGGACATGCTTTGGTGCAATGCGCGGACATCCOCCTC GTATAAAAAGATCACATAA SEQ ID 6_1H4 ATGCTAGAAGTGAAACCGATTAACGCAGAGGATACCTA NO:250 TGAACTAAGGCATAAAATACT AGACCAAACCAGCCGT TAGAAGTGTGTATGTATGAAACCGATTTACTTmraOTa CATTTCACTTAGGCGGCITTTACGGGGGCAAACTGATTT
CCATAG 'l ltJATTCCACCAGGCCGAGC^<n^AGACCrCC AAGGCCAGAAACAGTACCAGCTCCGAGOTATGGCTACC
TTGGAAGGTTATCGTGATCAOAAAGCGGGATCGACTCT
AATTAAACACOCTGAACAAATTCTTCGTAAGAGGGGGG
CGGACATGCTnX3GTGCAATGCGCGGACArcCGCCTCA GGCTACTACAAAAAGTTAGGCrTCAGCGAGCAGGGAGA G JTATTraAAACGCCGCCAGTAGGACCTCACATCCTGA TGTATAAAAGGCTCACATAA
SBQ ID 8_IF8 ATOATAGAGGTOAAACCGATTAACGCAGAGGATACCTA NO-.251 TOAACTAAGGCATAGAATACTCAGACCAAACCAGCCGT TAGAAGTGTGTATG ATGAAACCGATTTACTTCOTGGTG CAlTTCACTrAGGCGGCTTTTACAGGGGCAAACTGATTT CCATAGCTTCATTCCACCAOGCCGAGCACTCAGACCTCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC TTGGAAGGTTATCGTGAOCAGAAAGCXKHjATCGAGTCT AATTAAACACGCTGAAGAAATTC rCGTAAGAGGGGGG CGGACTTGC TTGGTGTAATGCGCGGACATCCGCCTCAG GCTACTACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG ATA IXJATACGCCGCCAG AGGACCTCACATCCTGATG TATAAAAGGATCACATAA
SEQ ID S_1G2 ATGATAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:252 TGAACTAAGGCATAGAGTACTCAGACCAAACCAGCCGT TAGAAGTGTGTATGTATGAAACCGATTTACITCGTGGTG
CATTIX^CTrAGGCGGCTATTACAGGGGCAAACTGA"nT CCATAOCTTCAITCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAOCTCCGAGGTATGGCTACC
TTGOAAGGTTATCGTGAGCAGAAAGCGGOATCGAGTCr AATTAAACACGCTGAAGAAATT rTCGTAAGAGGGGGG CGGACTTGCTTTOGTGCAATGCGCGGACATCCGCCTCAG
GCrACTACAAAAAGTTAGGCTTCAGCOAOCAGGGAGAG GTATTTGAGA Y X^GCC^GTAOGACCrCACATCCTGAT GTATAAAAGGCTCACGTAA
SEQ ID 8_1G3 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACTTA NO.-253 CGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGA TAGAAGTGTGTATGTATGAAA( GATT ACTTCGTGGTG CATTTCACTrAGGCGGCTATTACAGGGGCAAACTGATTT CCATAGCrrCATTCCACCAGGCCGAGCACTCAGAACTCC AAGGCCAGAAACAGTACCAGCTCCGAGGTATGG TACC TrGGAAGGTrATCGTGAOCAGAAAGCGGGA CGAGTCT AATTAGACACG rGAAGAAATTCTTCGTAAGAGGGOGG CGGACrTO ITTGOTOTAATCCO<XK3ACATX:COCCTCAO GCTAC ACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
ATATTTGATACGCCGCGAG AGGACCTCACATCCTGATG
TATAAAAGGATCACGTAA
SEO ID 8_1H7 ATGCTAGAGOTGAAACCGATTAACGCAGAGGATACCTA 309
NO-.254 TGAACTAAGGCATAGAATACTCAGACCAAACCAGCCGA TAG AAGTOTOTATG" G ATG AAACCGATTTACTTCGTGGTG CATTTCACl AGGCGGCTTTTACAGGGGCAAACTGATrT CCATAGCTTCATTCCACCAGGCCGAGCACTCAGAACTCC
AAGGCCAGAAACAGTACCAGCTCCGAOGTATGGCTACC
TTGGAAGGT ATCGTGAGCAGAAAGCGGQATCGAGTCT
AATTAAACACGCTOAAGAAATTCTTCGTAAGAGGGGGG
CGGACATGCTTTGGTGCAATGCGCGGACATCCGCCTCA
GGCTACTACAAAAAGTTAGGCT CAGCGAGCAGGGAGA
GATATTTGAAACGCCGCCAGTAGGACCTCACA CCTGA GTATAAAAGGCTCACATAA
SEQ ID 8_IH9 ATGCTAGAGGTGAAACCGATTAACGCAGAGGATACCTA NO:255 TGAACTAAGGCATAAAATACTCAGACCAAACCAGCCGT TAGAAGTGTGTATOTATGAAACCX3ATTTACTTCGTGGTG CATTTCAC rAGGCGGCTATTACAGGGGCAAACTGATrT CCATAGCTTCATTCCACCAGGCCGAGCACTCAGACCTCC
AAGGCCAGAAACAGTACCAGCTCCGAGGTATGGCTACC
TTGGAAGGTTATCGTGAGCAGAAAOCGGGATCGAGT T
AATTAGACACGCTGAAGAAAT CTTCGTAAGAGGGGGG
CGGACTTGCI TGGTGTAATGCGCGGACATCCGCCTCAG
GCTAC ACAAAAAGTTAGGCTTCAGCGAGCAGGGAGAG
GTATTTGATACOCCO^AGTAGOACCTCACATCCrOATG TATAAAAGGCrCACATAA SEQ ID OAT1^21F ATGATTGAAG CAAACCTATAAACGCGGAAGATACOTA NO:256 12 TGAGATCAGGCACCOCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCrCGGCGGATAT ACCGGGGCAAGCTGAT CAQCATCGC T(X^TTCATAATGCCGAACATTCAGAGCT TGAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCG
ACOCTTGAAGGATACCGTOAGCAAAAAGCGGGAAGCA
CGCTCATCCGCCATGCCGAAGAGCTrCTTCGGAAAAAA GGCGCGGAC 'l I'I'IATGGTGCAACGCCAGGACATCTGT GAGCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAGG
GCGAAGTXTTACOACATACCGCCOATCaGACCTCATATTT TGATGTATAAGAAATTGACGTAA
SEQ ID GAT1J240 ATGATTGAAGTCAAACCAATAAACGCGGAAGATACX3TA NO:257 3 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAOCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCCTCCTTTCATCAA KXGAACATTCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAGGGA GGCGA
CACTTGAAGGOTACCGCGAGCAAAAAGCGGGCAGTACG
C TATCCGCCATGCCGAAGAGCTTCTTCGG AAAAAG GG
GGCAGACcT- l 1 TGGTGCAATGCCAGGACATTTGTGA GCGGTrrACTATGAAAAGCTCGGTTTCAGCGAACAGGGC GAAGTCTACOACATACCGCCGATCGGACCTTATATTTTG
ATGTATTAGAAATTGACATAA
SEQ ID GAT1J29G ATGATTGAAGTCAAACCAATAAACGCGGAAGAT ACOTA NO:258 1 TGAGATCAGGCA(XGCATTCTCCGGCCGAATCAGCCOC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGT 310
ACGTTTCACCKXjG GGATATrACCGGGGCAAGCrGATC AGCATCGCTTCCTITCATCAAGCCGAACArrCAGAGCTT GAAGGCCAAAAACAOTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGTAGTACO
CT ATCCGCCATGCCGAAOAGCrTCrrCGGAAAAAGGG GGCAGACCTTTTATGGTGCAACGCCAGGACATCTGTGA
GCGGGTACTATAAAAAGCTCGGCTTCAGCGAACAAGGC
GGGGTCTGCGATATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGGCATAA
SEQ ID GAT1_32Q ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:259 1 TGAGATCAGGCACCGCATACTCCGGCCGAATCAGCCGC TTGAAGCATGTATGTATGAAACCGATTTGCTCGGGGGC
ACOTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCCTTTCATCAAGCCGAACATCCAGAGCTT
GAAGGCCAAAAACAGTATCAGCTGAGAG GATGGCGA
CACTTGAAGGG ACCGCGAGCAAAAAGCGGGCAGTACG
CTTATCCGCCATGCCGAAGAGCTTCTTCGGAAAAAAGG
CGCAGACCTTTTATGGTQCAAC K AGGACATCrG OA GCGGCTACTATGAAAAGCTCGGCTTCAGCGAACAGGGC
GAAGTCTACGACATACCGCCGATCGGACCTCATATTTTG
ATGTATAAGAAATTGACATAA
SEQ ID GAT2.15G ATGAITGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:260 8 TGAGATCAGGCACCGCATTCTCCGGCCGAATCAGCCGC TGGAAGCATGCAAGTAIOAAACCGATT GCTCGGGGGC
ACGTTTCACCTCGGTGGATATTACCGGGGCAAGCTGATC
AGCATCGCTTCC TTCATAATGCCGAACAlTCAGAGCTT GAAGGCCAAAAACAGTATCAG TGAGAGGGATGGCGA
CGCTTGAAGGGTACCGCGAGCAAAAAGCGGGAAGCAC
GCTCATCCOCCATGCCGAAGAGCTTCTTCGGAAAAAAG
GCGCAGACCTTTTATGGTGCAACGCCAGGACATCTGTG
AG XKiGTACTATAAAAAGCTCGGCrrcAGCGAACAGOG CGAAG CTACGACATAi G XXJATCGGACCTCATATTTT GATGTATAAGAAATTGACGTAA
SEQ 1D GAT2_19H ATGATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:261 8 TGAGATCAGGCA(XGGATACTCCGGCCGAATCAGCCGC TTGAAGCATGTATXJrATGAAACCGATrTGCTCGGOGGC A8TT CACCTCGCjTGGATATTACa3GGGCAAGCTGATC AGCATCGCTTXX n CATCAAGCCGAACATCCAGAGCTT GAAGGCCAAAAACAGTATCAGCTGAGAGGGATGGCGA
CACTTGAAGGGTACCGCGAGCAAAAAGCGGGCAGTACG
CTTATXXX3CCATGCCGAAGAGCTTCTTCGGAAAAAAGG CGCAGACCTTTTATCH rGCAACGCCAGGACATCTOTGA GCOGCTACrATGAAAAGCTCOGCTrCAGCGAACAGGGC GAAGTCTGCGACATACCaCCGATCGGACCTCATATTTTG ATGTATAAGAAATTGACATAA
SEQ ID GAT2_21F AIXJATTGAAGTCAAACCAATAAACGCGGAAGATACGTA NO:262 1 TOAGATCAGGCACCG TATTCrCCGG<XGAATCAGCCGC TTOAAGCATGTATOTATGAAACCGATTTGCTCGGGGGC ACU 1' 1' l'C ACCTCGGTGG ?? ATT ACCGGGGC AAGCTG ATC AGCATXXJCTTCCTTTCATCAAGCCGAACATTCAGAGCTT 312
313
314
315
N0.-311 I^GYYRG LÍSIASFHQAEHPEI.EGQKQYQLRGMA'rLEEY REQKAGSTIJRHAEEIJJUKOADI1.WCNARTSASGYYKK LGFSEÍ iEVYDIPPTGPHllJvrY KLT SEQID 14_2B6 MffiVKPI AEDTYEDUIRIUmíQPLEACKYETDLLGG^ NO:312 3GYYRG LISIASFNQAEHPEIÍGQKQYQLRG ATLEGY REQKAGSTURHAEEOJI XGADIXWC ARTSASGYY^ 3KEQGGVYDIPPVGPHILMY KLT SEQID 14_2G11 MIEVKP AEDTYEIRHRIUtfNQPL.^ NO:313 LGGYYRGi VSIASmQAEHPEUBGQKQYQLRGMATLEG YREQ AQSTLIRHA FPT I R KKQ ADLLWCNA TS ASQYYK LGFSEOGEVYÜJPPTGPHILMYKKLT
SEQID 14_3B2 MIEVKPINAEDTYEIRHJUl^PNQPLEACKYETDIiJlGAM NO:314 LGGYYRG LVSIASFHQAJEHPELEOQKQYQLRGMATLEG YREQKAGSTURHAF_AIIJU¡CK^ KlXSFSEQGGVYDIPPAGPHlIivfYKKLT SEQID 14_4H8 MEVKPI AEDTYiaRHRII-R^^ N0.315 GGYYRGKliSIA5raQAEHPELEGQ QYQLROMATLEOyR EQKAGSTTJRHAEFJJJUKOADIXW<^ARTSASGYYKKL GKEQGEVYDTPPVGPHn^MYK LT SEQID 14_6A8 MIEVKPI AEDTYEIRHRIUUWQPl^^ N0:316 LaGYYRG LVSIASFNQAEHPELEOQKQYQLRGMATLEa YREQKAGSTLIRHAEEU.R KGADLLWCNARTSASGYYK LGFSEOGEVYDTPPVGPHVLMY LT
SEQID 14J5B10 NíffiVKPINAEDTYEIIUiRnJ^NQP NO:317 I 3GYYRGKUS SFHQAEHPEI£K3KQYQI^GMATLEOY REQKAGSTLIRHAEEIIiUKGADlJLWCNARTSASGYYKK LGFSEQGGVYDMPPVGPHIL YKKLT
SEQID 14_6D4 MIEV PINAFJDlYETKHRn.RPNQPÍ.EACKYETDLLGGTFB NO:318 mGYYRGmSIASF QAEHPEJJEGQKQYQLRGMATLEGY REQKAGSTLIRHAEALIJi KG ADLLWC ARTS AS G YYKK IXJFSEQGEVYDTPPVQPHILMYK LT
SEQID I4.7A11 MIEVinT ABDTYElKH^ NO:319 LGGYYRGKLVSIASHIQAEIIPELEGLKQYQUIG ATLEG YREQKAGSTLIRHAEEIJJUCKGADIXWCNARTSASGYYK L3FSEQGEVYDTT TGPIBL YKKLT SEQID 14J7A1 MHWKFINAED YEIttflRI-JEUW^ NO:320 LGGYYROKLVSIASFHQAEHPEI-EGKJKQYQIJRGMATLEE YMQKAGSTLIRHAEELLRl^QADLLWCNARTSASGYYK LGFSEQGEVYD PPAGPHIL YK LT
SEQID 14_7A MH-VKPlNAEDTYEIRI-WIJ NO:321 LGOYYRG LVSL\SFHQAOffELEGQ QYQIJlGMATLEG YREQKAGSTLIRHAEEIIJlKKaADIXWC^íARTSASGYYK KI JFSEOGEVYDT PVGPHnLMY KLT SEQID 14_7G1 MIEVKPINAEDTYErRI IROJIPNQPLEAC YETDLLRG AFH NO:322 LGGYYPvGKUSIASFNQAEHPELEGQ QYQLRGMATLEEY REQKAGSIIJRHAEAIJJIK GADI-LWCNARTSASGYYKK IXFSEOGEVYJJIPFVGPHIL YKKLT
SEQID 14J7H9 MIEV PTNAEDTYETRHRILRPNQPLEAC TETDLL^ NO:323 LGGYYRGKLVSLASFHQAEHPELEGQKQYQLRGMATLEG YREQ AGSTLIRI LAEELIJli-KGADI WCNARTS A_SGYY 316
WFSEQGEVYDIPPVGPHIL-vlYKKLT SEQID 14_8F7 MIEVKPI AFXiTYEIRHRIIJtfNQPI^CKYF^IXGG^ NO:32 LGGYY GKLVSIASI¾QAEHPEI-EaQKQ YQIJ10MATI1.EE YSEQICAGSTIJPJIAEAIXR1.XGADIXWCNARTSASGYY DjFSEQGEVYDlPPTGttlll YKKLT SEQID 15_1QC2 MIEVKPINAEDTYEIRHPJIi NQPI^ NO.-325 LÜGYYRGKJ-VSL^FHQAEHPEIJiGQKQYQLROMATLEG YP^KAOSTIJPJiAEI!IJJi KaADI W L/iFSEQGEVFDIPPTOPHILAÍY LT SEQID 15_10D6 MIFV^INAEDTYEIRHPJIJ^NQPIJJACMYETO NO:326 I-OGYYRGKXVSIASFHQAEHPELEGQ QYQl-RGMATT-EE Y EQKAGSTTJRHAEEI RKKG ADLLWC A TS AS G Y YK KmFSEQGEVYDIPPVOPHILNfY LT SEQID I5_UP9 MIEVimNAH^TYEIRHRIIiPNQPlJ^ NO:327 LGGYYRG I-VSIASFNQAEHPELEGQKQYQLRGMATLEG YMQKAGSTIJRHAEEI KGADLLWCNAR'l'SASGYYK RÍEQGEVYDIPPTGPH11^^ SEQID 15_HH3 MIEV PINAEDTYEIRHRILJlPNQPlJiACKYETDU^ NO:328 LGGYYRG lJSLASFHQAEHPEIJíGQ QYQLilGMATLEGY REQKAGST RHAEAIJJlKKGADIXWCNARTSASaYYKK LGFSEOGEVYDIPPTOPHILJIY KLT
SEQID 15_12A8 MIEV PINAEDTYFJRHtULltfNQPLEACXYETO NO:329 LGGYYRG lJ-SIASraQAEHPELEGQKQYQIJtG ATLEGY REQKAG5TIJKHAEALI-R KGADIÍWC ARTSASGYY K LGFSEOGEVYDIP GPHILMY KLT
SEQID 15_12D6 MlEVKPINAEDTYmHRIlJPNQPiJEAC n T IJJiGAffi NO:330 LC 3YYRO X.VSIASFHQAEHPELEGQ QYQIJtG ATLEa Y EQKAGSTUlUiAEELL iaCG ADLXWCN ARTS AS G Y YK KLGFSEQGEVYinTPVGPHILMY KLT SEQID 15_12D8 ffiVKPINAEDTYEIBH IL PNQPLEACKYETD^ NO:331 IX3GYYR0KLVSL\SFHQAEHPELECKÍKQYQI- GlvlATLEG YREQKAGSTLI HAEEIJL KKGADIXWC ARTSASGYY KI^FSEQGKVYDIPPVaPHIL YKKLT SEQID 15_12D MI1WKPI AEDTYEIRHRJ1JRFNQPI-EAQY NO.332 LGGYYRG iVSIASFHQAl ElJ^KQYQIJlGMATlJJE YREQKAGSTURHAFÍRI L KXQADLLWCNARTSASGYYK K 3FSEQGEVYDIPPVGPHIIAÍYKKLT SEQID 15.3FI0 MTEVTO>INAJ¾TYBIRHRI[JÍPNQPt^ NO:333 I jCYYRGKlISIVSFHQAEHPEIJiGQKQYQIJia ATLEGY REQKAGSTIJRHAEEU «RKKG ADLLWCN ARTS ASGYYKK I JKEOGBVYDTPPAOPHnjyfYTKLT SEQID 15_3G11 MIBVKPI ABDTYEIRHPJLJ^NQPIii\CK^ NO:334 LGGYYRGKLVSIASFHQAEHPEIJ2GQKQYQIJIGMATLEE YREQKAGSTIJRHAJEHIJJIKKGADLX.WCNARTSASGYYK KLGPSEOIEVYDIPPVGPHnJvíYKKLT SEQID 13_4FU MffiVO>INA---DTYKIRHRIL^^ NO:335 LGGYYRGin^VSIASF QA JdPEiJíGQKQYQIJRGMATLEG YREQ AGSTLIRHAEAIlilKKGAD-XWC^ARTSASGYYK LGF^EOGEVYDIPPraPHILMYK LT SEO ID 15_4H3 MIEVKPINA£DTYEIRHRIIJIPNQPIJ2^ 317
318
319
320
321
322
I/H'SBOGEVYDIPPIGPHDIAÍYK LT SEQID 6_23H3 IEVKPINAEDTYEIRHRIUU1^ NO:399 LXKJYY GKlJSIASraQAEQPELEGQKQYQL GMATLEGY REQKAGSTURHAEEIJ^KXGA I WCNARTSASGYYKK LGI^E KJVYDIPPVGPHllMYKKLT SEQID 6_23H7 MIEVKPINAEDTYEIRHRILRPNQPrJEACMYETDI^^ NO:400 LGQYYRGKIJSIASraQAEHSElEG ! QYQLRGMATTiGY REQKAGS1URHAEEILRK GADLLWCNARTSASGYY KL GFSEOGOVYDIITVGPfflL Y LT SEQID 6_2H1 MlEV PI AEiyiTEIRHR\'LRPNQPLEACMYETDIÍGG F NO:401 HT.G YYROK1JSLASFHQAEHPELEGQKPYQL GMATLEG YREQKAGSTURHAEELJJ CKGADLLWCNARTSASGYYK KLGFSEOGFJYDIPPIGPH1LMY KLT SEQID 6_3D6 M1EIKPI AEDTYEIRHR-1-RPNQPIJELACMYETO NO.402 GGYYRG USIASmQAEHPEI GQKQYQUlGMATLEGYR EQKAGST1JRHAEEIJLRÍ-KGA I1WCNARTSASGYYK L GFSEOGEVYDIPPVGPHILMY K T
SEQID 6_3G3 MIEVKPINAEDTYEIRHRIUU^QPLEACMYETDU^ NO: 03 jGYYRGKIJSIA^raQAEHSELEGQ QYQLRGMATLEGY REQKAGSTURHAEELI-R1QCGADIXWC ARTSASGYYK LGFSEOGE^YDIPPYGPinLMYKKLT SEQID 6_3H2 MmVKP AI=ayr EIRHRIL^ NO:404 IJ3G YYRG IJSIA5FHQ AEHPEJLEGQKQ YQLRGMATLEEY REQKAOST1JRHAEE11JR KGADLLWCNARTSASGYYK LGFSEOGEVYDIPPVaPHILMYK LT SEQID 6_4A10 MffiVKPmAEDTYEIRHRILRPNQPl^CMYETOIXGG^rffi NO:405 LGGYYRGKlJSIASFHQAHil KJJEGQKQYQLRClMATLEOY REQKAGSTURHAPH J .RKKGADLLWCNARTSASGYYKK L^1¾EQGEVYDIPFVGPHIL YKKLT SEQID 6_4B1 MIEVKPINAEDTYEIRHRVlJmiQFT^ACMY NO:406 HLGGYYRGmGIASraQAEHPHLEGQ QYQLRGMATLE GYREQKAGSTLJRHAEELLRKKGADLLWCNARTSASGYY EKl 3F¾GOGEVYDimGPHIIJvíYK LT 5EQID 6_5DU NDEVKPINAEDTYEJRHRJIJtPN^ NO:407 LGG YYRG LIS IASFHQ AEHPELEGQ Q YQI.RGMATLEEY REQKAGSTIJRHAEFJ R KGADLLWCNART^ASGYYKK I_XjFSEOGEVYDIPPIGPfnLMYKKLT SEQID 6_5F11 MlEV PINAE-yiTEIRHRI-^^ NO:408 I^GYYRGKliSIASFHQAKRKJ-EG^ REQKAGSTLIRHAEEU.R GADLLWCN ARTS ASGYYKK LGPSEQGBVHDIPPVGPHILMYK LT
SEQID 6_5G9 MIEVKPINAEDTYEn IRILRP QPL-EAC Y NO:409 UGYYRGK1JSIASFHQAEHSELEGQ QYQLRGMATLEEY RFj ??^?? TBHAFP T R GADT .WHNARTS ASGYYKKL GFSEOGGVYDIPPVGPHILMY XLT
SEQID 6_6D5 MIBVKPI AEDAYEIRHRIIJUWQPIJElA nKro NO:410 LGGYYROJ^IASraQAEHSELEGQ QYQLROMATLEOY REQKAGSTIJWIAEEIJURXKGADI WCNARTSASGYYia JP^EOWVYDIPPVGPHIl-NlYKKLT SEOID 6J7D1 MlEV PINAEDTTEIRHRILilPNOPU^CMYETO 323
324
325
326
K1 }FSHX;EVFETPPVGPHILMYKRLT SEQID (L6D11 MXEVK-PTNA-E-DTYElJy^^ NO:449 LOGYYRG LISIASFHQAEHSDLQGQKQYQLRGMATLEOF RJXJ AOSSLIRHAEQILRKROADLLWCN AR1¾ ASO Y Y K I_ JFSEQGEVI¾TPPVGPHILMYKRIT SEQ1D 0_6F2 MIEVKPmAJEaDTTELRHRIIJ^ NO:450 L^YYRGIOJSIASFHQAEHSELQGQ QYQIJRG ATLEaF REQKAGST1J0RHAEQIIJIKRGADMLWCNARTSASGYY K LGFSEQGEIFDTPPVOPHI 1YKRJT SEQID 0_6H9 MIEVK_PINAEDTYEUÍHKIIJRPNQPIEACMYETO NO:451 LGGFYGGKI-lSlASPHQAEHSDLEGQ QYQIJtGMATTLEGY REQKAGSTURIiAEEIUKKGANl WCNARTSASGYYK^ GFSEOGEVFDTPPVGPHILMY RLT
SEQID 10_4C10 M7F. ??G?G? A KDTYFT JÜ FTKTT .R PNQPf JjVCMYFTDT T J? ? A P NO:452 !ILGGXY G lJSIASFHQAEHSEIjQGQ QYQI^aM.\TI-EG Y DQKAGSSIJKHAEQTLRKRGADXLWCNAR SASGYYK KLGFSEOOEJFDTPPVÍPHIIA1YKRLT SEQID 10.4D5 MIEVKPINAEDTYEIJ^IiRttJlPNQPIEVCMYE DlJJlGAFH NO:453 U3GFY GK1JS1ASFHQAEHSDL0GQ QYQLRGMATLB3Y REQKAGSTLt HAEQIIJl »GAI3IiWCNARTSASGYYK L GFSEQGEVPiyiPPVGPHILMY -T SEQID 10_4F2 MXJSVKPÍNAEDTY I.R TRIIJ¾PNQPIF-ACMFE5DI,LRGAFH NO:454 LGGPYRG LISIASmQAEHSELQGQ QYQL aMATLEGY REQKAGSSL1RHAEEI1JI RGADML CNAR rS ASGYYK D FSEOGEIFETPPVGPHnJ^YKRLT SEQID 10„4F9 MIEVKPI AEDTYEIJlHRIIJRPNQPIF 'CAtYETDIJJ^ NO:455 IOKJFYRGKlJSIASFHQAEHSEI KJ QYQIJlGMATIiGF REQKAGSSXJRHAEQE-RKRGADIXWC ARTSASGYYKKL GFSEQGEIFDTPPVGPHnJvlYKRLT SEQID 10_4G5 MIEVKPINAEDTYELRHRIl^^ NO:456 LGGYYROmSIA^FHQAHHSBIJ^KQYQLRGMATXjSG YPJXJKAGSSIJ¾HAFJI1JI RGADLLWCNARTSASGYYK LGFSEOGEIFDTPPVGPHIIA YTCRLT
SEQID 10_4H4 MI JiVKTTN AEDT^BTJRHKILRPNQPt^CMY^TD NO:457 HIXKjFYRGKLISIASFHQAFJHSEl ^GQKQYQIJlGMATLEG YREQKAGSSIi HAEEI ^GADLLWCNARTSASGYYKK mFSEOGEVFD-rpPVOPHILMYKI T SEQID U_3A11 MIEV PINAEDTYELRH TÍ .PxPNQPTEVCMYESDLLROAFH NO:458 D^FYRG LIS]ASFHQAEHPDI-X^KQYQ1JRGMATXEGY RIXJKAaSSUKHAEQIUUCRGADlJLWCNARTSAJSGYYK ]. iP5EQGEVFEI PVGPHILMYKRLT SEQID U_3B1 MIJEVKPINAHXyiTFIRHRIUU'NQPIEACMFETO NO:459 LGGFYRG lJSlASFHQAEíiSDLQGQKQYQLRGMATLEÜF REQKAQSTIJRIIAEET RGADI WC^AJ^TSA^GYYKPJ-. G.¾EQ i-IPT>TPFVGFHILMYK!RLT SEQTD 11_3B5 MIEVXPINAEDTYELRHRI1.RPNQPIEACMFESDIXRGAFH NO:460 LGGYYRGKlJSIAi!FHQAEHSEUyJQ QYQLRGMATLEGY RDQKAG5 SLI HAEQI1-RXRGADMLWCNARTS ASGYYKK l iF¾EOGHVFDTPPVGPHILMYKRrr SEQID 11.3C12 MIEVKPINAED YEI^HRILRP QPLEVCMYETDI^ 327
NO:461 LGGFyOGKLISIASFHQAl-33PDLQGQKQYQI-RGMATI£GY MXJKA0SS1JRHAEQUJUCR0ADLLWCNARTSASGYYKK LGFSEÍ JHl KIVPVGPHE- YKRr SEQID 11_3C3 MllETV PINAJEÜTYEI-RH IlJ^ NO:462 IX3GYYRGKUSlASPHQAEHSEU3GQKQYQI-ROMATLEGY REQKAGSSljaaiAEEIlilKRGADIiWCNARTSASGYYK L GFSEOOEVF TPPVCPHILMYKRIT
SEQID 11.3C6 ^VIOWAEDTYEIilHKII^^ NO:463 IJJGF^OGKUSIASFHQAEHSDI^GQ QYQI^GMATLEGY REQ AGSTURHAEEILRKRGADLLWC A TSASGYYXKL GFSEOGEIFDTPPVGPHII- YKR1T SEQID MlEVKPINAEDTYEliUm-RPNQPIEVCMYETDUJlGAFH NO:464 LOOFYRG LISIASFHQ AEHSDLQG QKQ YQLRGMATLEG Y REQK^GSSIJKHAEQILRKRGADI WCNARTSASGYYKKL GFSEOGEVFDTPPVGPHILA1Y LT SEQID 1.1G12 MLEVIOTNAEDTYEIJIH-UI-^ NO:465 3FYGGKUSIASFHQAEHSEL0GQKQYQL GMATLEGY DQKAGSSIJ HAEJEI1JIKRGADIXWCNARTSASGYYKKL GKEOGEVPETPPVQPHILMYKRLT
SEQID 1_1H1 M1EVKPINAEETYELRHKIIJ^NQPIEA.CMYESDL IGSFH NO:466 LG GFYRGQLISIASFH AEHSELQ GQ Q YQL GMATLEGF REQ AGSSURHAEEIIJII^GAD .WC ARTTASGYYK L GFSEHGEVFETPPVGPinLMYKRir SEQID 1_1H2 MIEVKPI AEDTYEIJHRIlJ^NQPI^CMYESDlJJlGSm NO.-467 LGGFYRG LISIASFHQAEHSELEGQKQYQLRGMATLEGF REQ AQSSIJRHAEimjl RGADIiWCNARTTAAGYY K IXia¾EX>BIPI)TPPVGPHILMYKRir SEQID 1_IH5 MIEVKPINAEDTYEIRHRB.RmQPIJv\CMYKSDIJ.RGSFH NO:468 UXJFYRG IJSIASFHQAEHSDLEGQKQYQLRGMATLEGY RIXJ AGSSURHAEQnjiKRGADIJLWCNARTTAAGYYKR I^PSEOGEVFDTPFVGPHILMYKKLT SEQH) 1 _2A12 MIEVKPI AE TYELRHRI tfNQPIEACMYESD ^ NO:469 UXlFYRGELISIASFHQAEQSEIiGQ QYQLRGN TIJEGY RIXJ AGSTLJKHAEEnil KGADLLWC ARTSAAGYYKR I^FSEOGElFI rPPVGPHILMYKRLT SEQID 1_2B6 MIEVKPINAEETYEI-RHKII-RPNQPIEACMYEI^ NO:470 l^FYRG LISIASFHQAEHSELEGQKQYQL GMATLEGF RDQKAGSS KHAEE KRGADI WCNARTSASGYYm GPSEQGEIPETPP VGPHILMY RLT
SEQID 1J2C4 MLEVl^INAEETYEIJün UtfNQPJEAC YETDLLRG^ NO:471 I^GFYRGQUSIASFHQAEHSDLQGQ QYQLRG All-EGY REQ LAGSTlJKHABHI-l-RiQ^GA IXWCNARTTAAGYYlO^ LGF«EO<}EVnyrPPVGPHILMYKlrr SEQH) 1_2D2 MffiV PI AEDTYELRHEOlJPNQPI^CMYESDL-LRSAFH NO:472 3GFYRGK1-ISIASFHKAFJ1SELQGQKQYQIJIGMATLEGY RDQ AGSSURHAEEIIJKRGADMLWC ARTSAAGYYKR LGF¾EOGEVFDTTPVGPHEMYKRrr SEQID 1_2D4 NO.-473 LGQPYRGKI-ISIASPflQAEHSDLQGQKQYQI-RGMATT-E^ RF >KAGSSIJ HAE0I RKKGADMLWCNARTSAAGYYK 328
RLGFSEHGEIFETPPVGPHIL-MYKFJT SEQID l_2F8 ML£VKPINAEDTYElitH ILRPNQPLEAC!MYFro NO:474 HI 3GFYRGK1-ISIASFHQ AEHflBT P.GQKQYQL GMATLEG YRDQ AGSSLIimAEEttJl-aiOADMLWCNARTtAAaYYK KI JFSEOOEIYD PPVGPHII-MYKKLT SEQID 1_2HS ????????????????-??????^ NO:475 LGGl^GKUSIASFHQADHSELQGQKQYQl-RaMATLEQY REQKAGSTURIIAEQILR RGADIXWCNARTSAAGYY
LGFSEHGEIFÍTPPVGPHIL Y RLT
SEQID I_3A2 IEVKPINAEDTYHJHRIU^NQ NO:476 XJFYROKLISIASFHQAEffiDLQGQKQYQLRGMATLEOY REQKAQSSURHAFTTT RKKOADML CNARTTAAQYYK mFSEWPVFDT PVGPHILMYKRIT SEQID 1_3D6 NQEVKPINAEDTYEIJmKII^NQPIEAC YESDLLQGSFH NO:477 I raFmGQUSIASFHQAEHSDLQGQKQYQUtGMATLEGF REQKAGSTUKHARFTT RKKGADLLWC ARTS AAGYYKK LGFS EHGEIFI7I P AGPHIL Y KLT SEQID 1_3F3 MIEVIfflNAEETYEIilQRIU^NQPIEACMYESDIXRaSFHL NO:478 GGFYRGQUSIASFHQAEHSEI^GQKQYQLRGMATLEGYR EQKAGSTUKHAEEILRKKGADLLWC^A TSAAaYYXRL GF¾EHGEIFDTPPVGPHILMY TT SBQID 1_3H2 MlEVKPI AEDTYEIJtHRIIJlPNQPIEAC YETO NO:479 LGGYY GQUSIASFH-AJniSELQGQ QYQLRGMATLEQY REQ AGSTU HAEQ1 RE GADMLWC ARTSAAGYY RLGFSHJGEVPDTP VGPHII-MY KLT SEQID 1„4C5 IvDEY PI AEDTYELRHKILRPNQP-^ NO:480 LX3GFY GKlJSIA5FHKAEHSDI£GQNQYQmGMATLEGY REQKAGSTIJ_HAEEIliUÍRGADMLWCNARTSA5GYYKR LGFSEHGEIHD PPVGPH-iMYKRLT SEQID 1_4D6 M1JE3VKPI AEDTY--I-RH II-KPNQB NO:481 UMFYRGQLI5IASFHKAEHSD]JEGQKQYQLRGL\ATLEGY REQKAGSTLIRHAEQILRE¾OADNÍLW(^AJRTSAAGYYKR LOFSEQGEVPBTPPVGPHILMYKRLT
SEQID I_4H1 IEVKPINAEDTYEI-RHRIUU^^ NO:482 I^GFVRGKLISIASFHQAEHSDI^^KQYQUIOMATLEGY REQKAGSTURHAEQT ,T J KRGADLLWCN ARTS ASGYYKR I_GP¾EHGEVFDTPPVGPHILMYKRL.T SEQID 1_5H5 MI^V PINAEETYELJ^imJm^QPI^CMYESDLLRGSH NO:483 1 K3YYRGQ1JSIASFHQAEH5EI^GQKQYQI^G ATLEGF REQKAGSTIJKHAEQILRKRG AD LWCN ARTS AAG YYKK. LGFSEHGEM IWVGPHI1-MY LT SEQID 1_6F12 MIEVKPINAEOTYEHIHRII-RPNQPIEACM NO:484 GGFYRGKLLSIASFHQAEHSDI^QKQYQLRGMATIJEGYR IX^ AGSITJOKMAi^iUJRXRGA MLWCNA^ LGFSEHGEIYFI PVGPHIl- ? ?G SEQID 1J5H6 MffiVKPlNAEDTYEUUiKlIJ^ NO:485 LGGFYRGQUSL SI¾QAEHSD1£GQ QYQU¾G ATLEGY RDQKAGSSUKHAEEIU¾ RGADLLWC^ARTSAAGYYKR l.GI¾EQ EIPT»TPPVGPH]IMYKKlT SEQID 3_11A10 O^VKPINAEDTYE HRnj^NQPrEACMYESDLLRGAFH 329
330
Claims (1)
- 332 REIVI DICACIONES 1. Un polinucleótido aislado o recombinante, caracterizado porque comprende: (a) una secuencia de nucleótidos que codifica una secuencia de aminoácidos que puede ser óptimamente alineada con una secuencia seleccionada del grupo que consiste de SEQ ID NO:300, SEQ ID NO:445 y SEQ ID NO:457 para generar una marca de similaridad de por lo menos 430, utilizando la matriz BLOSUM62 , una sanción de existencia de espacio de 11 y una sanción de extensión de espacio de 1; o (b) una secuencia de nucleótidos complementaria de la misma. 2. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque el polipéptido tiene actividad de glifosato N-acetil transferasa . 3. El polinucleótido aislado o recombinante de conformidad con la reivindicación 2, caracterizado porque el polipéptido cataliza la acetilación del glifosato con una kcat/Km de por lo menos 10 m -1 min"1 para glifosato. 4. El polinucleótido aislado o recombinante de conformidad con la reivindicación 2, caracterizado porque el polipéptido cataliza la acetilación del ácido aminometilfosfónico . 5. Un polinucleótido aislado o recombinante, caracterizado porque comprende una secuencia de nucleótidos 333 que codifica un polipéptido que tiene actividad de glifosato N-acetiltransferasa, el polipéptido que comprende una secuencia de aminoácidos que comprende por lo menos 20 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO:445 y SEQ ID NO:457. 6. El polinucleótido aislado o recombinante de conformidad con la reivindicación 5, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 50 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO:300, SEQ ID NO:445 y SEQ ID NO:457. 7. El polinucleótido aislado o recombinante de conformidad con la reivindicación 5, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 100 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO:300, SEQ ID NO:445 y SEQ ID NO:457. 8. El polinucleótido aislado o recombinante de conformidad con la reivindicación 5, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 140 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO: 445 y SEQ ID NO: 57. 9. El polinucleótido aislado o recombinante de 334 conformidad con la reivindicación 5, caracterizado porque el polipéptido comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO: 45 y SEQ ID NO: 57. 10. El polinucleótido aislado o recom inante de conformidad con la reivindicación 5, caracterizado porque comprende una secuencia de nucleótidos seleccionada del grupo que consiste de SEQ ID NO: 48, SEQ ID NO:193 y SEQ ID NO:205. 11. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque un codón de origen se ha reemplazado por un codón sinónimo que es preferencialmente utilizado en plantas con relación al codón de origen. 12. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque además comprende una secuencia de nucleótidos que codifica un péptido de tránsito de cloroplasto N-terminal. 13. Una variante no natural del polinucleótido de conformidad con la reivindicación 1, caracterizada porque uno o más aminoácidos del polipéptido codificado han sido mutados . 14. Una construcción de ácido nucleico, caracterizada porque comprende el polinucleótido de conformidad con la reivindicación 1. 15. La construcción de ácido nucleico de conformidad con la reivindicación 14, caracterizada porque 335 comprende un promotor operablemente enlazado al polinucleótido de la reivindicación 1, donde el promotor es heterólogo con respecto al polinucleótido y efectivo para ocasionar suficiente expresión del polipéptido codificado para aumentar la tolerancia al glifosato de una célula de planta transformada con la construcción de ácido nucleico. 16. La construcción de ácido nucleico de conformidad con la reivindicación 14, caracterizada porque la secuencia de polinucleótido de la reivindicación 1 funciona como un marcador seleccionable . 17. La construcción de ácido nucleico de conformidad con la reivindicación 14, caracterizada porque la construcción es un vector. 18. El vector de conformidad con la reivindicación 17, caracterizado porque comprende una segunda secuencia de polinucleótido que codifica un segundo polipéptido que confiere una cualidad fenotipica detectable en una célula u organismo que expresa el segundo polipéptido a un nivel efectivo . 19. El vector de conformidad con la reivindicación 18, caracterizado porque la cualidad fenotipica detectable funciona como marcador seleccionable. 20. El vector de conformidad con la reivindicación 19, caracterizado porque la cualidad fenotipica detectable consiste de resistencia a herbicida, resistencia a plaga o un 336 marcador visible. 21. El vector de conformidad con la reivindicación 17, caracterizado porque el vector comprende una secuencia de T-DNA. 22. El vector de conformidad con la reivindicación 17, caracterizado porque el polinucleótido está operablemente enlazado a una secuencia reguladora. 23. El vector de conformidad con la reivindicación 17, caracterizado porque el vector es un vector de transformación de planta. 24. Un polinucleótido aislado o recombinante, caracterizado porque comprende : (a) un nucleótido que se hibridiza bajo condiciones severas sobre sustancialmente la longitud completa de una secuencia de nucleótidos que codifica una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO:300, SEQ ID NO:445 y SEQ ID NO:457; (b) una secuencia de nucleótidos complementaria de la misma; (c) un fragmento de (a) o (b) que codifica un polipéptido que tiene actividad de glifosato N-acetiltransferasa . 25. El polinucleótido de conformidad con la reivindicación 24, caracterizado porque comprende una secuencia de nucleótidos que codifica una glifosato N-acetil transferasa . 26. Una composición/ caracterizada porque comprende 337 dos o más polinucleótidos de conformidad con la reivindicación 1. 27. La composición de conformidad con la reivindicación 26, caracterizada porque comprende por lo menos diez polinucleótidos de conformidad con la reivindicación 1. 28. Una célula que comprende por lo menos un polinucleótido de conformidad con la reivindicación 1, caracterizada porque el polinucleótido es heterólogo a la célula. 29. La célula de conformidad con la reivindicación 28, caracterizada porque el polinucleótido está operablemente enlazado a una secuencia reguladora. 30. Una célula, caracterizada porque es transducida por el vector de la reivindicación 17. 31. La célula de conformidad con la reivindicación 28 o 30, caracterizada porque la célula es una célula de planta transgénica. 32. La célula de planta transgénica de conformidad con la reivindicación 31, caracterizada porque la célula de planta expresa un polipéptido exógeno con actividad de glifosato N-acetil transferasa. 33. Una planta transgénica o explantación de planta transgénica, caracterizada porque comprende la célula de conformidad con la reivindicación 32. 338 34. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 33, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetil transíerasa . 35. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 34, caracterizada porque la planta transgénica o explantación de planta es una planta de cultivo seleccionada de entre los géneros: Eleusíne, Lollium, Bambusa, Brasslca, Dactylis, Sorghum, Pennisetum, Zea, Oryza, Triticum, Sécale, Avena, Hoxdeum, Saccharum, Coix, Glycíne y Gossypi m. 36. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 34, caracterizada porque la planta transgénica o explantación de planta es Arabidosis . 37. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 34, caracterizada porque la planta transgénica o explantación de planta es Gossypium. 38. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 34, caracterizada porque la planta o explantación de planta exhibe resistencia aumentada al glifosato comparada con una planta de tipo silvestre de la misma especie, cepa o 339 variedad. 39. Una semilla, caracterizada porque se produce por la planta de la reivindicación 34. 40. Una planta transgénica, caracterizada porque contiene un gen heterólogo que codifica una glifosato N-acetiltransferasa que tiene una kcat/Km de por lo menos 10 mM"1 min"1 para glifosato, en donde la planta exhibe tolerancia al glifosato aplicado a un nivel efectivo para inhibir el crecimiento de la misma planta que carece del gen heterólogo, sin reducción significante del rendimiento debido a la aplicación de herbicida. 41. La planta transgénica de conformidad con la reivindicación 40, caracterizada porque la glifosato N-acetiltransferasa cataliza la acetilación del ácido aminometilfosfónico . 42. Un polipéptido aislado o recombinante, caracterizado porque comprende una secuencia de aminoácidos que puede ser óptimamente alineada con una secuencia seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO: 45 y SEQ ID NO: 57 para generar una marca de similaridad de por lo menos 430 utilizando la matriz BLOSUM62, una sanción de existencia de espacio de 11, y una sanción de extensión de espacio de 1, en donde el polipéptido tiene actividad de glifosato N-acetil transferasa. 43. El polipéptido aislado o recombinante de 340 conformidad con la reivindicación 42, caracterizado porque el polipéptido cataliza la acetilación del glifosato con una kcat/ ?t? de por lo menos 10 mM"1 min"1 para glifosato. 44. El polipéptido aislado o recoia inante de conformidad con la reivindicación 43, caracterizado porque el polipéptido cataliza la acetilación del glifosato con una kcat/Km de por lo menos 100 mM"1 min"1 para glifosato. 45. El polipéptido aislado o recombinante de conformidad con la reivindicación 44, caracterizado porque el polipéptido cataliza la acetilación del ácido aminometilfosfónico . 46. Un polipéptido aislado o recombinante que tiene actividad de glifosato N-acetiltransferasa, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 20 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 45 y SEQ ID NO: 57. 47. El polipéptido aislado o recombinante de conformidad con la reivindicación 46, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 50 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO:300, SEQ ID NO:445 y SEQ ID NO:457. 48. El polipéptido aislado o recombinante de conformidad con la reivindicación 46, caracterizado porque el 341 polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 100 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de S EQ ID NO.-300, S EQ ID NO:445 y SEQ ID NO:457. 49. El polipéptido aislado o recombinante de conformidad con la reivindicación 46, caracterizado porque el polipéptido comprende una secuencia de aminoácidos que comprende por lo menos 140 aminoácidos contiguos de una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO: 445 y SEQ ID NO: 457. 50. El polipéptido aislado o recombinante de conformidad con la reivindicación 46, caracterizado porque el polipéptido comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO:445 y SEQ ID NO:457. 51. La secuencia de polinucleótido de conformidad con la reivindicación 42, caracterizada porque además comprende un péptido de tránsito de cloroplasto N-terminal. 52. Una variante no natural del polipéptido de conformidad con la reivindicación 42, caracterizada porque uno o más aminoácidos del polipéptido han sido mutados . 53. Una variante no natural del polipéptido de conformidad con la reivindicación 42, caracterizada porque uno o más aminoácidos del polipéptido han sido alterados con relación a un polipéptido de origen. 342 54. El polipéptido de conformidad con la reivindicación 53, caracterizado porque el polipéptido es producido mediante un procedimiento de generación de diversidad. i 55. El polipéptido de conformidad con la reivindicación 54, caracterizado porque los procedimientos de generación de diversidad comprenden mutación o recombinación de por lo menos un polinucleótido de origen que codifica un polipéptido de glifosato N-acetiltransferasa . 0 56. El polipéptido de conformidad con la reivindicación 55, caracterizado porque el polinucleótido de origen es un polinucleótido de la reivindicación 1. 57. El polipéptido de conformidad con la reivindicación 42, caracterizado porque comprende una 5 secuencia de secreción o una secuencia de localización. 58. El polipéptido de conformidad con la reivindicación 57, caracterizado porque comprende una secuencia de tránsito de cloroplasto. 59. Un polipéptido, caracterizado porque es 0 específicamente enlazado por un antisuero policlonal resaltado contra uno o más antígenos, el antígeno que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 300, SEQ ID NO: 45 y SEQ ID NO: 57. 60. Un polipéptido que tiene actividad de GAT, 5 caracterizado por: 343 (a) un km para glifosato de por lo menos aproximadamente 2 mM o menor; (b) un km para acetil CoA de por lo menos aproximadamente 200 µ? o menor y (c) un kcat igual a por lo menos aproximadamente 6/minuto. 61. Un método para producir una planta transgénica resistente a glifosato o célula de planta, caracterizado porque comprende: (a) transformar una planta o célula de planta con un polinucleótido que codifica una glifosato N- acetiltransferasa y (b) opcionalmente regenerar una planta transgénica de la célula de planta transformada. 62. El método de conformidad con la reivindicación 61, caracterizado porque el polinucleótido es un polinucleótido de conformidad con la reivindicación 1. 63. El método de conformidad con la reivindicación 61, caracterizado porque el polinucleótido es derivado de una fuente bacteriana. 64. El método de conformidad con la reivindicación 61, caracterizado porque comprende cultivar la planta transformada o célula de planta en una concentración de glifosato que inhibe el crecimiento de una planta de tipo silvestre de la misma especie, concentración que no inhibe el crecimiento de la planta transformada. 344 65. El método de conformidad con la reivindicación 64, caracterizado porque comprende cultivar la planta transformada o célula de planta o progenie de la planta o célula de planta en concentraciones incrementadas de glifosato . 66. El método de conformidad con la reivindicación 64, caracterizado porque comprende cultivar la planta transformada o célula de planta en una concentración de glifosato que es letal para una planta de tipo silvestre o célula de planta de la misma especie. 67. El método de conformidad con la reivindicación 62, caracterizado porque comprende propagar una planta transformada con el polinucleótido de la reivindicación 1. 63. El método de conformidad con la reivindicación 67, caracterizado porque una primera planta es propagada al cruzar entre una primera planta y una segunda planta, de tal manera que algo de progenie de la cruza exhibe tolerancia al glifosato. 69. Un método para producir una variante de un polinucleótido de conformidad con la reivindicación 1, caracterizado porque comprende recom inar recursivamente un polinucleótido de la reivindicación 1 con un segundo polinucleótido, para formar de esta manera una biblioteca de polinucleótidos variantes. 70. El método de conformidad con la reivindicación 345 69, caracterizado porque comprende seleccionar un polinucleótido variante de la biblioteca en la base de la actividad de glifosato N-acetiltransferasa . 71. El método de conformidad con la reivindicación 70, caracterizado porque la recombinación recursiva es realizada in vitro. 72. El método de conformidad con la reivindicación 10, caracterizado porque la recombinación recursiva es realizada in vivo. 73. El método de conformidad con la reivindicación 70, caracterizado porque la recombinación recursiva es realizada in silico. 74. El método de conformidad con la reivindicación 70, caracterizado porque la recombinación recursiva comprende tergiversación de familia. 75. El método de conformidad con la reivindicación 70, caracterizado porque la recombinación recursiva comprende un método de tergiversación sintético. 76. El método de conformidad con la reivindicación 70, caracterizado porque comprende reemplazar por lo menos un codón de origen en una secuencia de nucleótidos con un codón sinónimo que es pref rencialmente utilizado en plantas con relación al codón de origen. 77. Una biblioteca de polinucleótidos variantes, caracterizada porque se produce mediante el método de la 346 reivindicación 70. 78. Una población de células, caracterizada porque comprende la biblioteca de la reivindicación 77. 79. Un polinucleótido recombinante producido por el método de la reivindicación 70, caracterizado porque el polinucleótido recombinante codifica un polipéptido con actividad de glifosato N-acetiltransferasa . 80. Una célula, caracterizada porque comprende el polinucleótido de la reivindicación 79. 81. La célula de conformidad con la reivindicación 80, caracterizada porque la célula es una célula de planta 82. La célula de conformidad con la reivindicación 81, caracterizada porque la célula es una célula de planta transgénica . 83. Una semilla, caracterizada porque se produce por la planta de la reivindicación 82. 84. Un polipéptido, caracterizado porque es codificado por el polinucleótido de la reivindicación 79. 85. Un método para producir una variante de un polinucleótido de la reivindicación 1, caracterizado porque comprende mutar el polinucleótido. 86. Un polinucleótido, caracterizado porque se produce por el método de la reivindicación 85. 347 87. Un método para seleccionar una planta o célula que contiene una construcción de ácido nucleico, el método caracterizado porque comprende: (a) proporcionar una planta transgénica o célula que contiene una construcción de ácido nucleico, en donde la construcción de ácido nucleico comprende una secuencia de nucleótidos que codifica una glifosato N- acetiltransferasa; (b) cultivar la planta o célula en la presencia de glifosato bajo condiciones donde la glifosato N-acetiltransferasa es expresada a un nivel efectivo, mediante lo cual la planta transgénica o célula crece a una proporción que es discerniblemente más grande que la planta o célula crecerla si no contuviera la construcción de ácido nucleico . 88. El método de conformidad con la reivindicación 87, caracterizado porque la construcción de ácido nucleico comprende una segunda secuencia de nucleótidos que codifica un polipéptido y una secuencia reguladora operablemente enlazada a la segunda secuencia de nucleótidos. 89. Un método para controlar selectivamente malas hierbas en un campo que contiene un cultivo, caracterizado porque comprende : (a) plantar el campo con semillas de cultivo o plantas que son tolerantes al glifosato como un resultado de ser transformadas con un gen que codifica una glifosato N- acetiltransferasa; y (b) aplicar al cultivo y a las malas hierbas en el campo una cantidad suficiente de glifosato para controlar las malas hierbas sin afectar significativamente al cultivo. 90. Un método para producir una planta genéticamente transformada que es tolerante hacia el glifosato, caracterizado porque comprende: (a) insertar en el genoma de una célula de planta una molécula de DNA de doble hebra, recombinante, que comprende: (i) un promotor que funciona en células de planta para ocasionar la producción de una secuencia de RNA; (ii) una secuencia de DNA estructural que ocasiona la producción de una secuencia de RNA que codifica un polipéptido de la reivindicación 42; y (iii) una región 3' no traducida que funciona en células de planta para ocasionar la adición de un estiramiento de poliadenil nucleótidos al extremo 3' de la secuencia de RNA; donde el promotor es heterólogo con respecto a la secuencia de DNA estructural y adaptado para ocasionar suficiente expresión del polipéptido codificado para aumentar la tolerancia al glifosato de una célula de planta transformada con la molécula de DNA; 349 (b) obtener una célula de planta transformada; y (c) regenerar de la célula de planta transformada una planta genéticamente transformada que tiene tolerancia incrementada al glifosato. 91. Un método para producir un cultivo, caracterizado porque comprende: (a) cultivar una planta de cultivo que es tolerante al glifosato como resultado de ser transformada con un gen que codifica una glifosato N-acetiltransferasa, bajo condiciones tales que la planta de cultivo produce un cultivo; y (b) cosechar un cultivo de la planta de cultivo. 92. El método de conformidad con la reivindicación 91, caracterizado porque comprende aplicar glifosato a la planta de cultivo a una concentración efectiva para controlar malas hierbas. 93. El método de conformidad con la reivindicación 92, caracterizado porque el cultivo es algodón, maiz o semilla de soya. 94. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 31, 45, 51, 54 86, 90, 91, 97, 103, 105, 106, 114, 123, 129, 139 y/o 145 el residuo de aminoácido es Bl; y (b) en las posiciones 3, 5, 8, 10, 11 14, 17, 18, 24, 27, 32, 37, 38, 47, 48, 49, 52, 57, 58, 61, 62, 63, 68, 69, 79, 80, 82, 83, 89, 92, 100, 101, 104, 119, 120, 124, 125, 126, 128, 131, 143 y/o 144 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado de grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 95. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 129, 139 y/o 145 el residuo de aminoácido es Zl; (b) en las posiciones 31 y/o 45 el residuo de aminoácido es Z2; (c) en las posiciones 8 y/o 89 el residuo de aminoácido es Z3; (d) en las posiciones 82, 92, 101 y/o 120 el residuo de aminoácido es Z4; 351 en las . posiciones 3, 11, 27 y/o 79 el residuo de aminoácido es Z5; en la posición 123 el residuo de aminoácido es Zl o Z2; en las posiciones 12, 33, 35, 39, 53, 59, 112, 132, 135, 140 y/o 146 el residuo de aminoácido es Zl o Z3; en la posición 30 el residuo de aminoácido es Zl o Z4; en la posición 6 el residuo de aminoácido es Zl o Z6; en las posiciones 81 y/o 113 el residuo de aminoácido es Z2 o Z3; en las posiciones 138 y/o 142 el residuo de aminoácido es Z2 o Z4; en las posiciones 5, 17, 24, 57, 61 124 y/o 126 el residuo de aminoácido es Z3 o Z4; en la posición 104 el residuo de aminoácido es Z3 o Z5; en las posiciones 38, 52, 62 y/o 69 el residuo de aminoácido es Z3 o 6; en las posiciones 14, 119 y/o 144 el residuo de aminoácido es Z4 o Z5 en la posición 18 el residuo de aminoácido es Z4 o Z6; en las posiciones 10, 32, 48, 63, 80 y/o 83 el residuo de aminoácido es Z5 o Z6; en la posición 40 el residuo de aminoácido es Zl, Z2 o Z3; en las posiciones 65 y/o 96 el residuo de aminoácido es Zl, Z3 o Z5; (u) en las posiciones 84 y/o 115 el residuo de aminoácido es Zl, Z3 o Z4; (v) en la posición 93 el residuo de aminoácido es Z2, Z3 o Z4; (w) en la posición 130 el residuo de aminoácido es Z2, Z4 o Z6; (x) en las posiciones 47 y/o 58 el residuo de aminoácido es Z3, Z4 o Z6; (y) en las posiciones 49, 68, 100 y/o 143 el residuo de aminoácido es Z3, Z4 o Z5; (z) en la posición 131 el residuo de aminoácido es Z3, Z5 o Z6; (aa) en las posiciones 125 y/o 128 el residuo de aminoácido es Z4, Z5 o Z6; (ab) en la posición 31 y/o 45 el residuo de aminoácido es Zl, Z3, Z4 o Z5; (ac) en la posición 60 el residuo de aminoácido es Zl, Z4, Z5 o Z6; y (ad) en la posición 37 el residuo de aminoácido es Z3, Z4, Z5 o Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que 353 consiste de R, H y K Z5 es un aminoácido seleccionado del grupo que consiste de D y E y Z6 es un aminoácido seleccionado del grupo que consiste de c, G y P. 96. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, , Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 97. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 50, 64, 72, 75, 76, 78, 94, 98, 110, 121 y/o 141 el residuo de aminoácido es Zl; (b) en las posiciones 13, 46, 56, 70, 107, 117 y/o 118 el residuo de aminoácido es Z2; (c) en las posiciones 23, 55, 71, 77, 88 y/o 109 el residuo de aminoácido es Z3; (d) en las posiciones 16, 21, 41, 73, 85, 99 y/o 111 el residuo de aminoácido es Z4; (e) en las posiciones 34 y/o 95 el residuo de aminoácido es Z5; (f) en las posiciones 22, 25, 29, 43, 44, 66, 74, 87, 102, 108, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T Z4 es un aminoácido seleccionado del grupo que consiste de , H y ; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. 98. El polinucleótido aislado o recom inante de conformidad con la reivindicación 94, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 99. El polinucleótido aislado o recombinante de conformidad con la reivindicación 94, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que 356 consiste de A, I, L, M, F, , Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 100. El polinucleótido aislado o recoiabinante de conformidad con la reivindicación 94, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, ? y T. 101. El polinucleótido aislado o recombinante de conformidad con la reivindicación 95, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2 en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 102. El polinucleótido aislado o recombinante de conformidad con la reivindicación, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en la posición 2 el residuo de aminoácido es I o L; (b) en la posición 3 el residuo de aminoácido es E o D; (c) en la posición 4 el residuo de aminoácido es V, A o I; (d) en la posición 5 el residuo de aminoácido es , R o N; (e) en la posición 6 el residuo de aminoácido es P o L; (f) en la posición 8 el residuo de aminoácido es N, S o T; (g) en la posición 10 el residuo de aminoácido es E o G; ( ) en la posición 11 el residuo de aminoácido es D o E; (i) en la posición 12 el residuo de aminoácido es T o A; (j) en la posición 14 el residuo de aminoácido es E o K; 358 (JO en la posición 15 el residuo de aminoácido es I o L; (1) en la posición 17 el residuo de aminoácido es H o Q; (m) en la posición 18 el residuo de aminoácido es , C o K; (n) en la posición 19 el residuo de aminoácido es I o V; (o) en la posición 24 el residuo de aminoácido es Q o R; (p) en la posición 26 el residuo de aminoácido es L o I; (q) en la posición 27 el residuo de aminoácido es E o D; (r) en la posición 28 el residuo de aminoácido es A o V; (s) en la posición 30 el residuo de aminoácido es K, M 0 R; (t) en la posición 31 el residuo de aminoácido es Y o F; (u) en la posición 32 el residuo de aminoácido es E o G (v) en la posición 33 el residuo de aminoácido es T, A o ?; (w) en la posición 35 el residuo de aminoácido es L, S o M; (X) en la posición 37 el residuo de aminoácido es R, G, E )'* (y) en la posición 38 el residuo de amino cido es G o S; (z) en la posición 39 el residuo de aminoácido es T, A o s; (aa) en la posición 40 el residuo de aminoácido es F, L o S; (ab) en la posición 45 el residuo de aminoácido es Y o F; (ac) en la posición 47 el residuo de aminoácido es R, Q o G; (ad) en la posición 48 el residuo de aminoácido es G o D; (ae) en la posición 49 el residuo de aminoácido es K, R, E o (af) en la posición 51 el residuo de aminoácido es I o V; (ag) en la posición 52 el residuo de aminoácido es S, C o G; 359 (ah) en la posición 53 el residuo de aminoácido es I o T; (ai) en la posición 54 el residuo de aminoácido es A o V; (aj) en la posición 57 el residuo de aminoácido es H o N; (ak) en la posición 58 el residuo de aminoácido es Q, K, N o P; (al) en la posición 59 el residuo de aminoácido es A o S; (am) en la posición 60 el residuo de aminoácido es E, K, G, V o D; (an) en la posición 61 el residuo de aminoácido es H o Q; (ao) en la posición 62 el residuo de aminoácido es P, S o T; (ap) en la posición 63 el residuo de aminoácido es E, G o D; (aq) en la posición 65 el residuo de aminoácido es E, D, V o Q (ar) en la posición 67 el residuo de aminoácido es Q, E, R, L, H o ; (as) en la posición 68 el residuo de aminoácido es K, R, E o N (at) en la posición 69 el residuo de aminoácido es Q o P; (au) en la posición 79 el residuo de aminoácido es E o D; (av) en la posición 80 el residuo de aminoácido es G o E; (aw) en la posición 81 el residuo de aminoácido es Y, o F; (ax) en la posición 82 el residuo de aminoácido es R o H (ay) en la posición 83 el residuo de aminoácido es E, G o D; (az) en la posición 84 el residuo de aminoácido es Q, R o L; (ba) en la posición 86 el residuo de aminoácido es A o V; 360 (bb) en la posición 89 el residuo de aminoácido es T o S; (be) en la posición 90 el residuo de aminoácido es L o I; (bd) en la posición 91 el residuo de aminoácido es I o V; (be) en la posición 92 el residuo de aminoácido es R o ; (bf) en la posición 93 el residuo de aminoácido es H , Y o Q; (bg) en la posición 96 el residuo de aminoácido es E , A o Q; (bh) en la posición 97 el residuo de aminoácido es L o I ; (bi) en la posición 100 el residuo de aminoácido es , R, N E; (bj) en la posición 101 el residuo de aminoácido es K o R; (bk) en la posición 103 el residuo de aminoácido es A o V; (bl) en la posición 104 el residuo de aminoácido es D o N; (bm) en la posición 105 el residuo de aminoácido es L o M; (bn) en la posición 106 el residuo de aminoácido es L o I; (bo) en la posición 112 el residuo de aminoácido es T o I; (bp) en la posición 113 el residuo de aminoácido es s, T o F; (bq) en la posición 114 el residuo de aminoácido es A o V; (br) en la posición 115 el residuo de aminoácido es s, R o A; (bs) en la posición 119 el residuo de aminoácido es K, E o R; (bt) en la posición 120 el residuo de aminoácido es o R; (bu) en la posición 123 el residuo de aminoácido es F o L; (bv) en la posición 124 el residuo de aminoácido es S o R; (bw) en la posición 125 el residuo de aminoácido es E K, G o n · (bx) en la posición 126 el residuo de aminoácido es Q 0 H; 361 (by) en la posición 128 el residuo de aminoácido es E, G o K; (bz) en la posición 129 el residuo de aminoácido es V, l o A; (ca) en la posición 130 el residuo de aminoácido es Y, H, F o C; (cb) en la posición 131 el residuo de aminoácido es D, G, N o E; (ce) en la posición 132 el residuo de aminoácido es I, T, A, M, V o L; (cd) en la posición 135 el residuo de aminoácido es V, T, A o I; (ce) en la posición 138 el residuo de aminoácido es H o Y; (cf) en la posición 139 el residuo de aminoácido es I o V; (cg) en la posición 140 el residuo de aminoácido es L o ?; (ch) en la posición 142 el residuo de aminoácido es Y o H; (ci) en la posición 143 el residuo de aminoácido es K, T o E; (cj) en la posición 144 el residuo de aminoácido es K, E o ; (ck) en la posición 145 el residuo de aminoácido es L o I; y (el) en la posición 146 el residuo de aminoácido es T o A. 103. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en la posición 9, 76, 94 y 110 el residuo de aminoácido es A; 362 (b) en la posición 29 y 108 el residuo de aminoácido es C; (c) en la posición 34 el residuo de aminoácido es D; (d) en la posición 95 el residuo de aminoácido es E; (e) en la posición 56 el residuo de aminoácido es F; (f) en la posición 43, 44, 66, 74, 87, 102, 116, 122, 127 y 136 el residuo de aminoácido es G; (g) en la posición 41 el residuo de aminoácido es H; (h) en la posición 7 el residuo de aminoácido es I; (i) en la posición 85 el residuo de aminoácido es K; (j) en la posición 20, 36, 42, 50, 72, 78, 98 y 121 el residuo de aminoácido es L; (k) en la posición 1, 75 y 141 el residuo de aminoácido es M; (1) en la posición 23, 64 y 109 el residuo de aminoácido es N; (m) en la posición 22, 25, 133, 134 y 137 el residuo de aminoácido es P; (n) en la posición 71 el residuo de aminoácido es Q; (o) en la posición 16, 21, 73, 99 y 111 el residuo de aminoácido es R; (p) en la posición 55 y 88 el residuo de aminoácido es S; (q) en la posición 77 el residuo de aminoácido es T; (r) en la posición 107 el residuo de aminoácido es W; y (s) en la posición 13, 46, 70, 117 y 118 el residuo de aminoácido es Y. 104. El polinucleótido aislado o recombinante de 363 conformidad con la reivindicación 102, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, , P, S y . 105. El polinucleótido aislado o recombinante de conformidad con la reivindicación 103, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 31, 45, 51, 54 86, 90, 91, 97, 103, 105, 106, 114, 123, 129, 139 y/o 145 el residuo de aminoácido es Bl; y (b) en las posiciones 3, 5, 8, 10, 11 14, 17, 18, 24, 27, 32, 37, 38, 47, 48, 49, 52, 57, 58, 61, 62, 63, 68, 69, 79, 364 80, 82, 83, 89, 92, 100, 101, 104, 119, 120, 124, 125, 126, 128, 131, 143 y/o 144 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado de grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 106. El polinucleótido aislado o recombinante de conformidad con la reivindicación 102, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 50, 64, 72, 75, 76, 78, 94, 98, 110, 121 y/o 141 el residuo de aminoácido es Zl; (b) en las posiciones 13, 46, 56, 70, 107, 117 y/o 118 el residuo de aminoácido es Z2; (c) en las posiciones 23, 55, 71, 77, 88 y/o 109 el residuo de aminoácido es Z3; (d) en las posiciones 16, 21, 41, 73, 85, 99 y/o 111 el residuo de aminoácido es Z4; (e) en las posiciones 34 y/o 95 el residuo de aminoácido es Z5; (f) en la posición 22, 25, 29, 43, 44, 66, 74, 87, 102, 108, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de 365 aminoácido es Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y ; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. 107. El polinucleótido aislado o recombinante de conformidad con la reivindicación 103, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 129, 139 y/o 145 el residuo de aminoácido es Zl; (b) en las posiciones 31 y/o 45 el residuo de aminoácido es Z2; (c) en las posiciones 8 y/o 89 el residuo de aminoácido es Z3; (d) en las posiciones 82, 92, 101 y/o 120 el residuo de aminoácido es Z ; (e) en las posiciones 3, 11, 27 y/o 79 el residuo de aminoácido es Z5; 366 en la posición 123 el residuo de aminoácido es Zl o Z2 r en las. posicianias L2_, 33, 3.5, 19, 53, 5.3, 1L2_, L3Z, 125, 140 y/o 146 el residuo de aminoácido es Zl o Z3; en la posición 30 el residuo de aminoácido es Zl o Z4; en la posición 6 el residuo de aminoácido es Zl o 6; en las posiciones 81 y/o 113 el residuo de aminoácido es Z2 o Z3; en las posiciones 138 y/o 142 el residuo de aminoácido es Z2 o Z4; en las posiciones 5, 17, 24, 57, 61, 124 y/o 126 el residuo de aminoácido es Z3 o Z4; en la posición 104 el residuo de aminoácido es Z3 o Z5; en las posiciones 38, 52, 62 y/o 69 el residuo de aminoácido es Z3 o Z6; en las posiciones 14, 119 y/o 144 el residuo de aminoácido es 24 o Z5; en la posición 18 el residuo de aminoácido es Z4 o Z6; en las posiciones 10, 32, 48, 63, 80 y/o 83 el residuo de aminoácido es Z5 o Z6; en la posición 40 el residuo de aminoácido es Zl, Z2 o Z3; en las posiciones 65 y/o 96 el residuo de aminoácido es Zl, Z3 o Z5; en las posiciones 84 y/o 115 el residuo de aminoácido es Zl, Z3 o Z4; 367 (v) en la posición 93 el residuo de aminoácido es Z2, Z3 o Z4; (w) en la posición 130 el residuo de aminoácido es Z2, Z4 o Z6; (x) en las posiciones 47 y/o 58 el residuo de aminoácido es Z3, Z4 o Z6; (y) en las posiciones 49, 68, 100 y/o 143 el residuo de aminoácido es Z3, Z4 o Z5 (z) en la posición 131 el residuo de aminoácido es Z3, Z5 o Z6; (aa) en las posiciones 125 y/o 128 el residuo de aminoácido es Z4, Z5 o Z6; (ab) en la posición 67 el residuo de aminoácido es Zl, Z3, Z4 o Z5 (ac) en la posición 60 el residuo de aminoácido es Zl, Z4, Z5 o Z6 (ad) en la posición 37 el residuo de aminoácido es Z3, Z4, Z5 o Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y ; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido 368 seleccionado del grupo que consiste de C, G y P. 108. El polinucleótido aislado o recombinante de conformidad con la reivindicación 102, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en la posición 9, 76, 94 y 110 el residuo de aminoácido es A; (b) en la posición 29 y 108 el residuo de aminoácido es C; (c) en la posición 34 el residuo de aminoácido es D; (d) en la posición 95 el residuo de aminoácido es E; (e) en la posición 56 el residuo de aminoácido es F; <f) en la posición 43, 44, 66, 74, 87, 102, 116, 122, 127 y 136 el residuo de aminoácido es G; (g) en la posición 41 el residuo de aminoácido es H; (h) en la posición 7 el residuo de aminoácido es I; (i) en la posición 85 el residuo de aminoácido es K (j) en la posición 20, 36, 42, 50, 72, 78, 98 y 121 el residuo de aminoácido es L; (k) en la posición 1, 75 y 141 el residuo de aminoácido es M; (1) en la posición 23, 64 y 109 el residuo de aminoácido es N; (m) en la posición 22, 25, 133, 134 y 137 el residuo de aminoácido es P; (n) en la posición 71 el residuo de aminoácido es Q; 369 (o) en la posición 16, 21, 73, 99 y 111 el residuo de aminoácido es R; (p) en la posición 55 y 88 el residuo de aminoácido es S (q) en la posición 77 el residuo de aminoácido es T; (r) en la posición 107 el residuo de aminoácido es W; y (s) en la posición 13, 46, 70, 117 y 118 el residuo de aminoácido es Y. 109. El polinucleótido aislado o recom inante de conformidad con la reivindicación 1, caracterizado porque el residuo de aminoácido en la secuencia de aminoácidos que corresponde a la posición 28 es V. 110. El polinucleótido aislado o recombinante de conformidad con la reivindicación 1, caracterizado porque la secuencia de aminoácidos es seleccionada del grupo que consiste de SEQ ID NO: 6-10 y 263-514. 111. El polipéptido aislado o recombinante de conformidad con la reivindicación 42, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 31, 45, 51, 54 86, 90, 91, 97, 103, 105, 106, 114, 123, 129, 139 y/o 145 el residuo de aminoácido es Bl; y (b) en las posiciones 3, 5, 8, 10, 11 14, 17, 18, 24, 27, 32, 37, 38, 47, 48, 49, 52, 57, 58, 61, 62, 63, 68, 69, 79, 370 80, 82, 33, 89, 92, 100, 101, 104, 119, 120, 124, 125, 126, 128, 131, 143 y/o 144 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado de grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 112. El polipéptido aislado o recom inante de conformidad con la reivindicación 42, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 129, 139 y/o 145 el residuo de aminoácido es Zl; (b) en las posiciones 31 y/o 45 el residuo de aminoácido es Z2; (c) en las posiciones 8 y/o 89 el residuo de aminoácido es Z3; (d) en las posiciones 82, 92, 101 y/o 120 el residuo de aminoácido es Z4; (e) en las posiciones 3, 11, 27 y/o 79 el residuo de aminoácido es Z5; (f) en la posición 123 el residuo de aminoácido es Zl o Z2; (g) en las posiciones 12, 33, 35, 39, 53, 59, 112, 132, 135, 371 140 y/o 146 el residuo de aminoácido es Zl o Z3; (h) en la posición 30 el residuo de aminoácido es Zl o Z4; (i) en la posición 6 el residuo de aminoácido es Zl o Z6; (j) en las posiciones 81 y/o 113 el residuo de aminoácido es Z2 o Z3; (k) en las posiciones 138 y/o 142 el residuo de aminoácido es Z2 o Z4; (1) en las posiciones 5, 17, 24, 57, 61, 124 y/o 126 el residuo de aminoácido es Z3 o 2 ; (m) en la posición 104 el residuo de aminoácido es 23 o Z5; (o) en las posiciones 38, 52, 62 y/o 69 el residuo de aminoácido es Z3 o Z6; (p) en las posiciones 14, 119 y/o 144 el residuo de aminoácido es Z4 o Z5; (q) en la posición 18 el residuo de aminoácido es Z4 o Z6; (r) en las posiciones 10, 32, 48, 63, 80 y/o 83 el residuo de aminoácido es Z5 o Z6; (s) en la posición 40 el residuo de aminoácido es Zl, Z2 o Z3; (t) en las posiciones 65 y/o 96 el residuo de aminoácido es Zl, Z3 o Z5; (u) en las posiciones 84 y/o 115 el residuo de aminoácido es Zl, Z3 o Z4; (v) en la posición 93 el residuo de aminoácido es Z2, Z3 o Z4; (w) en la posición 130 el residuo de aminoácido es Z2, Z4 o Z6; (x) en las posiciones 47 y/o 58 el residuo de aminoácido es 23, Z4 o Z6; (y) en las posiciones 49, 68, 100 y/o 143 el residuo de aminoácido es Z3, Z4 o Z5; (z) en la posición 131 el residuo de aminoácido es Z3, Z5 o Z6 (aa) en las posiciones 125 y/o 128 el residuo de aminoácido es Z4, Z5 o Z6; (ab) en la posición 67 el residuo de aminoácido es Zl, Z3, Z4 o Z5; (ac) en la posición 60 el residuo de aminoácido es Zl, Z4, Z5 o Z6; (ad) en la posición 37 el residuo de aminoácido es Z3, Z4, Z5 o Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y K; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. 113. El polipéptido aislado o recombinante de conformidad con la reivindicación 42, caracterizado porque de loa residuos de aminoácido en la secuencia de aminaá.cidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y . 114. Bl polipéptido aislado o recorabinante de conformidad con la reivindicación 42,. caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 50, 64, 72, 75, 76, 78, 94, 98, 110, 121 y/o 141 el residuo de aminoácido es Zl; (b) en las posiciones 13, 46, 56, 70, 107, 117 y/o 118 el residuo de aminoácido es 22; 374 (c) en las posiciones 23, 55, 71, 77, 88 y/o 109 el residuo de aminoácido es Z3; (d) en las posiciones 16, 21, 41, 73, 85, 99 y/o 111 el residuo de aminoácido es Z4; (e) en las posiciones 3 y/o 95 el residuo de aminoácido es Z5; (f) en la posición 22, 25, 29, 43, 44, 66, 74, 87, 102, 108, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y ; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. 115. El polipéptido aislado o recombinante de conformidad con la reivindicación 111, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y 375 (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, ? y T. 116. El polipéptido aislado o recombinante de conformidad con la reivindicación 111, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Qr E, G, H, , P, S y T. 117. El polipéptido aislado o recombinante de 376 conformidad con la reivindicación 111, caracterizado porque de los residuos de amina-ácido- en la- secuencia- de- ami-noá ido-s- que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: 5 (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 10 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2 ; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, 1, "M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, lí D, C, Q, E, G, H, K, P, S y . 118. El polipéptido aislado o recombinante de conformidad con la reivindicación 112, caracterizado porque de los residuos de amino-ácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 20 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 38, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 25 55, 66 , 71, 73 , 74 , 77 , 85 , 87 , 88 , 95 , 99, 102, 108, 377 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2 en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y ? V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, 119. El polipéptido aislado o recombinante de conformidad con la reivindicación 42, caracterizado porgue de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en la posición 2 el residuo de aminoácido es I o L; (b) en la posición 3 el residuo de aminoácido es E o D; (c) en la posición 4 el residuo de aminoácido es v, A o I; (d) en la posición 5 el residuo de aminoácido es , R o N; (e) en la posición 6 el residuo de aminoácido es P o L; (f) en la posición 8 el residuo de aminoácido es N, S o T (g) en la posición 10 el residuo de aminoácido es E o G; (h) en la posición 11 el residuo de aminoácido es D o E; (i) en la posición 12 el residuo de aminoácido es T o A; (i) en la posición 14 el residuo de aminoácido es E o K; (JO en la pp-sición 15 el residuo de aminoácido es I o L (1) en la posición 17 el residuo de aminoácido es H o Q; (m) en la posición 18 el esiduo de aminoácido es R , C o K; (n) en la posición 19 el residuo de aminoácido es I o V; 378 (o) en la posición 24 el residuo de aminoácido es Q o R, (p) en la posición 26 el residuo de aminoácido es L o I, (q) en la posición 27 el residuo de aminoácido es E o D; (r) en la posición 28 el residuo de aminoácido es A o V; (s) en la posición 30 el residuo de aminoácido es , M o R; (t) en la posición 31 el residuo de aminoácido es Y o F; (u) en la posición 32 el residuo de aminoácido es E o G (v) en la posición 33 el residuo de aminoácido es T, A o S; ( ) en la posición 35 el residuo de aminoácido es L, S o M; (x) en la posición 37 el residuo de aminoácido es R, G, E o Q; (y) en la posición 36 el residuo de aminoácido es G o S; (z) en la posición 39 el residuo de aminoácido es T, A o S; (aa) en la posición 40 el residuo de aminoácido es F, L o S; (ab) en la posición 45 el residuo de aminoácido es Y o F; (ac) en la posición 47 el residuo de aminoácido es R, Q o G; (ad) en la posición 48 el residuo de aminoácido es G o D; (ae) en la posición 49 el residuo de aminoácido es K, R, E o (af) en la posición 51 el residuo de aminoácido es I o V; (ag) en la posición 52 el residuo de aminoácido es s, C o G (ah) en la posición 53 el residuo de aminoácido es I o T; (ai) en la posición 54 el residuo de aminoácido es A o V; (aj) en la posición 57 el residuo de aminoácido es H o N; (ak) en la posición 58 el residuo de aminoácido es Q, K, N o 379 P; (ai; en la posición 59 el residuo de aminoácido es A o S; ( am; en la posición 60 el residuo de aminoácido es E, K, G, V o D; (an) en la posición 61 el residuo de aminoácido es H o Q; (ao¡ en la posición 62 el residuo de aminoácido es P, S o T; (api en la posición 63 el residuo de aminoácido es E, G o D; (aq) en la posición 65 el residuo de aminoácido es E, D, V o Q; (ar] en la posición 67 el residuo de aminoácido es Q, E, R, L, H o K (as; en la posición 68 el residuo de aminoácido es K, R, E o N; (at) en la posición 69 el residuo de aminoácido es Q o P; (au) en la posición 79 el residuo de aminoácido es E o D; (av) en la posición 80 el residuo de aminoácido es G o E; (aw) en la posición 81 el residuo de aminoácido es Y, N o F; (ax) en la posición 82 el residuo de aminoácido es R o H; (ay) en la posición 83 el residuo de aminoácido es E, G o D; (az) en la posición 84 el residuo de aminoácido es Q, R o L; (ba) en la posición 86 el residuo de aminoácido es A o V; (bb) en la posición 89 el residuo de aminoácido es T o S; (be; en la posición 90 el residuo de aminoácido es L o I; (bd) en la posición 91 el residuo de aminoácido es I o V; (be) en la posición 92 el residuo de aminoácido es R o K 380 (bf) en la posición 93 el residuo de aminoácido es H, Y o Q (bg) en la posición 96 el residuo de aminoácido es E, A o Q; (bh) en la posición 97 el residuo de aminoácido es L o I; (bi) en la posición 100 el residuo de aminoácido es K, R, o E; (bj) en la posición 101 el residuo de aminoácido es K o R; (bk) en la posición 103 el residuo de aminoácido es A o V; (bl) en la posición 104 el residuo de aminoácido es D o N"; (bm> en la posición 105 el residuo de aminoácido es L o M; (bn) en la posición 106 el residuo de aminoácido es L o I; (bo) en la posición 112 el residuo de aminoácido es T o I; (bp) en la posición 113 el residuo de aminoácido es s, T o F; (bq) en la posición 114 el residuo de aminoácido es A o V; (br) en la posición 115 el residuo de aminoácido es s, R o A; (bs) en la posición 119 el residuo de aminoácido es K, E o R (bt) en la posición 120 el residuo de aminoácido es K o R; (bu) en la posición 123 el residuo de aminoácido es F o L (bv) en la posición 124 el residuo de aminoácido es S o R; (b ) en la posición 125 el residuo de aminoácido es E, K, G o n - (bx) en la posición 126 el residuo de aminoácido es Q o H ; (by) en la posición 128 el residuo de aminoácido es E, G o K; (bz) en la posición 129 el residuo de aminoácido es , I o A; (ca) en la posición 130 el residuo de aminoácido es Y, H, F o C; 381 (cb) en la posición 131 el residuo de aminoácido es D, G, o E; (ce) en la posición 132 el residuo de aminoácido es i, t, A, (cd) en la posición 135 el residuo de aminoácido es V, T, A o Ti- . (ce) en la posición 138 el residuo de aminoácido es H o Y; (cf) en la posición 139 el residuo de aminoácido es I o V; (cg) en la posición 140 el residuo de aminoácido es L o S; (ch) en la posición 142 el residuo de aminoácido es Y o H; (ci) en la posición 143 el residuo de aminoácido es K, T o E; (cj) en la posición 144 el residuo de aminoácido es , E o R; (ck) en la posición 145 el residuo de aminoácido es L o I; y (el) en la posición 146 el residuo de aminoácido es T o A. 120. El polipéptido aislado o recom inante de conformidad con la reivindicación 42, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en la posición 9, 76, 94 110 el residuo de aminoácido es A; (b) en la posición 29 y 10.8 el residuo de aminoácido es C (c) en la posición 34 el residuo de aminoácido es D; (d) en la posición 95 el residuo de aminoácido es E; (e) en la posición 56 el residuo de aminoácido es F; 382 (f) en la posición 43, 44, 66, 74, 87, 102, 116, 122, 127 y 136 el residuo de aminoácido es G; tg) en la posición 41 el residuo de aminoácido es H; (h) en la posición 7 el residuo de aminoácido es I; (i) en la posición 85 el residuo de aminoácido es K; (j) en la posición 20, 36, 42, 50, 72, 78, 98 y 121 el residuo de aminoácido es L; (k) en la posición 1, 75 y 141 el residuo de aminoácido es M; (1) en la posición 23, 64 y 109 el residuo de aminoácido es N; (m) en la posición 22, 25, 133, 134 y 137 el residuo de aminoácido es P (n) en la posición 71 el residuo de aminoácido es Q; (o) en la posición 16, 21, 73, 99 y 111 el residuo de aminoácido es R; (p) en la posición 55 y 88 el residuo de aminoácido es S; (q) en la posición 77 el residuo de aminoácido es T; (r) en la posición 107 el residuo de aminoácido es W; y (s) en la posición 13, 46, 70, 117 y 118 el residuo de aminoácido es Y. 121. El polipéptido aislado o recombinante de conformidad con la reivindicación 119, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 13, 20, 36, 42, 46, 50, 56, 64, 70, 72, 75, 76, 78, 94, 98, 107, 110, 117, 118, 121 y/o 141 el residuo de aminoácido es Bl; y (b) en las posiciones 16, 21, 22, 23, 25, 29, 34, 41, 43, 44, 55, 66, 71, 73, 74, 77, 85, 87, 88, 95, 99, 102, 108, 109, 111, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado del grupo que consiste de R, N, D, C, Q, E, G, H, K, P, S y T. 122. El polipéptido aislado o recombinante de conformidad con la reivindicación 120, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 31, 45, 51, 54 86, 90, 91, 97, 103, 105, 106, 114, 123, 129, 139 y/o 145 el residuo de aminoácido es Bl; y (b) en las posiciones 3, 5, 8, 10, 11 14, 17, 18, 24, 27, 32, 37, 38, 47, 48, 49, 52, 57, 5ß, 61, 62, 63, 68, 69, 79, 80, 82, 83, 89, 92, 100, 101, 104, 119, 120, 124, 125, 126, 128, 131, 143 y/o 144 el residuo de aminoácido es B2; en donde Bl es un aminoácido seleccionado del grupo que 384 consiste de A, I, L, M, F, W, Y y V; y B2 es un aminoácido seleccionado de grupo que consiste de R, N, D, C, Q, E , G, H, , P, S y T. 123. El polipéptido aislado o recom inante de conformidad con la reivindicación 119, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 90% conforman a las siguientes restricciones: (a) en las posiciones 1, 7, 9, 20, 36, 42, 50, 64, 72, 75, 76, 78, 94, 98, 110, 121 y/o 141 el residuo de aminoácido es Zl; (b) en las posiciones 13, 46, 56, 70, 107, 117 y/o lia el residuo de aminoácido es Z2; (c) en las posiciones 23, 55, 71, 77, 88 y/o 109 el residuo de aminoácido es Z3; (d) en las posiciones 16, 21, 41, 73, 85, 99 y/o 111 el residuo de aminoácido es Z4; (e) en las posiciones 34 y/o 95 el residuo de aminoácido es Z5; (f) en la posición 22, 25, 29, 43, 44, 66, 74, 87, 102, 108, 116, 122, 127, 133, 134, 136 y/o 137 el residuo de aminoácido es Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, W y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S 385 y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y K; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de c, G y P. 124. El polipéptido aislado o recombinante de conformidad con la reivindicación 120, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% conforman a las siguientes restricciones: (a) en las posiciones 2, 4, 15, 19, 26, 28, 51, 54, 86, 90, 91, 97, 103, 105, 106, 114, 129, 139 y/o 145 el residuo de aminoácido es Zl; (b) en las posiciones 31 y/o 45 el residuo de aminoácido es Z2; (c) en las posiciones 8 y/o 89 el residuo de aminoácido es Z3; (d) en las posiciones 82, 92, 101 y/o 120 el residuo de aminoácido es Z4; (e) en las posiciones 3, 11, 27 y/o 79 el residuo de aminoácido es Z5; (f) en la posición 123 el residuo de aminoácido es Zl o Z2; (g) en las posiciones 12, 33, 35, 39, 53, 59, 112, 132, 135, 140 y/o 146 el residuo de aminoácido es Zl o Z3; (h) en la posición 30 el residuo de aminoácido es 21 o Z4 (i) en la posición 6 el residuo de aminoácido es Zl o Z6; 386 (j) en las posiciones 81 y/o 113 el residuo de aminoácido es Z2 o Z3; (k) en las posiciones 138 y/o 142 el residuo de aminoácido es Z2 o Z4; (1) en las posiciones 5, 17, 24, 57, 61, 124 y/o 126 el residuo de aminoácido es Z3 o Z4; (m) en la posición 104 el residuo de aminoácido es Z3 o 25; (o) en las posiciones 38, 52, 62 y/o 69 el residuo de aminoácido es Z3 o Z6; (p) en las posiciones 14, 119 y/o 144 el residuo de aminoácido es Z4 o Z5; (q) en la posición 18 el residuo de aminoácido es Z4 o Z6; (r) en las posiciones 10, 32, 48, 63, 80 y/o 83 el residuo de aminoácido es Z5 o 26; (s) en la posición 40 el residuo de aminoácido es Zl, Z2 o Z3; (t) en las posiciones 65 y/o 96 el residuo de aminoácido es Zl, Z3 o Z5; (u) en las posiciones 84 y/o 115 el residuo de aminoácido es Zl, Z3 o Z4; (v) en la posición 93 el residuo de aminoácido es Z2, 23 o Z4; ( ) en la posición 130 el residuo de aminoácido es Z2, 24 o Z6; (x) en las posiciones 47 y/o 58 el residuo de aminoácido es Z3, Z4 o Z€; (y) en las posiciones 49, 68, 100 y/o 143 el residuo de aminoácido es Z3, Z4 o Z5; (z) en la posición 131 el residuo de aminoácido es Z3, Z5 o Z6 (aa) en las posiciones 125 y/o 123 el residuo de aminoácido es Z4, Z5 o Z6; (ab) en la posición 67 el residuo de aminoácido es Zl, Z3, Z4 o Z5; (ac) en la posición 60 el residuo de aminoácido es Zl, 24, Z5 o Z6; (ad) en la posición 37 el residuo de aminoácido es Z3, Z4, Z5 o Z6; en donde Zl es un aminoácido seleccionado del grupo que consiste de A, I, L, M y V; Z2 es un aminoácido seleccionado del grupo que consiste de F, y Y; Z3 es un aminoácido seleccionado del grupo que consiste de N, Q, S y T; Z4 es un aminoácido seleccionado del grupo que consiste de R, H y ; Z5 es un aminoácido seleccionado del grupo que consiste de D y E; y Z6 es un aminoácido seleccionado del grupo que consiste de C, G y P. 125. El polipéptido aislado o recombinante de conformidad con la reivindicación 119, caracterizado porque de los residuos de aminoácido en la secuencia de aminoácidos que corresponde a las siguientes posiciones, por lo menos 80% 388 conforman a las siguientes restricciones: (a) en la posición 9, 76, 94 y 110 el residuo de aminoácido es A; (b) en la posición 29 y 108 el residuo de aminoácido es C; (c) en la posición 34 el residuo de aminoácido es D; (d) en la posición 95 el residuo de aminoácido es E; (e) en la posición 56 el residuo de aminoácido es F; (f) en la posición 43, 44, 66, 74, 87, 102, 116, 122, 127 y 136 el residuo de aminoácido es G; (g) en la posición 41 el residuo de aminoácido es H; (h) en la posición 7 el residuo de aminoácido es I; (i) en la posición 85 el residuo de aminoácido es K (j) en la posición 20, 36, 42, 50, 72, 78, 98 y 121 el residuo de aminoácido es L (k) en la posición 1, 75 y 141 el residuo de aminoácido es M; (1) en la posición 23, 64 y 109 el residuo de aminoácido es N (m) en la posición 22, 25, 133, 134 y 137 el residuo de aminoácido es P; (n) en la posición 71 el residuo de aminoácido es Q; (o) en la posición 16, 21, 73, 99 y 111 el residuo de aminoácido es R (p) en la posición 55 y 88 el residuo de aminoácido es S; (q) en la posición 77 el residuo de aminoácido es T; (r) en la posición 107 el residuo de aminoácido es W; y 389 (s) en la posición 13, 46, 70, 117 y 118 el residuo de aminoácido es Y. 126. El polipéptido aislado o recombinante de conformidad con la reivindicación 24, caracterizado porque el residuo de aminoácido en la secuencia de aminoácidos que corresponde a la posición 28 es V. 127. El polipéptido aislado o recombinante de conformidad con la reivindicación 42, caracterizado porque la secuencia de aminoácidos es seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. 128. Una planta transgénica o explantación de planta transgénica que tiene una tolerancia aumentada al glifosato, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa y por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional. 129. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 128, caracterizada porque el polipéptido con actividad de glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste, de SEQ ID NOS: 6-10 y 263-514. 130. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 129, caracterizada porque por lo menos un polipéptido que imparte 390 tolerancia al glifosato mediante un mecanismo adicional, es seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y una glifosato óxido-reductasa tolerante a glifosato. 131. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 130, caracterizada porque por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional, es una 5-enolpiruvilshikimato-3- fos fato sintasa tolerante al glifosato. 132. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 130, caracterizada porque por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional, es una glifosato óxido-reductasa tolerante al glifosato. 133. Una planta transgénica o explantación de planta transgénica, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa y por lo menos un polipéptido que imparte tolerancia a un herbicida adicional. 134. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 133, caracterizada porque el polipéptido con actividad de glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID 391 NOS :6-10 y 263-514. 135. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación '134, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 136. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada . 137. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida.. 138. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que 392 imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida . 139. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona. 140. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona . 141. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 142. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 135, caracterizada porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es protoporfirinogen oxidasa mutada. 143. Una planta transgénica o explantación de planta transgénica que tiene una tolerancia aumentada al glifosato, caracterizada porque la planta o explantación de 393 planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa, por lo menos un polipéptido que imparte tolerancia al glifosato medíante un mecanismo adicional y por lo menos un polipéptido que imparte tolerancia a un herbicida adicional. 144. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 143, caracterizada porque el polipéptido con actividad de glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS : 6-10 y 263-514. 145. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 144, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y una glifosato óxido-reductasa tolerante a glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil 394 transferasa y una protopor firinogen oxidasa mutada. 146. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada . 147. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida. 148. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5~enolpiruvilshikimato-3-fosf to sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida. 395 149. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosf to sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona . 150. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshi)imato-3-fosfato sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 151. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetiltransferasa. 152. La planta transgénica o explantación de planta 396 transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sinta5a tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa. 153. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada. 154. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida. 155. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, 397 caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida. 156. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona . 157. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 158. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que 398 imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 159. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 145, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante al glifosato y el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa . 160. Una planta transgénica o explantación de planta transgénica que tiene una tolerancia aumentada al glifosato, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa y por lo menos un polipéptido seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato y una glifosato óxido-reductasa tolerante al glifosato. 161. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 160, caracterizada porque el polipéptido con actividad de glifosato N-acetiltransferasa comprende una secuencia de 399 aminoácidos seleccionada del grupo que consiste de SEQ ID NOS:6-10 y 263-514. 162. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 161, caracterizada porque el por lo menos un polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante al glifosato . 163. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 161, caracterizada porque el por lo menos un polipéptido es una glifosato óxido-reductasa tolerante al glifosato. 164. Una planta transgénica o explantación de planta transgénica, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa y por lo menos un polipéptido seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 165. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 164, caracterizada porque el polipéptido con actividad de 400 glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS: 6-10 y 263-514. 166. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una hidroxifenilpiruvatodioxigenasa mutad . 167. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una acetolactato sintasa tolerante a sulfonamida. 168. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una acetohidroxi ácido sintasa tolerante a sulfonamida. 169. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una acetolactato sintasa tolerante a imidazolinona . 170. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una acetohidroxi ácido sintasa tolerante a imidazolinona. 171. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, 401 caracterizada porque el por lo menos un polipéptido es una fosfinotricin acetil transferasa. 172. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 165, caracterizada porque el por lo menos un polipéptido es una protoporfirinogen oxidasa. 173. Una planta transgénica o explantación de planta transgénica que tiene una tolerancia al glifosato aumentada, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa, por lo menos uno de un primer polipétido seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y una glifosato óxido-reductasa tolerante a glifosato y por lo menos uno de un segundo polipéptido seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 174. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 173, caracterizada porque el polipéptido con actividad de 402 glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS : 6-10 y 263-51 . 175. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikiirtato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una hidroxifenilpiruvatodioxigenasa mutada . 176. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una acetolactato sintasa tolerante a sulfonamida . 177. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una acetohidroxi ácido sintasa tolerante a sulfonamida. 178. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato 403 y el segundo polipéptido es una acetolactato sintasa tolerante a imidazolinona . 179. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una acetohidroxi ácido sintasa tolerante a imidazolinona. 180. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una fosfinotricin acetil transferasa. 181. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y el segundo polipéptido es una protoporfirinogen oxidasa mutada . 182. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una hidroxifenilpiruvatodioxigenasa mutada. 404 183. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una acetolactato sintasa tolerante a sulfonamida . 184. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una acetohidroxi ácido sintasa tolerante a sulfonamida . 185. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una acetolactato sintasa tolerante a imidazolinona . 186. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una acetohidroxi ácido sintasa tolerante a imidazolinona . 187. La planta transgénica o explantación de planta 405 transgénica de conformidad con la reivindicación 174, caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una fosfinotricin acetil transferasa. 188. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 17 , caracterizada porque el primer polipéptido es una glifosato óxido-reductasa tolerante a glifosato y el segundo polipéptido es una protopor firinogen oxidasa mutada. 189. Una planta transgénica o explantación de planta transgénica que tiene una tolerancia al glifosato aumentada, caracterizada porque la planta o explantación de planta expresa un polipéptido con actividad de glifosato N-acetiltransferasa y por lo menos un polipétido seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato, una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 190. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 189, caracterizada porque el polipéptido con actividad de 406 glifosato N-acetiltransferasa comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NOS : 6-10 y 263-51 . 191. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato. 192. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una glifosato óxido-reductasa tolerante a glifosato. 193. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una hidroxifenilpiruvatodioxigenasa mutada . 194. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una acetolactato sintasa tolerante a sulfonamida . 195. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una acetohidroxi ácido sintasa tolerante a sulfonamid . 196. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, 407 caracterizada porque el polipéptido es una acetolactato sintasa tolerante a imidazolinona . 197. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una acetohidroxi ácido sintasa tolerante a imidazolinona. 198. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una fosfinotricin acetil transferasa. 199. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 190, caracterizada porque el polipéptido es una protoporfirinogen oxidasa mutada . 200. Un método para controlar malas hierbas en un campo que contiene un cultivo, caracterizado porque comprende : (a) plantar el campo con semillas de cultivo o plantas que son transformadas con un gen que codifica una glifosato N-acetiltransferasa y por lo menos un gen que codifica un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación efectiva de glifosato suficiente para inhibir el crecimiento de las malas hierbas en el campo 408 sin afectar significativamente el cultivo. 201. El método de conformidad con la reivindicación 200, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262. 202. El método de conformidad con la reivindicación 201, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y una glifosato óxido-reductasa tolerante a glifosato, 203. El método de conformidad con la reivindicación 202, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato . 204. El método de conformidad con la reivindicación 202, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante a glifosato. 205. Un método para prevenir la emergencia de malas hierbas resistentes a glifosato en un campo que contiene un cultivo, caracterizado porque comprende: (a) plantar el campo con semillas de cultivo o plantas que 409 son transformadas con un gen que codifica una glifosato N-acetiltransferasa y por lo menos un gen que codifica un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación efectiva de glifosato. 206. El método de conformidad con la reivindicación 205, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262. 207. El método de conformidad con la reivindicación 206, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y una glifosato óxido-reductasa tolerante a glifosato. 208. El método de conformidad con la reivindicación 207, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato . 209. El método de conformidad con la reivindicación 207, caracterizado porque el polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es 410 una glifosato óxido-reductasa tolerante a glifosato. 210. Un método para controlar selectivamente malas hierbas en un campo que contiene un cultivo, caracterizado porque comprende: (a) plantar el campo con semillas de cultivo o plantas que son transformadas con un gen que codifica una glifosato N-acetiltransferasa y por lo menos un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación simultánea o cronológicamente escalonada de glifosato y el herbicida adicional que es suficiente para inhibir el crecimiento de las malas hierbas en el campo sin afectar significativamente el cultivo. 211. El método de conformidad con la reivindicación 210, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262. 212. El método de conformidad con la reivindicación 211, caracterizado porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una 411 acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada . 213. El método de conformidad con la reivindicación 211, caracterizado porque el herbicida adicional es seleccionado del grupo que consiste de un inhibidor de hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialafos, fosfinotricin, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor de protox. 214. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutad . 215. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida . 216. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida. 217. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato 412 sintasa tolerante a imidazolinona . 218. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 219. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 220. El método de conformidad con la reivindicación 212, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa mutada . 221. Un método para prevenir la emergencia de malas hierbas resistentes a herbicida en un campo que contiene un cultivo, caracterizado porque comprende: (a) plantar el campo con semillas de cultivo o plantas que son transformadas con un gen que codifica una glifosato N-acetiltransferasa y por lo menos un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación simultánea o cronológicamente escalonada de glifosato y el herbicida adicional. 222. El método de conformidad con la reivindicación 413 221, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262. 223. El método de conformidad con la reivindicación 222, caracterizado porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 224. El método de conformidad con la reivindicación 221, caracterizado porque el herbicida adicional es seleccionado del grupo que consiste de un inhibidor de hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialafos, fosfinotricin, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor de protox. 225. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada . 226. El método de conformidad con la reivindicación 414 223 caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato síntasa tolerante a sulfonamida. 227. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida. 228. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona . 229. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 230. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 231. El método de conformidad con la reivindicación 223, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa mutada. 232. Un método para controlar selectivamente malas hierbas en un campo que contiene un cultivo, caracterizado 415 porque comprende: (a) plantar el campo con semillas de cultivo o plantas que son transformadas con un gen que codifica una glifosato N-acetiltransferasa, por lo menos un gen que codifica un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional y por lo menos un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación simultánea o cronológicamente escalonada de glifosato y el herbicida adicional que es suficiente para inhibir el crecimiento de las malas hierbas en el campo sin afectar significativamente el cultivo. 233. El método de conformidad con la reivindicación 232, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS : 1-5 y 11-262. 234. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 233, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es seleccionado del grupo que consiste de una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato y una glifosato óxido-reductasa tolerante a glifosato. 416 235. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 234, caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una 5-enolpiruvilshikimato-3-fosfato sintasa tolerante a glifosato. 236. La planta transgénica o explantación de planta transgénica de conformidad con la reivindicación 234 caracterizada porque el por lo menos un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional es una glifosato óxido-reductasa tolerante a glifosato. 237. El método de conformidad con la reivindicación 233, caracterizado porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 238. El método de conformidad con la reivindicación 233, caracterizado porque el herbicida adicional es seleccionado del grupo que consiste de un inhibidor de 417 hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialafos, fos finotricin, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor de protox. 239. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada . 240. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida. 241. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida. 242. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona. 243. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 244. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte 418 tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 245. El método de conformidad con la reivindicación 237, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa mutada. 246. Un método para prevenir la emergencia de malas hierbas resistentes a herbicida en un campo que contiene un cultivo, caracterizado porque comprende: (a) plantar el campo con semillas de cultivo o plantas que son transformadas con un gen que codifica una glifosato N-acetiltransferasa, por lo menos un gen que codifica un polipéptido que imparte tolerancia al glifosato mediante un mecanismo adicional y por lo menos un gen que codifica un polipéptido que imparte tolerancia a un herbicida adicional y (b) aplicar al cultivo y malas hierbas en el campo una aplicación simultánea o cronológicamente escalonada de glifosato y el herbicida adicional. 247. El método de conformidad con la reivindicación 246, caracterizado porque el gen que codifica una glifosato N-acetiltransferasa comprende una secuencia de polinucleótido seleccionada del grupo que consiste de SEQ ID NOS: 1-5 y 11-262. 248. El método de conformidad con la reivindicación 419 247, caracterizado porque el por lo menos un polipéptido que imparte tolerancia a un herbicida adicional es seleccionado del grupo que consiste de una hidroxifenilpiruvatodioxigenasa mutada, una acetolactato sintasa tolerante a sulfonamida, una acetohidroxi ácido sintasa tolerante a sulfonamida, una acetolactato sintasa tolerante a imidazolinona, una acetohidroxi ácido sintasa tolerante a imidazolinona, una fosfinotricin acetil transferasa y una protoporfirinogen oxidasa mutada. 249. El método de conformidad con la reivindicación 247, caracterizado porque el herbicida adicional es seleccionado del grupo que consiste de un inhibidor de hidroxifenilpiruvatodioxigenasa, sulfonamida, imidazolinona, bialafos, fosfinotricin, azafenidin, butafenacil, sulfosato, glufosinato y un inhibidor de protox. 250. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una hidroxifenilpiruvatodioxigenasa mutada . 251. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a sulfonamida. 252. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte 420 tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a sulfonamida . 253. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetolactato sintasa tolerante a imidazolinona . 254. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una acetohidroxi ácido sintasa tolerante a imidazolinona. 255. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una fosfinotricin acetil transferasa. 256. El método de conformidad con la reivindicación 248, caracterizado porque el polipéptido que imparte tolerancia a un herbicida adicional es una protoporfirinogen oxidasa mutada.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24438500P | 2000-10-30 | 2000-10-30 | |
PCT/US2001/046227 WO2002036782A2 (en) | 2000-10-30 | 2001-10-29 | Novel glyphosate n-acetyltransferase (gat) genes |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA03003810A true MXPA03003810A (es) | 2004-10-15 |
Family
ID=22922516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA03003810A MXPA03003810A (es) | 2000-10-30 | 2001-10-29 | Genes de glifosato n-acetiltransferasa (gat) novedosos. |
Country Status (21)
Country | Link |
---|---|
US (1) | US20030083480A1 (es) |
EP (1) | EP1399566A2 (es) |
JP (3) | JP2004534505A (es) |
CN (3) | CN101684458A (es) |
AR (3) | AR035595A1 (es) |
AU (2) | AU2002220181B2 (es) |
BG (1) | BG107758A (es) |
BR (1) | BR0115046A (es) |
CA (1) | CA2425956C (es) |
CZ (1) | CZ20031120A3 (es) |
HR (1) | HRP20030439A2 (es) |
HU (1) | HUP0700153A2 (es) |
IL (3) | IL155599A0 (es) |
MX (1) | MXPA03003810A (es) |
NZ (1) | NZ526148A (es) |
PL (1) | PL366144A1 (es) |
RS (1) | RS32703A (es) |
SK (1) | SK5222003A3 (es) |
UA (2) | UA86918C2 (es) |
WO (1) | WO2002036782A2 (es) |
ZA (1) | ZA200303138B (es) |
Families Citing this family (293)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2009201716B2 (en) * | 2000-10-30 | 2012-05-17 | E. I. Du Pont De Nemours And Company | Novel glyphosate-N-acetyltransferase (GAT) genes |
AU2004260931B9 (en) * | 2003-04-29 | 2012-01-19 | E.I. Du Pont De Nemours And Company | Novel glyphosate-N-acetyltransferase (GAT) genes |
US20090011938A1 (en) * | 2000-10-30 | 2009-01-08 | Pioneer Hi--Bred International, Inc. | Novel glyphosate-n-acetyltransferase (gat) genes |
US7462481B2 (en) | 2000-10-30 | 2008-12-09 | Verdia, Inc. | Glyphosate N-acetyltransferase (GAT) genes |
US7504561B2 (en) | 2003-03-10 | 2009-03-17 | Athenix Corporation | GDC-1 genes conferring herbicide resistance |
WO2004111245A2 (en) | 2003-03-10 | 2004-12-23 | Athenix Corporation | Gdc-2 genes conferring herbicide resistance |
US7807881B2 (en) | 2003-03-10 | 2010-10-05 | Athenix Corp. | Methods to confer herbicide resistance |
NZ575248A (en) * | 2003-04-29 | 2010-09-30 | Pioneer Hi Bred Int | Glyphosate-n-acetyltransferase (gat) genes |
EP1664311A2 (en) * | 2003-09-25 | 2006-06-07 | Monsanto Technology LLC | Actin regulatory elements for use in plants |
EP2868749B1 (en) | 2004-01-20 | 2017-10-04 | Monsanto Technology LLC | Chimeric promoters for use in plants |
US20070197474A1 (en) * | 2004-03-30 | 2007-08-23 | Clinton William P | Methods for controlling plants pathogens using N-phosphonomethylglycine |
US7405074B2 (en) | 2004-04-29 | 2008-07-29 | Pioneer Hi-Bred International, Inc. | Glyphosate-N-acetyltransferase (GAT) genes |
CA2569767C (en) | 2004-06-09 | 2011-07-26 | Pioneer Hi-Bred International, Inc. | Plastid transit peptides |
CN101124323A (zh) | 2004-06-30 | 2008-02-13 | 先锋高级育种国际公司 | 保护植物免受致病真菌侵害的方法 |
ATE480555T1 (de) | 2004-07-02 | 2010-09-15 | Pioneer Hi Bred Int | Antimykotische polypeptide |
WO2006023869A2 (en) | 2004-08-24 | 2006-03-02 | Monsanto Technology Llc | Adenylate translocator protein gene non-coding regulatory elements for use in plants |
WO2007044043A2 (en) | 2004-12-21 | 2007-04-19 | Monsanto Technology, Llc | Transgenic plants with enhanced agronomic traits |
EP1827078B1 (en) | 2004-12-21 | 2014-02-26 | Monsanto Technology LLC | Transgenic plants with enhanced agronomic traits |
US20070199095A1 (en) | 2005-10-13 | 2007-08-23 | Edwards Allen | Methods for producing hybrid seed |
AU2006220768B2 (en) | 2005-03-04 | 2011-10-13 | Monsanto Technology Llc | Mitigating necrosis in transgenic glyphosate-tolerant cotton plants treated with herbicidal glyphosate formulations |
PT1885176T (pt) | 2005-05-27 | 2016-11-28 | Monsanto Technology Llc | Evento mon89788 de soja e métodos para a sua deteção |
CN101278053A (zh) | 2005-07-29 | 2008-10-01 | 孟山都技术有限公司 | 利用来自转基因杂交体的分离子来开发新的种质 |
AP2008004392A0 (en) | 2005-08-24 | 2008-04-30 | E I Du Pomt De Nemours And Com | Compositions providing tolerance to multiple herbicides and methods of use thereof |
US8993846B2 (en) | 2005-09-06 | 2015-03-31 | Monsanto Technology Llc | Vectors and methods for improved plant transformation efficiency |
CN1313614C (zh) * | 2005-10-17 | 2007-05-02 | 中国农业科学院生物技术研究所 | 草甘膦乙酰转移酶基因及其应用 |
WO2007078280A2 (en) | 2005-12-21 | 2007-07-12 | Monsanto Technology, Llc | Transgenic plants with enhanced agronomic traits |
US20100199363A1 (en) * | 2006-05-12 | 2010-08-05 | Hartley Carol J | Enzymes for degrading herbicides |
EP2333088B1 (en) | 2006-05-16 | 2013-08-28 | Pioneer Hi-Bred International, Inc. | Antifungal polypeptides |
AU2007253903B2 (en) | 2006-05-16 | 2012-07-19 | Monsanto Technology Llc | Use of non-agrobacterium bacterial species for plant transformation |
EP2308986B1 (en) | 2006-05-17 | 2014-10-08 | Pioneer Hi-Bred International Inc. | Artificial plant minichromosomes |
US7855326B2 (en) | 2006-06-06 | 2010-12-21 | Monsanto Technology Llc | Methods for weed control using plants having dicamba-degrading enzymatic activity |
MX2008015742A (es) | 2006-06-06 | 2008-12-19 | Monsanto Technology Llc | Metodo de seleccion de celulas transformadas. |
US7968770B2 (en) | 2006-06-28 | 2011-06-28 | Pioneer Hi-Bred International, Inc. | Methods for improving yield using soybean event 3560.4.3.5 |
US7951995B2 (en) | 2006-06-28 | 2011-05-31 | Pioneer Hi-Bred International, Inc. | Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof |
US20110252501A1 (en) | 2006-08-17 | 2011-10-13 | Monsanto Technology Llc | Transgenic plants with enhanced agronomic traits |
US7939721B2 (en) * | 2006-10-25 | 2011-05-10 | Monsanto Technology Llc | Cropping systems for managing weeds |
US7928296B2 (en) | 2006-10-30 | 2011-04-19 | Pioneer Hi-Bred International, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
US7897846B2 (en) | 2006-10-30 | 2011-03-01 | Pioneer Hi-Bred Int'l, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
CL2007003744A1 (es) | 2006-12-22 | 2008-07-11 | Bayer Cropscience Ag | Composicion que comprende un derivado 2-piridilmetilbenzamida y un compuesto insecticida; y metodo para controlar de forma curativa o preventiva hongos fitopatogenos de cultivos e insectos. |
US7838729B2 (en) * | 2007-02-26 | 2010-11-23 | Monsanto Technology Llc | Chloroplast transit peptides for efficient targeting of DMO and uses thereof |
BRPI0808715A8 (pt) | 2007-03-09 | 2017-04-18 | Monsanto Technology Llc | Preparação e uso de explantes de embrião de planta para transformação |
WO2008110279A1 (de) | 2007-03-12 | 2008-09-18 | Bayer Cropscience Ag | Dihalogenphenoxyphenylamidine und deren verwendung als fungizide |
EP1969929A1 (de) | 2007-03-12 | 2008-09-17 | Bayer CropScience AG | Substituierte Phenylamidine und deren Verwendung als Fungizide |
EP1969934A1 (de) | 2007-03-12 | 2008-09-17 | Bayer CropScience AG | 4-Cycloalkyl-oder 4-arylsubstituierte Phenoxyphenylamidine und deren Verwendung als Fungizide |
BRPI0808798A2 (pt) | 2007-03-12 | 2014-10-07 | Bayer Cropscience Ag | Fenoxifenilamidinas 3,5-dissubstituídas e seu uso como fungicidas |
US8003398B2 (en) * | 2007-03-27 | 2011-08-23 | E.I. De Pont De Nemours And Company | Methods and compositions for detecting glyphosate and metabolites thereof |
BRPI0810654B1 (pt) | 2007-04-19 | 2016-10-04 | Bayer Cropscience Ag | tiadiazoliloxifenilamidinas, seu uso e seu método de preparação, composição e método para combate de micro-organismos indesejados, semente resistente a micro-organismo indesejado, bem como método para proteger a dita semente contra micro-organismos |
EP2698433A1 (en) | 2007-06-06 | 2014-02-19 | Monsanto Technology LLC | Genes and uses for plant enhancement |
JP2009000046A (ja) * | 2007-06-21 | 2009-01-08 | Hitachi Zosen Corp | トチュウのメバロン酸経路の酵素をコードする遺伝子 |
EP2380988A3 (en) | 2007-07-10 | 2012-04-11 | Mosanto Technology LLC | Transgenic plants with enhanced agronomic traits |
DE102007045957A1 (de) | 2007-09-26 | 2009-04-09 | Bayer Cropscience Ag | Wirkstoffkombinationen mit insektiziden und akarziden Eigenschaften |
DE102007045922A1 (de) | 2007-09-26 | 2009-04-02 | Bayer Cropscience Ag | Wirkstoffkombinationen mit insektiziden und akariziden Eigenschaften |
DE102007045953B4 (de) | 2007-09-26 | 2018-07-05 | Bayer Intellectual Property Gmbh | Wirkstoffkombinationen mit insektiziden und akariziden Eigenschaften |
DE102007045956A1 (de) | 2007-09-26 | 2009-04-09 | Bayer Cropscience Ag | Wirkstoffkombination mit insektiziden und akariziden Eigenschaften |
DE102007045920B4 (de) | 2007-09-26 | 2018-07-05 | Bayer Intellectual Property Gmbh | Synergistische Wirkstoffkombinationen |
DE102007045919B4 (de) | 2007-09-26 | 2018-07-05 | Bayer Intellectual Property Gmbh | Wirkstoffkombinationen mit insektiziden und akariziden Eigenschaften |
DE102007045955A1 (de) | 2007-09-26 | 2009-04-09 | Bayer Cropscience Ag | Wirkstoffkombinationen mit insektiziden und akariziden Eigenschaften |
EP2090168A1 (de) | 2008-02-12 | 2009-08-19 | Bayer CropScience AG | Methode zur Verbesserung des Pflanzenwachstums |
WO2009085982A1 (en) * | 2007-12-19 | 2009-07-09 | Monsanto Technology Llc | Method to enhance yield and purity of hybrid crops |
EP2072506A1 (de) | 2007-12-21 | 2009-06-24 | Bayer CropScience AG | Thiazolyloxyphenylamidine oder Thiadiazolyloxyphenylamidine und deren Verwendung als Fungizide |
EP2262896B1 (en) | 2008-04-07 | 2014-01-22 | Monsanto Technology LLC | Plant regulatory elements and uses thereof |
EP2537937A3 (en) | 2008-04-29 | 2013-04-10 | Monsanto Technology LLC | Genes and uses for plant enhancement |
US8338665B2 (en) | 2008-07-16 | 2012-12-25 | Monsanto Technology Llc | Methods and vectors for producing transgenic plants |
EP2168434A1 (de) | 2008-08-02 | 2010-03-31 | Bayer CropScience AG | Verwendung von Azolen zur Steigerung der Resistenz von Pflanzen oder Pflanzenteilen gegenüber abiotischem Stress |
CN102112629B (zh) | 2008-08-08 | 2015-05-27 | 拜尔作物科学公司 | 用于植物纤维表征和鉴定的方法 |
PE20110672A1 (es) | 2008-08-14 | 2011-09-25 | Bayer Cropscience Ag | 4-fenil-1-h-pirazoles insecticidas |
DE102008041695A1 (de) | 2008-08-29 | 2010-03-04 | Bayer Cropscience Ag | Methoden zur Verbesserung des Pflanzenwachstums |
EP2201838A1 (de) | 2008-12-05 | 2010-06-30 | Bayer CropScience AG | Wirkstoff-Nützlings-Kombinationen mit insektiziden und akariziden Eigenschaften |
EP2198709A1 (de) | 2008-12-19 | 2010-06-23 | Bayer CropScience AG | Verfahren zur Bekämpfung resistenter tierischer Schädlinge |
CN102333445B (zh) | 2008-12-29 | 2014-09-03 | 拜尔农作物科学股份公司 | 改善利用转基因植物生产潜力的方法 |
EP2223602A1 (de) | 2009-02-23 | 2010-09-01 | Bayer CropScience AG | Verfahren zur verbesserten Nutzung des Produktionspotentials genetisch modifizierter Pflanzen |
EP2204094A1 (en) | 2008-12-29 | 2010-07-07 | Bayer CropScience AG | Method for improved utilization of the production potential of transgenic plants Introduction |
EP2039772A2 (en) | 2009-01-06 | 2009-03-25 | Bayer CropScience AG | Method for improved utilization of the production potential of transgenic plants introduction |
EP2039771A2 (en) | 2009-01-06 | 2009-03-25 | Bayer CropScience AG | Method for improved utilization of the production potential of transgenic plants |
EP2039770A2 (en) | 2009-01-06 | 2009-03-25 | Bayer CropScience AG | Method for improved utilization of the production potential of transgenic plants |
US8487118B2 (en) | 2009-01-19 | 2013-07-16 | Bayer Cropscience Ag | Cyclic diones and their use as insecticides, acaricides and/or fungicides |
EP2227951A1 (de) | 2009-01-23 | 2010-09-15 | Bayer CropScience AG | Verwendung von Enaminocarbonylverbindungen zur Bekämpfung von durch Insekten übertragenen Viren |
JP5592398B2 (ja) | 2009-01-28 | 2014-09-17 | バイエル・クロップサイエンス・アーゲー | 殺菌剤n−シクロアルキル−n−二環式メチレン−カルボキサミド誘導体 |
AR075126A1 (es) | 2009-01-29 | 2011-03-09 | Bayer Cropscience Ag | Metodo para el mejor uso del potencial de produccion de plantas transgenicas |
AU2010213530B2 (en) | 2009-02-13 | 2015-09-03 | Monsanto Technology Llc | Encapsulation of herbicides to reduce crop injury |
EP2398770B1 (en) | 2009-02-17 | 2016-12-28 | Bayer Intellectual Property GmbH | Fungicidal n-(phenylcycloalkyl)carboxamide, n-(benzylcycloalkyl)carboxamide and thiocarboxamide derivatives |
EP2218717A1 (en) | 2009-02-17 | 2010-08-18 | Bayer CropScience AG | Fungicidal N-((HET)Arylethyl)thiocarboxamide derivatives |
TW201031331A (en) | 2009-02-19 | 2010-09-01 | Bayer Cropscience Ag | Pesticide composition comprising a tetrazolyloxime derivative and a fungicide or an insecticide active substance |
CN102317461A (zh) | 2009-02-19 | 2012-01-11 | 先锋国际良种公司 | 通过杂交种子生产期间的操纵进行的混合庇护区部署 |
DE102009001469A1 (de) | 2009-03-11 | 2009-09-24 | Bayer Cropscience Ag | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
DE102009001681A1 (de) | 2009-03-20 | 2010-09-23 | Bayer Cropscience Ag | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
DE102009001732A1 (de) | 2009-03-23 | 2010-09-30 | Bayer Cropscience Ag | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
DE102009001728A1 (de) | 2009-03-23 | 2010-09-30 | Bayer Cropscience Ag | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
DE102009001730A1 (de) | 2009-03-23 | 2010-09-30 | Bayer Cropscience Ag | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
CN102395271A (zh) | 2009-03-25 | 2012-03-28 | 拜尔农作物科学股份公司 | 具有杀虫和杀螨特性的活性化合物结合物 |
CN102448305B (zh) | 2009-03-25 | 2015-04-01 | 拜尔农作物科学股份公司 | 具有杀昆虫和杀螨虫特性的活性成分结合物 |
US8828906B2 (en) | 2009-03-25 | 2014-09-09 | Bayer Cropscience Ag | Active compound combinations having insecticidal and acaricidal properties |
CN102365018B (zh) | 2009-03-25 | 2014-10-29 | 拜尔农作物科学股份公司 | 具有协同作用的活性成分结合物 |
EP2232995A1 (de) | 2009-03-25 | 2010-09-29 | Bayer CropScience AG | Verfahren zur verbesserten Nutzung des Produktionspotentials transgener Pflanzen |
BRPI0924436B1 (pt) | 2009-03-25 | 2017-06-06 | Bayer Cropscience Ag | combinações de substâncias ativas com propriedades inseticidas e acaricidas e seu uso, bem como método para o controle de pragas e animais |
EP2239331A1 (en) | 2009-04-07 | 2010-10-13 | Bayer CropScience AG | Method for improved utilization of the production potential of transgenic plants |
EP2427059B1 (en) | 2009-05-06 | 2015-06-03 | Bayer Intellectual Property GmbH | Cyclopentanedione compounds and their use as insecticides and acaricides |
AR076839A1 (es) | 2009-05-15 | 2011-07-13 | Bayer Cropscience Ag | Derivados fungicidas de pirazol carboxamidas |
EP2251331A1 (en) | 2009-05-15 | 2010-11-17 | Bayer CropScience AG | Fungicide pyrazole carboxamides derivatives |
WO2010135324A1 (en) | 2009-05-18 | 2010-11-25 | Monsanto Technology Llc | Use of glyphosate for disease suppression and yield enhancement in soybean |
EP2255626A1 (de) | 2009-05-27 | 2010-12-01 | Bayer CropScience AG | Verwendung von Succinat Dehydrogenase Inhibitoren zur Steigerung der Resistenz von Pflanzen oder Pflanzenteilen gegenüber abiotischem Stress |
CA2763835C (en) | 2009-06-02 | 2017-01-31 | Bayer Cropscience Ag | Use of succinate dehydrogenase inhibitors for controlling sclerotinia spp. |
EP2440666B1 (en) | 2009-06-10 | 2017-03-01 | Temasek Life Sciences Laboratory Limited | Virus induced gene silencing (vigs) for functional analysis of genes in cotton |
US20120288914A1 (en) | 2009-07-07 | 2012-11-15 | Pioneer Hi Bred International Inc. | Crystal structure of glyphosate acetyltransferase (glyat) and methods of use |
CN102510721B (zh) | 2009-07-16 | 2014-11-19 | 拜尔农作物科学股份公司 | 含苯基三唑的协同活性物质结合物 |
WO2011015524A2 (en) | 2009-08-03 | 2011-02-10 | Bayer Cropscience Ag | Fungicide heterocycles derivatives |
EP2292094A1 (en) | 2009-09-02 | 2011-03-09 | Bayer CropScience AG | Active compound combinations |
US8581046B2 (en) | 2010-11-24 | 2013-11-12 | Pioneer Hi-Bred International, Inc. | Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof |
GB0920891D0 (en) | 2009-11-27 | 2010-01-13 | Syngenta Participations Ag | Herbicidal compositions |
EP2343280A1 (en) | 2009-12-10 | 2011-07-13 | Bayer CropScience AG | Fungicide quinoline derivatives |
KR20120102133A (ko) | 2009-12-28 | 2012-09-17 | 바이엘 크롭사이언스 아게 | 살진균제 히드록시모일-테트라졸 유도체 |
US20130012546A1 (en) | 2009-12-28 | 2013-01-10 | Christian Beier | Fungicide hydroximoyl-tetrazole derivatives |
BR112012012755A2 (pt) | 2009-12-28 | 2015-09-08 | Bayer Crospscience Ag | "composto de fórmula (i), composição fungicida e método para controle do fungo fitopatogênico de culturas" |
BR122021001267B1 (pt) | 2010-01-14 | 2022-03-15 | Monsanto Technology Llc | Molécula de dna compreendendo elementos reguladores de plantas |
CN102811617A (zh) | 2010-01-22 | 2012-12-05 | 拜耳知识产权有限责任公司 | 杀螨和/或杀虫活性物质结合物 |
JP2013521255A (ja) | 2010-03-04 | 2013-06-10 | バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング | フルオロアルキル置換2−アミドベンズイミダゾールおよび植物中のストレス耐性を強化するためのその使用 |
BR112012023551A2 (pt) | 2010-03-18 | 2015-09-15 | Bayer Ip Gmbh | aril e hetaril sulfonamidas como agentes ativos contra estresse abiótico em plantas |
WO2011124554A2 (de) | 2010-04-06 | 2011-10-13 | Bayer Cropscience Ag | Verwendung der 4-phenylbuttersäure und/oder ihrer salze zur steigerung der stresstoleranz in pflanzen |
CN102933083B (zh) | 2010-04-09 | 2015-08-12 | 拜耳知识产权有限责任公司 | (1-氰基环丙基)苯基次膦酸或其酯的衍生物和/或其盐提高植物对非生物胁迫耐受性的用途 |
BR112012027558A2 (pt) | 2010-04-28 | 2015-09-15 | Bayer Cropscience Ag | ''composto da fórmula (i), composição fungicida e método para o controle de fungos fitogênicos de colheitas'' |
WO2011134911A2 (en) | 2010-04-28 | 2011-11-03 | Bayer Cropscience Ag | Fungicide hydroximoyl-tetrazole derivatives |
CN102985419A (zh) | 2010-04-28 | 2013-03-20 | 拜尔农科股份公司 | 杀真菌剂肟基-杂环衍生物 |
MX2012013897A (es) | 2010-06-03 | 2012-12-17 | Bayer Cropscience Ag | N[(het)ariletil)]pirazol (tio)carboxamidas y sus analogos heterosustituidos. |
MX2012013896A (es) | 2010-06-03 | 2012-12-17 | Bayer Cropscience Ag | N-[(het)arilalquil)]pirazol(tio)carboxamidas y sus analogos heterosustituidos. |
UA110703C2 (uk) | 2010-06-03 | 2016-02-10 | Байєр Кропсайнс Аг | Фунгіцидні похідні n-[(тризаміщений силіл)метил]-карбоксаміду |
BR112012031323A2 (pt) | 2010-06-09 | 2015-09-08 | Bayer Cropscience Nv | métodos e meios para modificação de genoma vegetal em uma sequência de nucleotídeos comumente usada na engenahria genética de plantas |
WO2011154158A1 (en) | 2010-06-09 | 2011-12-15 | Bayer Bioscience N.V. | Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering |
BR112012032907A2 (pt) | 2010-06-25 | 2017-06-13 | Du Pont | métodos para selecionar e identificar uma planta de mais e planta de mais |
ES2638519T3 (es) | 2010-07-20 | 2017-10-23 | Bayer Intellectual Property Gmbh | Benzocicloalquenos como agentes antifúngicos |
AU2011289283B2 (en) | 2010-08-13 | 2015-04-30 | Pioneer Hi-Bred International, Inc. | Chimeric promoters and methods of use |
AR082855A1 (es) | 2010-08-18 | 2013-01-16 | Monsanto Technology Llc | Aplicacion temprana de acetamidas encapsuladas para reducir daños en los cultivos |
US9222100B2 (en) | 2010-08-24 | 2015-12-29 | Monsanto Technology Llc | Methods and DNA constructs for autoregulating transgene silencing |
AR082784A1 (es) | 2010-08-30 | 2013-01-09 | Agrigenetics Inc | Potenciador viral baciliforme de caña de azucar (scbv) y su uso en la genomica funcional de plantas |
ES2587657T3 (es) | 2010-09-03 | 2016-10-26 | Bayer Intellectual Property Gmbh | Derivados de dihidropirimidinona condensados sustituidos |
CN103298341B (zh) | 2010-09-22 | 2016-06-08 | 拜耳知识产权有限责任公司 | 活性成分在抗线虫作物中用于防治线虫的用途 |
EP2460406A1 (en) | 2010-12-01 | 2012-06-06 | Bayer CropScience AG | Use of fluopyram for controlling nematodes in nematode resistant crops |
KR101871525B1 (ko) | 2010-10-07 | 2018-06-26 | 바이엘 크롭사이언스 악티엔게젤샤프트 | 테트라졸릴옥심 유도체 및 티아졸릴피페리딘 유도체를 포함하는 살진균제 조성물 |
EP2630125B1 (en) | 2010-10-21 | 2016-08-24 | Bayer Intellectual Property GmbH | N-benzyl heterocyclic carboxamides |
KR20130132816A (ko) | 2010-10-21 | 2013-12-05 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 1-(헤테로시클릭 카르보닐) 피페리딘 |
BR112013010683B1 (pt) | 2010-11-02 | 2018-06-26 | Bayer Intellectual Property Gmbh | Composto, composição fungicida e método para controlar fungos fitopatogênicos de safras |
US9375004B2 (en) | 2010-11-15 | 2016-06-28 | Bayer Intellectual Property Gmbh | 5-halogenopyrazolecarboxamides |
CN103369962A (zh) | 2010-11-15 | 2013-10-23 | 拜耳知识产权有限责任公司 | 5-卤代吡唑(硫代)甲酰胺 |
MX2013005258A (es) | 2010-11-15 | 2013-07-05 | Bayer Ip Gmbh | N-aril pirazol(tio)carboxamidas. |
US8575431B2 (en) | 2010-11-24 | 2013-11-05 | Pioneer Hi-Bred International, Inc. | Brassica GAT event DP-061061-7 and compositions and methods for the identification and/or detection thereof |
EP2460407A1 (de) | 2010-12-01 | 2012-06-06 | Bayer CropScience AG | Wirkstoffkombinationen umfassend Pyridylethylbenzamide und weitere Wirkstoffe |
KR20180096815A (ko) | 2010-12-01 | 2018-08-29 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 작물에서 선충류를 구제하고 수확량을 증가시키기 위한 플루오피람의 용도 |
TWI667347B (zh) | 2010-12-15 | 2019-08-01 | 瑞士商先正達合夥公司 | 大豆品種syht0h2及偵測其之組合物及方法 |
EP2474542A1 (en) | 2010-12-29 | 2012-07-11 | Bayer CropScience AG | Fungicide hydroximoyl-tetrazole derivatives |
EP2658853A1 (en) | 2010-12-29 | 2013-11-06 | Bayer Intellectual Property GmbH | Fungicide hydroximoyl-tetrazole derivatives |
EP2471363A1 (de) | 2010-12-30 | 2012-07-04 | Bayer CropScience AG | Verwendung von Aryl-, Heteroaryl- und Benzylsulfonamidocarbonsäuren, -carbonsäureestern, -carbonsäureamiden und -carbonitrilen oder deren Salze zur Steigerung der Stresstoleranz in Pflanzen |
GB201101743D0 (en) | 2011-02-01 | 2011-03-16 | Syngenta Ltd | Herbicidal compositions |
EP2670231B1 (en) | 2011-02-01 | 2024-10-23 | Colorado Wheat Research Foundation, Inc. | Acetyl co-enzyme a carboxylase herbicide resistant plants |
EP2494867A1 (de) | 2011-03-01 | 2012-09-05 | Bayer CropScience AG | Halogen-substituierte Verbindungen in Kombination mit Fungiziden |
WO2012120105A1 (en) | 2011-03-10 | 2012-09-13 | Bayer Cropscience Ag | Use of lipochito-oligosaccharide compounds for safeguarding seed safety of treated seeds |
US20140005230A1 (en) | 2011-03-14 | 2014-01-02 | Juergen Benting | Fungicide hydroximoyl-tetrazole derivatives |
ES2637862T3 (es) | 2011-03-25 | 2017-10-17 | Monsanto Technology Llc | Elementos reguladores de plantas y usos de los mismos |
WO2012136581A1 (en) | 2011-04-08 | 2012-10-11 | Bayer Cropscience Ag | Fungicide hydroximoyl-tetrazole derivatives |
EP2511255A1 (de) | 2011-04-15 | 2012-10-17 | Bayer CropScience AG | Substituierte Prop-2-in-1-ol- und Prop-2-en-1-ol-Derivate |
AR085585A1 (es) | 2011-04-15 | 2013-10-09 | Bayer Cropscience Ag | Vinil- y alquinilciclohexanoles sustituidos como principios activos contra estres abiotico de plantas |
AR090010A1 (es) | 2011-04-15 | 2014-10-15 | Bayer Cropscience Ag | 5-(ciclohex-2-en-1-il)-penta-2,4-dienos y 5-(ciclohex-2-en-1-il)-pent-2-en-4-inos sustituidos como principios activos contra el estres abiotico de las plantas, usos y metodos de tratamiento |
AR085568A1 (es) | 2011-04-15 | 2013-10-09 | Bayer Cropscience Ag | 5-(biciclo[4.1.0]hept-3-en-2-il)-penta-2,4-dienos y 5-(biciclo[4.1.0]hept-3-en-2-il)-pent-2-en-4-inos sustituidos como principios activos contra el estres abiotico de las plantas |
EA029682B1 (ru) | 2011-04-22 | 2018-04-30 | Байер Интеллекчуал Проперти Гмбх | Комбинации активных соединений, содержащие производное соединение (тио)карбоксамида и фунгицидное соединение |
CN106978423B (zh) | 2011-05-13 | 2021-06-08 | 孟山都技术公司 | 植物调控元件及其应用 |
GB201109239D0 (en) | 2011-06-01 | 2011-07-13 | Syngenta Participations Ag | Herbicidal compositions |
WO2012168124A1 (en) | 2011-06-06 | 2012-12-13 | Bayer Cropscience Nv | Methods and means to modify a plant genome at a preselected site |
BR112013031723B1 (pt) | 2011-06-10 | 2020-10-13 | Temasek Life Sciences Laboratory Limited | construção de polinucleotídeo, método para transformação de uma célula fúngica e promotor isolado |
CN103957711A (zh) | 2011-07-04 | 2014-07-30 | 拜耳知识产权有限责任公司 | 取代的异喹啉酮、异喹啉二酮、异喹啉三酮和二氢异喹啉酮或其各自的盐作为活性剂对抗植物非生物胁迫的用途 |
WO2013020985A1 (en) | 2011-08-10 | 2013-02-14 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
EP2742059A1 (en) | 2011-08-12 | 2014-06-18 | Bayer CropScience NV | Guard cell-specific expression of transgenes in cotton |
MX348003B (es) | 2011-08-22 | 2017-03-08 | Bayer Cropscience Nv | Metodos y medios para modificar un genoma vegetal. |
JP2014524455A (ja) | 2011-08-22 | 2014-09-22 | バイエル・インテレクチユアル・プロパテイー・ゲー・エム・ベー・ハー | 殺真菌性ヒドロキシモイル−テトラゾール誘導体 |
EP2561759A1 (en) | 2011-08-26 | 2013-02-27 | Bayer Cropscience AG | Fluoroalkyl-substituted 2-amidobenzimidazoles and their effect on plant growth |
CN103781353B (zh) | 2011-09-09 | 2016-10-19 | 拜耳知识产权有限责任公司 | 用于改良植物产量的酰基高丝氨酸内酯衍生物 |
CN103874681B (zh) | 2011-09-12 | 2017-01-18 | 拜耳知识产权有限责任公司 | 杀真菌性4‑取代的‑3‑{苯基[(杂环基甲氧基)亚氨基]甲基}‑1,2,4‑噁二唑‑5(4h)‑酮衍生物 |
AU2012308818B2 (en) | 2011-09-13 | 2018-06-21 | Monsanto Technology Llc | Methods and compositions for weed control |
MX343072B (es) | 2011-09-13 | 2016-10-21 | Monsanto Technology Llc | Metodos y composiciones para controlar malezas. |
AU2012308694B2 (en) | 2011-09-13 | 2018-06-14 | Monsanto Technology Llc | Methods and compositions for weed control |
MX348495B (es) | 2011-09-13 | 2017-06-14 | Monsanto Technology Llc | Metodos y composiciones para el control de malezas. |
UA115535C2 (uk) | 2011-09-13 | 2017-11-27 | Монсанто Текнолоджи Ллс | Спосіб та композиція для боротьби з бур'янами (варіанти) |
WO2013040116A1 (en) | 2011-09-13 | 2013-03-21 | Monsanto Technology Llc | Methods and compositions for weed control |
AU2012308753B2 (en) | 2011-09-13 | 2018-05-17 | Monsanto Technology Llc | Methods and compositions for weed control |
BR112014005963A2 (pt) | 2011-09-13 | 2020-12-08 | Monsanto Technology Llc | métodos de controle de planta, de redução de expressão de um gene als em uma planta, de identificação de polinucleotídeos úteis na modulação de expressão do gene als, de fazer um polinucleotídeo, composições compreendendo um polinucleotídeo e um agente de transferência ou um herbicida, cassete de expressão microbiana, bem como molécula de polinucleotídeo |
EA029208B1 (ru) | 2011-09-16 | 2018-02-28 | Байер Интеллектуэль Проперти Гмбх | Способ повышения урожайности пригодных для заготовки частей растений полезных растений или сельскохозяйственных культур и композиция для повышения урожайности растений |
WO2013037956A1 (en) | 2011-09-16 | 2013-03-21 | Bayer Intellectual Property Gmbh | Use of 5-phenyl- or 5-benzyl-2 isoxazoline-3 carboxylates for improving plant yield |
BR112014005990B1 (pt) | 2011-09-16 | 2019-12-31 | Bayer Ip Gmbh | método para induzir uma resposta específica de regulação do crescimento de plantas |
EP2757886A1 (de) | 2011-09-23 | 2014-07-30 | Bayer Intellectual Property GmbH | Verwendung 4-substituierter 1-phenyl-pyrazol-3-carbonsäurederivate als wirkstoffe gegen abiotischen pflanzenstress |
CN103842507A (zh) | 2011-10-04 | 2014-06-04 | 拜耳知识产权有限责任公司 | 通过抑制酵母氨酸脱氢酶基因控制真菌和卵菌的RNAi |
WO2013050324A1 (de) | 2011-10-06 | 2013-04-11 | Bayer Intellectual Property Gmbh | Abiotischen pflanzenstress-reduzierende kombination enthaltend 4- phenylbuttersäure (4-pba) oder eines ihrer salze (komponente (a)) und eine oder mehrere ausgewählte weitere agronomisch wirksame verbindungen (komponente(n) (b) |
KR20140102238A (ko) | 2011-11-21 | 2014-08-21 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 살진균제 n-[(트리치환실릴)메틸]-카르복사미드 유도체 |
RU2014126063A (ru) | 2011-11-30 | 2016-01-27 | Байер Интеллекчуал Проперти Гмбх | ФУНГИЦИДНЫЕ N-БИЦИКЛОАЛКИЛ и N-ТРИЦИКЛОАЛКИЛ(ТИО)КАРБОКСАМИДНЫЕ ПРОИЗВОДНЫЕ |
US9414595B2 (en) | 2011-12-19 | 2016-08-16 | Bayer Cropscience Ag | Use of anthranilic acid diamide derivatives for pest control in transgenic crops |
TWI557120B (zh) | 2011-12-29 | 2016-11-11 | 拜耳知識產權公司 | 殺真菌之3-[(吡啶-2-基甲氧基亞胺)(苯基)甲基]-2-經取代之-1,2,4-二唑-5(2h)-酮衍生物 |
KR102028893B1 (ko) | 2011-12-29 | 2019-10-07 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 살진균 3-[(1,3-티아졸-4-일메톡시이미노)(페닐)메틸]-2-치환-1,2,4-옥사디아졸-5(2h)-온 유도체 |
CN104284980A (zh) | 2011-12-30 | 2015-01-14 | 布特马斯先进生物燃料有限责任公司 | 用于丁醇生产的基因开关 |
US9408386B2 (en) | 2012-02-22 | 2016-08-09 | Bayer Intellectual Property Gmbh | Use of succinate dehydrogenase inhibitors (SDHIs) for controlling wood diseases in grape |
PE20190345A1 (es) | 2012-02-27 | 2019-03-07 | Bayer Ip Gmbh | Combinaciones de compuestos activos |
IN2014DN06986A (es) | 2012-02-29 | 2015-04-10 | Dow Agrosciences Llc | |
WO2013139949A1 (en) | 2012-03-23 | 2013-09-26 | Bayer Intellectual Property Gmbh | Compositions comprising a strigolactame compound for enhanced plant growth and yield |
US9357778B2 (en) | 2012-04-12 | 2016-06-07 | Bayer Cropscience Ag | N-acyl-2-(cyclo)alkypyrrolidines and piperidines useful as fungicides |
US20150080337A1 (en) | 2012-04-20 | 2015-03-19 | Bayer Cropscience | N-cycloalkyl-n-[(trisubstitutedsilylphenyl)methylene]-(thio)carboxamide derivatives |
US9663793B2 (en) | 2012-04-20 | 2017-05-30 | Monsanto Technology, Llc | Plant regulatory elements and uses thereof |
MX2014012449A (es) | 2012-04-20 | 2015-01-19 | Bayer Cropscience Ag | Derivados de n-cicloalquil-n-[(heterociclilfenil)metilen]-(tio) carboxamida. |
US11518997B2 (en) | 2012-04-23 | 2022-12-06 | BASF Agricultural Solutions Seed US LLC | Targeted genome engineering in plants |
EP2662362A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | Pyrazole indanyl carboxamides |
EP2662363A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | 5-Halogenopyrazole biphenylcarboxamides |
EP2662361A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | Pyrazol indanyl carboxamides |
CN104364236B (zh) | 2012-05-09 | 2018-01-16 | 拜尔农作物科学股份公司 | 5‑卤代吡唑二氢茚基甲酰胺 |
EP2662370A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | 5-Halogenopyrazole benzofuranyl carboxamides |
EP2662364A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | Pyrazole tetrahydronaphthyl carboxamides |
EP2662360A1 (en) | 2012-05-09 | 2013-11-13 | Bayer CropScience AG | 5-Halogenopyrazole indanyl carboxamides |
JP6262208B2 (ja) | 2012-05-09 | 2018-01-17 | バイエル・クロップサイエンス・アクチェンゲゼルシャフト | ピラゾールインダニルカルボキサミド類 |
AR091104A1 (es) | 2012-05-22 | 2015-01-14 | Bayer Cropscience Ag | Combinaciones de compuestos activos que comprenden un derivado lipo-quitooligosacarido y un compuesto nematicida, insecticida o fungicida |
AU2013289301A1 (en) | 2012-07-11 | 2015-01-22 | Bayer Cropscience Ag | Use of fungicidal combinations for increasing the tolerance of a plant towards abiotic stress |
US20150216168A1 (en) | 2012-09-05 | 2015-08-06 | Bayer Cropscience Ag | Use of substituted 2-amidobenzimidazoles, 2-amidobenzoxazoles and 2-amidobenzothiazoles or salts thereof as active substances against abiotic plant stress |
EP2895610B1 (en) | 2012-09-13 | 2019-11-06 | Indiana University Research and Technology Corporation | Compositions and systems for conferring disease resistance in plants and methods of use thereof |
WO2014060519A1 (en) | 2012-10-19 | 2014-04-24 | Bayer Cropscience Ag | Method for enhancing tolerance to abiotic stress in plants using carboxamide or thiocarboxamide derivatives |
US9668480B2 (en) | 2012-10-19 | 2017-06-06 | Bayer Cropscience Ag | Method for treating plants against fungi resistant to fungicides using carboxamide or thiocarboxamide derivatives |
UA114937C2 (uk) | 2012-10-19 | 2017-08-28 | Байєр Кропсайнс Аг | Спосіб стимулювання росту рослин із застосуванням карбоксамідних похідних |
AU2013333916B2 (en) | 2012-10-19 | 2017-05-25 | Bayer Cropscience Ag | Active compound combinations comprising carboxamide derivatives |
WO2014079957A1 (de) | 2012-11-23 | 2014-05-30 | Bayer Cropscience Ag | Selektive inhibition der ethylensignaltransduktion |
EP2735231A1 (en) | 2012-11-23 | 2014-05-28 | Bayer CropScience AG | Active compound combinations |
US9943082B2 (en) | 2012-11-30 | 2018-04-17 | Bayer Cropscience Ag | Ternary fungicidal mixtures |
UA117820C2 (uk) | 2012-11-30 | 2018-10-10 | Байєр Кропсайєнс Акцієнгезелльшафт | Подвійна фунгіцидна або пестицидна суміш |
WO2014083031A2 (en) | 2012-11-30 | 2014-06-05 | Bayer Cropscience Ag | Binary pesticidal and fungicidal mixtures |
UA116222C2 (uk) | 2012-11-30 | 2018-02-26 | Байєр Кропсайєнс Акцієнгезелльшафт | Потрійні фунгіцидні і пестицидні суміші |
MX2015006425A (es) | 2012-11-30 | 2015-08-14 | Bayer Cropscience Ag | Mezclas fungicidas binarias. |
US20150305334A1 (en) | 2012-12-05 | 2015-10-29 | Bayer Cropscience Ag | Use of substituted 1-(aryl ethynyl)-, 1-(heteroaryl ethynyl)-, 1-(heterocyclyl ethynyl)- and 1-(cycloalkenyl ethynyl)-cyclohexanols as active agents against abiotic plant stress |
EP2740720A1 (de) | 2012-12-05 | 2014-06-11 | Bayer CropScience AG | Substituierte bicyclische- und tricyclische Pent-2-en-4-insäure -Derivate und ihre Verwendung zur Steigerung der Stresstoleranz in Pflanzen |
EP2740356A1 (de) | 2012-12-05 | 2014-06-11 | Bayer CropScience AG | Substituierte (2Z)-5(1-Hydroxycyclohexyl)pent-2-en-4-insäure-Derivate |
WO2014090765A1 (en) | 2012-12-12 | 2014-06-19 | Bayer Cropscience Ag | Use of 1-[2-fluoro-4-methyl-5-(2,2,2-trifluoroethylsulfinyl)phenyl]-5-amino-3-trifluoromethyl)-1 h-1,2,4 tfia zole for controlling nematodes in nematode-resistant crops |
US20140173775A1 (en) | 2012-12-13 | 2014-06-19 | Pioneer Hi-Bred International, Inc. | Methods and compositions for producing and selecting transgenic plants |
AR093996A1 (es) | 2012-12-18 | 2015-07-01 | Bayer Cropscience Ag | Combinaciones bactericidas y fungicidas binarias |
WO2014095677A1 (en) | 2012-12-19 | 2014-06-26 | Bayer Cropscience Ag | Difluoromethyl-nicotinic- tetrahydronaphtyl carboxamides |
WO2014100525A2 (en) | 2012-12-21 | 2014-06-26 | Pioneer Hi-Bred International, Inc. | Compositions and methods for auxin-analog conjugation |
JP2016515100A (ja) | 2013-03-07 | 2016-05-26 | バイエル・クロップサイエンス・アクチェンゲゼルシャフト | 殺菌性3−{フェニル[(ヘテロシクリルメトキシ)イミノ]メチル}−ヘテロ環誘導体 |
US9273322B2 (en) | 2013-03-12 | 2016-03-01 | Pioneer Hi Bred International Inc | Root-preferred promoter and methods of use |
US20160053277A1 (en) | 2013-03-14 | 2016-02-25 | Pioneer Hi-Bred International, Inc. | Compositions Having Dicamba Decarboxylase Activity and Methods of Use |
WO2014153242A1 (en) | 2013-03-14 | 2014-09-25 | Pioneer Hi-Bred International, Inc. | Compositions having dicamba decarboxylase activity and methods of use |
CA2908403A1 (en) | 2013-04-02 | 2014-10-09 | Bayer Cropscience Nv | Targeted genome engineering in eukaryotes |
BR112015025637A2 (pt) | 2013-04-12 | 2017-07-18 | Bayer Cropscience Ag | novos derivados de triazol |
US9550752B2 (en) | 2013-04-12 | 2017-01-24 | Bayer Cropscience Aktiengesellschaft | Triazolinthione derivatives |
BR112015026235A2 (pt) | 2013-04-19 | 2017-10-10 | Bayer Cropscience Ag | método para melhorar a utilização do potencial de produção de plantas transgênicas envolvendo a aplicação de um derivado de ftaldiamida |
KR20150144779A (ko) | 2013-04-19 | 2015-12-28 | 바이엘 크롭사이언스 악티엔게젤샤프트 | 살충성 또는 농약성 2성분 혼합물 |
TW201507722A (zh) | 2013-04-30 | 2015-03-01 | Bayer Cropscience Ag | 做為殺線蟲劑及殺體內寄生蟲劑的n-(2-鹵素-2-苯乙基)-羧醯胺類 |
WO2014177514A1 (en) | 2013-04-30 | 2014-11-06 | Bayer Cropscience Ag | Nematicidal n-substituted phenethylcarboxamides |
BR112015031235A2 (pt) | 2013-06-26 | 2017-07-25 | Bayer Cropscience Ag | derivados de n-cicloalquil-n-[(biciclil-fenil)metileno]-(tio)carboxamida |
US20160150782A1 (en) | 2013-07-09 | 2016-06-02 | Bayer Cropscience Aktiengesellschaft | Use of selected pyridone carboxamides or salts thereof as active substances against abiotic plant stress |
EP2837287A1 (en) | 2013-08-15 | 2015-02-18 | Bayer CropScience AG | Use of prothioconazole for increasing root growth of Brassicaceae |
BR112016005859A2 (pt) | 2013-09-24 | 2017-09-19 | Basf Se | Heterotransglicosilase e usos da mesma |
US20160237447A1 (en) | 2013-10-07 | 2016-08-18 | Monsanto Technology Llc | Transgenic Plants With Enhanced Traits |
WO2015057600A1 (en) | 2013-10-18 | 2015-04-23 | E. I. Du Pont De Nemours And Company | Glyphosate-n-acetyltransferase (glyat) sequences and methods of use |
WO2015061548A1 (en) | 2013-10-25 | 2015-04-30 | Pioneer Hi-Bred International, Inc. | Stem canker tolerant soybeans and methods of use |
US10071967B2 (en) | 2013-12-05 | 2018-09-11 | Bayer Cropscience Aktiengesellschaft | N-cycloalkyl-N-{[2-(1-substitutedcycloalkyl)phenyl]methylene}-(thio)carboxamide derivatives |
TW201609661A (zh) | 2013-12-05 | 2016-03-16 | 拜耳作物科學公司 | N-環烷基-n-{[2-(1-經取代環烷基)苯基]亞甲基}-(硫代)甲醯胺衍生物 |
CN103740670B (zh) * | 2014-01-13 | 2016-06-22 | 中国农业大学 | 筛选草甘膦n-乙酰转移酶抗血清的试剂盒 |
AR099092A1 (es) | 2014-01-15 | 2016-06-29 | Monsanto Technology Llc | Métodos y composiciones para el control de malezas utilizando polinucleótidos epsps |
WO2015116838A1 (en) * | 2014-01-31 | 2015-08-06 | AgBiome, Inc. | Modified biological control agents and their uses |
US9877486B2 (en) | 2014-01-31 | 2018-01-30 | AgBiome, Inc. | Methods of growing plants using modified biological control agents |
AR100159A1 (es) | 2014-04-22 | 2016-09-14 | Du Pont | Genes de anhidrasa carbónica plastídica para el incremento de aceite en semillas con expresión incrementada de dgat |
CN103981199B (zh) * | 2014-05-15 | 2017-01-18 | 中国农业科学院生物技术研究所 | 一种含有草甘膦抗性基因的表达载体及其应用 |
AR101214A1 (es) | 2014-07-22 | 2016-11-30 | Bayer Cropscience Ag | Ciano-cicloalquilpenta-2,4-dienos, ciano-cicloalquilpent-2-en-4-inas, ciano-heterociclilpenta-2,4-dienos y ciano-heterociclilpent-2-en-4-inas sustituidos como principios activos contra el estrés abiótico de plantas |
US10266837B2 (en) | 2014-10-22 | 2019-04-23 | Temasek Life Sciences Laboratory Limited | Terpene synthases from ylang ylang (Cananga odorata var. fruticosa) |
AR103024A1 (es) | 2014-12-18 | 2017-04-12 | Bayer Cropscience Ag | Piridoncarboxamidas seleccionadas o sus sales como sustancias activas contra estrés abiótico de las plantas |
JP6815322B2 (ja) | 2015-02-04 | 2021-01-20 | モンサント テクノロジー エルエルシー | 色素体形質転換方法 |
EP3274462A4 (en) | 2015-03-26 | 2018-12-26 | The Texas A&M University System | Conversion of lignin into bioplastics and lipid fuels |
CN107531676A (zh) | 2015-04-13 | 2018-01-02 | 拜耳作物科学股份公司 | N‑环烷基‑n‑(双杂环基亚乙基)‑(硫代)羧酰胺衍生物 |
US10711277B2 (en) | 2015-06-17 | 2020-07-14 | Pioneer Hi-Bred International, Inc. | Plant regulatory elements and methods of use thereof |
JP2018527931A (ja) | 2015-08-28 | 2018-09-27 | パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド | 植物のオクロバクテリウム(ochrobactrum)媒介形質転換 |
CN108513583A (zh) | 2015-10-02 | 2018-09-07 | 孟山都技术公司 | 重组玉米b染色体序列及其用途 |
BR112018016057A2 (pt) | 2016-02-05 | 2019-01-29 | Pioneer Hi Bred Int | métodos para selecionar uma planta de soja ou um germoplasma de soja com resistência aprimorada a infecção por podridão parda da haste e kit |
WO2018005491A1 (en) | 2016-06-28 | 2018-01-04 | Monsanto Technology Llc | Methods and compositions for use in genome modification in plants |
CN109688816A (zh) | 2016-07-29 | 2019-04-26 | 拜耳作物科学股份公司 | 活性化合物结合物和保护植物的繁殖材料的方法 |
US20190281828A1 (en) | 2016-09-22 | 2019-09-19 | Bayer Cropscience Aktiengesellschaft | Novel triazole derivatives |
WO2018054832A1 (en) | 2016-09-22 | 2018-03-29 | Bayer Cropscience Aktiengesellschaft | Novel triazole derivatives |
US20190225974A1 (en) | 2016-09-23 | 2019-07-25 | BASF Agricultural Solutions Seed US LLC | Targeted genome optimization in plants |
BR112019008455A2 (pt) | 2016-10-26 | 2019-07-09 | Bayer Cropscience Ag | uso de piraziflumida para o controle de sclerotinia spp. em aplicações de tratamento de semente |
RU2755433C2 (ru) | 2016-12-08 | 2021-09-16 | Байер Кропсайенс Акциенгезельшафт | Применение инсектицидов для борьбы с проволочниками |
WO2018108627A1 (de) | 2016-12-12 | 2018-06-21 | Bayer Cropscience Aktiengesellschaft | Verwendung substituierter indolinylmethylsulfonamide oder deren salze zur steigerung der stresstoleranz in pflanzen |
EP3332645A1 (de) | 2016-12-12 | 2018-06-13 | Bayer Cropscience AG | Verwendung substituierter pyrimidindione oder jeweils deren salze als wirkstoffe gegen abiotischen pflanzenstress |
WO2019025153A1 (de) | 2017-07-31 | 2019-02-07 | Bayer Cropscience Aktiengesellschaft | Verwendung von substituierten n-sulfonyl-n'-aryldiaminoalkanen und n-sulfonyl-n'-heteroaryldiaminoalkanen oder deren salzen zur steigerung der stresstoleranz in pflanzen |
US20210054404A1 (en) | 2017-08-22 | 2021-02-25 | Napigen, Inc. | Organelle genome modification using polynucleotide guided endonuclease |
WO2019139616A1 (en) | 2018-01-12 | 2019-07-18 | The Texas A&M University System | Increasing plant bioproduct yield |
CN108414768B (zh) * | 2018-02-06 | 2020-10-30 | 中国农业科学院生物技术研究所 | 一种抗草甘膦gat转基因农作物的金标检测试纸条 |
US11905518B2 (en) | 2018-02-12 | 2024-02-20 | Curators Of The University Of Missouri | Small auxin upregulated (SAUR) gene for the improvement of root system architecture, waterlogging tolerance, drought resistance and yield in plants and methods of uses |
US20210323950A1 (en) | 2018-06-04 | 2021-10-21 | Bayer Aktiengesellschaft | Herbicidally active bicyclic benzoylpyrazoles |
UA128698C2 (uk) | 2018-07-26 | 2024-10-02 | Баєр Акціенгезельшафт | Застосування інгібітора сукцинатдегідрогенази флуопіраму для боротьби з комплексом кореневої гнилі та/або комплексом диплодіозної гнилі, спричиненим rhizoctonia solani, видом fusarium та видом pythium у рослин виду brassicaceae |
CA3112653A1 (en) | 2018-09-17 | 2020-03-26 | Bayer Aktiengesellschaft | Use of the succinate dehydrogenase inhibitor fluopyram for controlling claviceps purpurea and reducing sclerotia in cereals |
BR112021004865A2 (pt) | 2018-09-17 | 2021-06-01 | Bayer Aktiengesellschaft | uso do fungicida isoflucypram para controlar claviceps purpurea e reduzir esclerócios em cereais |
EP3917319A4 (en) | 2019-01-30 | 2022-11-23 | Monsanto Technology LLC | MICROENCAPSULATED ACETAMIDE HERBICIDES |
CN110218738A (zh) * | 2019-07-04 | 2019-09-10 | 安徽省农业科学院棉花研究所 | 一种抗除草剂薏苡资源获取的方法 |
EP4192232A2 (en) | 2020-08-10 | 2023-06-14 | E. I. du Pont de Nemours and Company | Compositions and methods for enhancing resistance to northern leaf blight in maize |
CN113755457B (zh) * | 2020-09-23 | 2022-11-22 | 山东舜丰生物科技有限公司 | 抗除草剂乙酰辅酶a羧化酶突变体及其应用 |
CN114525292B (zh) * | 2022-04-22 | 2022-08-02 | 中国农业科学院生物技术研究所 | gat3基因及其突变体在培育抗草甘膦作物中的应用 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4535060A (en) * | 1983-01-05 | 1985-08-13 | Calgene, Inc. | Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use |
DE3587548T2 (de) * | 1984-12-28 | 1993-12-23 | Bayer Ag | Rekombinante DNA, die in pflanzliche Zellen eingebracht werden kann. |
NZ217113A (en) * | 1985-08-07 | 1988-06-30 | Monsanto Co | Production of eucaryotic plants which are glyphosate resistant, vectors (transformation and expression), chimeric gene and plant cells |
US4940835A (en) * | 1985-10-29 | 1990-07-10 | Monsanto Company | Glyphosate-resistant plants |
US5312910A (en) * | 1987-05-26 | 1994-05-17 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase |
US5145783A (en) * | 1987-05-26 | 1992-09-08 | Monsanto Company | Glyphosate-tolerant 5-endolpyruvyl-3-phosphoshikimate synthase |
US4971908A (en) * | 1987-05-26 | 1990-11-20 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase |
US5310667A (en) * | 1989-07-17 | 1994-05-10 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
DE69132939T2 (de) * | 1990-06-25 | 2002-11-14 | Monsanto Technology Llc | Glyphosattolerante pflanzen |
US5633435A (en) * | 1990-08-31 | 1997-05-27 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases |
US5866775A (en) * | 1990-09-28 | 1999-02-02 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
FR2673642B1 (fr) * | 1991-03-05 | 1994-08-12 | Rhone Poulenc Agrochimie | Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate. |
FR2673643B1 (fr) * | 1991-03-05 | 1993-05-21 | Rhone Poulenc Agrochimie | Peptide de transit pour l'insertion d'un gene etranger dans un gene vegetal et plantes transformees en utilisant ce peptide. |
KR20010083077A (ko) * | 1998-08-12 | 2001-08-31 | 추후제출 | 제초제 선택성 작물을 생성하는 dna 재편성 |
ES2325874T3 (es) * | 1998-11-17 | 2009-09-22 | Monsanto Technology Llc | Plantas que matabolizan fosfonatos. |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
AU2415200A (en) | 1999-01-18 | 2000-08-01 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
IL138002A0 (en) | 1999-01-19 | 2001-10-31 | Maxygen Inc | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
-
2001
- 2001-10-29 CA CA2425956A patent/CA2425956C/en not_active Expired - Fee Related
- 2001-10-29 PL PL01366144A patent/PL366144A1/xx unknown
- 2001-10-29 AU AU2002220181A patent/AU2002220181B2/en not_active Ceased
- 2001-10-29 US US10/004,357 patent/US20030083480A1/en not_active Abandoned
- 2001-10-29 CZ CZ20031120A patent/CZ20031120A3/cs unknown
- 2001-10-29 CN CN200910159780A patent/CN101684458A/zh active Pending
- 2001-10-29 NZ NZ526148A patent/NZ526148A/en not_active IP Right Cessation
- 2001-10-29 RS YU32703A patent/RS32703A/sr unknown
- 2001-10-29 SK SK522-2003A patent/SK5222003A3/sk not_active Application Discontinuation
- 2001-10-29 CN CN018199755A patent/CN1531594B/zh not_active Expired - Fee Related
- 2001-10-29 BR BR0115046-4A patent/BR0115046A/pt not_active Application Discontinuation
- 2001-10-29 UA UA2003055027A patent/UA86918C2/ru unknown
- 2001-10-29 JP JP2002539528A patent/JP2004534505A/ja active Pending
- 2001-10-29 CN CN2011100857181A patent/CN102212534A/zh active Pending
- 2001-10-29 HU HU0700153A patent/HUP0700153A2/hu not_active Application Discontinuation
- 2001-10-29 WO PCT/US2001/046227 patent/WO2002036782A2/en active IP Right Grant
- 2001-10-29 IL IL15559901A patent/IL155599A0/xx active IP Right Grant
- 2001-10-29 AU AU2018102A patent/AU2018102A/xx active Pending
- 2001-10-29 MX MXPA03003810A patent/MXPA03003810A/es active IP Right Grant
- 2001-10-29 EP EP01992782A patent/EP1399566A2/en not_active Withdrawn
- 2001-10-30 AR ARP010105074A patent/AR035595A1/es not_active Application Discontinuation
-
2003
- 2003-04-23 ZA ZA2003/03138A patent/ZA200303138B/en unknown
- 2003-04-24 BG BG107758A patent/BG107758A/bg unknown
- 2003-04-28 IL IL155599A patent/IL155599A/en not_active IP Right Cessation
- 2003-05-30 HR HR20030439A patent/HRP20030439A2/xx not_active Application Discontinuation
-
2008
- 2008-01-04 AR ARP080100038A patent/AR064756A2/es unknown
- 2008-02-29 JP JP2008051411A patent/JP2008206519A/ja active Pending
- 2008-03-05 UA UAA200802868A patent/UA94688C2/ru unknown
- 2008-06-03 IL IL191899A patent/IL191899A/en not_active IP Right Cessation
-
2009
- 2009-01-29 AR ARP090100277A patent/AR070289A2/es unknown
- 2009-12-29 JP JP2009299177A patent/JP2010142234A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
BR0115046A (pt) | 2005-04-12 |
PL366144A1 (en) | 2005-01-24 |
JP2010142234A (ja) | 2010-07-01 |
UA86918C2 (ru) | 2009-06-10 |
CN1531594B (zh) | 2011-05-25 |
IL191899A (en) | 2012-08-30 |
CA2425956C (en) | 2014-12-23 |
CZ20031120A3 (cs) | 2003-11-12 |
EP1399566A2 (en) | 2004-03-24 |
IL155599A0 (en) | 2003-11-23 |
AU2002220181B2 (en) | 2007-12-20 |
CN101684458A (zh) | 2010-03-31 |
US20030083480A1 (en) | 2003-05-01 |
AR035595A1 (es) | 2004-06-16 |
SK5222003A3 (en) | 2004-12-01 |
AR064756A2 (es) | 2009-04-22 |
JP2008206519A (ja) | 2008-09-11 |
WO2002036782A3 (en) | 2004-01-08 |
RS32703A (en) | 2006-12-15 |
AR070289A2 (es) | 2010-03-25 |
ZA200303138B (en) | 2005-06-29 |
CN102212534A (zh) | 2011-10-12 |
IL155599A (en) | 2011-09-27 |
HRP20030439A2 (en) | 2008-12-31 |
AU2018102A (en) | 2002-05-15 |
UA94688C2 (ru) | 2011-05-25 |
HUP0700153A2 (en) | 2007-08-28 |
JP2004534505A (ja) | 2004-11-18 |
WO2002036782A2 (en) | 2002-05-10 |
BG107758A (bg) | 2004-07-30 |
CN1531594A (zh) | 2004-09-22 |
NZ526148A (en) | 2005-09-30 |
CA2425956A1 (en) | 2002-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MXPA03003810A (es) | Genes de glifosato n-acetiltransferasa (gat) novedosos. | |
US7531339B2 (en) | Glyphosate-N-acetyltransferase (GAT) genes | |
US8222489B2 (en) | Glyphosate-N-acetyltransferase (GAT) genes | |
AU2002220181A1 (en) | Novel glyphosate n-acetyltransferase (gat) genes | |
MXPA05011585A (es) | Genes de glifosato-n-acetil transferasa (gat) novedosos. | |
AU2007224390B2 (en) | Novel glyphosate N-acetyltransferase (GAT) genes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |